用 Claude 用到月底突然被「達到本月使用上限」彈出來,是不是很心痛?或者 API 帳單比預期高 3 倍,搞不清楚錢花到哪去?這篇 2026 最新指南會把Claude 省 token 的 10 招實戰技巧全部一次教給你——從新手最容易踩的雷,到工程師、知識工作者各自的省錢配方,看完直接省 60–70% token不是夢。
👉 還不確定自己該用 Claude / Claude Code / Cowork 哪一個?先讀 Claude vs Claude Code vs Cowork 完整比較。
30 秒搞懂:什麼是 token?為什麼要省?
把 token 想成 AI 的「字」就對了——你打字進去叫「input token」,AI 回你的叫「output token」。中文一個字大概等於 1.5–2 個 token,英文一個字大概 0.75 個 token。Anthropic 是用 token 數量收錢的,所以:
- 越長的對話越貴(context 累積)
- 越聰明的模型每個 token 越貴(Opus > Sonnet > Haiku)
- Cowork > Claude Code > 聊天:每個產品燒 token 的速度差 50–100 倍
所以 Pro/Max 訂閱戶每月撞到「使用上限」、API 用戶帳單暴衝,都不是「用太多」的問題,而是「沒省」的問題。下面這張圖先看大方向,後面 10 招逐個展開:

10 大省 token 技巧(含 2026 最新變動)
#1 用對模型(最大省錢槓桿,沒有之一)
Claude 目前有三個主力模型,價格差5 倍:
- Haiku 4.5($1/$5 per million input/output tokens):速度最快、最便宜。適合分類、摘要、格式轉換、小範圍程式編輯。
- Sonnet 4.6($3/$15):CP 值之王。Anthropic 官方推薦的生產預設值。日常 80% 的事用它就夠了。
- Opus 4.7($5/$25,2026/4 GA):最聰明,留給真的需要深思的硬任務——複雜架構決策、多步驟代理規劃、難 debug。
⚠️ 2026 重要變動:Opus 4.7 換了新的 tokenizer,同一段程式碼會比 Opus 4.6 多消耗高達 35% token。價錢沒變,但你的帳單會悄悄漲——這讓「選對模型」比以前更重要。

#2 開啟 Prompt Caching(API 用戶必開)
同一個 system prompt 或一份手冊每次都重新算錢?太貴了。Prompt Caching 讓 Claude「記住」開頭部分,cache read 只要原價的 10%。
- 適合場景:客服機器人、固定 system prompt 的工作流、長文件分析(同一份 PDF 多次問問題)
- 命中率門檻:cache write 要付 1.25× 原價(5 分鐘 TTL)或 2.0× (1 小時 TTL)。命中率低於 60% 不建議開,否則寫入成本吃光省下的錢。
- ⚠️ 2026/3/6 起 cache 預設 TTL 從 1 小時悄悄改成 5 分鐘。如果你的工作流依賴長時間間隔(例如夜間 cron),記得明確指定 1 小時 TTL。
#3 養成 /clear 習慣(最容易忽略的技巧)
對話越久越貴——因為每一輪 Claude 都要重新讀整個 context。一開始的 1k token 對話,到第 100 輪可能膨脹到 100k,同樣的問題現在貴 100 倍。
- 聊天版的 Claude:話題切換時直接「新對話」而不是接著問。
- Claude Code:在 CLI 裡輸入
/clear重置 context;任務切換一定要做。 - 長任務:用
/compact在 50–70% context 時壓縮,比等到 95% 才壓縮省更多。
#4 用 Plan Mode 想清楚再執行(Claude Code 專屬)
叫 Claude Code 直接動手做大專案——它可能寫一半發現方向錯了,前面消耗的 token 全部白燒。Plan Mode(Shift+Tab 切換)讓它先列計畫、跟你確認、再動手,把錯誤消化在「計畫階段」,省下執行階段的高額 token。
#5 用 Skills 取代每次貼指令
同一段「你是個資深工程師…」貼了 50 次?每次 200 token,50 次就是 10,000 token 白燒。Skills(2026 起在 Claude.ai + Claude Code + Agent SDK 通用)讓你把指令存成檔案,需要時才載入,平時不佔 context。
- Claude.ai:在 Projects 設定裡加 Custom Instructions
- Claude Code:在
~/.claude/skills/建立 Skill 檔,需要時/skill xxx呼叫
#6 MCP / Projects 取代「貼整份文件」
每次問 PDF 都重新上傳整本 60 頁?每次 50k token。Projects + Project Knowledge 讓你把檔案放進專案,Claude 自動引用,不算進每次對話的 context。
- 聊天版:用 Projects 上傳資料、用 MCP 連 Notion / Google Drive / Gmail 即時抓取
- Claude Code:MCP servers 比直接貼檔案省,但啟用太多 server 也佔 context,只開你真的會用的
#7 Memory 功能(2026/3 對 Free 也開放)
每次新對話都要重新跟 Claude 自我介紹「我是台灣工程師、現在在做 X」?Memory 讓 Claude 把這些事寫進 /memory 資料夾,每次 session 開始自動讀。省下每次重複自我介紹的 token,並且回答更貼合你的脈絡。
#8 Batch API(API 用戶獨享 5 折)
非即時的任務(夜間摘要、文件批次處理、評測),用 Batch API 直接 5 折——input / output 都半價。24 小時內回(通常 1 小時內),同樣的模型品質。
- 單批最多 100k 個 request、256MB
- Sonnet 4.6 batched = $1.50/$7.50 per M tokens(vs 即時 $3/$15)
#9 用 Subagent 隔離搜尋/讀檔的雜訊
叫 Claude Code 在大型 repo 裡搜「所有用到 useEffect 的地方」——10MB 文字回主 context,這些雜訊每一輪都要重算。Subagent 把搜尋丟給專門代理,只回摘要給主代理。
⚠️ 但要適量:Anthropic 自家文件提到「subagent-heavy workflows 可能比單線多用 7 倍 token」——subagent 自己的 context 也有成本。只在搜尋/讀檔/驗證這類需要隔離雜訊的場景用。
#10 Hooks 限制終端輸出長度(Claude Code)
跑一次 npm test 終端機輸出 50k 行——這 50k 全進 context。用 Hook 把單次 bash 輸出截斷到 20,000 字元以內,Claude 還是看得到關鍵錯誤訊息,但不會被 console 雜訊淹沒。
編輯 ~/.claude/settings.json 加上 PostToolUse hook:
{
"hooks": {
"PostToolUse": [{
"matcher": "Bash",
"hooks": [{ "type": "command", "command": "head -c 20000" }]
}]
}
}
依產品給的省 token 配方
📱 Claude(聊天版)省 token 配方
- 用 Projects 放固定參考檔(合約模板、公司風格指南),不要每次新對話貼一次
- 啟用 Memory,省下自我介紹的 token
- 需要產生網頁 / 計算機這種一次性東西,用 Artifacts(不會把整份程式碼塞回對話)
- 每個任務一個新對話——不要一直接著問
⌨️ Claude Code 省 token 配方
- 用對 model:簡單修改用 Sonnet;架構決策才用 Opus
- 每個任務
/clear - Plan Mode 想清楚再 Auto-Accept
- Hook 限制 bash 輸出(見 #10)
- 非常大的 search / refactor 才用 Subagent
- 不需要的 MCP server 關掉
🖥️ Claude Cowork 省 token 配方(最重要)
Cowork 啟動時會讀取整個指定資料夾,token 成本是聊天版的 50–100 倍。3 個鐵則:
- 資料夾範圍要精簡:只放這個任務真的需要的檔,
package-lock.json、長 test logs、.env.example都會把 token 燒光 - 「思考」用聊天版做,Cowork 只負責「執行」。先在便宜的 Claude 對話確認方向,再交給 Cowork 動手
- 不要讓 Cowork 跑超過 2 小時不看。它跑 200k context 之後每多一輪都很貴,超過就應該寫個 handoff doc、重啟新 session
新手最常踩的 5 個 token 雷
- 所有事都用 Opus 4.7——改變數名也用 Opus,等於 Haiku 5 倍價錢辦同樣事
- 對話 200 輪了還在同一個 thread 問——context 累積到 100k+,
/clear一下能省 90% - 每次都貼整份 100 行檔案——只貼出問題那 10 行 + 結構摘要,省 90%
- 讓 Cowork 在背景跑著沒監控——它跑迴圈時可能 1 小時燒掉一整週的 quota
- 沒開 Prompt Caching 跑 100 次相同 system prompt 的 batch job——同樣的開頭付 100 次原價
2026 重大變動:3 個你今天就要知道
- Opus 4.7 換 tokenizer(2026/4):同樣程式碼比 4.6 多消耗最高 35% token,價錢沒變但帳單會多。對策:能用 Sonnet 別用 Opus。
- Cache TTL 從 1 小時改 5 分鐘(2026/3/6):依賴長間隔的工作流命中率掉光。對策:明確指定 1 小時 TTL,或調整工作流頻率。
- 1M context 取消加價(2026 Q1):Sonnet 4.6 / Opus 4.6 / 4.7 的 1M context 已經是原價,不再有 2× 附加費。但這不代表你應該把對話拉到 1M——成本還是會線性增加。
常見問題(FAQ)
Q1:我是 Pro 訂閱戶,token 跟我有關係嗎?
有。Pro / Max 有「每週使用上限」,背後計算單位就是 token。長對話、用 Opus、Cowork 跑半天都會把上限燒光。本文 10 招對訂閱用戶與 API 用戶都適用。
Q2:怎麼看自己用了多少 token?
API 用戶:登入 console.anthropic.com 看 Usage 頁面,可以細到每個 model / 每天。Pro/Max 用戶:在 claude.ai 設定裡的 Plan & Billing 看本週剩餘上限。Claude Code:CLI 輸入 /cost 即時顯示。
Q3:用 Opus 4.7 真的會比 4.6 貴 35% 嗎?
單價沒變(同樣 $5/$25 per M)。但同一段內容 4.7 會切出比 4.6 更多的 token(最多多 35%,視內容類型——程式碼、非英文文字最明顯)。實際帳單會增加,但你也換到顯著更強的能力(SWE-bench Verified 約 80.8%)。對策:日常用 Sonnet 4.6,硬任務才用 Opus 4.7。
Q4:Prompt Caching 對個人用戶有用嗎?
對 Pro/Max 訂閱戶沒直接幫助(訂閱已經抹平了大部分成本),但對用 API 跑客服/批次處理/資料分析的開發者每月可以省 30–60%。如果你只是個人聊天,不用花時間研究 caching,把 #1(用對模型)做好就贏一半。
Q5:免費版用戶怎麼節省?
免費版有每日訊息上限。3 招:(1) 盡量短的訊息,不要把整本 PDF 貼進去;(2) 每個任務一個新對話;(3) 用 Memory 省下重複自我介紹。額度撐不夠就升 Pro($20/月)。
Q6:Claude Code 一直跳「Context low」怎麼辦?
說明你的 context 已經 70%+ 了。先用 /compact 壓縮(保留摘要、丟棄細節),如果壓完還是高,/clear 重啟並先寫一份簡短的「進度交接」文檔,下個 session 引用它。千萬不要繼續硬塞——後面每輪都是雙倍貴。
Q7:Skills 跟 Projects 有什麼差?
Projects 是「持久的對話容器 + 共用知識檔案」——適合長期參與的工作(一個 client、一個產品)。Skills 是「可重用的操作指令包」——適合反覆觸發的工作流(每次寫文章前都要用同一份風格指南)。實務上兩個一起用:Project 放專案脈絡,Skill 放重複動作。
Q8:怎麼挑「該升級到 Max」的時機?
當你每週至少 2 次撞到 Pro 的使用上限,而且做完上面 10 招省 token 還是撞牆——升 Max 5x($100/月)是合理選擇。如果 10 招都還沒做,先把 /clear、用對模型、Memory 三招打開,可能就不用升級。
📚 延伸閱讀
- Claude vs Claude Code vs Claude Cowork 完整比較 — 還沒選對工具的話,先讀這篇
- AlphaLab AI 工具總覽 — Claude、ChatGPT、Cursor 等工具評測
- 實用工具總覽 — VPN、eSIM、資安等開發者必備
- 線上課程 — 矽谷工程師打造的系統設計 / Coding 實戰營,AI 時代的職涯護城河
- 新手入門總覽 — 還搞不懂 AI 怎麼用?從這裡開始
結語:先把這 3 招做好,再談進階
10 招看起來多,但 80% 的人卡關都是因為沒做最基本的 3 件事:
-
🟦
- 選對模型:日常用 Sonnet 4.6,不要全部上 Opus 4.7 🟨
- 養成 /clear 習慣:每個新任務一個新對話 🟩
- 啟用 Memory + Projects:別讓 Claude 每次都重新認識你
這 3 招做完通常已經省 50% token。剩下的 7 招是給已經用很重、或要做 API 開發的進階使用者。從最便宜的省錢動作開始做,回報率最高。
👉 還沒搞清楚自己該用哪個 Claude 產品?回頭看 Claude vs Claude Code vs Cowork 完整指南 再決定。
免責聲明:本文僅為教育與資訊整理目的,不構成投資或商業決策建議。文中所述 token 價格、技術細節、產品功能截至 2026 年 5 月為止,Anthropic 仍可能隨時調整,最新請以官方為準:官方價目表、Prompt Caching 文件、Claude Code 最佳實踐。token 計算為近似值;實際帳單視具體使用內容(程式碼/中文/英文)而異。
