【2026 最新】Claude 怎麼省 token?新手必學 10 招實戰技巧(含 Opus 4.7 / Cowork 省錢攻略)

最後更新: · AI 工具
Claude 怎麼省 token|2026 新手 10 招實戰指南封面

用 Claude 用到月底突然被「達到本月使用上限」彈出來,是不是很心痛?或者 API 帳單比預期高 3 倍,搞不清楚錢花到哪去?這篇 2026 最新指南會把Claude 省 token 的 10 招實戰技巧全部一次教給你——從新手最容易踩的雷,到工程師、知識工作者各自的省錢配方,看完直接省 60–70% token不是夢。

👉 還不確定自己該用 Claude / Claude Code / Cowork 哪一個?先讀 Claude vs Claude Code vs Cowork 完整比較

30 秒搞懂:什麼是 token?為什麼要省?

token 想成 AI 的「字」就對了——你打字進去叫「input token」,AI 回你的叫「output token」。中文一個字大概等於 1.5–2 個 token,英文一個字大概 0.75 個 token。Anthropic 是用 token 數量收錢的,所以:

  • 越長的對話越貴(context 累積)
  • 越聰明的模型每個 token 越貴(Opus > Sonnet > Haiku)
  • Cowork > Claude Code > 聊天:每個產品燒 token 的速度差 50–100 倍

所以 Pro/Max 訂閱戶每月撞到「使用上限」、API 用戶帳單暴衝,都不是「用太多」的問題,而是「沒省」的問題。下面這張圖先看大方向,後面 10 招逐個展開:

Claude 省 token 10 招技巧一張看完:用對模型、Prompt Caching、/clear、Plan Mode、Skills、Projects、Memory、Batch API、Subagent、Hook
Claude 省 token 10 招總覽:按重要度排序,做前 3 招就省 50%

10 大省 token 技巧(含 2026 最新變動)

#1 用對模型(最大省錢槓桿,沒有之一)

Claude 目前有三個主力模型,價格差5 倍

  • Haiku 4.5($1/$5 per million input/output tokens):速度最快、最便宜。適合分類、摘要、格式轉換、小範圍程式編輯。
  • Sonnet 4.6($3/$15):CP 值之王。Anthropic 官方推薦的生產預設值。日常 80% 的事用它就夠了。
  • Opus 4.7($5/$25,2026/4 GA):最聰明,留給真的需要深思的硬任務——複雜架構決策、多步驟代理規劃、難 debug。

⚠️ 2026 重要變動:Opus 4.7 換了新的 tokenizer,同一段程式碼會比 Opus 4.6 多消耗高達 35% token。價錢沒變,但你的帳單會悄悄漲——這讓「選對模型」比以前更重要。

Claude 模型價格對照表:Haiku 4.5 vs Sonnet 4.6 vs Opus 4.7 + Prompt Caching + Batch API 比較
Claude 模型價格比較:用對模型可以省 5 倍

#2 開啟 Prompt Caching(API 用戶必開)

同一個 system prompt 或一份手冊每次都重新算錢?太貴了。Prompt Caching 讓 Claude「記住」開頭部分,cache read 只要原價的 10%

  • 適合場景:客服機器人、固定 system prompt 的工作流、長文件分析(同一份 PDF 多次問問題)
  • 命中率門檻:cache write 要付 1.25× 原價(5 分鐘 TTL)或 2.0× (1 小時 TTL)。命中率低於 60% 不建議開,否則寫入成本吃光省下的錢。
  • ⚠️ 2026/3/6 起 cache 預設 TTL 從 1 小時悄悄改成 5 分鐘。如果你的工作流依賴長時間間隔(例如夜間 cron),記得明確指定 1 小時 TTL。

#3 養成 /clear 習慣(最容易忽略的技巧)

對話越久越貴——因為每一輪 Claude 都要重新讀整個 context。一開始的 1k token 對話,到第 100 輪可能膨脹到 100k,同樣的問題現在貴 100 倍

  • 聊天版的 Claude:話題切換時直接「新對話」而不是接著問。
  • Claude Code:在 CLI 裡輸入 /clear 重置 context;任務切換一定要做。
  • 長任務:用 /compact 在 50–70% context 時壓縮,比等到 95% 才壓縮省更多。

#4 用 Plan Mode 想清楚再執行(Claude Code 專屬)

叫 Claude Code 直接動手做大專案——它可能寫一半發現方向錯了,前面消耗的 token 全部白燒。Plan Mode(Shift+Tab 切換)讓它先列計畫、跟你確認、再動手,把錯誤消化在「計畫階段」,省下執行階段的高額 token。

#5 用 Skills 取代每次貼指令

同一段「你是個資深工程師…」貼了 50 次?每次 200 token,50 次就是 10,000 token 白燒。Skills(2026 起在 Claude.ai + Claude Code + Agent SDK 通用)讓你把指令存成檔案,需要時才載入,平時不佔 context。

  • Claude.ai:在 Projects 設定裡加 Custom Instructions
  • Claude Code:在 ~/.claude/skills/ 建立 Skill 檔,需要時 /skill xxx 呼叫

#6 MCP / Projects 取代「貼整份文件」

每次問 PDF 都重新上傳整本 60 頁?每次 50k token。Projects + Project Knowledge 讓你把檔案放進專案,Claude 自動引用,不算進每次對話的 context

  • 聊天版:用 Projects 上傳資料、用 MCP 連 Notion / Google Drive / Gmail 即時抓取
  • Claude Code:MCP servers 比直接貼檔案省,但啟用太多 server 也佔 context,只開你真的會用的

#7 Memory 功能(2026/3 對 Free 也開放)

每次新對話都要重新跟 Claude 自我介紹「我是台灣工程師、現在在做 X」?Memory 讓 Claude 把這些事寫進 /memory 資料夾,每次 session 開始自動讀。省下每次重複自我介紹的 token,並且回答更貼合你的脈絡。

#8 Batch API(API 用戶獨享 5 折)

非即時的任務(夜間摘要、文件批次處理、評測),用 Batch API 直接 5 折——input / output 都半價。24 小時內回(通常 1 小時內),同樣的模型品質。

  • 單批最多 100k 個 request、256MB
  • Sonnet 4.6 batched = $1.50/$7.50 per M tokens(vs 即時 $3/$15)

#9 用 Subagent 隔離搜尋/讀檔的雜訊

叫 Claude Code 在大型 repo 裡搜「所有用到 useEffect 的地方」——10MB 文字回主 context,這些雜訊每一輪都要重算。Subagent 把搜尋丟給專門代理,只回摘要給主代理。

⚠️ 但要適量:Anthropic 自家文件提到「subagent-heavy workflows 可能比單線多用 7 倍 token」——subagent 自己的 context 也有成本。只在搜尋/讀檔/驗證這類需要隔離雜訊的場景用

#10 Hooks 限制終端輸出長度(Claude Code)

跑一次 npm test 終端機輸出 50k 行——這 50k 全進 context。用 Hook 把單次 bash 輸出截斷到 20,000 字元以內,Claude 還是看得到關鍵錯誤訊息,但不會被 console 雜訊淹沒。

編輯 ~/.claude/settings.json 加上 PostToolUse hook:

{
  "hooks": {
    "PostToolUse": [{
      "matcher": "Bash",
      "hooks": [{ "type": "command", "command": "head -c 20000" }]
    }]
  }
}

依產品給的省 token 配方

📱 Claude(聊天版)省 token 配方

  • Projects 放固定參考檔(合約模板、公司風格指南),不要每次新對話貼一次
  • 啟用 Memory,省下自我介紹的 token
  • 需要產生網頁 / 計算機這種一次性東西,用 Artifacts(不會把整份程式碼塞回對話)
  • 每個任務一個新對話——不要一直接著問

⌨️ Claude Code 省 token 配方

  • 用對 model:簡單修改用 Sonnet;架構決策才用 Opus
  • 每個任務 /clear
  • Plan Mode 想清楚再 Auto-Accept
  • Hook 限制 bash 輸出(見 #10)
  • 非常大的 search / refactor 才用 Subagent
  • 不需要的 MCP server 關掉

🖥️ Claude Cowork 省 token 配方(最重要)

Cowork 啟動時會讀取整個指定資料夾,token 成本是聊天版的 50–100 倍。3 個鐵則:

  1. 資料夾範圍要精簡:只放這個任務真的需要的檔,package-lock.json、長 test logs、.env.example 都會把 token 燒光
  2. 「思考」用聊天版做,Cowork 只負責「執行」。先在便宜的 Claude 對話確認方向,再交給 Cowork 動手
  3. 不要讓 Cowork 跑超過 2 小時不看。它跑 200k context 之後每多一輪都很貴,超過就應該寫個 handoff doc、重啟新 session

新手最常踩的 5 個 token 雷

  1. 所有事都用 Opus 4.7——改變數名也用 Opus,等於 Haiku 5 倍價錢辦同樣事
  2. 對話 200 輪了還在同一個 thread 問——context 累積到 100k+,/clear 一下能省 90%
  3. 每次都貼整份 100 行檔案——只貼出問題那 10 行 + 結構摘要,省 90%
  4. 讓 Cowork 在背景跑著沒監控——它跑迴圈時可能 1 小時燒掉一整週的 quota
  5. 沒開 Prompt Caching 跑 100 次相同 system prompt 的 batch job——同樣的開頭付 100 次原價

2026 重大變動:3 個你今天就要知道

  • Opus 4.7 換 tokenizer(2026/4):同樣程式碼比 4.6 多消耗最高 35% token,價錢沒變但帳單會多。對策:能用 Sonnet 別用 Opus。
  • Cache TTL 從 1 小時改 5 分鐘(2026/3/6):依賴長間隔的工作流命中率掉光。對策:明確指定 1 小時 TTL,或調整工作流頻率。
  • 1M context 取消加價(2026 Q1):Sonnet 4.6 / Opus 4.6 / 4.7 的 1M context 已經是原價,不再有 2× 附加費。但這不代表你應該把對話拉到 1M——成本還是會線性增加。

常見問題(FAQ)

Q1:我是 Pro 訂閱戶,token 跟我有關係嗎?

有。Pro / Max 有「每週使用上限」,背後計算單位就是 token。長對話、用 Opus、Cowork 跑半天都會把上限燒光。本文 10 招對訂閱用戶與 API 用戶都適用

Q2:怎麼看自己用了多少 token?

API 用戶:登入 console.anthropic.com 看 Usage 頁面,可以細到每個 model / 每天。Pro/Max 用戶:在 claude.ai 設定裡的 Plan & Billing 看本週剩餘上限。Claude Code:CLI 輸入 /cost 即時顯示。

Q3:用 Opus 4.7 真的會比 4.6 貴 35% 嗎?

單價沒變(同樣 $5/$25 per M)。但同一段內容 4.7 會切出比 4.6 更多的 token(最多多 35%,視內容類型——程式碼、非英文文字最明顯)。實際帳單會增加,但你也換到顯著更強的能力(SWE-bench Verified 約 80.8%)。對策:日常用 Sonnet 4.6,硬任務才用 Opus 4.7。

Q4:Prompt Caching 對個人用戶有用嗎?

對 Pro/Max 訂閱戶沒直接幫助(訂閱已經抹平了大部分成本),但對用 API 跑客服/批次處理/資料分析的開發者每月可以省 30–60%。如果你只是個人聊天,不用花時間研究 caching,把 #1(用對模型)做好就贏一半。

Q5:免費版用戶怎麼節省?

免費版有每日訊息上限。3 招:(1) 盡量短的訊息,不要把整本 PDF 貼進去;(2) 每個任務一個新對話;(3) 用 Memory 省下重複自我介紹。額度撐不夠就升 Pro($20/月)。

Q6:Claude Code 一直跳「Context low」怎麼辦?

說明你的 context 已經 70%+ 了。先用 /compact 壓縮(保留摘要、丟棄細節),如果壓完還是高,/clear 重啟並先寫一份簡短的「進度交接」文檔,下個 session 引用它。千萬不要繼續硬塞——後面每輪都是雙倍貴。

Q7:Skills 跟 Projects 有什麼差?

Projects 是「持久的對話容器 + 共用知識檔案」——適合長期參與的工作(一個 client、一個產品)。Skills 是「可重用的操作指令包」——適合反覆觸發的工作流(每次寫文章前都要用同一份風格指南)。實務上兩個一起用:Project 放專案脈絡,Skill 放重複動作。

Q8:怎麼挑「該升級到 Max」的時機?

當你每週至少 2 次撞到 Pro 的使用上限,而且做完上面 10 招省 token 還是撞牆——升 Max 5x($100/月)是合理選擇。如果 10 招都還沒做,先把 /clear、用對模型、Memory 三招打開,可能就不用升級。

📚 延伸閱讀

結語:先把這 3 招做好,再談進階

10 招看起來多,但 80% 的人卡關都是因為沒做最基本的 3 件事:

    🟦
  1. 選對模型:日常用 Sonnet 4.6,不要全部上 Opus 4.7
  2. 🟨
  3. 養成 /clear 習慣:每個新任務一個新對話
  4. 🟩
  5. 啟用 Memory + Projects:別讓 Claude 每次都重新認識你

這 3 招做完通常已經省 50% token。剩下的 7 招是給已經用很重、或要做 API 開發的進階使用者。從最便宜的省錢動作開始做,回報率最高

👉 還沒搞清楚自己該用哪個 Claude 產品?回頭看 Claude vs Claude Code vs Cowork 完整指南 再決定。

免責聲明:本文僅為教育與資訊整理目的,不構成投資或商業決策建議。文中所述 token 價格、技術細節、產品功能截至 2026 年 5 月為止,Anthropic 仍可能隨時調整,最新請以官方為準:官方價目表Prompt Caching 文件Claude Code 最佳實踐。token 計算為近似值;實際帳單視具體使用內容(程式碼/中文/英文)而異。

留言區

還沒有留言,成為第一個留言的人吧!

留下你的留言

留言送出後會進入審核佇列,通過後公開顯示。Email 不會公開。