【2026 最新】Claude 怎麼省 token？新手必學 10 招實戰技巧（含 Opus 4.7 / Cowork 省錢攻略）

最後更新：2026年6月5日 · Terry Chen

用 Claude 用到月底突然被「達到本月使用上限」彈出來，是不是很心痛？或者 API 帳單比預期高 3 倍，搞不清楚錢花到哪去？這篇 2026 最新指南會把Claude 省 token 的 10 招實戰技巧全部一次教給你——從新手最容易踩的雷，到工程師、知識工作者各自的省錢配方，看完直接省 60–70% token不是夢。

👉 還不確定自己該用 Claude / Claude Code / Cowork 哪一個？先讀 Claude vs Claude Code vs Cowork 完整比較。

Table of Contents

30 秒搞懂：什麼是 token？為什麼要省？

把 token 想成 AI 的「字」就對了——你打字進去叫「input token」，AI 回你的叫「output token」。中文一個字大概等於 1.5–2 個 token，英文一個字大概 0.75 個 token。Anthropic 是用 token 數量收錢的，所以：

越長的對話越貴（context 累積）
越聰明的模型每個 token 越貴（Opus > Sonnet > Haiku）
Cowork > Claude Code > 聊天：每個產品燒 token 的速度差 50–100 倍

所以 Pro/Max 訂閱戶每月撞到「使用上限」、API 用戶帳單暴衝，都不是「用太多」的問題，而是「沒省」的問題。下面這張圖先看大方向，後面 10 招逐個展開：

Claude 省 token 10 招技巧一張看完：用對模型、Prompt Caching、/clear、Plan Mode、Skills、Projects、Memory、Batch API、Subagent、Hook — Claude 省 token 10 招總覽：按重要度排序，做前 3 招就省 50%

10 大省 token 技巧（含 2026 最新變動）

#1 用對模型（最大省錢槓桿，沒有之一）

Claude 目前有三個主力模型，價格差5 倍：

Haiku 4.5（$1/$5 per million input/output tokens）：速度最快、最便宜。適合分類、摘要、格式轉換、小範圍程式編輯。
Sonnet 4.6（$3/$15）：CP 值之王。Anthropic 官方推薦的生產預設值。日常 80% 的事用它就夠了。
Opus 4.7（$5/$25，2026/4 GA）：最聰明，留給真的需要深思的硬任務——複雜架構決策、多步驟代理規劃、難 debug。

⚠️ 2026 重要變動：Opus 4.7 換了新的 tokenizer，同一段程式碼會比 Opus 4.6 多消耗高達 35% token。價錢沒變，但你的帳單會悄悄漲——這讓「選對模型」比以前更重要。

Claude 模型價格對照表：Haiku 4.5 vs Sonnet 4.6 vs Opus 4.7 + Prompt Caching + Batch API 比較 — Claude 模型價格比較：用對模型可以省 5 倍

#2 開啟 Prompt Caching（API 用戶必開）

同一個 system prompt 或一份手冊每次都重新算錢？太貴了。Prompt Caching 讓 Claude「記住」開頭部分，cache read 只要原價的 10%。

適合場景：客服機器人、固定 system prompt 的工作流、長文件分析（同一份 PDF 多次問問題）
命中率門檻：cache write 要付 1.25× 原價（5 分鐘 TTL）或 2.0× （1 小時 TTL）。命中率低於 60% 不建議開，否則寫入成本吃光省下的錢。
⚠️ 2026/3/6 起 cache 預設 TTL 從 1 小時悄悄改成 5 分鐘。如果你的工作流依賴長時間間隔（例如夜間 cron），記得明確指定 1 小時 TTL。

#3 養成 /clear 習慣（最容易忽略的技巧）

對話越久越貴——因為每一輪 Claude 都要重新讀整個 context。一開始的 1k token 對話，到第 100 輪可能膨脹到 100k，同樣的問題現在貴 100 倍。

聊天版的 Claude：話題切換時直接「新對話」而不是接著問。
Claude Code：在 CLI 裡輸入 /clear 重置 context；任務切換一定要做。
長任務：用 /compact 在 50–70% context 時壓縮，比等到 95% 才壓縮省更多。

#4 用 Plan Mode 想清楚再執行（Claude Code 專屬）

叫 Claude Code 直接動手做大專案——它可能寫一半發現方向錯了，前面消耗的 token 全部白燒。Plan Mode（Shift+Tab 切換）讓它先列計畫、跟你確認、再動手，把錯誤消化在「計畫階段」，省下執行階段的高額 token。

#5 用 Skills 取代每次貼指令

同一段「你是個資深工程師…」貼了 50 次？每次 200 token，50 次就是 10,000 token 白燒。Skills（2026 起在 Claude.ai + Claude Code + Agent SDK 通用）讓你把指令存成檔案，需要時才載入，平時不佔 context。

Claude.ai：在 Projects 設定裡加 Custom Instructions
Claude Code：在 ~/.claude/skills/ 建立 Skill 檔，需要時 /skill xxx 呼叫

#6 MCP / Projects 取代「貼整份文件」

每次問 PDF 都重新上傳整本 60 頁？每次 50k token。Projects + Project Knowledge 讓你把檔案放進專案，Claude 自動引用，不算進每次對話的 context。

聊天版：用 Projects 上傳資料、用 MCP 連 Notion / Google Drive / Gmail 即時抓取
Claude Code：MCP servers 比直接貼檔案省，但啟用太多 server 也佔 context，只開你真的會用的

#7 Memory 功能（2026/3 對 Free 也開放）

每次新對話都要重新跟 Claude 自我介紹「我是台灣工程師、現在在做 X」？Memory 讓 Claude 把這些事寫進 /memory 資料夾，每次 session 開始自動讀。省下每次重複自我介紹的 token，並且回答更貼合你的脈絡。

#8 Batch API（API 用戶獨享 5 折）

非即時的任務（夜間摘要、文件批次處理、評測），用 Batch API 直接 5 折——input / output 都半價。24 小時內回（通常 1 小時內），同樣的模型品質。

單批最多 100k 個 request、256MB
Sonnet 4.6 batched = $1.50/$7.50 per M tokens（vs 即時 $3/$15）

#9 用 Subagent 隔離搜尋／讀檔的雜訊

叫 Claude Code 在大型 repo 裡搜「所有用到 useEffect 的地方」——10MB 文字回主 context，這些雜訊每一輪都要重算。Subagent 把搜尋丟給專門代理，只回摘要給主代理。

⚠️ 但要適量：Anthropic 自家文件提到「subagent-heavy workflows 可能比單線多用 7 倍 token」——subagent 自己的 context 也有成本。只在搜尋／讀檔／驗證這類需要隔離雜訊的場景用。

#10 Hooks 限制終端輸出長度（Claude Code）

跑一次 npm test 終端機輸出 50k 行——這 50k 全進 context。用 Hook 把單次 bash 輸出截斷到 20,000 字元以內，Claude 還是看得到關鍵錯誤訊息，但不會被 console 雜訊淹沒。

編輯 ~/.claude/settings.json 加上 PostToolUse hook：

{
  "hooks": {
    "PostToolUse": [{
      "matcher": "Bash",
      "hooks": [{ "type": "command", "command": "head -c 20000" }]
    }]
  }
}

依產品給的省 token 配方

📱 Claude（聊天版）省 token 配方

用 Projects 放固定參考檔（合約模板、公司風格指南），不要每次新對話貼一次
啟用 Memory，省下自我介紹的 token
需要產生網頁 / 計算機這種一次性東西，用 Artifacts（不會把整份程式碼塞回對話）
每個任務一個新對話——不要一直接著問

⌨️ Claude Code 省 token 配方

用對 model：簡單修改用 Sonnet；架構決策才用 Opus
每個任務 /clear
Plan Mode 想清楚再 Auto-Accept
Hook 限制 bash 輸出（見 #10）
非常大的 search / refactor 才用 Subagent
不需要的 MCP server 關掉

🖥️ Claude Cowork 省 token 配方（最重要）

Cowork 啟動時會讀取整個指定資料夾，token 成本是聊天版的 50–100 倍。3 個鐵則：

資料夾範圍要精簡：只放這個任務真的需要的檔，package-lock.json、長 test logs、.env.example 都會把 token 燒光
「思考」用聊天版做，Cowork 只負責「執行」。先在便宜的 Claude 對話確認方向，再交給 Cowork 動手
不要讓 Cowork 跑超過 2 小時不看。它跑 200k context 之後每多一輪都很貴，超過就應該寫個 handoff doc、重啟新 session

新手最常踩的 5 個 token 雷

所有事都用 Opus 4.7——改變數名也用 Opus，等於 Haiku 5 倍價錢辦同樣事
對話 200 輪了還在同一個 thread 問——context 累積到 100k+，/clear 一下能省 90%
每次都貼整份 100 行檔案——只貼出問題那 10 行 + 結構摘要，省 90%
讓 Cowork 在背景跑著沒監控——它跑迴圈時可能 1 小時燒掉一整週的 quota
沒開 Prompt Caching 跑 100 次相同 system prompt 的 batch job——同樣的開頭付 100 次原價

2026 重大變動：3 個你今天就要知道

Opus 4.7 換 tokenizer（2026/4）：同樣程式碼比 4.6 多消耗最高 35% token，價錢沒變但帳單會多。對策：能用 Sonnet 別用 Opus。
Cache TTL 從 1 小時改 5 分鐘（2026/3/6）：依賴長間隔的工作流命中率掉光。對策：明確指定 1 小時 TTL，或調整工作流頻率。
1M context 取消加價（2026 Q1）：Sonnet 4.6 / Opus 4.6 / 4.7 的 1M context 已經是原價，不再有 2× 附加費。但這不代表你應該把對話拉到 1M——成本還是會線性增加。

常見問題（FAQ）

Q1：我是 Pro 訂閱戶，token 跟我有關係嗎？

有。Pro / Max 有「每週使用上限」，背後計算單位就是 token。長對話、用 Opus、Cowork 跑半天都會把上限燒光。本文 10 招對訂閱用戶與 API 用戶都適用。

Q2：怎麼看自己用了多少 token？

API 用戶：登入 console.anthropic.com 看 Usage 頁面，可以細到每個 model / 每天。Pro/Max 用戶：在 claude.ai 設定裡的 Plan & Billing 看本週剩餘上限。Claude Code：CLI 輸入 /cost 即時顯示。

Q3：用 Opus 4.7 真的會比 4.6 貴 35% 嗎？

單價沒變（同樣 $5/$25 per M）。但同一段內容 4.7 會切出比 4.6 更多的 token（最多多 35%，視內容類型——程式碼、非英文文字最明顯）。實際帳單會增加，但你也換到顯著更強的能力（SWE-bench Verified 約 80.8%）。對策：日常用 Sonnet 4.6，硬任務才用 Opus 4.7。

Q4：Prompt Caching 對個人用戶有用嗎？

對 Pro/Max 訂閱戶沒直接幫助（訂閱已經抹平了大部分成本），但對用 API 跑客服／批次處理／資料分析的開發者每月可以省 30–60%。如果你只是個人聊天，不用花時間研究 caching，把 #1（用對模型）做好就贏一半。

Q5：免費版用戶怎麼節省？

免費版有每日訊息上限。3 招：(1) 盡量短的訊息，不要把整本 PDF 貼進去；(2) 每個任務一個新對話；(3) 用 Memory 省下重複自我介紹。額度撐不夠就升 Pro（$20/月）。

Q6：Claude Code 一直跳「Context low」怎麼辦？

說明你的 context 已經 70%+ 了。先用 /compact 壓縮（保留摘要、丟棄細節），如果壓完還是高，/clear 重啟並先寫一份簡短的「進度交接」文檔，下個 session 引用它。千萬不要繼續硬塞——後面每輪都是雙倍貴。

Q7：Skills 跟 Projects 有什麼差？

Projects 是「持久的對話容器 + 共用知識檔案」——適合長期參與的工作（一個 client、一個產品）。Skills 是「可重用的操作指令包」——適合反覆觸發的工作流（每次寫文章前都要用同一份風格指南）。實務上兩個一起用：Project 放專案脈絡，Skill 放重複動作。

Q8：怎麼挑「該升級到 Max」的時機？

當你每週至少 2 次撞到 Pro 的使用上限，而且做完上面 10 招省 token 還是撞牆——升 Max 5x（$100/月）是合理選擇。如果 10 招都還沒做，先把 /clear、用對模型、Memory 三招打開，可能就不用升級。

📚 延伸閱讀

Claude vs Claude Code vs Claude Cowork 完整比較 — 還沒選對工具的話，先讀這篇
AlphaLab AI 工具總覽 — Claude、ChatGPT、Cursor 等工具評測
實用工具總覽 — VPN、eSIM、資安等開發者必備
線上課程 — 矽谷工程師打造的系統設計 / Coding 實戰營，AI 時代的職涯護城河
新手入門總覽 — 還搞不懂 AI 怎麼用？從這裡開始

結語：先把這 3 招做好，再談進階

10 招看起來多，但 80% 的人卡關都是因為沒做最基本的 3 件事：

選對模型：日常用 Sonnet 4.6，不要全部上 Opus 4.7
養成 /clear 習慣：每個新任務一個新對話
啟用 Memory + Projects：別讓 Claude 每次都重新認識你

這 3 招做完通常已經省 50% token。剩下的 7 招是給已經用很重、或要做 API 開發的進階使用者。從最便宜的省錢動作開始做，回報率最高。

👉 還沒搞清楚自己該用哪個 Claude 產品？回頭看 Claude vs Claude Code vs Cowork 完整指南 再決定。

免責聲明：本文僅為教育與資訊整理目的，不構成投資或商業決策建議。文中所述 token 價格、技術細節、產品功能截至 2026 年 5 月為止，Anthropic 仍可能隨時調整，最新請以官方為準：官方價目表、Prompt Caching 文件、Claude Code 最佳實踐。token 計算為近似值；實際帳單視具體使用內容（程式碼／中文／英文）而異。