Token燒太快？Anthropic官方給出4條Claude Code建議，這樣做降低額度消耗

2026/04/13

2,945

Token燒太快？Anthropic官方給出4條Claude Code建議，這樣做降低額度消耗 — 許多用戶反映，自己明明只是做了幾個操作，卻在短時間內用掉大量配額，甚至在升級到更昂貴的方案後，實際可用的時間與token用量反而大幅下降，引發不少不滿。(來源：Google Gemini生成)

摘要

Anthropic近日針對「Claude Code用量暴衝」的爭議做出說明，並提出4個官方「省流」建議，希望用戶可以降低不必要消耗。

Anthropic近日針對「Claude Code用量暴衝」的爭議做出說明。許多用戶反映，自己明明只是做了幾個操作，卻在短時間內用掉大量配額，甚至在升級到更昂貴的方案後，實際可用的時間與token用量反而大幅下降，引發不少不滿。

負責Claude Code的Lydia Hallie在X上表示，團隊這段時間蒐集了大量回報與數據後發現，發現多數token「燒得特別快」的情況，其實來自幾種非常消耗額度的使用模式。同時，她也提出4個官方建議，希望用戶可以降低不必要消耗。

1.優先使用Sonnet 4.6，避免Opus過度消耗

在Pro方案中，Anthropic建議預設改用Sonnet 4.6，而不是更高階的Opus。原因在於，Opus的代幣消耗大約是Sonnet的2倍，如果不是每一次都需要最強、最深度的推理能力，其實沒有必要全程使用Opus，否則會很快碰到用量上限。

2.調整運算強度與延伸思考功能

Claude Code提供「運算強度」（effort level）與「延伸思考」（extended thinking）等參數，這些功能會讓模型進行更多步驟的推理，自然也會大幅增加token的使用量。官方建議，如果只是處理一般的程式輔助或輕量任務，可以適度調低運算強度，甚至在不需要深度推理時關閉延伸思考，把成本壓下來。

3.避免長時間續用巨大對話工作階段

Lydia提醒，用戶不要長期「續命」一個放著不動的大型對話。如果某個工作階段（session）已經閒置約1小時以上，且累積了龐大的上下文內容，繼續在同一個工作階段裡操作，模型每次都要重新處理這段長上下文，自然會讓一次互動就吃掉大量token。她建議改成重新開啟一個新工作階段，比較節省資源。

4.透過上下文視窗上限控制對話長度

Anthropic也在Claude Code中提供「上下文視窗」（context window）上限設定，例如使用環境變數（environment variable）CLAUDE_CODE_AUTO_COMPACT_WINDOW=200000來自動壓縮過長的上下文。對常態開啟大型專案、讀取多檔案的開發者來說，這可以避免模型每次都帶著過量歷史內容一起運算。

Lydia表示，團隊已經陸續推出多項效率優化，並在產品內加入提示視窗，幫助使用者避免觸發大型提示快取失誤（large prompt cache misses）等高成本情境。她也提醒，用戶務必確認自己使用的是最新版本。如果仍然遇到「明明只是個小操作，卻吃掉不成比例的大量額度」的狀況，可以在產品內執行/feedback指令，讓團隊進一步調查。

Gemini的額度其實也很容易被「用法」吃掉

前面幾點是Anthropic自己點名的Claude Code省token方式，但實際上，現在多數訂閱型AI服務的額度，都跟「怎麼使用」高度相關。以Google AI的Gemini為例，如果有訂閱相關方案，也要特別留意使用方式，才不會很快把每日額度燒光。

雖然官方文件沒有直接標註「哪些行為是浪費額度」，但從使用說明與各項功能限制中，其實可以整理出幾種特別容易消耗額度的使用模式，作為規劃使用策略的參考。

1.提問本身的長度與複雜度

提示詞越長、結構越複雜，模型在背後需要投入的運算資源就越高；如果在同一個對話串中，多次追加篇幅較長、層次繁複的追問，使用量會持續往上疊加。換句話說，能用精準語句表達清楚的問題，就應該盡量避免鋪陳過多背景與枝節內容，而在單一對話中無限制延伸討論，也會讓額度消耗速度明顯加快。

2.容易被忽略的來源

一口氣上傳數量眾多的檔案，會比事先精選少量關鍵檔案更快耗用額度；而且檔案容量越大，例如長時間影片、頁數龐大的PDF報告，模型為了讀懂內容所需的處理資源與上下文空間也會同步增加。較佳的做法，是先預先整理，只上傳「確實需要Gemini協助分析」的檔案，而不是把整個資料夾原封不動丟進去。

3.本身就屬於高成本的進階功能

Deep Research會依方案不同設定每日或每月可產生的報告數量上限；圖像、影片、音樂生成等功能，也都有明確的每日張數或曲數限制，而且官方特別提醒這些需求量高的服務，限額未來可能因為成本壓力而調整；至於Agent、螢幕自動化、簡報生成等功能，多半也設有每日可使用次數或同時執行數量上限。

若想實際降低額度浪費，可以從幾個面向著手調整。問題設計上，盡量聚焦核心需求，優先追求「精準與清楚」，而不是刻意拉長篇幅或追求華麗文采；在對話結構上，當討論主題已經大幅轉變，或是單一對話變得過長時，適度開啟新對話，有助於減少不必要的歷史上下文負擔。

在檔案管理上，只上傳實際需要分析的檔案，避免一次性投入大量冗餘資料；至於生成內容，若是為了比較模型輸出品質而重生多個版本，事先替自己訂一個合理上限，避免無節制反覆生成，也能有效控制整體用量。

資料來源：Anthropic、Google

＊本文出自《數位時代》，原文標題：Token燒太快？Anthropic官方給出4條Claude Code建議，這樣做降低額度消耗

延伸閱讀：
用Claude Code管理100篇研究筆記！前OpenAI共同創辦人公開LLM知識庫系統，貼一段指令就能建起來
 Claude送免費額度！這三種方案都能領，怎麼領？要注意什麼？教學一次看

責任編輯：陳芊吟
核稿編輯：倪旻勤