Claude Fable 5、Mythos 5 被美國政府下令全球下架:逐字讀懂 Anthropic 官方聲明(2026)

最後更新: ·
Claude Fable 5 全球下架

2026 年 6 月 12 日(週五)傍晚,Anthropic 在官網發出了一篇措辭冷靜、內容卻不平靜的聲明〈Statement on the US government directive to suspend access to Fable 5 and Mythos 5〉。內容只有一件事:美國政府以「出口管制令」要求它暫停旗下最強的兩個模型 Claude Fable 5Claude Mythos 5,而 Anthropic「在數小時內」就把這兩個模型對全世界所有用戶關掉了。

這是一個值得停下來看清楚的時刻:據多家媒體報導,這是史上第一次,一家領先的 AI 公司因為政府介入,把一個已經公開上線、服務數億人的前沿模型整個下線。下面這張就是那篇聲明本身,點圖可以直接到官網讀原文。

Anthropic 官方聲明〈Statement on the US government directive…〉。圖/Anthropic,點擊前往原文
Anthropic 官方聲明〈Statement on the US government directive…〉。圖/Anthropic,點擊前往原文

這篇文章我們分三步走:先忠實整理聲明到底說了什麼(連同英文原句逐字引用)、再逐一查證各方說法、最後給出一個不吹捧也不唱衰的獨立判讀。先講結論的一半:真正讓「一個小漏洞」變成「全球下架」的,不是這個模型有多危險,而是那道法律工具本身的「全有或全無」設計。

一、72 小時內發生了什麼

要看懂這件事,先把時間軸攤開。Claude Fable 5 6 月 9 日才剛公開發布——它是 Anthropic 口中「capabilities exceed those of any model we’ve ever made generally available(能力超過我們過去任何一個對外開放的模型)」的旗艦;而 Mythos 5 是同一個底層模型、把部分安全防護拿掉的版本,只開放給政府核可的資安夥伴(透過 Project Glasswing)。三天後,它就被下架了。

從 6/9 發布到全球下線,只隔了 72 小時。圖/AlphaLab 整理自 Anthropic 聲明、NBC News、Decrypt
從 6/9 發布到全球下線,只隔了 72 小時。圖/AlphaLab 整理自 Anthropic 聲明、NBC News、Decrypt

聲明開頭的第一句,就是整起事件的核心。Anthropic 逐字寫道:

The US government, citing national security authorities, has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States, including foreign national Anthropic employees.

中文:美國政府援引國家安全相關職權,發出一道出口管制令,要求暫停「任何外國人」存取 Fable 5 與 Mythos 5——不論這個人身在美國境內或境外,甚至包含 Anthropic 自己的外籍員工。

Anthropic, 官方聲明(2026/6/12)

關鍵在這裡:法令管制的是「外國人不得存取」,但 Anthropic 沒辦法在每一次對話即時、可靠地判斷對面是不是外國人。於是唯一能「確保合規」的做法,就是對所有人關閉。換句話說,全球下線不是因為政府認定這模型對全人類都危險,而是這道法律的範圍太寬、Anthropic 又無法精準執行,兩者相乘的結果。據 NBC News 報導,這封信由商務部長 Howard Lutnick 署名、商務部工業與安全局(BIS)協助撰寫;Anthropic 也明說,其餘模型(例如 Claude Opus 4.8)完全不受影響。

二、觸發點:那個「越獄」到底是什麼

政府為什麼動手?Anthropic 說,信裡「did not provide specific details of its national security concern(沒有提供國安疑慮的具體細節)」,他們的理解是政府得知了一個能繞過 Fable 5 防護的「越獄」手法。而這個手法到底有多嚴重,是整件事最該被看清楚的地方:

To date, the government has only given us verbal evidence of a potential narrow, non-universal jailbreak, which essentially consists of asking the model to read a specific codebase and fix any software flaws.

中文:到目前為止,政府只給了我們「口頭」證據,指出一個可能存在、但範圍很窄、且非通用的越獄手法——它本質上就是:請模型去讀某一段特定的程式碼,然後找出並修補其中的軟體漏洞。

Anthropic, 官方聲明(2026/6/12)

Anthropic 進一步說明,他們實際看到的示範,只挖出「a small number of previously known, minor vulnerabilities(少數幾個早已知道的小漏洞)」,而且「other publicly-available models are able to discover them as well without requiring a bypass(其他公開可用的模型不必越獄也找得到)」。他們還點名了競品:經查證,這種程度的能力「is widely available from other models (including OpenAI’s GPT-5.5)」,並且是資安防禦方每天都在用的東西。

這一段如果為真,威力很大:它把「越獄=危險」這個直覺,拆成了「能力是否獨有」的問題。如果同樣的事 GPT-5.5 等模型不必越獄就做得到,那麼只下架 Anthropic 一家,並沒有把這個能力從世界上移除——只是把它從 Anthropic 的客戶手上拿走。不過要誠實提醒:這些目前都還是 Anthropic 的單方說法,外界看不到那份越獄報告,沒辦法獨立驗證它到底有多輕微。

三、Anthropic 的立場:照辦,但公開反對

這篇聲明最罕見的地方,是它一邊服從、一邊把不滿說得清清楚楚。Anthropic 寫道:

We are complying with the government’s legal directive and are removing access to Fable 5 and Mythos 5 for all users. However, we disagree that the finding of a narrow potential jailbreak should be cause for recalling a commercial model deployed to hundreds of millions of people. If this standard was applied across the industry, we believe it would essentially halt all new model deployments for all frontier model providers.

中文:我們遵從政府的法律命令,正在對所有用戶移除 Fable 5 與 Mythos 5 的存取。但我們不認同:因為發現一個範圍狹窄、可能存在的越獄,就該把一個已經服務「數億人」的商用模型整個召回。如果這個標準套用到整個產業,我們相信它幾乎會讓所有前沿模型業者,再也沒辦法推出任何新模型。

Anthropic, 官方聲明(2026/6/12)

這句話背後有一個自洽的邏輯。Anthropic 在聲明裡也承認:今天「perfect jailbreak resistance is not currently possible for any model provider(沒有任何一家業者做得到完美的越獄防護)」,每一套安全機制都會有非通用越獄。如果「存在一個窄越獄」就足以召回,那等於宣告所有前沿模型都不該上線——因為照定義,它們全都有窄越獄。它真正的訴求不是「政府不該管」,而是管的程序要對

We believe the government should have the ability to block unsafe deployments, as part of a statutory process that is transparent, fair, clear, and grounded in technical facts. This action does not adhere to those principles.

中文:我們認為政府應該有權力擋下不安全的部署——但這要透過一套「透明、公平、清楚、且立基於技術事實」的法定程序來進行。這次的做法,並不符合這些原則。

Anthropic, 官方聲明(2026/6/12)

聲明結尾,是一句對客戶的道歉與一個樂觀的判斷:「We apologize for this disruption to our customers. We believe this is a misunderstanding and are working to restore access as soon as possible.(我們為這次中斷向客戶致歉。我們相信這是一場誤會,正努力盡快恢復存取。)」——「誤會」這個詞,等一下會看到對方完全不這麼認為。

四、另一種敘事:政府與 David Sacks 怎麼說

只聽一方,永遠拼不出全貌。隔天,白宮科技顧問委員會(PCAST)共同主席、AI 與加密政策主管 David Sacks 在 X 上給了完全不同的版本:

A highly credible, trusted partner of both Anthropic and the U.S. government who was testing Fable came forward with a jailbreak of those guardrails. The admin asked [Anthropic CEO Dario Amodei] to fix the jailbreak or de-deploy the model. Dario refused. Anthropic prioritized the continued offering of the consumer model over safety.

中文:一個同時受 Anthropic 與美國政府高度信任的合作夥伴,在測試 Fable 時提報了一個能突破防護的越獄。政府請 Anthropic 執行長 Dario Amodei「把越獄修好,否則就把模型下架」,但 Dario 拒絕了。Anthropic 把「繼續供應消費級模型」看得比安全更重要。

David Sacks, X(2026/6/13)

Sacks 還說,出口管制是「不得已」的反制,政府對 Anthropic「不願配合一個合理的安全要求」感到意外,並指這與 Anthropic 長年標榜 AI 安全、呼籲監管的品牌「自相矛盾」。把兩邊的說法並排,你會更清楚雙方真正在吵的是什麼:

同一件事的兩種敘事,攤開來自己判斷。圖/AlphaLab 整理自 Anthropic 聲明與 David Sacks 的 X 貼文
同一件事的兩種敘事,攤開來自己判斷。圖/AlphaLab 整理自 Anthropic 聲明與 David Sacks 的 X 貼文

注意兩邊其實沒在吵同一個問題。Anthropic 吵的是「程序」——一封週五傍晚 5:21、沒有書面技術依據的信,夠不夠格叫人召回一個服務數億人的產品;Sacks 吵的是「態度」——你既然天天說 AI 危險、要監管,被要求修一個真實越獄時憑什麼拒絕。這兩件事可以同時為真。

五、這不是孤立事件:背景脈絡

要公平判讀,得知道這對「政府 vs Anthropic」之間早有過節。據 NBC News 整理:2026 年 2 月,川普與國防部長 Hegseth 曾因 Anthropic 想對五角大廈如何使用其技術加上更強限制,而一度禁止聯邦機構採用 Anthropic 產品。但近幾週雙方看似和解——上週《金融時報》報導,國家安全局(NSA)正使用 Mythos 進行「攻擊性」網路行動;6 月 2 日川普簽署 AI 行政命令,要求政府設計機制,以「自願」方式提早取得 Anthropic、OpenAI 等最強模型的存取權。

把這條線拉直,這次的出口管制就不只是「一個越獄」那麼單純,而更像是政府與最強 AI 業者之間,關於「誰能決定一個模型何時該上線、何時該關掉」的角力,第一次以最硬的形式攤牌。值得一提的是,眾議院科學委員會資深成員 Zoe Lofgren 也公開抨擊政府此舉是對 Anthropic 的「攻擊」——這件事已經不只是技術問題,而是政治問題。

六、AlphaLab 的判讀

判讀 1:真正的主角是「法律工具」,不是模型

全球下線這個結果,和「一個窄越獄」這個起因之間,比例嚴重失衡。為什麼?因為中間那道槓桿——出口管制令的「禁止任何外國人存取」條款——本身是個開關,不是旋鈕。它沒有「降級」「限縮高風險功能」「只關某地區」這些檔位;配上「無法即時辨識國籍」的現實,唯一合規解就是全關。所以這場全球停擺,與其說是對 Fable 5 危險程度的判斷,不如說是一個為「實體軍民兩用品」設計的法律,硬套到「軟體模型」上時,必然會產生的鈍器效果。

判讀 2:能力可替代,單點下架就接近「安全劇場」

如果 Anthropic 說的為真——同樣的漏洞挖掘能力,GPT-5.5 等公開模型不必越獄就有——那麼只關 Fable 5 並沒有讓世界更安全,因為這個能力沒有被移除,只是換一家拿。它確實傷到了正當用戶(包含 Anthropic 點名的、每天靠這能力守系統的防禦方),卻擋不住真正想用這能力的人。這是這次政府行動最站不住腳的地方。但前提是「能力可替代」要成立——而這點,目前只有 Anthropic 的單方背書。

判讀 3:「自相矛盾」是最有力、也最容易被誤用的一刀

Sacks 的指控很犀利:你不是一直說要監管嗎?但仔細看會發現,Anthropic 從頭到尾要的都是「a statutory process that is transparent, fair, clear, and grounded in technical facts(透明、公平、清楚、有技術依據的法定程序)」。「支持依法監管」和「反對一封沒有技術依據的突襲信」並不矛盾——就像支持法治的人,可以同時反對不經審判的處罰。Sacks 把「反對這次的做法」偷換成「反對被監管」,是這場輿論戰裡最聰明、也最該被拆穿的一步。

判讀 4:一個沒人定價的新風險被坐實了

這次事件證明了一件過去只存在於投影片裡的事:一個前沿模型,可以被單一政府在一夜之間、對全球關掉。對所有把工作流、產品、Agent 押在單一模型 API 上的人來說,這是一個從此必須計入的「營運連續性風險」。它跟模型好不好用無關,跟政治、法律、地緣有關——而這些,正是工程師最不擅長預測的變數。

我同意什麼、我存疑什麼

  • 同意:程序很重要。一封沒有書面技術依據的傍晚來信,不該是召回服務數億人產品的正當方式;Anthropic 對「程序」的堅持站得住腳。
  • 同意:「能力可替代」若成立,單點下架的安全效益趨近於零,代價卻由正當用戶承擔。
  • 同意:「單一政府可全球關停前沿模型」已從假設變成事實,這是每個重度使用者都該重新計算的風險。
  • 存疑:越獄「很輕微」「早已知」「GPT-5.5 也有」,目前全是 Anthropic 自述,外界看不到報告,無法獨立查證。
  • 存疑:Sacks「Dario 拒絕修復」的版本不能直接當假。若政府手上真有更嚴重、未公開的證據,這次行動的正當性會完全不同。
  • 存疑:Anthropic「這是誤會、很快恢復」的樂觀,對照雙方數月的緊張關係,可能過於一廂情願。

七、如果你在用這些模型,現在該做什麼

無論這場爭議最後怎麼收場,它都給了所有 AI 使用者一堂很具體的課。幾個實際可做的事:

  • 別把關鍵流程單壓一個模型:把你的 Agent、產品或工作流設計成「可換模型」——抽象一層 API、準備好備援模型(例如同時接 Claude 與其他家),讓任何一家臨時斷線都不會讓你停擺。
  • 先搞懂你在用的到底是什麼:Fable 5、Mythos 5、Opus 4.8 定位差很多,這次只有前兩者被關。如果還沒搞清楚差異,可以先讀我們的 Claude Fable 5 是什麼?與 Mythos 5、Opus 4.8 差在哪
  • 把「治理風險」也納入選型:選模型過去只看能力與價格,現在得多看一條——它會不會因為法規、地緣政治而對你所在的地區、或你的國籍突然關閉。
  • 持續追蹤,別只看第一天的新聞:Anthropic 說會在 24 小時內公布更多細節,政府也可能補上正式理由。事件的「真相」很可能在後續才浮現,第一天的版本往往不是最終版本。

📚 延伸閱讀

免責聲明與利益揭露

本文為 AlphaLab 的獨立評論與分析,目的在於幫助讀者理解事件全貌,不代表任何一方立場,也非投資、法律或資安建議。文中引用的英文原句、官方聲明與數據之著作權均屬原出處(Anthropic、NBC News、Decrypt、Al Jazeera、David Sacks 等),於此基於評論目的引用;事件仍在發展中,部分細節可能隨後續官方說明而更新。AlphaLab 與本文提及之任何機構無贊助或商業合作關係。

ALPHALAB 社群

有問題?來 Telegram 聊

和 Terry、編輯、其他網友一起討論這篇文章。提問、分享觀點,回覆更即時。

加入 Telegram 討論

📩 訂閱 AlphaLab 電子報

每週一封,第一時間收到新文章與投資觀察。

我們不會 spam,隨時可退訂。