駭客組織稱成功越獄 Anthropic Fable 5 模型，引發 AI 安全疑慮

分類: AI 新品報導發布時間: 2026/06/22 10:00

知名 AI 安全研究者與駭客組織「Pliny the Liberator」（@elder_plinius）近日在 X（前 Twitter）上宣布，他們在 Anthropic 新模型 Claude Fable 5（部分消息稱其為 Mythos 系列）下架前，就成功完成越獄（jailbreak），讓該模型輸出破解 Linux 系統與製造化學武器的詳細步驟。這項消息迅速在 AI 安全圈引發熱議，也讓外界重新關注大型語言模型（LLM）的安全防護能力。

根據 Pliny the Liberator 在 X 上的貼文，他使用多代理（multi-agent）協作的「pack hunt」技巧，成功繞過 Fable 5 的安全機制，並釋出了據稱是該模型完整的系統提示（System Prompt），長達約 12 萬字，已公開在 GitHub 上。

他展示的越獄結果包括：

提供破解 Linux 系統的詳細步驟
輸出製造化學武器的相關資訊

Anthropic 隨後對此做出回應，強調這「並非真正的越獄」，而是模型在拒絕後被「引導繼續回答」（coaxing after refusal），並非突破核心安全防護機制。公司表示，他們已進行超過 1,000 小時的漏洞懸賞測試，並未發現可普遍應用的越獄方法。

不過，由於事件影響重大，Fable 5 後續被限制使用，甚至傳出因美國政府出口管制而下架。

Pliny 使用的技巧與過去常見的越獄方法相似，主要包括：

文字混淆：將英文字母替換成拉丁文、符號或同形異義字（homoglyphs），繞過第一層關鍵字過濾。
超長提示 + 注意力分散：在大量無關廢話中埋入真正意圖，讓模型注意力被分散。
角色扮演：聲稱自己是研究人員或小說作家，需要詳細步驟來完成「學術研究」或「讓讀者信服」。
步驟拆解（Decomposition）：將危險任務拆成多個看似無害的小步驟，分別詢問模型，再將答案重新組合。

這種「拆解-重組」的手法特別有效，因為單一小步驟看起來合法，模型難以察覺整體意圖。

許多 AI 安全研究者認為，這次事件再次證明：即使是最頂尖的安全對齊（alignment）模型，仍難以完全防禦有心人的攻擊。把大任務拆成小步驟的技巧，尤其凸顯目前 AI 安全機制的盲點——模型難以理解使用者「最終意圖」。有分析指出，目前 LLM 已經如此容易被越獄，未來當 AI Agent 具備實際執行能力（例如控制電腦、操作機器人），一旦被惡意越獄，可能造成的實體傷害將更加嚴重。

參考資訊:
https://github.com/elder-plinius/CL4R1T4S/blob/main/ANTHROPIC/CLAUDE-FABLE-5.md

⊙ 美國政府對 Anthropic Claude 祭出出口管制始末 [6/14/2026]

⊙ 美國商務部祭管制 Anthropic 兩旗艦模型 Claude Fable 5 與 Mythos 5 [6/13/2026]

⊙ Anthropic 推出 Claude Fable 5 與 Mythos 5，Fable 5 成最強 [6/10/2026]

⊙ Anthropic 研究警示：LLM 將 N-day 漏洞利用開發縮短至數小時 [6/9/2026]

⊙ Anthropic 重磅報告呼籲建立全球可驗證暫停機制 [6/6/2026]

市場快報

神腦年中慶開跑指定商品最高贈2500神腦幣 iPhone換電池最高省800元

燦坤3C家電年中慶開跑指定商品5折起滿額抽旅遊金

神腦國際攜手FutureDial打造全台首創手機健康管理中心

燦坤會員寵物卡週年慶寵物價商品54折起

BRITA 攜手《怪奇物語》女星米莉芭比布朗打造新世代喝水風潮

哈燒王 Hot3C

駭客組織稱成功越獄 Anthropic Fable 5 模型，引發 AI 安全疑慮

分類: AI 新品報導發布時間: 2026/06/22 10:00

相關文章:

⊙ 美國政府對 Anthropic Claude 祭出出口管制始末 [6/14/2026]

⊙ 美國商務部祭管制 Anthropic 兩旗艦模型 Claude Fable 5 與 Mythos 5 [6/13/2026]

⊙ Anthropic 推出 Claude Fable 5 與 Mythos 5，Fable 5 成最強 [6/10/2026]

⊙ Anthropic 研究警示：LLM 將 N-day 漏洞利用開發縮短至數小時 [6/9/2026]

⊙ Anthropic 重磅報告呼籲建立全球可驗證暫停機制 [6/6/2026]

⊙ [「擇法善思林之蘭室藏津」的緣起]

⊙ 獨家》到女碩士家幫除蟑竟偷拍內褲照給友人看偷拍男判賠定了

⊙ 蔣萬安喊15條公車專用道推無人自駕公車信義路打頭陣

⊙ 「新南向授信」前5月大增2515億澳星越三國增額最多

⊙ 世足》政治角力下的暖心74字！伊朗隊離開洛城前留下手寫感謝信

⊙ 世足》C羅球迷「出征」自家人葡萄牙隊還沒贏球先爆內亂

⊙ 防醫療院所隱私爭議醫事司最快8月公告新制

⊙ 班鐵翔西門町重摔「斷骨釘20釘」痛失千萬坐輪椅重返現場怒告地主

⊙ 車手提領大降97％！台南首創ATM防詐辨識攜手中央倡議全國推動

⊙ 南興國中小學校舍落成盧秀燕：努力做到最後一分鐘

⊙ 全國最大水庫蓄水率飆破4成盼「米克拉」再補水

⊙ 2025年自殺人數下降「2年齡層」不減反增

⊙ 中職》二軍猛飆152公里、9局14K！兄弟網羅的戰力外火球男註冊了

⊙ 班鐵翔西門町踩「隱形陷阱」摔斷腿北市府：先噴漆示警加貼止滑條

⊙ 政院拋2100億無人載具特別條例陳昭姿：反對用特別預算「神來一筆」

⊙ 飛中國應援還摟抱！蔡尚樺鬆口談3年緋聞親解林秉聖關係

⊙ [擇法善思林之蘭室藏津]

市場快報

哈燒王 Hot3C

駭客組織稱成功越獄 Anthropic Fable 5 模型，引發 AI 安全疑慮

分類: AI 新品報導 發布時間: 2026/06/22 10:00

相關文章:

⊙ 美國政府對 Anthropic Claude 祭出出口管制始末 [6/14/2026]

⊙ 美國商務部祭管制 Anthropic 兩旗艦模型 Claude Fable 5 與 Mythos 5 [6/13/2026]

⊙ Anthropic 推出 Claude Fable 5 與 Mythos 5，Fable 5 成最強 [6/10/2026]

⊙ Anthropic 研究警示：LLM 將 N-day 漏洞利用開發縮短至數小時 [6/9/2026]

⊙ Anthropic 重磅報告呼籲建立全球可驗證暫停機制 [6/6/2026]

⊙ [「擇法善思林之蘭室藏津」的緣起]

⊙ 獨家》到女碩士家幫除蟑 竟偷拍內褲照給友人看 偷拍男判賠定了

⊙ 蔣萬安喊15條公車專用道推無人自駕公車 信義路打頭陣

⊙ 「新南向授信」前5月大增2515億 澳星越三國增額最多

⊙ 世足》政治角力下的暖心74字！ 伊朗隊離開洛城前留下手寫感謝信

⊙ 世足》C羅球迷「出征」自家人 葡萄牙隊還沒贏球先爆內亂

⊙ 防醫療院所隱私爭議 醫事司最快8月公告新制

⊙ 班鐵翔西門町重摔「斷骨釘20釘」痛失千萬 坐輪椅重返現場怒告地主

⊙ 車手提領大降97％！台南首創ATM防詐辨識 攜手中央倡議全國推動

⊙ 南興國中小學校舍落成 盧秀燕：努力做到最後一分鐘

⊙ 全國最大水庫蓄水率飆破4成 盼「米克拉」再補水

⊙ 2025年自殺人數下降 「2年齡層」不減反增

⊙ 中職》二軍猛飆152公里、9局14K！兄弟網羅的戰力外火球男註冊了

⊙ 班鐵翔西門町踩「隱形陷阱」摔斷腿 北市府：先噴漆示警加貼止滑條

⊙ 政院拋2100億無人載具特別條例 陳昭姿：反對用特別預算「神來一筆」

⊙ 飛中國應援還摟抱！蔡尚樺鬆口談3年緋聞 親解林秉聖關係

⊙ [擇法善思林之蘭室藏津]

相關新聞

相關新聞

市場快報

分類: AI 新品報導發布時間: 2026/06/22 10:00

⊙ 獨家》到女碩士家幫除蟑竟偷拍內褲照給友人看偷拍男判賠定了

⊙ 蔣萬安喊15條公車專用道推無人自駕公車信義路打頭陣

⊙ 「新南向授信」前5月大增2515億澳星越三國增額最多

⊙ 世足》政治角力下的暖心74字！伊朗隊離開洛城前留下手寫感謝信

⊙ 世足》C羅球迷「出征」自家人葡萄牙隊還沒贏球先爆內亂

⊙ 防醫療院所隱私爭議醫事司最快8月公告新制

⊙ 班鐵翔西門町重摔「斷骨釘20釘」痛失千萬坐輪椅重返現場怒告地主

⊙ 車手提領大降97％！台南首創ATM防詐辨識攜手中央倡議全國推動

⊙ 南興國中小學校舍落成盧秀燕：努力做到最後一分鐘

⊙ 全國最大水庫蓄水率飆破4成盼「米克拉」再補水

⊙ 2025年自殺人數下降「2年齡層」不減反增

⊙ 班鐵翔西門町踩「隱形陷阱」摔斷腿北市府：先噴漆示警加貼止滑條

⊙ 政院拋2100億無人載具特別條例陳昭姿：反對用特別預算「神來一筆」

⊙ 飛中國應援還摟抱！蔡尚樺鬆口談3年緋聞親解林秉聖關係