Anthropic 推出 Claude Opus 4.8,程式碼代理能力大幅進化

分類: AI 新品報導   5/29/2026   Anthropic


AI 公司 Anthropic 今日正式推出最新旗艦模型 Claude Opus 4.8,在代理式程式設計(agentic coding)、多領域推理與電腦操作等任務上都有明顯進步,被視為目前最強的「AI 程式設計協作者」之一。根據官方測試數據,Opus 4.8 在 SWE-Bench Pro 基準測試中達到 69.2% 的成績,超越 OpenAI 的 GPT-5.5 與 Google 的 Gemini 3.1 Pro。在多項代理式任務與知識工作評測中,也展現出更可靠的判斷力與執行力。


速度更快、成本更低

這次更新最受開發者關注的是「快速模式」(Fast Mode)。Opus 4.8 的快速模式速度比前一代快 2.5 倍,價格則便宜 3 倍。同時,模型在程式碼審查時「放過有缺陷程式碼」的機率,比 Opus 4.7 減少了 4 倍,顯示其判斷力與誠實度都有提升。

Anthropic 表示,Opus 4.8 在對齊(alignment)評測中也表現更好,較少出現欺騙或不當行為,親社會傾向更明顯。


新增「動態工作流」功能

此次更新還加入了「動態工作流」(Dynamic Workflows)研究預覽功能。開發者可以讓 Claude 拆解大型任務,自動規劃並啟動多個子代理(subagents)平行作業,適合進行大規模程式碼重構或專案遷移。目前這項功能已開放給 Enterprise、Team 與 Max 方案的 Claude Code 使用者。

此外,模型新增「努力程度控制」(Effort Control),讓用戶可以調整 Claude 思考的深度,預設為高努力模式以獲得最佳品質。Messages API 也支援在對話中途更新系統指令,方便開發者進行更彈性的控制。

AI 軍備競賽持續升溫

Anthropic 目前正同步開發比 Opus 系列更強大的新一代模型,並持續強化安全機制。據悉,代號「Claude Mythos」的新模型已在部分機構進行測試,預計不久後將開放給所有客戶使用。 隨著 Claude Opus 4.8 的推出,AI 在程式設計與代理任務上的實用性再次往前推進一大步。開發者與企業用戶可立即在 Anthropic 平台上體驗新模型。接下來就看看 OpenAI 甚麼時候要發布 GPT 5.6 了!