Claude Opus 4.1火速發布!坐穩編程之王,官方:馬上還有大更新
還是Claude痛快,Claude Opus 4.1前腳曝光,今天這就正式發了。
編程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。
此外在Agent任務和推理方面進一步升級。
但加量不加價,定價和Claude Opus 4一樣。

官方說計劃在未來幾周對模型進行更大規模升級與改進,看來真就只是一次小更新,替代Opus 4。

實測用它做一個俄羅斯方塊小游戲,提示詞是“build the tetris game”,表現很穩。

有人覺得,Anthropic可能本來不想發模型,但是奈何GPT-5/Gemini-3的消息太多,為了保持市場競爭力所以先更新一波。

值得一提的是,Claude Opus 4.1這篇發布blog雖然簡短,但是里面的心機可不老少——秀性能提升、秀客戶關系、還變相證明自家模型真實好用。
現在的硅谷AI圈,真有意思哇。
明曬模型性能,暗秀客戶關系
Anthropic首先曬了大家最關心的模型編程能力。
在SWE-bench上,Opus 4.1超越Opus 4、Gemini 2.5 Pro、o3,將性能提升至74.5%,拿下新SOTA。
同時還提升了深度研究和數據分析的技能,特別是在細節追蹤和Agent檢索方面。

其次,他們還找來客戶做背書,邀請他們分享了內測中覺得Opus 4.1印象深刻的能力。既能體現自家模型在真實場景中好用,也暗暗秀了一把自己的客戶訂單。
根據GitHub給出的三方結果,Opus 4.1各個方面都較Opus 4有所改進,特別是在跨文件重構代碼上,提升明顯。
Rakuten Group(日本樂天株式會社)表示,Opus 4.1很擅長在大型代碼庫中精準定位、修復bug,且不需要進行不必要的調整、也不會產生新的bug,他們團隊很喜歡在日常任務中使用這一功能。
Windsurf則表示,在初級開發基準測試中,Opus4到Opus 4.1的提升,和此前Sonnet 3.7到Sonnet 4的提升一樣大。
這里插一句,因為亞歷山大·王帶團跳槽Meta,Windsurf剩余團隊去向不明期間,Anthropic還斷供了Windsurf一段時間,這應該是因為當時OpenAI要收購Windsurf。
如今隨著Windsurf被Cognition收購,這種封鎖已經解除,借著此次模型升級,Anthropic也算是亮明“大家還是好伙伴”的態度。
至于為啥找這么多客戶來背書……前段時間GPT-5被泄露可不只有ChatGPT這邊,還包括Cursor等合作平臺,是故意的還是不小心不知道,但是OpenAI和誰合作大家都清楚了。Anthropic也想曬客戶關系,也很正常。
最后,這篇Blog很簡短,官方也明說就是小升級。
這種文風更受開發者們喜愛,畢竟隔壁的大忽悠實在是emmm……太能拉高大家預期了。

不管是有意還是無意,Anthropic都和最近一直炒GPT-5熱度的OpenAI形成鮮明對比,誰現在更加技術本色,大家想必也心中有選擇。
以及Opus 4.1的System Card也一同發布,其中表明Opus 4.1是對Opus 4的進一步調整,模型的核心尺寸或訓練方法都沒有變化。
同時Anthropic也公布了Opus 4.1的更多相關指標。
比如Opus 4.1的無害回復回應率更高,如果開啟推理,指標已經能達到99.06%。

更多內容大家可在System Card中進一步查看。
最后,Claude Opus 4.1已面向所有付費用戶開放,包括Claude Code;也可以通過API、Amazon Bedrock和Vertex AI上使用,定價和Claude Opus 4一樣。
Blog:https://www.anthropic.com/news/claude-opus-4-1
System Card:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf

































