自己打敗自己！Claude Opus 4.1緊急上線！再度刷新AI編程記錄，未來數周還有重磅！原創

51CTO技術棧

發布于 2025-8-6 13:06

瀏覽

0收藏

今天太魔幻了！

短短幾小時內，OpenAI、Anthropic、Google 先后放出新品，直接把八月這場大混戰的序幕點燃了！

Anthropic 選擇在這個節點緊急上線 Claude Opus 4.1，在編碼基準測試上再次登頂。

自己打敗自己！Claude Opus 4.1緊急上線！再度刷新AI編程記錄，未來數周還有重磅！-AI.x社區圖片

Opus 4.1 現已向付費 Claude 用戶和 Claude Code 用戶開放，并同步上線 API、Amazon Bedrock 以及 Google Cloud Vertex AI。

不過，正如一些網友所說，這波更像是應對GPT-5鋪天蓋地的炒作，而搞了一個臨時的小更新。

目的是緩解GPT-5上線后，可能給Claude API收入帶來的沖擊。

自己打敗自己！Claude Opus 4.1緊急上線！再度刷新AI編程記錄，未來數周還有重磅！-AI.x社區圖片

此外，對大多數人來說，自己的編程主力是 Sonnet，而不是這次更新的超大杯 Opus。如果同類改進下放到 Sonnet，可能會影響更多開發者的日常工作體驗。

好消息是，Anthropic 已經放話——未來幾周還會有更大的模型更新登場。

自己打敗自己！Claude Opus 4.1緊急上線！再度刷新AI編程記錄，未來數周還有重磅！-AI.x社區圖片

一位Hacker News網友期待地說：

鑒于 GPT?5 的傳聞，八月才剛開始。

另一位網友則幽默回復：

按公歷和地球軌道，八月確實才剛開始。

自己打敗自己！Claude Opus 4.1緊急上線！再度刷新AI編程記錄，未來數周還有重磅！-AI.x社區圖片

看來，這將是注定是AI圈不平凡的一個月。

1.編程性能再度提升，但真實體驗更能說明問題

從基準測試來看，Claude這波更新更像是常規操作。

Opus 4.1 在 SWE?bench Verified 測試中將編碼性能提升至 74.5%，刷新了當前的最高分，依舊穩壓 OpenAI o3 和 Gemini 2.5 Pro。

根據 Claude 官方文檔，新版 Opus 還強化了深入研究與數據分析能力，尤其是在細節追蹤和自主搜索方面。

自己打敗自己！Claude Opus 4.1緊急上線！再度刷新AI編程記錄，未來數周還有重磅！-AI.x社區圖片

不過，紙面上的分數是一回事，實際體驗又是另一回事——有開發者表示，雖然提升幅度看似不大，但上手后的感受可能會非常顯著。

這也暴露了當前 benchmark 的一個爭議點：它們越來越難真實反映模型在日常使用中的表現。

在 Reddit 上，一位用戶分享了自己的實測感受：

“我讓它執行了今早做過的同一個任務，結果明顯更好。任務是：在一個大型且復雜的代碼庫中，調查并識別與某個新功能相關的系統與組件。我給了它三個關注領域，并要求為每個領域調用一個子代理，最后將調查結果分別保存成 Markdown 文件。

結果是，Opus 4.1 的搜索行為明顯不同，犯錯次數減少了。雖然它依然會虛構部分服務、誤述 API 和接口，但整體表現的確有所改進。”

自己打敗自己！Claude Opus 4.1緊急上線！再度刷新AI編程記錄，未來數周還有重磅！-AI.x社區圖片

2.Claude 全力押注 To?B，在技術文檔中“點名”大客戶

有意思的是，在篇幅并不長的 Opus?4.1 技術文檔中，Anthropic 特地留出了一整段展示企業客戶的使用反饋。

GitHub 表示，Claude?Opus?4.1 在大多數能力上較 Opus?4 都有提升，尤其是在多文件代碼重構中的表現十分突出。
樂天集團發現，Opus?4.1 能在大型代碼庫中精準定位需要修正的部分，不會做多余改動或引入 Bug，這種精確度在他們的日常調試中尤為重要。
Windsurf 報告稱，在其初級開發者基準測試中，Opus?4.1 相比 Opus?4 提升了一個標準差，幅度大致相當于從 Sonnet?3.7 升級到 Sonnet?4 的跳躍。

值得一提的是，在此前 Windsurf 與 OpenAI 收購案鬧得沸沸揚揚之際，Windsurf 曾一度失去 Claude 供應，CEO 連續發帖公開喊話批評 Claude無事前溝通、直接斷供。場面一度十分難看。

如今在經歷一系列風波后，Windsurf 與 Claude 再度恢復合作，顯然關系已經回暖。

這種“客戶背書”正好契合 Anthropic 全力做 To?B 的戰略方向。行業數據顯示，Anthropic 在短短 7?個月內，年化經常性收入（ARR）從 10?億美元飆升至 50?億美元，增長了整整 5 倍；其中 API 收入高達 31?億美元，占據半壁江山。

正如 Anthropic CEO Dario 上周所言：