自己打敗自己!Claude Opus 4.1緊急上線!再度刷新AI編程記錄,未來數周還有重磅! 原創
今天太魔幻了!
短短幾小時內,OpenAI、Anthropic、Google 先后放出新品,直接把八月這場大混戰的序幕點燃了!
Anthropic 選擇在這個節點緊急上線 Claude Opus 4.1,在編碼基準測試上再次登頂。
圖片
Opus 4.1 現已向付費 Claude 用戶和 Claude Code 用戶開放,并同步上線 API、Amazon Bedrock 以及 Google Cloud Vertex AI。
不過,正如一些網友所說,這波更像是應對GPT-5鋪天蓋地的炒作,而搞了一個臨時的小更新。
目的是緩解GPT-5上線后,可能給Claude API收入帶來的沖擊。
圖片
此外,對大多數人來說,自己的編程主力是 Sonnet,而不是這次更新的超大杯 Opus。 如果同類改進下放到 Sonnet,可能會影響更多開發者的日常工作體驗。
好消息是,Anthropic 已經放話——未來幾周還會有更大的模型更新登場。
圖片
一位Hacker News網友期待地說:
鑒于 GPT?5 的傳聞,八月才剛開始。
另一位網友則幽默回復:
按公歷和地球軌道,八月確實才剛開始。
圖片
看來,這將是注定是AI圈不平凡的一個月。
1.編程性能再度提升,但真實體驗更能說明問題
從基準測試來看,Claude這波更新更像是常規操作。
Opus 4.1 在 SWE?bench Verified 測試中將編碼性能提升至 74.5%,刷新了當前的最高分,依舊穩壓 OpenAI o3 和 Gemini 2.5 Pro。
根據 Claude 官方文檔,新版 Opus 還強化了深入研究與數據分析能力,尤其是在細節追蹤和自主搜索方面。
圖片
不過,紙面上的分數是一回事,實際體驗又是另一回事——有開發者表示,雖然提升幅度看似不大,但上手后的感受可能會非常顯著。
這也暴露了當前 benchmark 的一個爭議點:它們越來越難真實反映模型在日常使用中的表現。
在 Reddit 上,一位用戶分享了自己的實測感受:
“我讓它執行了今早做過的同一個任務,結果明顯更好。任務是:在一個大型且復雜的代碼庫中,調查并識別與某個新功能相關的系統與組件。我給了它三個關注領域,并要求為每個領域調用一個子代理,最后將調查結果分別保存成 Markdown 文件。
結果是,Opus 4.1 的搜索行為明顯不同,犯錯次數減少了。雖然它依然會虛構部分服務、誤述 API 和接口,但整體表現的確有所改進。”
圖片
2.Claude 全力押注 To?B,在技術文檔中“點名”大客戶
有意思的是,在篇幅并不長的 Opus?4.1 技術文檔中,Anthropic 特地留出了一整段展示企業客戶的使用反饋。
- GitHub 表示,Claude?Opus?4.1 在大多數能力上較 Opus?4 都有提升,尤其是在多文件代碼重構中的表現十分突出。
- 樂天集團 發現,Opus?4.1 能在大型代碼庫中精準定位需要修正的部分,不會做多余改動或引入 Bug,這種精確度在他們的日常調試中尤為重要。
- Windsurf 報告稱,在其初級開發者基準測試中,Opus?4.1 相比 Opus?4 提升了一個標準差,幅度大致相當于從 Sonnet?3.7 升級到 Sonnet?4 的跳躍。
值得一提的是,在此前 Windsurf 與 OpenAI 收購案鬧得沸沸揚揚之際,Windsurf 曾一度失去 Claude 供應,CEO 連續發帖公開喊話批評 Claude無事前溝通、直接斷供。場面一度十分難看。
如今在經歷一系列風波后,Windsurf 與 Claude 再度恢復合作,顯然關系已經回暖。
這種“客戶背書”正好契合 Anthropic 全力做 To?B 的戰略方向。行業數據顯示,Anthropic 在短短 7?個月內,年化經常性收入(ARR)從 10?億美元飆升至 50?億美元,增長了整整 5 倍;其中 API 收入高達 31?億美元,占據半壁江山。
正如 Anthropic CEO Dario 上周所言:
“我們認為,AI 在企業和專業領域的應用,最終可能會超過 C 端市場。”
3.寫在最后:編程強勢,但 Anthropic 暗藏危機
與 OpenAI、Google 同日更新,Claude 顯然也想搶占流量,稀釋競爭對手的關注度。
在編程體驗上,Claude 系列幾乎一騎絕塵,這也為 Anthropic 帶來了可觀的收入。
但過于集中的客戶結構,讓這份優勢伴隨著高風險——在 31 億美元的 API 收入中,Cursor 和 GitHub 兩家就貢獻了一半。
圖片
這也意味著,一旦 GPT?5 能在編碼能力上對 Claude 發起挑戰,并促使 Cursor、GitHub Copilot 等大客戶轉向 OpenAI,市場格局可能迅速逆轉。
尤其是 GitHub 本身隸屬于微軟,而微軟又是 OpenAI 的重要股東——如果雙方在編程能力上打成平手,Claude 失去 GitHub 的風險將顯著放大。
另一方面,Anthropic 也在積極布局直面企業的 Claude Code。這個產品一經上線,數周內收入就翻倍,年化收入達到 4 億美元,印證了企業級客戶對高性能 AI 編碼工具的巨大需求。
Dario出席各種訪談,也把Claude編程能力提升的細節當做最高的商業機密,絕口不提。
接下來,問題的關鍵在于——GPT?5 會不會在編程能力上實現大幅躍升?
答案可能很快就要揭曉了。
本文轉載自??51CTO技術棧??,作者:伊風

















