剛剛,Claude Sonnet 4.5重磅發布,編程新王降臨!
北京時間今天凌晨,Anthropic正式發布了Claude Sonnet 4.5。
圖片
這一版本被Claude定義為全球最強的代碼模型,同時在智能體構建、計算機使用、推理和數學能力上展現出顯著突破。
圖片
代碼無處不在,它驅動著應用程序、表格和各種工具。
現代工作的核心在于運用這些工具并解決復雜問題,而Sonnet 4.5讓這一切更加高效和可靠。
全新功能與產品升級
伴隨Sonnet 4.5,Anthropic對Claude全線產品進行了大規模更新:
- Claude Code新增了備受期待的「檢查點」(Checkpoints)功能,可隨時保存進度并一鍵回滾到早先狀態;同時更新了終端界面,并推出了原生VS Code插件。
- Claude API增加了上下文編輯功能和記憶工具,讓智能體能運行更久,處理更復雜的任務。
- Claude apps現已支持在對話中直接執行代碼、生成文件(包括表格、幻燈片和文檔)。
- Claude for Chrome擴展對此前等待名單中的Max用戶開放。
開發者社區也迎來了新的核心資源:Claude Agent SDK。
這套工具包開放了驅動Claude Code的底層基礎設施,為所有人打造智能體提供了基礎能力。
前沿性能與基準成績
Sonnet 4.5在多項權威測試中表現出色:
- SWE-bench Verified:在真實軟件編碼能力測試中達到最新的最優水平,可在復雜的多步驟任務中保持超過30小時的專注執行。
圖片
- OSWorld:在模擬真實計算機任務的基準中,以61.4%的成績位居首位,而四個月前Sonnet 4還保持在42.2%。
視頻演示了Claude for Chrome的模擬操作計算機任務能力
- 推理與數學:在一系列公共評測中大幅領先,特別是在金融、法律、醫學和STEM等專業領域的知識與推理上,遠超此前的Opus 4.1。
圖片
圖片
圖片
圖片
這些進展不僅體現在數據中,也得到了提前體驗的專業用戶們的高度評價:
Claude Code能自主編程30小時以上,幫助工程師在極短時間內完成原本要花費數月的架構工作。——Sean Ward, iGent AI CEO
replit內部代碼編輯測試中,錯誤率從Sonnet 4的9%直接降至0%。——Michele Catasta, replit President
圖片
圖片
圖片
更強的對齊,更安全
Sonnet 4.5是迄今為止對齊性最好的Claude模型。
通過改進的能力和廣泛的安全訓練,模型在減少迎合、欺騙、權力追求和虛妄鼓勵等行為方面取得了明顯成效。
在智能體和計算機使用場景中,團隊也特別加強了對提示注入攻擊的防御。
這些改進已在系統卡(System Card)中以詳細評估形式公開,其中首次引入了可解釋性技術來驗證安全性。
圖片
Sonnet 4.5按照AI Safety Level 3(ASL-3)框架發布,包含一系列防護措施,例如針對化學、生物、放射和核相關內容的分類器過濾機制。
雖然這些過濾器可能偶爾誤判正常內容,但與Sonnet 4相比,誤報率已降低十倍,并將在未來繼續優化。
Claude Agent SDK
在過去半年中,Claude團隊不斷迭代Claude Code,探索了智能體設計中的核心挑戰,包括長時任務的內存管理、權限體系的平衡,以及子代理的協同方式。
如今,這些能力通過Claude Agent SDK向開發者全面開放。
Claude Agent SDK演示視頻
SDK不僅適用于編碼,還能支持更廣泛的應用場景。
它為構建復雜任務的自主智能體提供了與Anthropic內部工具相同的基礎設施。
研究預覽:「Imagine with Claude」
作為額外的實驗,Anthropic發布了一個臨時研究預覽——「Imagine with Claude」。
Imagine With Claude實時生成軟件演示視頻
在這一體驗中,Claude會實時生成軟件,沒有預設功能或預寫代碼,用戶可以直接看到Claude在交互過程中即時創造與適配的過程。
該功能向Max訂閱用戶開放5天,可在claude.ai/imagine上體驗。
API新特性
Sonnet 4.5在API層面也帶來了重要更新:
- 記憶工具(Beta):支持在上下文窗口外存儲和調用信息,幫助跨會話維持知識和狀態。
- 上下文編輯:通過自動清理舊的工具調用和結果來避免上下文溢出。
- 新的停止原因提示:增加了
model_context_window_exceeded,更清晰地標識因上下文限制而中止生成。 - 工具參數改進:修復了字符串參數尾部換行被截斷的問題,保證格式精確傳遞。
- Token計數優化:系統會自動添加優化Token,但用戶不會為這些系統注入的部分付費。
定價與使用渠道
價格保持與Sonnet 4一致:
- 輸入:3美元/百萬Tokens
- 輸出:15美元/百萬Tokens
圖片
Sonnet 4.5可通過以下渠道使用:
- Claude API:
claude-sonnet-4-5-20250929 - Amazon Bedrock:
anthropic.claude-sonnet-4-5-20250929-v1:0 - Google Cloud Vertex AI:
claude-sonnet-4-5@20250929 - 同時也在Claude.ai與Claude Code平臺上線。
圖片
升級指南
當前使用Sonnet 4的開發者,只需將模型名稱更新為claude-sonnet-4-5-20250929即可完成遷移。
所有現有API調用依然有效。建議同時啟用新特性,例如記憶工具和上下文清理,以充分發揮模型性能。
需要注意的是,Sonnet 4.5不再允許同時指定temperature和top_p參數,用戶應選擇其一。

新一輪的AI編程大戰即將來臨
Claude Sonnet 4.5在編碼、智能體能力、計算機使用和安全性方面實現了全面躍升。
它既是開發者工具箱中的新利器,也是一個能在金融、醫學、科研等領域提供專業支持的強大平臺。
Anthropic通過這一版本,繼續推動AI在前沿能力和安全性上的平衡發展。
編程新王降臨,新一輪圍繞編程展開的百模大戰即將展開,而Claude Sonnet 4.5即將成為大家爭相對標的新對象。
參考資料:
https://www.anthropic.com/news/claude-sonnet-4-5
https://docs.claude.com/en/docs/about-claude/models/whats-new-sonnet-4-5
https://assets.anthropic.com/m/12f214efcc2f457a/original/Claude-Sonnet-4-5-System-Card.pdf






























