「性價比王者」Claude Haiku 4.5來了,速度更快,成本僅為Sonnet 4的1/3
距離上次新品發布僅僅兩周后,Anthropic 又出手了。
最新消息,Anthropic 發布輕量級模型 Claude Haiku 4.5,主打「更便宜、更快速」。
據 Anthropic 介紹,Claude Haiku 4.5 的編碼性能可與中高端模型 Claude Sonnet 4(這是 Anthropic 于 5 個月前發布的模型)相媲美,但成本更低,每百萬輸入 token 的成本為 1 美元,每百萬輸出 token 的成本為 5 美元,僅為 Claude Sonnet 4 的三分之一。而推理速度卻提升一倍多。

用 Anthropic 發言人的話來說就是,「Haiku 4.5 在性能上有了明顯的飛躍,現在基本上和 Sonnet 4 一樣智能,但速度卻快得多,成本卻只有 Sonnet 4 的三分之一?!?/span>
不僅如此,從測試數據來看,Claude Haiku 4.5 在某些任務,甚至超越了 Claude Sonnet 4。比如 computer use 「OSWorld」(一個在現實世界計算機任務中測試人工智能模型的基準測試平臺)上,前者得分 50.7%,后者得分 42.2%;數學推理(AIME 2025)測試中,前者借助 Python 工具,成績高達 96.3%,后者為 70.5%。

整體來看,Claude Haiku 4.5 核心面向實時、低延遲的任務場景,比如聊天助手、客服人員、協同編程等。這些場景用戶將會體驗到 Claude Haiku 4.5 的高智能、極快速度。而 Claude Code 用戶則會發現 Claude Haiku 4.5 顯著提升了編碼體驗的響應速度,包括多智能體項目到快速原型開發設計等。

早期客戶的一些體驗評價也體現了 Claude Haiku 4.5 的能力水平:
比如,Augment Code 的聯合創始人 Guy Gur-Ari 表示,「Claude Haiku 4.5 達到了我們意想不到的最佳狀態:接近前沿的編碼質量、驚人的速度和成本效益。在 Augment 的內部編碼評估測試中,Haiku 4.5 的性能達到了 Sonnet 4.5 的 90%,甚至可以與規模更大的模型相媲美?!?/span>

Windsurf 的首席執行官 Jeff Wang 也表示,「歷史上,模型總是為了質量而犧牲速度和成本,而 Haiku 4.5 正在「模糊」這種傳統權衡的界限:它是一種快速的前沿模型,既保持了成本高效,又預示了這類模型的發展方向?!?/span>

其實,從測試數據上也不難看出,目前,Claude Sonnet 4.5 仍然是 Anthropic 最好的模型,在各項性能表現上都超過 Claude Haiku 4.5,而 Claude Haiku 4.5 的長處在于能以更高的成本效益為用戶提供「近乎前沿的性能」。
另外,Anthropic 表示,兩者的配合使用還將為企業客戶帶來極大優勢:前者可以構建前沿多步驟計劃,而后者則并行完成子任務,「從而支持多智能體系統快速高質量地處理復雜的重構、遷移和大型功能構建?!?/span>
比如,在金融服務領域,Claude Sonnet 4.5 和 Haiku 4.5 的結合所帶來的多智能體架構,將徹底改變企業監控市場和管理風險的方式。在 Anthropic 的設想中,Haiku 4.5 將同時監控數千個數據流 —— 追蹤監管變化、市場信號和投資組合風險,而 Sonnet 4.5 則負責處理復雜的預測模型和戰略分析。
而對于研究機構來說,分工可以大幅壓縮時間。比如,Claude Sonnet 4.5 可以協調全面的分析,而多個 Haiku 4.5 Agent 則可以并行處理數十個來源的文獻綜述、數據收集和文檔合成,根據 Anthropic 的描述,這可能「將數周的研究壓縮到數小時」。
還有一點非常重要的是,Claude Haiku 4.5 不僅速度快、價格低,而且安全。
Anthropic 表示,他們對 Claude Haiku 4.5 進行了一系列詳細的安全性和一致性評估,結果顯示,該模型表現出較低的令人擔憂的行為發生率,并且比其前身 Claude Haiku 3.5 的一致性顯著提高。而在自動一致性評估中,Claude Haiku 4.5 的總體偏差行為發生率也顯著低于 Claude Sonnet 4.5 和 Claude Opus 4.1。
因此,根據這一指標,Claude Haiku 4.5 可以堪稱是他們「迄今為止最安全的模型?!?/span>
所以綜合來看,Claude Haiku 4.5 是目前 Anthropic「更快、性價比更高、更安全」的模型版本。
目前,Claude Haiku 4.5 已在全球上線,作為 Claude Haiku 3.5 與 Sonnet 4 的「直接替代品」,用戶可通過 Claude 官方平臺、API 接口,以及亞馬遜 Bedrock、Google Cloud Vertex AI 等云服務渠道訪問使用。
業界的朋友應該感受到了,最近 Anthropic 真是動作頻頻,兩個月內接連發布三大 AI 模型,「太卷了」。
今年 8 月上旬,Anthropic 發布新模型 Opus 4.1,在編程評估基準 SWE-Bench Verified 上得分達到 74.5%,較 Opus 4 的 72.5% 提升兩個百分點。
緊接著,9 月 30 日,重磅發布了自詡為「世界上最好的編碼模型」的 Claude Sonnet 4.5。之后就是兩周后的今天,再次帶來新模型,自己卷自己。
而有意思的是,最近有報道傳出,Anthropic 到今年年底有望實現 90 億美元的年化營收目標,此外,更是明年設定了更激進的「小目標」:基準情況下年化營收超過 200 億美元,最佳情況下可達 260 億美元,相當于今年營收的近兩倍。而據 Anthropic 的發言人在接受媒體采訪時透露,Anthropic 本月的年化營收正接近 70 億美元……
似乎「自卷」的理由找到了……





































