8%價格,2倍速度!國產MiniMax M2暴打Claude Sonnet 4.5?我們實測后發現堪稱性價比之王! 原創
編輯 | 聽雨
出品 | 51CTO技術棧(微信號:blog51cto)
10月27日,MiniMax正式開源并上線了 MiniMax M2。官方口號喊得非常響亮:“專為 Agent 和代碼而生,僅 Claude Sonnet 8% 價格,2倍速度,限時免費!”
這就引發了很多網友紛紛前去體驗,再加上官方延長了限時免費的時間,截至11月7日前都可以免費體驗Agent平臺和調用API,政策十分誘人。
現在MiniMax首頁已經有很多網友分享了自己的作品,可以說是五花八門:有MBTI測試、在線撲克游戲、兒童繪本等等……
圖片
小編也迫不及待地實測了一下MiniMax M2的Agent能力,分別體驗了網頁制作和游戲制作,并與Sonnet 4.5進行了對比。
先放結論:M2的綜合性能還是很不錯的,最后的輸出結果與Sonnet 4.5相比是各有千秋,有些方面甚至更加出彩。
老規矩,在測試開始前,先簡單介紹一下MiniMax M2這款模型。從官方介紹可以看出,這個模型的定位還是非常聚焦的:
- 頂級代碼能力:
專為端到端開發工作流打造,在Claude Code、Cursor、Cline、Kilo Code、Droid 等多種應用中表現卓越強大
- Agentic表現:
出色規劃并穩定執行復雜長鏈條工具調用任務,協同調用Shell、Browser、Python代碼執行器和各種MCP工具
- 極致性價比&速度:
通過高效的激活參數設計,實現智能、速度與成本的最佳平衡
在Artificial Analysis的測試中,MiniMax M2以61分獲得了開源模型第一、全球第五的成績,緊隨Claude 4.5 Sonnet,排在前面的也都是幾位大佬。
圖片
在Agent最關鍵的三個能力——編程能力、工具使用能力和深度搜索能力上,M2在工具使用和深度搜索方面都不遜于海外頂尖模型,編程能力也在國內名列前茅。
圖片
MiniMax M2主打的就是性價比。目前,MiniMax官方對模型的API價格定在每百萬Token輸入0.3美金/2.1元人民幣,以及輸出1.2美金/8.4元人民幣,同時在線上提供TPS(每秒輸出Token數)在100左右的推理服務(還在快速提升)。 這個價格是Claude Sonnet 4.5 的8%,而推理速度快了接近一倍。
目前,M2的完整模型權重已經開源,采用MIT協議,在線Agent平臺和API截至11月7日前都免費。
Round 1:制作元素周期表
小編出的第一道題是制作一個介紹元素周期表的網站,給出的prompt也非常簡單,“幫我制作一個介紹元素周期表的網頁,要求可交互,風格簡潔美觀”。
沒有用GPT生成一個復雜詳細的prompt,目的就是想測試一下編程小白能不能用M2直出一個網頁。
圖片
MiniMax M2收到指令后,很快就進一步拆解制作思路,并給出了幾種設計方案供用戶選擇。
圖片
小編選擇了第一種設計方案,也是MiniMax推薦的瑞士國際主義風格。確認方案后,M2就開始了漫長的生成過程。
這里不得不吐槽一下,M2的網頁制作過程耗時實在太久了,整體上花了大約20-30分鐘,而且中間M2還失敗了一次,又重新進行開發。
圖片
不過M2的思考過程非常豐富,可以看到整個網頁開發的設計、構建、部署、測試、驗證的完整流程。
圖片
圖片
最后還有“驗證”這個步驟,事無巨細地測試了搜索、篩選、交互卡片、模態框等各個功能。
圖片
終于,網頁生成了!讓我們來看看MiniMax做的元素周期表。
首先,整個網頁讓人眼前一亮,風格簡潔明了。但仔細一看,118個元素并沒有展示完整,鑭系元素和錒系元素都有缺失,而鹵素和惰性氣體則是一個元素也沒列出來。
圖片
圖片
其次,網頁交互還是做得很不錯的,點擊各個元素可以查看元素的具體信息,包括原子序數、原子量、基本屬性、物理屬性,部分元素還能查看發現年代及發現者。
圖片
上方有搜索框,顯示輸入元素的名稱、序號或符號都可以進行搜索。
圖片
輸入“氫”會出現氫元素,輸入“20”會出現鈣元素,這都沒問題。
圖片
但是這個功能也有Bug。輸入“Fe"沒有出現相應的鐵元素,而小編隨手輸入一個“L”,卻出現了很多結果。
圖片
仔細一看,某個元素的英文中有字母“l”,也會被歸入搜索結果中。
再次,這個網頁還有篩選功能,點擊相應類別,下方就會出現相應元素。不過也歸咎于元素展示不完整,點擊部分類別時沒有出現相應的元素。
圖片
還有一個小細節,就是鼠標懸停在某個元素上時,會出現一點陰影效果,這也是M2自己想出的設計。
頁腳部分,顯示數據來源為國際純粹與應用化學聯合會(IUPAC),這個組織及其官網都是真實存在的,官網上也有元素周期表的展示。
圖片
圖片
總的來說,MiniMax M2生成的這個網站功能很多樣,檢索、分類篩選、交互等功能應有盡有,設計風格也很美觀。但最大的硬傷就是元素展示不完整、網頁生成時間較長。
另外,小編還同步測試了Sonnet 4.5。使用的是一模一樣的Prompt,大概三四分鐘整個網頁就生成好了。
圖片
可以看到,Sonnet 4.5生成的網頁還是很簡潔明了的。
首先,完整展示了118個元素,并用不同顏色對不同類型的元素進行了標注(堿金屬、堿土金屬、過渡金屬、鹵素、稀有氣體等)。
其次,網頁有基本的交互效果,點擊元素可查看基本信息,包括原子序數、相對原子質量、元素符號等,但沒有MiniMax M2生成得那么全面。
再次,整個網頁的功能也比較簡單,只有元素展示、點擊查看具體信息這兩個功能,不像M2還做了檢索、分類篩選等功能。
圖片
另外還有一點差評,那就是Sonnet4.5說自己做了一個簡單的懸停效果,鼠標懸停時元素會放大。但是小編發現其實并沒有這個效果。
總的來說,在網頁制作這個項目上,MiniMax M2和Claude Sonnet 4.5是各有千秋。
M2的整體設計風格更美觀,功能也更加豐富,但略微有些本末倒置,最重要的元素展示反而有所缺失。
而Sonnet 4.5則勝在輸出速度快,信息完整全面。不過在功能和交互上,一行簡單的prompt就不能指望太多了,只能說是迅速給到你一個各方面都合格的網頁。
Round 2 :俄羅斯方塊游戲
這一回我給出的propmt依舊非常簡單:“幫我制作一個俄羅斯方塊游戲,要求能夠玩起來,沒有bug”。
這回我們先來看看Sonnet 4.5,它的速度依然快得驚人,僅僅半分鐘左右,游戲就做好了。
圖片
游戲包含7種經典的方塊形狀(I、O、T、S、Z、J、L),具備完整的碰撞檢測系統,可以實現自動消除滿行并計分,方塊旋轉和移動也十分流暢。
另外,游戲還設計了暫停/繼續功能,很適合辦公摸魚。
圖片
Sonnet 4.5生成的這個俄羅斯方塊游戲,在小編心里妥妥的是超出及格線的水平。
來到MiniMax M2這邊。一如往常,M2收到指令后會進行分析,并詢問用戶是否有特殊要求。
圖片
小編確認無特殊要求后,模型就進入了開發流程。大約等待20分鐘后,游戲終于制作完畢。
圖片
游戲的整體效果還是可以的,鍵盤操作、計分系統、游戲的暫停/繼續等功能都沒有問題,方塊的旋轉移動也十分流暢。
唯一的bug在于方塊不能自動下降,只能鍵盤控制,這就比較放水了。
另外,游戲左下方還會提示下一個圖形的形狀,這也給游戲降低了難度。
但在頁面設計上,M2生成的游戲風格要比Sonnet更加美觀,元素和色彩也更加豐富,還多了一個“重新開始”功能,看來這么長的輸出時間也沒有完全白費。
結論:M2更有亮點、性價比之王,Sonnet表現更穩定
經過這兩輪測試,小編認為MiniMax M2的綜合性能還是非常不錯的。從測試結果來看,在頁面風格、功能設計等方面,M2的表現甚至超越了Sonnet,還有一些出彩的點,令人驚喜。
但M2給出的結果都存在一些硬傷,比如元素周期表的元素不全、俄羅斯方塊游戲中方塊不能自動下降等,反而是Sonnet的表現會更加穩定,并且在輸出效率上也明顯超越M2。
不過在價格方面,MiniMax M2的定價只有Claude Sonnet 4.5的8%,而生成質量卻能保持在八九成的水準,這個價格還要什么自行車?性價比壓倒一切!
再加上現在 MiniMax 還針對性推出了免費活動:新的 M2 模型,以及 Agent 產品都可以限時免費使用 14 天,包括 API 也免費。這也是小編見過的免費幅度最大的活動。
伙計們,還等什么?趕緊體驗起來吧!
在線Agent體驗地址:??https://agent.minimaxi.com/??
本文轉載自??51CTO技術棧??,作者:聽雨

















