精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!生產環境下更劃算!但還不夠美觀

原創 精選
人工智能
標準評估基準方面,MiniMax-M1 顯著優于當前主流開源大模型,如 DeepSeek-R1 和 Qwen3-235B,特別是在復雜軟件工程、工具使用、長上下文處理等任務中表現突出。

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

大模型的內卷遠遠沒有結束了。今天凌晨,MiniMax 扔出了一記重磅炸彈——MiniMax-M1。

先來看看,M1 有多猛?

  • 上下文長度 100 萬 tokens(這里指的輸入,達到全球最高水平),秒殺 DeepSeek R1 的 8 倍;
  • 激活參數 45.9 億/次,精度不打折;
  • 計算效率較 DeepSeek 提升 4 倍,生成 10 萬token只用后者 1/4 的算力;
  • 思維預算最高 80K,真正的「長考型」AI;
  • 全面超越 Qwen3-235B、DeepSeek-R1,尤其擅長復雜編程、工具使用與長文本理解。

如果數字看著頭疼,可以看下省流版:

一、長推理能力:實現具有實際生產力的代碼任務,并具備競賽級的數學解題能力。

二、強工具調用能力:穩定處理包含長鏈路思考與工具調用的復雜任務,是Agent時代的優秀基座模型。

三、百萬token長上文支持:提供卓越的海量信息檢索與分析能力,在超長多輪對話中保持強大記憶力。

“省省流”版本,面向三個場景:生產級別環境、Agent工具調用、超長上下文的復雜任務。

多項指標屠榜,超越 DeepSeek R1

MiniMax-M1,這次除了兩個版本,即,輸出 token 方面分別對應 40K 和 80K 的“思維預算(thinking budget)”。

在 Minimax 在 Gihub 上放出的技術報告中顯示——

標準評估基準方面,MiniMax-M1 顯著優于當前主流開源大模型,如 DeepSeek-R1 和 Qwen3-235B,特別是在復雜軟件工程、工具使用、長上下文處理等任務中表現突出。

下圖是核心的基準表現,比如擴展思維能力、數學、編程、推理與知識、軟件工程、長上下文、工具調用智能體、事實問答、通用助手任務等。(下表為 80K 與 40K 版本對比,其他模型包括 Qwen3、DeepSeek、Claude、Gemini、OpenAI 等):

圖片圖片

為了便于大家查看,這里特別制作了一組核心對比。

圖片圖片

從上圖可以看到,MiniMax-M1 尤其在長文本理解、軟件工程與多工具使用方面有明顯領先。

如何做到的?技術亮點一覽

省流版:

1.Hybrid-MoE 架構 + Lightning Attention:少激活,大聰明,既節省算力又保證推理力。

2.大規模 RL 訓練 + 自研 CISPO 強化學習算法:不是靠刷網頁堆語料,而是真刀真槍去練“腦力”。

MiniMax-Text-01 擁有 4560 億參數,每個 token 激活參數為 45.9 億。延續其設計理念,M1 模型原生支持長達 100 萬個 token 的上下文長度,是 DeepSeek R1 的 8 倍。

此外,得益于 lightning attention 機制,M1 在推理時大幅降低計算開銷——例如在生成長度為 10 萬 token 的任務中,M1 所需的計算量僅為 DeepSeek R1 的 25%。

這使得 M1 特別適用于需要處理超長輸入、進行深度思考的復雜任務。

那么,為什么 M1 用更少的參數量 456B就做到了超越 DeepSeek R1 的水平?究竟怎么訓練的呢? 

官方介紹到,M1 通過大規模強化學習(RL)訓練,覆蓋從傳統數學推理到基于沙盒環境的真實世界軟件工程等多種任務。為此,Minimax 團隊開發了一套高效的 RL 擴展框架,亮點包括:

  1. CISPO 算法:提出了一種新穎的策略——不裁剪 token 更新,而是裁剪重要性采樣權重,在多種 RL 變體中表現更優;
  2. 混合注意力設計:天然增強 RL 訓練效率,并解決了混合架構在擴展過程中的一系列獨特挑戰。

此外,MiniMax-M1 開放了:

  • HuggingFace 權重下載(40K / 80K 兩種版本)
  • vLLM 快速部署指南(企業用,真香)
  • Transformers 接入文檔
  • Function Calling(函數調用)支持
  • 支持聯網搜索的 Chatbot / API。
  • 甚至還提供通過 MCP 使用以下能力:視頻生成、圖像生成、語音合成、聲音克隆。

Agent 能力實測:推理比DS-R1更快!

登錄 MiniMax 的對話界面,你就會發現相當囂張的問候語:

Ask anything!No question too long,no query too complex.(盡管來問!沒有問題太長,也沒有提問太復雜。)

圖片圖片

圖片關于 M1 的實測案例,MiniMax 在官方媒體賬號上有放出不少。這里小編更關心的 Agent 場景下的表現。

正如前文所提到的,在 TAU-bench 方面, M1-80k 取得了 62 分的結果,幾乎是 Qwen-32B 得分的兩倍,同時也超越了 Deepseek R1 的 53.5 分。

一位 X 網友對于 M1 在零售場景的表現大為驚嘆:

“在 TAU-bench 零售場景中,僅用 1M 上下文窗口 + 40K 思維預算,就超越了 Gemini 2.5 Pro —— 真是驚艷!”

圖片圖片

小編這里科普一下,這里 TAU-bench retail 測試,其實是一個企業 Agent 的能力測試,它讓大模型完成一個“企業智能助理”或“客戶服務智能代理”在零售場景下的真實任務,比如:

  • 分析庫存和銷售數據
  • 查找和調用特定工具(比如退貨系統、訂單查詢、商品比價 API)
  • 理解復雜政策和規則文檔(如退換貨、會員積分、商品上下架)
  • 制定合理的下一步行動(比如建議補貨、替代商品、發優惠券)

既然都說到這里了,小編忍不住想實際動手測一測。Agent 能力測試題如下:

你是一名智能客服代理,負責處理零售用戶的退貨請求。你可以使用以下工具來完成任務:

【你可以使用的工具】
1. 查詢訂單狀態:`get_order_info(order_id)` → 返回下單時間、狀態、商品信息、用戶ID
2. 查詢用戶積分:`get_user_points(user_id)` → 返回當前積分余額
3. 申請退款:`create_refund(order_id, amount)` → 向用戶發起退款流程
4. 發放積分:`grant_points(user_id, amount)` → 給用戶發放積分

【退貨政策文檔】
- 所有商品支持15天無理由退貨。
- 超過15天需用戶提供合理理由并經人工審核。
- 特殊情況可發放最高不超過20元等值積分補償。
- 咖啡機類產品需保留原包裝和配件,狀態良好。

【任務目標】
請處理用戶的退貨請求,合理使用工具,做出符合政策的判斷,并以自然、溫和的語氣生成一段客服回復。

【用戶輸入】
Hi,我想退掉我上個月買的咖啡機(訂單號:#8492035),但是系統說退貨時間已過。我剛生完孩子,沒時間處理。請你幫我看能不能特殊處理一下,或者給點補償?

請按以下格式輸出:
1. 使用了哪些工具?輸入與輸出是什么?
2. 你的判斷邏輯是什么?
3. 最終給用戶的客服回復是什么?

問 M1、Gemini2.5 Pro、DeepSeek R1 這三款同樣的問題。來看下 表現。

先說結果:三款模型的回答可以說都挺準確。但差距在于:

一、思考過程和速度上。

DeepSeek 明顯是思考過程最長最多的,光思考就占了一分半鐘。

圖片圖片

M1 思考過程相當 37.8s,與 Gemini 2.5 Pro 時長相當(后者只能自己計時,從思考的token長度上看是相當的。) 

圖片圖片

二,輸出答案質量上。三者都答對了。

但是,不得不承認,Gemini 生成的結果更為讓讀者賞心悅目一些,只能說領先模型對于生成結果的細致包裝程度還是值得學習的。

M1 答案如下:

圖片圖片

圖片下面是Gemini 2.5 Pro預覽版的輸出效果——

圖片圖片

圖片然后是 DeepSeek-R1 的答案,給出答案中的判斷邏輯和 Gemini 2.5 Pro比較類似。

圖片圖片

圖片圖片

可以說Agent調用能力方面,Minimax M1 的優勢在于思索很快,答案精簡一些。Gemini 2.5 Pro 和 DeepSeek R1 可以說不相上下,但后者輸入速度更慢一些。

怎么看呢?真要是用在生產環境中,在答案都對的情況下:誰最省 token 誰是最合適的解~

還有歪果仁驚嘆 M1 的 LiveCode 能力的。小編沒有測試哈,如果各位測好了可以評論區反饋一下。

圖片圖片

不過小編,倒是測了一個“抓娃娃”的小游戲。雖然豐富性上差一些,可玩性上倒是超過了 Gemini 2.5 Pro。

M1 的效果如下:簡單到只有個娃娃,但說抓就抓到。

圖片圖片

而 Gemini 2.5 生成畫面更為精致,生成的畫面也更為逼真,但是小編發現,真的是一次都沒抓到過娃娃。難道是 Gemini 更懂得“抓娃娃”的商業邏輯~

圖片圖片

最后,還有一個 one more thing,這一周 MiniMax 也打算來個開源周。看網友們呼聲最高的還是:音視頻模型的開源。靜待深夜的炸彈吧!

圖片圖片

圖片圖片

責任編輯:武曉燕 來源: 51CTO技術棧
相關推薦

2022-03-20 19:03:00

M1 Ultra蘋果芯片

2024-12-16 16:05:34

2022-12-06 07:34:36

語音助手自動語音音箱

2012-04-17 11:48:32

清華紫光掃描儀

2021-09-10 08:31:36

技術Prometheus監控

2011-12-15 09:07:21

javaeclipse

2023-02-07 19:46:35

NIOCQ內核

2011-07-09 15:21:48

筆記本評測

2021-04-06 11:36:47

Starlink網速互聯網

2020-11-26 06:08:39

MacBook

2021-03-13 06:56:56

M1版SSDMacBook

2023-11-16 15:10:39

RustJavaZig

2016-06-06 11:14:21

DockerDelphix

2022-04-06 10:23:41

Linux系統蘋果

2009-08-05 16:19:19

2025-09-22 04:00:00

2020-06-04 17:13:12

JavaScript語言Web

2025-06-20 18:45:01

2025-06-18 16:42:38

2009-09-07 16:17:32

2M寬帶費
點贊
收藏

51CTO技術棧公眾號

亚洲精品第一国产综合野| 日韩三级小视频| 精品美女www爽爽爽视频| 极品国产人妖chinesets亚洲人妖| 鲁大师成人一区二区三区| 欧美精品久久99久久在免费线| 精品国产区在线| 欧美激情一区二区视频| 成人免费在线观看视频| 久久一留热品黄| 91精品国产91久久久久久吃药| 亚洲一区二区三区四区精品| 成年女人的天堂在线| 久久99国产精品久久99大师| 黑人精品xxx一区| 国产精品区免费视频| www.xxxx日本| www.成人| 亚洲三级免费电影| 成人福利视频网| 九一在线免费观看| 国产精品4hu.www| 亚洲国产日韩a在线播放性色| 成人午夜黄色影院| 97免费在线观看视频| 永久91嫩草亚洲精品人人| 欧美美女一区二区在线观看| www.国产在线视频| 色噜噜一区二区三区| 黄色成人在线网站| 亚洲精品99999| 无码人妻丰满熟妇区96| 日产精品久久久久久久性色| 香蕉亚洲视频| 国产性猛交xxxx免费看久久| 国产又黄又猛又粗又爽的视频| 成人免费视频| 成人妖精视频yjsp地址| 性色av一区二区三区免费| 影音先锋黄色资源| 亚洲私拍视频| 欧美韩国一区二区| 成人中文字幕在线观看| 国产高潮流白浆| 国产精品115| 日韩欧美国产免费播放| 西游记1978| jizz中国少妇| 国产视频一区免费看| 亚洲人成免费电影| 911福利视频| www555久久| 国产91高潮流白浆在线麻豆| 91精品国产91久久久久福利| 一区二区三区免费高清视频| 欧美freesex8一10精品| 欧美三级视频在线观看| 大陆极品少妇内射aaaaaa| 色婷婷视频在线| 成人网在线免费视频| 操人视频欧美| 在线免费一区二区| 综合一区av| 美日韩在线视频| 亚洲一区二区观看| **国产精品| 91精品国产综合久久婷婷香蕉 | 国产高清在线观看视频| 国产呦萝稀缺另类资源| 久久久久久久影院| 日本欧美一区二区三区不卡视频| 国产欧美日韩电影| 欧美午夜激情小视频| 日韩欧美精品在线观看视频| 麻豆视频免费在线观看| 久久亚洲精精品中文字幕早川悠里| 好吊妞www.84com只有这里才有精品| 免费看黄色一级视频| 日韩在线卡一卡二| 久久免费成人精品视频| 国产小视频你懂的| 蜜桃精品wwwmitaows| 精品蜜桃在线看| 欧美一级xxxx| 一区二区网站| 在线电影欧美成精品| 在线视频一二区| 久久久伦理片| 在线成人中文字幕| 久久久久亚洲av无码专区桃色| 国产乱码精品一区二区亚洲 | 99久久婷婷| 亚洲欧美日韩综合| 中文在线观看免费视频| 国产日本亚洲| 精品亚洲一区二区三区| 无码人妻一区二区三区免费n鬼沢| 日本在线精品| 欧美性高潮床叫视频| 色免费在线视频| fc2ppv在线播放| 久久久久久久久影院| 久久久综合色| 国产亚洲欧美日韩精品| 性欧美疯狂猛交69hd| 亚洲精品一二| 欧美疯狂性受xxxxx另类| 黑人狂躁日本娇小| 夜久久久久久| 97视频人免费观看| 中文字幕福利视频| 奇米四色…亚洲| 国产999在线| 日本免费在线观看视频| 亚洲精品社区| 亚洲qvod图片区电影| 亚洲熟女乱色一区二区三区久久久 | 亚洲国产精品无码久久久久高潮| 不卡福利视频| 欧美日韩亚洲精品一区二区三区| 九色91popny| 国产成人免费9x9x人网站视频 | 一级黄色录像在线观看| 国产66精品| 超在线视频97| 欧美性猛交xxxxx少妇| 亚洲国产一区二区在线观看| 精品精品国产国产自在线| 大地资源高清在线视频观看| 99热精品在线| 国产精品日韩欧美一区二区| 日本a级在线| 色88888久久久久久影院按摩| 欧美亚洲国产成人| 成人性生交大片免费网站| 日韩精品中文字幕一区| 99re这里只有| 中文字幕午夜精品一区二区三区| 国产精品av网站| 一区二区日韩视频| 国产乱子轮精品视频| 国产精品久久久久久久久久久久冷| 在线视频91p| 玉米视频成人免费看| 九九九九九国产| 久久一区二区三区喷水| 国产精品一区专区欧美日韩| 97人妻一区二区精品免费视频| 国产乱码精品1区2区3区| 日韩女优中文字幕| xvideos国产在线视频| 亚洲成人精品影院| 欧美图片自拍偷拍| 精品国产一区二区三区噜噜噜| 久久九九免费视频| 亚洲一级视频在线观看| 国产精品国产三级国产有无不卡| 日韩一级特黄毛片| 免费看一区二区三区| 国产视频精品久久久| 日韩无码精品一区二区三区| 不卡一区中文字幕| 亚洲一卡二卡三卡| 国产盗摄精品一区二区酒店| 精品少妇一区二区三区日产乱码 | 超碰人人cao| 欧美色资源站| 日韩av成人在线| 国产网站在线播放| 亚洲制服丝袜在线| 欧美一级特黄a| 日韩免费在线| 韩剧1988在线观看免费完整版| 黄色三级网站在线观看| 国产精品欧美一区喷水| 青青草精品视频在线| 色综合视频一区二区三区44| 日韩不卡在线观看| 中文字幕手机在线观看| 成人黄色国产精品网站大全在线免费观看 | 欧美成人精品一区二区| av网站免费大全| 天天av天天翘天天综合网| 国产精品区在线| 婷婷亚洲综合| 国产麻豆日韩| yiren22亚洲综合| 欧美成人精品在线视频| 亚洲av成人精品一区二区三区在线播放 | 亚洲一级片免费观看| 天海翼精品一区二区三区| 久久6精品影院| 中文字幕人妻一区二区三区视频| 国产精品国产三级国产有无不卡 | 中文字幕一区二区在线视频 | 欧美美女被草| 国产丝袜一区视频在线观看| 中文字幕精品在线观看| 亚洲v日本v欧美v久久精品| 亚洲一级片免费观看| 在线欧美一区| 国产精品毛片一区视频| 一呦二呦三呦精品国产| 亚洲男女性事视频| 99久久精品无免国产免费| 国产精品家庭影院| 青青草视频播放| 亚洲专区免费| 妞干网这里只有精品| 欧美一级片网址| 中文字幕不卡av| 亚洲图片欧美日韩| 国产日韩欧美a| 91小视频网站| 亚洲作爱视频| 日本天堂免费a| 日韩欧美视频专区| 欧美日韩精品一区| 国产私拍福利精品视频二区| 欧美人与物videos| 在线观看麻豆蜜桃| 亚洲欧美精品一区二区| 丰满人妻av一区二区三区| 欧美精品久久一区| 中文字幕一区二区人妻痴汉电车| 欧美日韩国产一区在线| 麻豆视频在线观看| 又紧又大又爽精品一区二区| 国产三级精品三级观看| 国产欧美精品一区二区色综合 | 国产精品久久国产精麻豆99网站| 中文人妻一区二区三区| www.亚洲在线| 免费无码av片在线观看| 亚洲高清免费| 日韩国产成人无码av毛片| 国产 日韩 欧美 综合 一区| 亚洲一区二区三区毛片| 91麻豆精品国产综合久久久| 国产精品视频自在线| 全球最大av网站久久| 国产成人亚洲精品| 久久久一本精品| 久久精品影视伊人网| www.黄在线观看| 一本色道久久综合狠狠躁篇的优点| 日本啊v在线| 精品亚洲aⅴ在线观看| 在线观看xxx| 亚洲精品福利在线观看| 香蕉av一区二区三区| 精品调教chinesegay| 手机福利在线| 欧美一区二区女人| 69国产精品视频免费观看| 午夜久久久影院| 青青草成人av| 一本大道久久精品懂色aⅴ| 黄色香蕉视频在线观看| 国产精品成人午夜| 亚洲最大的黄色网址| 亚洲自拍与偷拍| 久久99精品波多结衣一区| 色呦呦网站一区| 夜夜躁狠狠躁日日躁av| 7777精品伊人久久久大香线蕉完整版| 国产精品老熟女视频一区二区| 欧美一级搡bbbb搡bbbb| 欧美视频xxx| 国产视频久久网| 8888四色奇米在线观看| 久久综合网hezyo| heyzo在线欧美播放| 欧洲日韩成人av| 日本高清在线观看视频| 在线电影av不卡网址| 麻豆tv入口在线看| 美女性感视频久久久| 国模精品视频| 欧美国产日本高清在线 | 久久精品国产68国产精品亚洲| 天天综合中文字幕| 国产精品手机在线播放| 在线观看日韩羞羞视频| 午夜日韩激情| 亚洲第一精品区| 欧美中文一区二区| 精品一区二区久久久久久久网站| 神马电影久久| 日韩video| 久久久水蜜桃av免费网站| 男人c女人视频| 99日韩精品| 国产嫩草在线观看| 国产精品综合视频| 欧美成人午夜精品免费| 自拍偷拍国产精品| 无码人妻精品中文字幕| 午夜一区二区三区在线观看| 中文字幕视频一区二区| 亚洲福利视频在线| 日韩中文字幕免费在线观看| 亚洲人成啪啪网站| 不卡一本毛片| 成人精品一区二区三区电影免费| 精品久久ai电影| 国产盗摄视频在线观看| 天堂影院一区二区| 国产免费无码一区二区| 国产精品夫妻自拍| 日本免费在线观看视频| 日韩女优av电影在线观看| 69av亚洲| 日本国产欧美一区二区三区| 一区二区网站| 最新黄色av网站| 日本伊人色综合网| 3d动漫精品啪啪一区二区下载| 亚洲综合色婷婷| 国产黄色av网站| 久久精品电影一区二区| 国产精品高清乱码在线观看| 国产不卡一区二区在线观看| 国产毛片久久久| 喜爱夜蒲2在线| 亚洲经典自拍| 日本xxxx免费| 亚洲日本丝袜连裤袜办公室| 中文字幕精品在线观看| 亚洲人成绝费网站色www| 制服丝袜专区在线| 国内精品视频在线播放| 不卡在线一区| 可以免费观看av毛片| 精彩视频一区二区三区| 一起草最新网址| 亚洲欧美日韩在线| 国产精品爽爽久久| 精品国产一区二区三区久久久狼| 制服丝袜中文字幕在线| 91国产视频在线| 卡通动漫国产精品| 少妇高潮喷水在线观看| 日韩在线卡一卡二| 亚洲一区二区三区日韩| 亚洲精品写真福利| 无码人妻av免费一区二区三区| 欧美日韩国产综合久久| 成人久久精品人妻一区二区三区| 久久综合九色九九| 亚洲国产aⅴ精品一区二区| 国产成人一二三区| 成人av中文字幕| 欧美另类一区二区| 亚洲美女激情视频| 91大神在线观看线路一区| 日韩欧美亚洲日产国| 美女在线视频一区| 给我看免费高清在线观看| 黄网动漫久久久| 欧美男男激情freegay| 不卡av在线播放| av日韩精品| 在线观看精品视频| 国产成人综合网| 嘿嘿视频在线观看| 欧美精品久久久久久久多人混战 | 精品久久久无码中文字幕| 欧美黑人性视频| 自拍欧美一区| 人妻av无码专区| 99久久综合国产精品| 精品国产xxx| 日韩性生活视频| av日韩在线播放| 99视频精品免费| 99久久精品费精品国产一区二区| 999精品久久久| 日韩欧美成人一区| 成人免费看视频网站| 亚洲综合av一区| 风间由美性色一区二区三区| 国产精品免费精品一区| 日韩亚洲第一页| 全球av集中精品导航福利| 超碰在线97免费| 一区二区激情小说| 国产高清在线观看| 国产精品香蕉视屏| 青青草国产精品亚洲专区无| 免看一级a毛片一片成人不卡| 日韩电影网在线| 高清久久精品| 狠狠操精品视频| 亚洲一区在线观看免费观看电影高清 | 99热这里只有精| 5566成人精品视频免费| 国产+成+人+亚洲欧洲在线| 91n.com在线观看| 亚洲成av人片在线|