精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS! 原創

發布于 2025-6-17 15:09
瀏覽
0收藏

編輯 | 云昭

出品 | 51CTO技術棧(微信號:blog51cto)

大模型的內卷遠遠沒有結束了。今天凌晨,MiniMax 扔出了一記重磅炸彈——MiniMax-M1。

先來看看,M1 有多猛?

  • 上下文長度 100 萬 tokens(這里指的輸入,達到全球最高水平),秒殺 DeepSeek R1 的 8 倍;
  • 激活參數 45.9 億/次,精度不打折;
  • 計算效率較 DeepSeek 提升 4 倍,生成 10 萬token只用后者 1/4 的算力;
  • 思維預算最高 80K,真正的「長考型」AI;
  • 全面超越 Qwen3-235B、DeepSeek-R1,尤其擅長復雜編程、工具使用與長文本理解。

如果數字看著頭疼,可以看下省流版:

一、長推理能力:實現具有實際生產力的代碼任務,并具備競賽級的數學解題能力。

二、強工具調用能力:穩定處理包含長鏈路思考與工具調用的復雜任務,是Agent時代的優秀基座模型。

三、百萬token長上文支持:提供卓越的海量信息檢索與分析能力,在超長多輪對話中保持強大記憶力。

“省省流”版本,面向三個場景:生產級別環境、Agent工具調用、超長上下文的復雜任務。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

多項指標屠榜,超越 DeepSeek R1

MiniMax-M1,這次除了兩個版本,即,輸出 token 方面分別對應 40K 和 80K 的“思維預算(thinking budget)”。

在 Minimax 在 Gihub 上放出的技術報告中顯示——

標準評估基準方面,MiniMax-M1 顯著優于當前主流開源大模型,如 DeepSeek-R1 和 Qwen3-235B,特別是在復雜軟件工程、工具使用、長上下文處理等任務中表現突出。

下圖是核心的基準表現,比如擴展思維能力、數學、編程、推理與知識、軟件工程、長上下文、工具調用智能體、事實問答、通用助手任務等。(下表為 80K 與 40K 版本對比,其他模型包括 Qwen3、DeepSeek、Claude、Gemini、OpenAI 等):

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

為了便于大家查看,這里特別制作了一組核心對比。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

從上圖可以看到,MiniMax-M1 尤其在長文本理解、軟件工程與多工具使用方面有明顯領先。

如何做到的?技術亮點一覽

省流版:

1.Hybrid-MoE 架構 + Lightning Attention:少激活,大聰明,既節省算力又保證推理力。

2.大規模 RL 訓練 + 自研 CISPO 強化學習算法:不是靠刷網頁堆語料,而是真刀真槍去練“腦力”。

MiniMax-Text-01 擁有 4560 億參數,每個 token 激活參數為 45.9 億。延續其設計理念,M1 模型原生支持長達 100 萬個 token 的上下文長度,是 DeepSeek R1 的 8 倍。

此外,得益于 lightning attention 機制,M1 在推理時大幅降低計算開銷——例如在生成長度為 10 萬 token 的任務中,M1 所需的計算量僅為 DeepSeek R1 的 25%。

這使得 M1 特別適用于需要處理超長輸入、進行深度思考的復雜任務。

那么,為什么 M1 用更少的參數量 456B就做到了超越 DeepSeek R1 的水平?究竟怎么訓練的呢? 

官方介紹到,M1 通過大規模強化學習(RL)訓練,覆蓋從傳統數學推理到基于沙盒環境的真實世界軟件工程等多種任務。為此,Minimax 團隊開發了一套高效的 RL 擴展框架,亮點包括:

  1. CISPO 算法:提出了一種新穎的策略——不裁剪 token 更新,而是裁剪重要性采樣權重,在多種 RL 變體中表現更優;
  2. 混合注意力設計:天然增強 RL 訓練效率,并解決了混合架構在擴展過程中的一系列獨特挑戰。

此外,MiniMax-M1 開放了:

  • HuggingFace 權重下載(40K / 80K 兩種版本)
  • vLLM 快速部署指南(企業用,真香)
  • Transformers 接入文檔
  • Function Calling(函數調用)支持
  • 支持聯網搜索的 Chatbot / API。
  • 甚至還提供通過 MCP 使用以下能力:視頻生成、圖像生成、語音合成、聲音克隆。

Agent 能力實測:推理比DS-R1更快!

登錄 MiniMax 的對話界面,你就會發現相當囂張的問候語:

Ask anything!No question too long,no query too complex.(盡管來問!沒有問題太長,也沒有提問太復雜。)

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

關于 M1 的實測案例,MiniMax 在官方媒體賬號上有放出不少。這里小編更關心的 Agent 場景下的表現。

正如前文所提到的,在 TAU-bench 方面, M1-80k 取得了 62 分的結果,幾乎是 Qwen-32B 得分的兩倍,同時也超越了 Deepseek R1 的 53.5 分。

一位 X 網友對于 M1 在零售場景的表現大為驚嘆:

“在 TAU-bench 零售場景中,僅用 1M 上下文窗口 + 40K 思維預算,就超越了 Gemini 2.5 Pro —— 真是驚艷!”

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

小編這里科普一下,這里 TAU-bench retail 測試,其實是一個企業 Agent 的能力測試,它讓大模型完成一個“企業智能助理”或“客戶服務智能代理”在零售場景下的真實任務,比如:

  • 分析庫存和銷售數據
  • 查找和調用特定工具(比如退貨系統、訂單查詢、商品比價 API)
  • 理解復雜政策和規則文檔(如退換貨、會員積分、商品上下架)
  • 制定合理的下一步行動(比如建議補貨、替代商品、發優惠券)

既然都說到這里了,小編忍不住想實際動手測一測。Agent 能力測試題如下:

復制

你是一名智能客服代理,負責處理零售用戶的退貨請求。你可以使用以下工具來完成任務:

【你可以使用的工具】
1. 查詢訂單狀態:`get_order_info(order_id)` → 返回下單時間、狀態、商品信息、用戶ID
2. 查詢用戶積分:`get_user_points(user_id)` → 返回當前積分余額
3. 申請退款:`create_refund(order_id, amount)` → 向用戶發起退款流程
4. 發放積分:`grant_points(user_id, amount)` → 給用戶發放積分

【退貨政策文檔】
- 所有商品支持15天無理由退貨。
- 超過15天需用戶提供合理理由并經人工審核。
- 特殊情況可發放最高不超過20元等值積分補償。
- 咖啡機類產品需保留原包裝和配件,狀態良好。

【任務目標】
請處理用戶的退貨請求,合理使用工具,做出符合政策的判斷,并以自然、溫和的語氣生成一段客服回復。

【用戶輸入】
Hi,我想退掉我上個月買的咖啡機(訂單號:#8492035),但是系統說退貨時間已過。我剛生完孩子,沒時間處理。請你幫我看能不能特殊處理一下,或者給點補償?

請按以下格式輸出:
1. 使用了哪些工具?輸入與輸出是什么?
2. 你的判斷邏輯是什么?
3. 最終給用戶的客服回復是什么?

問 M1、Gemini2.5 Pro、DeepSeek R1 這三款同樣的問題。來看下 表現。

先說結果:三款模型的回答可以說都挺準確。但差距在于:

一、思考過程和速度上。

DeepSeek 明顯是思考過程最長最多的,光思考就占了一分半鐘。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

M1 思考過程相當 37.8s,與 Gemini 2.5 Pro 時長相當(后者只能自己計時,從思考的token長度上看是相當的。) 

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

二,輸出答案質量上。三者都答對了。

但是,不得不承認,Gemini 生成的結果更為讓讀者賞心悅目一些,只能說領先模型對于生成結果的細致包裝程度還是值得學習的。

M1 答案如下:

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

下面是Gemini 2.5 Pro預覽版的輸出效果——

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區

然后是 DeepSeek-R1 的答案,給出答案中的判斷邏輯和 Gemini 2.5 Pro比較類似。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

可以說Agent調用能力方面,Minimax M1 的優勢在于思索很快,答案精簡一些。Gemini 2.5 Pro 和 DeepSeek R1 可以說不相上下,但后者輸入速度更慢一些。

怎么看呢?真要是用在生產環境中,在答案都對的情況下:誰最省 token 誰是最合適的解~

還有歪果仁驚嘆 M1 的 LiveCode 能力的。小編沒有測試哈,如果各位測好了可以評論區反饋一下。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

不過小編,倒是測了一個“抓娃娃”的小游戲。雖然豐富性上差一些,可玩性上倒是超過了 Gemini 2.5 Pro。

M1 的效果如下:簡單到只有個娃娃,但說抓就抓到。

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

而 Gemini 2.5 生成畫面更為精致,生成的畫面也更為逼真,但是小編發現,真的是一次都沒抓到過娃娃。難道是 Gemini 更懂得“抓娃娃”的商業邏輯~

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

最后,還有一個 one more thing,這一周 MiniMax 也打算來個開源周。看網友們呼聲最高的還是:音視頻模型的開源。靜待深夜的炸彈吧!

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本命周!MiniMax M1有多猛?網友:僅用40k思考預算就干翻Gemini,實測:真·超DS!-AI.x社區圖片

本文轉載自??51CTO技術棧??,作者:云昭

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
1條回復
按時間正序
/
按時間倒序
wx68426ac5b5c8a
wx68426ac5b5c8a

回復
2025-6-17 17:44:40
回復
相關推薦
99中文字幕| 欧美天堂一区| 国产精品三级| 亚洲自拍偷拍麻豆| 成人h片在线播放免费网站| 亚洲中文字幕一区| 三级小视频在线观看| 第九色区aⅴ天堂久久香| 五月天亚洲精品| 99中文视频在线| 四虎精品永久在线| 日韩欧美ww| 五月婷婷欧美视频| 国产亚洲精品美女久久久m| 久久久精品视频在线| 欧美日韩中出| 一区二区欧美精品| 欧美中日韩一区二区三区| 伊人中文字幕在线观看| 怕怕欧美视频免费大全| 欧美体内谢she精2性欧美| 噜噜噜噜噜久久久久久91| 草久久免费视频| 偷窥自拍亚洲色图精选| 91精品国产乱码| 一区二区三区四区久久| 国产伦精品一区二区三区视频痴汉| 日韩精品久久| 91精品国产全国免费观看| 国产精品69页| 欧美日韩xx| 一区二区三区四区日韩| 91精品国产综合久久小美女| 亚洲小说欧美另类激情| www.日日夜夜| 国产精品夜夜夜| 国产亚洲在线播放| 一女二男3p波多野结衣| 国产成人在线视频免费观看| 国产高清在线观看免费不卡| 欧美激情精品久久久久久黑人| 在线播放av网址| 超碰aⅴ人人做人人爽欧美| 欧美韩国日本综合| 91色视频在线观看| 日韩精品一区二区三| 九一亚洲精品| 日韩成人在线网站| 一区二区成人网| av网站免费在线观看| 成人的网站免费观看| 日本乱人伦a精品| 日本伦理一区二区三区| 1769国产精品视频| 色婷婷综合久久久久中文| 正在播放一区| 少妇人妻偷人精品一区二区| 丰满白嫩尤物一区二区| 国产精品91久久久| 久久一区二区三| 亚洲午夜激情在线| 中文字幕日韩av电影| 91精品国产高清91久久久久久 | 日韩三级不卡| 粉嫩老牛aⅴ一区二区三区| 日韩一区二区三区高清| 国产激情视频在线播放| 午夜亚洲视频| 欧美成人精品在线观看| 久久久久亚洲av成人无码电影| www.91精品| 粉嫩av一区二区三区免费野| 久久精品99国产| 日本大片在线播放| 国产欧美一区二区精品性| 日本欧洲国产一区二区| 三区四区电影在线观看| 91视频你懂的| 18成人在线| 在线观看xxxx| 老色鬼久久亚洲一区二区| 欧美激情视频一区二区| 亚洲免费激情视频| 亚洲激情中文| 色偷偷噜噜噜亚洲男人的天堂| 国产一级二级视频| 精品国产91乱码一区二区三区四区| 亚洲第一中文字幕| 日本黄色www| 四虎精品一区二区免费| 欧美三区免费完整视频在线观看| 国产成人无码精品久久久性色| 中文字幕在线观看网站| 欧美日韩精品在线| 色婷婷一区二区三区av免费看| 中文字幕在线高清| 亚洲不卡一区二区三区| 黄色一级一级片| 精品视频在线播放一区二区三区| 日韩av在线资源| 538精品在线视频| 我不卡神马影院| 中文字幕久精品免费视频| 久草免费新视频| 欧美韩国一区| 欧美日本啪啪无遮挡网站| 五月天婷婷色综合| 免费一区视频| 成人动漫在线视频| 91高清在线视频| 中文字幕不卡的av| 午夜久久资源| 日韩毛片久久久| 欧美日韩国产一区二区三区| 天堂网成人在线| 亚洲综合影院| 丝袜一区二区三区| 日韩不卡在线播放| 国产成人av一区二区| 亚洲欧洲日韩综合二区| 美女av在线播放| 色哟哟精品一区| 亚洲激情 欧美| 国产一区日韩| 97超级碰碰碰| 色老头在线视频| 另类小说视频一区二区| 91日本视频在线| av福利在线播放| 一本一道综合狠狠老| 国产二级一片内射视频播放| 欧美精品国产| 人人澡人人澡人人看欧美| 国产又大又粗又爽| 成人精品国产一区二区4080| 国产免费一区二区三区四在线播放| 欧美18—19sex性hd| 欧美性videosxxxxx| caoporm在线视频| 99re8这里有精品热视频免费| 亚洲第一区第一页| 美女视频黄免费| 国产伦精一区二区三区| 精品久久精品久久| 99se视频在线观看| 色婷婷综合视频在线观看| 国产精品久久久免费观看| 今天的高清视频免费播放成人| 欧美一级淫片videoshd| 亚洲专区在线播放| 国产精品视频你懂的| 大西瓜av在线| 久久人人视频| 波霸ol色综合久久| 国产午夜在线播放| 99精品国产一区二区三区不卡| 色姑娘综合网| 亚洲成人va| 亚洲成在人线av| 日本在线观看视频网站| av电影天堂一区二区在线观看| 亚洲午夜精品一区二区| mm视频在线视频| 午夜精品福利一区二区蜜股av | 国产xxxx振车| 高清av一区二区三区| 国产亚洲精品久久久久久777| 波多野结衣影片| 成人精品小蝌蚪| 尤物av无码色av无码| 亚洲综合图色| 久久久久久国产| 国产精品一区二区av白丝下载 | 日韩一区二区久久久| 99久久久久久久| 久久久亚洲欧洲日产国码αv| 一区二区三区一级片| 精品国产亚洲日本| 国产+人+亚洲| 亚洲国产成人一区二区| 欧美国产1区2区| 在线成人免费av| 国产欧美高清| 亚洲欧美日韩在线综合 | 蜜桃av在线| 91精品国产综合久久精品图片| 欧产日产国产v| 久久精品二区亚洲w码| 好色先生视频污| 亚洲小说图片| 亚洲在线www| 美女写真理伦片在线看| 亚洲成人教育av| 日韩xxx视频| 国产亚洲一区二区三区四区| 无码人妻丰满熟妇区96| 久久要要av| 国产欧美精品在线播放| 137大胆人体在线观看| 欧美va日韩va| 久久网中文字幕| 国产肉丝袜一区二区| 国产chinesehd精品露脸| 久久精品人人做人人爽电影蜜月| 精品一区二区三区日本| 香蕉久久久久久| 久久人人爽人人| 精品视频在线一区二区| 69堂精品视频| 台湾佬中文在线| 亚洲一级在线观看| 无码任你躁久久久久久老妇| 韩日在线一区| 永久域名在线精品| 国产91精品对白在线播放| 国产成人免费电影| av中文资源在线资源免费观看| 在线性视频日韩欧美| 天堂在线视频观看| 日韩欧美国产三级| 激情五月色婷婷| 亚洲欧美视频在线观看视频| 久久久久亚洲av无码麻豆| 日韩avvvv在线播放| 一区二区不卡在线| 自拍视频一区| 久久资源av| 久久婷婷国产| 国产精品第一第二| 黄色大片在线播放| 一区三区二区视频| 国产又黄又粗又硬| 欧美三级中文字| 男人天堂视频在线| 色婷婷综合激情| 久久中文字幕免费| 岛国av午夜精品| 中文字幕第15页| 午夜视频一区二区三区| 国产午夜精品一区二区理论影院| 久久久久久久久久久久久女国产乱 | 91精品中文在线| 不卡亚洲精品| 欧美成人手机在线| av免费在线免费| 毛片精品免费在线观看| 中文字幕资源网在线观看| 欧美老妇交乱视频| 国产理论电影在线| 亚洲人成网站色ww在线| 97精品人妻一区二区三区| 亚洲一区二区精品视频| 久草免费在线观看视频| 亚洲一区二区在线观看视频 | 久久中文在线| 欧美一级黄色影院| 亚洲影视一区| 69精品丰满人妻无码视频a片| 色爱av综合网| 欧美日韩亚洲免费| av日韩在线播放| 国产区日韩欧美| 亚洲精品进入| 性欧美精品一区二区三区在线播放| 日韩av片子| 激情五月六月婷婷| 在线视频精品| 无码人妻精品一区二区蜜桃百度| 欧美激情1区2区3区| 美女扒开大腿让男人桶| 久久久999| jizz18女人| 国产成人精品1024| 播金莲一级淫片aaaaaaa| 国产精品99久久久久久有的能看| 男人添女人荫蒂国产| ww亚洲ww在线观看国产| 女人裸体性做爰全过| 久久久久久久久蜜桃| 成人黄色短视频| 亚洲国产另类av| 国产大学生自拍| 亚洲高清免费在线| 五月激情丁香网| 精品日韩成人av| 福利在线午夜| 亚洲美女福利视频网站| 乱色精品无码一区二区国产盗| 欧美一区二区三区性视频| 欧美77777| 精品成人佐山爱一区二区| 国产高潮流白浆喷水视频| 亚洲精品久久久久久久久久久久| www.五月天激情| 亚洲人成电影在线观看天堂色| 国产福利在线播放麻豆| 青青草成人在线| 日韩精品一区国产| 亚洲 国产 欧美一区| 亚洲欧洲一区二区天堂久久| 欧美高清中文字幕| 日本特黄久久久高潮| 黄色激情在线观看| 中文字幕一区二区三区乱码在线| 国产传媒视频在线| 无码av免费一区二区三区试看| 亚洲综合视频在线播放| 日韩精品高清在线| 欧美日韩经典丝袜| 91精品国产综合久久香蕉最新版| 91麻豆精品| 奇米精品在线| 国产一区导航| 国产女主播在线播放| 亚洲视频一二区| 中文字幕一区二区久久人妻| 欧美精品在线视频| 国产乱淫a∨片免费观看| 亚洲视频欧美视频| 高端美女服务在线视频播放| 91沈先生作品| 欧美a级成人淫片免费看| 精品久久久久久无码国产| av欧美精品.com| 久久精品国产亚洲av高清色欲 | 成人免费在线观看av| 777久久久精品一区二区三区| 亚洲综合日韩| 国产一级免费片| 亚洲一区二区三区视频在线| 国产视频一区二区三区四区五区| 最近的2019中文字幕免费一页| 午夜欧美巨大性欧美巨大 | 欧美性猛交xxxx免费看久久久| 午夜老司机福利| 欧美成人h版在线观看| 国产日韩中文在线中文字幕| 高清国产在线一区| 午夜久久黄色| 91精产国品一二三| 性久久久久久久| 六月婷婷综合网| 2020久久国产精品| 青草久久视频| 中文精品一区二区三区| 免费成人av资源网| 无码国产精品一区二区免费式直播 | 91精品国产高清久久久久久91裸体 | 欧美激情视频免费观看| 一区二区中文字幕在线观看| 999久久欧美人妻一区二区| 国产成人在线看| 黄色激情视频在线观看| 亚洲韩国青草视频| 亚洲人体视频| 日韩精品大片| 久久精品999| www青青草原| 亚洲成人久久久| 中文字幕在线视频久| 日韩电影大全在线观看| 九九**精品视频免费播放| 欧美日韩一区二区三区四区五区六区| 亚洲精品伦理在线| 中文字幕av无码一区二区三区| 色偷偷偷亚洲综合网另类| www 久久久| 国产精品12345| 韩国成人精品a∨在线观看| www.色天使| 欧美午夜片在线观看| 成人在线观看亚洲| 国产欧美日韩在线播放| 老**午夜毛片一区二区三区 | 成人国产精品一区| 欧美视频在线观看| v8888av| 91麻豆精品国产91久久久久久 | 国产精品电影网| 99精品美女| 人妻熟女aⅴ一区二区三区汇编| 欧美性色黄大片手机版| 黄色在线视频网站| 精品久久久久久亚洲精品| 久久99久久久久久| 久草综合在线| 欧美一级日本a级v片| 国内精品免费在线观看| 国产精品7777777| 日韩亚洲精品视频| 日本高清视频免费看| 亚洲欧美综合另类中字| 在线不卡一区| 国产免费黄视频| 亚洲人成亚洲人成在线观看图片| 天堂在线观看免费视频| 成人h视频在线观看播放| 99亚洲伊人久久精品影院红桃| 国产又粗又猛又爽又黄的视频四季| 毛片一区二区|