精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

我MiniMax,用實習生處理數據,照樣屠榜開源大模型

人工智能 新聞
為啥M1用了Linear Attention,到了M2又換成更傳統的Full Attention了?

屠榜開源大模型的MiniMax M2是怎樣煉成的?

為啥M1用了Linear Attention,到了M2又換成更傳統的Full Attention了?

現在的大模型社區,可謂是被M2的橫空出世搞得好不熱鬧。

面對現實任務,M2表現得非常扛打,在香港大學的AI-Trader模擬A股大賽中拿下了第一名,20天用10萬本金賺了將近三千元。

而之所以能夠站在聚光燈下,還有一個原因是M2身上著實有不少奇招。

除了注意力機制“回歸傳統”,M2在數據處理、思考模式上也是另辟蹊徑,給開源社區帶來了不一樣的技術路徑。

而且MiniMax還公開了這些招數背后的“棋譜”,接連發布三篇技術博客,將M2的技術細節娓娓道來。

博客一發布,本已討論得熱火朝天的大模型社區變得更熱鬧了,不乏有大佬給出自己的分析。

其中也包括質疑的聲音,比如Thinking Machine Lab技術人員Songlin Yang就表示——

MiniMax團隊敢于揭露Linear Attention的不足這點值得肯定,但他們的測試有問題,低估了Linear Attention的實力。

實際上,注意力機制的選擇,也確實是M2相關問題當中最熱門的一個。

M2團隊選擇的理由究竟是什么?三篇技術報告揭開了哪些秘密?

快搬起小板凳,我們一點點往下看。

2025年了,還有人用Full Attention?

就從網友們最好奇的Full Attention機制開始說起。

畢竟現在算力十分稀缺,MiniMax卻沒有選擇更省算力的Linear和Hybrid等機制。

加上M2的上一代M1用的就是Linear Attention,這次卻換了方案,更是給這個選擇添上了幾分神秘色彩。

這個問題看似復雜,但MiniMax的理由卻非常簡單有力——試出來的。

M2團隊希望構建的是一個真正可用于商業部署的通用模型,所以穩定性和可靠性就成了優先考量。

一開始,他們確實也試了Efficient Attention,結果發現,用了這些機制之后的模型,雖然在小任務上表現尚可,但隨著上下文長度的拉長,性能就大幅下降了。

一番折騰之后,團隊最終決定放棄Efficient路徑,轉而回歸穩定可靠的Full Attention。

而且團隊試過的路比想象中多得多,Blog下方有網友追問,是否嘗試更多的Linear Attention變體,比如GDN或Mamba2。

而團隊成員表示,這些方法也都嘗試過,但結果只有一個——這些方法的實際表現都不及Full Attention。

也就是說,Efficient Attention看似是命運的饋贈,實際上早已在暗中標好了價格。

M2的當頭一棒,讓人們開始意識到,所謂的“免費午餐”根本就不存在。

比如這位網友過去就認為,Lightning Attention與Full Attention混合起來效果和純Full Attention是一樣的,但他現在發現,對于復雜任務而言根本不是這么回事。

不過MiniMax也并沒有把其他Attention一棒子打死,M2團隊探討了這些Attention未來的改進方向。

但問題不是出在Attention本身,而是人們缺乏有效的評估系統。

M2團隊指出,現在的模型評測系統不完善,很多常用榜單根本拉不開差距,造成了Efficient Attention表現能與Full Attention持平的假象。

可只要一遇到多跳推理或長鏈邏輯過程這種高端局,Efficient Attention就立馬現原形。

推理基礎設施也需要進一步提升——如何將理論計算復雜度優勢轉化為應用層面的速度和價格優勢,是目前業界仍在攻克的方向。

總之,要想轉化為實際生產力,需要提前構建更豐富的長文數據、更完善的評測體系、更貼近部署場景的實驗范式,以及更穩定的訓練與推理基建。

但隨著Context Length越來越長,尤其是在Pretrain和Posttrain階段都面臨長上下文挑戰的背景下,未來某個階段GPU的增長速度可能趕不上數據長度增長帶來的壓力,那時Linear或Sparse結構的優勢將會逐漸釋放。

想讓模型做好推理,還得從數據開始

現在骨架(模型)搭好了,該往里面填肉(數據)了,有意思的是,這件事,M2團隊雇了一幫實習生來干,還把這個細節寫到了博客里。

網友看了就很納悶,直言自己get不到M2團隊強調這個細節的目的。

面對這樣犀利的提問,作者也是絲毫不賣關子。

之所以強調實習生呢,是想反襯出M2用的數據處理流程非常成熟,成熟到讓沒有經驗的人來操作,一樣可以達到預期效果。

說到底,M2團隊是咋處理數據的?咱們接著往下看。

他們希望模型能夠具有更強的泛化能力,也就是能夠適應更多的任務類型。

確定了這個目標之后,篩選數據的標準自然也就有了。

M2團隊把數據質量的衡量標準拆解成了思維鏈(CoT)和Response這兩個關鍵維度。

CoT部分的標準很容易理解,邏輯完整、表述簡潔,就是優質數據,符合我們的常識。

Response部分就更能體現M2團隊的巧思了。

前面說過,團隊的目的是想讓模型適應更多場景,而在他們看來,Response數據,剛好就是癥結所在——

過去的Response數據,對榜單格式的依賴已經達到過擬合了,導致換個環境就秒變戰五渣。

所以,M2在數據合成時刻意引入了格式多樣性。

當然只靠形式是不夠的,數據內容本身,也要盡可能多地涉獵不同領域的任務。

好的數據要廣泛吸納,不好的數據則要及時剔除——

M2團隊發現,模型表現出的所有問題,包括幻覺、指令未遵循等等,幾乎都能從數據上找到根源。

所以在處理數據時,他們專門整理了一批典型的bad case,基于規則和大模型判斷,構建了數據清洗流程,從而消滅這些“壞數據”。

數據范圍更加廣泛,質量也有了保障之后,接下來的事,就是擴大數據規模了。

交叉思考,讓模型不再“高分低能”

在M2團隊的實踐過程中,有一個“高分低能”的問題貫穿始終——模型一考試成績都很高,但到了真實場景就被虐得渣也不剩。

這個問題在Agent場景中也是如此,甚至同一個模型,在不同的Agent系統里體驗差異也會非常大。

問題出在了哪里呢?M2團隊對Agent執行任務的流程進行了拆解。

Agent在執行任務時,會分析用戶的意圖,然后做出任務規劃,之后付諸執行,中間過程還會涉及外部工具的調用。

在傳統的模型當中,Agent會在規劃階段進行思考,但到了執行環節,就變成了既沒有思維也沒有感情的機器。

但實際工作并不是能夠完全依照原始規劃進行的,如果不根據執行過程中遇到的實際情況對規劃進行調整,那便是刻舟求劍,任務做不好就不是什么怪事了。

而要想根據每步的執行結果進行動態調整,就需要把原先只在開頭進行的思考過程,復制到每一個關鍵節點。

所以,M2團隊提出了“Interleaved Thinking”(交錯式思維鏈)的策略。

這種策略讓思考在顯式推理與工具調用之間交替進行,并把推理結果持續帶入后續步驟,這樣一來原本冗長、重度依賴工具的任務,就變成了穩定的“計劃→行動→反思”循環。

Interleaved Thinking保持了思維鏈的連貫性,使其在多輪交互中不斷累積,更加接近人類的任務執行方式,也減少了狀態漂移與重復性錯誤的產生。

實際應用當中效果也是立竿見影,不僅提升了模型在長鏈任務中的容錯率,也顯著增強了對環境擾動的適應能力。

除了新的思考模式,泛化也是M2團隊自始至終在強調的一個關鍵指標。

他們發現,即便模型的工具調用能力得到大幅提升,但只要換個框架,模型依然容易失控。

怎么辦呢?簡單說,菜就多練——M2團隊選擇從訓練數據下手。

他們設計了一整套覆蓋全軌跡擾動的數據鏈路,在構建訓練樣本時,他們不僅模擬了工具本身的變化,還覆蓋了系統提示語、環境參數變化、用戶反復提問、工具返回異常等多種情況。

看上去指標很復雜,但簡單概括就是,讓這些訓練數據盡可能多地去模擬真實使用場景,在訓練中就學會如何在不確定性中完成任務。

能實現落地,才是好選擇

回看M2的結構選擇,MiniMax并不是為了“回歸傳統”而選擇Full Attention。

相反,在Efficient Attention廣受追捧的當下,堅持使用Full Attention恰恰體現了團隊更偏工程理性的判斷——優先考慮模型在真實任務中的穩定性與可用性,而非盲目追求資源的節省。

這并非首次類似決策,例如早在MoE架構尚未成為行業主流前,MiniMax就已投入探索,并取得階段性成果。

彼時,選擇MoE的廠商寥寥,MiniMax卻憑借自身理解做出了不同判斷,并最終驗證了可行性。

可以看出,MiniMax不僅擁有深刻的技術洞察,更突出以實用性為導向,在M2上,這種思路也表現得尤為明確——

它不是一個為參數堆疊而生的“炫技模型”,而是為開發者準備的落地工具,強調解釋邏輯、兼顧系統性,并不斷通過社區反饋與真實使用場景持續迭代。

在今天這個“結構百花齊放”的階段,MiniMax展示的,不只是模型能力本身,更是一套面向復雜現實問題的思考方式。

比起搶占某個風口,擁有一套穩定可用、被理解并認可的工程體系,也許更具意義。

責任編輯:張燕妮 來源: 量子位
相關推薦

2012-11-19 13:53:42

職場Google實習生

2020-07-27 08:26:03

數據庫 SQL索引

2014-01-07 09:23:41

項目管理

2025-05-16 09:12:00

2009-09-17 09:35:17

微軟實習生

2010-10-12 11:06:07

招聘

2013-06-07 09:59:40

Google實習面試

2023-10-16 09:27:27

2020-03-17 10:01:22

人工智能神經網絡技術

2021-05-20 19:56:08

泄露密碼數據泄露網絡攻擊

2015-04-14 15:05:35

Web前端開發騰訊暑期實習生

2024-01-09 15:51:56

Rust開發Trait

2011-12-07 20:37:42

iOSAndroid谷歌

2009-03-13 08:58:04

AOL裁員實習

2021-06-24 17:37:58

機器學習人工智能計算機

2020-02-03 09:10:23

數據庫刪庫刪庫跑路

2012-11-07 17:05:41

Google實習生

2019-08-07 11:02:28

Python 開發編程語言

2013-11-26 14:15:43

2013-02-20 10:40:21

實習生科技公司谷歌
點贊
收藏

51CTO技術棧公眾號

日韩欧美精品在线观看| 免费观看日韩av| 亚洲精品xxxx| 欧美一级视频免费在线观看| 捆绑凌虐一区二区三区| 成人看片网站| 亚洲精品综合在线| 欧美在线视频在线播放完整版免费观看| a级在线观看视频| 精品日韩视频| 亚洲综合免费观看高清完整版在线 | 91精品国产一区二区三区香蕉| 99久久免费观看| 国产乱视频在线观看| 国产在线精品免费| 国产91精品久久久久久| 国产免费美女视频| 亚洲免费成人av在线| 91精品国产高清一区二区三区蜜臀| 黄色免费福利视频| 99热国产在线| 欧美激情在线看| 精品亚洲第一| 国产草草影院ccyycom| 久久精品人人| 97精品国产97久久久久久免费 | 欧美一级大片视频| 黄色在线观看免费| 久久久久久久性潮| 精品magnet| 日本大胆人体视频| 欧美三级黄网| 国产三区在线成人av| 国产日韩欧美精品| www.色婷婷.com| 久久电影网电视剧免费观看| 国产成人精彩在线视频九色| 日本a在线观看| 中文不卡在线| 神马久久久久久| www..com.cn蕾丝视频在线观看免费版| 99香蕉久久| 欧美一级久久久| 无尽裸体动漫2d在线观看| 91在线高清| 久久久久久久久伊人| 精品无人区一区二区三区| 亚洲男女视频在线观看| 国产麻豆视频一区| 亚洲直播在线一区| 国产剧情久久久| 自拍偷拍欧美专区| 日韩在线播放视频| 久久久精品少妇| 欧美电影免费播放| 日韩在线视频二区| 免费看特级毛片| 91精品一区国产高清在线gif | 欧美一区二区视频在线观看2022 | 国产精品狼人色视频一区| 久久av超碰| 韩国精品免费视频| 国产热re99久久6国产精品| 国产乱码77777777| 奇米影视一区二区三区| 中文字幕久久亚洲| 99在线观看| 亚洲天堂网在线视频| 精品精品99| 亚洲视频在线观看| 谁有免费的黄色网址| 欧美日韩国产传媒| www.亚洲天堂| 免费视频一二三区| 亚洲日本成人| 亚洲欧美国产精品va在线观看| 青青草视频成人| 国产一区二区三区探花| 中文字幕在线精品| 三级影片在线看| 国产精品hd| 欧美性受xxx| 波多野结衣小视频| 国产在线视频一区二区三区| 成人精品水蜜桃| 日韩有码电影| 中文字幕免费在线观看视频一区| 中文字幕剧情在线观看一区| 免费网站在线观看人| 欧美性猛xxx| 女人高潮一级片| 麻豆视频在线观看免费网站黄| 欧美体内谢she精2性欧美| 丰满少妇在线观看| 视频国产精品| 亚洲精品资源美女情侣酒店| 一级性生活免费视频| 激情亚洲网站| 超在线视频97| 日本天堂网在线| 精品一区二区三区香蕉蜜桃| 国产色综合一区二区三区| xxxxx日韩| 亚洲大尺度视频在线观看| 999在线免费视频| 日本少妇精品亚洲第一区| 日韩精品在线视频观看| 日本福利片在线观看| 久久激情一区| 成人18视频| 最新国产在线观看| 精品欧美激情精品一区| 日本中文字幕影院| 日韩欧美ww| 欧美成人免费va影院高清| 神马久久久久久久| 欧美亚洲一级| 91色精品视频在线| 国产一级二级三级在线观看| 337p粉嫩大胆噜噜噜噜噜91av | 亚洲制服一区| 美国一区二区三区在线播放| 欧美日韩在线网站| 日韩一区二区不卡| www色com| 91精品综合| 亚洲天堂a在线| 少妇人妻无码专区视频| 999精品视频在线观看| 亚洲精品日韩丝袜精品| 国产一级片久久| 国产精品一区二区亚洲| 久久久久久香蕉| 免费在线观看污网站| 51漫画成人app入口| 欧美日韩一区二区在线观看视频| 亚洲精品乱码久久久久久久| 欧美淫片网站| 国产日韩在线看片| 国产高清av在线| 狠狠色狠狠色综合日日五| 韩国一区二区三区四区| 亚洲欧美色图| 成人国产亚洲精品a区天堂华泰| 国产小视频免费在线网址| 欧美性猛交xxxx| 荫蒂被男人添免费视频| 午夜精品亚洲| 99在线国产| 狂野欧美性猛交xxxxx视频| 欧美一区日韩一区| 乱h高h女3p含苞待放| 国产综合色精品一区二区三区| 亚洲精品一区国产精品| 黄色欧美视频| 久久精品久久久久电影| 国产毛片毛片毛片毛片| 日韩美女视频一区| 男生和女生一起差差差视频| 91精产国品一二三| 五级黄高潮片90分钟视频| 国产乱论精品| 久久久久久久一| 青娱乐国产视频| 天天操天天干视频| 视频在线观看一区二区三区| 久久久久久精| 二区三区不卡| 在线观看欧美日韩国产| 一级全黄少妇性色生活片| 国产精品美女www爽爽爽| 精品久久久99| 久久久国产精品| 99re在线观看| 波多野结衣在线高清| 日韩国产精品视频| 亚洲天堂男人av| 国产精品久久一卡二卡| 1314成人网| 在线一区视频| 国产亚洲一区二区精品| 亚洲精品毛片一区二区三区| 中文字幕在线不卡一区| 黄色一级视频在线播放| 日本久久成人网| 国产精品老女人视频| 国产剧情在线| 亚洲精品动漫100p| 中文无码av一区二区三区| 亚洲精品视频在线观看网站| 亚洲乱码国产乱码精品精| 日本成人黄色免费看| 亚洲福利影院| 色偷偷av一区二区三区乱| www.天天干.com| 日韩欧美一区视频| 成人自拍小视频| 91在线免费视频观看| 伊人久久免费视频| 精品一区二区成人免费视频| 日韩伦理av| 亚洲女同精品视频| 国产欧美综合视频 | 欧美一区二区在线看| 黄色一级片免费看| 亚洲欧美在线观看| 好吊一区二区三区视频| 国内精品久久久久影院一蜜桃| 激情五月宗合网| 91精品二区| 日本在线免费观看一区| 成人三级av在线| 国产在线精品成人一区二区三区| 国产精品25p| 在线精品亚洲一区二区不卡| 少妇影院在线观看| 亚洲国产精品二十页| 午夜视频在线观看国产| 国内精品久久久久影院一蜜桃| 成年人视频在线免费| 激情综合自拍| www.黄色网址.com| 亚州精品国产| 777午夜精品福利在线观看| 成人看片免费| 色小说视频一区| 黄色在线免费观看大全| 亚洲黄色av网站| www.国产麻豆| 在线成人午夜影院| 一区二区视频在线免费观看| 日韩欧美亚洲范冰冰与中字| 日本一区二区欧美| 亚洲中国最大av网站| 亚洲国产美女视频| 国产精品久久久久久户外露出 | 全亚洲最色的网站在线观看| 国产经典三级在线| 色综合五月天导航| 特级毛片在线| 久久99精品视频一区97 | 国语自产偷拍精品视频偷 | 一区二区不卡在线播放| 91精品国产闺蜜国产在线闺蜜| 国产精品看片你懂得| 欧美性受xxxx黑人| 亚洲国产精品成人久久综合一区| www.色天使| 国产日韩影视精品| 日本乱子伦xxxx| 国产精品天天摸av网| 欧美三级视频网站| 国产精品久久看| 91制片厂在线| 中文字幕一区二区三区av| 日韩亚洲欧美中文字幕| 1000部国产精品成人观看| 中国一级片在线观看| 亚洲美女视频在线观看| 91精品国产高清一区二区三蜜臀| 樱花草国产18久久久久| 国产精品白浆一区二小说| 亚洲二区视频在线| 国产91精品一区| 色悠久久久久综合欧美99| 免费看一级视频| 欧美日韩一区国产| 国产成人精品毛片| 亚洲国产精品va在线观看黑人| 日本精品999| 亚洲人成网站免费播放| av在线免费观看网| 久久国产精品久久久| 俄罗斯一级**毛片在线播放| 欧美综合在线观看| 日韩av黄色| 国产高清在线精品一区二区三区| 欧美在线导航| 亚洲人成人77777线观看| 欧美日韩三级电影在线| 哪个网站能看毛片| 久久精品国产亚洲一区二区三区| 女人扒开双腿让男人捅| 91日韩精品一区| 国产福利在线导航| 亚洲一区二区三区中文字幕在线| 天堂中文字幕在线观看| 欧美精品乱码久久久久久按摩| 成人小说亚洲一区二区三区| 日韩高清a**址| 精品美女在线观看视频在线观看| 亚洲91精品在线| 激情久久99| 久久精品国产99精品国产亚洲性色| 精品国产中文字幕第一页 | 国产99re66在线视频| 国产精品久久久久久久久男| 亚洲图色一区二区三区| 日韩精品成人一区二区在线观看| 亚洲女同另类| 午夜免费一区二区| 丁香六月久久综合狠狠色| 久久久久久国产免费a片| 亚洲综合在线视频| 波多野结衣视频观看| 亚洲国产精品久久久| 免费观看在线午夜影视| 456亚洲影院| 日韩三级网址| 亚洲精品一区二区三| 国产日韩1区| 中文字幕 欧美 日韩| 日本一区二区成人在线| 成年人免费高清视频| 日韩午夜在线影院| 91xxx在线观看| 欧洲亚洲免费在线| a级日韩大片| 午夜在线视频免费观看| 视频一区视频二区在线观看| 欧美xxxxx精品| 亚洲精品乱码久久久久久日本蜜臀| 波多野结衣视频在线看| 日韩精品在线视频美女| 国内高清免费在线视频| 欧美日韩久久久| 亚洲自拍三区| 四虎精品成人影院观看地址| 亚洲性受xxx喷奶水| 国产一区二区三区视频免费| 波多野结衣乳巨码无在线观看| 国产精品久久久久aaaa九色| www.精品| 成人在线免费观看一区| 国产精品精品国产一区二区| 免费观看成人在线视频| 91麻豆免费视频| 日韩女优在线观看| 精品国产乱码91久久久久久网站| 18视频在线观看网站| 国产精品直播网红| 精品日韩免费| 男女爽爽爽视频| 国产欧美在线观看一区| 日本一本在线观看| 亚洲欧美另类在线观看| 欧美a级在线观看| 麻豆av一区二区三区| 国产精品久久久久9999高清| 在线免费观看a级片| 午夜私人影院久久久久| 秋霞av鲁丝片一区二区| 97精品久久久| 另类尿喷潮videofree| 青青草成人免费在线视频| 99视频精品在线| www成人在线| 亚洲欧美色图片| 电影亚洲精品噜噜在线观看| 天天人人精品| 九九热在线视频观看这里只有精品| youjizz亚洲女人| 欧美电影影音先锋| fc2ppv国产精品久久| 成人情视频高清免费观看电影| 一区在线观看| 可以直接看的无码av| 天天影视网天天综合色在线播放| 女人18毛片一区二区三区| 97在线精品国自产拍中文| 性欧美lx╳lx╳| 在线观看的毛片| 亚洲视频免费观看| 韩国av永久免费| 欧美在线视频一二三| 日韩专区精品| 免费看一级大黄情大片| 久久这里只有精品6| 在线播放一级片| 欧美丰满少妇xxxxx做受| 欧美一性一交| 九色91popny| 一区二区高清免费观看影视大全| 五十路在线视频| 国产精品欧美在线| 国模 一区 二区 三区| 人人妻人人澡人人爽人人精品| 欧美性大战久久久久久久| 岛国中文字幕在线| 久久精品日韩精品| 精品一区二区免费在线观看| 日韩精品人妻中文字幕| 中文字幕在线日韩 | 1024日韩| 美女100%露胸无遮挡| 久久精品欧美一区二区三区麻豆| 性久久久久久久久久久| 日本韩国一区二区三区视频| 国产欧美日韩成人| 青青在线视频一区二区三区|