精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MiniMax震撼開源,突破傳統Transformer架構,4560億參數,支持400萬長上下文

人工智能
隨著 Agent 進入應用場景,無論是單個 Agent 工作時產生的記憶,還是多個 Agent 協作所產生的 context,都會對模型的長上下文窗口提出更多需求。

2025 年,我們可能會看到第一批 AI Agent 加入勞動力大軍,并對公司的生產力產生實質性的影響。

——OpenAI CEO Sam Altman

2025 年,每個公司都將擁有 AI 軟件工程師 Agent,它們會編寫大量代碼。

——Meta CEO Mark Zuckerberg

未來,每家公司的 IT 部門都將成為 AI Agent 的 HR 部門。

—— 英偉達 CEO 黃仁勛

2025 新年伊始,在很多趨勢都還不明朗的情況下,幾位 AI 業界的重要人物幾乎在同一時間做出了類似的判斷 ——2025 年將是 AI Agent 之年。

沒想到,MiniMax 很快就有了動作:開源了最新的基礎語言模型 MiniMax-Text-01 和視覺多模態模型 MiniMax-VL-01。

新模型的最大亮點是,在業內首次大規模實現了新的線性注意力機制,這使得輸入的上下文窗口大大變長:一次可處理 400 萬 token,是其他模型的 20-32 倍。

他們相信,這些模型能夠給接下來一年潛在 Agent 相關應用的爆發做出貢獻。

為什么這項工作對于 Agent 如此重要?

隨著 Agent 進入應用場景,無論是單個 Agent 工作時產生的記憶,還是多個 Agent 協作所產生的 context,都會對模型的長上下文窗口提出更多需求。

  • 開源地址:https://github.com/MiniMax-AI
  • Hugging Face:https://huggingface.co/MiniMaxAI
  • 技術報告:https://filecdn.minimax.chat/_Arxiv_MiniMax_01_Report.pdf
  • 網頁端:https://www.hailuo.ai
  • API:https://www.minimaxi.com/platform

一系列創新造就比肩頂尖模型的開源模型

MiniMax-Text-01 究竟是如何煉成的?事實上,他們為此進行了一系列創新。從新型線性注意力到改進版混合專家架構,再到并行策略和通信技術的優化,MiniMax 解決了大模型在面對超長上下文時的多項效果與效率痛點。

MiniMax-Text-01 的架構

1. Lightning Attention

目前領先的 LLM 大都基于 Transformer,而 Transformer 核心的自注意力機制是其計算成本的重要來源。為了優化,研究社區可以說是絞盡腦汁,提出了稀疏注意力、低秩分解和線性注意力等許多技術。MiniMax 的 Lightning Attention 便是一種線性注意力。

通過使用線性注意力,原生 Transformer 的計算復雜度可從二次復雜度大幅下降到線性復雜度,如下圖所示。

MiniMax 的相關技術報告中寫道,這主要是得益于一種右邊積核技巧(right product kernel trick)。以 2022 年論文《The Devil in Linear Transformer》中的 TransNormer 為例,下圖左側的 NormAttention 機制可轉換成使用「右側矩陣乘法」的線性變體。

而 Lightning Attention 便是基于 TransNormer 實現的一個 I/O 感知型優化版本。

以下是 Lightning Attention 前向通過的算法描述。

基于 Lightning Attention,MiniMax 還提出了一種 Hybrid-lightning,即每隔 8 層將 Lightning Attention 替換成 softmax 注意力,從而既解決了 softmax 注意力的效率問題,也提升了 Lightning Attention 的 scaling 能力。

效果如何?下表給出了根據層數  l、模型維度  d、批量大小 b 和序列長度 n 計算注意力架構參數量與 FLOPs 的公式。

可以明顯看出,模型規模越大,Lightning Attention 與 Hybrid-lightning 相對于 softmax 注意力的優勢就越明顯。

2. 混合專家(MoE) 

MoE 相對于密集模型的效率優勢已經得到了大量研究證明。MiniMax 團隊同樣也進行了一番比較實驗。他們比較了一個 7B 參數的密集模型以及 2B 激活參數和 20B 總參數的 MoE 模型。結果如下圖所示。

可以看到,在多種基準上,當計算負載一樣時,MoE 模型的表現要大幅優于密集模型。

MiniMax 還引入了一個新的 allgather 通信步驟,可解決擴大 MoE 模型的規模時可能會遇到路由崩潰(routing collapse)問題。

3. 計算優化

與許多大模型訓練項目一樣,MiniMax 先通過小規模實驗上述技術改進的有效性以及 Scaling Law,然后再開始著手大規模訓練。MiniMax 為此采用了 1500 到 2500 臺 H800 GPU—— 并且在訓練過程中,具體使用 GPU 數量會動態變化。而大規模訓練都有自己的特有挑戰,MiniMax 開發了一系列針對性的優化技術。

首先,對于 MoE 架構,最主要的優化目標是降低其通信負載。尤其是對于采用 all-to-all(a2a)通信的 MoE 模型。MiniMax 的解決方案是一種基于 token 分組的重疊方案。

其次,對于長上下文訓練,一大主要挑戰是難以將真實的訓練樣本標準化到統一長度。傳統的方式是進行填充,但這種方法非常浪費計算。MiniMax 的解決思路是進行數據格式化,其中不同樣本會沿序列的維度首尾相連。他們將這種技術命名為 data-packing。這種格式可盡可能地降低計算過程中的計算浪費。

最后,為了將 Lightning Attention 投入實踐,MiniMax 采用了四項優化策略:分批核融合、分離式的預填充與解碼執行、多級填充、跨步分批矩陣乘法擴展。

MiniMax-Text-01上下文巨長,能力也夠強

基于以上一系列創新,MiniMax 最終得到了一個擁有 32 個專家共 4560 億參數的 LLM,每個 token 都會激活其中 459 億個參數。MiniMax 將其命名為 MiniMax-Text-01。在執行推理時,它的上下文長度最高可達 400 萬 token,并且其表現出了非常卓越的長上下文能力。

1. MiniMax-Text-01 基準成績優秀

在常見的學術測試集上,MiniMax-Text-01 基本上能媲美甚至超越 GPT-4o、Claude 3.5 Sonnet 等閉源模型以及 Qwen2.5、DeepSeek v3、Llama 3.1 等 SOTA 開源模型。下面直接上成績。

可以看到,在 HumanEval 上,MiniMax-Text-01 與 Instruct Qwen2.5-72B 相比表現出色。此外,MiniMax-Text-01 在 GPQA Diamond 這樣具有挑戰性問答的數據集上取得了 54.4 的成績,超過了大多數開源指令微調的 LLM 以及最新版本的 GPT-4o。

MiniMax-Text-01 在 MMLU、IFEval 和 Arena-Hard 等測試中也取得了前三名的成績,展示了其在給定限制條件下,應用全面知識來充分滿足用戶查詢、與人類偏好保持一致的卓越能力。可以想象,基于最新的模型能力,也給開發者開發 Agent 應用提供了更好的基礎。

2. 領先的上下文能力

那 MiniMax-Text-01 引以為傲的長上下文能力呢?其優勢就更為明顯了。

在長上下文理解任務上,MiniMax 測試了 Ruler 和 LongBench v2 這兩個常見基準。首先在 Ruler 上,可以看到,當上下文長度在 64k 或更短時,MiniMax-Text-01 與其它 SOTA 模型不相上下,而當上下文長度超過 128k 時,MiniMax-Text-01 的優勢就明顯顯現出來了。

在 Ruler 上,MiniMax-Text-01 與其它模型的性能比較

同樣,MiniMax-Text-01 在 LongBench v2 的長上下文推理任務上的表現也非常突出。

在  LongBench v2 上,MiniMax-Text-01 與其它模型的性能比較

另外,MiniMax-Text-01 的長上下文學習能力(終身學習的一個核心研究領域)也是 SOTA 水平。MiniMax 在 MTOB 基準上驗證了這一點。

在 MTOB 上,MiniMax-Text-01 與其它模型的性能比較

3. 長文本能力Showcase

MiniMax-Text-01 得到了很不錯的基準分數,但實際表現如何呢?下面展示了一些示例。

首先,來寫首歌吧!

人類評估者也給出了非常正面的評價:詩意的語言和演繹空間為歌曲增添了層層的趣味和情感共鳴,使歌曲既引人入勝又發人深省。

下面重點來看看 MiniMax-Text-01 的長上下文能力。對于新幾內亞的一門小眾語言 Kalamang,先將指令、語法書、單詞表、與英語的對照例句放入 MiniMax-Text-01 的上下文,然后讓其執行翻譯。可以看到,MiniMax-Text-01 給出的答案基本與標準答案一致。

至于長對話記憶任務,MiniMax-Text-01 可說是表現完美。

4. 視覺-語言模型

基于 MiniMax-Text-01,MiniMax 還開發了一個多模態版本:MiniMax-VL-01。思路很簡單,就是在文本模型的基礎上整合一個圖像編碼器和一個圖像適配器。簡而言之,就是要將圖像變成 LLM 能夠理解的 token 形式。

因此,其整體架構符合比較常見的 ViT-MLP-LLM 范式:MiniMax-VL-01 作為基礎模型,再使用一個 303M 參數的 ViT 作為視覺編碼器,并使用了一個隨機初始化的兩層式 MLP projector 來執行圖像適應。

當然,為了確保 MiniMax-VL-01 的視覺理解能力足夠好,還需要在文本模型的基礎上使用圖像-語言數據進行持續訓練。為此,MiniMax 設計了一個專有數據集,并實現了一個多階段訓練策略。

最終,得到的 MiniMax-VL-01 模型在各個基準上取得了如下表現。

可以看到,MiniMax-VL-01 整體表現強勁,整體能與其它 SOTA 模型媲美,并可在某些指標上達到最佳。

下面展示了一個分析導航地圖的示例,MiniMax-VL-01 的表現可得一個贊。

探索無限的上下文窗口讓 Agent 走進物理世界

有人認為 [1],context 會是貫穿 AI 產品發展的一條暗線,context 是否充分同步會直接影響智能應用的用戶體驗,這包括用戶的個性化信息、環境變化信息等各種背景上下文信息。

而為了保證 context 充分同步,足夠大的上下文窗口就成了大模型必須克服的技術難題。目前,MiniMax 已經在這條路上邁出了重要的一步。

不過,400 萬 token 的上下文窗口明顯不是終點。他們在技術報告中寫道:「我們正在研究更高效的架構,以完全消除 softmax 注意力,這可能使模型能夠支持無限的上下文窗口,而不會帶來計算開銷。」

除此之外,MiniMax 還在 LLM 的基礎上訓練的視覺語言模型,同樣擁有超長的上下文窗口,這也是由 Agent 所面臨的任務所決定的。畢竟,在現實生活中,多模態任務遠比純文本任務更常見。

「我們認為下一代人工智能是無限接近通過圖靈測試的智能體,交互自然,觸手可及,無處不在。」MiniMax 創始人在去年的一次活動中提到。

或許,「無處不在」也意味著,隨著多模態 token 的加入,Agent 也將逐步進入物理世界。為此,AI 社區需要更多的技術儲備。

責任編輯:趙寧寧 來源: 機器之心
相關推薦

2024-09-30 14:10:00

2025-10-11 04:22:00

人工海馬體網絡LV-Eval

2025-10-27 09:38:26

2025-10-31 01:00:00

2025-02-06 10:21:51

2024-04-03 10:05:00

LLM性能基準測試

2025-10-20 09:06:00

2025-01-15 12:27:11

2023-08-10 14:04:15

代碼模型

2024-11-04 08:45:00

2025-07-10 09:03:27

2025-07-25 10:06:05

2024-04-29 13:09:10

LLM架構性能

2025-01-14 17:23:08

2024-09-05 08:24:09

2023-09-16 13:47:47

人工智能數據

2025-07-31 09:06:00

2025-09-10 09:38:56

2017-05-11 14:00:02

Flask請求上下文應用上下文
點贊
收藏

51CTO技術棧公眾號

亚洲专区一区二区三区| 欧亚精品一区| 亚洲一二三四久久| 精品久久蜜桃| 6—12呦国产精品| 欧美成人久久| 亚洲欧美在线磁力| 亚洲黄色av片| 黄色在线免费观看网站| 国产亚洲婷婷免费| 91免费在线观看网站| 久久久久久少妇| 99视频精品全部免费在线视频| 亚洲精品一区二区三区精华液| 欧美黑人又粗又大又爽免费| 91一区二区三区在线| 久久综合九色欧美综合狠狠| 91精品视频免费观看| 一级黄色免费网站| 一区二区三区午夜视频| 亚洲桃花岛网站| 久久久男人的天堂| 欧美视频免费看| 欧美视频在线免费看| 免费看黄色a级片| 在线视频婷婷| 2023国产精品| 国产伦理久久久| 国产精品一级视频| 免费看欧美女人艹b| 26uuu久久噜噜噜噜| jizz亚洲少妇| 午夜欧美在线| 少妇高潮久久久久久潘金莲| 丰满大乳奶做爰ⅹxx视频| 9.1麻豆精品| 欧美午夜寂寞影院| 欧美激情成人网| 成年男女免费视频网站不卡| 亚洲三级电影网站| 在线看成人av电影| 国产三级在线观看| 久久综合资源网| 久久精品99| 欧日韩在线视频| 成熟亚洲日本毛茸茸凸凹| 亚洲一区二区三区成人在线视频精品| 懂色av蜜臀av粉嫩av喷吹| 亚洲欧美网站| 奇米四色中文综合久久| 国产性xxxx高清| 亚洲激情在线| 91国在线精品国内播放| 日韩黄色在线视频| 日韩视频一区| 51精品在线观看| 久久99国产综合精品免费| 国产欧美短视频| 欧美在线一区二区视频| 日本道在线观看| 亚洲欧美日韩国产综合精品二区 | sis001亚洲原创区| 一区二区成人在线| 国产精品999视频| 牛牛精品一区二区| 日韩欧美一区二区三区| 国产自偷自偷免费一区 | 韩国av网站在线| 日韩美女啊v在线免费观看| 中文字幕一区二区三区最新| 精品176二区| 一级日本不卡的影视| 分分操这里只有精品| 天堂中文最新版在线中文| 色综合天天狠狠| 香蕉视频禁止18| 日本少妇精品亚洲第一区| 精品免费视频.| www.久久国产| 久久一区91| 欧美精品激情在线| 中文字幕精品视频在线观看| 男女男精品视频| 2020国产精品久久精品不卡| 少妇喷水在线观看| 国产欧美一二三区| 欧美精品一区二区性色a+v| 不卡的av影片| 国产一区二区三区免费在线 | 亚洲国产99精品国自产| 中文字幕在线观看网址| av伊人久久| 欧美大片大片在线播放| 日韩免费视频一区二区视频在线观看| 肉肉av福利一精品导航| 91亚洲精品久久久久久久久久久久| 亚洲av无码一区二区乱子伦| 97精品国产露脸对白| 亚洲激情电影在线| 成人影院在线播放| 欧美日韩一区 二区 三区 久久精品| 色姑娘综合天天| 神马香蕉久久| 欧美成人在线影院| 天干夜夜爽爽日日日日| 国产老肥熟一区二区三区| 麻豆成人小视频| 污污的网站在线看| 欧美视频在线观看一区| 99久久人妻精品免费二区| 欧美顶级大胆免费视频| 26uuu亚洲国产精品| 国产三级视频在线播放| 久久久国产精华| 97碰在线视频| 中文字幕综合| 国产亚洲免费的视频看| 人人干人人干人人干| 国产在线一区二区| 视频一区在线免费观看| 麻豆蜜桃在线观看| 日韩美女一区二区三区四区| 少妇太紧太爽又黄又硬又爽小说 | 亚洲欧美自偷自拍另类| 日韩av黄色在线| 欧美黄色片视频| 国产美女三级无套内谢| 国产精品久久影院| 精品少妇无遮挡毛片| 欧美黄色录像| 性欧美激情精品| 欧美综合视频在线| 亚洲国产视频a| 91丨porny丨九色| 91精品国产自产在线观看永久∴| 国产精品黄页免费高清在线观看| 天天色综合久久| 亚洲成人1区2区| 亚洲香蕉中文网| 欧美色图首页| 99精彩视频在线观看免费| 国产传媒在线播放| 欧美日韩国产一区| 亚洲女同二女同志奶水| 蜜臀av一区二区在线观看| 日本在线观看一区| 国产 日韩 欧美一区| 亚洲男人天堂2024| 中文字幕亚洲欧美一区二区三区 | 日韩中文字幕1| 麻豆成人在线播放| 亚洲女色av| 亚洲丝袜在线视频| 中文字幕+乱码+中文乱码91| 日本一区二区三区国色天香| 别急慢慢来1978如如2| 欧美亚洲国产精品久久| 国产精品久久久久久久久久久久| 国产福利小视频在线观看| 在线观看91视频| 奇米网一区二区| 国产一区二区三区四区五区美女| 男女啪啪免费观看| 久久亚州av| 欧美亚洲视频一区二区| 国内av一区二区三区| 欧美性受极品xxxx喷水| 午夜成人亚洲理伦片在线观看| 九一九一国产精品| 国产尤物av一区二区三区| 国产精品流白浆在线观看| 9.1国产丝袜在线观看| 欧美91精品久久久久国产性生爱| 色婷婷一区二区| 国产三级短视频| 国内国产精品久久| 亚洲色欲久久久综合网东京热| 久久人人爽人人爽人人片av不| 欧美专区在线视频| 午夜伦理在线| 精品国产网站在线观看| 4438国产精品一区二区| 国产精品久久免费看| 国产精品日日摸夜夜爽| 美女尤物久久精品| 久久久成人精品一区二区三区 | 日韩高清av| 成人豆花视频| 欧美一区二区三区艳史| 香港伦理在线| 亚洲国产成人久久综合一区| 影音先锋欧美资源| 亚洲xxxxxx| 亚洲福利视频久久| 中文资源在线播放| 亚洲va国产va欧美va观看| 国产熟女一区二区| 粉嫩高潮美女一区二区三区| 日本一本二本在线观看| 午夜久久久久| 亚洲精品成人自拍| 激情亚洲另类图片区小说区| 国产精品入口免费视| 好久没做在线观看| 中文字幕亚洲综合| 少妇一区二区三区四区| 在线观看91av| 欧美a视频在线观看| 一区二区三区精品在线观看| 蜜乳av中文字幕| 国产91精品一区二区麻豆亚洲| 国产a级片免费观看| 国产精品大片| 亚洲最大色综合成人av| 免费成人高清在线视频theav| 亚洲最大成人在线| 日韩av首页| 欧美一级片一区| 色呦呦久久久| 日韩视频在线免费| 国产福利小视频在线| 日韩av在线看| 国产 日韩 欧美 综合| 欧美日韩不卡在线| 亚洲欧美一二三区| 欧美性猛交xxxx富婆弯腰| 国产性猛交普通话对白| 亚洲欧美中日韩| 俄罗斯毛片基地| 久久精品一区二区| 国产美女喷水视频| 91丨porny丨国产入口| 国产清纯白嫩初高中在线观看性色| 久久国产麻豆精品| 亚洲精品高清无码视频| 午夜宅男久久久| 波多野结衣家庭教师在线| 欧美午夜电影在线观看 | 5858s免费视频成人| 国产精品第六页| 日本韩国一区二区三区| 日韩人妻精品中文字幕| 狠狠久久五月精品中文字幕| 国产成人在线播放视频| 精品成人久久av| 国产 日韩 欧美 在线| 亚洲激情第一区| 欧美三级小视频| 亚洲最大成人综合| 久久久久久久蜜桃| 亚洲成人一区在线| 91看片在线播放| 欧美性猛交xxxx乱大交3| 天天爽夜夜爽夜夜爽精品| 欧美日韩国产一区在线| 亚洲影院在线播放| 在线免费亚洲电影| 亚洲视频一区在线播放| 9191成人精品久久| 亚洲精品视频专区| 亚洲国产精品人人爽夜夜爽| 亚洲av成人无码久久精品老人 | 视频一区免费观看| 99久久亚洲精品| 99久热在线精品视频| 亚洲人www| caopor在线视频| 精品一区二区三区视频在线观看| 91蝌蚪视频在线| 成人黄色av电影| 国产手机在线观看| 国产精品热久久久久夜色精品三区| 肉色超薄丝袜脚交69xx图片| 一区二区在线观看视频| 亚洲视频免费播放| 欧美色涩在线第一页| www.成人免费视频| 精品亚洲一区二区三区| 北岛玲一区二区三区| 久久成年人视频| 免费看男女www网站入口在线| 日韩免费黄色av| 国产精品3区| 精品国产乱码久久久久久久软件| 成人同人动漫免费观看 | 影音先锋男人资源在线| 性亚洲最疯狂xxxx高清| 成人不卡视频| 国产精品久久久久久久久久直播| 一本久久青青| 无码毛片aaa在线| 欧美一级播放| 女人扒开双腿让男人捅| 久久久国产午夜精品| 成人免费毛片东京热| 91久久精品一区二区| 精品久久国产视频| 一区二区三区久久精品| 欧美午夜大胆人体| 国产不卡精品视男人的天堂| 久久伊人影院| 日韩欧美激情一区二区| 国内精品久久久久久久影视麻豆| www.玖玖玖| 国产成人亚洲综合色影视| 少妇久久久久久久久久| 一区二区成人在线视频| 中文字幕av无码一区二区三区| 亚洲第一色在线| 菠萝蜜视频国产在线播放| 国产999精品久久久影片官网| 中文字幕久久熟女蜜桃| 久久99国产精品麻豆| 亚洲av人人澡人人爽人人夜夜| 中文字幕乱码亚洲精品一区| 天海翼一区二区| 日韩美女一区二区三区| 69av亚洲| 国产精品久久国产精品99gif| 久久精品色播| 国产高清www| 国产精品亚洲第一| 久久久精品成人| 日韩欧美高清在线视频| 欧美 日韩 国产 成人 在线| 精品国产一区av| 99久久亚洲国产日韩美女| 久久综合九九| 在线日韩中文| 日韩女优在线视频| 亚洲欧美日韩国产一区二区三区 | 这里只有精品99re| 国产三区四区在线观看| 91成人免费观看网站| 日本妇女一区| 久久久久久久中文| caoporm超碰国产精品| 久久精品第一页| 精品日韩在线观看| 羞羞的视频在线观看| 91亚洲永久免费精品| 一区二区三区网站| 午夜激情视频网| 亚洲男同性视频| 精品女同一区二区三区| 欧美裸身视频免费观看| 国产剧情一区二区在线观看| 男女啪啪的视频| 国产高清不卡一区| 久久综合亚洲色hezyo国产| 日韩免费视频一区二区| 青青在线视频| 国产精品18毛片一区二区| 亚洲韩日在线| 欧美色图亚洲激情| 日本韩国视频一区二区| 福利成人在线观看| 成人免费网站在线观看| 欧美1区2区| 中国极品少妇videossexhd| 精品国产1区2区| 激情福利在线| 国产在线拍偷自揄拍精品| 亚洲一区二区日韩| 国产日韩视频一区| 日韩欧美精品网址| av基地在线| 91精品网站| 亚洲免费在线| 色撸撸在线视频| 日韩一区二区三区精品视频| av今日在线| 日本日本精品二区免费| 九九视频精品免费| 日韩av免费网址| 尤物九九久久国产精品的特点| 欧美电影在线观看网站| 久久久99精品视频| 2024国产精品| 99热这里只有精品在线观看| 97欧美精品一区二区三区| 亚洲桃色综合影院| 在线观看亚洲色图| 亚洲va欧美va国产va天堂影院| 国产在线视频你懂得| 成人黄色片网站| 亚洲视频大全| 婷婷在线精品视频| 亚洲欧洲自拍偷拍| 一区二区亚洲视频| 91制片厂毛片| 亚洲成人动漫在线观看| av一区在线观看| 国产麻豆乱码精品一区二区三区| 日本欧洲一区二区| 日本三级网站在线观看| 色妞在线综合亚洲欧美| 7777精品| 91 在线视频观看| 欧美视频中文字幕在线|