精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Mamba真比Transformer更優嗎?Mamba原作者:兩個都要!混合架構才是最優解

人工智能 新聞
Mamba模型由于匹敵Transformer的巨大潛力,在推出半年多的時間內引起了巨大關注。但在大規模預訓練的場景下,這兩個架構還未有「一較高低」的機會。最近,英偉達、CMU、普林斯頓等機構聯合發表的實證研究論文填補了這個空白。

去年12月,CMU、普林斯頓的兩位華人學者Albert Gu和Tri Dao一舉推出了Mamba架構,向Transformer多年的霸主地位發起挑戰。

圖片

論文地址:https://arxiv.org/abs/2312.00752

完全拋棄注意力機制和MLP模塊、上下文長度線性縮放、推理速度比Transformer快5倍…這些特點讓所有人都為之一振,Jim Fan大佬也發推贊嘆「為推翻Transformer的研究感到興奮」。

論文發表后的6個月中,兩位作者發現,雖然Mamba很強大,但是大家依舊更關注各種Transformer的變體。

畢竟整個學術社區在注意力機制上深耕多年,從模型、標準庫到算子、GPU,此時完全拋棄之前的研究、轉向Mamba的SSM不太現實,也讓Mamba架構顯得非常格格不入。

于是,我們看到Mamba-2的論文在更高層面上將SSM和注意力機制統一了起來,同時相比Mamba-1實現了2~8倍的速度提升。

圖片

論文地址:https://arxiv.org/abs/2405.21060

就在大家都期待著「王者歸來」的Mamba-2與Transformer一決高下時,英偉達、威斯康星-麥迪遜大學、普林斯頓、CMU等多個機構的作者共同發表了一篇實證研究文章,發現基于Mamba架構的語言模型在長上下文任務上不敵Transformer。

其實不管出現哪種創新的方法或模型,有論文提出批評意見總是難免的。但細看這篇文章居然發現,Mamba的創造者Tri Dao和Albert Gu兩人竟然也在作者列表中。

圖片

論文地址:https://arxiv.org/abs/2406.07887

在此為兩位科學家實事求是的精神點贊。

此外,作者列表中還能發掘到另一個華點——Albert Gu和Tri Dao都有了新title。

Albert Gu現任Cartesia AI的聯合創始人兼首席科學家,他們最新的產品是實時語音交互API Cartesia Sonic。

圖片

https://cartesia.ai

Tri Dao是Together AI的創始科學家,該公司主要提供云服務,同時也貢獻前沿的開源研究。

圖片

https://www.together.ai

接下來我們還是詳細看看,這篇文章對Mamba和Transformer的能力具體做了哪些對比研究。

簡介

在迄今為止的研究中(包括提出Mamba架構的論文),SSM與Transformer的對比都只進行了較小規模的實驗(<3B參數,<1T token),這些結論在訓練預算更大的情況下是否成立?

這篇技術報告就是要回答這個問題。作者分別訓練出Mamba、Mamba-2、Mamba-2-Hybrid、Transformer等4種架構的8B參數模型,在35個NLP下游任務中對比性能。

圖片

訓練數據包括1.1T和3.5T兩個數據集,都是英偉達用于訓練Nemotron-4的數據集的前身,由70%英語、15%非英語和15%代碼組成

其中,Mamba-2-Hybrid是一個SSM-Transformer的混合架構模型,包含24個Mamba-2層,以及均勻分布在整個模型中的4個自注意力層和28個MLP層。

總體而言,這項對比實驗消除了比較不同LLM的常見困難,包括訓練數據、分詞器、評估管道等方面,確保評估流程的標準和可重復性。

為了方便復現和進一步研究,用于訓練Mamba、Mamba-2和Mamba-2-Hybrid的代碼已經開源,而且研究團隊還在HuggingFace上發布了Mamba-2 8B和Mamba-2-Hybrid 8B的模型權重(作為英偉達Megatron-LM框架和代碼庫的一部分)。

圖片

https://huggingface.co/nvidia

實驗結果表明,雖然Mamba和Mamba-2更擅長建模語言,但在上下文學習方面,以及從上下文中回憶信息時,性能落后于Transformer模型。

尤其是在MMLU基準上,即使提高了訓練數據的token數量,基于Mamba的模型依舊和Transformer有不小的差距。

Mamba vs. Transformer

用于評估的35個下游任務大致包含3個類別:

  • 標準短上下文任務(12個):HellaSwag、ARC-Easy、ARC-Challenge、MMLU、OpenBookQA、TruthfulQA等
  • 自然長上下文任務(9個):LongBench中的6個任務和LM Evaluation Harness框架中的3個任務
  • 綜合長上下文任務(14個):RULER框架中的13個開源測試(包括「大海撈針」的8個變體)以及今年剛提出的「電話簿」(Phonebook)任務,旨在衡量模型在長輸入文本中檢索、跟蹤、聚合信息的能力。

表2展示了經過1.1T數據訓練后,純SSM架構的Mamba和Mamba-2與Transformer模型的部分評估結果。

圖片

在常見任務上,Mamba和Mamba-2的性能都可以匹配甚至超過Transformer模型,但MMLU基準是一個例外。進行零樣本或少樣本學習時,Mamba-2相比Transformer分別有10分和17分的差距。

因為在1.1T數據集上Mamba模型的訓練速度就已經比Mamba-2慢了將近3×(模型的狀態維度較大),出于效率方面的考量,在3.5T數據集上只訓練了Mamba-2模型和Transormer模型,部分結果如表3所示。

圖片

從表3可知,更多的訓練數據有助于Mamba-2在MMLU任務上得到改進,5-shot分數的差距縮小到僅1.37分,其他任務上依舊全面領先Transformer。

Mamba折戟MMLU與電話簿任務

由于MMLU在一眾下游任務的結果中顯得如此反常,論文對此進行了更細致的拆解和討論。

圖片

如上圖所示,MMLU的任務類似于考試中的選擇題,但在cloze格式中也可以不提供備選答案,以填空題的方式提供給模型。

表4中提供了MMLU按照格式細分后,3個模型各自的分數(用1.1T token訓練)。在標準模式和選擇題模式中,Mamba架構不敵Transformer,但在填空題模式中居然實現了分數反超。

圖片

結合表3中的結果,我們有理由推斷,純SSM模型和Transformer模型包含的知識內容應該是同等級別的,但前者需要更多的訓練才能理解MMLU的前兩種格式。

作者推斷,這種差距可能源于Transformer強大的上下文學習能力,可以看到該模型從0-shot到5-shot的準確度提升非常明顯。

此外,SSM模型可能無法直接將答案所需的知識路由到輸出的單個答案token中(即ABCD選項的其中一個),而這正是自注意力層擅長的任務。

此外,Mamba系列模型在「電話簿」上的表現也并不理想,該任務旨在衡量模型通過少數示例進行上下文學習,以及從上下文中復制信息的能力。

下圖展現了任務的兩種變體,標準版是先提供整個電話簿,再給出目標查詢;反轉版則是先查詢,再給電話簿。

圖片

圖3a、c分別展示了3個模型在這兩個任務變體上的準確率。

Transformer在電話簿長度不超過預訓練的上下文長度(4096)時,準確率接近100%,相比之下,Mamba和Mamba-2在輸入序列達到500 token時就出現了顯著的性能滑坡。

圖片

如果仔細觀察Mamba系列的輸出答案(圖2b),可以發現SSM架構的模型并非完全無法記憶上下文信息,而是保留了一些模糊記憶,給出的電話號碼通常有幾位是正確的。

綜合以上結果,我們可以將MMLU和「電話簿」任務確立為純SSM架構模型的挑戰性任務,并且推測出可能原因:這兩個任務需要上下文學習、token間信息路由以及從上下文復制的能力,它們可能是Mamba系列模型的能力軟肋。

SSM-Transformer混合架構

由于在MMLU和「電話簿」任務上看到了SSM架構的能力缺陷,作者想到——讓SSM和Transformer強強聯合,能夠起到取長補短的效果?

于是他們將自注意力和MLP層添加到Mamba架構中,想看看模型能否克服上述問題。

論文首先報告了一系列消融實驗的結果,通過對比在下游任務上的表現,探索出了能達到最佳性能的架構設計與參數(表6)。

圖片

56層的Mamba-2-Hybrid中包含4個(7.1%)自注意力層,24 個(42.9%)Mamba-2層和28個(50%)MLP 層,其中Mamba-2層使用與Mamba-2模型相同的參數。

自注意力、MLP層的數量以及MLP層擴展因子這些參數的選擇并非隨機,而是根據驗證集上損失值結果(圖4)進行的最優化設計。

圖片

消融實驗的結果還顯示,混合模型中不添加旋轉位置編碼(RoPE)能達到更好的下游任務性能(表5),而且Mamba層、自注意力層、MLP層的順序也會影響模型能力。

首先,Mamba層必須出現在架構的開頭,以確保模型自然地學習到位置信息。相比使用重復塊模式,將自注意力和MLP均勻分散在整個模型是更好的配置。

而且通過計算驗證集上的模型困惑度(perplexity)可以得知,相比多頭注意力(MHA),使用組查詢注意力層(GQA)能減少推理計算量和內存量,但幾乎不會造成模型質量的下降。

圖片

效率方面,Mamba-2-Hybrid實現了29.9%的FLOP利用率(MFU),與Transfomer的30.7%基本相當。此外,前者有推理速度方面的巨大優勢。

在長上下文情境中,受益于多個SSM層的存在,Mamba-2-Hybrid的token生成速度比Transformer加速了將近8×(圖5)。

圖片

評估

測評發現,這種混合架構果然有了「取長補短」的效果,混合架構在5-shot MMLU測評中同時超過了單純的Transformer和SSM架構,取得得了最高準確度(圖6)。

圖片

從表7中的多個基準總體來看,Mamba-2-Hybrid在效率更高的同時,性能也超過了Transformer模型。

圖片

相比Mamba-2,混合架構的長上下文能力也得到了顯著提高(表10),在RULER基準上的綜合任務、「大海撈針」任務的平均成績也都超過了Transformer。

圖片

在Mamba系列表現較差的「電話簿」任務上,Mamba-2-Hybrid可以在預訓練上下文長度 (4K) 內以近乎完美的精度完成電話簿任務,還可以稍微超出該長度進行泛化,在最多5.5k token的電話簿上實現100%準確率。

圖片

甚至,Mamba-2-Hybrid的潛力還不止于此,當預訓練長度擴展到128k并在4個自注意力層中使用全局注意力時,「電話簿」任務的100%準確率也延伸到了將近150k token。

圖片

結論

論文開頭的評估結果表明,在更大訓練預算的情況下,純SSM模型依舊能在下游任務上超過Transformer,但上下文學習和信息檢索能力有所局限。

基于此,作者提出的混合架構模型Mamba-2-Hybrid能夠在提高效率的同時繼續表現出比Transformer更強大的性能,并彌補了純SSM架構的相關缺陷。

這項研究所展示的全面結果告訴我們,Mamba和Transformer這兩種架構各有長短,也許并不需要其中一個取代另一個,將二者結合起來是一條值得探索的、有巨大潛力的路徑。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-05-10 09:16:01

模型數據

2023-12-29 08:02:17

大模型人工智能AI

2025-03-20 08:34:14

2025-10-22 08:41:22

2014-05-09 10:12:57

2048移動應用

2025-03-24 13:04:12

2024-09-02 08:45:00

模型生成

2025-03-10 08:47:00

模型AI訓練

2024-03-04 08:20:00

谷歌架構AI

2025-03-11 09:42:00

2024-09-23 08:20:00

模型訓練

2024-08-13 12:49:29

2024-04-02 09:03:43

TransformeMambaRNN

2025-07-10 08:50:00

2024-05-13 10:38:08

2025-07-14 08:50:00

語言模型AI論文

2024-09-03 09:46:51

2025-07-10 08:55:00

模型AI論文

2024-06-11 07:38:00

2023-12-25 15:11:16

AI模型
點贊
收藏

51CTO技術棧公眾號

中文字幕丰满人伦在线| 亚洲精品成人无码熟妇在线| 国产精品国精产品一二| 大白屁股一区二区视频| 98视频在线噜噜噜国产| 老鸭窝一区二区| 成人午夜一级| 亚洲第一在线综合网站| 日韩精品一区二区三区外面| 国产人妻精品一区二区三| 一本色道久久精品| 中文字幕亚洲天堂| av电影在线播放| 国产精品黄色片| 婷婷久久综合九色综合伊人色| 日韩欧美一区二区三区四区 | 91精品人妻一区二区| 日本h片久久| 午夜欧美在线一二页| 亚洲欧美日韩国产yyy| 天天干视频在线| 精品夜夜嗨av一区二区三区| 欧美一区视频在线| 午夜69成人做爰视频| 欧美精品第一区| 日韩免费视频一区| 五月婷婷狠狠操| 99re6在线精品视频免费播放| 国产精品久久久久久久久动漫| 含羞草久久爱69一区| 亚洲图片在线播放| 欧美一级二区| 国内精品一区二区三区四区| 国精品无码一区二区三区| 香蕉视频一区二区三区| 精品国产一区二区三区不卡| 五月天开心婷婷| 高清av一区二区三区| 五月天中文字幕一区二区| 日韩不卡一二区| 成人性爱视频在线观看| 久久综合久久综合亚洲| 国产日本一区二区三区| 朝桐光av在线一区二区三区| 国产麻豆视频一区| 国产欧美在线播放| 波多野结衣电车| 久久精品1区| 欧美亚洲国产精品| 91浏览器在线观看| 在线精品亚洲| 色综合久久中文字幕综合网小说| 91高清免费看| 婷婷综合网站| 日韩中文字幕网站| 国产极品视频在线观看| 成人久久久久| 搡老女人一区二区三区视频tv| 国产第一页精品| 久久激情电影| 日韩一区二区在线视频| www.97视频| 91精品久久久久久久久久不卡| 久久九九有精品国产23| 91香蕉视频在线播放| 亚洲成人精选| 欧美高清自拍一区| 国产亚洲精品久久777777| 欧美日韩三区| 欧美日韩国产成人在线| 国产精品自拍视频一区| 国产日韩欧美一区| 日本中文字幕久久看| 少妇又紧又色又爽又刺激视频| 美国三级日本三级久久99| 成人国产精品一区| 午夜久久久久久久久久| 9人人澡人人爽人人精品| 久久综合给合久久狠狠色| 男人的天堂在线免费视频| 国产日韩欧美综合在线| 中文字幕一区二区三区四区五区| 丝袜综合欧美| 精品久久久在线观看| 国产熟人av一二三区| 日韩大陆av| 精品久久久久久久久久久久包黑料| 亚洲调教欧美在线| 精品视频国产| 欧美床上激情在线观看| 日韩三级小视频| 日韩精品电影在线| 国产精品免费视频xxxx| aa视频在线免费观看| 成人av免费网站| 日韩资源av在线| 中文在线手机av| 欧美性猛交xxxx富婆弯腰| 男人添女人下面免费视频| 亚洲三级av| 国产亚洲一区二区精品| 亚洲xxxx3d动漫| 国产一区成人| 91九色蝌蚪国产| 天天射天天操天天干| 国产精品天干天干在观线| www.男人天堂网| 亚洲精品在线影院| 精品久久久久久久久久久久包黑料| 精品人伦一区二区三电影 | 在线日韩日本国产亚洲| 青青草激情视频| 日精品一区二区| 亚洲aaaaaa| 浮生影视网在线观看免费| 亚洲一区在线视频| 韩国视频一区二区三区| 精品国内亚洲2022精品成人| www国产亚洲精品久久网站| 欧美三级在线免费观看| 日本免费在线视频不卡一不卡二| 国产精选在线观看91| 欧美成人三区| 在线欧美一区二区| 亚洲av网址在线| 欧美va亚洲va日韩∨a综合色| 国产激情999| 香蕉视频黄在线观看| 亚洲免费观看高清完整版在线观看 | 久久久久久国产精品视频| 青青草伊人久久| 免费精品视频一区二区三区| 精精国产xxxx视频在线中文版| 7777精品伊人久久久大香线蕉超级流畅 | 国产精品无圣光一区二区| 91精品91久久久中77777老牛| 亚洲va欧美va人人爽成人影院| 精品国偷自产在线视频99| 亚洲 国产 日韩 欧美| xnxx国产精品| 久久视频这里有精品| 日韩一区二区三区色| 久久精品免费播放| 91极品身材尤物theporn| 国产欧美日韩麻豆91| 国产欧美高清在线| 午夜欧洲一区| 青草热久免费精品视频| 色综合久久网女同蕾丝边| 亚洲 欧美综合在线网络| 日韩女优在线视频| 禁久久精品乱码| 国产精品有限公司| 电影k8一区二区三区久久 | 天天免费综合色| 国产一级免费片| 亚洲黄色一区| 精品国产一区二区三区四区精华| 韩国成人二区| 国产丝袜精品视频| 神马久久久久久久| 欧美韩国日本一区| 久久久久久蜜桃一区二区| 色999日韩| 亚洲专区中文字幕| 青青草视频在线免费直播| 精品国产99国产精品| 国产精彩视频在线观看| 99视频超级精品| 成人午夜视频免费在线观看| 成人6969www免费视频| 国产精品一区二区女厕厕| 米奇精品一区二区三区| 日韩欧美国产高清| 日本网站在线播放| 久久久久国产一区二区三区四区| 国产野外作爱视频播放| 色综合天天综合网中文字幕| 91手机在线播放| 性国裸体高清亚洲| 色哟哟网站入口亚洲精品| 国产ts变态重口人妖hd| 香蕉乱码成人久久天堂爱免费| 免费黄色在线视频| 乱一区二区av| 日韩激情视频一区二区| 视频一区在线观看| 91精品视频在线看| 激情黄产视频在线免费观看| 亚洲图片在线综合| 国产免费一区二区三区免费视频| 亚洲成人免费视频| 亚洲av毛片基地| 国产成a人亚洲精品| 国产黄视频在线| 国产精品二区不卡| 国产尤物91| 少妇高潮一区二区三区99| 久久久综合免费视频| 国产尤物视频在线| 欧美成人高清电影在线| 国产精品自拍第一页| 亚洲综合久久av| 又嫩又硬又黄又爽的视频| 岛国精品在线播放| 日本肉体xxxx裸体xxx免费| 激情综合中文娱乐网| 午夜精品短视频| 免费观看成人www动漫视频| 国产日韩欧美另类| 少妇视频一区| 九九久久综合网站| 国产精品麻豆一区二区三区| 亚洲国产成人精品女人久久久| 在线观看免费观看在线| 天天操天天干天天综合网| 日本中文在线视频| 久久久久国产一区二区三区四区| 逼特逼视频在线观看| 久久国产精品无码网站| 女人天堂av手机在线| 欧美激情第10页| 亚洲精品影院| 免费成人结看片| 韩国一区二区三区美女美女秀| 年轻的保姆91精品| 国产精品免费视频xxxx| 欧美理论影院| 午夜精品久久久久久99热软件| 成人影院在线观看| 日韩中文第一页| 高h视频在线| 亚洲日韩中文字幕在线播放| 五月婷在线视频| 亚洲成人av片在线观看| 国产黄色片网站| 91精品久久久久久蜜臀| 亚洲av综合一区| 色婷婷av一区| 日本a级c片免费看三区| 欧美日韩另类视频| 欧美激情亚洲综合| 午夜精品久久久久久久99樱桃| 国产精品久久久久久久精| 亚洲天堂免费在线观看视频| 波兰性xxxxx极品hd| 中文字幕在线观看不卡视频| 正在播放国产对白害羞| 中文字幕一区在线观看视频| 欧美福利在线视频| 国产精品三级电影| 貂蝉被到爽流白浆在线观看| 国产精品久久久久婷婷二区次| 天堂网av2018| 国产精品国产馆在线真实露脸| 国产精品视频看看| 亚洲日本在线看| 五月天丁香激情| 亚洲一区二区3| 日本熟妇色xxxxx日本免费看| 午夜a成v人精品| 精品国产乱子伦| 欧美吞精做爰啪啪高潮| ,一级淫片a看免费| 在线播放91灌醉迷j高跟美女 | 99久久精品99国产精品| 亚洲黄色免费在线观看| 久久蜜桃香蕉精品一区二区三区| 好吊视频在线观看| 国产精品嫩草影院com| 91精品国产闺蜜国产在线闺蜜| 国产精品麻豆久久久| 99热精品免费| 五月激情综合婷婷| 中文字幕免费观看| 欧美情侣在线播放| www.四虎在线观看| 亚洲精品动漫100p| eeuss影院在线观看| 久久这里只有精品99| 97蜜桃久久| 国产精品免费视频xxxx| 日韩在线成人| 免费成人av网站| 91精品1区| 欧美二区在线视频| 美女性感视频久久| 图片区偷拍区小说区| 久久亚区不卡日本| 一区二区三区影视| 欧美色另类天堂2015| 一级特黄aaa大片| 精品国产三级电影在线观看| 国产午夜视频在线观看| 欧美成人精品不卡视频在线观看| 中文字幕一区久| 亚洲va欧美va国产综合久久| 欧美调教在线| 熟女视频一区二区三区| 亚洲一区国产| 色婷婷激情视频| 2017欧美狠狠色| 日韩欧美中文字幕视频| 欧洲国产伦久久久久久久| 性生活视频软件| 色av吧综合网| 日韩伦理三区| 国产精品视频免费一区二区三区 | 成人免费视频caoporn| 国产美女永久免费无遮挡| 亚洲国产欧美日韩另类综合| 亚洲系列在线观看| 亚洲精品国产综合区久久久久久久 | 欧美久久久久久久久久久久久| 麻豆国产精品一区二区三区| 37p粉嫩大胆色噜噜噜| 亚洲一区二区三区美女| 亚洲无码精品国产| 亚洲美女喷白浆| h片在线观看| 91久久偷偷做嫩草影院| 日本午夜一区| 成人观看免费完整观看| 成人av在线资源网| 四虎884aa成人精品| 欧美性猛交xxxx免费看漫画| 高清乱码毛片入口| 久久综合免费视频影院| 狠狠久久伊人中文字幕| 欧美高清一区二区| 99riav1国产精品视频| 韩国三级在线看| 亚洲伦理在线精品| 国产又爽又黄又嫩又猛又粗| 一区二区三区动漫| 92国产精品| 农村寡妇一区二区三区| av不卡免费看| 亚洲男人在线天堂| 亚洲成人综合在线| 国模人体一区二区| 欧美日韩成人在线播放| 91精品国产自产精品男人的天堂 | 直接在线观看的三级网址| 91精品国产综合久久男男| 日韩不卡一区| 成人日韩在线视频| 中文字幕中文字幕一区| 在线观看国产黄| 色婷婷成人综合| 国产精品中文| 成人在线视频一区二区三区| 国产成人三级在线观看| 免费一级全黄少妇性色生活片| 日韩欧美精品三级| 国产网红在线观看| 国产精品视频福利| 国产日韩欧美| 国产熟女一区二区| 欧美色涩在线第一页| 秋霞a级毛片在线看| 成人欧美一区二区三区在线| 欧美激情一级片一区二区| 国产免费一区二区三区最新6| 婷婷久久综合九色综合绿巨人| 伦理片一区二区三区| 国产精品第10页| 久久久久蜜桃| 国产性猛交96| 欧美色道久久88综合亚洲精品| 999国产在线视频| 91视频国产一区| 尤物在线精品| 欧美狂猛xxxxx乱大交3| 欧美日韩中文字幕一区| a级网站在线播放| 国产一区二区不卡视频在线观看| 久久精品官网| 中文字幕无码日韩专区免费| 日韩欧美123| 亚洲女同av| 影音先锋亚洲视频| 国产ts人妖一区二区| 男人天堂av在线播放| 久久人人爽人人爽爽久久 | 亚洲精品乱码久久久久久按摩观| xxxxxx欧美| 潘金莲一级淫片aaaaa免费看| 成人免费观看av| 国产精品成人久久久| 久久国产精品电影| 日韩美女毛片| 在线视频观看91| 黑人巨大精品欧美一区免费视频| 视频一区二区三区不卡| 精品国产免费久久久久久尖叫| 久久成人av少妇免费| 国产一级做a爱片久久毛片a| 俺去啦;欧美日韩| 清纯唯美亚洲经典中文字幕|