精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Transformer危!谷歌MoR架構發布:內存減半推理速度還翻倍

人工智能 新聞
Mixture-of-Recursions(MoR),注意不是MoE,它能推理速度提高2倍,而KV內存直接減半!

超越Transformer,谷歌推出全新底層架構——

Mixture-of-Recursions(MoR),注意不是MoE,它能推理速度提高2倍,而KV內存直接減半!

而且All in One,首次在單一框架中實現,用同一組參數處理不同任務的同時,進行動態分配計算資源。

就像給LLM開了個雙層增強buff,模型性能和效率全都要。

圖片

谷歌DeepMind聯合KAIST AI、Mila人團隊通過統一參數共享自適應遞歸深度高效KV緩存,在保持大模型性能的同時降低計算和內存成本,形成新的效率最優解。

不少網友甚至將它形容為Transformer Killer

圖片

更有甚者表示,該架構的出現或許能代表,潛在空間推理也許將會成為下一個LLM突破所在。

圖片

具體MoR創新在哪些方面?下面一一詳解。

MoR:首次統一參數共享與自適應計算

Transformer的出現雖然帶來了優秀的少樣本泛化和推理能力,但隨之而來龐大的計算和內存需求還是讓訓練和部署成為難題。

目前相關優化方法主要是參數共享和自適應計算,但往往只能二選一,無法同時兼顧。

于是研究人員提出了遞歸混合模型MoR,可以在單一遞歸Transformer中同時融合兩個效率維度。

首先采用的遞歸Transformer,相比通過多個獨特層構建token的標準Transformer,其直接將模型劃分為遞歸塊,復用一組共享參數池。

圖片

主要包含三種參數共享策略:

  1. Cycle:循環復用層。
  2. Sequence:連續復用同一層。
  3. Middle變體:保留首尾層獨特參數,僅共享中間層。

利用參數共享,可以減少獨特參數數量,提升分布式訓練效率,并通過連續深度批處理消除計算 “氣泡”,提高推理吞吐量。

圖片

然后MoR采用動態路由機制,通過輕量級路由器為每個token分配不同遞歸深度,并集中計算在復雜token上,可以分為兩種:

  • Expert-choice路由:將每個遞歸步驟視作 “專家”,基于隱藏狀態計算分數,通過閾值選擇合適的token繼續計算,采用層級過濾,優先為復雜token分配計算。
  • Token-choice路由:初始階段為每個token分配固定遞歸深度,通過softmax/sigmoid確定專家,然后token按分配深度依次完成遞歸。

圖片

另外,MoR本身還借助KV緩存策略,管理鍵值的存儲與使用,同時確保內存效率的提升:

  • Recursion-wise緩存:僅緩存當前遞歸步驟中活躍token的KV對,將注意力計算限制在本地緩存,降低內存和IO需求。
  • Recursive KV共享:復用首次遞歸的KV對供后續步驟使用,確保所有token可訪問歷史上下文,減少預填充操作,而此時注意力計算量下降幅度較小。

在三種策略共同作用下,MoR通過在解碼每個token時直接進行潛在思考,路由機制讓模型能進行自適應推理,突破了先前固定思考深度的限制,實現了參數效率與自適應計算的統一。

性能超越Transformer

研究人員在135M到1.7B不同參數規模的模型上,就原始Transformer遞歸基線模型MoR進行對比實驗。

圖片

實驗表明,在相同的16.5e18 FLOPs的訓練預算下,MoR使用了將近50%的更少參數,但實現了更低的驗證損失和更高的平均少樣本準確率43.1%

而vanilla模型的少樣本準確率此時是42.3%,說明MoR擁有更高的計算效率,可以在相同FLOPs預算下處理更多訓練token。

在訓練固定的20B token時,MoR也減少了25%的訓練FLOPs,訓練時間還縮短了19%,峰值內存減少25%。

另外,通過分析路由策略,發現Expert-choice路由的性能會在一定程度上優于Token-choice路由,說明路由粒度會對性能產生重要影響。

研究人員還對MoR進行了IsoFLOP分析,發現在135M、360M、730M和1.7B參數規模,以及2e18、5e18、16.5e18的FLOPs預算下,MoR始終優于遞歸基線模型。

圖片

雖然受遞歸容量瓶頸限制,在135M時略遜于vanilla模型,但在360M及規模的進一步擴大,MoR性能接近甚至超過Vanilla模型,且參數僅為后者的1/3,驗證了MoR的可擴展性。

推理吞吐量評估上,360M規模的MoR模型在固定批大小和最大批大小設置下,均優于vanilla。

圖片

遞歸深度的增加讓更多token提前退出,KV緩存占用減少,吞吐量顯著提升,驗證了深度批處理與早期退出結合對部署效率的提升。

谷歌對底層架構的再思考

這已經不是谷歌第一次對底層架構進行重新思考,甚至可以說,谷歌始終希望利用架構創新重構計算范式,重新尋找AI新的平衡。

例如混合專家模型(MoE)正是這一理念的集中體現。

最早是在2017年,谷歌首次將MoE引入LSTM層,通過稀疏門控機制,僅激活部分專家網絡從事輸入處理,但仍能讓參數量高達137B的模型保持高效訓練。

圖片

后面推出的GShard將MoE與Transformer結合,可實現動態負載均衡,2021年的Switch Transformer又進一步地簡化了路由機制。

Gemini 1.5 Pro就是采用的分層MoE架構,將專家網絡與多模態處理深度結合,可以處理更為復雜的多模態任務,訓練和服務效率也得到顯著提升。

圖片

MoE的底層邏輯設計突破了傳統全連接模型的計算缺陷,現在已經成為了許多超大規模模型的優先選擇,為應對算力瓶頸提供了新范式。

另外還有像TokenFormer等可擴展架構,將模型參數視為可學習的token,通過增量訓練無縫擴展模型規模,為未來千億級模型的低成本迭代提供了可能。

所以有網友認為,關于谷歌如今推出的MoR,會在未來徹底改變AI世界規則,會超越Transformer嗎?一切交給時間驗證

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-17 13:05:35

2023-07-18 14:19:00

模型AI

2025-03-14 11:56:52

2022-06-20 14:36:49

TensorFlow機器學習

2024-03-04 13:23:34

數據模型

2021-12-31 09:34:22

PyTorchtransformer模型

2009-03-18 09:06:00

GoogleChrome瀏覽器

2023-01-08 13:22:03

模型

2025-01-26 13:20:49

谷歌AI模型Titans

2021-09-30 11:14:17

谷歌框架技術

2023-12-05 13:25:00

數據訓練

2025-04-21 09:07:00

2024-01-26 10:09:01

2024-04-07 07:46:00

谷歌架構

2023-03-22 13:53:26

芯片英偉達

2019-12-23 08:57:50

Python代碼單線程

2021-06-29 15:33:28

谷歌Transformer模型

2024-02-19 09:27:31

谷歌AI

2024-07-26 09:29:38

點贊
收藏

51CTO技術棧公眾號

99re热视频精品| 国产欧美丝袜| 欧美日韩精品不卡| 免费高清在线观看电视| 亚洲AV无码乱码国产精品牛牛| 亚洲精品推荐| 亚洲福利电影网| 成人在线视频网| 午夜天堂在线视频| 国产youjizz在线| 色愁久久久久久| 一区二区三区国产精品| 国产主播喷水一区二区| 欧美波霸videosex极品| 345成人影院| 成人免费av资源| 欧美成人四级hd版| 中文字幕第一页在线视频| 色黄网站在线观看| 国产尤物一区二区| 久久久国产精品免费| 亚洲国产成人va在线观看麻豆| 国产中文在线观看| 日韩av在线免费观看不卡| 日韩精品在线一区二区| 97精品国产97久久久久久粉红| 亚洲中文字幕无码爆乳av| 丝袜连裤袜欧美激情日韩| 欧美日韩精品综合在线| 亚洲国产一区二区三区在线播| 中文字幕日韩免费| 国产成人精品一区二区免费看京| 欧美日韩另类在线| 玛丽玛丽电影原版免费观看1977 | 亚洲成人第一网站| 欧美wwwwww| 狠狠色狠狠色综合日日91app| 丁香亚洲综合激情啪啪综合| 国产不卡av在线| 免费在线观看你懂的| 绿色成人影院| 99精品国产99久久久久久白柏| 国产日韩欧美另类| 成人小视频在线播放| 日韩一区二区免费看| 亚洲成人黄色在线| 欧美网站免费观看| 可以在线观看的黄色| 免费人成黄页网站在线一区二区| 在线日韩中文字幕| 特级黄色片视频| 白白色在线观看| 26uuu国产在线精品一区二区| 日本国产高清不卡| 精品国产国产综合精品| 一区二区三区国产好| 黑人精品xxx一区一二区| 国产一区二区三区在线免费| 色欲av伊人久久大香线蕉影院| 午夜在线精品偷拍| 久久激情五月丁香伊人| 欧美丰满美乳xxⅹ高潮www| 成人网av.com/| 午夜精品久久久久| 先锋影音一区二区三区| www.色视频| 亚洲欧美日韩一区在线观看| 国内揄拍国内精品| 国产亚洲精品精品精品| 成人vr资源| 精品精品国产高清a毛片牛牛| 无码aⅴ精品一区二区三区浪潮| porn视频在线观看| 国产91精品免费| 国产精品电影久久久久电影网| 亚洲天堂一级片| 天天揉久久久久亚洲精品| 欧美成人在线直播| 国产精品一区二区在线免费观看| 欧美精品总汇| 亚洲一区二区在线观看视频| 日韩国产高清一区| 国产精品一区二| 久草网站在线观看| 亚洲国产欧美日韩在线观看第一区 | 制服丝袜成人动漫| 男的插女的下面视频| 成人在线免费观看| 国产精品久久久久久久久晋中| 精品一区二区国产| 国产成人三级一区二区在线观看一 | 一区二区三区欧美在线| 五月婷婷六月丁香| 国产精品影视在线| 国产精品天天狠天天看| 国产www在线| 欧美日韩mv| 北条麻妃在线一区二区| 国产肥白大熟妇bbbb视频| 狼人精品一区二区三区在线| 欧美一区二区三区爱爱| 日韩一区二区三区不卡视频| 一本大道色婷婷在线| 亚洲成人免费观看| 免费在线观看的av网站| 麻豆国产一区| 欧美高清性hdvideosex| www.com操| 风间由美中文字幕在线看视频国产欧美 | 精品小视频在线| 欧美xxxx日本和非洲| 精品午夜av| 精品偷拍一区二区三区在线看| 四季av中文字幕| 黄色亚洲大片免费在线观看| 久热99视频在线观看| 久久精品一区二区三区四区五区 | 男人靠女人免费视频网站 | 欧美jizz19性欧美| 久久久精品久久久久| 天堂网视频在线| 成人免费黄色在线| 中文字幕日韩一区二区三区| av免费在线一区二区三区| 国产午夜三级一区二区三| 美女三级99| 日本片在线看| 制服.丝袜.亚洲.中文.综合| 免费a级黄色片| 国内自拍一区| 91大片在线观看| 亚洲男女视频在线观看| 懂色一区二区三区免费观看| 日韩免费一区二区三区| 亚洲美女炮图| 日韩av中文字幕在线免费观看 | 羞羞色院91蜜桃| 青青草精品视频| 久久香蕉综合色| 97超碰在线免费| 日韩欧美在线视频日韩欧美在线视频 | 欧美69xxxxx| 亚洲成av人片一区二区梦乃| 中文字幕第三区| 2023国产精华国产精品| www日韩欧美| 国产女优在线播放| 国产午夜亚洲精品理论片色戒| 男人天堂网视频| 日韩成人动漫在线观看| 91精品国产91久久久久久久久| 国产精品男女视频| av一本久道久久综合久久鬼色| 欧美国产一二三区| 成人免费看黄| 国产亚洲精品一区二555| 在线观看黄网址| 久久狠狠亚洲综合| 国产在线欧美日韩| 2021天堂中文幕一二区在线观| 亚洲第一精品自拍| 国产情侣在线视频| 麻豆国产欧美日韩综合精品二区| 天天综合狠狠精品| 亚洲黑人在线| 日韩精品免费在线视频观看| 91久久国产视频| 久久婷婷国产综合精品青草 | 综合一区av| 欧美亚洲一区在线| 国产精品午夜福利| 91在线观看视频| 北条麻妃在线观看| 国内黄色精品| 91精品国产综合久久香蕉的用户体验| 久草免费在线| 色94色欧美sute亚洲线路一ni| 亚洲自拍第三页| 欧美在线网站| 国产精品美女在线| 欧美一级做性受免费大片免费| 欧美激情综合网| 日韩av高清在线看片| 神马日本精品| 成人免费黄色网| 51av在线| 这里只有精品视频在线| 国内自拍视频在线播放| 国产欧美精品一区aⅴ影院| 亚洲制服中文字幕| 一本色道久久综合亚洲精品不| 日本午夜精品电影| 中文在线最新版地址| 在线日韩中文字幕| 免费观看黄色av| 欧美亚洲一区二区在线观看| 久久无码人妻精品一区二区三区| 欧美日韩1区| 明星裸体视频一区二区| crdy在线观看欧美| 日韩亚洲综合在线| 高清毛片aaaaaaaaa片| 91久久精品一区二区三| 九九视频免费看| 国产成人自拍在线| 宅男一区二区三区| 伦理一区二区| 成人国产在线视频| 中国字幕a在线看韩国电影| 另类色图亚洲色图| 第一福利在线| 亚洲风情亚aⅴ在线发布| 91好色先生tv| 亚洲视频1区2区| 国产女同无遮挡互慰高潮91| 亚洲深爱激情| 久久日韩精品| 伊人成综合网站| 欧美成人精品在线观看| 国产美女性感在线观看懂色av | 天堂av在线播放| 天天综合日日夜夜精品| 99久久人妻无码中文字幕系列| 久久国产夜色精品鲁鲁99| 免费无遮挡无码永久视频| 麻豆精品蜜桃一区二区三区| 1204国产成人精品视频| 国产免费亚洲高清| 亚洲电影有码| 日韩亚洲欧美中文在线| 欧美视频综合| 亚洲电影中文字幕| 亚洲精品一区二区三区蜜桃| 欧美久久免费观看| 中文字幕乱码中文字幕| 亚洲欧美激情小说另类| 久久久精品人妻一区二区三区| 蜜臀久久久99精品久久久久久| 777久久久精品一区二区三区 | 成人爽a毛片免费啪啪红桃视频| 欧美激情亚洲视频| 青草久久伊人| 欧美日本韩国一区二区三区视频| 日本视频免费观看| 色综合天天综合网天天看片| 中文字幕第二区| 国产免费久久精品| av电影在线不卡| 国产欧美精品在线观看| 九九九视频在线观看| 国产欧美精品国产国产专区| 黄瓜视频污在线观看| 久久综合色婷婷| 亚洲精品乱码久久久久久蜜桃欧美| 国产精品一区二区久激情瑜伽| 古装做爰无遮挡三级聊斋艳谭| 一区二区三区四区五区在线| 秋霞无码一区二区| 欧美限制电影| 亚洲人成影视在线观看| 成人在线免费观看网站| 亚洲一区二三| 中文字幕av亚洲精品一部二部| 看全色黄大色大片| 欧美日韩综合| 国产精品无码av在线播放| 国产伦理一区| www.超碰com| 激情久久久久久久| 在线观看精品视频| 亚洲人metart人体| 国产精品www在线观看| 国产精品videosex性欧美| 中文字幕一区二区三区5566| 中文字幕免费一区二区三区| 妺妺窝人体色www看人体| 精品视频网站| 久久久久久久久久久久久久一区 | 亚洲精品在线免费| 中国成人一区| 日韩a在线播放| 精品一区二区三区免费播放 | 人人爽香蕉精品| 手机精品视频在线| 白白色亚洲国产精品| www.99热| 亚洲一区二区三区四区在线| 老熟妇仑乱一区二区av| 欧美日韩高清一区二区三区| www.午夜激情| 亚洲视频在线看| 青青草娱乐在线| 中文字幕视频一区二区在线有码 | 精品久久久在线观看| 久久人人爽人人爽人人片av免费| 欧美丰满嫩嫩电影| 婷婷色在线视频| 精品国产一区二区三区久久久| 国产高清在线a视频大全| 国产成人精彩在线视频九色| 日本精品国产| 97欧洲一区二区精品免费| 亚洲资源网站| www.夜夜爱| 九一久久久久久| 日本高清www| 成人av电影在线网| 亚洲女则毛耸耸bbw| 国产三级一区二区| 久久久久99精品| 性做久久久久久免费观看| 亚洲视频一区二区三区四区| 欧美午夜在线一二页| 丰满人妻av一区二区三区| 色偷偷av一区二区三区乱| 9191在线观看| 91精品国产色综合| 日韩中文字幕| 中文字幕99| 日韩电影在线观看电影| 一级特级黄色片| 久久久精品一品道一区| 国产男女猛烈无遮挡a片漫画| 亚洲精品视频免费观看| 中文字幕乱码视频| 亚洲一区二区国产| 国模冰冰炮一区二区| 国产日韩欧美亚洲一区| 欧美黄色一级视频| 色婷婷一区二区三区在线观看| 国产人成一区二区三区影院| 你懂的国产在线| 亚洲国产毛片完整版| 毛片网站在线| 欧美亚洲成人xxx| 亚洲区小说区| 北条麻妃视频在线| 久久婷婷综合激情| 激情视频网站在线观看| 亚洲欧美国产一本综合首页| 瑟瑟视频在线| 午夜免费日韩视频| 向日葵视频成人app网址| 蜜桃视频成人| 久久国产精品99国产| 日本三级黄色网址| 欧美国产乱子伦| 亚洲精品在线观看av| 精品奇米国产一区二区三区| 女子免费在线观看视频www| 日本午夜在线亚洲.国产| 伊人久久综合网另类网站| 影音欧美亚洲| 国产毛片精品一区| 黄色一级视频在线观看| 欧美精品一区二区久久婷婷| 福利视频在线看| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 亚洲美女视频一区| 亚洲精品久久久蜜桃动漫| 久久久久久久久久久国产| 国内精品免费| 99久久久无码国产精品6| 国产日韩欧美在线一区| 探花国产精品一区二区| 久久影院资源网| 国产香蕉精品| 天天影视综合色| 成人激情午夜影院| 国产成人精品网| 日韩中文字幕视频在线观看| 免费看日产一区二区三区| 国产主播自拍av| 中国色在线观看另类| 国产高清不卡视频| 2021久久精品国产99国产精品| 国产亚洲一区| 日本黄色www| 日韩欧美aaa| 黄色网在线播放| 精品1区2区| 久久99日本精品| 国产又色又爽又黄的| 国产一区二区三区精品久久久 | 欧美成人激情免费网| 男人日女人bb视频| 亚洲色图欧美视频| 欧美激情精品久久久久久大尺度 | 可以免费观看的毛片| 26uuu亚洲伊人春色| 999久久久精品国产| 999香蕉视频| 夜鲁夜鲁夜鲁视频在线播放| 色一情一乱一伦一区二区三区 | 亚洲欧美不卡| 岛国片在线免费观看| 日本久久一区二区三区| av黄在线观看| 91精品视频网站| 在线亚洲一区|