精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

唯快不破:上海AI Lab 82頁(yè)綜述帶你感受LLM高效架構(gòu)的魅力

人工智能 新聞
本文從 LLM 架構(gòu)角度出發(fā),帶你剖析大模型的效率秘訣。這一切的核心在于 Transformer 架構(gòu)。

作者:孫偉高 上海人工智能實(shí)驗(yàn)室

近年來(lái),大語(yǔ)言模型(LLMs)展現(xiàn)出強(qiáng)大的語(yǔ)言理解與生成能力,推動(dòng)了文本生成、代碼生成、問(wèn)答、翻譯等任務(wù)的突破。代表性模型如 GPT、Claude、Gemini、DeepSeek、Qwen 等,已經(jīng)深刻改變了人機(jī)交互方式。LLMs 的邊界也不止于語(yǔ)言和簡(jiǎn)單問(wèn)答。隨著多模態(tài)(VLMs)與推理能力(LRMs)的興起,LLMs 正不斷擴(kuò)展到多模態(tài)理解、生成與復(fù)雜推理場(chǎng)景。

但模型性能持續(xù)提升的背后,是模型尺寸、數(shù)據(jù)規(guī)模、RL 推理長(zhǎng)度的快速 Scaling,是算力和存儲(chǔ)資源的急劇消耗。大模型的訓(xùn)練與推理的成本居高不下,成為制約其廣泛落地和應(yīng)用的現(xiàn)實(shí)瓶頸。

本文從 LLM 架構(gòu)角度出發(fā),帶你剖析大模型的效率秘訣。這一切的核心在于 Transformer 架構(gòu)。Transformer 的自注意力機(jī)制雖帶來(lái)了遠(yuǎn)距離建模的突破,卻因 O(N2) 的復(fù)雜度在長(zhǎng)序列任務(wù)中成本高昂。而在 RAG、智能體、長(zhǎng)鏈推理、多模態(tài)等新興場(chǎng)景下,長(zhǎng)序列需求愈發(fā)突出,進(jìn)一步放大了效率與性能之間的矛盾。同時(shí) Transformer 的 FFN 部分采用密集的 MLP 層,同樣面臨模型規(guī)模放大后的訓(xùn)練和推理效率問(wèn)題。

近年來(lái)針對(duì) Transformer 架構(gòu)改進(jìn)的創(chuàng)新工作層出不窮,卻一直缺乏一篇全面深入的綜述文章進(jìn)行總結(jié)。

圖 1:常見(jiàn)長(zhǎng)序列場(chǎng)景

近期,上海 AI Lab 聯(lián)合港科廣、澳門(mén)大學(xué)、中科院自動(dòng)化所、蘇州大學(xué)、瑞典 KTH、北大、港中文等多家機(jī)構(gòu),總結(jié) 440 余篇相關(guān)論文,深入探討了當(dāng)前 LLM 高效結(jié)構(gòu)的最新進(jìn)展,形成這篇 82 頁(yè)的綜述論文:

  • 論文標(biāo)題:Speed Always Wins: A Survey on Efficient Architectures for Large Language Models
  • 論文地址:https://arxiv.org/pdf/2508.09834
  • 項(xiàng)目倉(cāng)庫(kù):https://github.com/weigao266/Awesome-Efficient-Arch

圖 2:大語(yǔ)言模型高效架構(gòu)概覽

該綜述將目前 LLM 高效架構(gòu)總結(jié)分類為以下 7 類:

  • 線性序列建模:降低注意力訓(xùn)練和推理復(fù)雜度,無(wú)需 KV Cache 開(kāi)銷。
  • 稀疏序列建模:通過(guò)稀疏化注意力矩陣,降低計(jì)算與顯存需求。
  • 高效全注意力:在保持完整注意力的前提下優(yōu)化內(nèi)存訪問(wèn)與 KV 存儲(chǔ)。
  • 稀疏專家模型:通過(guò)條件激活部分專家,大幅提升模型容量而不增加等比例計(jì)算成本。
  • 混合模型架構(gòu):結(jié)合線性/稀疏序列建模與全注意力,兼顧效率與性能。
  • 擴(kuò)散語(yǔ)言模型:利用非自回歸的擴(kuò)散模型進(jìn)行語(yǔ)言生成。
  • 其他模態(tài)應(yīng)用:將這些高效架構(gòu)應(yīng)用于視覺(jué)、語(yǔ)音、多模態(tài)模型。

這些方向的探索不僅關(guān)乎 LLM 的未來(lái)效率,也關(guān)乎如何在算力受限的條件下,持續(xù)推動(dòng) AI 走向更強(qiáng)的智能的關(guān)鍵選擇。綜述涉及的方法類別和代表性論文可見(jiàn)如下樹(shù)狀圖:

圖 3:綜述完整組織架構(gòu)

線性序列建模

線性序列建模是近年來(lái)研究相當(dāng)火熱的一個(gè)方向,代表性工作像 Mamba、Lighting Attention、RWKV、GLA、TTT 等在模型架構(gòu)方向都引起過(guò)廣泛關(guān)注。我們將這類技術(shù)細(xì)分為以下幾個(gè)類別:

  • 線性注意力
  • 線性 RNN
  • 狀態(tài)空間模型
  • 測(cè)試時(shí)推理 RNN

并且正如在多篇文獻(xiàn)里已經(jīng)提出的,這些線性序列建模方法可以概括為統(tǒng)一建模的數(shù)學(xué)形式,并且能夠通過(guò)線性化過(guò)程將預(yù)訓(xùn)練模型權(quán)重的 Softmax Attention 架構(gòu)轉(zhuǎn)為 Linear Sequence Modeling 架構(gòu),從而獲得模型效率的大幅提升,如下圖所示。

圖 4:線性序列建模方法

我們將已有的線性序列建模方法從記憶視角和優(yōu)化器視角分別進(jìn)行梳理和對(duì)比,詳細(xì)形式可見(jiàn)下表:

表 1:線性序列建模方法統(tǒng)一建模的 Memory 視角和 Optimizer 視角

其中線性化技術(shù)可以進(jìn)一步細(xì)分為基于微調(diào)的線性化,和基于蒸餾的線性化,如下圖所示:

圖 5:線性化方法

綜述還進(jìn)一步總結(jié)歸納了目前在線性序列建模領(lǐng)域常見(jiàn)的硬件高效實(shí)現(xiàn)方法,可以歸納為 Blelloch Scan、Chunk-wise Parallel 和 Recurrent for Inferences,如下圖所示:

圖 6:線性序列建模方法的硬件高效實(shí)現(xiàn)

稀疏序列建模

稀疏序列建模是另一類有代表性的高效注意力機(jī)制,通過(guò)利用 Attention Map 天然具有的稀疏性加速注意力的計(jì)算,這類方法可以進(jìn)一步細(xì)分為:

  • 靜態(tài)稀疏注意力
  • 動(dòng)態(tài)稀疏注意力
  • 免訓(xùn)練稀疏注意力

代表性的稀疏注意力方法如 Global Attention、Window Attention、Dilated Attention 等,及其工作原理如下圖所示:

圖 7:稀疏注意力的幾種經(jīng)典形式

高效全注意力

另一類高效注意力算法可以統(tǒng)一歸納為高效全注意力,這類方法可以根據(jù)算法思路進(jìn)一步細(xì)分為如下幾類:

  • IO-Aware Attention
  • Grouped Attention
  • Mixture of Attention
  • Quantized Attention

其中 IO-Aware Attention 指代目前使用非常廣泛的 Flash Attention 系列工作,Grouped Attention 則包含廣為使用的 GQA、MLA 等全注意力變體,幾種代表性方法如下圖所示。

圖 8:Grouped Attention 的幾種代表性方法

稀疏混合專家

稀疏混合專家是對(duì) Transformer 架構(gòu)中另一個(gè)重要模塊 FFN 做的一類重要改進(jìn),已經(jīng)逐漸成為(語(yǔ)言和多模態(tài))大模型架構(gòu)的事實(shí)標(biāo)準(zhǔn)。綜述中將相關(guān)文獻(xiàn)按以下三個(gè)方向進(jìn)行分類:

  • Routing Mechanisms
  • Expert Architectures
  • MoE Conversion

路由機(jī)制包括 Token-choice 和 Expert-choice 兩類,其原理如下圖所示:

圖 9:MoE 路由機(jī)制

專家結(jié)構(gòu)的創(chuàng)新工作包括:共享專家、細(xì)粒度專家、零專家、深度路由等,其作用和原理可見(jiàn)下圖:

圖 10:MoE 專家架構(gòu)

另外一個(gè)重要的方向是 MoE 轉(zhuǎn)換,已有的工作包括通過(guò) Split、Copy、Merge 等手段對(duì)專家進(jìn)行構(gòu)造,如下圖所示:

圖 11:MoE 轉(zhuǎn)化機(jī)制

混合架構(gòu)

混合架構(gòu)是近年來(lái)出現(xiàn)的一種實(shí)用的新型架構(gòu),可以在線性/稀疏注意力和全注意力之間取得微妙的 Trade-off,也在效率和效果間找到了最佳甜蜜點(diǎn)。具體可細(xì)分為:

  • 層間混合
  • 層內(nèi)混合

圖 12:混合架構(gòu)形式

擴(kuò)散大語(yǔ)言模型

擴(kuò)散大語(yǔ)言模型是近期出現(xiàn)的一個(gè)熱門(mén)方向,創(chuàng)新性地將擴(kuò)散模型從視覺(jué)生成任務(wù)遷移至語(yǔ)言任務(wù),從而在語(yǔ)言生成速度上取得大幅進(jìn)步。相關(guān)工作可以細(xì)分為:

  • Non-Autoregressive Diffusion LLM
  • Bridging Diffusion LLM and Autoregressive
  • Extending Diffusion LLM to Multimodality

圖 13:擴(kuò)散大語(yǔ)言模型機(jī)制

應(yīng)用至其他模態(tài)

最后一個(gè)重要的部分是高效架構(gòu)在其他模態(tài)上的應(yīng)用,涵蓋視覺(jué)、音頻和多模態(tài)。以 Mamba 為代表的線性模型被廣泛應(yīng)用至多種模態(tài)任務(wù)上,并取得了優(yōu)秀的表現(xiàn),綜述將這類模型總結(jié)梳理至如下表格:

寄語(yǔ)

最后正如帝國(guó)時(shí)代 3 中這條神奇代碼「Speed Always Wins」能讓游戲世界「Increases build, research, shipment, and gather rates by 100 times for all players」一樣,我們希望綜述中的 Efficient Architectures 可以真被用來(lái) 100x 加速 AI 世界的構(gòu)建,更快更便宜地訓(xùn)練出更強(qiáng)更實(shí)用的大模型。請(qǐng)記住這條神奇代碼:「Speed Always Wins」

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2018-06-19 16:48:42

華為

2021-01-26 09:19:58

Redis框架架構(gòu)

2018-04-13 10:36:44

Web應(yīng)用優(yōu)化

2016-08-01 10:38:14

華為

2020-06-22 13:43:46

代碼編碼語(yǔ)言

2014-12-04 17:30:08

編程

2014-12-04 15:19:51

程序員

2012-12-24 09:57:58

ERPDynamics AX

2022-02-21 09:35:36

機(jī)器學(xué)習(xí)自然語(yǔ)言模型

2018-12-19 06:38:01

Wi-Fi 6Wi-Fi網(wǎng)絡(luò)

2017-06-20 11:10:13

2021-02-23 10:15:31

軟件開(kāi)發(fā)IT領(lǐng)導(dǎo)者首席信息官

2021-03-03 11:36:00

嵌入式項(xiàng)目開(kāi)發(fā)字符串格式化

2016-01-13 15:11:32

leangoo工具

2023-07-03 09:55:01

2018-01-26 16:28:24

阿里Blink核心

2018-01-25 12:01:08

阿里巴巴機(jī)器學(xué)習(xí)大數(shù)據(jù)

2023-07-17 10:45:04

模型應(yīng)用

2009-12-17 17:00:32

無(wú)線路由linksys
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

成人妇女淫片aaaa视频| 亚洲欧美国产另类| 日本手机在线视频| 色资源在线观看| 蜜芽一区二区三区| 欧美激情视频一区二区三区不卡| 一级欧美一级日韩片| 经典三级一区二区| 亚洲精品免费看| 欧美视频小说| 超碰在线人人干| 久久一区二区三区超碰国产精品| 久久久精品美女| 91网站免费视频| 久久在线观看| 欧美影院精品一区| 人妻av无码专区| 在线观看完整版免费| 成人在线综合网| 91精品中文在线| 综合激情网五月| 亚洲午夜伦理| 久久久精品免费视频| 欧美 日韩 国产 成人 在线观看 | 国产精品99导航| 毛片a片免费观看| 97精品97| 在线观看视频99| free性中国hd国语露脸| 玖玖精品一区| 91精品国产综合久久香蕉麻豆| www.亚洲天堂网| 国产羞羞视频在线播放| 国产区精品视频| 久久久久久久激情| 怡红院在线播放| 国产精品美女久久久久久久| 精品卡一卡二| 国产综合在线播放| 精品一区二区国语对白| 国产经典一区二区| 国产欧美一区二区三区在线看蜜臂| 欧美暴力喷水在线| 久久视频国产精品免费视频在线| 中国女人特级毛片| 嫩草一区二区三区| 国产午夜精品麻豆| 男男做爰猛烈叫床爽爽小说| 午夜日韩影院| 日韩欧美专区在线| 国产又粗又猛大又黄又爽| 免费一区二区三区四区| 欧美最猛黑人xxxxx猛交| 不要播放器的av网站| 亚洲女同av| 色综合色综合色综合| 国产一区二区三区精彩视频 | 久久久久影视| 欧美精品一区二区三区高清aⅴ| 原创真实夫妻啪啪av| 国产一区 二区| 日韩午夜精品电影| xxxxwww一片| 国产成人av毛片| 日韩av综合中文字幕| 六十路息与子猛烈交尾| 中日韩免视频上线全都免费| 亚洲人成在线观看| 国产三级短视频| 97久久视频| 欧美美女操人视频| 日本在线免费观看| 亚洲综合好骚| 国产精品久久久久久超碰| 中文字幕日韩国产| 国产老妇另类xxxxx| 鬼打鬼之黄金道士1992林正英| 色一情一乱一区二区三区| 99久久99久久综合| 亚洲激情啪啪| 在线观看a级片| 午夜精品福利一区二区三区av| www.中文字幕在线| 99只有精品| 欧美不卡一区二区三区四区| 在线观看日韩精品视频| 国产亚洲第一伦理第一区| 色婷婷综合久久久久| 波多野结衣爱爱视频| 一区视频在线看| 国产精品激情av在线播放 | 精品精品国产高清a毛片牛牛| 亚洲天堂美女视频| 日韩欧美一区二区三区免费看| 久久国产精品久久久| 欧美一二三区视频| 另类中文字幕网| 久久99影院| 黄色小网站在线观看| 岛国精品视频在线播放| 手机av在线免费| 婷婷亚洲成人| 成年人精品视频| 免费看一级视频| 国产精品91一区二区| 欧洲精品久久| 美洲精品一卡2卡三卡4卡四卡| 欧美无乱码久久久免费午夜一区| www.黄色网| 成人久久电影| 欧美亚洲另类视频| www.国产免费| 国产精品剧情在线亚洲| 欧美 日本 亚洲| 日韩欧美高清一区二区三区| 在线观看视频99| 亚洲熟女综合色一区二区三区| 国产高清久久久久| 亚洲成人自拍| 韩国美女久久| 亚洲电影免费观看| 暗呦丨小u女国产精品| 三级久久三级久久久| 国产亚洲欧美一区二区| 成人video亚洲精品| 欧美色偷偷大香| 免费一级做a爰片久久毛片潮| 伊人久久大香线蕉av超碰演员| 国产在线播放不卡| 搞黄视频免费在线观看| 欧美日韩免费观看中文| 少妇伦子伦精品无吗| 91精品亚洲| 国产日产欧美精品| 国产网站在线播放| 色综合色综合色综合| 欧美双性人妖o0| 很黄很黄激情成人| 91精品综合久久| 亚洲丝袜精品| 制服丝袜亚洲播放| 波多野结衣亚洲一区二区| 蜜桃久久久久久久| 日韩资源av在线| 欧美香蕉视频| 亚洲天堂一区二区三区| 手机看片久久久| 久久久久久久久久看片| 久久久久久久久久久久久久国产| 无码日韩精品一区二区免费| 秋霞午夜一区二区| 青青草娱乐在线| 日韩欧美在线看| 真实乱视频国产免费观看| 老妇喷水一区二区三区| 欧美极品jizzhd欧美| 成人亚洲欧美| 亚洲性日韩精品一区二区| 国产亚洲久一区二区| 亚洲国产精品黑人久久久| 欧美成人福利在线观看| 亚洲成人精品| 国产精品美女xx| 精精国产xxxx视频在线播放| 亚洲欧美国产日韩中文字幕| 亚洲欧美一二三区| 日本一区二区在线不卡| 性欧美1819| 欧美阿v一级看视频| 国产精品伊人日日| 性欧美1819sex性高清| 中文字幕国产日韩| 国产又色又爽又黄又免费| 亚洲精品美腿丝袜| 中文字幕精品久久久| 视频一区在线视频| 成人手机视频在线| 精品福利网址导航| 国产精品电影久久久久电影网| 欧美jizzhd欧美| 日韩一级二级三级| 99热只有这里有精品| 欧美国产禁国产网站cc| 男人操女人下面视频| 午夜宅男久久久| 亚洲高清不卡一区| 97色成人综合网站| 日本亚洲欧美成人| 八戒八戒神马在线电影| 国产视频丨精品|在线观看| 特级西西444www高清大视频| 一区二区三区在线视频观看58| 精品人妻一区二区三区日产乱码卜| 欧美aaa在线| 欧美精品一区二区三区三州| 日韩欧美电影| 好吊色欧美一区二区三区四区| 久久亚洲资源中文字| 久久久久久久香蕉网| www黄在线观看| 精品免费日韩av| 伊人22222| 岛国av一区二区| 亚洲女人久久久| 久久综合九色综合97婷婷| 亚洲涩涩在线观看| 性欧美videos另类喷潮| 玖玖精品在线视频| 成人激情开心网| 精品一区日韩成人| 亚洲91网站| 国产裸体写真av一区二区| 老牛影视精品| 欧美大片在线看免费观看| av在线第一页| 亚洲男人的天堂网站| 亚洲国产成人在线观看| 欧美久久久影院| 欧美一区免费看| 午夜精品久久久久影视| 人妻久久一区二区| 国产精品美女久久久久久久久久久 | 99久久er热在这里只有精品66| 三级黄色片播放| 久久99久久久久| 亚洲福利精品视频| 久久激情视频| 久久国产成人精品国产成人亚洲| 亚洲手机视频| 国产毛片久久久久久国产毛片| 国产精品99视频| 图片区小说区区亚洲五月| 国产精品午夜一区二区三区| 极品尤物一区二区三区| 精品av导航| 国产日韩欧美综合精品 | 欧美成人一区二区三区片免费| 中文字幕日韩经典| 欧美性videosxxxxx| 欧美日韩a v| 欧美亚洲动漫精品| 国产情侣呻吟对白高潮| 日本精品免费观看高清观看| 探花视频在线观看| 色噜噜狠狠色综合中国| 不卡av电影在线| 在线欧美小视频| 亚洲精品国产无码 | 国产成人精品免费看视频| 777久久久精品| 99热这里是精品| 日韩欧美在线不卡| 成人精品在线播放| 亚洲黄色有码视频| 色视频免费在线观看| 日韩精品在线免费观看视频| 免费黄色片在线观看| 亚洲欧美中文另类| 999国产在线视频| 爱福利视频一区| 羞羞网站在线看| 国产综合在线视频| 二区三区不卡| 国产精品免费福利| 国产高清精品二区| 99re6热在线精品视频播放速度| 国产91精品入| 美女黄毛**国产精品啪啪| 精品国产一区二区三区av片| 伊人久久大香线蕉午夜av| 最新欧美人z0oozo0| a级免费在线观看| 久久久久看片| 三级一区二区三区| 粉嫩13p一区二区三区| www.超碰97| 国产精品久久久久婷婷二区次| 黄色在线观看免费| 一本到三区不卡视频| 国产精品一区二区三区在线免费观看| 欧美v亚洲v综合ⅴ国产v| 日本福利片高清在线观看| 最近中文字幕日韩精品| 色婷婷av在线| 国产成人一区二区三区| 国产一区二区视频在线看| 国产精品毛片一区视频 | 最新精品视频| 99国产精品| 在线免费看污网站| 99精品视频中文字幕| 无码人中文字幕| 午夜精品福利一区二区三区av| 中文字幕乱码无码人妻系列蜜桃| 日韩欧美一区二区久久婷婷| 国产视频精选在线| 欧美国产中文字幕| 51一区二区三区| 国产青春久久久国产毛片| 图片区亚洲欧美小说区| 91专区在线观看| 国产一区二区在线免费观看| 素人fc2av清纯18岁| 亚洲专区一二三| 最近中文字幕在线观看| 亚洲精品大尺度| 在线观看操人| 成人黄色午夜影院| 亚洲自拍电影| 大西瓜av在线| 精品一区在线看| 蜜桃传媒一区二区亚洲| 亚洲高清免费观看| 国产深喉视频一区二区| 亚洲丝袜一区在线| h片在线观看| 亚洲一区二区三区sesese| 欧美在线观看视频一区| 国产无套内射久久久国产| 成人黄色大片在线观看| 全网免费在线播放视频入口 | 成人免费播放视频| 国产精品私人影院| av片免费观看| 亚洲男人天堂2019| 国产精品论坛| 国产精品区一区二区三在线播放| 女人色偷偷aa久久天堂| 911福利视频| 亚洲国产精品二十页| 亚洲国产精品无码久久久| 亚洲欧美日韩高清| 欧美大胆a人体大胆做受| 国产一区二区三区黄| 影音先锋日韩资源| av漫画在线观看| 一二三四社区欧美黄| 性色av蜜臀av| 欧美乱大交xxxxx| 久久爱www.| 大地资源网在线观看免费官网| 韩国毛片一区二区三区| 激情无码人妻又粗又大| 欧美美女bb生活片| 日本综合在线| 亚洲va欧美va在线观看| 欧美激情1区2区3区| 佐山爱在线视频| 一个色妞综合视频在线观看| 亚洲女同志亚洲女同女播放| 久久久久久久电影一区| 久久a爱视频| 日韩人妻精品无码一区二区三区| 99国产麻豆精品| 国产乱国产乱老熟| 国产一区二区三区在线视频| 嫩草伊人久久精品少妇av杨幂| 亚洲在线欧美| 成人永久免费视频| 香蕉免费毛片视频| 亚洲欧美在线看| 国产精品成人国产| 精品久久免费观看| 国产高清不卡一区二区| 国产在线一区视频| 亚洲欧美三级在线| 成人在线免费av| 青青草视频国产| 91丨九色丨黑人外教| 免费av中文字幕| 久久综合国产精品台湾中文娱乐网| 豆花视频一区二区| 黄色国产小视频| 亚洲婷婷在线视频| 三级视频在线看| 国产精品十八以下禁看| 欧美黄色大片网站| av在线网站观看| 欧美日韩www| 国产伦子伦对白在线播放观看| 日本一区二区高清视频| 国产精品一二一区| 中文字幕超碰在线| 久久色精品视频| 欧美午夜18电影| 999久久久精品视频| 亚洲福利电影网| 91社区在线观看| 国产精品国产精品国产专区蜜臀ah| 久久久久国内| 欧美人与禽zozzo禽性配| 亚洲人成伊人成综合网久久久| 日本少妇精品亚洲第一区| 日韩黄色片视频| 亚洲欧美经典视频| 国产在线中文字幕| 国产美女精品久久久| 久国产精品韩国三级视频| 波多野结衣国产| 欧美成人黄色小视频|