精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

階躍公開了自家新型注意力機制:KV緩存消耗直降93.7%,性能不減反增

人工智能 新聞
MFA 用最簡潔的設計帶來了最顯著的提升,在不增加額外工程復雜度的前提下,優雅地解決了 LLM 的高效推理顯存瓶頸問題,并能無縫集成到現有的 Transformer 生態中。

隨著當前大語言模型的廣泛應用和推理時擴展的新范式的崛起,如何實現高效的大規模推理成為了一個巨大挑戰。特別是在語言模型的推理階段,傳統注意力機制中的鍵值緩存(KV Cache)會隨著批處理大小和序列長度線性增長,儼然成為制約大語言模型規模化應用和推理時擴展的「內存殺手」。

雖然業界已有 MQA、GQA、MLA 等多種注意力機制變體試圖解決這一問題,但這些方案要么難以在嚴格的顯存限制下保持理想性能,要么在模型結構上引入額外復雜度,帶來巨大的工程挑戰和生態兼容性問題。

在近期由階躍星辰、清華大學等機構完成的論文《Multi-matrix Factorization Attention》中,研究人員提出新型注意力機制架構 —— 多矩陣分解注意力(MFA)及其變體 MFA-Key-Reuse,在大幅降低語言模型推理成本的同時,還實現了性能的顯著提升。

圖片

鏈接:https://arxiv.org/abs/2412.19255

實驗中,MFA 和 MFA-KR 不僅超越了 MLA 的性能,還在減少了高達 93.7% 的 KV Cache 使用量的情況下,與傳統的 MHA 性能相當。于此同時,MFA 實現簡單,容易復現,對超參敏感度低,且兼容各種 Pos-embedding。

圖片

圖片

MFA 方法與分析

研究團隊通過研究 Attention 機制的一般性設計和容量分析,明確了 Attention 機制的容量最相關的兩個維度,并且提出了一系列的分析方法和設計原則。

圖片

為了更好地理解注意力機制的本質,研究團隊提出了廣義多頭注意力(GMHA)的概念框架,為理解不同的 MHA 變種注意力機制提供了一個統一的視角。進一步地,研究團隊分別從推理角度研究鍵值的計算和存儲方式,從分解角度探討模型的容量特征。這種創新的分析方法為理解不同策略如何在模型性能和計算效率之間取得平衡提供了全新視角。

在此基礎上,研究者們確立了完全參數化雙線性注意力(FPBA)作為理論上的性能上限標準。他們發現,目前廣泛使用的 MHA 及其各種變體實際上都可以被視為 FPBA 的低秩分解版本。研究團隊在分析現有解決方案時,重點考察了兩個代表性的改進方案:多查詢注意力(MQA)和多頭潛在注意力(MLA)

對于 MQA,研究人員發現它采用了一種更激進的參數共享策略。不同于 MHA 在頭部之間保持獨立的參數,MQA 讓所有注意力頭共享同一組鍵值參數。這種設計雖然將內存使用降到了極低的水平,但可能會影響模型的表達能力。研究團隊指出,這種權衡實際上反映了一個更普遍的設計困境:如何在保持模型性能的同時減少資源消耗。

而對于更新的 MLA 方案,研究人員發現它采用了更為復雜的架構設計。MLA 引入了一個共享的潛在空間,通過在這個空間中進行參數壓縮來節省內存。雖然這種設計看似提供了更大的靈活性(因為中間維度可以設置得更大),但研究團隊的理論分析揭示了一個關鍵問題:模型的實際表達能力仍然受限于最小維度的約束,這意味著 MLA 的設計中增加中間維度并不能真正提升模型的性能上限。

在深入分析現有方案的基礎上,研究團隊提出了一個雄心勃勃的目標:開發一種新的注意力機制,既能最大限度地節省資源,又能盡可能接近理論性能上限。這個目標促使他們開發出了多矩陣分解注意力(MFA)。

MFA 的設計體現了研究團隊的三個關鍵創新:

  • 首先,他們突破傳統設計的局限,顯著增加了注意力頭的數量和維度,極大增加了注意力模塊的模型容量。
  • 其次,研究團隊在矩陣分解方面實現了創新性突破,采用激進的低秩分解策略,成功地在擴展模型注意力頭的數量和維度時保持了極高的參數效率。
  • 最后,研究團隊采用單鍵值頭設計,這個設計確保了即使在增加模型復雜度的情況下,內存使用仍然保持在最低水平。

 圖片

為了進一步分析 MFA 和其他注意力機制的不同,研究團隊提供了一個清晰的對比表格。研究人員首先引入兩個關鍵指標來度量 GMHA 系列模型的容量:模型總有效秩 TER ( Total Effective Rank ) 和 共享隱空間維度 SLSD(Shared latent subspace dim)。總有效秩 TER 定義為注意力頭數量與每個頭部分解秩(Factorization rank per head,簡稱 FRH)的乘積,而共享隱空間維度 SLSD 則代表了所有注意力頭共同使用的隱空間維度,注意到 TER 和  SLSD 越大,模型具有更高的容量。同時注意到每個頭的分解秩(FRH)不超過 SLSD,而 KV Cache 的占用受制于 FRH 和 SLSD 之間的較大值,這構成了容量和效率之間的關鍵權衡。

通過這個框架進行分析,可以發現與 MQA 相比,MFA 同時實現了更高的 SLSD 和更高的 TER;與 MLA 相比,在相似的參數預算下,MFA 不僅達到了更小的 KV cache 尺寸,還實現了更高的 TER,同時保持了相當的 SLSD;與傳統的 MHA 相比,雖然 MFA 的 SLSD 較小,但它的 TER 更高,這解釋了為什么在實驗中 MFA 能夠獲得更好的性能。

實驗結果

為了研究新架構在可能的更大規模上的表現,研究團隊開展了一系列深入的擴展性實驗,系統地測試了從 1B 到 7B 參數的不同規模的模型,訓練數據量從 10B 擴展到 1T。在性能擴展方面,研究團隊的 MFA 方案展現出與傳統 MHA 完全相當的擴展能力。這意味著,即使在更大規模下,MFA 依然能保持其優異的性能。而 MFA-KR 雖然在性能上略有降低,但其擴展趨勢與 MHA 保持一致。而隨著模型規模的增加,MFA 和 MFA-KR 在內存節省方面的優勢不僅得到保持,還呈現出進一步擴大的趨勢。在最大規模模型上,MFA 實現了 87.5% 的內存節省,而 MFA-KR 更是將內存使用降低到原來的 6.25%。

 圖片

研究人員還進行了一系列的消融實驗,證明 MFA 和 MFA-KR 的設計的有效性,并在其他的主流的位置編碼上也驗證了 MFA 和 MFA-KR 的性能優勢。

圖片

圖片

展望

MFA 用最簡潔的設計帶來了最顯著的提升,在不增加額外工程復雜度的前提下,優雅地解決了 LLM 的高效推理顯存瓶頸問題,并能無縫集成到現有的 Transformer 生態中。這種簡單而強大的創新,必將加速大語言模型在更多場景中的落地應用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-25 10:21:15

2025-07-23 09:05:00

2024-12-04 09:25:00

2018-08-26 22:25:36

自注意力機制神經網絡算法

2023-12-26 12:03:52

AI模型

2024-09-19 10:07:41

2025-09-29 18:51:01

2024-12-17 14:39:16

2025-05-16 10:17:54

2024-10-31 10:00:39

注意力機制核心組件

2024-06-28 08:04:43

語言模型應用

2024-12-05 09:00:00

2025-02-19 09:18:04

2024-12-09 00:00:10

2020-09-17 12:40:54

神經網絡CNN機器學習

2024-12-05 16:19:14

2024-08-28 17:36:35

AI模型開發

2024-11-04 10:40:00

AI模型

2025-10-16 09:00:00

大模型

2023-05-05 13:11:16

點贊
收藏

51CTO技術棧公眾號

一区二区三区精品99久久| 亚洲三级电影全部在线观看高清| 欧美诱惑福利视频| 神马影院午夜我不卡| 国产一区二区女内射| 黄色成人在线网址| 亚洲一区二区黄| 日本一区二区三区在线免费观看| 国产精品原创| 中文字幕日本不卡| 精品中文字幕人| 91中文字幕在线播放| 在线视频精品| 欧美乱人伦中文字幕在线| 亚洲永久精品ww.7491进入| 久久久久久久久久久久电影| 欧美日韩亚洲一区二区| 日本丰满大乳奶| 国产永久免费高清在线观看| 亚洲激精日韩激精欧美精品| 日韩视频永久免费| 苍井空浴缸大战猛男120分钟| 成人高清免费在线| 国产欧美精品国产国产专区| 日韩69视频在线观看| 九九热精彩视频| 99久久www免费| 亚洲欧美成人网| 日本少妇xxxx| 亚洲精品在线国产| 欧美福利视频一区| 9久久婷婷国产综合精品性色 | 国产精品99久久免费| 色综合欧美在线视频区| 欧美一级欧美一级| 污视频免费在线观看| 国产精品久久三区| 成人美女av在线直播| 能直接看的av| 亚洲人和日本人hd| 亚洲激情中文字幕| 日本三级免费观看| 国产啊啊啊视频在线观看| 中文字幕中文字幕一区二区| 水蜜桃亚洲一二三四在线| 香港一级纯黄大片| a级精品国产片在线观看| 97精品一区二区三区| 欧美成人精品欧美一级| 婷婷综合激情| 日韩在线观看成人| 国产午夜精品理论片在线| 成人在线免费观看网站| 一本一道久久a久久精品逆3p | 91精品无人成人www| 欧美va视频| 国产精品久久久久影院色老大| 欧美一区二区视频17c| 手机看片福利在线观看| 337p粉嫩大胆色噜噜噜噜亚洲| 国内精品**久久毛片app| 日韩一级片免费看| 91在线看国产| 日本视频一区二区在线观看| www.中文字幕久久久| 国产精品国产自产拍高清av王其 | 亚洲wwwav| 精品久久国产视频| 亚洲永久视频| 欧洲成人性视频| www.av88| 韩国欧美国产1区| 999久久久| 日日躁夜夜躁白天躁晚上躁91| 奇米精品一区二区三区在线观看 | 成人性生交大片免费看96| 精品国产三级a在线观看| 美女福利视频在线| 欧美123区| 欧美一区二区三区小说| 天堂www中文在线资源| 亚洲小说图片视频| 中文字幕亚洲一区| 久久久久久久久久99| 一本一本久久| 国产男女猛烈无遮挡91| 精品久久人妻av中文字幕| 99久久久无码国产精品| 日韩偷拍一区二区| 青春草视频在线| 色噜噜久久综合| 涩涩网站在线看| 日韩高清影视在线观看| 色妞色视频一区二区三区四区| 国产一二三四在线| 日韩av不卡一区二区| 91传媒免费看| 国产免费av在线| 99精品国产视频| 亚洲精品美女久久7777777| 先锋成人av| 日本道精品一区二区三区| 一级片免费在线观看视频| 亚洲小说图片| 欧美激情精品久久久久久免费印度 | a毛片在线免费观看| 久久综合色综合88| 久久人妻无码一区二区| 99久久伊人| 亚洲国产成人一区| 希岛爱理中文字幕| 日韩av二区在线播放| 国产麻豆一区二区三区在线观看| 午夜免费播放观看在线视频| 色综合夜色一区| 91超薄肉色丝袜交足高跟凉鞋| 日韩av密桃| 在线精品国产欧美| 日本在线观看视频网站| 国产精品一区二区男女羞羞无遮挡| 欧美日韩亚洲一区二区三区在线观看| 日本资源在线| 欧美丰满一区二区免费视频 | 午夜免费福利视频| 中文字幕一区视频| 国产主播中文字幕| 九九久久精品| 97成人超碰免| 黑人精品一区二区三区| 亚洲精品视频在线看| 亚洲xxx在线观看| 日韩www.| 国产精品色悠悠| 国产青青草在线| 91黄色免费版| 免费视频91蜜桃| 视频在线在亚洲| 鲁鲁视频www一区二区| 黄毛片在线观看| 亚洲第一av在线| 日韩 欧美 亚洲| 波多野结衣中文字幕一区二区三区 | 老司机免费视频| 激情自拍一区| 国产伦精品一区二区三区在线| 狂野欧美激情性xxxx欧美| 欧美一区二区三区四区久久 | 黄色成人在线播放| 这里只有精品在线观看视频| 在线欧美福利| 国产综合av一区二区三区| 俺来俺也去www色在线观看| 亚洲国产精品va| 黄色片视频网站| 91麻豆国产福利精品| 亚洲爆乳无码专区| 精品一区二区三区在线| 国产精品视频久| 黄视频网站在线看| 欧美一区二区女人| 国产午夜精品一区二区理论影院 | 欧美日韩三级视频| 国产黄色小视频网站| 国产精品亚洲综合一区在线观看| 99热这里只有精品免费| 欧美18xxxx| 国产成人精品久久亚洲高清不卡| 在线观看二区| 日韩欧美一区二区三区在线| 久久久精品91| 97精品国产97久久久久久久久久久久 | 偷拍女澡堂一区二区三区| 国产精品久久久免费| 国产欧美日韩中文字幕在线| 美女黄视频在线观看| 日韩一级片网址| 国产精品老女人| 中文字幕免费观看一区| 久久无码人妻一区二区三区| 亚洲美女色禁图| 日韩精彩视频| 视频一区中文字幕精品| 欧美一级大胆视频| 美女免费久久| 国产视频在线一区二区| 中文字幕777| 亚洲一区精品在线| www.黄色在线| 国产成人亚洲综合a∨婷婷| 精品久久久久久久久久中文字幕| 欧美精品一二| 99在线首页视频| 成a人片在线观看| 亚洲精品第一国产综合精品| 伊人精品在线视频| 亚洲福利视频一区| 欧美性生交大片| 日韩在线a电影| 一区精品在线| 日韩人体视频| 97在线资源站| 欧美三级电影网址| 77777亚洲午夜久久多人| 免费黄网在线观看| 亚洲欧美制服丝袜| 亚洲va久久久噜噜噜无码久久| 色美美综合视频| 国产精品第九页| 亚洲精品国产无套在线观| 国产精品久久久久无码av色戒| 国产很黄免费观看久久| 好男人www社区| 国产欧美短视频| 日韩在线视频在线| 天天综合久久| 日韩精品伦理第一区| 理论片一区二区在线| 91网站免费看| 久久婷婷五月综合色丁香| 庆余年2免费日韩剧观看大牛| 天堂亚洲精品| 久久成人18免费网站| av在线免费观看网站| 亚洲精品视频免费在线观看| 亚洲高清视频在线播放| 制服丝袜亚洲网站| 亚洲怡红院av| 欧美性猛片aaaaaaa做受| 国产一区二区三区四区在线| 91在线小视频| 人妻体内射精一区二区三区| 国产乱码精品一区二区三| 天天操狠狠操夜夜操| 日韩黄色小视频| 久久久久久三级| 视频一区二区中文字幕| 国产黄色特级片| 国产精品入口| 精品久久久久久久免费人妻| 性欧美长视频| 午夜激情在线观看视频| 久久久久久黄| 四虎精品欧美一区二区免费| 日韩欧美在线中字| 亚洲国产一区二区三区在线播| 国产一区三区在线播放| 91色视频在线导航| 图片一区二区| 亚洲一区二区三区四区视频| 伊人久久精品| 99re在线视频观看| 9l视频自拍九色9l视频成人| 国产三区精品| 香蕉久久精品日日躁夜夜躁| 欧美三级电影在线播放| 国产一区二区精品久| 亚洲免费精品视频| 99re久久最新地址获取| 国产高潮呻吟久久久| 亚洲国产精品久久久天堂| 超碰10000| 亚洲久久视频| 亚洲一区二区蜜桃| 国内精品伊人久久久久av影院| 在线观看视频在线观看| 国产精品亚洲午夜一区二区三区 | 久久久久久久电影| 中文字幕第4页| 国产精品传媒入口麻豆| 久久久久久久久精| 色欧美片视频在线观看 | 精品国产凹凸成av人导航| 神马一区二区三区| 国产亚洲视频在线观看| 老司机午夜在线| 性欧美暴力猛交69hd| 99riav视频一区二区| 91亚洲精品在线| 五月天亚洲一区| 中文字幕久久综合| 亚洲精品三级| 国内外成人免费在线视频| 国产精品一区二区在线播放 | 中文字幕一区二区视频| 免费在线黄色片| 日韩欧美国产骚| 国产裸体永久免费无遮挡| 亚洲国产精品久久精品怡红院| 国产露出视频在线观看| 欧美人与物videos| 蜜桃精品在线| 成人动漫视频在线观看完整版| 神马久久一区二区三区| 热久久最新地址| 日韩国产欧美在线播放| 人妻互换一二三区激情视频| 国产日产精品1区| 久久久久久久久久久网| 欧美性高清videossexo| 人人妻人人澡人人爽精品日本| 日韩在线免费av| 欧美一级鲁丝片| 久久人人爽人人爽人人片av高请 | 欧美日韩另类丝袜其他| 欧美日韩福利| 色婷婷777777仙踪林| 亚洲视频1区| 杨幂一区二区国产精品| 久久久99久久| 日韩精品――中文字幕| 69精品人人人人| 不卡在线视频| 欧美亚洲伦理www| 成人精品毛片| 性做爰过程免费播放| 日本强好片久久久久久aaa| 国产精品无码在线| 久久综合色鬼综合色| 青青草在线观看视频| 制服丝袜亚洲网站| 日本激情在线观看| 国产精品久久久久久久久借妻 | 一区二区三区国产在线| 色婷婷狠狠18禁久久| 国产精品美女久久久久久2018| 日本一区二区三区精品| 亚洲国产一区自拍| 男人添女人下部高潮视频在线观看 | 中文字幕中文字幕一区三区| 天堂va蜜桃一区二区三区 | 奇米影视亚洲狠狠色| 国产厕拍一区| 男同互操gay射视频在线看| 久久99国产精品成人| 国产精品理论在线| 欧美吻胸吃奶大尺度电影| 国产高清视频在线观看| 日本人成精品视频在线| 亚洲自拍电影| 欧美韩国日本在线| 国产色产综合色产在线视频| 国产视频1区2区| 国产亚洲欧洲高清| 粉嫩av一区二区三区四区五区| 亚洲成人18| 六月丁香婷婷色狠狠久久| 成人18视频免费69| 欧美精品粉嫩高潮一区二区| 免费观看在线黄色网| 91精品久久久久久久久中文字幕| 国产精品不卡| 久久久久亚洲av无码麻豆| 一区二区三区久久| 岛国av中文字幕| 亚洲三级 欧美三级| 亚洲a∨精品一区二区三区导航| 涩涩涩999| 国产资源精品在线观看| 欧美另类视频在线观看| 亚洲а∨天堂久久精品9966| 妞干网免费在线视频| 欧美精品七区| 麻豆精品在线视频| av成人免费网站| 亚洲精品一区二区三区香蕉 | 国产主播精品在线| 欧美国产激情| 最近日本中文字幕| 欧美亚男人的天堂| av网站在线看| 久久人人九九| 午夜精品电影| 亚洲一区二区三区四区五区六区| 色婷婷精品久久二区二区蜜臀av | 777精品视频| 精品午夜久久| 91福利视频免费观看| 狠狠综合久久av一区二区小说 | 蜜桃一区二区三区| 向日葵污视频在线观看| 亚洲一区在线观看免费 | 男人舔女人下面高潮视频| 国产精品激情偷乱一区二区∴| 狠狠综合久久av一区二区| 国产精品2018| 国精品一区二区| 91在线无精精品白丝| 日韩精品一区国产麻豆| 黑人巨大亚洲一区二区久 | 新版中文在线官网| 日本高清不卡一区二区三| 国产成人自拍网| 中文字幕在线观看视频免费| 欧美高清第一页| 成人在线一区| 成人无码www在线看免费| 欧美精品黑人性xxxx| 欧美性理论片在线观看片免费| 国产成人亚洲综合无码| 中文字幕精品一区|