精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

DeepSeek的MLA,任意大模型都能輕松遷移了

人工智能 新聞
復旦 NLP 實驗室、華東師大、上海 AI Lab、??低暵摵咸岢?MHA2MLA 框架。

復旦 NLP 實驗室博士后紀燾是這篇文章的第一作者,研究方向為大模型高效推理、多模態大模型,近期代表工作為首個NoPE外推HeadScale、注意力分塊外推LongHeads、多視覺專家大模型MouSi,發表ACL、ICLR、EMNLP等頂會頂刊論文 20 余篇。

DeepSeek-R1 作為 AI 產業顛覆式創新的代表轟動了業界,特別是其訓練與推理成本僅為同等性能大模型的數十分之一。多頭潛在注意力網絡(Multi-head Latent Attention, MLA)是其經濟推理架構的核心之一,通過對鍵值緩存進行低秩壓縮,顯著降低推理成本 [1]。

然而,現有主流大模型仍然基于標準注意力架構及其變種(e.g., MHA, GQA, MQA),推理成本相比 MLA 呈現顯著劣勢。使預訓練的任意 LLMs 快速遷移至 MLA 架構而無需從頭預訓練,這既有重大意義又具有挑戰性。

復旦 NLP 實驗室、華東師大、上海 AI Lab、??低暵摵咸岢?MHA2MLA 框架,通過部分 RoPE 保留(Partial-RoPE)鍵值聯合表示低秩近似(Low-rank Approximation)兩個關鍵步驟,成功將任意 MHA/GQA 架構遷移到 MLA。

圖片

目前,MHA2MLA 已位列??alphaXiv 熱度榜??

復旦 NLP 實驗室博士后紀燾為第一作者,副研究員桂韜為通訊作者。

圖片

論文概覽

本文聚焦如何將預訓練的基于 MHA/GQA 的大語言模型高效遷移到 DeepSeek 提出的經濟推理架構 —— 多頭潛在注意力(MLA)。

MHA 與 MLA 在多處存在差異,使得 MHA2MLA 極具挑戰:

  1. 位置編碼不同:MHA 采用全維度位置編碼(PE),MLA 僅少量維度采用 PE,剩余維度則 PE 無關
  2. 緩存對象不同:MHA 緩存分離的鍵向量及值向量,MLA 緩存帶 PE 的鍵向量及 PE 無關的鍵值聯合低維表示向量
  3. 參數矩陣不同:MHA 包含查詢、鍵、值三個線性變換矩陣,MLA 則更加復雜、多達七個目的不同的線性變換矩陣
  4. 運算形式不同:MHA 的運算受限于訪存瓶頸,MLA 則能通過矩陣吸收等優化實現更高的訪存效率

本文提出的 MHA2MLA 為了最大化利用 MHA 預訓練參數矩陣并對齊 MLA 的緩存對象和運算形式,首先通過部分 RoPE 保留(Partial-RoPE)分離出 PE 相關表示(少量維度,如 1/8)和 PE 無關表示(大量維度),其中 PE 相關的鍵向量對齊 MLA。其次拼接值的變換矩陣(W_v)和 PE 無關的鍵的變換矩陣(W_{k, nope}),并進行 SVD 分解得到降維變換矩陣和升維變化矩陣,中間的鍵值聯合低秩表示對齊 MLA,完成了緩存對象的對齊以及運算形式的對齊。

圖片

在 135M~7B 上的實驗表明,僅需使用預訓練數據的 0.3% 到 0.6% 進行高效微調,即可基本還原架構遷移帶來的性能損失。并且 MHA2MLA 還能結合其他高效推理技術,例如結合 4-bit KV 緩存量化,Llama2-7B 減少了 92.19% KV 緩存,而 LongBench 上的性能僅下降 0.5%。

部分 RoPE 保留(Partial-RoPE)

為了實現從標準的 MHA(多頭注意力機制)到 MLA(多頭潛在注意力機制)的遷移,作者提出了部分 RoPE 微調(partial-RoPE finetuning)策略,該策略通過從大量維度中移除 RoPE(旋轉位置編碼)并將其轉換為 NoPE(無位置編碼)來解決 MLA 和 RoPE 沖突的問題。

圖片

作者主要嘗試了四種移除 RoPE 的策略:1)保留高頻位置信息 S_high,該方法最簡單直接,保留了局部語義特征相關的高頻特征 [2];2)保留低頻位置信息 S_low,與保留高頻位置信息的策略形成對比,檢驗低頻成分在語義理解任務中的潛在作用;3)均勻采樣策略 S_uniform,等間隔均勻采樣頻率保留位置頻率;4)使用查詢、鍵向量范數乘積 (2-norm) 近似注意力貢獻值 [2] 的篩選策略 S_{2-norm},針對每個注意力頭,計算所有頻率的平均 2-norm 分數,隨后選擇得分較高的頻率保留位置信息。該策略能自適應識別對模型性能關鍵的特征頻率。

圖片

圖片

Partial-RoPE 的消融實驗表明:1)保留低頻位置信息的 S_low 導致了最大的性能損失,保留高頻位置信息的 S_high 導致的性能損失明顯小于保留低頻,說明了高頻維度的重要性;2)S_uniform 和 S_{2-norm} 均展現出更優的性能,分別在 135M 模型和 1.7B 模型上取得了最少的性能損失。最終作者選擇 S_{2-norm} 作為默認配置,是因為注意力貢獻分數較低的維度在結合低秩近似時損失更少。

鍵值聯合表示低秩近似

圖片

圖片

移除了大量維度的 RoPE 之后,MHA2MLA 就可以對值向量和 PE 無關的鍵向量進行低秩近似,從而大幅減少緩存空間。為最大化保留預訓練知識,本文提出兩種基于奇異值分解 (SVD) 的投影矩陣初始化策略:1)SVD_split,分別對矩陣進行低秩分解,保持各自的表征特性;2)SVD_joint,考慮鍵值矩陣之間的關聯性,參數矩陣拼接后整體進行低秩分解。

消融實驗表明:無論是在 GQA 基座還是 MHA 基座上,SVD_joint 方法始終優于 SVD_split 方法。

實驗結果

作者在多種規模的語言模型(SmolLM-135M/360M/1B7 和 Llama2-7B)以及不同壓縮比例的配置下評估了所提出的方法。實驗表明:1)相同微調設置下,壓縮比例越高,性能損失越大,特別是對于兩個 GQA 模型;2)相同壓縮比例下,原始模型參數越多,性能損失越小,揭示了 MHA2MLA 的潛在 scaling law。3)MHA2MLA 的微調數據量僅需預訓練數據的 0.3%~0.6%,避免了從頭預訓練 MLA 模型的高昂成本。

作者在 LongBench 長文本生成任務中評估了結構遷移后的 Llama2-7B 模型,將 KV 緩存量化作為基準對比方案。實驗表明,MHA2MLA 能在 d_{kv}=16 的情況下實現與 2-bit 量化相同的壓縮比例(87.5%),同時僅損失一半的性能(-3.0% vs. -6.2%);進一步結合 4-bit 量化后,不僅壓縮比例超過 2-bit 量化,性能損失也都優于所有 2-bit 的基線方法,例如 92.19% 壓縮比例僅掉 0.5%,96.87% 壓縮比例僅掉 3.2%,證明了 MHA2MLA 能顯著減少推理時的訪存瓶頸。

總結與展望

本文主要研究如何將基于 MHA 的預訓練 LLMs(或其變體)適配為 KV 緩存高效的 MLA 架構,以顯著降低推理時的訪存瓶頸。通過精心的架構設計,MHA2MLA 僅需 0.3% 至 0.6% 預訓練數據。該框架展現了與現有壓縮技術的強兼容性,同時保持了常識推理和長上下文處理能力,為部署資源高效的 LLMs 提供了一條實用路徑。

作者提到該研究受限于硬件條件,當前實驗未能覆蓋 Llama3 等需 128K 長上下文微調的模型,也未突破 7B 參數規模的驗證瓶頸。擴展至更多的基座將作為未來工作之一。作者還計劃結合參數高效微調策略,進一步降低架構遷移過程中的參數更新規模。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-10 00:00:55

MHAValue向量

2025-02-24 11:31:33

2014-04-08 15:27:57

Windows Ser

2025-05-08 08:10:25

大模型DeepSeekAPI

2025-03-06 07:28:31

DeepSeek大模型人工智能

2025-02-13 08:30:11

2025-02-26 13:45:00

2022-02-28 17:57:44

云遷移云計算

2022-02-28 22:58:04

云遷移IT開發

2025-02-25 10:03:20

2025-02-20 09:27:46

2025-09-08 08:49:00

2025-02-28 12:32:42

2024-08-13 15:40:00

2025-07-04 16:50:07

工具AI模型

2023-11-30 08:15:58

模型結構化

2025-03-03 10:00:00

2025-04-03 15:40:41

機器學習大模型DeepSeek

2020-08-28 10:01:08

AndroidPC手機屏幕

2025-02-24 11:32:57

點贊
收藏

51CTO技術棧公眾號

av综合在线播放| 北条麻妃一区二区三区在线| 国产欧美一区二区精品仙草咪 | 久久亚洲精品视频| 青青草视频在线视频| 午夜精品在线播放| 国产日韩免费| 日韩在线一区二区三区免费视频| 久久久久无码精品| 欧美动物xxx| 亚洲美女视频一区| 欧美一区2区三区4区公司二百| 中文字幕一区二区人妻痴汉电车| 国产精品a级| 一色桃子一区二区| 亚洲国产精品第一页| 精品日韩视频| 亚洲超碰97人人做人人爱| 翔田千里亚洲一二三区| 黄色成人一级片| 日本午夜一本久久久综合| 欧美日韩第一页| 日韩av在线看免费观看| 日本免费精品| 欧美网站一区二区| 成人一级生活片| 91精品国产综合久久久久久豆腐| 国产成人av电影在线观看| 国产精品高潮呻吟久久av野狼| 久久久久久久久艹| 国产精品成人a在线观看| 精品无人区乱码1区2区3区在线| 午夜av中文字幕| 搜成人激情视频| 精品av在线播放| 水蜜桃在线免费观看| 成人在线观看黄色| 久久影院视频免费| 精品国产一二| 蜜臀av中文字幕| 国产在线播精品第三| 国产精品美女免费| 在线视频精品免费| 国产精品美女| 88xx成人精品| 日韩aaaaaa| 国内精品美女在线观看| 成年无码av片在线| 亚洲区一区二区三| 欧美精品一二| 国产亚洲视频在线| 无码 人妻 在线 视频| 麻豆一区二区麻豆免费观看| 精品三级在线看| 色黄视频免费看| 91国产一区| 欧美视频一区二区三区在线观看| 韩国一区二区av| 高潮一区二区| 在线视频一区二区免费| 91av在线免费播放| 国产免费不卡| 欧美最新大片在线看| 岳毛多又紧做起爽| 久久毛片亚洲| 欧美视频一区二区三区四区 | 成人h精品动漫一区二区三区| 91免费精品国偷自产在线| 亚洲一级av毛片| 六月婷婷色综合| 91精品久久久久久久久久另类| 中文字幕乱码一区二区| 精油按摩中文字幕久久| 成人在线小视频| www.国产视频| 99久久久无码国产精品| 热re99久久精品国产99热| 91在线高清| 亚洲欧美日韩在线不卡| 欧美国产视频一区| heyzo高清国产精品| 欧美日韩精品中文字幕| 波多野结衣天堂| crdy在线观看欧美| 精品久久久网站| 中文字幕在线免费看线人 | 国产成人精品www牛牛影视| 国产精品一区而去| 久久米奇亚洲| 中文字幕视频一区| 91免费黄视频| 电影久久久久久| 欧美一区二区三区在线看| 韩国三级视频在线观看| 亚洲免费福利一区| 久久精品国产成人精品| 日韩三级一区二区三区| 日韩av中文字幕一区二区| 91九色在线观看| 飘雪影院手机免费高清版在线观看 | 亚洲视频精品| 国产精品激情自拍| 亚洲av无码国产精品久久不卡| 91在线视频18| 潘金莲一级淫片aaaaa免费看| 玖玖在线播放| 91精品国产91综合久久蜜臀| 老司机福利av| 中文字幕一区二区精品区| 国产69精品久久久久久| 国产露脸无套对白在线播放| 91视频观看免费| 日韩精品一区二区三区电影| 欧美电影在线观看免费| 亚洲日韩欧美视频| 校园春色 亚洲| 性伦欧美刺激片在线观看| 成人激情av在线| 天天操天天干天天爽| 国产精品久线在线观看| 欧美亚洲日本一区二区三区 | 国产精品6699| 亚洲精品国产精品乱码不卡| 国产精品美女久久久久高潮| 成人免费aaa| 在这里有精品| 久久夜色精品国产| 日韩国产成人在线| 91网站最新网址| 国产精品日韩三级| 欧美a级片一区| 中文字幕免费不卡| 波多野结衣与黑人| 久久久久国产精品夜夜夜夜夜| 国产精品美女久久久| 99高清视频有精品视频| av在线三区| 欧美性69xxxx肥| 伊人网综合视频| 在线国产一区| 成人av番号网| 无遮挡的视频在线观看| 色欧美片视频在线观看在线视频| 熟妇人妻久久中文字幕| 黄色一区二区三区四区| 不卡一卡2卡3卡4卡精品在| 久久久久久国产精品免费无遮挡| 在线看国产一区二区| 永久免费看mv网站入口78| 99热在线精品观看| 精品国产一区二区三区麻豆免费观看完整版 | 精品国产99久久久久久| 99成人精品| 亚洲自拍偷拍色片视频| av在线1区2区| 欧美日韩视频在线一区二区| 色一情一交一乱一区二区三区 | 天堂网中文字幕| 94色蜜桃网一区二区三区| 黄色一级片播放| 日韩欧美影院| 欧美综合一区第一页| 午夜性色福利影院| 色综合久久综合网欧美综合网| 亚洲精品乱码久久久久久不卡 | 无限资源日本好片| 欧美一区二区三| 国产精品久久久av久久久| 粉嫩av一区| 欧美日韩国产区一| 男人在线观看视频| 国产成人综合精品三级| www.好吊操| 夜色77av精品影院| 国产精品久久久久久久美男| 69视频在线观看| 91精品在线观看入口| 九九九久久久久| 97se亚洲国产综合自在线 | 韩国av一区二区三区四区| 中国一区二区三区| 色悠久久久久综合先锋影音下载| 久久久这里只有精品视频| 亚洲av片一区二区三区| 在线视频观看一区| 伊人久久久久久久久久久久久久| 国产高清久久久| 大肉大捧一进一出好爽视频| 色婷婷一区二区三区| 999在线免费观看视频| 在线天堂中文资源最新版| 中文字幕亚洲在线| 亚洲精品一区二区三区蜜桃| 色综合天天在线| 亚洲一级生活片| 97久久人人超碰| 思思久久精品视频| 99视频一区| a级网站在线观看| 亚洲免费成人av在线| 91欧美日韩一区| 天堂中文在线播放| 久久久精品网站| 日本亚洲一区| 日韩一区二区电影| 亚洲图片欧美日韩| 一级做a爱片久久| www.日本高清视频| 97久久久精品综合88久久| 亚洲精品成人在线播放| 亚洲欧美清纯在线制服| 日韩精品中文字幕一区| 国产免费a级片| 日本不卡高清| 国产精品91久久久| 免费黄色片在线观看| 狠狠躁夜夜躁人人爽天天天天97 | 成人av资源在线| 一本久道高清无码视频| 中文字幕一区图| 97精品久久久| 日本人妖在线| 在线一区二区视频| 亚洲一级理论片| 韩国视频一区二区| 999久久欧美人妻一区二区| xxxxxhd亚洲人hd| 午夜伦理精品一区| 日本天堂影院在线视频| 在线视频观看一区| 国产美女久久久久久| 国产成人av在线影院| 成人中文字幕在线播放| 蜜桃成人av| 国产久一一精品| 午夜小视频在线观看| 亚洲电影免费观看高清完整版在线| 精品亚洲永久免费| 91美女视频网站| 亚洲成人福利在线观看| 91亚洲自偷观看高清| 91在线免费看片| 久久青草伊人| 在线电影中文日韩| 性生活黄色大片| 色综合中文综合网| 疯狂撞击丝袜人妻| 成人av网址在线观看| 18岁网站在线观看| 日韩精品一区二区久久| 亚洲最大福利网站| 小视频免费在线观看| 中文字幕精品国产| 欧美熟妇交换久久久久久分类 | 国产v日产∨综合v精品视频| 男女猛烈激情xx00免费视频| 国产探花一区二区| 18成人免费观看网站下载| 自拍偷拍亚洲视频| 日韩一区视频在线| 熟妇人妻系列aⅴ无码专区友真希| 日本韩国一区二区三区视频| 免费三级在线观看| 久久亚洲精品小早川怜子| 天堂在线一区二区三区| 亚洲三级视频| 中文字幕av久久| 免费欧美一区| 99精彩视频| 国产成人精品一区二区三区在线 | 久久精品女人毛片国产| 国产欧美一区二区在线| 无码av免费精品一区二区三区| 日韩黄色一级片| 国产精品日韩三级| 国产精品88久久久久久| 青青草原成人| 国产精品18hdxxxⅹ在线| 国产在线视频2019最新视频| 亚洲精品mv| 久久久久亚洲精品国产| 国产午夜精品久久久久免费视| 亚洲一级黄色片| 无码国产精品一区二区免费16| 欧美丰满一区二区免费视频| 日韩手机在线视频| 红桃av永久久久| 欧美日韩免费做爰视频| 国产精品福利av| 蜜臀久久99精品久久久久久| 成人午夜视频免费看| 91热视频在线观看| 麻豆精品在线视频| 老熟妇仑乱视频一区二区| 一区二区高清| 丁香色欲久久久久久综合网| 亚洲成人精选| 亚洲视频精品一区| 国产欧美高清视频在线| 精品亚洲欧美日韩| 欧美久久香蕉| 国产视频不卡| 粉嫩久久久久久久极品| 成人av免费在线看| 视频精品一区| 91入口在线观看| 亚洲成人影音| 国产成人精品自拍| 7m精品国产导航在线| 国产精品国产精品| 成人福利一区| 国产尤物91| 欧美韩一区二区| 国产一区二区无遮挡| 麻豆精品少妇| 麻豆成人av| 国产99久久久国产精品成人免费| 精品国产综合区久久久久久| 国产精品男女| 国产自产在线视频一区| 日韩高清在线免费观看| 久久久久一区二区三区| 欧美日韩一区二区三区四区不卡| 国产精品夜夜夜一区二区三区尤| 国产精品2023| 免费亚洲一区二区| 国产不卡一区| 亚洲综合首页| 欧美伊人久久| cao在线观看| 亚欧美中日韩视频| 在线免费视频a| 国产综合成人久久大片91| 韩国三级在线播放| 成人av手机在线观看| 久久国产精品影院| 国产精品青草久久| 成人在线观看免费完整| 午夜精品久久一牛影视| 午夜精品免费观看| 欧美日本在线播放| 午夜精品久久久久久久第一页按摩 | 性猛交富婆╳xxx乱大交天津 | 91精品国产综合久久香蕉922 | 日韩一级视频免费观看在线| 黄色av小说在线观看| 日韩精品中文字幕在线播放| 国产乱视频在线观看| 超碰97人人做人人爱少妇| 91丝袜在线| 国产大片精品免费永久看nba| 四虎影视精品永久在线观看| 九九热这里有精品视频| 欧美精品一区二区蜜桃| 亚洲欧美一区二区三区极速播放 | 色悠悠久久久久| 91蜜桃在线视频| 77777亚洲午夜久久多人| 91久久久久久白丝白浆欲热蜜臀| 亚洲www永久成人夜色| 日韩大胆成人| 亚洲一区二区三区在线观看视频| 国产精品v欧美精品v日本精品动漫| 国模无码视频一区二区三区| 另类小说视频一区二区| 国产女主播在线播放| 国产日韩精品一区| 久久久久久欧美精品se一二三四| 91久久精品一区二区三| 性一交一乱一乱一视频| 国产一区二区三区在线观看网站| 18视频在线观看网站| 国产成人精品在线| 6080亚洲理论片在线观看| 亚洲国产欧美日韩| 亚洲精品影视| 日韩欧美中文视频| 国产欧美日韩久久| aaa人片在线| 日韩视频不卡中文| 日本免费在线视频| 清纯唯美亚洲综合| 超碰成人福利| 亚洲第一综合网站| 琪琪一区二区三区| 国产黄色三级网站| 一区二区三区小说| 特级毛片www| 欧美精品一区二| 羞羞视频在线免费国产| 91精品久久久久久久久中文字幕| 欧美**字幕| 成人毛片视频网站| 成人ar影院免费观看视频| 性欧美videos| 欧美日韩在线播放一区| 成年人视频在线看| 国产精品∨欧美精品v日韩精品| 欧美aaaaaaaa牛牛影院| 久久精品国产sm调教网站演员|