精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

上交大等探索鍵值壓縮的邊界:MILLION開源框架定義模型量化推理新范式,入選頂會DAC 2025

人工智能 新聞
本文的研究者提出了 MILLION,一種基于乘積量化的鍵值緩存壓縮和推理加速設計。

本篇工作已被電子設計自動化領域頂級會議 DAC 2025 接收,由上海交大計算機學院蔣力教授與劉方鑫助理教授帶領的 IMPACT 課題組完成,同時也獲得了華為 2012 實驗室和上海期智研究院的支持。第一作者是博士生汪宗武與碩士生許鵬。

在通用人工智能的黎明時刻,大語言模型被越來越多地應用到復雜任務中,雖然展現出了巨大的潛力和價值,但對計算和存儲資源也提出了前所未有的挑戰。在以 transformer 模型為基礎的大模型中,鍵值緩存雖然用以存代算的思想顯著加速了推理速度,但在長上下文場景中成為了存儲瓶頸。例如,半精度的 LLaMA-2-7B 模型權重約 14GB,在上下文長度為 128K 時鍵值緩存占據 64GB,總和已經接近高端卡 NVIDIA A100 的 80GB 顯存容量上限。鍵值量化可被用于壓縮緩存,但往往受到異常值的干擾,導致模型性能的顯著下降。為此,本文的研究者提出了 MILLION,一種基于乘積量化的鍵值緩存壓縮和推理加速設計。

圖片

  • arxiv 鏈接:https://arxiv.org/abs/2504.03661
  • 開源鏈接:https://github.com/ZongwuWang/MILLION

整型量化的軟肋:異常值

圖片

圖 1:矩陣量化可視化。紅色代表的異常值顯著大于其他值,導致均勻量化后高位編碼被浪費。

量化中受到廣泛使用的整型均勻量化受到異常值的影響較為顯著。圖 1 展示了矩陣中的量化。在一組分布較為集中的數據中,一個顯著偏離其他值的異常值會導致其他值的量化結果全部落在較低區間,浪費了高位編碼的表示能力。

圖片

圖 2:圖中使用 「通道熵」 定量比較不同方案的量化效果,越大表明越有效地利用了通道容量,即整型的寬度。沿通道量化只能解決沿該方向分布的異常值,而在面對另一方向異常值時效果不佳。

在實際的鍵值量化中,為了更好的表示能力,通常對于每個通道(即鍵值向量的維度)或每個 token 采取不同的量化參數,這種方法被稱為沿通道量化(channel-wise quantization)或沿詞元量化(token-wise quantization)。然而,如圖 2 所示,沿特定方向量化只能解決沿該方向分布的異常值。

圖片

圖 3:實際采樣獲得的鍵值緩存分布。在 llama-2-7b-wikitext-103-v1-layer10-value 中,異常值并不遵循簡單的沿通道分布,而是呈現為較復雜的點狀和團狀。

研究團隊通過實際采樣數據發現,在鍵值緩存中,沿通道方向分布的異常值占多數,但也存在并不明顯的情況,如圖 3 所示。這表明,上述量化方案并不是一勞永逸的解決方式,仍然存在優化空間。

異常值的解決方案:乘積量化

圖片

圖 4:數軸上的均勻和非均勻量化對比。在對 8 個數據點進行 2 比特量化過程中,均勻量化浪費了 10 編碼。而基于聚類的非均勻量化則編碼更合理。

如圖 4 所示,非均勻量化通過聚類的方式允許量化區間不等長,從而更合理地分配編碼,提升量化效率。研究團隊觀察到,由于通道間的數據分布可能存在關聯(即互信息非負),將通道融合后在向量空間中聚類,效果一定不亞于獨立通道的量化,如圖 5 所示。

圖片

圖 5:左圖為兩個通道獨立進行 1 比特量化,右圖為在通道融合后進行 4 分類的 KMeans 聚類。融合通道量化的通道熵更加接近 2 比特的容量極限,展示出更好的量化效果。

由于高維空間中聚類較為困難,因此將整個向量空間劃分為多個低維子空間的笛卡爾積,可以平衡聚類復雜度和量化效果。這與最近鄰搜索中使用的乘積量化思想一致。研究團隊通過實驗發現,子空間維度為 2 或 4 是較好的平衡點。

推理加速手段:高效的系統和算子實現

圖片

圖 6:三階段的推理系統設計

圖片

圖 7:分塊注意力機制使得批量延遲量化成為可能

圖 6 展示了離線訓練、在線預填充、在線解碼三階段的量化推理系統設計。其中,碼本訓練(量化校準)屬于秒級輕量化任務,并且離線進行,不影響運行時開銷;在線預填充階段使用訓練好的碼本對鍵值緩存進行量化壓縮,達到節省顯存的目的;在線解碼階段采用分塊注意力機制的方法,將預填充階段的歷史注意力和生成 token 的自注意力分開計算(如圖 7 所示),達成批量延遲量化的目的,掩藏了在線量化的開銷,確保模型輸出的高速性。并且,在歷史注意力階段,由于歷史鍵值對數遠大于碼本長度,因此先用查詢向量與碼本計算好非對稱距離查找表(ad-LUT),可以大大減少內積距離計算量,達到加速計算的目的。

圖片

圖 8:向量化加載可有效使帶寬飽和

在算子優化方面,研究團隊在 flash decoding 的基礎上使用了寬數據(如 float4)向量化加載的方式,將多個乘積量化編碼打包為寬數據,有效使帶寬飽和(如圖 8 所示)。同時,在表查找階段,子空間之間的表具有獨立性,并且可以被放入少量緩存行中,研究團隊利用這一空間局部性極大提高了表查找的 L2 緩存命中率。此外,研究團隊還仔細掃描了不同上下文長度下可能的內核參數,找到最優配置,形成了細粒度的預設,在實際運行時動態調整,充分利用 GPU 的計算資源。具體實現可以在開源倉庫中找到。

實驗結果

實驗設置

圖片

圖 9:實驗設置

實驗采用了不同位置編碼、不同上下文長度的多種模型進行了詳細的評估。在模型性能方面,采用困惑度(Perplexity,PPL)和 Longbench 兩種指標;在系統性能方面,采用每詞元輸出間隔(Time Per Output Token, TPOT)定量分析,并給出了注意力層詳細的剖析。對比采用方案和乘積量化參數如圖 9 所示。

模型性能

圖片

圖 10:困惑度指標。其中 「-1%」 表示該方法額外存儲 1% 的異常值不參與量化。

困惑度越小表明模型輸出質量越高。實驗結果表明,MILLION 與額外處理了異常值的 SOTA 方案輸出質量保持一致,展現出對異常值良好的魯棒性。而 SOTA 方案在不處理異常值的情況下可能會遭遇嚴重的輸出質量損失。

圖片

圖 11:Longbench 問答數據集得分展示

在長對話問答任務中,不同模型在各種數據集上的得分均表明,MILLION 方案能夠在 4 倍鍵值緩存壓縮效率下保持幾乎無損的表現。

系統性能

圖片

圖 12:每詞元輸出時間。對比其他方案,MILLION 的優勢持續增長,在 32K 上下文時達到 2 倍加速比。

圖片

圖 13:注意力層時間剖析

在 TPOT 評估中,MILLION 能夠在 32K 上下文語境下同時達成 4 倍鍵值緩存壓縮比和 2 倍端到端加速比。注意力層的深入分析表明,MILLION 在訪存和內核函數方面對比 baseline 取得顯著優勢。

總結

MILLION 的主要貢獻在于:(1)深入分析鍵值緩存分布;(2)提出基于乘積量化的非均勻量化算法;(3)設計高效的推理系統及內核。研究團隊首先證實了鍵值緩存中異常值存在的普遍性,并指出異常值的不同分布是當前主流的量化方案精度不足的根本原因;然后提出通過將高維向量空間分解為多個子空間,并在每個子空間內獨立進行向量量化的方法,更有效地利用了通道間的互信息,并且對異常值展現出極強的魯棒性;接著通過 CUDA 異步流和高效的算子設計,充分利用了 GPU 的并行計算能力和內存層次結構,以支持乘積量化的高效執行。實驗表明,對比主流框架 transformers 的半精度實現,MILLION 在 32K 上下文場景中同時達成 4 倍壓縮率和 2 倍加速比,并且在多種語言任務中精度表現幾乎無損。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-23 09:00:24

2025-01-23 12:30:00

2022-07-12 10:37:08

阿里巴巴達摩院機器學習

2025-11-14 08:43:45

2025-05-30 02:00:00

獎勵模型RRMAI

2022-12-19 14:39:29

機器人論文

2025-11-04 01:43:00

循環語言模型架構

2023-12-29 13:19:43

視頻AI

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-02-26 16:55:27

2025-06-26 09:06:59

2021-12-09 08:50:35

Kubernetes增強功能版本更新

2024-06-12 11:48:55

2025-07-14 08:42:00

開發模型圖像生成

2025-05-16 08:44:01

2025-07-07 08:56:00

2025-09-04 11:58:42

2025-07-08 03:11:00

2021-09-02 10:15:50

計算平臺MaxCompute 阿里云

2025-06-09 09:32:35

點贊
收藏

51CTO技術棧公眾號

日韩一级高清毛片| 91在线porny国产在线看| 中文字幕精品一区久久久久| 在线观看av网页| 欧美成人hd| 成人精品电影在线观看| 国产成人福利网站| 日本天堂中文字幕| 久久不见久久见免费视频7| 欧美日韩卡一卡二| 美女日批免费视频| 免费看美女视频在线网站| 99久久综合精品| 国产精品一区av| 久久精品国产成人av| 亚洲精品极品少妇16p| 亚洲国产美女久久久久| 不用播放器的免费av| 中文字幕在线中文字幕在线中三区| 国产精品女同互慰在线看| 国产一区精品在线| 一区二区日韩视频| 久久久噜噜噜| 97视频在线观看视频免费视频| 欧美日韩国产一二三区| 亚洲男人都懂第一日本| 日韩欧美精品三级| 日本xxxx黄色| 波多野结衣亚洲一二三| 亚洲国产视频a| 中文字幕精品—区二区日日骚| 欧美精品久久久久久久久久丰满| 国产精品一级黄| 国产成人一区三区| 99热只有这里有精品| 国内揄拍国内精品久久| 久久高清视频免费| 51精品免费网站| 日韩情爱电影在线观看| 亚洲女人天堂av| 国产麻豆天美果冻无码视频 | 成人黄色免费网站在线观看| 亚洲久久久久久| 欧美经典一区| 在线观看不卡视频| 亚洲欧美另类中文字幕| 日韩av卡一卡二| 成人开心激情| 一本到不卡精品视频在线观看 | 天堂久久精品忘忧草| 国产精品白丝一区二区三区| 日韩欧美国产综合一区| 欧美色图校园春色| 在线播放一区二区精品视频| 日韩免费观看高清完整版| 天天av天天操| 亚洲大奶少妇| 精品日韩一区二区三区| 制服丝袜在线第一页| 成人精品动漫一区二区三区| 精品国产乱码久久久久久闺蜜| 中文字幕55页| 久久免费视频色| 欧美肥老妇视频| 真实国产乱子伦对白在线| 中文字幕日韩欧美精品高清在线| 久久精品国产成人| 免费在线观看黄视频| 影音先锋亚洲精品| 欧美一级在线亚洲天堂| aaa在线视频| 琪琪一区二区三区| 91色p视频在线| aaa一区二区三区| 成人亚洲一区二区一| 久久99精品久久久久久青青日本| 青青草免费在线| 国产精品天天看| 日韩在线视频在线| 美女高潮在线观看| 欧美日韩亚洲综合在线| av在线免费观看不卡| 欧美wwwsss9999| 国产一区二区免费| 日韩欧美国产精品| 欧美精品自拍视频| 国产另类xxxxhd高清| 欧美色倩网站大全免费| 亚洲成人av免费观看| 日本午夜精品| 久久精品欧美视频| 91浏览器在线观看| 麻豆国产欧美一区二区三区| 97超碰人人看人人| 毛片在线免费| 成人免费小视频| 国产日本在线播放| 另类一区二区三区| 亚洲大尺度美女在线| 日本一卡二卡在线播放| 欧美色123| 国产精品麻豆va在线播放| 午夜久久久久久噜噜噜噜| 久久免费的精品国产v∧| 最新视频 - x88av| 浪潮色综合久久天堂| 欧美成人三级电影在线| 久久中文字幕精品| 亚洲作爱视频| 91欧美日韩一区| 国产专区在线| 亚洲观看高清完整版在线观看| 丰满少妇在线观看| 久久99精品国产自在现线| 久久天天躁狠狠躁夜夜躁 | 亚洲国产成人精品女人| 日韩美女在线播放| 成人午夜免费福利| 亚洲丝袜制服诱惑| 婷婷六月天在线| 日韩精品福利一区二区三区| 精品自拍视频在线观看| 中文字幕免费观看视频| 91伊人久久大香线蕉| 肉大捧一出免费观看网站在线播放| 玛雅亚洲电影| 亚洲精品久久久久久下一站| 欧美又粗又大又长| 久久精品国产免费看久久精品| 裸模一区二区三区免费| heyzo高清国产精品| 欧美一区二区视频在线观看2020 | 午夜国产在线视频| 亚洲精品国产视频| 日韩欧美亚洲另类| 成人在线电影在线观看视频| 91av在线不卡| 少妇精品高潮欲妇又嫩中文字幕| 亚洲精品你懂的| 嫩草av久久伊人妇女超级a| 亚洲小说图片| 日韩美女视频中文字幕| 黄上黄在线观看| 日韩欧中文字幕| 特级西西人体4444xxxx| 亚洲精品四区| 国产一区二区在线网站| 免费看男女www网站入口在线 | 亚洲无线视频| 国产成人免费观看| 日本大胆在线观看| 精品日韩成人av| www.av视频在线观看| 99久久久国产精品免费蜜臀| 精品视频在线观看一区| 欧美黄色网视频| 清纯唯美亚洲激情| 第九色区av在线| 欧美日韩一区国产| 久久久久久视频| 国产激情91久久精品导航| 欧美一二三不卡| 极品国产人妖chinesets亚洲人妖| 久久久久久久久网站| 无码国产色欲xxxx视频| 福利微拍一区二区| 四虎国产精品成人免费入口| 蜜臀av一区二区| 在线免费观看一区二区三区| 精品99re| 午夜精品久久久久久久久久久久 | 日韩三级精品| 97香蕉超级碰碰久久免费软件| 日韩午夜影院| 欧美日韩不卡在线| 欧美片一区二区| 91在线观看免费视频| 亚洲精品怡红院| 一区二区三区四区在线观看国产日韩| 国产91免费视频| 3d欧美精品动漫xxxx无尽| 最近2019年日本中文免费字幕| 99热这里只有精品9| 亚洲高清免费在线| 亚洲精品国产精品国自| 国产精品综合网| 岳毛多又紧做起爽| 天天色天天射综合网| 国产欧美韩日| 看片一区二区| 欧美亚洲日本黄色| 国产在线高潮| 亚洲人成电影网站色…| 国产视频一区二区三| 黑人与娇小精品av专区| 一区二区三区在线播放视频| 成人ar影院免费观看视频| 香蕉视频网站入口| 影音先锋在线一区| 一区二区三区不卡在线| 麻豆精品av| 91网站免费看| 日韩免费va| 久久理论片午夜琪琪电影网| 在线观看h片| 亚洲精品视频久久| www日本高清视频| 欧美日韩在线不卡| 国产成人在线观看网站| 亚洲美女淫视频| 懂色av蜜桃av| 91蜜桃视频在线| 真实乱偷全部视频| 麻豆视频观看网址久久| 激情伊人五月天| 欧美在线观看天堂一区二区三区| 欧美午夜精品理论片a级大开眼界 欧美午夜精品久久久久免费视 | 亚洲少妇30p| 色婷婷国产精品免| 久久久久9999亚洲精品| 亚洲激情 欧美| 国产精品77777| 欧美婷婷精品激情| 老牛国产精品一区的观看方式| 国产曰肥老太婆无遮挡| 影音先锋日韩在线| 在线视频91| 久久高清免费| 亚洲精品乱码视频| 国内精品视频在线观看| 欧洲亚洲一区二区| 亚洲传媒在线| 久久国产精品久久精品国产| 国产精品毛片av| 国产成人av一区二区三区| 视频一区中文字幕精品| 98国产高清一区| 麻豆精品国产| 亚洲自拍偷拍一区| 高清一区二区中文字幕| 91久久久久久久久久久| av一级久久| 91免费在线视频网站| 国产精品中文| 91久久偷偷做嫩草影院| 日韩中文字幕| 国产精品久久久久免费| 久久精品凹凸全集| 精品亚洲欧美日韩| 亚洲精品小区久久久久久| 久久青青草综合| 九色成人国产蝌蚪91| 欧美精品成人一区二区在线观看| 免费看日本一区二区| 日韩欧美精品久久| 三区四区不卡| 成人黄色片免费| 亚洲福利精品| 免费毛片小视频| 日本最新不卡在线| 女同激情久久av久久| 国产精品原创巨作av| 图片区偷拍区小说区| 99视频精品在线| 男女做爰猛烈刺激| 国产精品久久久久久久久图文区| 在线观看黄网址| 亚洲自拍偷拍麻豆| 国产免费av一区二区| 91久久精品日日躁夜夜躁欧美| 又骚又黄的视频| 日韩免费一区二区三区在线播放| 日本精品一二区| 亚洲欧美在线磁力| 米奇777四色精品人人爽| 九九久久综合网站| 波多视频一区| 91精品在线播放| 麻豆精品99| 亚洲三区四区| 激情偷拍久久| 精品亚洲一区二区三区四区| 国产精品888| 美女被到爽高潮视频| 亚洲激情成人在线| 99久久精品国产亚洲| 欧美高清精品3d| 香蕉视频911| 久久精品99久久香蕉国产色戒| 99thz桃花论族在线播放| 国产成人精品在线| 美女久久精品| 欧美一区激情视频在线观看| 欧美暴力喷水在线| 日本在线视频www| 国产高清成人在线| 亚洲日本精品视频| 亚洲国产成人tv| 一级日韩一级欧美| 亚洲精品影视在线观看| fc2ppv国产精品久久| 国产成人精品一区二区在线| 7777精品| 在线一区亚洲| 老**午夜毛片一区二区三区| 精品久久久久久无码人妻| 国产亚洲成aⅴ人片在线观看| 福利所第一导航| 在线精品视频一区二区三四| 日韩在线一区二区三区四区| 久久不射电影网| 日本久久免费| 精品无人乱码一区二区三区的优势| 91精品啪在线观看国产18| mm1313亚洲国产精品无码试看| 国产aⅴ精品一区二区三区色成熟| 久久中文字幕精品| 色哟哟亚洲精品| 色婷婷av一区二区三区之红樱桃| 久久九九国产精品怡红院| 日韩成人高清| 欧美日韩精品不卡| 亚洲一区二区成人| av电影在线播放| 亚洲精品国产一区二区精华液| 亚洲影视一区二区| 在线播放日韩av| 我爱我色成人网| 精品欧美国产| 亚洲精选成人| 182在线视频| 天天射综合影视| 色屁屁草草影院ccyycom| 国内成人精品视频| 69精品国产久热在线观看| 国产人妻人伦精品| 国产精品综合一区二区三区| 日韩在线观看视频一区二区| 91精品黄色片免费大全| 蜜芽在线免费观看| 国产欧美日韩精品丝袜高跟鞋| 波多野结衣在线播放一区| 91看片就是不一样| 26uuu国产一区二区三区| 亚洲黄色一区二区| 亚洲成年人在线| caoporn视频在线观看| 国产在线播放一区二区| 在线看片日韩| 少妇一级淫免费观看| 天天色天天操综合| 欧美成人片在线| 国产精品极品美女粉嫩高清在线| 日本成人小视频| 午夜激情影院在线观看| 一区二区三区在线观看网站| 三级网站在线看| 5566日本婷婷色中文字幕97| 综合亚洲色图| 国产日韩一区二区在线| 欧美—级在线免费片| 中文字幕在线观看精品| 久久久精品视频在线观看| 日本超碰一区二区| 夜夜添无码一区二区三区| 91蝌蚪porny九色| 伊人网中文字幕| 欧美乱大交xxxxx| 日韩一级电影| 男人添女人下面免费视频| 亚洲精品ww久久久久久p站| 日本精品一二区| 国产精品爽黄69天堂a| 亚洲色图国产| 国产又粗又猛又色| 欧美午夜精品久久久久久孕妇| 日本在线播放| 国产私拍一区| 美女视频网站黄色亚洲| 免费中文字幕在线观看| 精品网站999www| 欧洲精品久久久久毛片完整版| 国产在线视频综合| 国产欧美视频一区二区| 国产高清在线免费| 日本国产高清不卡| 亚洲成人最新网站| 在线观看国产三级| 欧美酷刑日本凌虐凌虐| 韩国精品一区| 一区在线电影| 久久综合av免费| 国产ts变态重口人妖hd| 国产成人精品一区| 国产精品hd| 国产真人真事毛片视频| 欧美精品一区二区久久婷婷| 51一区二区三区| 国产xxxx振车| ㊣最新国产の精品bt伙计久久|