精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

10倍吞吐提升無損性能:多模態適用的KV cache量化策略來了,即插即用無需改原模型

人工智能 新聞
作者提出了CalibQuant,一種簡單卻高效的視覺KV cache量化策略,能夠大幅降低顯存和計算開銷。

在InternVL-2.5上實現10倍吞吐量提升,模型性能幾乎無損失。

最新1-bit多模態大模型KV cache量化方案CalibQuant來了。

通過結合后縮放和校準方法,可顯著降低顯存與計算成本,無需改動原模型即可直接使用。

圖片

即插即用、無縫集成

多模態大語言模型在各種應用中展現出了卓越的性能。然而,它們在部署過程中的計算開銷仍然是一個關鍵瓶頸。

雖然KV cache通過用顯存換計算在一定程度上提高了推理效率,但隨著KV cache的增大,顯存占用不斷增加,吞吐量受到了極大限制。

為了解決這一挑戰,作者提出了CalibQuant,一種簡單卻高效的視覺KV cache量化策略,能夠大幅降低顯存和計算開銷。具體來說,CalibQuant引入了一種極端的1比特量化方案,采用了針對視覺KV cache內在模式設計的后縮放和校準技術,在保證高效性的同時,不犧牲模型性能。

作者通過利用Triton進行runtime優化,在InternVL-2.5模型上實現了10倍的吞吐量提升。這一方法具有即插即用的特性,能夠無縫集成到各種現有的多模態大語言模型中。

動機

當前的多模態大語言模型在實際應用中常常需要處理大尺寸、高分辨率的圖像或視頻數據,KV cache機制雖然能提升效率,但其顯存占用與輸入長度(如視覺幀數、圖像尺寸等)成正比。

當輸入數據的規模增大(例如更多的視覺幀、更高的圖像分辨率)時,KV緩存的顯存使用量迅速增加,成為限制吞吐量的瓶頸。盡管當前有些針對LLM KV cache量化的方法可以將其壓縮至2比特,但這些方法沒有針對多模態問題中特有的視覺冗余做分析優化,導致其無法在極限情況1比特下被使用。

本文通過分析多模態大語言模型中的視覺KV cache的冗余,設計了適合多模態模型特有的KV cache量化方案。

方法

本文在通道維度量化的基礎上提出了針對反量化計算順序的后縮放優化方案和針對注意力權重優化的校準策略。

1、通道維度KV cache量化

一種廣泛使用的方法是均勻整數量化。給定一個比特寬度b>0和一個輸入值x,它位于某個范圍[α,β]內,則將其映射到一個離散整數圖片,計算過程為:


圖片

這里的???表示取整運算符。最樸素的方法是使用全局統計量來計算這些極值,但是模型性能會受較大影響,作者選擇在通道維度上細化統計范圍。具體來說,令圖片表示一個K cache,其中n和d分別表示token的數量和head的維度。定義兩個向量圖片如下:

然后,通過上述過程對K中的每一行向量進行量化,其中乘法操作是逐元素進行的。作者同樣將這種按通道的量化方法應用于V cache。

2、后縮放KV cache管理策略

量化后的K cache可以用離散化的整數值、一個縮放因子(scale factor)和一個偏置項(bias term)來表示。在解碼階段,這些值被用于對K cache進行反量化,并隨后與Q相乘。然而,通道維度的量化需要為每個通道分別指定不同的縮放因子和偏置向量,這將導致產生大量不同的數值,增加了反量化過程中的計算開銷。此外,這種方式也使得CUDA內核中的計算效率降低。作者觀察到量化后的K僅具有有限數量的離散取值(例如,對于2比特量化,其取值僅為0、1、2、3),于是提出利用簡單的計算順序重排來減少存儲需求,并提高計算效率。具體過程如下:

圖片是K cache矩陣圖片中的任意一行向量,為其進行b比特整數量化后的結果,并伴隨有逐通道的縮放因子α,β。給定一個查詢向量圖片,在生成token過程中注意力計算如下:

圖片

其中,符號?和⊙分別表示向量之間的內積和逐元素乘積。通道維度上的反量化操作圖片被延遲執行,并高效地集成到后續的向量乘法運算中。因此,這種方法僅存儲經過b比特整數量化后的數值,并且避免了全精度反量化計算過程。這種方法確保了低比特反量化執行的高效性。這種后縮放方法也可以自然地應用到V cache的反量化過程中。

3、量化后的校準

1比特量化的一個限制是經過反量化之后的數值往往會包含大量的極端值。這是因為1比特量化的碼本總是包含了最小值和最大值,導致那些接近邊界的輸入值在反量化后直接映射到了極端值。

因此,重建后的KV cache通常包含過多的大絕對值,最終導致注意力分數產生明顯的失真。為了解決這個問題,作者提出了一種量化后校準方法,用于調整softmax之前注意力分數的峰值。具體來說,假設圖片中的所有元素都位于區間圖片內。給定圖片,定義一個線性變換g將區間圖片映射到圖片,其表達式如下:圖片

隨后對注意力分數進行如下調整:

圖片

如下圖所示,校準方法(Quant-C,紅色)有效減輕了極端值的影響,使調整后的注意分數分布相較于未經校準的量化方法(Quant,藍色)更接近全精度(Exact)分布。

圖片

實驗結果

作者將提出的量化方法分別應用在LLaVA和InternVL model上,測試了其在captioning,VQA,Video QA三個不同的任務上的性能。以captioning任務為例,下圖展示了本文所提出的方法在cococaption benchmark下和其他方法如KIVI,VLCache的對比。

在不同比特數(8,4,2,1)下,本文提出的方法在大部分測試指標上都優于其他兩種方法。例如對于llava-1.5-7b,本文的方法在8比特下達到最高的CIDEr 分數 1.105,與全精度持平,并在1比特下提升至1.109,超過了VLCache(1.053)。同樣地,對于InternVL-2.5-26B,本文的方法在4比特和2比特下分別取得了最高的CIDEr分數1.32和1.313,均優于VLCache和KIVI。

圖片

Runtime分析

為了展示本文提出的量化方法對解碼效率的影響,作者使用InternVL-2.5系列模型,將所提出的1比特量化方法與16比特基線進行了吞吐量評估(即每秒生成的token數)。作者考慮了兩種視覺token長度的情況:n=3328和8192。作者將GPU最大內存從5GB變化到30GB,并在每種內存限制下,尋找能夠容納的最大batch size,測量解碼階段的吞吐量。

如下圖展示,1比特量化方法在所有顯存預算下始終優于基線方法。例如,當n=3329且使用80億參數模型時,本文的方法在5GB顯存下實現了126.582tokens/s的吞吐量(基線為11.628tokens/s),在30GB下提升至459.016tokens/s(基線為40.816tokens/s)。這意味著相比基線,本文方法的吞吐量提升約為9.88×到11.24×,充分展示了該方法在受限顯存條件下顯著提升解碼速率。

圖片

總結

本文探討了多模態大語言模型中視覺KV cache的壓縮方法。簡單地將量化應用到極低比特數常常會引發分布偏移,導致模型性能下降。為了解決這一問題,本文提出了一種新穎的校準策略,作用于softmax之前的注意力分數,有效緩解了量化帶來的失真。此外,本文還引入了一種高效的通道維度后縮放技術以提高計算和存儲效率。

作者在InternVL和LLaVA模型系列上,針對COCO Caption、MMBench-Video和DocVQA等基準任務進行了實驗,結果驗證了所提出方法的有效性。作者利用Triton實現了本文所提出的方法,runtime分析表明本文提出的方法相較于全精度模型有大約10倍的吞吐量提升。

論文標題:CalibQuant:1-Bit KV Cache Quantization for Multimodal LLMs
論文地址:https://arxiv.org/abs/2502.14882
代碼地址:https://github.com/insuhan/calibquant

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-18 11:16:50

大模型性能KV-Cache

2024-11-12 10:20:00

模型數據

2025-06-30 08:42:00

模型訓練AI

2020-03-13 10:36:19

KV存儲性能

2011-07-01 10:11:39

2025-06-16 14:41:07

模型開源AI

2024-12-27 09:30:00

AI數據訓練

2014-03-26 10:00:06

RailsRails性能

2024-10-21 12:30:52

2024-11-11 09:00:00

2025-09-28 09:00:00

2020-03-26 12:38:15

代碼節點數據

2025-05-27 01:55:00

TypeScript開發者項目

2020-07-21 15:40:55

NginxJava服務器

2024-12-26 00:51:38

2025-09-23 12:48:36

AGI模型框架

2022-01-21 15:33:56

架構模型AI

2024-10-29 08:21:05

2009-06-30 19:12:16

云計算SOAIT

2025-08-19 09:12:00

AI模型訓練
點贊
收藏

51CTO技術棧公眾號

亚洲美女少妇撒尿| 蜜桃av一区二区| 国产视频亚洲视频| 国产精品视频黄色| а√天堂在线官网| 成人福利电影精品一区二区在线观看| 欧美亚洲国产另类| 亚洲成人生活片| 丝袜av一区| 91精品国产综合久久久蜜臀图片| 欧美 日韩 亚洲 一区| 99se视频在线观看| av电影一区二区| 国产精品偷伦免费视频观看的| 欧美日韩免费做爰视频| 免费看成人吃奶视频在线| 欧美丰满一区二区免费视频| 99精品视频在线看| 成人高清免费在线| 国产亚洲成年网址在线观看| 国产成人精品福利一区二区三区| 自拍偷拍色综合| 亚洲国产日本| 久久艳片www.17c.com | 欧美黑粗硬大| 精品久久久视频| 日本免费黄色小视频| 国产精品一区二区三区四区色| 丰满白嫩尤物一区二区| 国产欧美va欧美va香蕉在线| 精品免费囯产一区二区三区| 激情欧美亚洲| 欧美成人一区二区三区电影| 日韩av毛片在线观看| 国产精品自拍区| 亚洲国产精品久久91精品| 天天做天天干天天操| av免费在线一区| 日韩欧美主播在线| 国产美女主播在线播放| 在线观看男女av免费网址| 国产精品人成在线观看免费| 日本福利一区二区三区| 手机福利在线| 大美女一区二区三区| 亚洲综合在线中文字幕| 国产精品久久久久久免费| 日本在线不卡一区| 亚洲国产欧美一区二区三区丁香婷| 日韩不卡免费高清视频| www.黄色com| 日韩欧美精品一区二区| 精品亚洲aⅴ在线观看| 国产高清不卡一区| 97色成人综合网站| 麻豆成人免费视频| 免费一区二区三区四区| 日韩欧美主播在线| 一本大道熟女人妻中文字幕在线| 免费在线播放电影| 亚洲一区二区三区四区五区黄 | 人妻少妇精品无码专区| 成人高清视频免费观看| 精品欧美日韩在线| 国外av在线| 国产精品系列在线| 欧美日韩在线免费观看视频| 成人免费网站在线观看视频| 亚洲一线二线三线久久久| www.好吊操| 亚洲妇女成熟| 91福利在线播放| 国产免费又粗又猛又爽| 95精品视频| 精品国产一区二区三区忘忧草| 国产69视频在线观看| 奇米777国产一区国产二区| 亚洲区中文字幕| 激情无码人妻又粗又大| 中文精品电影| 午夜精品视频在线| 亚洲午夜在线播放| 激情成人综合网| 国产经典一区二区三区| 日本ー区在线视频| 日韩一区在线播放| 中文字幕无码精品亚洲资源网久久| 亚洲小少妇裸体bbw| 欧美日韩午夜精品| 动漫美女无遮挡免费| 婷婷综合电影| 久久久精品免费视频| 自拍偷拍欧美亚洲| 美女国产一区二区三区| 风间由美久久久| 国产黄在线看| 亚洲国产精品综合小说图片区| 无遮挡又爽又刺激的视频| 亚洲狼人在线| 日韩精品亚洲元码| 国产精品白丝喷水在线观看| 国产一区二区高清| 91久久久久久久一区二区| 午夜福利视频一区二区| 中文字幕一区二区三区色视频 | 日韩av一级大片| 中文在线免费| 91九色02白丝porn| 亚洲av无码专区在线播放中文| 精品国产美女| 国外成人免费在线播放| 国产一区二区波多野结衣 | 九一在线免费观看| 99xxxx成人网| 99re在线视频观看| 午夜免费视频在线国产| 狠狠干狠狠久久| 性色av浪潮av| 人人狠狠综合久久亚洲婷| 海角国产乱辈乱精品视频| 国产一区二区在线视频聊天 | 久久嫩草捆绑紧缚| 久久综合五月| 久久亚洲综合网| 国产羞羞视频在线播放| 91超碰这里只有精品国产| 中文字幕免费高清| 亚洲永久网站| 国外成人免费视频| √最新版天堂资源网在线| 欧美一卡二卡三卡| 任我爽在线视频| 日本不卡中文字幕| 日韩精品欧美在线| 欧美大片免费观看网址| 日韩乱码在线视频| 日韩xxxxxxxxx| 成人精品电影在线观看| 996这里只有精品| 国产精品亚洲一区二区在线观看 | 中国特黄一级片| 免费精品99久久国产综合精品| 欧美性大战久久久久| 亚洲最新无码中文字幕久久| 日韩黄在线观看| 欧美精品二区三区| www日韩大片| 男人揉女人奶房视频60分 | 成人在线视频www| 久久精品亚洲精品| 99热这里是精品| 亚洲精品乱码久久久久| 国产伦理在线观看| 国精品一区二区| 国产亚洲精品自在久久| av电影在线免费| 亚洲精品国产成人| 国产午夜在线播放| 久久亚洲一区二区三区四区| 成人黄色一区二区| 成人女性视频| 成人国产精品一区二区| 91麻豆免费在线视频| 日韩限制级电影在线观看| 精品无码一区二区三区电影桃花| 成人免费毛片aaaaa**| 欧美色图另类小说| 狠狠做六月爱婷婷综合aⅴ| 国产精品人成电影在线观看| 欧美69xxxx| 日韩欧美精品三级| 免费日韩一级片| 国产日韩欧美综合一区| 伊人网在线综合| 精品69视频一区二区三区| 在线天堂中文资源最新版| 1024日韩| 国产欧美在线一区二区| 日韩电影毛片| 在线观看日韩欧美| 亚洲综合视频在线播放| 亚洲精品网站在线观看| 91av在线免费| 蓝色福利精品导航| 国产视频在线观看网站| 校花撩起jk露出白色内裤国产精品| 日本久久亚洲电影| 久久黄色美女电影| 精品精品欲导航| 国产suv精品一区二区33| 亚洲视频图片小说| 精品夜夜澡人妻无码av| 精品亚洲成a人| 国产一级爱c视频| 日韩精品91| 含羞草久久爱69一区| 日本久久二区| 国产91精品久| 成人短视频在线观看| 亚洲欧美制服第一页| aa视频在线免费观看| 一本高清dvd不卡在线观看| 538精品在线视频| 久久久久九九视频| 97精品人人妻人人| 久久99精品国产.久久久久久| 精品久久久久久无码中文野结衣| 欧美日韩一区二区综合| 精品日韩美女| 永久免费精品视频| 成人午夜小视频| 成人私拍视频| 国内精品在线一区| 性欧美video高清bbw| 在线观看日韩av| 青青九九免费视频在线| 精品久久国产字幕高潮| 在线播放成人av| 日本国产一区二区| 国产污污视频在线观看| 一区二区三区视频在线观看| 男人的天堂官网| 91女厕偷拍女厕偷拍高清| 亚洲av午夜精品一区二区三区| 麻豆精品久久久| 美女喷白浆视频| 午夜亚洲性色福利视频| 久久国产精品视频在线观看| 欧美精品激情| 国产一区一区三区| 国产精品精品国产一区二区| 四虎影院一区二区三区| 一区二区美女| 久久久久久99| 台湾亚洲精品一区二区tv| 激情欧美一区二区三区中文字幕| 午夜久久av| 99re视频在线观看| 欧美日本三级| 96久久精品| 秋霞一区二区三区| 成人av免费看| 国产成人一二| 国产欧美一区二区三区另类精品| 福利电影一区| 国产日韩精品推荐| 久久综合社区| 女人一区二区三区| 深夜福利久久| 婷婷亚洲婷婷综合色香五月| 欧美日韩激情在线一区二区三区| 色99中文字幕| 五月天综合网站| 97精品国产97久久久久久粉红| 一区二区三区在线观看免费| 91精品国产毛片武则天| 国产精品mm| 男人的天堂狠狠干| 免费在线亚洲| 九色porny自拍| 国内一区二区视频| 欧美图片自拍偷拍| 91免费国产在线观看| 欧美黄色一级生活片| 国产精品大尺度| 欧美成人三级视频| 欧美日韩另类字幕中文| 国产亚洲欧美日韩高清| 欧美乱妇20p| 国产精品伦一区二区三区| 日韩欧美在线1卡| 色欲av永久无码精品无码蜜桃 | 亚洲国产精品久久艾草纯爱 | 国产在线观看a视频| 精品自在线视频| 蜜桃av在线播放| 国产精品视频成人| 中文字幕一区二区三区四区久久| 国产日韩在线一区二区三区| 久久av资源| 桥本有菜av在线| 野花国产精品入口| 亚洲免费黄色网| 懂色av中文一区二区三区| 风间由美一二三区av片| 亚洲欧洲美洲综合色网| 日韩乱码在线观看| 欧美日韩精品电影| 欧美视频久久久| 色偷偷888欧美精品久久久| 欧美xxx黑人xxx水蜜桃| 国产精国产精品| 97久久综合精品久久久综合| 日韩欧美亚洲在线| 黄色工厂这里只有精品| mm1313亚洲国产精品无码试看| 国产精品一二二区| 永久免费毛片在线观看| 亚洲成人在线观看视频| 中文字幕a级片| 亚洲电影在线观看| yellow91字幕网在线| 日韩**中文字幕毛片| 另类视频一区二区三区| 日韩av大全| 亚洲少妇一区| 日本人dh亚洲人ⅹxx| 欧美激情一二三区| 粉嫩aⅴ一区二区三区| 欧美一卡二卡三卡| 9191在线观看| 日产精品99久久久久久| 久久97精品| 欧美日韩中文字幕在线播放| 男女男精品网站| 国产sm调教视频| 香蕉成人啪国产精品视频综合网| 国产又粗又猛又爽又黄视频| 亚洲欧美www| 超碰高清在线| 99re资源| 欧美国内亚洲| 五月天丁香花婷婷| 国产精品理论片| 无码人妻aⅴ一区二区三区有奶水| 亚洲成色999久久网站| 欧美xxxx少妇| 91免费观看| 91不卡在线观看| 999在线精品视频| 国产精品理论片| 亚洲一级在线播放| 中文字幕一区二区三区电影| 亚洲成av在线| 日韩精品av一区二区三区| 久久国产免费| 强伦人妻一区二区三区| 欧美天天综合色影久久精品| 午夜激情小视频| 欧美有码在线观看视频| 欧美黑人巨大videos精品| 久久国产精品视频在线观看| 成人av在线资源网| 日产欧产va高清| 亚洲精品乱码久久久久久按摩观| 超碰成人av| 久久久久久久久四区三区| 久久国产88| 国产肥白大熟妇bbbb视频| 欧美性猛交xxxx黑人交| 91精品大全| 91久久在线播放| 欧美久久影院| 日韩少妇一区二区| 黑人精品xxx一区一二区| 精品亚洲综合| 国产精品在线看| 亚洲成人最新网站| 麻豆免费在线观看视频| 香蕉av福利精品导航| 欧美男男同志| 国产精品视频免费在线观看| 香蕉精品视频在线观看| 国产男女无遮挡猛进猛出| 亚洲午夜免费视频| 天天干天天色天天| 国产福利成人在线| 99国产精品免费视频观看| 亚欧精品在线视频| 午夜国产精品一区| sese一区| 97碰碰视频| 欧美中文日韩| 午夜国产福利视频| 欧美不卡一区二区三区四区| 黄毛片在线观看| 亚洲图片欧洲图片日韩av| 国产成人精品亚洲日本在线桃色| 日韩三级小视频| 日韩一区二区欧美| 91成人午夜| 看欧美ab黄色大片视频免费| 亚洲免费av在线| 日本福利片高清在线观看| 91精品视频在线| 一区二区三区国产盗摄| 免费一级suv好看的国产网站| 日韩精品在线一区| 欧美精品高清| 日韩精品一区二区免费| 国产欧美日韩精品一区| 亚洲国产精品二区| 国产精品羞羞答答| 精品成人在线| 四季av中文字幕| 精品视频偷偷看在线观看| 国产高清视频一区二区| 久久久久人妻精品一区三寸| 亚洲免费观看高清完整版在线观看 | 国产成人免费xxxxxxxx|