精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

50s完成7B模型量化,4bit達到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

人工智能 新聞
DuQuant通過兩種正交變換,利用activation激活值的先驗知識達到了比QuaRot中Hadamard旋轉更好的量化效果。

消除激活值(outliers),大語言模型低比特量化有新招了——

自動化所、清華、港城大團隊最近有一篇論文入選了NeurIPS 2024(Oral Presentation),他們針對LLM權重激活量化提出了兩種正交變換,有效降低了outliers現象,達到了4-bit的新SOTA。

圖片

簡單理解,在大語言模型(LLM)中,有一些中間層輸出的數值(激活值 Activation)會變得非常大,它們被稱為“outliers(離群值)”,這些 outliers給模型量化帶來了挑戰。

補充一下,量化可以將模型中的數值從浮點數轉換為整數,以減少模型的大小和計算需求。

而一旦在量化過程中存在大量outliers,會導致量化后的模型性能下降。

明白了這層道理, 我們再來看他們團隊的一項名為DuQuant的新研究。

首先, 他們發現在LLM的前饋網絡 (FFN) 模塊中的down_proj層, 存在明顯的Massive Outliers(非常大的激活值)。

這種outliers不同于以往發現的Normal Outliers,表現為大于絕對值幾百的異常值并局限于個別的tokens中——

它們導致現有的量化算法(如SmoothQuant和OmniQuant)在將模型的權重和激活值量化為4位二進制數時表現不佳。

對此,團隊提出了一種新的量化方法,叫做DuQuant

DuQuant通過學習旋轉和置換變換矩陣,在Activation矩陣內部將outliers轉移到其他通道,最終得到平滑的激活矩陣,從而大幅降低了量化難度。

實驗顯示,使用DuQuant方法,在4位權重和激活量化的設置下,模型達到了SOTA

同時,DuQuant的訓練非常快速,可以在50s內完成7B模型的量化過程,即插即用

背景

在每個Transformer塊的常見模塊中,多頭自注意力(MSA)和前饋網絡(FFN)基本上都由線性層組成,將其表示為:

圖片

其中圖片是激活輸入,圖片表示權重矩陣。

模型量化通過將浮點數(FP16, BF16)表示的模型權重或激活值轉換為低位的浮點數或整數來減少內存占用,權重激活量化可以通過使用低比特乘法的算子進一步加快模型推理的速度。

該工作重點關注低比特整型量化,目標是獲得更好的硬件支持。

具體來說, ??位量化過程將FP16張量??映射為低位整數???? :

圖片

符號? · ?表示最接近的舍入操作, ?是量化步長, ??表示零點。

遵循主流量化方法,作者對激活??采用逐token量化,對權重??采用逐通道量化,這意味著為??的每個token分配不同的步長( ??? ? ???x1),為??的每個輸出通道分配不同的步長圖片

動機(Motivation)

據作者介紹,他們首次在實驗中發現,LLM FFN模塊中的down_proj layer存在明顯的Massive Outliers(非常大的激活值),表現為絕對值大于幾百的異常值并局限于個別的token中。

PS:先前工作發現Massive Outliers存在于每個transformer block的輸出中,DuQuant的作者進一步將其定位在FFN模塊中。

圖片論文:https://link.zhihu.com/?target=https%3A//eric-mingjie.github.io/massive-activations/index.html

這些Massive Outliers造成SmoothQuant和OmniQuant等算法在4bit WA量化中表現較差。

圖片△圖1:Massive outliers顯著加大了低比特權重激活量化的難度

圖1(a)(b)對比了普遍常見的Normal Outliers,和在FFN中出現的Massive Outliers

SmoothQuant通過將激活值除以每通道平滑因子并將其乘回權重矩陣,嘗試將量化難度從激活值轉移到權重。

具體來說,SmoothQuant使用逐通道的平滑對角矩陣,記為?? ,將原始線性層重新表達為:??=?? · ??=(?? ·??)(??-1 · ??),對角矩陣??中的元素???? 的計算方式為:

圖片

其中α是一個超參數,表示遷移強度。

然而,作者觀察到在輸入端進行這種轉移可能會導致權重矩陣也出現明顯的難以量化的outliers(如圖1(d)所示),這一問題的根源在于Massive Outliers使平滑因子???? 變得異常大。

此外,極大的outliers還可能導致基于優化的方法出現梯度爆炸的問題,所以基于梯度優化的OmniQuant和AffineQuant等工作會直接跳過down_proj layer,直接退化為SmoothQuant的處理方式。

這些preliminary experiments都表明需要一種更新更好的方式處理兩種outliers,特別是平滑掉down_proj輸入側的Massive Outliers

方法

DuQuant提出通過學習旋轉和置換變換矩陣,在Activation矩陣內部將outliers轉移到其他通道,最終得到平滑的激活矩陣,從而大幅度降低了量化難度。

(a) 逐步展示了DuQuant算法對Normal outlier的處理過程,(b) DuQuant顯著降低了Massive outlier,(c)一個Tony Example說明DuQuant有效降低了激活矩陣的量化難度。

圖片△圖2:DuQuant算法說明

簡單來說,DuQuant算法包含三個步驟:

1)旋轉矩陣的構造有效利用了特定outlier channel的位置索引,作者使用了分塊對角的旋轉矩陣,在每個block內部通過貪心算法將outlier平攤到其他的channels中。

2)由于block size的限制,可能導致某些block在旋轉之后組內的平均值大于其他blocks,因此作者進一步使用通道置換技術重新分配activation channel,使用zigzag順序排列使各組均值的方差大幅減小。

3) 進一步執行一次旋轉變換達到更均勻的activation分布,從而大幅降低了量化難度。

旋轉矩陣:作者希望應用旋轉矩陣??進行行或列變換,減輕Normal Outliers和Massive Outliers的影響。

由于Massive Outliers通常隨機分布在激活空間中,直接找到能夠通過單次旋轉變換減輕outliers的最優旋轉矩陣??是具有挑戰性的。

為了解決這一問題,作者采用帶有先驗知識的貪心搜索方法來計算旋轉矩陣圖片,從而近似理想的旋轉矩陣??。

具體來說,圖片的計算包括以下步驟:

1、識別outliers主要集中的特征維度 ,即:圖片,其中, ??????表示??中第??行和第??列的元素。

2、基于搜索到的維度,構建旋轉矩陣如下:

圖片

圖片是用于交換激活值的第1列和第d(1) 列的交換矩陣,表示一個正交初始化的旋轉矩陣,其第一行均勻分布。

這樣做的目的是通過圖片變換后減輕第1列中的outliers。

為了進一步增加隨機性,保留減輕outliers后的第1列,并通過與隨機正交矩陣??相乘,隨機旋轉其他列。

3、設N為貪心搜索的步數,則近似的旋轉矩陣圖片,其中圖片。每個???? 根據公式(2)和識別到的特征維度d(??) 構建。

通過這種構建方式,可以確保近似的最優旋轉矩陣圖片能夠有效減輕具有較大幅度的outliers,而不僅僅是使用隨機選擇的正交旋轉矩陣。

然而,直接構建整個旋轉矩陣非常耗時,并且會導致大量的內存開銷。

為了實現快速矩陣乘法,參考Training Transformer with 4ibts ,作者選擇以分塊的方式近似旋轉矩陣圖片

圖片

其中,圖片表示第??個塊的方陣,該矩陣按照上述三步構建。塊的數量K通過K=C??n/2n計算得出。

通道置換矩陣:盡管采用了塊對角旋轉矩陣圖片來提高時間和存儲效率,但其專注于局部信息的特性帶來了進一步減少outliers的潛在限制。

由于在每個小塊內進行的旋轉變換無法整合跨不同塊的信息,一個塊中可能有相對較大的outliers,而另一個塊中則有較小的outliers,導致不同塊之間存在較高的方差。

因此,作者提出利用通道置換矩陣平衡不同blocks之間outliers的幅度。

具體來說,在每個小塊中,將維度d??中最大的outlier記為O??

同時, Mb??表示第??個塊中所有O??的平均值,其中??=1,2,……,K ,各個塊之間激活幅度的方差可以表示為:

圖片

作者引入了之字形置換矩陣P 。

具體來說,通過生成一個之字形序列,首先將激活值最高的通道分配給第一個塊,接著,將激活值次高的通道按遞減順序分配到后續的塊,直到第K個塊。

在到達最后一個塊后,順序反轉,從下一個激活值最高的通道開始,按遞增順序分配。

這個往復模式貫穿所有塊,確保沒有單個塊持續接收最高或最低激活值的通道。

通過使用之字形置換,DuQuant實現了不同塊之間outliers的均衡分布,從而能夠使用額外的旋轉變換進一步平滑outliers,如圖2所示。

需要注意的是

1、通道置換其實是非常重要的一步,也很簡單快速(對于推理效率的影響很小,可見后面實驗部分),既可以避免像SpinQuant那樣復雜的訓練流程,也比QuaRot的Hadamard旋轉性能表現更好。

2、旋轉矩陣和置換變換矩陣都是正交矩陣,保證了????輸出的不變性,作者還通過嚴謹的理論推導了證明了兩種變換有效降低了量化誤差,具體證明可以閱讀Paper里面的Appendix。

實驗

在4-bit setting下達到了SOTA的效果,DuQuant驗證了LLaMA、Vicuna、Mistral系列模型,在PPL、QA、MMLU和MT-Bench等任務上都明顯提升了量化模型的性能。

此外作者還在LongBench評測了量化模型長文本生成的能力,DuQuant同樣大幅超過了baselines。

圖片△DuQuant在LLaMA3-8B的低比特量化中顯著超過了基線方法

上面是DuQuant在LLaMA3模型的量化效果,更多的模型和task上的表現可以參見論文。

硬件測速也證明了DuQuant在pre-filing階段可以達到2.08倍的加速比,在decoding階段有效降低了3.50倍內存開銷。

圖片

同時如右圖所示,DuQuant相比INT4推理帶來額外的10%左右速度開銷,微高于QuaRot,但帶來更多性能提升。

圖片

此外,DuQuant與使用Hadamard旋轉矩陣的QuaRot主要有以下兩點不同

1、DuQuant構造的旋轉矩陣利用了先驗知識(具體的outlier channel索引),因此它可以比QuaRot更好地平滑激活空間,如下圖展示了DuQuant單次旋轉和Hadamard旋轉對LLaMA2-7B Attention Key_proj輸入的變換效果。

2、QuaRot依賴于耗時的GPTQ算法來提升性能,而作者引入的通道置換矩陣可以幫助DuQuant在極短時間內進一步平衡outliers的分布,兩種正交變換可以同時平滑權重矩陣的空間,降低權重矩陣的量化難度,從而取得更好效果。

圖片
小結一下,DuQuant通過兩種正交變換,利用activation激活值的先驗知識達到了比QuaRot中Hadamard旋轉更好的量化效果。

該工作獲得了審稿人一致的高度評價,并最終被選為Oral Presentation,錄取率0.4%。

更多細節歡迎查閱原論文。

項目主頁:https://duquant.github.io/
論文:https://arxiv.org/abs/2406.01721
代碼:https://github.com/Hsu1023/DuQuant

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-04-02 09:17:50

AI數據開源

2025-06-03 08:49:00

2023-04-10 10:32:00

模型排序

2024-11-11 11:05:00

大語言模型系統

2024-05-09 08:33:33

2025-04-30 09:16:00

2024-06-03 10:43:34

2025-01-17 09:20:00

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2025-05-26 09:41:26

2025-04-16 02:30:00

2023-11-17 14:37:56

2024-03-25 08:00:00

2024-11-29 14:00:00

模型訓練

2025-04-23 12:11:40

2024-08-19 02:35:00

模型量化深度學習

2025-08-01 14:32:35

AI模型訓練

2024-06-04 14:09:00

2025-07-21 09:07:00

模型訓練視頻

2024-06-11 14:30:18

點贊
收藏

51CTO技術棧公眾號

性欧美18—19sex性高清| 久久视频免费在线| 中文字幕欧美色图| 欧美日韩岛国| 精品在线观看国产| 一区二区三区 欧美| 污污网站在线观看| 久久午夜羞羞影院免费观看| 成人综合网网址| www.国产com| 中文字幕一区二区av | 成人在线观看a| 久久精品视频免费看| hitomi一区二区三区精品| 国产精品视频一区二区三区四| 欧美三根一起进三p| 欧美精品色图| 亚洲精品成人久久电影| 日韩成人av免费| 亚洲精品一级二级| 亚洲第一主播视频| 无码人妻aⅴ一区二区三区日本| 神马久久高清| 国产91丝袜在线播放0| 国产欧美日韩最新| 免费黄色片视频| 91久久夜色精品国产九色| 久久精品91久久久久久再现| 欧美另类z0zx974| 日韩成人一级| 精品国产亚洲一区二区三区在线观看 | 污污污www精品国产网站| 9999精品视频| 欧美日韩免费不卡视频一区二区三区 | 亚洲理论在线| 欧美激情视频给我| 国产a免费视频| 五月精品视频| 色老头一区二区三区在线观看| 色欲av无码一区二区三区| 国产成人高清精品免费5388| 欧美一级理论片| 午夜激情影院在线观看| 国产精品无码久久久久| 在线观看成人小视频| 熟女少妇精品一区二区| 中国字幕a在线看韩国电影| 亚洲aⅴ怡春院| 青青草国产精品视频| 超碰97免费在线| 亚洲成av人综合在线观看| 日韩精品一区在线视频| 牛牛精品在线| 午夜精品福利久久久| 亚洲美免无码中文字幕在线| 999av小视频在线| 性做久久久久久免费观看欧美| 日韩欧美精品免费| av美女在线观看| 亚洲高清三级视频| 国产精品沙发午睡系列| 中文字幕在线官网| 欧美亚洲综合色| 日日噜噜夜夜狠狠| 精品一区二区三区免费看| 日韩一级片在线观看| 国产亚洲精品成人a| av自拍一区| 日韩乱码在线视频| 人与嘼交av免费| 久久精品青草| 久久欧美在线电影| 日韩中文字幕在线观看视频| 日本aⅴ免费视频一区二区三区| 国产欧美一区二区三区久久人妖 | 国产成人免费av在线| 国产亚洲第一区| 免费播放片a高清在线观看| 中文字幕精品一区二区三区精品| 中文字幕一区二区三区5566| 免费在线播放电影| 欧美午夜片在线免费观看| 天堂在线资源视频| 电影一区二区三区久久免费观看| 精品精品国产高清a毛片牛牛 | 欧美一区二区三区红桃小说| 国产一区二区三区在线观看网站 | 午夜激情一区二区| 久久久久久久片| 国产一区二区视频在线看| 亚洲福利视频久久| 国产免费嫩草影院| 精品二区视频| 国产日韩av高清| 欧性猛交ⅹxxx乱大交| 国产区在线观看成人精品| www.-级毛片线天内射视视| 日本在线啊啊| 日韩亚洲电影在线| 国产精品免费无码| 亚洲成人在线| 91精品在线观| 可以在线观看的黄色| 亚洲欧美另类在线| 亚洲乱码国产一区三区| 91精品日本| 色阁综合伊人av| 日日夜夜综合网| 国产乱码一区二区三区| 欧美一区少妇| 成入视频在线观看| 日韩视频一区二区三区在线播放| 日韩精品无码一区二区三区久久久| 激情欧美日韩一区| 91精品啪aⅴ在线观看国产| 欧美精品a∨在线观看不卡| 亚洲一区二区精品久久av| 精品综合久久久久| 精品久久影视| 日本精品在线视频| 丝袜视频国产在线播放| 一区二区三区在线观看国产 | 欧美精品韩国精品| 高清国产午夜精品久久久久久| 亚洲视频精品一区| 欧美与亚洲与日本直播| 亚洲毛片在线免费观看| 国产精品99re| 国产91丝袜在线播放九色| 中文字幕超清在线免费观看| 欧美日韩国产网站| 国产亚洲精品久久久久久| 日韩 欧美 中文| 成人福利电影精品一区二区在线观看| 在线观看成人免费| 91国产一区| 久久综合伊人77777蜜臀| 中文字幕在线观看第二页| 国产午夜精品一区二区| 无码人妻h动漫| 欧美三级电影在线| 欧美在线视频在线播放完整版免费观看| 精品人妻少妇嫩草av无码专区 | 免费观看成人毛片| 99re成人精品视频| 激情伊人五月天| 亚洲v天堂v手机在线| 2019av中文字幕| 无码精品一区二区三区在线| 亚洲福利视频导航| 男人的天堂影院| 亚洲区国产区| 久久久精品国产一区二区三区| 女人高潮被爽到呻吟在线观看| 亚洲国产91色在线| 91玉足脚交嫩脚丫在线播放| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 亚洲免费观看| 欧美日韩一区二| www.成人在线视频| 日日狠狠久久偷偷四色综合免费 | 成人mm视频在线观看| 在线观看视频99| 国产又大又黑又粗| 亚洲永久免费av| 玖草视频在线观看| 天堂久久久久va久久久久| 亚洲国产成人不卡| 国产在线视频欧美一区| 欧美极品少妇xxxxⅹ喷水| 亚洲欧洲视频在线观看| 91黄色免费网站| 国产真实乱在线更新| 国产不卡在线一区| 久久综合九色综合88i| 国产成人一区| 91传媒视频免费| 美女视频在线免费| 中文精品99久久国产香蕉| av老司机久久| 色综合久久中文综合久久牛| 国产一二三四视频| 国产成人h网站| 国产熟女高潮视频| 亚洲精品午夜av福利久久蜜桃| 国产精品一区二区三区四区五区 | 制服丨自拍丨欧美丨动漫丨| 国产精品系列在线观看| 日韩精品视频一区二区在线观看| 操欧美老女人| 7777精品久久久大香线蕉| 朝桐光av在线| 久久久久久久久久久黄色| 午夜一区二区视频| 亚洲在线日韩| 男人j进女人j| 成人系列视频| 国产私拍一区| 精品国产一级| 国产精欧美一区二区三区| 香蕉成人app免费看片| 国产亚洲一区精品| 少妇荡乳情欲办公室456视频| 欧美色男人天堂| 成人精品免费在线观看| 亚洲另类在线一区| 日本理论中文字幕| 91天堂素人约啪| 亚洲av无一区二区三区久久| 日韩电影免费在线| 国产乱子伦农村叉叉叉| 欧美国产另类| 亚洲免费视频一区| 亚洲三级网址| 国产综合第一页| 国产一区二区三区免费观看在线| 国产成人97精品免费看片| gogo久久| 九色精品免费永久在线| 日本在线观看视频| 亚洲性av网站| 欧洲视频在线免费观看| 精品99一区二区| 精品国产亚洲av麻豆| 欧美浪妇xxxx高跟鞋交| 中文字幕 自拍偷拍| 色综合欧美在线| 久久99精品波多结衣一区| 亚洲午夜精品一区二区三区他趣| www.xxxx日本| 亚洲欧美乱综合| 黄色录像二级片| 亚洲丝袜自拍清纯另类| 中文字幕黄色网址| 欧美国产国产综合| 免费视频91蜜桃| 久久精品一区二区三区av| 亚洲久久久久久| 99re在线精品| 亚洲啪av永久无码精品放毛片| 国产成人在线视频免费播放| 黑人无套内谢中国美女| 国产精品综合一区二区| 亚洲热在线视频| 国产精品香蕉一区二区三区| 午夜性福利视频| 成人美女视频在线看| www.四虎在线| 91小视频免费观看| 国产一二三四五区| 亚洲国产精品黑人久久久| 亚洲毛片亚洲毛片亚洲毛片| 欧美激情一区二区三区不卡| 俄罗斯毛片基地| 国产精品成人在线观看| 四虎永久免费在线| 亚洲午夜免费电影| 中文字幕一区在线播放| 色国产精品一区在线观看| 亚洲精品国产无码| 欧美日本视频在线| 国产高潮流白浆喷水视频| 精品久久国产字幕高潮| 每日更新在线观看av| 在线视频欧美日韩| caoporm免费视频在线| 久久久这里只有精品视频| 周于希免费高清在线观看| 国产精品流白浆视频| 欧美专区一区| 久久精品美女| 999视频精品| 国产欧美日韩小视频| 性欧美长视频| 亚洲美女性囗交| 成人av在线一区二区| 中文字幕第20页| 亚洲欧洲av一区二区三区久久| 久久97人妻无码一区二区三区| 福利精品视频在线| 亚洲系列在线观看| 精品剧情在线观看| 成人精品一区二区三区校园激情| 久久精品中文字幕| 国产精品一区二区日韩| 国产精品福利在线| 大奶一区二区三区| 日韩欧美国产二区| 亚洲天堂男人| mm131亚洲精品| 99riav久久精品riav| 精品视频第一页| 精品久久在线播放| 99国产在线播放| 亚洲午夜精品视频| 国内老司机av在线| 成人黄色中文字幕| 在线看成人短视频| 在线观看成人免费| 奇米777欧美一区二区| 超碰caoprom| 亚洲天堂成人在线观看| 区一区二在线观看| 精品国产乱码久久久久久免费 | 色偷偷88888欧美精品久久久| 1234区中文字幕在线观看| 国产欧美日韩中文字幕| 亚洲视频分类| 青青青青草视频| 国产一区二区三区黄视频 | 久久国产精品亚洲人一区二区三区| 欧美视频在线第一页| 精品一区二区在线看| 亚洲精品午夜视频| 亚洲成av人片在线| 99在线观看精品视频| 日韩在线视频中文字幕| 日韩电影大全网站| 精品免费国产| 激情综合网址| 日本女人性视频| 国产精品成人免费在线| 在线观看国产区| 日韩国产精品一区| 爱啪视频在线观看视频免费| 亚洲一区二区三区四区视频| 成人影院天天5g天天爽无毒影院| 国产二区视频在线播放| gogo大胆日本视频一区| 国产午夜视频在线| 日韩欧美国产成人一区二区| 国产黄色在线观看| 成人亚洲欧美一区二区三区| 日韩av有码| 五月婷婷六月合| 欧美国产一区二区在线观看| 老熟妇一区二区三区| 亚洲男人av电影| 日本成人三级电影| 欧美婷婷久久| 日韩国产高清在线| 18啪啪污污免费网站| 欧美日韩在线播放| 天天在线视频色| 91久久国产精品| 欧美国产日本| 天天躁日日躁狠狠躁av麻豆男男| 一区二区国产视频| 男人天堂一区二区| 97超级碰碰碰| 色综合综合网| 欧美一级特黄a| 亚洲欧美日韩在线不卡| www.五月婷| 97色在线观看| 蜜桃tv一区二区三区| 99视频精品免费| 亚洲欧洲精品天堂一级| 国产aⅴ一区二区三区| 欧美国产视频一区二区| 精品久久97| 熟妇人妻va精品中文字幕| 国产精品亲子伦对白| 国产福利免费视频| 欧美亚洲日本网站| 日韩精品久久| 少妇丰满尤物大尺度写真| 午夜精品视频一区| 韩国免费在线视频| 91在线网站视频| 亚洲欧洲一级| 国产精品www爽爽爽| 欧美一区二区三区啪啪| 超碰激情在线| 亚洲激情一区二区三区| 国产精品一二二区| 丁香六月婷婷综合| 日韩有码在线播放| 国产美女撒尿一区二区| 久久久精品三级| 一区二区三区在线免费观看| 青春有你2免费观看完整版在线播放高清 | 日韩欧美中文字幕一区二区| 亚洲人成网站色ww在线| 日韩三级网址| 福利在线一区二区三区| 亚洲国产乱码最新视频 | 69精品小视频| 91精品国产自产在线观看永久∴ | 日韩高清影视在线观看| www.99r| 精品色蜜蜜精品视频在线观看| 日本在线观看| 欧美精品一区二区三区四区五区| 韩国三级中文字幕hd久久精品| 日韩污视频在线观看| 久久久99久久精品女同性| 九九热精品视频在线观看| 不许穿内裤随时挨c调教h苏绵| 在线一区二区观看|