精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

基于重排序的新量化方法RPTQ:實現(xiàn)大型語言模型的 3 比特量化

人工智能 新聞
作者提出了一種新穎的基于重排序的量化方法 RPTQ,解決了量化大型語言模型激活的問題。

大型語言模型(LLMs)在各種任務(wù)上表現(xiàn)出色,但由于其龐大的模型規(guī)模,部署方面存在挑戰(zhàn)。

在這篇論文中,來自后摩智能、騰訊 AI Lab、華中科技大學(xué)、北京大學(xué)、伊利諾伊理工學(xué)院的研究人員發(fā)現(xiàn)量化大型語言模型的主要挑戰(zhàn)來自于通道之間不同的激活范圍,而不僅僅是離群值問題。

作者提出了一種新穎的基于重排序的量化方法 RPTQ,解決了量化大型語言模型激活的問題。RPTQ 通過重新排列激活中的通道,然后將它們分簇進(jìn)行量化,從而降低通道范圍差異的影響。

此外,作者通過避免顯式重新排序來減少存儲和計算開銷。該工作首次將 LLM 模型的激活量化推向 3 比特。激活值的 3 比特量化同時也能與權(quán)重的 3 比特量化共同使用,大幅度降低了大型欲言模型的開銷。

圖片

論文地址:https://arxiv.org/abs/2304.01089

開源地址:https://github.com/hahnyuan/RPTQ4LLM

大規(guī)模語言模型(LLMs)在各種任務(wù)中展現(xiàn)出了卓越的性能,但由于它們的巨大模型大小,它們的部署面臨著挑戰(zhàn)。例如一個 66B 模型包含 660 億個參數(shù),需要大量內(nèi)存進(jìn)行存儲。另外隨著序列長度和批處理大小的增加,內(nèi)存消耗問題變得更加嚴(yán)重,因為激活也需要消耗大量的內(nèi)存,例如 Self-attention 中的鍵和值緩存(Key/Value Cache)。然而,單個 GPU 或服務(wù)器并沒有足夠的內(nèi)存容量來存儲如此龐大的模型權(quán)重和中間激活。因此,LLM 需要被分割成多個塊并存儲在不同的設(shè)備中。由于權(quán)重和激活存儲在不同的設(shè)備上,在計算過程中需要在這些設(shè)備之間傳輸數(shù)據(jù),導(dǎo)致顯著的帶寬和能量消耗。

為了克服 LLMs 在模型規(guī)模上的挑戰(zhàn),模型量化已成為一種有前途的方法。該技術(shù)涉及使用低位整數(shù)對 LLMs 的權(quán)重和激活進(jìn)行量化,從而顯著降低存儲和運(yùn)行這些模型的成本。具體而言,量化有助于減少保存張量的內(nèi)存要求,并加速計算密集型操作,例如矩陣乘法和線性層。通過量化權(quán)重和激活,減少了存儲和通信開銷,提高了效率和推理速度。

圖片

圖 1 不同通道的數(shù)值分布情況。每個點(diǎn)都代表一個激活通道中的 (最大值,最小值)。

最近,GPTQ 使用 PTQ 成功地將 LLMs 的權(quán)重量化為 4 bit 或 3 bit。然而,對 LLMs 中的激活進(jìn)行量化仍然是一項具有挑戰(zhàn)性的任務(wù)。

從圖 1 中可以得出兩個觀察結(jié)果:

1)一些通道具有顯著的異常值,其最大或最小值比其他通道大幾百倍。以前的研究也已經(jīng)發(fā)現(xiàn)了這個問題并針對異常值提出了特殊處理。

2)不同的通道在數(shù)值范圍上有顯著差異。使用相同的量化參數(shù)來量化不同的通道可能會導(dǎo)致顯著的量化誤差。即使兩個通道具有相同的異常值絕對值,它們在數(shù)值范圍上也可能存在很大的變化。

將整個張量使用相同的量化參數(shù)進(jìn)行量化的每張量量化技術(shù)可能不太有效。原因是將量化范圍設(shè)置為覆蓋大范圍的數(shù)值范圍可能導(dǎo)致數(shù)值較小的通道產(chǎn)生較大的量化誤差,而將其設(shè)置為覆蓋小范圍的數(shù)值范圍可能導(dǎo)致對異常值的顯著截斷,并導(dǎo)致顯著的量化誤差。例如,一個通道可能具有 - 100 到 - 50 的值范圍,而另一個通道可能具有 80 到 100 的值范圍。試圖通過將范圍從 - 100 到 100 量化來覆蓋它們的范圍將導(dǎo)致兩個通道產(chǎn)生顯著的量化誤差。這是以前的研究中尚未有效解決的一個挑戰(zhàn)。

圖片

圖 2 解決激活量化問題的不同方法對比。

為了解決激活中通道差異的問題,作者提出了一種新穎的基于重新排序的訓(xùn)練后量化方法 RPTQ。

如圖 2 所示,該方法將數(shù)值范圍相似的通道聚類在一起,然后對每個聚類中的值使用相同的量化參數(shù)進(jìn)行量化。為了實施基于重排序的量化方法,作者首先使用校準(zhǔn)數(shù)據(jù)集作為推理輸入,從中導(dǎo)出每個激活通道的最大值和最小值。

接下來,他們采用 KMeans 算法將不同通道劃分為 g 個簇,基于每個通道的最大值和最小值形成的點(diǎn)。一旦建立了簇,他們就進(jìn)行通道重排序,將來自同一簇的通道放置在相近的位置。這樣,具有類似最大值和最小值的通道被組合在一起,并共享一組通用的量化參數(shù)。在重排序過程之后,作者對每個簇內(nèi)的激活進(jìn)行量化。這種方法為每個簇單獨(dú)計算量化參數(shù)(縮放因子 s 和零點(diǎn) z),確保這些參數(shù)專門針對相應(yīng)的通道。

最終,該方法確保了每個簇的量化都得到優(yōu)化,減少了量化誤差。

圖片

圖 3:一重排權(quán)重和激活的量化 Transformer 層的推斷過程失意圖。重排索引用符號 R1 到 R5 表示。

顯式重排是一種運(yùn)行時重新排列激活中通道的操作,需要將不同通道的數(shù)據(jù)從一個內(nèi)存位置物理移動到另一個位置,因此對于具有大量通道的大型模型,重排過程可能非常耗時。此外,存儲源和目標(biāo)激活張量會增加內(nèi)存開銷。因此,作者提出了避免顯式重新排序的策略,從而降低了計算開銷,提高了推理效率。

如圖 3 所示,作者重新排序線性層的權(quán)重,使它們能夠直接按照排序順序產(chǎn)生激活。此外,作者修改了 LayerNorm 的方法,使其能夠直接產(chǎn)生重新排序的激活,從而省去了在推理過程中進(jìn)行顯式通道調(diào)整。

圖片

作者在三種不同的位寬配置下評估了 OPT 的性能:W4A16、W4A8 和 W4A4。此外,作者還開發(fā)了一種新的量化方案,W4A4KV、W4A3KV 和 W3A3KV,只對主要內(nèi)存的消耗 —— 鍵緩存和值緩存(Key/Value Cache)進(jìn)行量化。根據(jù)表格,可以得出以下觀察結(jié)果:一般而言,隨著激活量化位寬的減少,模型的性能會下降。但在大多數(shù)情況下,這種退化并不顯著。對于某些任務(wù),性能下降不到 1%,甚至有所提高。

圖片

LLM 的內(nèi)存開銷來自三個方面:首先,設(shè)備內(nèi)存中權(quán)重的存儲,可以通過量化來顯著減少。其次,在網(wǎng)絡(luò)執(zhí)行期間生成的臨時激活需要分配設(shè)備內(nèi)存。這些臨時激活可以在使用后釋放,因此不會對整體內(nèi)存使用造成顯著影響。最后,鍵和值緩存(Key/Value Cache)對預(yù)測后續(xù)單詞是必要的。當(dāng)批次大小和序列長度很大時,鍵和值緩存占用了大部分內(nèi)存。

表中展示了不同設(shè)置下的內(nèi)存使用情況,可以發(fā)現(xiàn)較低比特的激活可以顯著減少內(nèi)存使用,特別是在批次大小和序列長度較大的情況下。具體而言,當(dāng)批次大小為 64,序列長度為 8192 時,OPT-66b 下的 W4A4 配置相比 W4A16 配置節(jié)省了超過 900GB 的內(nèi)存。因此,采用 RPTQ 對激活量化可以極大地減少在長文本任務(wù)或大批量場景中的內(nèi)存壓力。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-08-05 14:36:17

大型語言模型量化

2025-03-27 02:44:00

2023-11-17 14:37:56

2025-04-16 02:30:00

2024-08-19 02:35:00

模型量化深度學(xué)習(xí)

2024-09-13 16:47:06

模型量化AI

2024-11-08 10:00:00

AI模型

2025-03-07 08:00:00

LLM蒸餾和量化大模型

2024-05-09 08:11:04

OllamaGo訓(xùn)練文本

2023-09-28 21:55:12

AndroidApp

2024-08-13 14:20:00

模型數(shù)據(jù)

2023-07-03 16:15:46

模型訓(xùn)練

2023-06-28 08:23:41

搜索語義模型

2025-07-11 08:54:00

2024-11-21 16:30:21

2023-11-17 15:44:01

2025-08-19 10:10:46

2023-08-02 18:40:42

2021-01-28 19:58:48

技術(shù)團(tuán)隊效能

2020-09-16 10:16:54

數(shù)據(jù)分析量化大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

第三区美女视频在线| 国产一级免费观看| 国产成人a视频高清在线观看| 久久精品水蜜桃av综合天堂| 成人黄色免费看| 麻豆亚洲av成人无码久久精品| 国产精品色呦| 欧美四级电影在线观看| 色播亚洲视频在线观看| 国产三级第一页| 国内久久精品| 中文字幕视频在线免费欧美日韩综合在线看| 亚洲a级黄色片| 波多野结衣久久| 欧美激情中文字幕| 国产亚洲精品自在久久| 中文字幕乱码视频| 99精品国产福利在线观看免费| 中文字幕亚洲一区二区三区| 一二三区视频在线观看| 欧洲av不卡| 亚洲午夜电影网| 伊人狠狠色丁香综合尤物| 日韩在线观看视频网站| 国产在线视视频有精品| 国产精品igao视频| 日韩欧美亚洲一区二区三区| 91精品国产调教在线观看| 亚洲深夜福利网站| 国产精品无码专区| 秋霞一区二区三区| 欧美丰满少妇xxxxx高潮对白 | 国产综合视频在线观看| 99精品视频99| 好看的日韩av电影| 久久成人人人人精品欧| 国产性猛交xx乱| 欧洲专线二区三区| 亚洲精品久久视频| 精品久久久久一区二区| 精品国产第一国产综合精品| 欧美视频在线观看一区二区| 国产裸体舞一区二区三区| 欧美卡一卡二| 亚洲一区二区三区在线播放| 日本一本草久p| 麻豆传媒视频在线| 国产精品网站在线观看| 欧美一区二区三区在线播放| 三级av在线播放| 暴力调教一区二区三区| 国产伦精品一区二区三区在线| 精品国产99久久久久久宅男i| 久久99精品国产.久久久久| 国产精品免费看久久久香蕉| 国产乡下妇女三片| 日本不卡123| 国产日韩欧美视频| 国产模特av私拍大尺度| 国产伦精一区二区三区| 91精品天堂| 超碰在线观看av| 丁香婷婷综合色啪| 国产一区二区高清视频| 图片区 小说区 区 亚洲五月| 成人高清免费观看| 免费在线观看一区二区| 国产三级视频在线看| 国产女人aaa级久久久级| 欧美重口乱码一区二区| av在线日韩国产精品| 亚洲欧洲av一区二区三区久久| 伊人天天久久大香线蕉av色| а√天堂8资源在线官网| 亚洲自拍欧美精品| 日韩中文字幕三区| 国产精品99久久久久久董美香| 欧美日韩一级视频| 一区二区三区人妻| 久久悠悠精品综合网| 日韩精品视频观看| 国产欧美小视频| 欧美日本一区二区视频在线观看 | 亚洲精品在线91| 午夜时刻免费入口| 68国产成人综合久久精品| 久久久视频在线| 天天射天天干天天| 国产乱码精品一区二区三区忘忧草 | 欧美黄色一级网站| 国产日韩1区| 国产这里只有精品| 日韩一级片免费在线观看| 国产女同互慰高潮91漫画| 日本福利视频在线观看| 国产精品迅雷| 日韩欧美中文一区二区| 97超碰在线资源| 91tv精品福利国产在线观看| 青青在线视频一区二区三区| 国产农村妇女毛片精品久久| 91丝袜美腿高跟国产极品老师| 尤物一区二区三区| av在线网页| 欧美日韩免费高清一区色橹橹| 久久精品aⅴ无码中文字字幕重口| 欧美激情在线免费| 欧美高清一级大片| 在线观看一二三区| 97精品视频在线观看自产线路二| 在线视频精品一区| gay欧美网站| 精品久久久影院| 正在播放国产对白害羞| 亚洲在线黄色| 超碰在线97av| 黄色在线观看网站| 91福利视频网站| 日本黄色动态图| 亚洲区综合中文字幕日日| 国产成人91久久精品| 风流少妇一区二区三区91| 国产精品久久久久久久久图文区| 欧美日韩二三区| 一区二区三区国产好| 视频在线观看99| 激情视频网站在线观看| 波多野结衣亚洲一区| 2021狠狠干| 成人污版视频| 日韩中文字幕精品视频| 亚洲av无码不卡| 91社区在线播放| 国产青青在线视频| 97人人澡人人爽91综合色| 丝袜亚洲欧美日韩综合| 天天爱天天做天天爽| 久久影院午夜论| 成人中文字幕在线播放| 超碰cao国产精品一区二区| 免费91在线视频| 国产精品久久久久久久免费看| 国产日韩综合av| 日韩手机在线观看视频| 自拍视频一区| 奇门遁甲1982国语版免费观看高清 | 青草草在线视频| 国产美女主播视频一区| 国产卡一卡二在线| 视频国产精品| 欧美精品videos另类日本| 亚洲成人精品女人久久久| 亚洲激情一二三区| 久久久久久无码精品人妻一区二区| 999国产精品永久免费视频app| 国产精品无av码在线观看| www.亚洲免费| 欧美日韩视频专区在线播放| 亚洲女人毛茸茸高潮| 另类中文字幕网| 日韩视频在线观看视频| 日韩在线视频一区二区三区| 欧美另类暴力丝袜| 欧美熟妇乱码在线一区| 精品日本高清在线播放| 欧美老熟妇乱大交xxxxx| 丝袜亚洲精品中文字幕一区| 图片区小说区区亚洲五月| 欧美天堂在线| 操人视频在线观看欧美| 黄色一级大片在线免费看国产一| 亚洲成a人片在线观看中文| 亚洲天堂网一区二区| 日韩黄色一级片| a级黄色片网站| h视频久久久| 国产91精品久久久久| 91青青在线视频| 日韩片之四级片| 91在线视频在线观看| 国产精品免费丝袜| 黄色av电影网站| 玖玖精品视频| 色一情一乱一伦一区二区三区| 国产精品1区在线| 性欧美xxxx交| 最新真实国产在线视频| 精品国产制服丝袜高跟| 日韩精品视频免费看| 国产精品污www在线观看| 黑人玩弄人妻一区二区三区| 久久亚洲色图| 日本a级片在线播放| 国产精品三级| 99久久精品无码一区二区毛片 | 国产免费成人| 亚洲精品高清视频| 国产一级成人av| 国产视频999| 中文字幕一区久| 久久视频免费观看| 精品久久av| 精品乱人伦一区二区三区| 国产九色91回来了| 午夜欧美视频在线观看 | 亚洲一区二区视频在线观看| 我不卡一区二区| 不卡av免费在线观看| 成人不卡免费视频| 久久精品系列| 黄页网站大全在线观看| 91精品一区二区三区综合| 日韩欧美手机在线| 欧美有码在线| 成人福利免费观看| 91精品韩国| 91av视频在线免费观看| 欧美性video| 精品国产一区二区三区四区在线观看 | 精品视频在线播放色网色视频| 国产精品女同一区二区| 在线免费观看不卡av| 日韩久久精品视频| 一区二区欧美精品| 国产高潮流白浆| 欧美国产日韩亚洲一区| 中文字幕日韩三级片| 国产精品一区二区x88av| 精品少妇无遮挡毛片| 亚洲影视在线| 日本www在线播放| 亚洲电影在线| 99在线免费视频观看| 欧美激情综合| 国产精品一二三在线观看| 久久久久久久久99精品大| 视频在线观看成人| 欧美日韩伦理在线免费| 日本亚洲欧洲精品| 教室别恋欧美无删减版| 欧美视频观看一区| 国产一区2区| 少妇精品久久久久久久久久| 国产欧美一区二区精品久久久| 精品免费视频123区| 六月丁香久久丫| 久久手机视频| 免费看日本一区二区| 欧美亚州在线观看| 精品国产一区二区三区久久久樱花| 欧美精品一区二区三区四区五区| 欧美xxxx在线| 欧美日韩三区四区| 清纯唯美亚洲综合一区| 亚洲精品成人a8198a| 欧美hd在线| www.亚洲一区二区| 国内精品99| 国产97在线 | 亚洲| 乱码第一页成人| 精品999在线| 国产麻豆视频一区| 国产二级一片内射视频播放 | 美女性感视频久久| 在线播放av中文字幕| 国产精品一级在线| 91视频在线免费| 久久久久久日产精品| 综合 欧美 亚洲日本| 亚洲色图视频网| 激情综合网五月婷婷| 欧美日韩国产精品一区二区三区四区 | 日韩成人av影院| 99re视频精品| 国产欧美小视频| 亚洲自拍偷拍网站| yjizz国产| 欧美精品tushy高清| 性做久久久久久久久久| 亚洲精品视频在线播放| 日本中文字幕在线播放| 欧美激情一区二区三区成人| 午夜不卡影院| 91欧美激情另类亚洲| 国产精品1luya在线播放| 日韩av一级大片| 永久91嫩草亚洲精品人人| 日本一道本久久| 韩日av一区二区| 亚洲av网址在线| 国产精品第五页| 欧美三日本三级少妇99| 欧美日韩国产三级| 天天爽夜夜爽夜夜爽| 日韩中文在线视频| 蜜桃麻豆av在线| 91久久中文字幕| 久久99影视| 福利视频一区二区三区四区| 美女在线视频一区| 日本丰满少妇裸体自慰| 亚洲精品国产成人久久av盗摄| 国内精品福利视频| 精品少妇一区二区三区日产乱码 | 亚洲欧洲日韩综合一区二区| 久久久久久久久久影院| 欧美疯狂做受xxxx富婆| 国产免费永久在线观看| 国模精品系列视频| 精品国产亚洲一区二区三区| 欧美一区二区三区精美影视| 日韩视频中文| 苍井空张开腿实干12次| 中文字幕在线不卡一区| 一级做a爰片久久毛片| 精品精品国产高清a毛片牛牛| 国产一区久久精品| 国产www精品| 亚洲人成网亚洲欧洲无码| 日本wwwcom| 国产一区美女在线| 99国产精品无码| 在线观看一区日韩| 你懂得在线网址| 91高清在线免费观看| 99精品在免费线中文字幕网站一区 | 国产精品一区二区无码对白| 成人欧美一区二区三区1314| 老熟妇一区二区三区啪啪| 亚洲欧美国产一本综合首页| 波多野在线观看| 国产另类自拍| 激情偷拍久久| 日韩av无码一区二区三区不卡| 一级日本不卡的影视| 精品国产va久久久久久久| 精品国内自产拍在线观看| 亚洲精品777| 在线精品亚洲一区二区| 久久精品99国产国产精| av资源在线免费观看| 欧美午夜免费电影| 最近高清中文在线字幕在线观看| 国产精品白嫩美女在线观看| 欧美日韩亚洲在线观看| 日韩肉感妇bbwbbwbbw| 欧美国产日韩精品免费观看| 青娱乐在线免费视频| 中文字幕在线精品| 婷婷激情成人| 精品一区二区三区毛片| 国产乱一区二区| 日产欧产va高清| 亚洲女人天堂视频| 日本一区免费网站| 亚洲综合首页| 国产精品66部| 精品成人免费视频| 亚洲女人被黑人巨大进入| 日韩精选视频| 国产精品亚洲天堂| 国产激情一区二区三区| 国产乡下妇女做爰毛片| 亚洲美女在线视频| 国产精品亚洲d| 成人在线免费观看网址| 成人av网址在线观看| 无码日韩精品一区二区| 色婷婷综合成人| 波多野结衣在线一区二区| 成年人免费在线播放| 国产精品视频yy9299一区| 国产99999| 欧美一区二区三区四区在线| 日本不卡高清| 免费黄色在线播放| 日本韩国欧美在线| caopeng在线| 蜜桃精品久久久久久久免费影院 | 成人黄色短视频在线观看| 伊人精品在线| 五月婷婷欧美激情| 日韩一级完整毛片| 成人直播视频| 欧美日韩亚洲国产成人| 91在线观看地址| 国产理论视频在线观看| 欧美一区二区三区四区在线| 欧美a级成人淫片免费看| 国产视频久久久久久| 欧美日韩国产一区| 绿色成人影院| 中文字幕精品一区日韩| 91麻豆国产香蕉久久精品| 国产精品久久久久久免费免熟| 午夜精品视频网站| 我不卡神马影院| 波多野结衣av在线观看| 精品少妇一区二区三区视频免付费 | 毛片在线播放a|