精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

華為中科大聯(lián)創(chuàng)大模型低比特量化算法,1‰數(shù)據(jù)實現(xiàn)昇騰無損壓縮7倍

人工智能 新聞
大模型巨無霸體量,讓端側(cè)部署望而卻步?華為聯(lián)手中科大提出CBQ新方案,僅用0.1%的訓練數(shù)據(jù)實現(xiàn)7倍壓縮率,保留99%精度。

大模型,如今堪稱AI界的「吞金巨獸」。

從寫詩到解題,從對話到編程,它們幾乎無所不能,但動輒千億甚至萬億參數(shù)的規(guī)模,讓部署成本高得離譜。

以FP16精度部署的DeepSeek-R1 671B為例,推理時大概需要1342GB的顯存,如果是32GB 5090顯卡,需要整整42張!

為了降低成本,天才工程師們想出了后訓練量化(Post-training Quantization,PTQ)的方法,它能夠在有限的校準數(shù)據(jù)和計算資源下對模型進行高效壓縮。

但是PTQ依然帶來新的問題——在極低比特精度(如W2A16、W4A4)時往往會出現(xiàn)明顯的性能下降,規(guī)模是降了,但是不好用了!

就在這關(guān)鍵時刻,華為諾亞方舟實驗室聯(lián)合中科大亮出了「殺手锏」——CBQ(Cross-Block Quantization),一種基于跨塊重建的后訓練量化方案。

圖片

論文地址:https://openreview.net/pdf?id=eW4yh6HKz4

相比量化感知訓練(QAT)所需數(shù)據(jù)量,CBQ僅用0.1%的訓練數(shù)據(jù),一鍵壓縮大模型至1/7體積——浮點模型性能保留99%,真正實現(xiàn)「輕量不降智」。

值得一提的是,這項成果已榮登ICLR 2025 Spotlight(錄取率僅5%)。

它不僅展現(xiàn)了大模型壓縮領(lǐng)域的創(chuàng)新性和實用性,更像一顆信號彈,宣告大模型在國產(chǎn)算力上的普及時代已然來臨!

目前,CBQ已作為可調(diào)用的算法之一,正式加入昇騰模型壓縮工具包ModelSlim,幫助開發(fā)者在昇騰芯片上實現(xiàn)LLM的高效部署。

極低比特量化,為何如此難?

長期以來,后訓練量化(PTQ)一直是壓縮大語言模型的「黑科技」——通過解決異常值和采用layer-wise或block-wise的loss優(yōu)化技術(shù)取得了比較不錯的結(jié)果。

但是當把參數(shù)比特「壓得特別低」的時候,模型性能會嚴重下降。

為什么極低比特量化,如此困難?其實,答案隱藏在大模型的復雜結(jié)構(gòu)中。

研究者們對LLM在低比特量化場景下的量化誤差進行了深入分析,發(fā)現(xiàn)了問題的關(guān)鍵所在:

隨著模型參數(shù)數(shù)量的增加和量化bit數(shù)的減少,模型內(nèi)部的層間依賴(inter-layer dependencies)和層內(nèi)依賴(intra-layer dependencies)會顯著增強,這嚴重影響了量化精度。

如下實驗所示,清晰展示了LLAMA-7B層間與層內(nèi)的依賴關(guān)系。

圖片

圖1:Llama-7B內(nèi)部權(quán)重和層之間依賴關(guān)系的變化,以及層間縮放因子(scale)對誤差的影響

圖1(a)為LLAMA-7B單一層中權(quán)重的Hessian矩陣絕對值可視化,2-bit圖比4-bit更模糊,非對角線噪聲增多,表示在低比特下權(quán)重間的「干擾」增強了。

圖片

圖1(b)為LLAMA-7B 32層中損失相對于scale的Hessian矩陣可視化,在2-bit量化中,非對角線明顯比4-bit更亮,說明層間依賴增強,模型更容易因為一層的誤差影響到另一層。

以及圖1(c)LLAMA-7B前兩個Transformer塊的平均scale與相應損失之間的關(guān)系,4-bit情況下,誤差平穩(wěn)區(qū)域大,模型對 scale 不敏感。2-bit情況下,誤差對scale非常敏感,選擇不當誤差急劇上升,黑色區(qū)域更集中、易出錯。

總結(jié)來說,將模型參數(shù)從高精度壓縮到低精度,這一過程主要面臨三大核心挑戰(zhàn):

1. 層間依賴的「雪球效應」

大模型由多個Transformer層組成,各層參數(shù)之間存在復雜的相互依賴。

在極低比特量化時,量化誤差會在層間不斷累積放大,就像「滾雪球」一樣,導致整體性能嚴重下降。

然而,傳統(tǒng)逐層量化的方法,無法有效捕捉這些層間依賴,進而造成了精度損失。

2. 層內(nèi)依賴的復雜性

同一層內(nèi)的參數(shù)并非獨立存在,而是存在緊密的關(guān)聯(lián)性。

極低比特量化會破壞這些精細的層內(nèi)依賴,導致模型在處理復雜任務時「力不從心」。

比如,大模型語義理解或推理能力,可能因參數(shù)精度的降低而顯著退化。

3. 權(quán)重和激活的異常值

模型的權(quán)重和激活值中的異常值,在低比特量化時會引發(fā)較大的誤差。

傳統(tǒng)的方法無法精確識別和處理這些異常值,進一步加劇了量化誤差。

可見,這些挑戰(zhàn)讓低比特量化,成為大模型壓縮的「攔路虎」。

那么,華為的CBQ方案,是如何突破這些瓶頸?讓我們一探究竟!

CBQ打破層間壁壘,精準又高效

CBQ的核心思想是,通過跨塊依賴(Cross-Block Dependency, CBD)機制和自適應LoRA-Rounding技術(shù),同時優(yōu)化多個Transformer塊的量化參數(shù),從而更好地保留模型內(nèi)部的依賴關(guān)系。

圖片

具體來說,它通過三大技術(shù)創(chuàng)新,為極低比特量化注入了全新活力。

跨塊依賴機制(CBD)

剛剛也提到,傳統(tǒng)量化方法采用逐層優(yōu)化,卻忽視了層間依賴的復雜性。

CBQ引入了CBD機制,通過滑動窗口的方式,同時優(yōu)化多個Transformer塊,并且相鄰窗口之間會有重疊的塊,以確保塊之間的連接性和協(xié)作性。

圖片

這種方法,可以有效地捕捉到模型內(nèi)部的長距離依賴關(guān)系,使得相鄰的塊能夠共同參與到量化過程中,從而提高整體的量化性能。

圖片

在實驗中,隨著滑動窗口中塊的數(shù)量增加,模型的性能也得到了顯著提升。

圖片

自適應LoRA-Rounding技術(shù)

為了應對層內(nèi)依賴的復雜性,CBQ提出了自適應LoRA-Rounding技術(shù),通過兩個低秩矩陣來學習量化權(quán)重的自適應補償值。

圖片

與傳統(tǒng)的AdaRound方法相比,LoRA-Rounding通過低秩分解大大減少了可學習參數(shù),訓練速度更快,GPU內(nèi)存消耗更低。

圖片

這種方法能夠在訓練過程中動態(tài)調(diào)整權(quán)重的量化精度,從而更好地適應模型的內(nèi)部結(jié)構(gòu)和數(shù)據(jù)分布。

圖片

粗到細的預處理策略(CFP)

針對異常值問題,CBQ采用了粗到細的預處理策略(Coarse-to-Fine Preprocessing, CFP)。

CFP策略從統(tǒng)計學的角度出發(fā),通過分階段檢測和處理權(quán)重和激活中的異常值。

在粗粒度檢測階段,通過計算四分位數(shù)和四分位距來初步估計異常值的范圍;在細粒度檢測階段,通過最小化異常值子集與正常值子集之間的距離,同時最大化子集內(nèi)部的方差,來精確識別異常值的位置。

圖片

這種分階段策略,有效減少了量化誤差,確保模型在低比特場景下依然「穩(wěn)如泰山」。

那么,CBQ在場景中的真實表現(xiàn)又如何呢?

實驗結(jié)果:性能與效率的雙贏

一系列研究結(jié)果顯示,CBQ在華為盤古模型和開源模型的表現(xiàn)上,大放異彩。

盤古模型:端側(cè)部署「殺手锏」

CBQ量化技術(shù)已成功應用于華為盤古大模型PanGu-7B和PanGu-1.5B的端側(cè)部署,憑借其高精度的量化性能,有效支撐了盤古大模型在多個業(yè)務場景的落地應用。

如下表所示,在W8A8/W4A16精度下,PanGu-1.5B模型在中文(C-Eval/CMMLU)、多任務語言理解(MMLU)基準中的表現(xiàn),毫不遜色于全精度模型的性能。

在中文、多語言理解、數(shù)學基準中,PanGu-7B的表現(xiàn)同樣如此。

圖片

這些成果,足以讓盤古模型在手機等終端設備上,輕松運行。

開源模型:超越最優(yōu)

此外,CBQ在多個開源LLM(如OPT、LLaMA)上也取得了SOTA。

圖片

例如,在W4A16、W2A16和W4A8等低比特量化設置下,CBQ的性能均優(yōu)于現(xiàn)有的最先進方法,并且與全精度模型的性能差距縮小到了1%以內(nèi)。

圖片

更令人驚嘆的是,CBQ僅需4.3小時即可完成對4位權(quán)重的LLaMA1-65B模型的量化,展現(xiàn)了壓縮率與精度之間的完美平衡(trade-off)。

圖片

未來展望

華為的CBQ方案,以跨塊依賴機制、自適應LoRA-Rounding技術(shù),以及粗到細的預處理策略,成功征服了極低比特量化的「三大高峰」。

這項創(chuàng)新有效地解決了,大模型在低比特量化場景下所面臨的層間依賴和層內(nèi)依賴難題。

它不僅在多種大語言模型和數(shù)據(jù)集上展現(xiàn)出了顯著的性能提升,成功縮小了與全精度模型之間的差距,還以高效的量化效率實現(xiàn)了復雜模型的快速壓縮。

最終,讓盤古和各類開源模型,成功實現(xiàn)了在昇騰硬件上的高效部署,并為更加廣泛的應用鋪就坦途。


責任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-06-17 07:10:00

2023-10-10 08:52:43

PNG類型Chinchilla

2025-10-24 12:14:32

2025-10-11 18:05:23

AI大模型工具

2021-11-17 16:13:45

IBM 處理器量子

2024-12-02 10:40:00

AI模型

2024-04-07 09:00:00

數(shù)據(jù)模型

2022-06-30 10:38:53

Lepton無損壓縮圖片圖片質(zhì)量

2023-12-04 13:23:00

數(shù)據(jù)訓練

2015-08-31 10:10:48

Dropbox無損壓縮算法云存儲

2022-06-08 16:29:45

無損壓縮方案分布式

2021-05-07 09:34:20

量子芯片計算機

2025-07-11 08:54:00

2025-04-01 09:20:00

模型預測AI

2023-09-18 15:25:12

昇騰AI

2024-11-04 08:30:00

2021-07-09 22:54:38

昇騰產(chǎn)業(yè)升級智能化
點贊
收藏

51CTO技術(shù)棧公眾號

一区二区国产精品| 美女一区2区| 亚洲精品高清视频在线观看| 国产高清自拍一区| 久久国产视频一区| 99国产精品一区二区| 欧美岛国在线观看| av视屏在线播放| 在线观看免费视频你懂的| 波多野洁衣一区| 国产精品自拍偷拍视频| 国产中文字幕免费| 久久国产精品亚洲人一区二区三区 | 国产成人综合自拍| 欧美主播福利视频| 欧美毛片在线观看| 菠萝蜜一区二区| 精品国产乱码久久| 日韩欧美国产片| 瑟瑟视频在线看| 亚洲欧美另类久久久精品2019| 免费观看成人高| 亚洲乱色熟女一区二区三区| 男女激情视频一区| 欧美在线一区二区三区四| 久久国产波多野结衣| 国产一区2区| 亚洲精品国精品久久99热| 亚洲黄色av片| 成人午夜一级| 一本一本大道香蕉久在线精品 | www青青草原| 成人国产精品一级毛片视频| 亚洲另类激情图| 午夜男人的天堂| 一区二区日韩| 91精品国产综合久久蜜臀| 黑人粗进入欧美aaaaa| 华人av在线| 婷婷综合在线观看| 国产亚洲黄色片| 免费电影视频在线看| 亚洲免费在线电影| 中文字幕一区二区三区四区五区人| 欧美色18zzzzxxxxx| 97精品视频在线观看自产线路二| 国产精品加勒比| 亚洲免费不卡视频| 成人免费视频播放| 国产精品一 二 三| 理论片中文字幕| 成人福利视频在线看| 97人人做人人人难人人做| 国产男女裸体做爰爽爽| 国内成人免费视频| 99久久一区三区四区免费| 精品人妻无码一区二区三区蜜桃一| 国产美女视频一区| **亚洲第一综合导航网站| www.精品久久| 丁香六月久久综合狠狠色| 国产精品午夜av在线| 人妻与黑人一区二区三区| 99re热这里只有精品视频| 国产免费一区二区三区| 艳母动漫在线看| 久久久久久久久久久久久夜| 日日噜噜噜噜夜夜爽亚洲精品| 国产青青草在线| 中文字幕亚洲成人| 国产又粗又猛又爽又黄的网站| 国产乱妇乱子在线播视频播放网站| 亚洲成人午夜影院| 国产性xxxx18免费观看视频| 小黄鸭精品aⅴ导航网站入口| 日本丶国产丶欧美色综合| 嫩草影院国产精品| 国产一区二区av在线| 欧美sm极限捆绑bd| 免费无码一区二区三区| 精品久久久久久久久久久aⅴ| 日韩一区二区福利| 青娱乐在线视频免费观看| 国产日韩欧美| 国产欧美精品va在线观看| 亚洲大尺度网站| 久久免费看少妇高潮| 亚洲一区二区三区精品视频| 污片视频在线免费观看| 一本色道久久综合亚洲aⅴ蜜桃| 成人日韩在线视频| 久久精品论坛| 在线播放国产一区二区三区| 久草视频中文在线| 丝袜美腿亚洲一区二区图片| 91九色蝌蚪成人| 欧美理论在线观看| 日韩毛片精品高清免费| 成年人午夜视频在线观看| 国产成人福利夜色影视| 精品国产伦一区二区三区免费| 亚洲黄色免费视频| 亚洲无线一线二线三线区别av| 日韩免费高清在线观看| 国产夫妻在线观看| 久久中文娱乐网| 国产911在线观看| 成人在线免费| 日韩精品视频在线| 人妻少妇精品一区二区三区| 天堂成人免费av电影一区| www.久久草| 在线视频二区| 色综合久久99| 插我舔内射18免费视频| 伊人情人综合网| 国产精品com| 欧洲天堂在线观看| 一区二区三区四区亚洲| 天堂视频免费看| 狠狠操综合网| 欧美在线观看日本一区| 午夜精品一区二区三| 国产精品视频观看| 黄色av免费在线播放| 国内自拍欧美| 欧美国产欧美亚洲国产日韩mv天天看完整 | 国产精品视频永久免费播放| 日韩午夜影院| 精品久久久久人成| 男人网站在线观看| 欧美日韩影院| 亚洲已满18点击进入在线看片 | 欧美性猛交久久久乱大交小说 | 国产性生活网站| 国产精品456| 一二三四中文字幕| 国产精品视频一区视频二区| 久久精品国产96久久久香蕉| 中文字字幕在线中文乱码| 国产亚洲制服色| 亚洲精品中文字幕无码蜜桃| 国产精品免费大片| 日韩免费中文字幕| 国产日韩精品在线看| 色噜噜狠狠色综合欧洲selulu | 18欧美亚洲精品| 日本中文字幕二区| 亚州av乱码久久精品蜜桃| 成人精品在线观看| 国产精品扒开做爽爽爽的视频| 777xxx欧美| 青青草原在线免费观看| 国产不卡免费视频| 自拍日韩亚洲一区在线| 中文字幕亚洲影视| 国产精品免费网站| 岛国中文字幕在线| 精品久久国产97色综合| 日本一区二区三区免费视频| 91在线小视频| 欧美精品成人网| 国产高清欧美| 99在线观看视频网站| 免费影视亚洲| 亚洲男人7777| 97精品人妻一区二区三区| 一区二区三区精品视频在线| 久久精品女同亚洲女同13| 亚洲女优在线| 亚洲一卡二卡三卡| aaa国产精品视频| 欧美最近摘花xxxx摘花| 992tv免费直播在线观看| 日韩亚洲电影在线| 日韩欧美一区二区一幕| 中文字幕成人在线观看| 手机在线免费毛片| 蜜桃av一区| 天天操天天干天天玩| 女同久久另类99精品国产| 国产97在线|亚洲| av片在线观看免费| 精品无人区乱码1区2区3区在线| 中文字幕xxxx| 一区二区欧美在线观看| 色无极影院亚洲| 国产在线视频一区二区三区| 99爱视频在线| 91精品国产乱码久久久久久| 久久久久久精| 久久爱www.| 欧美在线视频网站| 综合图区亚洲| 亚洲午夜精品久久久久久久久久久久| 97久久人国产精品婷婷| 同产精品九九九| 色老板免费视频| 久久精品无码一区二区三区| 特黄特色免费视频| 秋霞影院一区二区| 久久国产精品网| 天天揉久久久久亚洲精品| 久久99久久精品国产| 欧美成人精品一级| 国产精品九九九| 在线手机中文字幕| 欧美激情国产精品| 午夜伦理在线| 亚洲欧美综合图区| 午夜视频在线免费播放| 欧美一卡在线观看| 91国产免费视频| 色激情天天射综合网| 国产精品19乱码一区二区三区| 中文字幕中文字幕在线一区 | 午夜亚洲国产au精品一区二区| 久久久久麻豆v国产| 久久男人中文字幕资源站| 大尺度做爰床戏呻吟舒畅| 国产精品一级在线| 在线能看的av网站| 日本成人在线电影网| 欧美 日韩 国产 高清| 欧美日韩网站| 日本美女爱爱视频| 天天影视综合| 亚洲图片都市激情| 欧美综合另类| 日产国产精品精品a∨ | 国产精品夜夜夜爽张柏芝| jlzzjlzz亚洲女人| 日本欧美精品久久久| 影视先锋久久| 欧美日韩亚洲免费| 自拍亚洲一区| 欧美人与物videos另类| 久久av免费| 欧美久久久久久久| 国产在线观看91一区二区三区 | 欧美日韩卡一卡二| 欧美超碰在线观看| 在线精品视频免费播放| 无码久久精品国产亚洲av影片| 黑丝美女久久久| 亚洲影院在线播放| 91黄视频在线观看| 欧美 亚洲 另类 激情 另类 | 亚洲涩涩在线观看| 激情综合色播激情啊| 午夜诱惑痒痒网| 国产大陆a不卡| 91传媒理伦片在线观看| 成人午夜av影视| 熟女人妻在线视频| 国产欧美一区二区精品仙草咪| 91麻豆精品国产91久久综合| 国产精品成人一区二区艾草 | 亚洲免费二区| 天堂8在线天堂资源bt| 亚洲免费激情| 国产精品少妇在线视频| 蜜臀久久99精品久久久画质超高清 | 91香蕉视频网址| 欧美日一区二区在线观看 | www.射射射| 亚洲资源av| 天天干天天综合| 国产.精品.日韩.另类.中文.在线.播放| 国产白袜脚足j棉袜在线观看| 91视频com| 日韩在线一卡二卡| 亚洲成人自拍网| 国产精品国产精品国产| 日韩片之四级片| 你懂的视频在线| 久久九九国产精品怡红院| 爱啪啪综合导航| 国产欧美精品日韩精品| 国产福利一区二区精品秒拍| 人偷久久久久久久偷女厕| 91成人超碰| 无码精品a∨在线观看中文| 久久精品国产99久久6| 免费看91视频| 国产精品理论片在线观看| 国产亚洲欧美精品久久久www | 精品久久久中文字幕人妻| 国产视频久久久久久久| 国产在线激情| 日本在线观看天堂男亚洲| 精品久久免费| 欧美一进一出视频| 黄色av日韩| 中文字幕色网站| 国产亚洲精品资源在线26u| 91视频免费在线看| 欧美亚洲国产一区二区三区 | 免费观看美女裸体网站| 美女网站视频久久| 少妇大叫太粗太大爽一区二区| 亚洲婷婷综合久久一本伊一区| 91丝袜一区二区三区| 精品久久人人做人人爱| 日韩免费啪啪| 国产精品大陆在线观看| 国产成人在线中文字幕| 97超碰免费观看| 欧美96一区二区免费视频| 亚洲调教欧美在线| 亚洲影院免费观看| 一二区在线观看| 一本一本久久a久久精品综合小说| 爱看av在线入口| 999视频在线免费观看| 第一会所亚洲原创| 国产精品亚洲二区在线观看| 成人精品免费网站| 激情视频在线播放| 欧美一区二区私人影院日本| 亚洲1卡2卡3卡4卡乱码精品| 青青草99啪国产免费| 国产精品香蕉| 亚洲精品久久久久久久蜜桃臀| 国产精品一品二品| 国精品无码一区二区三区| 日本韩国精品一区二区在线观看| 天堂中文在线8| 91国语精品自产拍在线观看性色| 一区二区三区四区视频免费观看| 中文字幕av久久| 激情图片小说一区| 欧美a级片免费看| 欧美日韩国产一级二级| www.久久热.com| 国产精品久久久久免费a∨| 精品一区二区三| 欧美性猛交久久久乱大交小说 | 99riav视频一区二区| 欧美资源一区| 蜜桃一区二区三区在线| 国产精品www爽爽爽| 欧美亚洲综合另类| 岛国最新视频免费在线观看| 国产精品电影在线观看| 国产日产精品_国产精品毛片| 91色国产在线| 中文字幕一区二区三区四区| 国产精品一级二级| 欧美成人精品激情在线观看| 亚洲欧洲国产精品一区| 成人精品视频在线播放| www精品美女久久久tv| 国产主播第一页| 中文字幕自拍vr一区二区三区| 亚洲图片小说区| 大陆极品少妇内射aaaaaa| 成人免费电影视频| 国产视频91在线| 一区二区亚洲欧洲国产日韩| 日韩黄色在线| 日本一区午夜艳熟免费| 久久亚洲一区二区三区明星换脸| 日韩黄色一级视频| 久久精品国产欧美激情| 成人自拍在线| 99热成人精品热久久66| 国产精品色哟哟网站| 性一交一乱一精一晶| 97免费中文视频在线观看| 欧美日韩中文字幕一区二区三区| 久热在线视频观看| 亚洲国产裸拍裸体视频在线观看乱了 | 粉嫩av一区二区三区天美传媒| 成人午夜精品在线| 国产日韩在线免费观看| 久久99亚洲精品| 在线视频亚洲专区| 91小视频在线播放| 激情久久av一区av二区av三区| 在线免费看av| 国产九色精品| 麻豆精品视频在线| 日韩成人在线免费视频| 综合网中文字幕| 国产欧美三级电影| 亚洲xxxx2d动漫1| 亚洲va欧美va天堂v国产综合| 美国成人毛片| 国产高清在线一区| 日韩电影在线一区二区三区| 免费日韩在线视频| 在线色欧美三级视频| 波多野结衣欧美| 亚洲国产成人va在线观看麻豆| 精品国产成人av| 调教一区二区| 亚洲精品久久久久久一区二区| 不卡电影一区二区三区| 国产乱码精品一区二三区蜜臂|