精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華、哈工大把大模型壓縮到了1bit,把大模型放在手機里跑的愿望就快要實現了!

人工智能 新聞
近期,清華大學和哈爾濱工業大學聯合發布了一篇論文:把大模型壓縮到 1.0073 個比特時,仍然能使其保持約 83% 的性能!

自從大模型火爆出圈以后,人們對壓縮大模型的愿望從未消減。這是因為,雖然大模型在很多方面表現出優秀的能力,但高昂的的部署代價極大提升了它的使用門檻。這種代價主要來自于空間占用和計算量。「模型量化」 通過把大模型的參數轉化為低位寬的表示,進而節省空間占用。目前,主流方法可以在幾乎不損失模型性能的情況下把已有模型壓縮至 4bit。然而,低于 3bit 的量化像一堵不可逾越的高墻,讓研究人員望而生畏。

圖 1 : 量化模型的困惑度在 2bit 時迅速上升

近期,一篇由清華大學、哈爾濱工業大學合作發表在 arXiv 上的論文為突破這一阻礙帶來了希望,在國內外學術圈引起了不小的關注。這篇論文也在一周前登上 huggingface 的熱點論文,并被著名論文推薦師 AK 推薦。研究團隊直接越過 2bit 這一量化級別,大膽地進行了 1bit 量化的嘗試,這在模型量化的研究中尚屬首次。

圖片

論文標題:OneBit: Towards Extremely Low-bit Large Language Models

論文地址:https://arxiv.org/pdf/2402.11295.pdf

作者提出的方法稱作 「OneBit」,非常貼切地形容了這一工作的本質:把預訓練大模型壓縮到真正的 1bit。該論文提出了模型參數 1bit 表示的新方法,以及量化模型參數的初始化方法,并通過量化感知訓練(QAT)把高精度預訓練模型的能力遷移至 1bit 量化模型。實驗表明,這一方法能夠在極大幅度壓縮模型參數的同時,保證 LLaMA 模型至少 83% 的性能。

作者指出,當模型參數壓縮至 1bit 后,矩陣乘法中的 「元素乘」將不復存在,取而代之的是更快速的 「位賦值」操作,這將大大提升計算效率。這一研究的重要意義在于,它不但跨越了 2bit 量化的鴻溝,也使在 PC 和智能手機上部署大模型成為可能。

已有工作的局限性

模型量化主要通過把模型的 nn.Linear 層(Embedding 層和 Lm_head 層除外)轉化為低精度表示實現空間壓縮。此前工作 [1,2] 的基礎是利用 Round-To-Nearest(RTN)方法把高精度浮點數近似映射到附近的整數網格。這可以被表示成圖片。

然而基于 RTN 的方法在極低位寬時(3bit 以下)存在嚴重的精度損失問題,量化后的模型能力損失十分嚴重。特別是,量化后參數以 1bit 表示時,RTN 中的縮放系數 s 和零點 z 會失去實際意義。這導致基于 RTN 的量化方法在 1bit 量化時幾乎失效,難以有效地保留原模型的性能。

此外,此前的研究中也曾對 1bit 模型可能采用什么結構進行過探索。幾個月前的工作 BitNet [3] 通過讓模型參數通過 Sign (?) 函數并轉為 + 1/-1 來實現 1bit 表示。但這一方法存在性能損失嚴重、訓練過程不穩定的問題,限制了其實際應用。

OneBit 框架

OneBit 的方法框架包括全新的 1bit 層結構、基于 SVID 的參數初始化方法和基于量化感知知識蒸餾的知識遷移。

1. 新的 1bit 結構

OneBit 的終極目標是將 LLMs 的權重矩陣壓縮到 1bit。真正的 1bit 要求每個權重值只能用 1bit 表示,即只有兩種可能的狀態。作者認為,在大模型的參數中,有兩個重要因素都必須被考慮進來,那就是浮點數的高精度和參數矩陣的高秩。

因此,作者引入兩個 FP16 格式的值向量以補償由于量化導致的精度損失。這種設計不僅保持了原始權重矩陣的高秩,而且通過值向量提供了必要的浮點精度,有助于模型的訓練和知識遷移。1bit 線性層的結構與 FP16 高精度線性層的結構對比如下圖:

圖 3 : FP16 線性層與 OneBit 線性層的對比

左側的 (a) 是 FP16 精度模型結構,右側的 (b) 是 OneBit 框架的線性層??梢?,在 OneBit 框架中,只有值向量 g 和 h 保持 FP16 格式,而權重矩陣則全部由 ±1 組成。這樣的結構兼顧了精度和秩,對保證穩定且高質量的學習過程很有意義。

OneBit 對模型的壓縮幅度究竟如何?作者在論文中給了一個計算。假設對一個 4096*4096 的線性層進行壓縮,那么 OneBit 需要一個 4096*4096 的 1bit 矩陣,和兩個 4096*1 的 16bit 值向量。這里面總的位數為 16,908,288,總的參數個數為 16,785,408,平均每個參數占用僅僅約 1.0073 個 bit。這樣的壓縮幅度是空前的,可以說是真正的 1bit 大模型。

2. 基于 SVID 初始化量化模型

為了使用充分訓練好的原模型更好地初始化量化后的模型,進而促進更好的知識遷移效果,作者提出一種新的參數矩陣分解方法,稱為 「值 - 符號獨立的矩陣分解(SVID)」。這一矩陣分解方法把符號和絕對值分開,并把絕對值進行秩 - 1 近似,其逼近原矩陣參數的方式可以表示成:

圖片

這里的秩 - 1 近似可以通過常見的矩陣分解方式實現,例如奇異值分解(SVD)和非負矩陣分解(NMF)。而后,作者在數學上給出這種 SVID 方法可以通過交換運算次序來和 1bit 模型框架相匹配,進而實現參數初始化。并且,論文還證明了符號矩陣在分解過程中確實起到了近似原矩陣的作用。

3. 通過知識蒸餾遷移原模型能力

作者指出,解決大模型超低位寬量化的有效途徑可能是量化感知訓練 QAT。在 OneBit 模型結構下,通過知識蒸餾從未量化模型中學習,實現能力向量化模型的遷移。具體地,學生模型主要接受教師模型 logits 和 hidden state 的指導。

 

 

訓練時,值向量和矩陣的值會被更新。模型量化完成后,直接把 Sign (?) 后的參數保存下來,在推理和部署時直接使用。

實驗及結果

OneBit 與 FP16 Transformer、經典的訓練后量化強基線 GPTQ、量化感知訓練強基線 LLM-QAT 和最新的 2bit 權重量化強基線 OmniQuant 進行了比較。此外,由于目前還沒有 1bit 權重量化的研究,作者只對自己的 OneBit 框架使用了 1bit 權重量化,而對其他方法采取 2bit 量化設置,屬于典型的 「以弱勝強」。

在模型選擇上,作者也選擇了從 1.3B 到 13B 不同大小、OPT 和 LLaMA-1/2 不同系列的模型來證明 OneBit 的有效性。在評價指標上,作者沿用了以往模型量化的兩大評價維度:驗證集的困惑度和常識推理的 Zero-shot 準確度。

表 1 : OneBit 與基線方法的效果比較(OPT 模型與 LLaMA-1 模型)

圖片

表 2 : OneBit 與基線方法的效果比較(LLaMA-2 模型)

表 1 和表 2 展示出了 OneBit 相比于其他方法在 1bit 量化時的優勢。就量化模型在驗證集的困惑度而言,OneBit 與 FP16 模型最為接近。就 Zero-shot 準確度而言,除 OPT 模型的個別數據集外,OneBit 量化模型幾乎取得了最佳的性能。其余的 2bit 量化方法在兩種評價指標上呈現較大的損失。

值得注意的是,OneBit 在模型越大時,效果往往越好。也就是說,隨著模型規模增大,FP16 精度模型在困惑度降低上收效甚微,但 OneBit 卻表現出更多的困惑度下降。此外,作者還指出量化感知訓練對于超低位寬量化或許十分有必要。

圖片

圖 4 : 常識推理任務對比

圖片

圖 5 : 世界知識對比

圖 6 : 幾種模型的空間占用和平均位寬

圖 4 - 圖 6 還對比了幾類小模型的空間占用和性能損失,它們是通過不同的途徑獲得的:包括兩個充分訓練的模型 Pythia-1.0B 和 TinyLLaMA-1.1B,以及通過低秩分解獲得的 LowRank Llama 和 OneBit-7B。可以看出,盡管 OneBit-7B 有最小的平均位寬、占用最小的空間,它在常識推理能力上仍然優于不遜于其他模型。作者同時指出,模型在社會科學領域面臨較嚴重的知識遺忘??偟膩碚f,OneBit-7B 展示出了其實際應用價值。正如圖 7 所展示的,OneBit 量化后的 LLaMA-7B 模型經過指令微調后,展示出了流暢的文本生成能力。

圖片

圖 7 : OneBit 框架量化后的 LLaMA-7B 模型的能力

討論與分析

1. 效率

表 3 : OneBit 在不同 LLaMA 模型的壓縮比

表 3 給出的是 OneBit 對不同規模 LLaMA 模型的壓縮比??梢钥闯?,OneBit 對模型的壓縮比均超過 90%,這一壓縮能力是史無前例的。其中值得注意的是,隨著模型增大,OneBit 的壓縮比越高,這是由于 Embedding 層這種不參與量化的參數占比越來越小。前文提到,模型越大,OneBit 帶來的性能增益越大,這顯示出 OneBit 在更大模型上的優勢。

圖片

圖 8 : 模型大小與性能的權衡

雖然超低比特量化可能會導致一定的性能損失,但如圖 8 所示,它在大小和性能之間達到了良好的平衡。作者認為,壓縮模型的大小十分重要,特別是在移動設備上部署模型時。

此外,作者還指出了 1bit 量化模型在計算上的優勢。由于參數是純二進制的,可以用 0/1 在 1bit 內表示,這毫無疑問地節省大量的空間。高精度模型中矩陣乘法的元素相乘可以被變成高效的位運算,只需位賦值和加法就可以完成矩陣乘積,非常有應用前景。

2. 魯棒性

二值網絡普遍面臨訓練不穩定、收斂困難的問題。得益于作者引入的高精度值向量,模型訓練的前向計算和后向計算均表現的十分穩定。BitNet 更早地提出 1bit 模型結構,但該結構很難從充分訓練的高精度模型中遷移能力。如圖 9 所示,作者嘗試了多種不同的學習率來測試 BitNet 的遷移學習能力,發現在教師指導下其收斂難度較大,也在側面證明了 OneBit 的穩定訓練價值。

圖 9 : BitNet 在多種不同學習率下的訓練后量化能力

論文的最后,作者還建議了超低位寬未來可能得研究方向。例如,尋找更優的參數初始化方法、更少的訓練代價,或進一步考慮激活值的量化。

更多技術細節請查看原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-11 09:27:00

框架模型AI

2023-09-23 12:36:32

蘋果模型

2024-01-29 11:56:23

數據AI

2023-11-03 07:47:12

機器資源大模型:

2025-06-16 14:39:56

模型開源框架

2025-11-21 12:02:41

2024-02-29 11:56:48

2023-07-05 14:01:50

AI技術

2024-03-18 10:38:03

模型算法

2024-01-03 17:40:49

模型AI

2025-07-31 06:45:00

大模型LLMOpenAI

2025-02-12 12:45:59

2023-11-05 10:04:47

2025-09-02 10:03:34

2024-05-10 12:58:08

2025-02-28 12:32:42

2024-03-18 09:22:43

AI模型

2023-08-17 16:07:16

模型優化

2023-09-04 15:42:19

人工智能
點贊
收藏

51CTO技術棧公眾號

免费在线精品视频| 国产精品劲爆视频| 日韩精品人妻中文字幕有码| av日韩国产| 26uuu亚洲| 国产不卡av在线免费观看| 美国一级黄色录像| 视频在线观看免费影院欧美meiju| 亚洲精品乱码久久久久久久久| 国产成人精品免费视频大全最热| 精品在线播放视频| 欧美一区二区三| 欧美成人性福生活免费看| 日韩欧美国产免费| gogo在线观看| 久久久亚洲综合| 91影院在线免费观看视频| 亚洲日本韩国在线| 68国产成人综合久久精品| 亚洲精品狠狠操| 日本美女高潮视频| 国产蜜臀在线| 亚洲欧洲日产国产综合网| 成人在线看片| 中文字幕视频免费观看| 亚洲国产综合在线看不卡| 色青青草原桃花久久综合| 荫蒂被男人添免费视频| 亚洲欧洲日韩精品在线| 日韩欧美在线视频日韩欧美在线视频| 天天干天天操天天干天天操| 牛牛澡牛牛爽一区二区| 国产v综合v亚洲欧| 国产精品一二区| 天堂网视频在线| 亚洲国产日韩欧美一区二区三区| 久久久黄色av| 欧美a在线播放| 亚洲综合福利| 亚洲高清久久久久久| www.色就是色.com| 日本美女久久| 欧美午夜精品久久久久久浪潮| 老司机激情视频| 色的视频在线免费看| 国产午夜精品一区二区| 九九九九精品| 日本黄色免费视频| 国产成都精品91一区二区三| 成人黄色中文字幕| 中文字幕永久免费视频| 日韩激情在线观看| 日韩av片免费在线观看| 欧美福利视频一区二区| 亚洲经典在线看| 色综合久久88色综合天天看泰| 污污的视频在线免费观看| 日韩激情在线| 色久欧美在线视频观看| 女人黄色一级片| 精品一区二区三区的国产在线观看| 精品一区二区三区三区| 97人妻精品一区二区三区免| 国产精品欧美大片| 日韩av一卡二卡| 中文字幕一区二区三区乱码不卡| 97久久亚洲| 欧美成人a∨高清免费观看| 美女日批在线观看| 国产精品18hdxxxⅹ在线| 亚洲成色777777女色窝| 日本一区二区在线观看视频| 牛牛影视一区二区三区免费看| 欧美精品一区二区精品网| 日本一级片在线播放| 欧美影院天天5g天天爽| 亚洲欧洲一区二区三区在线观看| 亚洲一区视频在线播放| 色琪琪久久se色| 久久精品国产99国产精品澳门 | 综合伊人久久| 日韩欧美国产综合| 亚洲无人区码一码二码三码| 国产成人精品福利| 亚洲欧美另类在线观看| 麻豆一区在线观看| 午夜久久99| 91精品国产91久久久久福利| 无码人妻精品一区二区三区9厂 | 亚洲香蕉伊在人在线观| 国产特级淫片高清视频| 春暖花开亚洲一区二区三区| 欧美丰满一区二区免费视频 | 91麻豆精品在线| 久久99久久99| 国产伦精品一区二区三毛| 日本福利午夜视频在线| 国产精品久久久久久久久免费樱桃 | 日韩av资源在线| 日本中文字幕视频一区| 日韩免费看网站| 欧美激情亚洲色图| 欧美日韩三级| 国产精品久久久久7777婷婷| 精品久久无码中文字幕| 国产亚洲精品bt天堂精选| 一级黄色片播放| 欧美黄色网页| 精品少妇一区二区| 女人裸体性做爰全过| 亚洲精品社区| 成人网在线免费观看| 日本福利片高清在线观看| 一区二区三区91| 噼里啪啦国语在线观看免费版高清版| 亚洲一区二区三区免费| 色狠狠av一区二区三区香蕉蜜桃| 欧美不卡视频在线观看| 国产老女人精品毛片久久| 欧美污视频久久久| 91美女主播在线视频| 欧美日韩国产另类不卡| 人妻无码一区二区三区| 午夜日韩视频| 成人激情免费在线| 国产高清一区在线观看| 天天做天天摸天天爽国产一区 | 国产剧情在线视频| 粉嫩av一区二区三区| 亚洲最新在线| 88xx成人永久免费观看| 亚洲高清在线观看| 久热精品在线观看| 国产在线精品免费| 天天好比中文综合网| 女厕盗摄一区二区三区| 精品久久人人做人人爰| 成年人二级毛片| 美腿丝袜一区二区三区| 欧美日韩国产免费一区二区三区| f2c人成在线观看免费视频| 欧美一区二区三区免费在线看| 五月天精品在线| 日韩精品高清不卡| 日韩精品欧美专区| 综合在线影院| 亚洲免费视频在线观看| 黄色在线视频网址| 久久久无码精品亚洲日韩按摩| www在线观看免费| 狠狠一区二区三区| 久久久视频精品| 欧美特黄一级视频| 亚洲成av人片www| 波多野结衣一二三区| 影音先锋久久| 国产精品福利视频| а√天堂中文资源在线bt| 亚洲国产精品久久| 日本网站在线免费观看| 国产二区视频在线播放| 欧美孕妇性xxxⅹ精品hd| 亚洲成av人综合在线观看| 被黑人猛躁10次高潮视频| 亚洲91中文字幕无线码三区| 国产一区二区视频在线观看| 四虎久久免费| 欧美欧美欧美欧美首页| 精品一区二区在线观看视频| 国内一区二区在线| 搞av.com| 日本亚洲不卡| 国产精品夫妻激情| 中文字幕在线视频区| 91精品国产综合久久久久久漫画| 精品欧美一区二区久久久久| 成人中文字幕合集| 久久久亚洲精品无码| 妖精视频一区二区三区| 国产精品视频免费观看www| 麻豆传媒视频在线| 亚洲成人av片| 免费av中文字幕| 日韩理论片在线| 亚洲一区二区三区黄色| 久久一区二区三区超碰国产精品| 亚洲国产日韩欧美| 亚洲五码在线| 国产精品福利观看| 欧美高清另类hdvideosexjaⅴ | 五月婷婷丁香花| 日韩人在线观看| 91视频最新网址| av激情综合网| www.这里只有精品| 伊人成人在线视频| 亚洲精品二区| 久草精品视频| 国产一区视频在线| 精精国产xxxx视频在线播放| 在线中文字幕日韩| 亚洲男人天堂久久| 欧美在线999| 精品在线视频免费观看| 中文字幕精品综合| 国产 xxxx| 九色|91porny| 一本大道熟女人妻中文字幕在线 | 久久久久久av无码免费网站下载| 九九热精品视频在线观看| 亚洲最大福利网| 久久天堂av| 国产做受69高潮| 欧美jizz18hd性欧美| 精品丝袜一区二区三区| 国产成a人亚洲精v品无码| 日本韩国一区二区三区视频| 国产在线观看99| 中文字幕制服丝袜成人av| 久久久久久久久久久国产精品| 国产精品影视天天线| 日韩不卡一二三| 久久一区亚洲| 国产二级片在线观看| 午夜精品电影| japanese在线视频| 大色综合视频网站在线播放| 久久精品国产理论片免费| 2020国产精品极品色在线观看| 国产日韩在线亚洲字幕中文| 深夜成人福利| 91高清视频免费| 久久www人成免费看片中文| 久久综合久久八八| 91成人高清| 在线观看亚洲视频| 国产69精品久久app免费版| 精品一区电影国产| 亚洲区小说区图片区| 亚洲成人中文字幕| 日批视频在线播放| 亚洲精品黄网在线观看| 天天躁日日躁狠狠躁伊人| 精品国精品国产| 亚洲男人天堂久久| 欧美日韩精品免费观看视频完整| 91超碰中文字幕久久精品| 日本天码aⅴ片在线电影网站| 久久精品一本久久99精品| 日本黄色片在线观看| 中文字幕日韩欧美在线| 69久久夜色| 色综合伊人色综合网| 91免费在线| 在线看国产精品| 亚洲xxxxxx| 久久久精品999| 色呦呦网站在线观看| 国模吧一区二区三区| 超碰97免费在线| 97视频免费看| 悠悠资源网亚洲青| 人九九综合九九宗合| 91tv亚洲精品香蕉国产一区| 国产精品久久久久一区二区| 成人av色网站| 91在线视频九色| 999国产精品一区| 精品国产综合久久| 精品色999| 成人短视频在线看| 黄色在线成人| 国模吧无码一区二区三区| 日产国产高清一区二区三区| 色一情一区二区三区| 国产成人在线视频播放| 日本少妇xxxx| 欧美极品aⅴ影院| 私库av在线播放| 欧美三级免费观看| 中文在线最新版天堂| 91麻豆精品国产自产在线观看一区 | 天天做天天摸天天爽国产一区 | 视频一区二区三区入口| 91精品无人成人www| 国产精品一区二区黑丝| 久久久久久久无码| 国产精品欧美久久久久一区二区| 成人免费精品动漫网站| 五月天国产精品| 中文字幕777| 亚洲成人中文字幕| 午夜视频在线观看网站| 欧美黄网免费在线观看| 户外露出一区二区三区| 亚洲va欧美va在线观看| 日韩欧美影院| 吴梦梦av在线| 国产麻豆综合| 欧美xxxx黑人| 日本一区二区三区久久久久久久久不 | 97se亚洲国产一区二区三区| 日本黑人久久| 国产精品mm| 天天色综合天天色| 成人美女视频在线观看18| 国产一区在线观看免费| 精品久久久精品| 国产又大又粗又长| 亚洲欧美日本精品| 欧美videosex性极品hd| 国产精品热视频| 欧美重口另类| 精品久久久无码人妻字幂| 免费在线观看视频一区| 欧美深性狂猛ⅹxxx深喉| 亚洲欧美一区二区不卡| 天天干天天插天天射| 亚洲精品v欧美精品v日韩精品| 久草免费在线| 国产精品久久久久久久久久久久| eeuss国产一区二区三区四区| 中文精品一区二区三区| 每日更新成人在线视频| 妖精视频一区二区| 一区二区三区美女视频| 国产又粗又猛又爽| 在线视频精品一| 在线能看的av网址| 加勒比在线一区二区三区观看| 欧美成人国产| 三区视频在线观看| 国产精品美女久久久久久久网站| 欧美一级淫片免费视频黄| 亚洲国产欧美日韩精品| 狂野欧美性猛交xxxxx视频| 91传媒在线免费观看| 91亚洲国产| 亚洲精品午夜在线观看| 国产日韩欧美制服另类| 日本久久综合网| 亚洲精品视频在线观看视频| 国产精品论坛| 精品免费二区三区三区高中清不卡| 中文字幕亚洲综合久久五月天色无吗''| 91小视频网站| 国产精品少妇自拍| 在线免费a视频| 少妇高潮 亚洲精品| 人人玩人人添人人澡欧美| 亚洲激情一区二区| 另类小说视频一区二区| 精品一区二区在线观看视频| 欧美男生操女生| av免费在线网站| 成人9ⅰ免费影视网站| 红桃视频国产精品| 在线视频 日韩| 日韩欧美一区二区三区| 国产福利在线观看| 国产精品永久在线| 91久久电影| 日韩大尺度视频| 亚洲高清免费视频| 青青国产在线| 国产精品电影在线观看| 久久久久亚洲| 男人的天堂免费| 午夜视频在线观看一区二区| 视频在线不卡| 国产在线999| 欧美特黄一区| 青青草视频播放| 欧美亚洲综合久久| caoporm免费视频在线| 国产另类自拍| 日韩精品视频网站| 国产老头老太做爰视频| 精品免费国产二区三区| 亚洲免费福利| 在线观看福利一区| 成人在线视频首页| 国模私拍一区二区| 欧美成人精品xxx| 欧美福利在线播放网址导航| 91香蕉视频污版| 亚洲免费三区一区二区| 日韩在线一区二区三区四区| 日韩av成人在线| 香港欧美日韩三级黄色一级电影网站| 年下总裁被打光屁股sp| 日本久久电影网| 欧美卡一卡二| 四虎一区二区| 成人av在线播放网址| 中国黄色一级视频| 国外成人在线视频| 国产精品久久久久蜜臀| 亚洲男人在线天堂| 91精品国产一区二区三区|