精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

微軟BitDistill將LLM壓縮到1.58比特:10倍內存節省、2.65倍CPU推理加速

人工智能 新聞
近期研究提出了極低比特(extreme low-bit)LLM,例如使用 1.58 比特(即三值 {-1, 0, 1})表示的 BitNet。這種方法旨在顯著降低內存占用并加速推理,從而為 LLM 在下游應用中的高效部署提供一條可行途徑。

大語言模型(LLM)不僅在推動通用自然語言處理方面發揮了關鍵作用,更重要的是,它們已成為支撐多種下游應用如推薦、分類和檢索的核心引擎。盡管 LLM 具有廣泛的適用性,但在下游任務中高效部署仍面臨重大挑戰。隨著模型規模的急劇擴大,這些挑戰被進一步放大,尤其是在資源受限的設備上(如智能手機),內存占用和計算開銷都變得極其昂貴。

為應對這些問題,近期研究提出了極低比特(extreme low-bit)LLM,例如使用 1.58 比特(即三值 {-1, 0, 1})表示的 BitNet。這種方法旨在顯著降低內存占用并加速推理,從而為 LLM 在下游應用中的高效部署提供一條可行途徑。

然而,要讓 1.58 比特的 BitNet 在下游任務中達到與高精度模型相媲美的準確率,通常需要從零開始在大規模語料上進行預訓練,這會帶來巨大的計算和能耗成本。

如圖 1 所示,直接對已有的全精度 LLM 進行 1.58 比特量化感知訓練(Quantization-Aware Training, QAT)時,在特定下游任務上的訓練過程往往不穩定,難以保持原有的性能,并表現出較差的可擴展性:當模型規模從 0.6B 增大到 4B 時,相對于全精度基線的性能差距從 13.9 擴大到 15.3。

這一現象凸顯出:迫切需要專門為 1.58 比特 BitNet 設計的更有效的量化感知訓練方法。

在本研究中,來自微軟的研究者聚焦于將已有的 LLM 微調至 1.58 比特以適配特定下游任務,同時保持與全精度模型相當的性能。為此,本文提出了 BitDistill(BitNet Distillation)—— 一種具備良好可擴展性的量化感知訓練(QAT)框架,旨在彌合極端 1.58 比特量化與實際部署之間的性能差距。

在四個基準任務及多種模型規模上的大量實驗表明,BitDistill 具有出色的可擴展性,其下游任務性能可與全精度基線持平。同時,如圖 1 所示,BitDistill 在 CPU 上實現了 10 倍的內存節省和 2.65 倍的推理加速,顯著改善了延遲、吞吐量、內存效率和能耗,使其特別適合部署在資源受限的硬件平臺上。

  • 論文地址:https://www.arxiv.org/pdf/2510.13998
  • 代碼地址:https://github.com/microsoft/BitNet
  • 論文標題:BitNet Distillation

方法介紹:BitDistill

本文針對在資源受限設備上部署 LLM 以執行特定下游任務。重點是高效地將現有的預訓練 LLM 壓縮為 1.58 比特的 BitNet 模型,同時盡量減少性能損失與訓練成本。

BitDistill 框架包含三個關鍵階段:

第一階段:模型精煉階段。

與全精度模型不同,在標準初始化方案下,全精度模型的隱藏狀態方差通常能夠保持在一個穩定范圍內;而低比特量化模型(如 1.58 比特 LLM)則常常遭受過大的激活方差問題,導致優化過程不穩定并造成收斂性能下降。

為緩解這一問題,借鑒先前 1.58 比特 BitNet 的設計原則,本文在每個 Transformer 模塊內的關鍵位置引入了額外的歸一化層(SubLN),以實現穩定的優化過程。

第二階段:持續預訓練階段。

如圖 1 所示,直接將已有的全精度 LLM 轉換為 1.58 比特 BitNet 并在下游任務上進行微調,往往會得到次優結果。這是因為有限的訓練 token 數量不足以有效地將全精度權重適配到受限的 1.58 比特表示空間中,從而導致可擴展性較差:隨著模型規模的增大,其性能與全精度基線之間的差距也隨之擴大。

為此,本文提出了一個兩階段訓練流程:首先進行持續訓練階段,利用少量預訓練語料來實現所需的適配;隨后再在下游任務上進行微調。

第三階段:基于蒸餾的微調。

為更有效地緩解由精度降低帶來的性能退化,本文在下游任務微調階段引入了兩種知識蒸餾技術:其中,微調后的全精度 LLM 作為教師模型,而其 1.58 比特量化版本作為學生模型,通過蒸餾過程進行學習與性能對齊。

蒸餾過程主要利用 logits 蒸餾和多頭注意力蒸餾來恢復全精度性能。

實驗

實驗設置

BitDistill 方法的有效性在兩個代表性任務上進行評估:文本分類與文本摘要。分類任務采用通用語言理解評估 (GLUE) 基準中的 MNLI、QNLI 與 SST-2 三個數據集,摘要任務使用 CNN/DailyMail (CNNDM) 數據集。所有數據集均用于訓練與評估,以全面驗證方法性能。

BitDistill 的目標是將預訓練的全精度大語言模型 (LLM) 微調為適用于下游任務的 1.58-bit BitNet 模型。比較對象包括:

 (1) 在相同任務上直接微調的全精度 FP16 模型 (FP16-SFT);

 (2) 將全精度模型量化為 1.58-bit BitNet 后再微調的模型 (BitNet-SFT)。

實驗以 Qwen3 系列為基礎模型,涵蓋 0.6B、1.7B 與 4B 三種規模,并額外測試了 Qwen2.5 與 Gemma 等替代骨干網絡以評估模型類型影響。所有方法均采用貪心搜索確定學習率與訓練輪數,以兼顧性能與公平比較。最大訓練序列長度設為 512,批大小為 32,所有模型均在配備 8 塊 AMD Mi300X GPU 的服務器上訓練。

Logits 蒸餾溫度設為 5.0;分類任務中 λ=10、γ=1e5,摘要任務中 λ=1、γ=1e3,所有實驗中 αi=1.0。持續預訓練階段使用 FALCON 語料庫中采樣的 100 億個 token,與從頭訓練 1.58-bit 模型所需的約 4 萬億個 token 相比,成本幾乎可忽略。

評估設置

采樣參數固定為 top-p=1.0、溫度 = 0。分類性能以準確率衡量,摘要性能使用 BLEU、ROUGE-1/2/L/SUM 評估,最大生成長度為 4096 token。運行時效率通過 16 線程 CPU 的 token 吞吐量(tokens/s)報告。

主要結果

BitDistill 在各基準數據集上表現如表 1 與表 2 所示。與全精度基線相比,1.58-bit 模型在準確率和摘要質量上保持接近性能,同時推理速度提升約 2 倍,內存占用減少近 10 倍,展示出在資源受限環境下的顯著優勢。這表明通過合理蒸餾策略,激進量化仍可實現高性能。

文本分類任務上的結果。所有模型均由 Qwen3 系列 [QY+25] 初始化。每個指標和數據集的最高分均以粗體突出顯示。1.58-bit 的 BitDistill 模型實現了與 FP16 基線相當的性能,同時在所有數據集上將推理速度提升了 2 倍,并將內存占用降低了 10 倍。符號 * 表示在 BitDistill 中所使用的 FP16 教師模型。

文本摘要任務(CNNDM 數據集)上的結果。所有模型均由 Qwen3 系列 [QY+25] 初始化。每個指標和數據集的最高分均以粗體突出顯示。1.58-bit 的 BitDistill 模型實現了與 FP16 基線相當的性能,同時在所有數據集上將推理速度提升了 2 倍,并將內存占用降低了 10 倍。符號 * 表示在 BitDistill 中所使用的 FP16 教師模型。

將基礎模型替換為 Qwen2.5 和 Gemma 后,BitDistill 仍保持穩定性能(見表 4)。雖然不同預訓練模型間存在輕微波動,但整體趨勢一致,顯示該方法具備跨架構通用性和良好的部署適應性。

不同量化技術在文本分類任務上的結果。B、G、A 分別代表塊量化、GPTQ 和 AWQ。

消融實驗

 BitDistill 包含三個階段。消融實驗表明,移除任一階段均顯著降低性能(表 5),說明各階段相互補充,完整流程對效率與準確率平衡至關重要。

BitDistill 中不同階段的效果。此處使用 Qwen3 0.6B 作為基礎模型。M.D.、C.T. 和 D.T. 分別表示建模優化、持續預訓練以及基于蒸餾的微調。

在第三階段中,單獨使用 logits 蒸餾或注意力蒸餾均能提升性能,但聯合使用效果最佳(表 6)。兩種技術從不同角度緩解量化優化難題,其協同作用在極低比特環境下尤為顯著。

蒸餾技術的效果。此處,LD 表示公式 9 中的 logits 蒸餾,AD 表示公式 12 中的多頭注意力蒸餾。

BitDistill 與 Block-Quant、GPTQ、AWQ 等多種量化方案兼容。實驗顯示:(1) 無論底層量化方法為何,BitDistill 均能穩定提升性能;(2) GPTQ、AWQ 等復雜量化策略在其基礎上進一步增強效果。這表明 BitDistill 提供了一種普適的低比特模型增強框架。

分析

在階段一中插入 SubLN 層能穩定 1.58-bit BitNet 的優化并加速收斂。如圖 3 (a) 所示,帶 SubLN 的模型在 FALCON 語料庫上的微調表現優于未使用 SubLN 的版本。

(a) 使用 SubLN 將現有的大語言模型 (LLMs) 微調為 1.58-bit BitNet,可以獲得更優的性能和更快的收斂速度。

持續訓練可顯著縮小大模型的 1.58-bit 與 FP16 性能差距。權重分布可視化(圖 2)顯示,經過持續訓練后,BitNet 權重從近似高斯分布轉變為更接近從頭訓練的分布。該特征促使權重集中于 0 與 ±1 過渡區域,增加梯度更新的敏感度,從而提升模型對下游任務的擬合能力。

模型權重的可視化。上面兩行展示了從頭開始訓練的 BitNet 的量化權重,及其對應的 FP16 分布。下面兩行展示的是從 LLM 加載權重并進行持續訓練后,BitNet 的量化權重及其對應的 FP16 分布。

在第三階段,單層注意力蒸餾優于多層蒸餾(圖 3 (b))。后期層的蒸餾效果更佳,表明層選擇對蒸餾質量至關重要。

(b) 在 Qwen3 0.6B 模型上,通過蒸餾不同層所獲得的 MNLI 準確率對比。

使用更大規模的 FP16 教師(如 Qwen3-1.7B、Qwen3-4B)顯著提升學生模型性能(圖 3 (c)),甚至超越同規模的 FP16 模型,證明高質量教師能為 BitDistill 帶來額外收益。

(c) 使用不同規模的 FP16 教師模型對 Qwen3-0.6B 進行蒸餾,所獲得的 MNLI 準確率對比。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-05-23 14:06:53

微軟研究

2024-12-05 13:50:00

AI大模型

2024-07-08 13:04:01

2021-07-27 10:10:21

CuPyNumpyPython

2025-07-24 16:34:25

AI模型測試

2020-02-25 17:40:52

Python循環內存

2013-09-24 09:40:41

Java圖形加速

2025-04-27 09:15:40

2024-12-26 16:00:00

英特爾推理模型

2019-12-25 14:08:50

Pandas數據計算

2025-05-28 08:51:00

大模型華為LLM

2024-08-01 08:40:00

2022-10-31 15:35:16

開源引擎

2023-12-19 13:32:00

模型數據

2025-07-11 08:54:00

2025-07-10 09:14:37

2023-09-10 12:37:38

模型英偉達

2025-06-11 09:15:51

2025-06-11 14:39:50

AILLMMistral

2020-07-22 01:21:26

軟件開發開發代碼
點贊
收藏

51CTO技術棧公眾號

亚洲精品日产aⅴ| 人人九九精品视频| 要久久电视剧全集免费 | 亚洲18在线看污www麻豆| 精品午夜福利视频| 自拍偷拍欧美日韩| xnxx国产精品| 欧美裸体男粗大视频在线观看| 色综合av综合无码综合网站| 亚洲第一天堂影院| 99久久精品网站| 在线一区二区三区做爰视频网站| 国产欧美日韩伦理| 丁香花五月激情| 成人豆花视频| 综合久久给合久久狠狠狠97色 | 一区二区三视频| 在线观看免费av片| 日韩精品中文字幕吗一区二区| 午夜精品久久久久久久蜜桃app| 91免费人成网站在线观看18| 五月婷婷六月香| 成人一区福利| 91丨九色丨蝌蚪丨老版| 91久热免费在线视频| 日本一区二区三区精品| 亚洲精品tv久久久久久久久久| 在线观看精品一区| av在线com| 少妇av在线播放| 精品91在线| 亚洲大胆美女视频| 日韩视频免费播放| 高潮毛片7777777毛片| 欧美三级在线| 精品成人佐山爱一区二区| 少妇久久久久久被弄到高潮| 欧美 日韩 中文字幕| 99精品视频免费观看视频| 亚洲精品久久久久久久久久久| 成人综合视频在线| 久久99久久| 亚洲另类av| 欧美va在线播放| 久久久久久久久久久99| 人成在线免费视频| 久久精品免费| www.xxxx精品| 一二三级黄色片| 色成人免费网站| 亚洲图片激情小说| 国产精品区一区二区三含羞草| av大片免费观看| 日韩免费在线| 欧美一区二区三区四区在线观看 | 精品999网站| 欧美老女人性视频| 欧美日韩大片在线观看| 精品久久ai| 日韩欧美aaa| 四虎一区二区| 中文字幕视频免费观看| 91精品天堂福利在线观看| 日韩中文字幕精品| 小早川怜子一区二区的演员表| 91嫩草精品| 精品久久久一区二区| 亚洲一区二区在线免费观看| xxxwww在线观看| 日日夜夜免费精品| 久久久久国产精品免费| 一级黄色录像毛片| 91精品国产自产精品男人的天堂 | 欧美久久久久久久久久久久久| 黄色美女视频在线观看| 26uuu成人网一区二区三区| 欧美精品一区三区在线观看| 一本色道久久综合熟妇| 日韩一区二区久久| 日本精品视频在线播放| 欧美人妻精品一区二区免费看| 欧美~级网站不卡| 国产一区二区三区四区福利| 999热精品视频| 先锋欧美三级| 欧美高清hd18日本| 欧美在线观看视频网站| 黄页网站在线观看免费| 婷婷国产在线综合| 日本a√在线观看| 波多野结衣在线高清| 婷婷夜色潮精品综合在线| 老司机午夜av| 欧美经典影片视频网站| 欧美日本一区二区三区四区| 欧美 日韩精品| 日韩一级特黄| 日本高清不卡aⅴ免费网站| 亚洲精品无码国产| 污影院在线观看| 中文字幕制服丝袜一区二区三区| 免费一区二区三区在在线视频| 亚洲精品911| 久久久久久影视| 精品一区久久| 无码国产色欲xxxx视频| 国产999精品久久久久久绿帽| 成人午夜在线视频一区| 国产一区二区在线视频观看| 久久婷婷丁香| 国产精品极品尤物在线观看| wwwwww国产| 国产在线看一区| 成人亲热视频网站| 可以在线观看的av| 久久午夜羞羞影院免费观看| 免费精品视频一区二区三区| 久操视频在线观看| 《视频一区视频二区| 99热自拍偷拍| 亚洲精品一区| 色哟哟日韩精品| 成年人小视频网站| 成人线上播放| 欧美wwwxxxx| 久久久国产精华液| 久久精品国产秦先生| 91精品视频在线| 在线观看xxx| 亚洲网友自拍偷拍| 337p粉嫩大胆噜噜噜鲁| 51亚洲精品| 久久精品国产久精国产思思| 男人的天堂久久久| 免费在线观看视频一区| 亚洲999一在线观看www| а√天堂中文在线资源bt在线| 国产精品久久毛片| 强开小嫩苞一区二区三区网站 | 日韩av三区| 亚洲欧美一区二区激情| 神马久久久久久久久久久| 黄页网站一区| 国产成人精品久久二区二区91| 亚洲成人av网址| 精品一区二区三区在线观看 | 日韩av不卡一区| 国内精品久久久久| 一二三区免费视频| 狠狠色狠狠色综合日日91app| 99在线高清视频在线播放| 无码国产色欲xxxx视频| 亚洲成a人v欧美综合天堂下载 | yw.139尤物在线精品视频| 无码免费一区二区三区| 国产亚洲综合av| 91制片厂免费观看| 625成人欧美午夜电影| 亚洲精品中文字幕av| 99久久久免费精品| 激情六月婷婷综合| 国产乱子伦精品视频| 中文久久电影小说| 久久久久久久国产精品| 欧美一级视频免费| 欧美性猛xxx| 欧美人与性囗牲恔配| 久久精品国产亚洲aⅴ| 五月天综合婷婷| 日韩精品一级| 91高清视频在线免费观看| 在线观看免费黄色小视频| 国产精品久久久久一区| japan高清日本乱xxxxx| 国产成人久久| 欧美激情18p| 曰批又黄又爽免费视频| 自拍偷拍亚洲综合| 日本在线不卡一区二区| 欧美高清视频手机在在线| 2019亚洲日韩新视频| 精品人妻伦一区二区三区久久 | 中文字幕第四页| 国产精品久线观看视频| 国产人妻精品午夜福利免费| 日本午夜一区| 日本成人免费在线| 欧美一区二区在线观看视频| 欧美日韩国产综合新一区 | 老司机凹凸av亚洲导航| 国产成人自拍视频在线观看| 18+视频在线观看| 欧美日韩国产高清一区| 青青草原在线免费观看视频| 91丨九色丨尤物| 91精产国品一二三产区别沈先生| 99亚洲伊人久久精品影院红桃| 日韩欧美三级一区二区| 一个人www视频在线免费观看| 在线视频亚洲欧美| 中文无码av一区二区三区| 亚洲精品你懂的| avav在线看| 亚洲成人日韩| 欧美日韩一区二区三区免费| 精品午夜视频| 国产极品jizzhd欧美| 女子免费在线观看视频www| 欧美一区永久视频免费观看| 日本特级黄色片| 一区二区三区精密机械公司| 在线观看视频你懂得| 五月激情综合| 蜜桃网站成人| 超碰精品在线观看| 成人激情视频小说免费下载| 在线视频超级| 久久久久久久影院| 美女国产在线| 欧美一区二区三区在线观看 | 菠萝蜜视频国产在线播放| 欧美日韩成人一区二区| 精品午夜福利视频| 亚洲男女毛片无遮挡| 中文字幕第二区| 精品综合久久久久久8888| 国产裸体舞一区二区三区| 亚洲小说区图片区| 中文字幕精品在线播放| 天天综合久久| 亚洲精品欧美精品| 精品久久亚洲| 国产精品入口免费视| 亚洲精品承认| 日韩欧美资源站| 日韩经典在线观看| 久久这里只有精品首页| av av在线| 波多野结衣中文字幕一区 | 视频一区二区三区中文字幕| 日本免费不卡一区二区| 亚洲第一毛片| 国产一级爱c视频| 亚洲黄色成人| 日本欧美精品久久久| 激情中国色综合| 久久91精品国产91久久跳| 黄网站在线免费看| xxxxx91麻豆| 男人天堂手机在线| 久久精品免费电影| 国产在线观看免费麻豆| 久久九九全国免费精品观看| 欧洲美女少妇精品| 久久色精品视频| 91精品国产乱码久久久| 在线一区二区三区四区五区| 少妇一级淫片日本| 亚洲夂夂婷婷色拍ww47| 欧美成人免费观看视频| 91免费观看视频| 中文字幕一区二区三区人妻| 久久99最新地址| 911av视频| 国产91富婆露脸刺激对白| 精品久久久久一区二区| 久久综合精品国产一区二区三区 | 日本欧美一二三区| 88xx成人网| 国模精品视频一区二区三区| 2018av在线| www.日韩系列| 日韩欧美一起| 国产99视频精品免视看7| 欧洲美女精品免费观看视频| 成人做爽爽免费视频| 丁香婷婷成人| 91青草视频久久| 澳门精品久久国产| 欧美日韩一区二| 一个色综合网| 亚洲精品国产精品国自产观看| 888久久久| 欧美在线一区视频| 日一区二区三区| 精品国产一二区| 91蜜桃免费观看视频| 亚洲女同二女同志奶水| 亚洲国产成人va在线观看天堂| 99国产精品无码| 久久久精品天堂| 91狠狠综合久久久| 欧美日韩国产精品一区二区三区四区| 国产99久久久久久免费看| 日韩一区二区三区在线| 香蕉久久国产av一区二区| 神马久久久久久| 亚洲视频tv| 国语自产在线不卡| 四虎国产精品免费久久| 国新精品乱码一区二区三区18| 欧美一区二区三| 僵尸世界大战2 在线播放| 久久成人久久爱| 精品无码人妻一区| 亚洲综合在线五月| 中文字幕 人妻熟女| 亚洲第一国产精品| 黄色精品免费看| 国产福利成人在线| 欧美a级网站| 一二三在线视频| 在线一区免费| 日韩精品无码一区二区三区免费| 亚洲经典在线| 在线播放黄色av| 国产精品五月天| 9.1片黄在线观看| 岛国精品视频在线播放| www.亚洲天堂.com| www.欧美精品| 国产精品第一国产精品| 成人国产精品久久久| 九九在线精品| 手机成人在线| 免费日韩视频| 日本a√在线观看| 久久久久久影视| 久久夜色精品国产噜噜亚洲av| 在线亚洲欧美专区二区| 天天操天天干天天爱| 欧美国产在线电影| 在线观看欧美| 中文字幕一区二区三区最新| 日本中文字幕一区二区有限公司| 欧美在线aaa| 免费成人在线影院| 亚洲精品成人无码| 亚洲日韩欧美一区二区在线| 亚洲天堂五月天| 亚洲欧洲免费视频| 日本免费在线视频| 国产日产久久高清欧美一区| 2020国产精品极品色在线观看| 中文字幕欧美日韩一区二区| 蜜臀a∨国产成人精品| 日本欧美一区二区三区不卡视频| 欧美综合色免费| 国产小视频免费在线网址| 最近更新的2019中文字幕| av一区在线| 午夜精品视频在线观看一区二区| 日韩电影免费在线观看网站| 永久免费毛片在线观看| 欧美三级在线看| 手机看片福利永久| 91国产高清在线| 群体交乱之放荡娇妻一区二区| av免费观看网| 久久精品视频一区二区三区| 国产精品sm调教免费专区| 日韩亚洲综合在线| 日本精品在线播放| 久久国产精品网| 久久久久久久久久久久久久久99| 一级特黄免费视频| 色黄久久久久久| 久久在线观看| 国产69精品久久久久久久| 久久亚洲精精品中文字幕早川悠里| 日本三级一区二区三区| 久久久成人av| 国产伦精品一区二区三区免费优势 | 久草在线免费福利资源| 国产精品视频专区| 国产suv精品一区二区四区视频| a级黄色一级片| 国产视频一区二区在线| 国产精品欧美综合亚洲| 亚洲欧洲一区二区三区在线观看| 成人看片网页| www成人免费| 国产喂奶挤奶一区二区三区| 国产人妖一区二区| 少妇精69xxtheporn| 2023国产精华国产精品| 国产精品天天av精麻传媒| 日本一区二区三区国色天香| 青青草免费观看视频| 日日狠狠久久偷偷四色综合免费| 成人精品毛片| 黄大色黄女片18第一次| 亚洲成人免费在线观看| 137大胆人体在线观看| 国产精品扒开腿做爽爽爽视频| 天天做综合网| 中文字幕一区二区三区人妻| 欧美一卡二卡三卡| 蜜桃视频成人m3u8| 国产 日韩 欧美在线|