精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

1.58bit不輸FP16!微軟推出全新模型蒸餾框架,作者全是華人

人工智能 新聞
微軟最新推出的蒸餾框架BitNet Distillation(簡稱BitDistill),實現了幾乎無性能損失的模型量化。

1.58bit量化,內存僅需1/10,但表現不輸FP16?

微軟最新推出的蒸餾框架BitNet Distillation(簡稱BitDistill),實現了幾乎無性能損失的模型量化。

該框架在4B及以下的Qwen、Gemma上已被證實有效,理論上可用于其他Transformer模型。

同等硬件性能下,使用該方法量化后的推理速度提升2.65倍,內存消耗僅1/10。

網友看了之后表示,如此一來昂貴的GPU將不再是必需品,英偉達的好日子要到頭了。

BitDistill框架設計

BitDistill包含三個依次銜接的階段,分別是模型結構優化(Modeling Refinement)、繼續預訓練(Continue Pre-training)和蒸餾式微調(Distillation-based Fine-tuning)。

建模結構優化的主要目標是為1.58-bit模型訓練提供結構層面的支持,緩解低精度訓練中常見的優化不穩定問題。

在傳統的全精度Transformer模型中,隱藏狀態的方差通常在預訓練時已被良好控制。然而,當模型被壓縮到極低位寬(如1.58-bit)后,激活值在經過量化前的分布可能會出現方差膨脹等問題,從而導致訓練過程震蕩甚至失敗。

為了應對這一問題,BitDistill在每一個Transformer層中引入了一個名為SubLN(Sub-layer LayerNorm)的歸一化模塊。

具體來說,SubLN的插入位置有兩個,一是在多頭自注意力模塊的輸出投影之前,二是在前饋網絡的輸出投影之前。

這樣的插入方式,不改變主干計算路徑,僅在關鍵位置對信號做規范化調整,使得量化后模型具備更好的收斂性。

這種設計使得量化前的表示能夠在進入下一計算階段前被重新歸一化,有效抑制激活尺度的發散,提升訓練穩定性。

經過第一階段的結構修改后,模型雖具備量化訓練的能力,但如果直接將其用于特定任務的微調,尤其是在模型規模較大時,仍會遭遇顯著的性能損失。

也就是說,隨著模型參數增大,1.58-bit模型與其全精度版本之間的性能差距反而進一步擴大。

為了緩解這一問題,BitDistill設計了一個輕量級的繼續預訓練階段。在此階段中,模型會在少量通用語料上進行自回歸語言建模訓練,訓練目標為最大化條件概率。

這一過程并不涉及特定任務數據,也不需精調標簽,僅是讓模型權重從全精度空間緩慢遷移到適合1.58-bit表示的分布上。

換句話說,這個階段的本質是一種預適配訓練,讓模型“學會如何被量化”,避免在微調階段才倉促適應低位寬帶來的信息丟失。

完成結構調整與繼續預訓練后,模型被正式引入到具體下游任務中進行1.58-bit量化訓練。

為了彌補量化后模型在表達能力上的損失,BitDistill采用了一種雙重蒸餾機制——Logits蒸餾與多頭注意力蒸餾。

這一階段的目的是從原始的全精度模型中提取關鍵行為模式,并引導低位寬模型在具體任務上學習這些模式,從而恢復性能。

Logits蒸餾是將全精度模型輸出的類概率分布作為“軟標簽”,引導量化模型在預測分布上向其靠攏。具體做法是使用Kullback–Leibler散度(KL散度)來最小化兩者輸出分布之間的差異。

由于Transformer模型的性能很大程度依賴其注意力機制,BitDistill進一步從結構層面對注意力關系進行蒸餾。這種蒸餾不是對注意力權重做對齊,而是對Q、K、V向量構成的關系矩陣進行分布層面的模仿。

具體而言,對于選定的某一層(通常是模型后部的一層),分別從教師模型與學生模型中提取Q、K、V三組張量,并計算它們之間的點積相關性,形成關系分布矩陣。

然后通過KL散度使兩者對齊,訓練學生模型還原出與教師模型相似的結構依賴。

FP16無損量化至1.58bit

BitDistill展示出在多個下游任務中幾乎等同于全精度模型的表現,同時顯著降低了內存開銷并提升了推理速度。作者在兩個典型任務類型上進行了全面實驗,分別是文本分類與文本摘要。

以Qwen3為基礎模型,測試中的分類任務包括MNLI、QNLI與SST-2,摘要任務則采用CNN/DailyMail數據集作為標準。

分類任務中,BitDistill的1.58-bit模型在準確率與生成質量指標上與全精度微調模型(FP16-SFT)幾乎一致,而顯著優于直接對量化模型進行微調的BitNet-SFT。

在文本摘要任務中,BitDistill同樣表現出高度保真的生成能力。

以ROUGE和BLEU等標準指標衡量,在CNN/DailyMail上,BitDistill所生成文本的BLEU為14.41,ROUGE-L為27.49,與FP16模型的13.98和27.72幾乎等同,甚至在BLEU上略有超出。

相比之下,直接量化后的模型在BLEU與ROUGE上普遍下降2至3個百分點。

為了驗證BitDistill在不同模型架構上的通用性,作者還將其應用于Gemma和Qwen2.5等其他預訓練模型,結果BitDistill都能實現對全精度性能的高度還原。

進一步的實驗表明,BitDistill在不同量化策略下也具備良好的兼容性。作者將其與常見的Block-Quant、GPTQ、AWQ等量化方法結合,在分類任務上依然能夠穩定地恢復原始性能,證明該方法可作為一個獨立于量化算法的上層蒸餾方案,適用于多種后量化優化場景。

One More Thing

BitStill的作者全部來自微軟研究院,而且均為華人。

通訊作者為微軟亞洲研究院副總裁、武漢大學校友韋福如博士。

他讀博期間就曾在MSRA實習,畢業后到IBM工作,又于2010年重回微軟,工作至今。

第一作者Xun Wu為清華計算機碩士,本科畢業于中南大學,2023年開始到微軟研究院實習,畢業后正式入職。

其他作者名單如下:

論文地址:https://arxiv.org/abs/2510.13998

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-10-22 18:07:43

LLMs開源大模型

2025-04-21 18:43:31

深度學習微軟開源

2025-10-17 02:00:00

2023-11-10 12:51:29

微軟AI

2024-01-12 21:18:22

負樣本大模型蒸餾

2024-10-21 12:10:00

模型訓練

2021-04-16 07:38:40

微軟Edge瀏覽器

2021-05-13 16:45:10

人工智能自然語言技術

2020-09-16 14:27:08

工具開源開發

2014-02-13 10:14:53

視頻會議Polycom

2013-11-11 09:43:03

2023-11-02 12:49:00

AI模型

2023-02-09 16:32:16

混合精度深度學習

2020-11-20 17:03:11

AI 數據人工智能

2016-12-20 14:20:05

Android網絡框架

2010-03-31 22:20:51

2014-11-07 08:45:53

微軟Office

2025-01-22 09:32:30

2013-03-14 13:39:13

Polycom微軟Lync2013

2023-11-15 14:17:23

微軟語言模型AI 模型
點贊
收藏

51CTO技術棧公眾號

成人av一区二区三区| 日韩精品久久| 欧美香蕉大胸在线视频观看| 欧美在线激情| 国产三级小视频| 一区二区三区四区五区在线 | 亚洲精品久久久久久无码色欲四季| 亚洲日产国产精品| 日韩中文字幕在线精品| 制服丝袜第一页在线观看| 日韩一区二区三区免费视频| 亚洲午夜在线电影| 在线一区亚洲| 欧洲综合视频| 风流少妇一区二区| 国产欧美一区二区三区四区 | 欧美亚洲一区二区在线| 中文字幕色呦呦| eeuss影院www在线播放| jvid福利写真一区二区三区| 91久久久久久久久| 羞羞色院91蜜桃| 国产精品久久久久久久久久妞妞 | 免费在线看污片| 国产精品久久久久aaaa| 欧美日韩一区二区三| 亚洲精品久久久蜜桃动漫| 国内精品在线播放| 国产精品夜色7777狼人| 日韩三级一区二区| 国产日本精品| 国产69精品久久久久9999| 国产精品丝袜一区二区| 成人在线免费观看视频| 亚洲欧美制服第一页| 亚洲激情 欧美| www.成人| 91精品久久久久久久久99蜜臂 | 国精品**一区二区三区在线蜜桃| 国产999精品久久久| 日韩xxx高潮hd| 欧美日韩福利| 欧美激情视频网| 日本妇女毛茸茸| 亚洲自拍偷拍网| 久久久精品中文字幕| 99久久精品久久亚洲精品| 精品久久影院| 中文字幕精品在线视频| 久操视频在线观看免费| 欧美日韩第一| 深夜福利一区二区| 成人欧美一区二区三区黑人一 | 色8久久久久| 欧美日韩高清不卡| 国产成年人视频网站| 国精品产品一区| 欧美乱妇23p| 手机在线国产视频| 欧美二区观看| 精品久久99ma| av鲁丝一区鲁丝二区鲁丝三区| 国产精品极品| 国产视频在线观看一区二区| 国产福利短视频| 国产精品免费99久久久| 亚洲一级黄色片| 亚洲AV成人无码网站天堂久久| 日韩系列欧美系列| 美女啪啪无遮挡免费久久网站| 懂色av懂色av粉嫩av| 欧美三级免费| 欧美又大粗又爽又黄大片视频| 黄色av一级片| 麻豆视频观看网址久久| 91在线看网站| 婷婷婷国产在线视频| 久久精品视频一区二区三区| 亚洲精品中文综合第一页| 黄色免费网站在线观看| 亚洲电影激情视频网站| 日本熟妇人妻xxxxx| 成人全视频在线观看在线播放高清 | 欧美成人一区二区三区电影| 国产一级在线视频| 天堂精品中文字幕在线| 91免费看片在线| 神马午夜一区二区| 欧美激情综合网| 一级特黄妇女高潮| 暖暖成人免费视频| 91精品国产乱| 欧美熟妇一区二区| 午夜精品视频| 国产成人精品免费久久久久 | 国模少妇一区二区三区| 精品国产区在线| 午夜在线免费观看视频| 亚洲国产精品人人做人人爽| 国产又黄又猛又粗又爽的视频| 精品国模一区二区三区欧美| 日韩精品一区二区视频| 久久国产波多野结衣| 国产欧美高清| 成人午夜在线视频一区| 麻豆导航在线观看| 亚洲自拍偷拍综合| 亚洲激情在线观看视频| 国产亚洲成av人片在线观黄桃| 中文字幕亚洲欧美一区二区三区| 日本熟妇乱子伦xxxx| 精品系列免费在线观看| 欧美高清一区二区| xxxx视频在线| 91精品国产丝袜白色高跟鞋| 中文字幕高清视频| 亚洲欧洲一区| av一区和二区| 黄色免费在线看| 欧美色偷偷大香| 播金莲一级淫片aaaaaaa| 激情视频一区二区三区| 成人久久一区二区三区| 福利片在线观看| 欧美日韩一区二区免费视频| 一区二区三区四区影院| 亚洲一级淫片| 91丨九色丨国产在线| 国产二区在线播放| 欧美日韩在线免费观看| xxxx视频在线观看| 中文字幕一区二区三三 | 国产又大又长又粗| 亚洲国产高清在线| 欧美少妇性生活视频| 欧美国产中文高清| 毛片精品免费在线观看| 国产免费叼嘿网站免费| 亚洲欧洲日韩在线| 欧美日韩中文不卡| 日本女优一区| 国产精品视频自拍| 香蕉视频网站在线观看| 欧美日韩色综合| 色婷婷国产精品免| 久久99久久99| 黄色a级在线观看| www一区二区三区| 久久视频国产精品免费视频在线| 91片黄在线观看喷潮| 日韩一区中文字幕| www.污网站| 你懂的国产精品永久在线| 亚洲精品免费一区二区三区| 97caopor国产在线视频| 精品少妇一区二区| 欧美亚韩一区二区三区| 91首页免费视频| 日韩在线第三页| 日韩久久久久| 亚洲aa中文字幕| 超碰在线97国产| 日韩不卡中文字幕| 日韩三级一区二区| 中文字幕字幕中文在线中不卡视频| 日韩欧美理论片| 欧美午夜国产| 精品亚洲一区二区三区四区五区高| 欧美少妇网站| 日韩在线视频播放| www天堂在线| 精品久久久久久中文字幕一区奶水| 欧美 日本 国产| 日本91福利区| 91视频 - 88av| 丝袜美腿一区二区三区动态图| 国产精品99久久99久久久二8| 日韩欧美小视频| 精品黑人一区二区三区久久| 亚洲第一在线播放| 国产精品色一区二区三区| 国产999免费视频| 一区二区三区国产在线| 一区二区三区欧美在线| 国产一区调教| 国产精品视频xxxx| 黄色在线看片| 中文字幕av一区| 天堂网在线资源| 欧美日韩不卡一区二区| 国产在线免费视频| 国产精品久久久久影视| 欧美久久久久久久久久久| 爽好久久久欧美精品| 蜜臀av.com| 久久综合影院| 成人免费看片网址| 99riav视频一区二区| 欧美精品xxx| 91.xxx.高清在线| 亚洲国产精品推荐| 国产欧美日韩成人| 日本福利一区二区| 久草视频精品在线| 1区2区3区国产精品| 日韩人妻无码一区二区三区| 国产精品一二三区| 丝袜制服一区二区三区| 99综合视频| 成人av在线播放观看| 国产一区二区三区四区大秀| 国产伦精品一区二区三区在线| 欧美日韩免费电影| 日韩美女激情视频| 97在线超碰| 欧美成人精品一区| 日本天堂在线观看| 亚洲一级黄色片| 欧美日韩视频精品二区| 精品捆绑美女sm三区 | 国产一区二区三区久久久| 久久久久久香蕉| 日韩视频一区| 日韩成人手机在线| 欧美激情成人在线| 国产高清免费在线| 国产精品成人av| 午夜精品区一区二区三| 久久av网址| 欧美日韩亚洲综合一区二区三区激情在线 | 亚洲蜜桃精久久久久久久久久久久| 久久国产成人午夜av影院| 欧美亚洲日本在线观看| 欧美中文字幕| 久久婷婷五月综合色国产香蕉| 亚洲大片在线| 五月丁香综合缴情六月小说| 极品尤物久久久av免费看| 免费人成自慰网站| 国内自拍视频一区二区三区| 国产精品国产三级国产专区51| 你懂的网址国产 欧美| 亚洲精品天堂成人片av在线播放 | 国产三级伦理片| 91精品在线观看入口| 96日本xxxxxⅹxxx17| 欧美日韩国产首页| 国产又大又长又粗| 欧美一级夜夜爽| 亚洲国产欧美另类| 亚洲成人中文字幕| 日本v片在线免费观看| 国产偷国产偷亚洲清高网站| 男人久久精品| 中文字幕不卡av| 欧美日本一道| 欧美成人中文字幕在线| 欧美性猛片xxxxx免费中国 | 桥本有菜av在线| 欧美日本不卡| 玩弄中年熟妇正在播放| 亚洲欧美久久| 九色porny自拍| 国产麻豆欧美日韩一区| 亚洲色图欧美另类| 91蜜桃免费观看视频| 中文字幕网站在线观看| 国产精品美女久久久久高潮| 99久久99久久精品国产| 亚洲永久精品大片| 免费观看成人毛片| 欧美在线色视频| 国产99久久九九精品无码免费| 精品国产一区二区三区久久久蜜月 | 日韩精品在线观看视频| 成人在线播放视频| 欧美成人精品影院| 东京一区二区| 91美女片黄在线观| 极品国产人妖chinesets亚洲人妖| 欧美日韩国产综合视频在线| 日韩免费av| 黄色成人在线看| 久久99最新地址| 国产十八熟妇av成人一区| 国产亚洲一区二区三区四区 | 亚洲巨乳在线| 欧美日韩一区二区三区69堂| 国产·精品毛片| 女女互磨互喷水高潮les呻吟| 亚洲欧洲精品天堂一级| 国产一级片播放| 欧美日韩在线播放三区四区| 亚洲国产999| 主播福利视频一区| free性m.freesex欧美| 国产美女精彩久久| 欧美a一欧美| 精品一区二区三区毛片| 久久综合激情| 最新国产精品自拍| 国产精品美女一区二区| 99热在线观看免费精品| 337p亚洲精品色噜噜| 免费人成在线观看网站| 欧美日本中文字幕| 国产a亚洲精品| 久热这里只精品99re8久| 欧美一区综合| 国产精品自在自线| 久久久久久久一区| 日韩大片免费在线观看| 欧美一级片在线看| yiren22综合网成人| 欧美一区二区三区图| 亚洲一区二区三区四区电影 | 91精品国产麻豆国产自产在线| 黄网在线免费| 欧美中文在线字幕| 国产精品极品| 日韩精品在线观看av| 黄网站免费久久| 正在播放国产对白害羞| 一本大道av一区二区在线播放| 日韩一区二区三区不卡| 久久6精品影院| 成人污污视频| 在线成人性视频| 免费国产亚洲视频| 毛片aaaaaa| 欧美午夜片在线看| 国产经典自拍视频在线观看| 青青草国产精品一区二区| 国产色噜噜噜91在线精品| 欧美大黑帍在线播放| 国产福利精品导航| 麻豆changesxxx国产| 日韩一区二区在线看| av免费在线免费观看| 91av免费看| 欧美激情第二页| 逼特逼视频在线观看| 亚洲综合一二区| 六月婷婷综合网| 1769国产精品| 免费成人av| 日韩一级片播放| 国产精品久久久久影院亚瑟| 亚洲手机在线观看| 久久精品国产2020观看福利| 91丨精品丨国产| 欧美a级黄色大片| 国产成人精品免费| 国产乡下妇女做爰毛片| 日韩精品极品在线观看播放免费视频| 蜜臀久久精品| 日本一区二区三区四区在线观看| 免费成人av在线| 伊人在线视频观看| 亚洲成人精品久久| 中文不卡1区2区3区| 日本中文不卡| 久99久精品视频免费观看| 校园春色 亚洲| 亚洲激情视频网站| 全亚洲第一av番号网站| 一区二区三区四区不卡| 国产成人精品免费一区二区| 国产免费观看av| 中文字幕日韩免费视频| 色悠久久久久综合先锋影音下载| 成年人看的毛片| 久久久国产精品不卡| 亚洲一区二区人妻| 欧美黑人狂野猛交老妇| 美女少妇全过程你懂的久久| 亚洲久久中文字幕| 一区二区成人在线| 国产女主播在线写真| 91丝袜美腿美女视频网站| 亚洲区一区二| 你懂得视频在线观看| 日韩精品中午字幕| 日韩pacopacomama| 成人一区二区av| 久久久久久久久久久久久夜| 国产免费的av| 欧美最猛性xxxx| 永久91嫩草亚洲精品人人| av无码av天天av天天爽| 欧美二区乱c少妇| 女厕盗摄一区二区三区| 欧美日韩一级在线| 91看片淫黄大片一级在线观看| 国产又爽又黄免费软件| 911国产网站尤物在线观看| 希岛爱理一区二区三区| av鲁丝一区鲁丝二区鲁丝三区| 欧美一区二区三区系列电影| 亚洲国产福利|