精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

1-bit大模型還能再突破!新一代BitNet架構啟用4位激活值

人工智能
近日,BitNet系列的原班人馬推出了新一代架構:BitNet a4.8,為1 bit大模型啟用了4位激活值,支持3 bit KV cache,效率再突破。

量化到1 bit的LLM還能再突破?

這次,他們對激活值下手了!

近日,BitNet系列的原班人馬推出了新一代架構:BitNet a4.8,為1 bit大模型啟用了4位激活值:

圖片圖片

論文地址:https://arxiv.org/pdf/2411.04965

眾所周知,激活值量化通常是比較難辦的。

本次的BitNet a4.8采用混合量化和稀疏化策略,來減輕異常通道引入的量化誤差。

簡單來說就是,對注意力層和FFN層的輸入采用4位量化,同時用8位整數稀疏化中間狀態。

大量實驗表明,BitNet a4.8在相同的訓練成本下,實現了與前代BitNet b1.58相當的性能,同時因為可以吃到4位(INT4/FP4)內核的計算紅利,實現了更快的推理速度。

BitNet a4.8僅激活55%的參數,并支持3 bit KV cache,進一步提升了大規模LLM部署和推理的效率。

BitNet a4.8

圖片圖片

模型架構

模型的整體架構如圖1所示,BitNet a4.8采用了與BitNet b1.58相同的布局。

作者使用BitLinear替換注意力(MHA)和前饋網絡(FFN)中的線性投影,以從頭開始學習1.58 bit權重。對于激活值,采用混合量化和稀疏化策略來減輕異常值維度引入的誤差。

圖片圖片

圖2說明了模型大小為7B的BitNet b1.58中,每個模塊輸入的分布。

注意力層和FFN層的輸入通常類似高斯分布,而在FFN下采樣之前的激活值和注意力中的輸出投影中,發現了很多異常值通道和大量接近零的條目(全精度LLM也有類似觀察結果)。

圖片圖片

如圖3所示,直接將低位量化應用于這些中間狀態會引入很大的量化誤差。

因此,作者使用Q-Sparse的稀疏化方法,將這些中間狀態保持在8位(同時消除了計算瓶頸)。

對于自注意層的輸出投影,使用sparsify-then-quantize函數:

圖片

兩個Q分別表示權重W和激活X的量化函數,M是掩碼,根據激活X的絕對值取topK,⊙是元素乘法。

具體來說,權重量化和激活值量化函數可以表述為:

圖片

對于FFN,這里采用squared ReLU和門控線性單元(GLU)來進一步提高激活的稀疏性:

圖片

根據初步實驗的結果,使用squared ReLU時,下采樣輸入的稀疏性超過了80%,且對性能的影響最小。

此外,作者還觀察到gate + squared ReLU的輸出也表現出高激活稀疏性(7B模型為67.5%)。通過首先計算gate projection,然后僅在非零通道上執行up projection,可以進一步減少推理的計算量。

相比之下,attention和FFN的輸入中包含的異常值特征要少得多,可以使用absmean函數將激活值量化為4位整數:

圖片

模型訓練

初始化

BitNet a4.8使用BitNet b1.58的權重開始訓練,分為W1.58A8與W1.58A4兩階段。

第一階段使用8位激活和GLU + squared ReLU訓練模型;第二階段采用上面介紹過的混合量化和稀疏化。

圖片圖片

BitNet a4.8只需少量訓練,即可快速適應4bit位寬和稀疏激活,同時性能損失可以忽略不計。

梯度近似

作者使用直通估計器(STE)對BitNet a4.8進行梯度逼近,使用混合精度訓練來更新參數。

圖片圖片

這里直接繞過了不可微函數,包括反向傳播過程中的量化函數和topK稀疏函數。對于混合精度訓練,保持全精度latent weight來累積參數更新。

模型量化

浮點量化提供了比基于整數的量化更寬的動態范圍,這對于處理激活值的長尾分布至關重要。

研究人員將FFN下采樣層的輸入保留為8位整數,其他激活值使用MinMax量化器量化為FP4:

圖片

公式中E和M分別表示指數和尾數部分的位寬。這里采用E2M1格式,因為它的動態范圍更大。

實驗

本文將BitNet a4.8、BitNet b1.58,以及各種參數量大小的FP16精度LLaMA進行了比較。

其中的1.58 bit模型,遵循BitNet b1.58的訓練方案,采用了兩階段權重衰減和學習率調度。

圖片圖片

所有模型都使用RedPajama數據集中的100B token進行訓練,以確保公平比較。

對于BitNet a4.8,作者首先使用95B token來訓練8位激活值的模型。然后重用優化器狀態,并使用5B token進行混合量化和稀疏化的訓練。實驗將topK設置為50%(attention的輸出投影位置)。

作者使用lm-evaluation-harness工具包,評估模型在一系列語言任務上的zero-shot準確性,包括ARC-Easy(ARCe)、ARCChallenge(ARCc)、Hellaswag(HS)、Winogrande(WGe)和PIQA(PQ)。另外還測試了在C4數據集(測試集)上的困惑度。

主要結果

圖片圖片

表1總結了BitNet a4.8、BitNet b1.58和FP16 LLaMA的詳細測試結果。

全精度(FP16)LLaMA和BitNet b1.58之間的性能差距,隨著模型大小的增長而縮小。對于7B模型,BitNet b1.58在語言模型困惑度和任務的平均準確性方面與LLaMA相當。

此外,相比于BitNet b1.58,BitNet a4.8的平均精度幾乎沒有損失。

圖片圖片

表2展示了各種大小的BitNet a4.8、BitNet b1.58 和 FP16 LLaMA中每個模塊的詳細稀疏性(使用C4驗證集上的非嵌入參數計算)。

值得注意的是,BitNet a4.8的稀疏性明顯高于BitNet b1.58和LLaMA。

比如在7B模型中,BitNet a4.8的整體稀疏性達到了44.5%,只有3.4B的活躍參數。down projection層的輸入顯示出特別高的稀疏性,且中間狀態分布以零為中心。

此外,gate projection的輸出非常稀疏,導致了up projection的高稀疏性(因為只需要在從Gate中選擇非零通道來執行投影)。

具體來說,對于7B BitNet a4.8,Gate和up projection的稀疏率分別為67.5%和12.0%。

圖片圖片

表3顯示了BitNet a4.8在3B和7B模型大小下,low-bit attention的詳細情況。模型使用4位KV或QKV頭,精度損失可忽略不計,同時KV cache可以量化為3位整數。

low-bit attention對于高效的長序列建模至關重要,它減少了KV cache的內存占用和IO,并加速了注意力計算。

在本文的實驗中,作者采用RoPE后量化。使用absmax函數將QKV頭直接量化為無符號整數,無需任何校準數據集。

對于3 bit KV量化,研究人員將bos token的頭保留為4 bit,因為它包含更多的異常值特征。

消融實驗

圖片圖片

圖4顯示了700M BitNet a4.8的訓練損耗曲線,比較了使用完整的INT4/FP4量化,以及本文的混合量化和稀疏化。

完整的INT4量化會導致發散,而混合架構在訓練困惑度方面明顯優于完整的FP4架構。

使用RedPajama數據集中25B token,來進行模型的第一階段訓練,采用absmean和MinMax量化器分別進行完整的INT4和FP4量化。

對于完整的INT4量化,由于其輸入具有更大的異常值,這里設置β = 2*mean(|X|)。

圖片圖片

接下來為1.3B BitNet a4.8的down projection層輸入,設置不同的量化或激活函數。

所有模型都使用RedPajama數據集中的50B token進行第一階段訓練。為了確保公平比較,其他激活值都保留在8位。

圖5顯示了這些模型的訓練損失曲線。Squared ReLU的訓練困惑度比Swish略好,同時實現了更高的稀疏性。

此外,對down projection的輸入應用FP4量化會導致性能顯著下降,而將INT4激活與STE一起使用會導致發散。

參考資料:

https://arxiv.org/abs/2411.04965

https://venturebeat.com/ai/how-microsofts-next-gen-bitnet-architecture-is-turbocharging-llm-efficiency/

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-04-30 09:16:00

2013-01-04 16:15:08

微軟ERPDynamics AX

2012-07-02 10:36:19

菲亞特

2022-03-10 16:01:29

Playwright開源

2024-03-12 07:24:26

DingoDB數據庫數據的存儲

2023-03-16 07:20:15

大數據平臺云數據

2016-01-26 11:58:12

2015-09-23 09:47:39

戴爾

2009-07-28 14:05:24

金融數據中心H3C

2009-07-20 14:44:40

數據中心金融行業H3C

2024-12-12 08:18:50

2013-09-24 10:38:23

2021-07-15 11:16:31

Spring WebWebFlux架構

2025-03-17 10:38:30

2009-10-13 10:04:51

醫院協同呼叫中心

2016-12-11 10:35:52

2010-02-07 15:50:33

Android手機

2011-03-31 17:49:51

微軟嵌入式WindowsEmbe

2009-03-11 13:02:20

存儲虛擬化數據中心

2010-06-17 16:54:49

新一代Hotmail
點贊
收藏

51CTO技術棧公眾號

一本色道久久综合| 99综合99| 久久精品视频一区| 国产欧美日韩中文字幕| 日本在线观看网址| 伊人久久大香| 亚洲va韩国va欧美va| 99热国产免费| 一级片免费在线播放| 最新国产一区| 欧美一三区三区四区免费在线看 | 国产中文字幕91| 国产在线视频第一页| 久久99久久人婷婷精品综合| 91精品国产欧美一区二区成人| 国产96在线 | 亚洲| av播放在线| 国产激情视频一区二区在线观看| 91成人福利在线| 99热这里只有精品4| 免费日韩一区二区三区| 欧美乱熟臀69xxxxxx| 自拍日韩亚洲一区在线| 黄色网页在线免费看| 91在线精品一区二区| 成人免费福利在线| 蜜臀尤物一区二区三区直播| 欧美午夜在线视频| 色999日韩欧美国产| 捆绑凌虐一区二区三区| 久久综合给合| 欧美日韩一区 二区 三区 久久精品| 999一区二区三区| 日本高清中文字幕在线| 久久久综合精品| 国产91aaa| 99久久久国产精品无码网爆| 日韩高清在线一区| 欧美又大又粗又长| 日韩少妇裸体做爰视频| 亚洲破处大片| 久久精品久久久久久| 精品人妻中文无码av在线 | 欧美videossexotv100| 亚洲高清在线免费观看| 第84页国产精品| 欧美日韩国产精品一区二区三区四区 | 一道本视频在线观看| 中国色在线日|韩| 亚洲成av人综合在线观看| 久久精品国产精品亚洲精品色 | 日韩中文字幕| 欧美一区二区三区在线视频| www.com久久久| 日本一区二区三区中文字幕| 欧美最猛性xxxxx直播| 男人天堂999| 老司机成人影院| 一本一道久久a久久精品| 国产男女在线观看| 久久r热视频| 日本久久一区二区三区| 亚洲熟妇国产熟妇肥婆| 欧美男男激情videos| 亚洲va中文字幕| 人人妻人人添人人爽欧美一区| 青草在线视频| 黄色一区二区在线| 中文字幕日本最新乱码视频| 91av亚洲| 在线欧美日韩国产| 漂亮人妻被中出中文字幕| gay欧美网站| 色婷婷综合在线| 91传媒久久久| 成人毛片免费| 欧美一个色资源| 第一页在线视频| 欧美一级色片| 夜夜躁日日躁狠狠久久88av | 天天干天天舔天天射| 久久综合久久鬼色中文字| 日本一区视频在线| caoporn国产精品免费视频| 中文字幕一区免费在线观看| 9色视频在线观看| av在线中出| 在线免费一区三区| 超碰人人cao| 亚洲三级精品| 久久久国产精品免费| 久久艹精品视频| 免费日韩av片| 成人xxxxx| 欧美视频一二区| 国产欧美日韩综合| 亚洲国产一二三精品无码| 韩国精品一区| 在线视频综合导航| 自拍偷拍激情视频| 欧美欧美黄在线二区| 久久久91精品国产| 欧美特黄aaaaaa| 国产一区免费电影| 久久婷婷人人澡人人喊人人爽| h网站在线免费观看| 午夜激情久久久| 亚洲天堂2018av| 老司机在线精品视频| 中文字幕精品在线| 丰满少妇乱子伦精品看片| 久久99精品久久久久久动态图 | 日韩av有码| 久久人人97超碰精品888| 国产精品午夜一区二区| 成人黄页毛片网站| 亚洲免费av网| 欧美xxx性| 亚洲国产成人av在线| 秋霞欧美一区二区三区视频免费| 一本久道久久综合狠狠爱| 国产在线观看精品| 黄色美女网站在线观看| 亚瑟在线精品视频| 18深夜在线观看免费视频| 欧美综合视频| 日韩av电影手机在线| 风流老熟女一区二区三区| 中文字幕在线播放不卡一区| 无码人妻丰满熟妇区毛片| 精品无人区一区二区| 欧美美女操人视频| 91久久精品国产91性色69| 久久影音资源网| 男女视频网站在线观看| 激情综合婷婷| 不卡av电影院| 一级黄在线观看| 中文字幕欧美三区| 激情五月亚洲色图| 亚洲国产合集| 欧美亚洲视频在线看网址| 亚洲国产精品欧美久久| 尤物av一区二区| 亚洲天堂小视频| 一本一道久久综合狠狠老 | 国产精品x8x8一区二区| 欧美不卡视频一区发布| 99产精品成人啪免费网站| 亚洲欧洲韩国日本视频| 欧美成人三级在线播放| 日韩电影免费网站| 成人天堂噜噜噜| 超碰最新在线| 日韩欧美美女一区二区三区| 免费无遮挡无码永久在线观看视频 | 韩国19禁主播vip福利视频| 亚洲黄色在线播放| 亚洲1区2区3区4区| 亚洲第一成人网站| 日韩高清不卡一区二区| 亚洲精品日韩精品| 国产95亚洲| 欧美高清在线观看| 三级视频在线看| 懂色av中文一区二区三区天美| 无码人妻精品一区二区三区温州| 性色一区二区三区| 亚欧洲精品在线视频免费观看| 国产精品伦一区二区| 日韩中文字幕精品视频| 国产精品高潮呻吟久久av野狼 | 台湾佬中文在线| 久久精品夜色噜噜亚洲a∨| 好吊妞无缓冲视频观看| 牛牛影视久久网| 久久久久久久久久婷婷| 亚洲欧美日韩精品永久在线| 欧美日韩国产精品专区 | 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 久久久久久免费精品| 懂色av一区二区三区四区 | wwwwww国产| 国产亚洲成aⅴ人片在线观看| 亚洲人成无码www久久久| 国产影视精品一区二区三区| 成人欧美一区二区三区黑人| 18+视频在线观看| 亚洲激情在线观看视频免费| 久久精品无码av| 亚洲欧洲日本在线| 97中文字幕在线观看| 国产精品久久国产愉拍| 日韩精品久久一区| 国产成人亚洲一区二区三区| 美女性感视频久久久| 日本韩国在线观看| 在线观看视频欧美| 亚洲天堂黄色片| 91亚洲国产成人精品一区二三| 欧美激情成人网| 99热国内精品永久免费观看| 国产99在线播放| 3d欧美精品动漫xxxx无尽| 最近更新的2019中文字幕| 国产美女www爽爽爽视频| 黑人与娇小精品av专区| 亚洲激情图片网| 成人免费视频app| 熟女少妇精品一区二区| 99久久婷婷| 久久伊人资源站| 一区在线不卡| 日本精品va在线观看| 北条麻妃在线| 日韩国产高清污视频在线观看| 一区二区小视频| 亚洲福利电影网| 四虎影视一区二区| 久久久国产精华| 乳色吐息在线观看| 美女网站视频久久| 欧美二区在线视频| 欧美三级不卡| 日日噜噜噜噜夜夜爽亚洲精品| 一区二区免费| 国产精品爽爽爽| 岛国毛片av在线| xxx一区二区| 久草在线网址| 日韩黄色高清视频| 91片黄在线观看喷潮| 日韩欧美一区二区三区| 少妇久久久久久被弄高潮| 国产欧美精品一区二区色综合| 国产91在线免费观看| 狠狠色丁香久久婷婷综| 国产又黄又猛视频| 99国产精品久久久久久久成人热| 青青草影院在线观看| 999久久久精品国产| 欧洲亚洲一区| 欧美精品中文字幕亚洲专区| 91精品国产一区二区三区动漫| 超碰国产精品一区二页| 国产精品久久久久久久久免费| 中文av在线全新| 2021国产精品视频| 欧美性受ⅹ╳╳╳黑人a性爽| 日韩一区二区三区在线播放| 久蕉依人在线视频| 亚洲欧洲xxxx| 番号集在线观看| 亚洲剧情一区二区| 色就是色亚洲色图| 亚洲激情自拍图| 九色网友自拍视频手机在线| 国产婷婷成人久久av免费高清| 少妇无码一区二区三区| 精品国产精品网麻豆系列| 欧美 日韩 国产 成人 在线 91| 日韩片之四级片| 国产日韩免费视频| 欧美一个色资源| 神马午夜电影一区二区三区在线观看 | 一区二区三区四区视频在线观看| 免费不卡中文字幕在线| 久久久人人爽| 国产一区二区三区四区二区 | 综合激情视频| 永久免费网站视频在线观看| 五月婷婷六月综合| 精品视频在线观看一区二区| 黄色av一区| 老太脱裤让老头玩ⅹxxxx| 麻豆九一精品爱看视频在线观看免费| 免费黄色日本网站| 蜜桃精品视频在线| av在线免费看片| 成人va在线观看| 一区二区三区免费在线观看视频| 91免费国产在线| 日本成人午夜影院| 亚洲桃色在线一区| 青娱乐免费在线视频| 黄网动漫久久久| 97人妻精品视频一区| 欧美高清性hdvideosex| 在线免费av片| 亚洲福利视频网站| 韩国福利在线| 久久综合电影一区| 在线最新版中文在线| 国产精品亚洲精品| 欧美精品三级在线| 久久伦理网站| 自拍欧美日韩| 黄色av免费在线播放| 国产综合色在线| 成人在线电影网站| 日本一区二区免费在线| 性色av无码久久一区二区三区| 亚洲国产精品久久久久秋霞影院| 精品一区二三区| 日韩欧美中文字幕精品| 老熟妇高潮一区二区高清视频| 日韩精品在线视频美女| 老司机精品影院| 欧美成人免费全部| 伊人久久av| 亚洲a∨日韩av高清在线观看| 西瓜成人精品人成网站| 在线免费一区| 欧美午夜精品| 久久久久久久久久一区二区| av影院午夜一区| 久草福利资源在线| 亚洲福利一二三区| 欧美激情一区二区三区免费观看| 日韩网站在线看片你懂的| www.亚洲资源| 2019中文字幕在线观看| 亚洲国产aⅴ精品一区二区三区| 美日韩免费视频| 午夜国产欧美理论在线播放| 午夜视频在线瓜伦| 91在线码无精品| 久久在线视频精品| 欧美疯狂做受xxxx富婆| 番号集在线观看| 91精品国产自产91精品| 日韩一区二区三区精品| 久久精品女人的天堂av| 伊人久久久大香线蕉综合直播| 欧美女同在线观看| 国产婷婷一区二区| 黄色网址中文字幕| 日韩成人激情视频| 黄色污污视频在线观看| 亚洲综合大片69999| 日韩欧美视频| 国产精品天天av精麻传媒| 久久日韩粉嫩一区二区三区| 国产精品1000| 欧美成人精品二区三区99精品| a级片国产精品自在拍在线播放| 国产精品成熟老女人| 亚洲肉体裸体xxxx137| 成人午夜视频免费在线观看| 成人一区二区三区| 精品一区在线观看视频| 欧美日韩午夜影院| 欧美成人三区| 国产精品网红直播| 精品日韩欧美一区| 污污视频网站免费观看| 欧美国产一区二区| 亚洲免费黄色网址| 日韩久久精品电影| 亚洲女同志freevdieo| 精品一区在线播放| 国产一区二区你懂的| 免费黄色片网站| 欧美三区免费完整视频在线观看| 国产有码在线| 91久久夜色精品国产网站| 久久精品青草| 午夜激情视频网| 亚洲国产精品尤物yw在线观看| 午夜精品久久久久久久99老熟妇| 久久99精品国产99久久6尤物| 成人高潮a毛片免费观看网站| 拔插拔插海外华人免费| www.亚洲色图.com| 免费在线不卡av| www国产亚洲精品久久网站| 国产精品xnxxcom| 日本a视频在线观看| www久久精品| 波多野结衣影片| 蜜月aⅴ免费一区二区三区| 一区二区三区国产好| 欧美精品一区免费| 一区二区中文视频| 亚洲国产精品二区| 欧美极品xxxx| 国产中文字幕一区二区三区 | 国产一区二区三区香蕉| 国产在线观看你懂的| 亚洲欧美精品一区二区| 日本欧美一区| 蜜臀精品一区二区| 91社区在线播放| 亚洲天天综合网| 97免费中文视频在线观看| 欧美色就是色| 青青草原播放器| 色一区在线观看| 91麻豆一二三四在线| 欧美连裤袜在线视频|