精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

清華朱軍團隊新作:使用4位整數訓練Transformer,比FP16快2.2倍,提速35.1%,加速AGI到來!

人工智能 新聞
清華朱軍團隊提出的INT4算法,解決了超低INT精度訓練的挑戰。LLM訓練效率要起飛了!

將激活、權重和梯度量化為4位,有望加速神經網絡訓練。

然而,現有的4位訓練方法需要自定義數字格式,而現代硬件不支持這種格式。

最近,清華朱軍團隊提出了一種使用INT4算法實現所有矩陣乘法的Transformer訓練方法。

使用超低INT4精度進行訓練,是非常具有挑戰性的。為了實現這一目標,研究者仔細分析了Transformer中激活和梯度的具體結構,為它們提出專用的量化器。

對于前向傳播,研究者確定了異常值的挑戰,并提出了Hadamard量化器來抑制異常值。

對于后向傳播,他們通過提出位分割,來利用梯度的結構稀疏性,并利用分數采樣技術來準確量化梯度。

這種新的算法,在自然語言理解、機器翻譯和圖像分類等廣泛任務上,都實現了具有競爭力的準確性。

原型線性算子運算速度比FP16同類算子快2.2倍,訓練速度提高了35.1%。

圖片圖片

論文地址:https://arxiv.org/abs/2306.11987

代碼地址:https://github.com/xijiu9/Train_Transformers_with_INT4

全新的INT 4訓練算法

訓練神經網絡對計算的要求很高。使用低精度算術進行訓練(完全量化訓練/FQT)有望提高計算和內存效率。

FQT方法在原來的全精度計算圖中添加了一些量化器和反量化器,并用消耗更小的低精度浮點運算,代替了消耗更高的浮點運算。

FQT的研究旨在降低訓練數值精度,而不犧牲太多的收斂速度或精度。

所需的數值精度已從FP16降低到FP8、INT32+INT8和INT8+INT5。

FP8訓練是在帶有Transformer引擎的Nvidia H100 GPU中實現的,加速了大規模Transformer的訓練。最近的訓練數值精度,已經降到了4位。

然而,這些4位訓練方法不能直接用于加速,因為它們需要自定義數字格式,而現代硬件不支持這些格式。

首先,前向傳播中的不可微量化器,會使損失情況變得崎嶇不平,基于梯度的優化器很容易陷入局部最優。

其次,梯度僅僅以低精度近似計算。這種不精確的梯度會減慢訓練過程,甚至導致訓練不穩定或發散。

而在這項工作中,研究者為Transformer提出了一種新穎的INT4訓練算法。

圖片圖片

訓練Transformer的所有高消耗的線性運算,都可以寫在矩陣乘法(MM)的形式中。

這種MM形式,可以讓我們設計更靈活的量化器,通過利用Transformer中激活、權重和梯度的特定結構,就可以更好地近似于FP32矩陣乘法。

隨機數值線性代數 (RandNLA) 領域的進步,被這種量化器充分利用。

對于前向傳播,研究者發現,激活中的異常值是精度下降的主要原因。

為了抑制異常值,他們提出了Hadamard量化器,它會對激活矩陣的變換版本進行量化。這種變換是塊對角Hadamard矩陣,它將離群值中攜帶的信息傳播到矩陣的鄰近條目,從而縮小了離群值的數值范圍。

對于后向傳播,他們利用了激活梯度的結構稀疏性。研究者發現,一些token的梯度非常大。同時,其余大多數token的梯度非常均勻,甚至比較大梯度的量化殘差更均勻。

圖片圖片

因此,與其計算所有梯度,不如節省計算較大梯度殘差的計算資源。

為了利用這種稀疏性,研究者提出了位分割,將每個token的梯度分割為高4位和低4位。

然后,通過杠桿分數采樣(leverage score sampling)來選擇信息最豐富的梯度,這是RandNLA的一種重要采樣技術。

圖片圖片

結合前向和后向傳播的量化技術,研究者提出了一種使用INT4MM進行Transformer中所有線性運算的算法, 并且評估了在各種任務上訓練Transformer的算法,包括自然語言理解、問答、機器翻譯和圖像分類。

與現有的4位訓練算法相比,他們的算法實現了有競爭力的或更高的精度。

此外,這種算法與GPU等當代硬件兼容,因為它不需要FP4或對數格式等自定義的數字格式。

這種原型量化+INT4 MM算子實現,速度比FP16MM基線快2.2倍,并且將訓練速度提高了35.1%。

相關工作

完全量化訓練

完全量化訓練 (FQT) 方法通過將激活、權重和梯度量化為低精度來加速訓練,因此訓練期間的線性和非線性算子可以用低精度算術來實現。

FQT的研究設計了新穎的數值格式和量化算法,可以更好地逼近全精度張量。

目前的研究前沿是4位FQT。由于梯度的數值范圍很大以及從頭開始訓練量化網絡的優化問題,FQT具有挑戰性。

由于這些挑戰,現有的4位FQT 算法在某些任務上的精度仍然下降了1-2.5%,并且無法支持當代硬件。

圖片圖片

其他有效的訓練方法

混合專家在不增加訓練預算的情況下提高了模型容量。

結構性dropout利用計算有效的方法來正則化模型。高效的注意力降低了計算注意力的二次時間復雜度。

分布式訓練系統通過利用更多的計算資源,減少了訓練時間。

研究者降低數值精度的工作與這些方向具有正交性。

圖片圖片

前向傳播

神經網絡訓練是一個迭代優化過程,通過前向和后向傳播計算隨機梯度。

研究團隊使用4位整數(INT4)算法加速前向和后向傳播。

正向傳播能以線性和非線性(GeLU, normalization, softmax等)算子的組合來實現。

在我們的訓練過程中,我們用INT4算術加速所有線性運算符,并將所有計算量較小的非線性運算符保留在16位浮 點(FP16)格式中。

Transformer中的所有線性運算都可以寫成矩陣乘法(MM)的形式。

為了便于表述,本文考慮以下簡單矩陣乘法的加速:

圖片圖片

這種MM的最主要用例是全連接層。

考慮一個輸入形狀為(批量大小S,序列長度T,維度D)的Transformer。

全連接層可以表述成上邊的公式,其中X是N = STtoken的激活,W是權重矩陣。

對于注意力層,可能需要批量矩陣乘法(BMMS)。

我們提出的技術可以應用于BMMS。

學習步長量化(Learned Step Quantization)

為了加速訓練,必須使用整數運算來計算前向傳播。

研究人員為此目的,利用學習步長量化器(LSQ)。

LSQ是靜態量化,他的量化尺度不依賴于輸入的方法,因此比動態方法消耗更小,量化方法,需要在每次迭代時動態計算量化尺度。

激活異常值

簡單地將LSQ應用到具有4位激活/權重的FQT會導致精度下降,因為會激活異常值。

圖片圖片

如上圖所示,激活有一些離群值條目,它們是其規模比其他條目大得多。

不幸的是,Transformers傾向于將信息存儲在這些異常值中,而且這樣的截斷會嚴重損害準確性。

當訓練任務是在一些新的下游任務上微調預訓練模型時,異常值問題尤為明顯。

因為預訓練模型比隨機初始化包含更多的異常值 。

Hadamard量化

我們提出了Hadamard量化(HQ)來解決異常值問題。

其主要思想是將另一個具有較少異常值的線性空間中的矩陣進行量化。

激活矩陣中的異常值形成了一個特征結構(feature-wise structure)。

他們通常集中在幾個維度上,也就是說X中只有幾列顯著大于其他列。

哈達瑪變換(Hardamand transform)是一個線性變換,它可以將異常值分攤到其他條目中。

后向傳播

現在我們考慮使用INT4操作來加速線性層的后向傳播。

我們將在本節中討論激活梯度/權重梯度的計算。

梯度的結構稀疏性

我們注意到,在訓練過程中梯度矩陣往往非常稀疏。

而且稀疏性具有這樣的結構:

圖片的幾行(比如tokens)具有較大的條目,而大多數其他行卻接近全零向量。

圖片圖片

這種結構稀疏性源于現代神經網絡的嚴重過度參數化。

幾乎在整個訓練過程中,網絡都以超參數化方案運行,除了一些困難的例子之外,它可以很好地適應大多數訓練數據。

因此,對于擬合良好的數據點,(激活)梯度將接近于零。

研究人員發現對于預訓練任務,例如,經過幾個訓練周期后,結構稀疏性很快就會出現。

對于微調任務,梯度整個訓練過程中始終是稀疏的。

位分割(Bit Splitting)和杠桿分數采樣(Leverage Score Sampling)

如何設計梯度量化器,以利用結構稀疏性在反向傳播期間準確計算MM呢?

高級的思路是:梯度的許多行都是如此小,對參數梯度影響很小,但浪費了大量的計算量。

另一方面,大行無法用INT4精確表示。

我們放棄掉一些小行并使用節省下來的計算能力來更準確地表示大行。

實驗

研究人員在包括語言模型在內的各種任務上評估我們的INT4訓練算法微調、機器翻譯和圖像分類。

研究人員用CUDA和cutlass執行了他們提出的HQ-MM和LSS-MM算法。

研究人員用INT4實現替換所有浮點線性運算符,但沒有簡單地使用LSQ來嵌入層,并保持最后一個分類器層的精度。

最后研究人員對所有評估的模型采用了默認架構、優化器、調度器和超參數。

收斂模型精度

研究人員在下表中比較了收斂模型在各種任務上的準確性。

圖片圖片

作為對照的方法包括全精度訓練(FP)、INT8訓練(INT8)、FP4訓練(「超低」),使用LSQ進行激活和權重(LSQ+LUQ)的4 位對數量化,以及我們這種利用HQ進行前向傳播,利用LSS進行反向傳播(HQ+LSS)的算法。

「超低」沒有公開的實現,因此我們僅列出了它在機器上的原始論文中的性能翻譯任務。

除了大型機器翻譯任務和大型視覺Transformer任務之外,我們將每次運行重復三次,并將標準差報告為表中的下標。

研究人員沒有進行任何類型的知識蒸餾或數據增強。

消融實驗

研究人員進行的消融實驗目的是展示前向和后向方法的有效性。

研究不同量化器的前向傳播的有效性,我們將后向傳播留在FP16中。

結果如下圖所示。

圖片圖片

計算和內存效率

最后,研究人員通過評估他們的原型實現,展示了他們的方法加速神經網絡訓練的潛力。

而且他們的實施還沒有完全優化。

研究人員也沒有將線性算子與非線性和歸一化進行融合。

因此,結果不能完全反映INT4訓練算法的潛力。

完全優化的實施需要大量工程,超出了我們論文的討論范圍。

結論

研究人員提出了一種對硬件很友好的Transformer INT4的訓練方法。

通過分析Transformer中MM的屬性,研究人員提出了HQ和LSS方法來量化激活和梯度,同時保持準確性。

在幾個重要任務上,我們的方法與現有的INT4方法表現相當,甚至更好。

研究人員的這些工作可能會擴展到除了Transformers之外的其他MM架構中,例如 MLP-Mixer、圖神經網絡和循環神經網絡網絡。

這是他們未來的研究方向。

更廣泛的影響:研究人員的算法可以提高效率并減少訓練神經網絡的能源消耗,這有助于減少深度學習造成的碳排放。

但是,高效的訓練算法還可能促進那些,對于人來安全存在隱患的大語言模型和惡意人工智能應用程序的開發。

比如,會被用于虛假內容生成的相關模型和應用。

限制:這項工作的主要限制是它只能加速具有較大規模的矩陣乘法(線性層)的大模型,但不能加速卷積層。

而且,所提出的方法還不能很好地適用于OPT-175B等超大模型。

據我們所知,即使是INT8訓練對于這些超大型模型來說仍然是尚待解決的問題。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-07-08 09:10:00

2023-06-30 13:48:00

算法AI

2025-09-28 09:10:00

2025-06-19 09:07:00

2023-03-13 15:56:00

模型框架

2021-03-18 15:29:10

人工智能機器學習技術

2015-09-10 11:29:57

5G4G

2023-12-23 23:08:21

語音數據

2024-03-13 13:49:22

Sora核心組件DiT

2025-10-17 02:00:00

2025-03-12 09:05:02

2023-05-26 10:15:34

模型訓練

2023-11-10 12:51:29

微軟AI

2023-11-02 12:49:00

AI模型

2022-06-17 14:28:16

算法模型

2024-07-01 12:17:54

2024-07-12 11:35:49

2022-08-09 09:10:31

TaichiPython

2023-01-08 13:22:03

模型

2025-04-01 09:40:00

點贊
收藏

51CTO技術棧公眾號

一区二区三区自拍视频| 国产精品麻豆一区二区三区| 欧美99久久| 亚洲国产精品小视频| 欧美aⅴ在线观看| 日本免费视频在线观看| 成人免费视频视频在线观看免费| 日本国产精品视频| 农村黄色一级片| 亚洲欧洲美洲国产香蕉| 欧美久久久久免费| 91精品91久久久中77777老牛| 香蕉视频免费在线播放| 成人av网站在线观看| 国产精品综合久久久| 亚洲精品一区二区三区樱花 | 国产精品一卡二卡在线观看| 高清在线视频日韩欧美| 久久久久久久一| jizz日本免费| 亚洲精品乱码久久久久久自慰| 成人在线高清视频| 成人av中文字幕| 91精品国产综合久久香蕉的用户体验 | www.99热这里只有精品| 日本激情在线观看| 国产日韩精品视频一区| 国产欧美日本在线| 国产精品一区二区免费视频| 性久久久久久| 97久久久免费福利网址| 国产成人无码aa精品一区| 欧洲乱码伦视频免费| 日韩激情视频在线| 在线观看一区二区三区四区| 成人污版视频| 欧美日韩大陆在线| 丝袜制服一区二区三区| 中文在线免费视频| 欧美日韩另类字幕中文| h无码动漫在线观看| gogo在线高清视频| 一区精品在线播放| 亚洲人成77777| 成人免费在线电影| 国产午夜久久久久| 欧美日韩三区四区| 免费人成黄页在线观看忧物| 99视频精品在线| 国产一区二区三区无遮挡| 亚洲xxx在线| 国产成人综合在线播放| 91久久国产自产拍夜夜嗨| 国产美女永久免费| 国产精品综合二区| 97在线电影| 精品国产伦一区二区三区| 国产精品综合视频| 国产成人免费观看| 少妇人妻偷人精品一区二区| 成人精品视频网站| 久久福利电影| 国产一级片在线播放| 国产欧美视频在线观看| 亚洲精品高清视频| av片在线观看永久免费| 亚洲国产综合在线| 日韩精品xxxx| 色综合一本到久久亚洲91| 色婷婷一区二区三区四区| 男人女人黄一级| 欧美高清影院| 日韩精品一区二区在线| 中文字幕无码人妻少妇免费| 亚洲警察之高压线| 日韩中文字幕网站| 久久免费精彩视频| 麻豆久久精品| 成人国产精品久久久| 精品人妻aV中文字幕乱码色欲 | 中文在线一区二区三区| 国产亚洲电影| 久久精品电影网站| 日韩精品一区二区av| 美女诱惑黄网站一区| 国产日韩欧美另类| 人妻精品一区二区三区| 欧美激情综合在线| 免费拍拍拍网站| 成人一区视频| 精品电影一区二区| 日本一二三不卡视频| 欧美激情四色| 国产成人福利网站| 国内老熟妇对白hdxxxx| 2020国产成人综合网| 中国成人在线视频| 偷拍自拍在线看| 91精品欧美福利在线观看| xxxxxx黄色| 亚洲女同另类| 国产98色在线| 少妇av在线播放| 亚洲视频在线观看一区| 国产三区在线视频| 亚洲精品视频一二三区| 色哟哟网站入口亚洲精品| 日本一级黄色录像| 韩国欧美国产1区| 精品欧美日韩| 日韩特级毛片| 在线不卡中文字幕| 国产精品久久久久无码av色戒| 99久久99久久精品国产片桃花| 97av视频在线| 亚洲第一视频在线播放| 国产精品久久毛片a| 91精品91久久久中77777老牛| 日本免费一区二区三区视频| 在线日韩欧美视频| 国产又黄又粗又爽| 国产99精品国产| 一区二区三区在线视频看| 91精品论坛| 亚洲成人免费网站| 久久久久97国产| 国产中文字幕一区| 亚洲精品一区二区三| 日韩在线免费| 亚洲天堂av在线免费观看| 日本熟妇毛耸耸xxxxxx| 国产精品91一区二区| 一区二区三区国产福利| 搜成人激情视频| 亚洲人成伊人成综合网久久久| 精品一区二区三区人妻| 国产精品一区一区| 男人日女人的bb| 国产精品3区| www欧美日韩| 91国内精品视频| 国产精品久久久久一区二区三区共 | 一本加勒比北条麻妃| 亚洲欧洲一区二区天堂久久| 99一区二区| 日韩专区av| 精品国产不卡一区二区三区| 久久黄色免费视频| 国产成人午夜精品影院观看视频| 免费在线精品视频| 久久69av| 欧美精品电影在线| 亚洲 小说区 图片区 都市| 天天av天天翘天天综合网| 欧美激情 亚洲| 国产午夜久久| 日本精品视频一区| 国产福利亚洲| 久久影院资源网| 丰满肉肉bbwwbbww| 午夜激情久久久| 西西444www无码大胆| 免费高清在线视频一区·| 亚洲精品一区二区三区四区五区| 日韩午夜电影免费看| 久久国产视频网站| 国模人体一区二区| 日本韩国一区二区三区视频| 性猛交ⅹxxx富婆video| 美女网站色91| www婷婷av久久久影片| 精品三级在线观看视频| 欧美在线激情网| 麻豆91在线| 精品成a人在线观看| 最新中文字幕一区| 国产精品色眯眯| 久久久高清视频| 美女网站一区二区| 亚洲理论电影在线观看| 精品国产1区| 亚洲一区中文字幕| 伊人成综合网站| 久久久精品一区二区| 人妻妺妺窝人体色www聚色窝| 色婷婷综合久久久久中文一区二区 | 亚洲大片精品永久免费| 免费成人深夜天涯网站| 国产精品一区二区在线观看网站| 男人日女人视频网站| 欧美伦理在线视频| 成人永久免费| 久久久久伊人| 欧美与欧洲交xxxx免费观看| 欧美精品videos另类| 日韩av影片在线观看| 亚洲视频在线观看免费视频| 亚洲国产美女搞黄色| 网爆门在线观看| av欧美精品.com| 在线看免费毛片| 蜜乳av另类精品一区二区| 中国一级黄色录像| 狠狠色丁香婷婷综合影院| 99久久精品免费看国产四区| 国产v综合v| 高清欧美电影在线| 八戒八戒神马在线电影| 亚洲欧美一区二区激情| 性生交大片免费看女人按摩| 在线观看不卡一区| 国产在线视频第一页| 国产精品美女久久久久久久网站| 六十路息与子猛烈交尾| 国产精品一级在线| 99中文字幕在线| 日韩成人伦理电影在线观看| 黄页网站大全在线观看| 欧美激情aⅴ一区二区三区| 亚洲开发第一视频在线播放| 日韩三级毛片| 激情久久av| 一区三区自拍| 91pron在线| 日本亚洲视频| 亚洲精品日韩av| 欧美成人一二区| 国产美女久久精品香蕉69| 日韩电影大全网站| 欧美中文字幕视频| 麻豆免费在线| 7777精品视频| 国产美女高潮在线观看| 国内免费精品永久在线视频| 欧洲一区二区三区| 欧美高清视频在线观看| h片在线播放| 欧美黑人性视频| 性欧美ⅴideo另类hd| 欧美区在线播放| 欧美野外wwwxxx| 欧美黄网免费在线观看| 欧美人动性xxxxz0oz| 久久久免费观看| av中文在线资源库| 国语对白做受69| 国产污视频在线播放| 97婷婷涩涩精品一区| 国产高清自产拍av在线| 欧美在线激情网| 日本精品裸体写真集在线观看| 国产精品成人在线| 日韩午夜视频在线| **亚洲第一综合导航网站| 日韩三级不卡| 国产一区二区在线观看免费播放| 青青草久久爱| 欧美一区观看| 999视频精品| 麻豆视频传媒入口| 亚洲区一区二| 久久精品网站视频| 麻豆91在线看| 日本少妇xxxx软件| www.日韩精品| 三区四区在线观看| 亚洲精品水蜜桃| 日本一级一片免费视频| 色综合久久久久综合| 中文字幕日韩第一页| 欧美一级精品在线| 四虎影院在线播放| 色哟哟入口国产精品| 国模雨婷捆绑高清在线| 欧洲一区二区视频| 亚洲色图综合| 国产精品推荐精品| 国产一区99| 4444在线观看| 亚洲欧美网站| 国产精品探花在线播放| 成人sese在线| 中文字幕第二区| 亚洲电影一区二区三区| 蜜臀尤物一区二区三区直播| 91精品国产综合久久福利 | 91捆绑美女网站| 中文字幕第69页| 午夜精品久久久久久不卡8050| 看黄色一级大片| 欧美成人r级一区二区三区| 日本一区视频| 欧美日本黄视频| 国产在线|日韩| 国产一区二区高清视频| 91久久夜色精品国产按摩| 欧日韩免费视频| 黄页网站大全一区二区| 波多野结衣一本| 亚洲一二三区不卡| 在线观看中文字幕2021| 国产婷婷成人久久av免费高清 | 992tv成人免费视频| 国产精品久久久久久久久久久久久久久 | 亚洲精品国产无套在线观| 国产中文字幕视频| 日韩女优电影在线观看| 91在线直播| 欧美综合国产精品久久丁香| 精品一区二区三区四区五区| 日韩影片在线播放| 国产日韩欧美一区| 人妻 丝袜美腿 中文字幕| 国产精品久久久久影院色老大| www.久久精品视频| 亚洲国产另类久久精品| 香蕉成人app免费看片| 成人黄色免费片| 精品视频亚洲| 韩国一区二区av| 97se亚洲国产综合自在线不卡| 九九视频在线观看| 91精品国产综合久久精品app| aiai在线| 国产精品777| 神马影视一区二区| 97av视频在线观看| 不卡av在线免费观看| 免费一级片在线观看| 欧美一级黄色片| 3d玉蒲团在线观看| 91久久精品一区二区别| 91精品啪在线观看国产81旧版| 杨幂毛片午夜性生毛片 | 激情综合色综合久久综合| 美国黑人一级大黄| 欧美性猛交xxxx黑人交| 成人免费视频| 国产精品久久久久久久久久三级 | 大桥未久女教师av一区二区| 强开小嫩苞一区二区三区网站 | 色婷婷在线影院| 一本到一区二区三区| 青春草在线观看| 日本中文字幕不卡免费| 小嫩嫩12欧美| 亚洲中文字幕久久精品无码喷水| 国产无人区一区二区三区| 亚洲男人天堂网址| 伊人伊成久久人综合网小说| 国产成人福利夜色影视| 一区二区三区日韩视频| 国内精品视频一区二区三区八戒| 潘金莲一级黄色片| 日韩欧美在线观看一区二区三区| 青青青国内视频在线观看软件| 国产视频一区二区三区四区| 一区二区三区导航| 国产探花视频在线播放| 欧美日韩黄色一区二区| av在线免费网址| 国产伦精品一区二区三区四区免费 | 日韩在线一区视频| 伊人色综合久久天天| 蜜臀av中文字幕| 日本久久久久久久| 成人在线免费观看91| 国产精品嫩草影视| 亚洲成av人片在www色猫咪| 日夜干在线视频| 国产欧美一区二区三区视频| 欧美黄色免费| 网站免费在线观看| 欧美人xxxx| heyzo在线| 视频一区二区在线| 国产精品一区二区视频| 全部毛片永久免费看| 尤物九九久久国产精品的分类| 国产精品一区二区三区www| 成年人午夜视频在线观看 | 亚洲福利视频二区| 欧美aaa视频| 天天做天天躁天天躁| 久久一区二区三区国产精品| 亚洲天堂网在线视频| 久久久久久成人| 欧美高清在线| 国产制服丝袜在线| 欧美精品在线观看一区二区| 爱啪啪综合导航| 一区二区精品国产| 久久影视一区二区| 精品久久久无码中文字幕| 国产成人精品在线播放| 亚洲视频日本| 成人一级黄色大片| 亚洲男人天堂手机在线| 婷婷综合国产| 日韩欧美国产片|