精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何在英特爾? 平臺上實現高效的大語言模型訓練后量化

企業動態
提升 SmoothQuant 量化方法的效力。

作者:英特爾公司 陸彤、何欣、郭恒、程文華、王暢、王夢妮、沈海豪

本文介紹了可提升大語言模型的訓練后量化表現的增強型 SmoothQuant 技術,說明了這項技術的用法,并證明了其在準確率方面的優勢。此方法已整合至英特爾? Neural Compressor(1) 中。英特爾? Neural Compressor 是一個包含量化、剪枝(稀疏性)、蒸餾(知識提煉)和神經架構搜索等多種常用模型壓縮技術的開源 Python 庫。目前,諸如 TensorFlow、英特爾? Extension for TensorFlow(2) 、PyTorch、英特爾? Extension for PyTorch(3) 、ONNX Runtime 和 MXNet等主流框架,都能與之兼容

英特爾? Neural Compressor 已經支持多款英特爾? 架構的硬件,比如英特爾? 至強? 可擴展處理器(4) 、英特爾? 至強? CPU Max 系列(5) 、英特爾? 數據中心 GPU Flex 系列(6) 英特爾? 數據中心 GPU Max 系列(7) 。本文涉及的實驗基于第四代英特? 至強? 可擴展處理器(8) 進行。

大語言模型

大語言模型 (Large Language Model, LLM) 需基于海量數據集進行訓練,可能擁有數十億權重參數。其先進的網絡結構和龐大的參數量,使它們能夠很好地應對自然語言本身的復雜性。完成訓練后的大語言模型,可針對各種下游的自然語言處理 (NLP) 和自然語言生成 (NLG) 任務進行調優,讓其更適合對話式聊天機器人(如 ChatGPT)、機器翻譯、文本分類、欺詐檢測和情感分析等任務場景。

大語言模型部署面臨的挑戰

大語言模型在執行自然語言處理和自然語言生成任務方面表現出色,但其訓練和部署頗為復雜,主要面臨以下挑戰:

  1. AI 與內存墻(9) 瓶頸問題:算力每兩年提高 3.1 倍,內存帶寬卻只提高 1.4 倍;
  2. 網絡帶寬挑戰:訓練大語言模型需要采用分布式系統,這對網絡帶寬提出了較高要求;
  3. 系統資源有限:訓練后的模型往往會部署在算力和內存資源均有限的系統上。

因此,采用訓練后量化的方法來為大語言模型瘦身,對于實現低時延推理至關重要。

大語言模型的量化

量化是一種常見的壓縮操作,可以減少模型占用的內存空間,提高推理性能。采用量化方法可以降低大語言模型部署的難度。具體來說,量化是將浮點矩陣轉換為整數矩陣:

其中 X_fp32、S 和 Z 分別為輸入矩陣、比例因子和整數零點。

有關每通道 (per-channel) 量化策略雖然可能會減少量化損失,但不能用于激活值量化的原因,請參看 SmoothQuant 相關文檔(10) 。不過,激活值量化誤差損失卻是導致模型量化準確率下降的重要因素。為此,人們提出了很多方法來降低激活值量化損失,例如:SPIQ(11) 、Outlier Suppression(12) SmoothQuant(13) 。這三種方法思路相似,即把激活值量化的難度轉移到權重量化上,只是三者在轉移難度的多少上有所不同。

增強型 SmoothQuant

SmoothQuant 引入了一個超參數 α 作為平滑因子來計算每個通道的量化比例因子,并平衡激活值和權重的量化難度。

其中 j 是輸入通道索引。

對于OPT 和 BLOOM 等大多數模型來說,α=0.5 是一個能夠較好實現權重和激活值量化難度分割的平衡值。模型的激活異常值越大,就越需要使用更大的 α 值來將更多的量化難度轉移到權重上。

原始的 SmoothQuant 旨在通過針對整個模型使用一個固定值 α 來分割權重和激活值的量化難度。然而,由于激活異常值的分布不僅在不同模型之間存在差異,而且在同一模型的不同層之間也不盡相同,因此,本文推薦使用英特爾? Neural Compressor 的自動調優能力,逐層獲取最佳 α 值。

相關方法包括以下五個主要步驟(偽代碼如下所示):

  1. 通過特殊的回調函數 register_forward_hook 捕獲 (hook) 模型各層的輸入和輸出值。
  2. 根據用戶定義的 α 范圍和步長生成一個 α 值列表。
  3. 根據給定的 α 值重新計算平滑因子并調整參數(權重值和激活值)。
  4. 對權重執行每通道量化與反量化 (quantization_dequantization),對輸入值執行每張量 (per-tensor) 量化與反量化,以預測與給定 α 值對應的每層輸出值。
  5. 計算相對實際輸出值的均方損失,將調整后的參數恢復回來,并保存每層的最佳 α 值。

本文提出的方法支持用多個標準(如最小值、最大值和平均值)來確定 Transformer 塊的輸入層歸一化 (LayerNorm) 操作的 α 值。實驗發現,將 α 范圍設為 [0.3, 0.7],步長設為 0.05,對大多數模型來說都能達到很好的平衡。

這一方法有兩個顯著特點:一是全自動化,二是比原始方法支持的融合模式多。

下圖提供了在 BLOOM-1b7 模型上執行 SmoothQuant α 值自動調優的樣例代碼:

啟用增強型 SmoothQuant 的樣例代碼啟用增強型 SmoothQuant 的樣例代碼

用戶只需傳遞一個模型名稱 (model_name) 和一個數據加載器。值得注意的是,模型分析主要依靠的是 Torch JIT。用戶可以在加載 Hugging Face 模型(14) 時將 torchscript 設置為 True,或將 return_dict 設置為 False。更多信息請參閱英特爾? Neural Compressor 文檔(10)

結果

本文提出的增強型 SmoothQuant 的主要優勢在于提高了準確率。

經過對多種主流大語言模型的評估,具備自動調優能力的 INT8 SmoothQuant 最后一個詞元 (last-token) 的預測準確率要高于原始 INT8 SmoothQuant 和 FP32 基線方法。詳見下圖:

FP32 基線方法、INT8(啟用和不啟用 SmoothQuant)以及 INT8(啟用本文提出的增強型 SmoothQuant)的準確率對比

從上圖可以看出,在 OPT-1.3b 和 BLOOM-1b7 模型上,本文提出的增強型 SmoothQuant 的準確率比默認的 SmoothQuant 分別高 5.4% 和 1.6%。量化后的模型也縮小到 FP32 模型的四分之一,大大減少了內存占用空間,從而有效地提升大模型在英特爾? 平臺上的推理性能。

更全面的結果請見GitHub 存儲庫(10) 。同時,也歡迎您創建拉取請求或就GitHub 問題(15) 發表評論。期待聽到您的反饋意見和建議。

作者:

英特爾公司人工智能資深架構師沈海豪、英特爾公司人工智能資深軟件工程師程文華、英特爾公司人工智能軟件工程師陸彤、何欣、郭恒、王暢、王夢妮,他們都在從事模型量化及壓縮的研究與優化工作。

注釋:

1、英特爾? Neural Compressor

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/neural-compressor.html

2、英特爾? Extension for TensorFlow

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-tensorflow.html

3、英特爾? Extension for PyTorch

https://www.intel.cn/content/www/cn/zh/developer/tools/oneapi/optimization-for-pytorch.html

4、英特爾? 至強? 可擴展處理器

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/scalable.html

5、英特爾? 至強? CPU Max 系列

https://www.intel.cn/content/www/cn/zh/products/details/processors/xeon/max-series.html

6、英特爾? 數據中心 GPU Flex 系列

https://www.intel.cn/content/www/cn/zh/products/details/discrete-gpus/data-center-gpu/flex-series.html

7、英特爾? 數據中心 GPU Max 系列

https://www.intel.com/content/www/us/en/products/details/discrete-gpus/data-center-gpu/max-series.html

8、第四代英特? 至強? 可擴展處理器

https://www.intel.cn/content/www/cn/zh/events/accelerate-with-xeon.html

9、AI 與內存墻

https://medium.com/riselab/ai-and-memory-wall-2cb4265cb0b8

10、SmoothQuant 相關文檔 / 英特爾? Neural Compressor 文檔 / GitHub 存儲庫

https://github.com/intel/neural-compressor/blob/master/docs/source/smooth_quant.md

11、SPIQ

https://arxiv.org/abs/2203.14642

12、Outlier Suppression

https://arxiv.org/abs/2209.13325

13、 SmoothQuant

https://arxiv.org/abs/2211.10438

14、Hugging Face 模型

https://huggingface.co/models

15、GitHub 問題

https://github.com/intel/neural-compressor/issues

責任編輯:張燕妮
相關推薦

2023-09-01 15:22:49

人工智能數據

2025-04-16 02:30:00

2011-11-23 10:04:25

英特爾Romley處理器PCI-E 3.0

2014-04-03 14:23:02

英特爾統一固件管理套件

2023-11-20 13:06:52

2011-07-07 09:36:15

2023-08-09 17:35:11

開源模型

2011-12-26 10:10:00

2022-07-01 18:50:32

英特爾

2011-12-14 19:01:20

英特爾

2014-12-03 10:34:31

2013-04-10 15:09:24

IDF2013英特爾陳榮坤

2014-11-14 15:59:07

英特爾架構安卓平臺創新

2014-11-14 17:15:42

英特爾

2013-09-13 15:19:08

英特爾移動平臺IDF

2021-01-08 14:18:05

AMD Zen 3英特爾測試
點贊
收藏

51CTO技術棧公眾號

国产精品9999久久久久仙踪林| 在线观看精品自拍私拍| 激情小视频网站| 天堂а√在线8种子蜜桃视频 | 久久午夜羞羞影院免费观看| 国产精品久久久久影院日本 | 婷婷中文字幕一区| 精品噜噜噜噜久久久久久久久试看| 欧美变态另类刺激| 日本黄色片在线观看| 成年人国产精品| 国产精品欧美风情| 日本熟妇一区二区| 99精品在线观看| 日韩av在线播放资源| 在线观看国产一级片| zzzwww在线看片免费| 国产精品久久久久影院| 久久国产日韩欧美| 国内精品偷拍视频| 蜜臀va亚洲va欧美va天堂| 国语自产精品视频在线看| 四虎地址8848| 日韩美女毛片| 精品美女在线观看| 91插插插影院| 男女啪啪999亚洲精品| 精品福利免费观看| 日韩免费在线观看av| 成人高清网站| 91麻豆产精品久久久久久| 91gao视频| 国产口爆吞精一区二区| 日韩av中文在线观看| 97在线免费视频| 久久久99精品| 亚洲电影在线一区二区三区| 在线播放精品一区二区三区 | 国产精品久久久久久久午夜片| 国内一区在线| 亚洲第一第二区| 国产一区中文字幕| 成人一区二区电影| 涩涩涩999| 国产传媒第一页| 一区二区三区亚洲变态调教大结局 | 日产精品一线二线三线芒果| 天天爱天天干天天操| 国产风韵犹存在线视精品| 国产精品视频网| 免费视频网站在线观看入口| 亚洲综合另类| 国产97在线|日韩| av资源免费观看| 99riav1国产精品视频| 欧美高清在线观看| 青娱乐免费在线视频| 欧美天天在线| 久久6免费高清热精品| 久久久久99精品成人片试看| 伊人久久大香线蕉综合四虎小说 | 在线观看一区不卡| 日本三级免费观看| 人狥杂交一区欧美二区| 精品久久久久久久久久国产 | 一级黄色片日本| 91精品一区二区三区综合在线爱| 日韩在线观看免费高清完整版| 中文字幕观看av| 欧美日韩国产高清| 国内久久久精品| 日韩毛片一区二区三区| 久久五月激情| 91精品久久久久久久久久另类| 国产美女裸体无遮挡免费视频 | 国产二级一片内射视频播放| 欧洲在线一区| 在线成人免费网站| 中文字幕在线有码| 在线视频日韩| 国产精品视频一区二区高潮| 国产精品无码天天爽视频| 国产成人午夜高潮毛片| 久久www免费人成精品| 国产专区在线| 亚洲精品一二三| 成人免费毛片网| 欧美激情不卡| 精品国产污污免费网站入口| 成年人在线观看av| 日韩电影免费在线观看| 欧美日本精品在线| 狠狠人妻久久久久久综合| 久久99国产乱子伦精品免费| 国产午夜精品一区| av在线播放网站| 一区二区久久久久久| 国产女女做受ⅹxx高潮| 99国内精品久久久久| 日韩高清有码在线| 69夜色精品国产69乱| 99精品免费视频| 91精品久久久久久久久青青| 人妻无码中文字幕免费视频蜜桃| 国产日产欧美一区二区视频| 日韩一级片一区二区| 电影一区二区三| 91精品国模一区二区三区| 国产免费一区二区三区最新6| 成人激情视频| 欧美性资源免费| 国产精品视频第一页| 久久只精品国产| 99国产精品白浆在线观看免费| 美女网站视频一区| 精品国产污污免费网站入口| 五月天免费网站| 香蕉久久夜色精品国产| 亚洲已满18点击进入在线看片| 九色在线免费| 亚洲国产aⅴ天堂久久| 亚洲最大天堂网| 精品国产精品| 欧美一区第一页| 日本黄色不卡视频| 亚洲乱码精品一二三四区日韩在线| 91视频免费版污| 女仆av观看一区| 欧美劲爆第一页| 99久久久国产精品无码免费| 中文子幕无线码一区tr| 久热免费在线观看| 秋霞综合在线视频| 午夜免费在线观看精品视频| 精品国产无码一区二区三区| 1024成人网| 尤蜜粉嫩av国产一区二区三区| 少妇久久久久| 91高清视频在线免费观看| 免费看av毛片| 亚洲一区二区三区四区在线 | 久久精品av麻豆的观看方式| 亚洲综合日韩中文字幕v在线| 免费在线黄色网址| 岛国视频午夜一区免费在线观看| 俄罗斯黄色录像| 国产精品magnet| 91香蕉电影院| av网站在线看| 欧美tickling网站挠脚心| 欧美日韩综合一区二区| 国产毛片精品国产一区二区三区| 婷婷视频在线播放| 电影一区中文字幕| 久久97精品久久久久久久不卡| 国产男男gay体育生白袜| 一色屋精品亚洲香蕉网站| 国产日韩欧美久久| 围产精品久久久久久久| 成人性生交大片免费看视频直播| 麻豆免费在线视频| 日韩一区二区免费电影| 久久久久久久福利| 99久久精品国产观看| 青青艹视频在线| 伊人精品一区| 国产精品流白浆视频| 欧洲不卡av| 欧美一区二区三区播放老司机| 污软件在线观看| 国产精品系列在线播放| av女优在线播放| 香蕉久久精品| 国产精品永久在线| 成人在线视频亚洲| 亚洲高清av在线| 中文字幕在线看人| 中文字幕在线播放不卡一区| 1314成人网| 国产精品日韩| 亚洲精品一区二区三区av| 综合久草视频| 国内精品久久久久影院 日本资源 国内精品久久久久伊人av | 成人中文字幕+乱码+中文字幕| 丝袜在线视频| 亚洲精选中文字幕| 国产一区二区在线播放视频| 一区二区理论电影在线观看| 亚洲第一香蕉网| 国产一区二区在线看| 国产精品自拍片| 欧洲乱码伦视频免费| 91精品久久香蕉国产线看观看| 免费h在线看| 北条麻妃一区二区三区中文字幕| 国产77777| 欧美少妇一区二区| 久久精品人妻一区二区三区| 国产午夜一区二区三区| 性猛交╳xxx乱大交| 日本不卡一二三区黄网| 激情六月天婷婷| 日韩免费久久| 免费成人看片网址| 亚洲va欧美va人人爽成人影院| 日本精品久久电影| 最新国产在线拍揄自揄视频| 一区二区三欧美| 成人午夜视频一区二区播放| 欧美日免费三级在线| 日韩免费黄色片| 亚洲女性喷水在线观看一区| 免费观看av网站| 成人一级视频在线观看| 亚洲36d大奶网| 久久国产精品99国产| 99er在线视频| 图片区亚洲欧美小说区| 日韩精品一区二区三区四区五区| 99re6热只有精品免费观看| 国产精品一香蕉国产线看观看| 深夜福利视频一区二区| 欧美精品18videos性欧| 成人在线观看免费网站| 中文字幕日韩欧美| 免费成人av电影| 日韩高清a**址| 婷婷五月综合久久中文字幕| 日韩精品资源二区在线| 国产又粗又黄视频| 欧美日韩精品专区| 国产情侣免费视频| 色嗨嗨av一区二区三区| 成人午夜淫片100集| 亚洲不卡在线观看| 久久久久免费看| 一区二区三区视频在线看| 在线看的片片片免费| 亚洲色图清纯唯美| 国产白丝一区二区三区| 欧美国产日产图区| 中文字幕伦理片| 欧美极品aⅴ影院| av电影在线不卡| 国产亚洲欧美一区在线观看| 亚洲av无码一区二区三区人| 91视频免费看| 色欲av无码一区二区三区| 91年精品国产| 97超碰在线资源| 国产亚洲欧美一区在线观看| 欧美黄色激情视频| 国产精品欧美一级免费| 黄色免费一级视频| 综合久久久久久| 欧美成人免费观看视频| 亚洲一区二区av在线| 日本熟女一区二区| 激情懂色av一区av二区av| 国产一级大片在线观看| 婷婷丁香激情综合| 五月天婷婷导航| 欧美色成人综合| 国产乱码精品一区二三区蜜臂| 91麻豆精品国产91久久久久久| 国产视频一区二区三区四区五区| 日韩一区二区三区四区| 国产91免费在线观看| 亚洲娇小xxxx欧美娇小| 男操女在线观看| 最新中文字幕亚洲| 丝袜综合欧美| 国产91在线高潮白浆在线观看| 成人国产激情在线| 91文字幕巨乱亚洲香蕉| 亚洲精品推荐| 亚洲一卡二卡三卡四卡无卡网站在线看| 91精品国产视频| 免费在线观看亚洲视频| 欧美a级一区二区| 曰本三级日本三级日本三级| 91在线视频观看| 二区三区四区视频| 亚洲1区2区3区4区| 一级爱爱免费视频| 亚洲第一页中文字幕| 国产精品免费观看| 另类图片亚洲另类| 成人影院av| 99九九视频| 精品国产一区二区三区香蕉沈先生| 在线视频不卡国产| 久久国产精品亚洲77777| 亚洲另类第一页| 91捆绑美女网站| 午夜剧场免费在线观看| 一本色道综合亚洲| 亚洲AV无码乱码国产精品牛牛| 国产性猛交xxxx免费看久久| 超碰在线免费公开| 日韩av免费在线观看| 亚洲一区二区免费在线观看| 日韩欧美亚洲日产国| 一区视频在线| 不用播放器的免费av| 91小视频在线观看| 免费日韩在线视频| 欧美色图第一页| 日韩偷拍自拍| 欧美激情视频免费观看| 日韩成人精品一区二区三区| 精品一区二区三区视频日产| 亚洲国产一区二区在线观看| 国产三级日本三级在线播放| 成人av网址在线观看| 天天操夜夜操av| 在线观看成人小视频| 亚洲人视频在线观看| 欧美激情久久久久久| 日韩成人一区| 午夜免费电影一区在线观看| 久久成人精品| 91av在线免费| 亚洲成人777| 亚洲国产www| 蜜臀久久99精品久久久久久宅男 | 黄免费在线观看| 富二代精品短视频| 亚洲不卡免费视频| 欧美成人激情视频| 成人噜噜噜噜| 亚洲成年人专区| 另类小说一区二区三区| 成人午夜剧场视频网站| 婷婷国产v国产偷v亚洲高清| 日韩一卡二卡在线| 高清欧美性猛交xxxx| 亚洲成av人片在线观看www| 裸体大乳女做爰69| 国产在线看一区| 2018天天弄| 日韩欧美中文字幕精品| 日本在线观看高清完整版| 91色在线视频| 欧美国产先锋| 久久久久国产免费| 亚洲香肠在线观看| 日本激情一区二区| 欧美一区二区三区免费视| 亚洲视频分类| 成人免费视频久久| 国产精品久久久久影院老司| 一级黄色大片免费| 久久九九国产精品怡红院| 成人污污视频| 久久久久久av无码免费网站下载| 国产成人在线观看免费网站| 免费在线观看日韩| 日韩电影免费观看在线观看| 一个人www视频在线免费观看| 欧美二区三区| 精品一区二区影视| 欧美黑人一级片| 亚洲激情自拍图| 91p九色成人| 强开小嫩苞一区二区三区网站| 国产福利91精品| 全部毛片永久免费看| 伊人精品在线观看| 精品国产亚洲日本| 国产不卡一区二区视频| 久久久久久久久免费| 一级黄色小视频| 久久国产精品网站| 任我爽精品视频在线播放| 日韩一级片播放| 亚洲乱码中文字幕| 亚洲av成人精品日韩在线播放| 国产精品高潮粉嫩av| 亚洲国产精品91| 日本黄色免费观看| 欧美性三三影院| 欧美人与禽猛交乱配| 欧美日韩一区二区三| 国产一区二区精品在线观看| 亚洲欧美在线观看视频| 中文字幕亚洲一区二区三区| 一区二区三区国产好| 北条麻妃视频在线| 亚洲一区二区三区小说| 成年人在线看| 成人欧美一区二区| 蜜桃av噜噜一区| 日本熟妇色xxxxx日本免费看| 在线视频欧美日韩精品| 国产精品成人自拍| 超碰成人在线播放| 欧美性xxxx18| 国产在线xxx| 亚洲一区二区不卡视频|