精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

十億參數,一鍵瘦身!「模型減重」神器讓大模型狂掉3/4 | 最“in”大模型

人工智能 新聞
大語言模型 (Large Language Model, LLM) 需基于海量數據集進行訓練,可能擁有數十億權重參數。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

本文介紹了可提升大語言模型的訓練后量化表現的增強型 SmoothQuant 技術,說明了這項技術的用法,并證明了其在準確率方面的優勢。此方法已整合至英特爾Neural Compressor[1] 中。

英特爾Neural Compressor是一個包含量化、剪枝(稀疏性)、蒸餾(知識提煉)和神經架構搜索等多種常用模型壓縮技術的開源 Python 庫。

目前,諸如 TensorFlow、英特爾Extension for TensorFlow[2]、PyTorch、英特爾Extension for PyTorch[3]、ONNX Runtime 和 MXNet等主流框架,都能與之兼容。

英特爾Neural Compressor 已經支持多款英特爾架構的硬件,比如英特爾至強可擴展處理器[4]、英特爾至強CPU Max 系列[5]、英特爾數據中心 GPU Flex 系列[6]和英特爾數據中心 GPU Max 系列[7]。本文涉及的實驗基于第四代英特至強可擴展處理器[8]進行。

大語言模型

大語言模型 (Large Language Model, LLM) 需基于海量數據集進行訓練,可能擁有數十億權重參數。

其先進的網絡結構和龐大的參數量,使它們能夠很好地應對自然語言本身的復雜性。

完成訓練后的大語言模型,可針對各種下游的自然語言處理 (NLP) 和自然語言生成 (NLG) 任務進行調優,讓其更適合對話式聊天機器人(如 ChatGPT)、機器翻譯、文本分類、欺詐檢測和情感分析等任務場景。

大語言模型部署面臨的挑戰

大語言模型在執行自然語言處理和自然語言生成任務方面表現出色,但其訓練和部署頗為復雜,主要面臨以下挑戰:

  • AI 與內存墻瓶頸問題[9]:算力每兩年提高 3.1 倍,內存帶寬卻只提高 1.4 倍;
  • 網絡帶寬挑戰:訓練大語言模型需要采用分布式系統,這對網絡帶寬提出了較高要求;
  • 系統資源有限:訓練后的模型往往會部署在算力和內存資源均有限的系統上。

因此,采用訓練后量化的方法來為大語言模型瘦身,對于實現低時延推理至關重要。

大語言模型的量化

量化是一種常見的壓縮操作,可以減少模型占用的內存空間,提高推理性能。

采用量化方法可以降低大語言模型部署的難度。具體來說,量化是將浮點矩陣轉換為整數矩陣:

圖片

其中 X_fp32、S 和 Z 分別為輸入矩陣、比例因子和整數零點。

有關每通道 (per-channel) 量化策略雖然可能會減少量化損失,但不能用于激活值量化的原因,請參看 SmoothQuant 相關文檔[10]。

不過,激活值量化誤差損失卻是導致模型量化準確率下降的重要因素。

為此,人們提出了很多方法來降低激活值量化損失,例如:SPIQ[11]、Outlier Suppression[12]和 SmoothQuant[13]。

這三種方法思路相似,即把激活值量化的難度轉移到權重量化上,只是三者在轉移難度的多少上有所不同。

增強型 SmoothQuant

SmoothQuant 引入了一個超參數 α 作為平滑因子來計算每個通道的量化比例因子,并平衡激活值和權重的量化難度。

圖片

其中 j 是輸入通道索引。

圖片

對于 OPT 和 BLOOM 等大多數模型來說,α=0.5 是一個能夠較好實現權重和激活值量化難度分割的平衡值。模型的激活異常值越大,就越需要使用更大的 α 值來將更多的量化難度轉移到權重上。

原始的 SmoothQuant 旨在通過針對整個模型使用一個固定值 α 來分割權重和激活值的量化難度。

然而,由于激活異常值的分布不僅在不同模型之間存在差異,而且在同一模型的不同層之間也不盡相同。

因此,本文推薦使用英特爾Neural Compressor 的自動調優能力,逐層獲取最佳 α 值。

相關方法包括以下五個主要步驟(偽代碼如下所示):

  1. 通過特殊的回調函數 register_forward_hook 捕獲 (hook) 模型各層的輸入和輸出值。
  2. 根據用戶定義的 α 范圍和步長生成一個 α 值列表。
  3. 根據給定的 α 值重新計算平滑因子并調整參數(權重值和激活值)。
  4. 對權重執行每通道量化與反量化 (quantization_dequantization),對輸入值執行每張量 (per-tensor) 量化與反量化,以預測與給定 α 值對應的每層輸出值。
  5. 計算相對實際輸出值的均方損失,將調整后的參數恢復回來,并保存每層的最佳 α 值。

圖片

本文提出的方法支持用多個標準(如最小值、最大值和平均值)來確定 Transformer 塊的輸入層歸一化 (LayerNorm) 操作的 α 值。

實驗發現,將 α 范圍設為 [0.3, 0.7],步長設為 0.05,對大多數模型來說都能達到很好的平衡。

這一方法有兩個顯著特點:一是全自動化,二是比原始方法支持的融合模式多。

下圖提供了在 BLOOM-1b7 模型上執行 SmoothQuant α 值自動調優的樣例代碼:

圖片

△啟用增強型 SmoothQuant 的樣例代碼

用戶只需傳遞一個模型名稱 (model_name) 和一個數據加載器。值得注意的是,模型分析主要依靠的是 Torch JIT。用戶可以在加載 Hugging Face[15]模型時將 torchscript 設置為 True,或將 return_dict 設置為 False。

更多信息請參閱英特爾Neural Compressor 文檔[15]。

結果

本文提出的增強型 SmoothQuant 的主要優勢在于提高了準確率。

經過對多種主流大語言模型的評估,具備自動調優能力的 INT8 SmoothQuant 最后一個詞元 (last-token) 的預測準確率要高于原始 INT8 SmoothQuant 和 FP32 基線方法。詳見下圖:

圖片

△FP32 基線方法、INT8(啟用和不啟用 SmoothQuant)以及 INT8(啟用本文提出的增強型 SmoothQuant)的準確率對比

從上圖可以看出,在 OPT-1.3b 和 BLOOM-1b7 模型上,本文提出的增強型 SmoothQuant 的準確率比默認的 SmoothQuant 分別高 5.4% 和 1.6%。

量化后的模型也縮小到 FP32 模型的四分之一,大大減少了內存占用空間,從而有效地提升大模型在英特爾平臺上的推理性能。

更全面的結果請見 GitHub 存儲庫[16]。同時,也歡迎您創建拉取請求或就 GitHub 問題[17]發表評論。期待聽到您的反饋意見和建議。

了解更多內容,請點擊文末【閱讀原文】。

作者:

英特爾公司人工智能資深架構師沈海豪、英特爾公司人工智能資深軟件工程師程文華、英特爾公司人工智能軟件工程師陸崟彤、何欣、郭恒、王暢、王夢妮,他們都在從事模型量化及壓縮的研究與優化工作。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-04-08 13:59:03

大模型Replicate

2025-04-22 08:08:37

2025-07-08 03:22:00

大模型參數AI

2024-08-02 14:50:00

數據AI

2023-11-03 07:47:12

機器資源大模型:

2025-03-04 10:13:45

2022-12-01 09:34:01

模型論文

2024-12-04 10:35:21

2024-11-01 10:16:09

API開源項目

2025-09-28 01:55:00

GGUF大模型GPT

2023-10-28 13:29:27

2025-10-10 07:48:12

大模型預訓練初始化

2023-05-26 00:43:08

2025-03-31 00:33:00

2025-03-06 07:28:31

DeepSeek大模型人工智能

2023-03-03 13:06:34

大腦分層預測

2023-07-28 08:08:09

大淘寶數據模型數據治理
點贊
收藏

51CTO技術棧公眾號

欧美视频三区| 五月婷婷六月丁香| 91麻豆精品国产91久久久平台| 91激情在线视频| 欧美精品久久久| 国产伦精品一区二区三区视频我| sdde在线播放一区二区| 欧美久久免费观看| 国产xxxx振车| 青青草超碰在线| 欧美aaa在线| 色久欧美在线视频观看| 四川一级毛毛片| av白虎一区| 久久久久久久久免费| 国产精品专区一| 国产老头老太做爰视频| 精品国产一区二区三区成人影院| 一本久久a久久精品亚洲| 亚洲精品一品区二品区三品区| 91亚洲国产成人久久精品麻豆| 四季av一区二区三区免费观看 | 国产黄色片在线免费观看| 久久爱www.| 五月婷婷另类国产| 亚洲欧美日韩不卡一区二区三区| www.激情五月.com| 久久蜜桃精品| 精品中文字幕在线2019| 精品人妻一区二区三区视频| 未满十八勿进黄网站一区不卡| 亚洲综合久久久久| 日韩国产高清一区| 亚洲精品一区二区三区蜜桃| 日韩高清不卡一区二区三区| 欧美老女人性生活| av手机在线播放| 中文字幕一区二区三区四区久久| 91激情在线视频| youjizz.com在线观看| 国产福利片在线| 成人18精品视频| 成人在线国产精品| 在线视频精品免费| 亚洲资源av| 日韩中文字幕网址| 好吊日免费视频| 亚洲成人黄色| 欧美精品一二三| 国产资源在线视频| 黄色在线免费| 亚洲国产岛国毛片在线| 久久国产精品精品国产色婷婷| 国产情侣在线播放| 日本中文字幕一区二区有限公司| 久久久久久久一| av成人免费网站| 日本道不卡免费一区| 亚洲男人的天堂网站| 精品人妻二区中文字幕 | 国产精品r级在线| 日本少妇激情视频| 欧美日韩岛国| 大胆欧美人体视频| 国精产品一区一区| 精品国产一区探花在线观看| 亚洲精品网站在线播放gif| xxxx在线免费观看| 日本免费成人| 精品视频免费看| 天天操天天爽天天射| a一区二区三区| 日韩欧美主播在线| 北条麻妃69av| 91精品产国品一二三产区| 无码av中文一区二区三区桃花岛| 男人添女人荫蒂免费视频| 久久99亚洲网美利坚合众国| 亚洲另类色综合网站| 中文字幕免费在线不卡| 一广人看www在线观看免费视频| 国产精品视频在线看| 天堂va久久久噜噜噜久久va| 9色在线观看| 国产精品久久午夜| av动漫免费观看| av在线播放观看| 亚洲一区二区五区| 成年丰满熟妇午夜免费视频| 自拍亚洲图区| 午夜视频一区二区三区| 国内性生活视频| 日韩欧美另类一区二区| 欧美视频一区二区| 亚洲最大天堂网| 激情中国色综合| 欧美日韩国产影片| 91日韩精品视频| 欧美经典一区| 亚洲精品国产成人| 国产特级黄色录像| 色综合咪咪久久网| 欧美国产精品人人做人人爱| 欧美日韩综合在线观看| 日韩在线一二三区| 国产一区二区视频在线观看| 丰满少妇高潮在线观看| 久久尤物电影视频在线观看| 色播亚洲婷婷| 婷婷丁香在线| 一本在线高清不卡dvd| 日韩高清第一页| aaa国产精品视频| 亚洲人成在线电影| 女同久久另类69精品国产| 欧美午夜在线| 国产精品678| 国产精品玖玖玖| 成人蜜臀av电影| 色综合电影网| 影音先锋中文在线视频| 欧美性猛交丰臀xxxxx网站| 国产无遮挡猛进猛出免费软件| 中文字幕区一区二区三| 亚洲色图第三页| 欧美成人一二三区| 亚洲在线观看| 91网在线免费观看| 久久久久久久久亚洲精品| 亚洲日本一区二区| 欧美日韩亚洲第一| 日韩在线观看一区二区三区| 亚洲第一精品夜夜躁人人爽 | 黑人巨大亚洲一区二区久| 欧美日韩高清一区| 美国黄色一级视频| 欧美hd在线| 日本三级久久久| 亚洲国产精品二区| 中文字幕欧美一区| 成人在线看视频| 亚洲性视频在线| 在线精品国产成人综合| 欧美一级视频免费观看| 久久国产精品99精品国产 | 精品国产免费一区二区三区香蕉| 亚洲精品成人av久久| 国产一区二区三区的电影| 99www免费人成精品| 求av网址在线观看| 色噜噜狠狠成人中文综合| 精品国产免费久久久久久婷婷| 久久免费大视频| 欧美一级免费看| 狠狠躁夜夜躁av无码中文幕| 亚洲美女免费在线| 最新天堂中文在线| 日韩成人免费| 国产不卡在线观看| 免费在线观看污视频| 欧美日韩美女在线| 一区二区三区少妇| 狠久久av成人天堂| 亚洲影视九九影院在线观看| 黄色免费网站在线观看| 欧美精品在线观看播放| 青青操在线播放| 奇米精品一区二区三区在线观看一 | 超碰免费在线播放| 欧美一级夜夜爽| 国产免费一区二区三区网站免费| 性色一区二区| 日本欧美精品久久久| 欧美色999| 国产小视频国产精品| 黄色一区二区视频| 国产精品麻豆久久久| 日韩av一卡二卡三卡| 午夜激情久久| 亚洲一区美女视频在线观看免费| 污网站在线免费看| 精品国产百合女同互慰| 国产精彩视频在线| 26uuu国产一区二区三区| 中国丰满人妻videoshd | 人妻无码中文字幕免费视频蜜桃| 亚洲成人自拍偷拍| 日韩精品卡通动漫网站| 视频一区视频二区在线观看| 色噜噜狠狠一区二区三区| 国产美女久久| 久久综合伊人77777尤物| a毛片在线免费观看| 亚洲综合视频在线| 久久精品国产亚洲av麻豆| 日韩av不卡一区二区| 中文字幕一区二区三区最新 | 国产精品扒开腿做爽爽爽视频| freemovies性欧美| 3atv一区二区三区| 日本少妇吞精囗交| 国产精品色婷婷| www.17c.com喷水少妇| 麻豆精品视频在线| 九一国产精品视频| 久久久久久久久99精品大| 蜜桃传媒视频第一区入口在线看| 91精品网站在线观看| 91精品国产91| 91精品久久久久久粉嫩| 在线电影av不卡网址| 欧洲成人一区二区三区| 欧美日韩国产另类一区| 亚洲精品www久久久久久| 国产精品的网站| 亚洲乱码国产乱码精品精大量| 国产激情一区二区三区四区 | 久久成人av少妇免费| 国产 福利 在线| 欧美国产高清| 中文字幕日韩一区二区三区不卡 | 欧美国产精品一二三| 国产精品欧美久久久久一区二区| www.17c.com喷水少妇| 国产精品综合网| 亚洲欧美日韩一级| 久久久999| 男人和女人啪啪网站| 一区二区自拍| 欧美做受777cos| 国产精品二区不卡| 亚洲精品美女久久7777777| 色老板在线视频一区二区| www.av一区视频| 午夜久久av| 91久久国产自产拍夜夜嗨| 91成人短视频在线观看| 国产精品视频yy9099| 亚洲第一会所001| 国产成人精品一区二区| 中文字幕在线看片| 91成人国产在线观看| 手机在线观看av网站| 久久久久亚洲精品| 福利在线导航136| 欧美激情一区二区三区久久久| 在线你懂的视频| 欧美精品亚州精品| 男插女视频久久久| 性欧美在线看片a免费观看| 成人免费高清观看| 久久久久国色av免费观看性色| 香蕉成人app免费看片| 欧美激情第三页| 91超碰在线免费| 91精品国产高清久久久久久久久 | 免费黄色在线视频网站| 亚洲欧美国产视频| 你懂的免费在线观看视频网站| 亚洲精品自拍第一页| 青青操在线视频| 国产亚洲激情视频在线| 日本视频不卡| 欧美日韩成人在线观看| 6699嫩草久久久精品影院| 91av视频在线免费观看| 欧美黑人疯狂性受xxxxx野外| 日韩美女免费观看| 婷婷久久免费视频| 5g国产欧美日韩视频| 久久婷婷国产| 日韩av一级大片| 看看黄色一级片| 国产精品日本一区二区不卡视频 | 日本中文字幕在线| 91久久精品日日躁夜夜躁欧美| 在线中文字幕网站| 日韩欧美视频一区| 丝袜视频国产在线播放| 亚洲香蕉在线观看| 国产传媒在线播放| 国模gogo一区二区大胆私拍| 欧美电影免费观看高清完整| 国产精品一二三在线| 精品一区二区三区中文字幕在线| 国产99在线播放| 久久91麻豆精品一区| 看一级黄色录像| 国产一区二区三区久久久久久久久| 成人亚洲视频在线观看| 国产自产高清不卡| 水蜜桃av无码| 国产精品国产自产拍高清av王其| 久久久久久久中文字幕| 色综合久久综合| 99精品国产99久久久久久97| 国产丝袜一区二区| 综合久久2019| 国产精品1234| 国产精品毛片久久久| 色综合影院在线观看| 国内精品99| the porn av| 9久草视频在线视频精品| 国产一二三av| 欧美三级xxx| 北条麻妃一二三区| 伊人久久久久久久久久久| sm在线观看| 国产日韩在线看| 日韩高清影视在线观看| 欧美另类videos| 日本伊人精品一区二区三区观看方式| 白丝校花扒腿让我c| 国产精品情趣视频| 中文字幕高清在线免费播放| 欧美va亚洲va| 日本美女在线中文版| 欧美在线激情视频| 91成人福利| 秋霞在线一区二区| 日韩主播视频在线| 亚洲av无码一区二区三区观看| 一区二区三区在线不卡| 中文在线字幕av| 亚洲男人天堂2023| 爱啪啪综合导航| 国产高清在线一区二区| 亚洲国产日韩欧美在线| 色婷婷综合网站| 久久久久久久久99精品| 国产乡下妇女做爰| 日韩欧美一级二级| 欧美jizz18性欧美| 国产精品福利观看| 视频一区中文| 99精品免费在线观看| 97se亚洲国产综合自在线| 久久人人爽人人爽人人| 日韩一区二区高清| 伊人影院在线视频| 91影院未满十八岁禁止入内| 欧美日韩亚洲一区在线观看| 少妇高潮一69aⅹ| 一区二区三区中文免费| 精品乱子伦一区二区| 九九久久国产精品| 亚洲国产一区二区三区网站| 一级性生活视频| 国产精品1区2区3区在线观看| 青娱乐国产在线视频| 91精品国产麻豆国产自产在线| 成年人黄视频在线观看| 91久久精品一区二区别 | 日韩日韩日韩日韩日韩| 北岛玲一区二区三区四区| 日本一二三区不卡| 日韩成人在线播放| 电影一区二区三| 欧美另类一区| 蜜桃视频一区二区三区| 亚洲二区在线播放| 日韩免费成人网| 超碰91在线观看| 免费在线一区二区| 日本少妇一区二区| 国产精品99久久久久久成人| 欧美一级黄色大片| 国产资源在线观看入口av| 欧美日韩在线观看一区| 免费人成网站在线观看欧美高清| 51精品免费网站| 亚洲国产黄色片| 台湾佬成人网| 一区二区三区在线观看www| 国产一区二区调教| 精品国产免费观看| 色噜噜国产精品视频一区二区| 日本一区二区三区视频在线看| 日韩视频免费播放| 国产日韩av一区| 99在线观看免费| 欧美一级片久久久久久久| 9999国产精品| 毛茸茸free性熟hd| 欧美在线播放高清精品| 亚洲男同gay网站| 欧美日韩一区在线播放| 韩国欧美一区二区| 日韩在线视频免费播放| 日韩中文字幕国产| 美女av一区| 三年中文在线观看免费大全中国| 亚洲成人av资源| 91精彩在线视频| 国内不卡一区二区三区| 久久99精品久久久久婷婷| 奇米影视第四色777| www.日本久久久久com.| 欧美电影免费网站|