精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

英偉達玩轉剪枝、蒸餾:把Llama 3.1 8B參數減半,性能同尺寸更強

人工智能 新聞
最近,英偉達研究表明,結構化權重剪枝與知識蒸餾相結合,可以從初始較大的模型中逐步獲得較小的語言模型。

上個月,Meta 發布了 Llama 3.1 系列模型,其中包括 Meta 迄今為止最大的 405B 模型,以及兩個較小的模型,參數量分別為 700 億和 80 億。

Llama 3.1 被認為是引領了開源新時代。然而,新一代的模型雖然性能強大,但部署時仍需要大量計算資源。

因此,業界出現了另一種趨勢,即開發小型語言模型 (SLM),這種模型在許多語言任務中表現足夠出色,部署起來也非常便宜。

最近,英偉達研究表明,結構化權重剪枝與知識蒸餾相結合,可以從初始較大的模型中逐步獲得較小的語言模型。

圖片

圖靈獎得主、Meta 首席 AI 科學家 Yann LeCun 也點贊轉帖了該研究。

經過剪枝和蒸餾,英偉達研究團隊將 Llama 3.1 8B 提煉為 Llama-3.1-Minitron 4B 開源了出來。這是英偉達在 Llama 3.1 開源系列中的第一個作品。

Llama-3.1-Minitron 4B 的表現優于類似大小的最先進的開源模型,包括 Minitron 4B、Phi-2 2.7B、Gemma2 2.6B 和 Qwen2-1.5B。

圖片

這項研究的相關論文早在上個月已經放出了。

圖片


  • 論文鏈接:https://www.arxiv.org/pdf/2407.14679
  • 論文標題:Compact Language Models via Pruning and Knowledge Distillation

剪枝和蒸餾

剪枝使模型變得更小、更精簡,可以通過刪除層(深度剪枝)或刪除神經元和注意力頭以及嵌入通道(寬度剪枝)來實現。剪枝通常伴隨著一定程度的再訓練,以恢復準確率。

模型蒸餾是一種將知識從大型復雜模型(通常稱為教師模型)遷移到較小、較簡單的學生模型的技術。目標是創建一個更高效的模型,該模型保留了原始較大模型的大部分預測能力,同時運行速度更快且資源消耗更少。

蒸餾方式主要包括兩種:SDG 微調與經典知識蒸餾,這兩種蒸餾方式互補。本文主要關注經典知識蒸餾方法。

英偉達采用將剪枝與經典知識蒸餾相結合的方式來構造大模型,下圖展示了單個模型的剪枝和蒸餾過程(上)以及模型剪枝和蒸餾的鏈條(下)。具體過程如下:

1. 英偉達從 15B 模型開始,評估每個組件(層、神經元、頭和嵌入通道)的重要性,然后對模型進行排序和剪枝,使其達到目標大?。?B 模型。

2. 接著使用模型蒸餾進行了輕度再訓練,原始模型作為老師,剪枝后的模型作為學生。

3. 訓練結束后,以小模型(8B)為起點,剪枝和蒸餾為更小的 4B 模型。

圖片

從 15B 模型進行剪枝與蒸餾的過程。

需要注意的點是,在對模型剪枝之前,需要先了解模型的哪部分是重要的。英偉達提出了一種基于激活的純重要性評估策略,該策略可以同時計算所有相關維度(深度、神經元、頭和嵌入通道)的信息,使用一個包含 1024 個樣本的小型校準數據集,并且只需要前向傳播。這種方法相比依賴梯度信息并需要反向傳播的策略更加簡單且具有成本效益。 

在剪枝過程中,你可以針對給定軸或軸組合在剪枝和重要性估計之間進行迭代交替。實證研究顯示,使用單次重要性估計就足夠了,迭代估計不會帶來額外的好處。

利用經典知識蒸餾進行重新訓練

下圖 2 展示了蒸餾過程,其中 N 層學生模型(剪枝后的模型)是從 M 層教師模型中(原始未剪枝模型)蒸餾而來。學生模型通過最小化嵌入輸出損失、logit 損失以及映射到學生塊 S 和教師塊 T 的 Transformer 編碼器特定損失組合來學習。

圖片

圖 2:蒸餾訓練損失。

剪枝和蒸餾最佳實踐

英偉達基于緊湊語言模型中剪枝和知識蒸餾的廣泛消融研究,將自己的學習成果總結為以下幾種結構化壓縮最佳實踐。

一是調整大小。

  • 要訓練一組 LLM,首先訓練最大的一個,然后迭代地剪枝和蒸餾以獲得較小的 LLM。
  • 如果使用多階段訓練策略來訓練最大的模型,最好剪枝并對訓練最后階段獲得的模型進行重新訓練。
  • 對最接近目標大小的可用源模型進行剪枝。

二是剪枝。

  • 優先考慮寬度剪枝而不是深度剪枝,這對于 15B 參數規模以下的模型效果很好。
  • 使用單樣本(single-shot)重要性估計,因為迭代重要性估計沒有任何好處。

三是重新訓練。

  • 僅使用蒸餾損失進行重新訓練,而不是常規訓練。
  • 當深度明顯減少時,使用 logit、中間狀態和嵌入蒸餾。
  • 當深度沒有明顯減少時,使用 logit-only 蒸餾。

Llama-3.1-Minitron:將最佳實踐付諸應用

Meta 最近推出了功能強大的 Llama 3.1 開源模型系列,在許多基準測試中可與閉源模型相媲美。Llama 3.1 的參數范圍從巨大的 405B 到 70B、8B。

憑借 Nemotron 蒸餾的經驗,英偉達著手將 Llama 3.1 8B 模型蒸餾為更小、更高效的 4B 模型,采取以下措施:

  • 教師微調
  • Depth-only 剪枝
  • Width-only 剪枝
  • 準確率基準
  • 性能基準

教師微調

為了糾正模型訓練所基于的原始數據集的分布偏差,英偉達首先在他們的數據集上(94B token)對未剪枝的 8B 模型進行了微調。實驗表明,如果不糾正分布偏差,教師模型在蒸餾時會為數據集提供次優指導。

Depth-only 剪枝

為了從 8B 降到 4B,英偉達剪枝了 16 層(50%)。他們首先通過從模型中刪除每個層或連續子層組來評估它們的重要性,并觀察下游任務中 LM 損失的增加或準確率的降低。

下圖 5 顯示了刪除 1、2、8 或 16 層后驗證集上的 LM 損失值。例如,第 16 層的紅色圖表示如果刪除前 16 層,則出現 LM 損失。第 17 層表示如果保留第一層并刪除第 2 至第 17 層,也出現 LM 損失。英偉達觀察到:開始和結束的層是最重要的。

圖片

圖 5:depth-only 剪枝中層的重要性。

然而,英偉達觀察到,這種 LM 損失不一定與下游性能直接相關。

下圖 6 顯示了每個剪枝模型的 Winogrande 準確率,它表明最好刪除第 16 到第 31 層,其中第 31 層是倒數第二層,剪枝模型的 5-shot 準確率明顯高于隨機準確率 (0.5)。英偉達采納了這一見解,刪除了第 16 到第 31 層。

圖片

圖 6:當刪除 16 層時,在 Winogrande 任務上的準確率。

Width-only 剪枝

英偉達沿寬度軸剪枝了嵌入(隱藏)和 MLP 中間維,以壓縮 Llama 3.1 8B。具體來說,他們使用前面描述的基于激活的策略來計算每個注意頭、嵌入通道和 MLP 隱藏維度的重要性分數。

在重要性估計之后,英偉達選擇

  • 將 MLP 中間維從 14336 剪枝到 9216。
  • 將隱藏大小從 4096 剪枝到 3072。
  • 重新訓練注意頭數量和層數。

值得一提的是,在單樣本剪枝之后,寬度剪枝的 LM 損失高于深度剪枝。然而,經過短暫的重新訓練后,趨勢發生了逆轉。

準確率基準

英偉達使用以下參數對模型進行蒸餾

  • 峰值學習率 = 1e-4
  • 最小學習率 = 1e-5
  • 40 步線性預熱
  • 余弦衰減計劃
  • 全局批量大小 = 1152

下表 1 顯示了 Llama-3.1-Minitron 4B 模型變體(寬度剪枝和深度剪枝)與原始 Llama 3.1 8B 模型、其他類似大小的模型在跨多個領域的基準測試中的性能比較??傮w而言,英偉達再次證實了寬度剪枝策略相較于遵循最佳實踐的深度剪枝的有效性。

圖片

表 1:Minitron 4B base 模型相較于類似規模 base 模型的準確率比較。

為了驗證蒸餾后的模型是否可以成為強大的指令模型,英偉達使用 NeMo-Aligner 對 Llama-3.1-Minitron 4B 模型進行了微調。

他們使用了 Nemotron-4 340B 的訓練數據,在 IFEval、MT-Bench、ChatRAG-Bench 和 Berkeley Function Calling Leaderboard (BFCL) 上進行了評估,以測試指令遵循、角色扮演、RAG 和函數調用功能。最后確認 Llama-3.1-Minitron 4B 模型可以成為可靠的指令模型,其表現優于其他基線 SLM。

圖片

表 2:對齊 Minitron 4B base 模型與類似規模的對齊模型的準確率比較。

性能基準

英偉達利用 NVIDIA TensorRT-LLM(一種用于優化 LLM 推理的開源工具包)優化了 Llama 3.1 8B 和 Llama-3.1-Minitron 4B 模型。

下兩張圖顯示了不同模型在不同用例下以 FP8 和 FP16 精度每秒的吞吐量請求,表示為 8B 模型的 batch size 為 32 的輸入序列長度 / 輸出序列長度 (ISL/OSL) 組合以及 4B 模型的 batch size 為 64 的輸入序列長度 / 輸出序列長度 (ISL/OSL) 組合,這要歸功于在一塊英偉達 H100 80GB GPU 上,較小的權重允許較大的 batch size。

Llama-3.1-Minitron-4B-Depth-Base 變體是最快的,平均吞吐量約為 Llama 3.1 8B 的 2.7 倍,而 Llama-3.1-Minitron-4B-Width-Base 變體的平均吞吐量約為 Llama 3.1 8B 的 1.8 倍。與 BF16 相比,在 FP8 中部署還可使這三種型號的性能提高約 1.3 倍。

圖片

圖 8:組合:Llama 3.1 8B 為 BS=32,Llama-3.1-Minitron 4B 型號為 BS=64。1x H100 80GB GPU。

結論

剪枝和經典知識提煉是一種非常經濟高效的方法,可以逐步獲得更小尺寸的 LLM,與在所有領域從頭開始訓練相比,可實現更高的準確性。與合成數據式微調或從頭開始預訓練相比,這是一種更有效且數據效率更高的方法。

Llama-3.1-Minitron 4B 是英偉達首次嘗試使用最先進的開源 Llama 3.1 系列完成的探索。要在 NVIDIA NeMo 中使用 Llama-3.1 的 SDG 微調,可參閱 GitHub 上的 /sdg-law-title-generation 部分。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2024-07-22 07:50:00

模型英偉達

2025-02-17 12:30:00

2024-07-29 07:46:00

英偉達模型

2024-07-02 01:09:02

2024-12-19 07:10:00

2024-08-15 15:45:00

AI訓練

2025-03-25 12:49:25

2025-08-20 09:28:53

2024-04-19 10:32:08

2021-12-06 09:35:38

英偉達人工智能軟件

2025-05-27 15:19:52

GPUMetaGPT-4o

2024-07-29 13:38:06

2024-07-23 09:20:35

2024-11-25 08:10:00

2024-05-27 09:16:37

2024-04-19 08:01:01

Llama 3 8BMeta

2025-08-19 16:10:46

AI模型開源

2024-04-30 08:28:44

開源大模型Llama
點贊
收藏

51CTO技術棧公眾號

欧美怡红院视频| 欧美日韩一二三四区| 国产精品传媒在线观看| 秋霞影院一区| 国产精品五区| 日韩手机在线导航| 亚欧洲精品在线视频免费观看| 日本少妇裸体做爰| 91精品尤物| 一区二区三区成人| 91在线视频导航| 黑人狂躁日本娇小| 久久精品国产福利| 国产精品天干天干在线综合| 国产91久久婷婷一区二区| 给我免费观看片在线电影的| 国产精品偷拍| 亚洲每日更新| 亚洲激情国产精品| 国精产品一区一区三区视频| 国产成人三级在线观看视频| 欧美激情1区| 欧美成人女星排行榜| www.国产亚洲| 亚洲老妇色熟女老太| 亚洲午夜一区| 亚洲精品电影在线观看| 三上悠亚在线一区| 老司机99精品99| 国产真实乱偷精品视频免| 最近更新的2019中文字幕| mm1313亚洲国产精品无码试看| 美丽的姑娘在线观看免费动漫| 久久国产日本精品| 亚洲色图五月天| 无码人妻丰满熟妇区毛片| 国产youjizz在线| 视频一区二区三区入口| 在线播放日韩av| 思思久久精品视频| 亚洲综合图区| 精品一区二区三区不卡 | 亚洲不卡免费视频| 卡一卡二国产精品| 久热精品视频在线| xxxx国产视频| 国产理论在线| 国产欧美精品一区| 亚洲综合在线中文字幕| 色播视频在线播放| 精品国产91乱码一区二区三区四区 | sm久久捆绑调教精品一区| 亚洲精品欧美激情| 精品视频高清无人区区二区三区| 五月婷婷亚洲综合| 区一区二视频| 亚洲成人精品久久久| 六月丁香婷婷在线| 超碰在线观看免费| 26uuu亚洲综合色欧美| 国产精品中文字幕久久久| 麻豆91精品91久久久| 久久91麻豆精品一区| 欧美精品在线观看一区二区| 亚洲国产成人精品无码区99| 日本福利专区在线观看| 国产专区欧美精品| 91精品在线看| www.av日韩| 视频在线在亚洲| 国产精品久久久久免费a∨| 久久久91视频| 欧美日韩激情在线一区二区三区| 亚洲无亚洲人成网站77777| 少妇高潮一69aⅹ| 日本高清精品| 日韩精品福利在线| 亚洲国产日韩在线一区| 欧美gay视频| 一区在线播放视频| 欧美精品尤物在线| 日韩一区免费视频| 国产综合久久久久久鬼色 | 欧美激情小视频| xxxxx99| 成人搞黄视频| 91精品福利在线一区二区三区| 免费在线观看视频a| 日本免费一区二区三区四区| 欧美精品少妇一区二区三区| 国产ts在线观看| 在线免费观看亚洲| 欧美在线一区二区| 成人在线激情网| 精品国产亚洲一区二区三区大结局 | 亚洲天堂av在线播放| 国产性xxxx| 99久久久久久中文字幕一区| 亚洲精品一区av在线播放| 国偷自产av一区二区三区麻豆| 欧美性生活一级片| 精品国产乱码久久久久久1区2区 | 天天爱天天做天天爽| 国产欧美精品| 91久久久久久久久| 欧美色图另类| 亚洲二区在线视频| www精品久久| 欧美三区在线| 亚洲欧洲日韩一区二区三区| 日本五级黄色片| 黄色大片在线播放| 欧美日韩中文字幕在线视频| 青青草精品视频在线| 外国电影一区二区| 欧美在线综合视频| 久久人人妻人人人人妻性色av| 日韩一级毛片| 久久亚洲国产精品| 中文字幕手机在线视频| 99国产精品久久| 品久久久久久久久久96高清| 国产视频网址在线| 欧美日韩国产精品一区| www黄色av| 1313精品午夜理伦电影| 久久综合电影一区| 亚洲国产无线乱码在线观看| 97久久精品人人澡人人爽| 国产一级不卡视频| 国产精品国产亚洲精品| 欧美成人a∨高清免费观看| 日韩精品久久久久久久的张开腿让| 成人国产精品一级毛片视频| 青青草原一区二区| 中文字幕 日韩有码| 精品一区二区三区久久久| 色噜噜色狠狠狠狠狠综合色一| 色资源二区在线视频| 日本大香伊一区二区三区| 国产三级三级看三级| 国产午夜久久av| www.欧美精品| 久热精品在线观看| 国产精品一区二区无线| 狠狠色综合欧美激情| 呦呦在线视频| 日韩欧美激情一区| 3d动漫精品啪啪一区二区下载| 成人午夜av| 国产精品美女免费视频| av播放在线| 亚洲综合无码一区二区| 久久久久国产免费| 欧美在线观看视频一区| 国产精品成人观看视频国产奇米| 国产精品怡红院| 91偷拍与自偷拍精品| 黄色一级片播放| 久久福利在线| 美日韩在线视频| 亚洲 欧美 中文字幕| 国产成人精品免费看| 青青草原成人| 国产精品久久久久久久久久齐齐| 日韩精品一区二区三区视频播放| 欧美另类视频在线观看| 9久草视频在线视频精品| 一本久道久久综合狠狠爱亚洲精品| 午夜小视频在线观看| 精品日韩欧美一区二区| 国产成人亚洲精品自产在线 | 欧美视频日韩视频在线观看| 亚洲男人天堂2021| 亚洲另类av| 久久久久久久一| 三级理论午夜在线观看| 亚洲精品自拍动漫在线| a级片在线观看视频| 99热精品久久| 91偷拍精品一区二区三区| 激情小视频在线观看| 亚洲大片一区二区三区| 国产特黄级aaaaa片免| 六月丁香婷婷色狠狠久久| 亚洲中文字幕无码一区二区三区 | 综合在线影院| 久热国产精品视频| 图片区 小说区 区 亚洲五月| 综合久久国产九一剧情麻豆| 精品无码av一区二区三区| 天堂资源在线中文精品| 国产一区一区三区| 欧美午夜三级| 亚洲欧美色婷婷| 91av在线免费视频| 国产精品激情偷乱一区二区∴| 亚洲成熟丰满熟妇高潮xxxxx| 水蜜桃精品av一区二区| 国产精品一区久久| 春色校园综合激情亚洲| 在线观看成人黄色| 婷婷国产在线| 欧美性生交xxxxxdddd| 黄色录像一级片| 国产亚洲短视频| 搡女人真爽免费午夜网站| 国产成人一区| 国产精品视频一区二区三区四| 美洲精品一卡2卡三卡4卡四卡| 日韩亚洲欧美中文三级| 精品成人无码久久久久久| 亚洲mv大片欧洲mv大片精品| 乱码一区二区三区| 免费看黄色91| 午夜啪啪免费视频| 欧美猛男做受videos| 高清日韩一区| 黄视频免费在线看| 久久香蕉国产线看观看av| 成人三级黄色免费网站| 欧美色爱综合网| av中文在线播放| 一区二区高清免费观看影视大全 | 狠狠躁夜夜躁人人爽天天天天97 | 国产精品日韩高清| av今日在线| 国产偷国产偷亚洲清高网站| 亚洲精品一区二区三区蜜桃 | 手机亚洲第一页| 精品国产百合女同互慰| 午夜精品久久久久久久99热黄桃 | 青青草在线免费观看| 亚洲成人网在线| 亚洲第一免费视频| 欧美一级日韩免费不卡| 亚洲无码精品在线播放| 一区二区在线免费观看| 国产麻豆剧传媒精品国产av| 久久精品日韩欧美| 给我免费播放片在线观看| 韩日视频一区| 天天操天天干天天玩| 鲁大师精品99久久久| 国产精品免费一区豆花| 日韩电影大全网站| 日韩免费观看网站| 婷婷激情一区| 国产精品劲爆视频| 福利视频亚洲| 成人精品在线视频| 一个人看的www视频在线免费观看| 亚洲视频在线视频| 黄色在线播放| 中文在线不卡视频| 天堂在线资源网| 欧美色网一区二区| 又骚又黄的视频| 欧美人伦禁忌dvd放荡欲情| 国产一级特黄aaa大片| 亚洲午夜免费电影| 国产精品久久久视频| 成人激情小说乱人伦| 视频二区在线播放| 激情深爱一区二区| 成年人在线看片| 蜜臀精品久久久久久蜜臀| 亚洲怡红院在线| 国产不卡在线播放| 精品人妻一区二区三区香蕉| 国产精品 日产精品 欧美精品| 成人久久久久久久久| 视频一区在线视频| 国产精品自在自线| 国产成人精品免费网站| 国产伦精品一区二区三区妓女 | 精品卡一卡二卡三卡四在线| 天天操天天干天天爱| 在线观看欧美日韩国产| 青青青草视频在线| 日av在线播放中文不卡| 亚洲国产91视频| 国产三区精品| 日韩成人视屏| 久久手机视频| 国产另类在线| 成人av中文| 日韩高清二区| 欧美视频1区| 亚洲女同中文字幕| 一区二区三区四区在线视频| 国产成人三级| 伊人再见免费在线观看高清版| 日韩一区二区在线免费| 性高湖久久久久久久久aaaaa| 68国产成人综合久久精品| 亚洲草草视频| 欧美三级三级| 成人免费观看在线| 久久精品国产一区二区三 | 国产片高清在线观看| 欧美日韩一区三区| 欧美视频在线观看一区二区三区| 一区二区国产精品视频| av免费不卡国产观看| 91精品综合视频| 久久99精品久久久久久园产越南| 中文字幕免费高| 天堂在线一区二区| 在线观看国产免费视频| 一区二区三区四区亚洲| 在线免费观看一级片| 日韩精品极品视频| 激情av在线播放| 91视频九色网站| 国产亚洲电影| 欧美日韩激情视频在线观看| 免费视频一区| 黄色av免费在线播放| 成人性生交大合| 欧美无人区码suv| 亚洲综合一区二区三区| 国产精品主播一区二区| 一区二区在线视频| 亚洲www.| 蜜桃精品久久久久久久免费影院| 国产精品免费大片| 日韩在线一级片| jlzzjlzz国产精品久久| 久久久久成人片免费观看蜜芽| 337p亚洲精品色噜噜狠狠| 丰满人妻av一区二区三区| 久久久国产在线视频| 色yeye免费人成网站在线观看| 国产精品直播网红| 成人黄色av| 污污的网站18| 丁香亚洲综合激情啪啪综合| 天天看天天摸天天操| 午夜精品久久久久久久蜜桃app| 性色av蜜臀av| 欧美夫妻性视频| 88xx成人免费观看视频库 | 国产片高清在线观看| 久久久精品网站| 日韩一区二区三区精品| www.日本在线视频| 不卡一区在线观看| 亚洲精品午夜国产va久久成人| 日韩精品在线免费| 小黄鸭精品aⅴ导航网站入口| 日本一区二区三区视频在线播放| 丝瓜av网站精品一区二区| 成年人在线免费看片| 一区二区三区日韩欧美| 精品女同一区二区三区| 欧美激情综合色综合啪啪五月| www.国产精品一区| 精品这里只有精品| 久久精品一区蜜桃臀影院| 欧美卡一卡二卡三| 欧美性淫爽ww久久久久无| 风间由美一区| 成人在线精品视频| 欧美极品一区二区三区| 在线精品一区二区三区| 日本道精品一区二区三区| 亚洲成人三级| 成人情视频高清免费观看电影| 亚洲青涩在线| 国产综合精品在线| 亚洲午夜激情av| 日韩av成人| 91九色视频导航| 亚洲精选久久| jizz18女人高潮| 精品国产一区二区三区av性色| 在线中文免费视频| 国产99在线|中文| 欧美综合视频| 欧美体内she精高潮| 亚洲成人免费观看| 成人亚洲综合天堂| 91黄在线观看| 手机精品视频在线观看| 三级影片在线看| 亚洲人成五月天| 中文字幕视频精品一区二区三区| 成人在线免费观看av| 亚洲欧洲国产日韩| 天天影院图片亚洲| 亚洲a区在线视频| 久久精品系列| 欧美黑人一级片| 一区二区成人精品| 国产精品调教| 又色又爽又黄视频| 欧美日韩亚洲一区二区| 伊人影院在线视频| 日韩三级电影网站|