精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比

發(fā)布于 2024-10-17 15:49
瀏覽
0收藏

一、背景

我們之前已經(jīng)分享過幾篇關(guān)于 Sample Packing 相關(guān)的文章,也提到了其中的性能優(yōu)化問題。最近今天又看到一篇新的論文,這里進(jìn)行簡單介紹。

對應(yīng)的論文為:[2410.08081] Packing Analysis: Packing Is More Appropriate for Large Models or Datasets in Supervised Fine-tuning

相關(guān)工作可以參考我們之前的文章:

  • Sample Packing:長序列 LLM 訓(xùn)練的 Attention 問題及優(yōu)化
  • Sample Packing 綜述:LLM 效果與效率的 Tradeoff
  • Binary Block Masking:加快稀疏 Attention 的一種新方法?

二、摘要

Sample Packing 技術(shù)最初應(yīng)用于大模型預(yù)訓(xùn)練階段,旨在通過合并不同的訓(xùn)練樣本來適應(yīng)模型的最大輸入長度,從而最大化硬件利用率。盡管在預(yù)訓(xùn)練中已展示了有效性,但對監(jiān)督微調(diào)(SFT)階段還缺乏全面分析:

  • Packing 能否在保持性能的同時有效提升訓(xùn)練效率。
  • 適合采用 Packing 技術(shù)進(jìn)行微調(diào)的模型和數(shù)據(jù)集的規(guī)模。
  • Packing 無關(guān)或者相關(guān)的訓(xùn)練樣本是否可能導(dǎo)致模型過度忽略或依賴上下文。

本文中,作者對使用 Padding 和 Packing 的 SFT 方案進(jìn)行了對比,涵蓋從 69K 到 1.2M 的 SFT 數(shù)據(jù)集,以及 8B 和 70B 規(guī)模的模型。作者首次提供了關(guān)于 Padding 和 Packing 優(yōu)缺點的全面分析,以及在各種訓(xùn)練場景中實施 Packing 的考量。作者的分析涉及多個基準(zhǔn),包括知識、推理和編碼,以及基于 GPT 的評估、訓(xùn)練效率等。此外,作者還開源了相應(yīng)微調(diào)和評估代碼,并提供了在不同規(guī)模數(shù)據(jù)集上微調(diào)的 Checkpoint,旨在推動未來 Packing 技術(shù)的研究。

PS:個人感覺這篇文章還有很多可以改善的地方,比如說:

  • 沒有考慮 Document Level Mask 的問題。
  • 沒有考慮長序列場景。
  • 可以提供更多的實驗證明其觀點:“特殊 Token [EOS] 可以有效地幫助模型區(qū)分兩個相鄰的訓(xùn)練樣本”。

三、方法

3.1 方法概述

如下圖 Figure 1 所示為對應(yīng)的 Padding 和 Packing 方案,其中 SFT 數(shù)據(jù)集包含單輪對話(一個樣本只包含一個輸入和對應(yīng)的一個輸出)和多輪對話(包含多個輸入-輸出對)。

  • Padding:

每個序列中只包含一個樣本,如果不超過 Max Sequence Length 則補(bǔ)充[PAD] 占位 Token,到滿足 Max Sequence Length。

如果是多輪對話,每個輸入-輸出對之后也要添加[EOS] 結(jié)束 Token。

  • Greedy Packing:
  • 首先,將多輪對話的多個輸入-輸出對合并成單個樣本,用 [EOS] 間隔。
  • 然后,將所有的數(shù)據(jù)按照長度排序。
  • 最后,從最長的樣本開始 Packing,將連續(xù)的幾個樣本打包,如果加上某個樣本后總長度超過 Max Sequence Length,則放棄這個樣本,補(bǔ)充 [PAD] Token 并開始一個新的序列。
  • Random Packing:
  • 首先,將所有訓(xùn)練樣本拼接為一個單一的序列,同樣會使用 [EOS] Token 間隔。
  • 然后,按照 Max Sequence Length 將序列截斷。?

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

3.2 優(yōu)劣

Padding 方案的優(yōu)勢和劣勢:

  • 優(yōu)勢:

實現(xiàn)簡單,任何框架都比較容易實現(xiàn)。

簡單的 Padding 和截斷可以避免變長序列引申出的各種計算錯誤或性能問題。

  • 劣勢:
  • 如果 Padding 太多,會導(dǎo)致計算量明顯增加,并且對訓(xùn)練沒有任何幫助。(PS:其實很多框架都支持變長計算,比如 FlashAttention,識別出 Padding 的 Token 可以不參與計算)

Random Packing 方案的優(yōu)勢和劣勢:

  • 優(yōu)勢:

可以最大限度減少未使用的空間(Token),從而提升計算效率。

可以提供更廣泛的上下文組合,從而提供更多元化的場景,有可能幫助提升模型的泛化能力。(也就是說不會使用 Document Level 的 Mask?)

  • 劣勢:
  • 可能導(dǎo)致兩個不同或相似的樣本串聯(lián),可能導(dǎo)致模型過度忽略或依賴上下文。不過作者提到這并不會導(dǎo)致模型過度關(guān)注 Packing 的上下文,主要是兩個原因:

Random Packing 導(dǎo)致兩個相似訓(xùn)練樣本打包在一起的概率非常低。

特殊 Token [EOS] 可以有效地幫助模型區(qū)分兩個相鄰的訓(xùn)練樣本。(PS:是否可以通過驗證 Attention Score 來判斷是否真的如此?)

  • 這種方法也可能導(dǎo)致單個對話中的不同輪次被劃分到了不同的子序列中,比如 Figure 1 中的 (Instruction 1 + Answer 1) 和 (Instruction 2 + Answer 2) 被劃分到不同序列中

Greedy Packing 方案的優(yōu)勢和劣勢:

  • 優(yōu)勢:

可以降低將一個多輪對話樣本劃分到不同序列的風(fēng)險。

  • 劣勢:
  • 需要對整個樣本排序,會打亂樣本分布的隨機(jī)性,也會影響一個 Batch 中樣本的多樣性。

PS:上述 Greedy Packing 方案也有可以改進(jìn)的地方,作者的 Packing 方法中會優(yōu)先使用當(dāng)前更長的序列來拼接,如果超過 Max Sequence Length 就直接結(jié)束,這也就導(dǎo)致更多的短上下文樣本無法利用這一部分空間。比如說,Max Sequence Length 為 2048,當(dāng)前已拼接的序列長度為 1800,需要 Padding 248 個 Token,假設(shè)下一個樣本的長度為 300,則會直接結(jié)束;然而,當(dāng)前還有大量長度小于 248 的 Token 可以被拼接。

四、實驗

4.1 實驗配置

包含 4 個 SFT 數(shù)據(jù)集:

  • WildChat(GPT-4):WildChat 是用戶訪問 ChatGPT 或者 GPT-4 生成的數(shù)據(jù)。這里作者只選擇了 GPT-4 相關(guān)數(shù)據(jù),包含 69K 個真實世界的數(shù)據(jù)。
  • TULU:包含 326K 個對話數(shù)據(jù)集,也是來自真實世界。
  • WildChat(Full):來自 WildChat 的全量 652K 數(shù)據(jù)。
  • Open-Source 1M:總共包含 1.2M 對話數(shù)據(jù),來自多個數(shù)據(jù)源。如下圖 Table 1 所示。?

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

訓(xùn)練配置如下圖 Table 2 所示,主要是基于 LLaMA-3-8B 和 LLaMA-3-70B 微調(diào),訓(xùn)練是在 4 臺機(jī)器,每臺集群 8 個 A800 GPU:

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

4.2 實驗結(jié)果

如下圖 Table 3 和 Table 4 所示,作者使用各種模型和數(shù)據(jù)集驗證,Packing 的平均性能會比 Padding 的更好。比如 LLaMA-3-70B 上微調(diào) WildChat(GPT-4)數(shù)據(jù)集,Padding 對應(yīng)平均性能為 61.96,而 Packing 對應(yīng)為 65.97(Random Packing)。

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

PS:上述的結(jié)論有點奇怪,智譜 AI 在 [2401.18058] LongAlign: A Recipe for Long Context Alignment of Large Language Models 中的實驗表明,短序列任務(wù)上的差異并不明顯,而在長序列上甚至 Packing 會導(dǎo)致指標(biāo)下降。當(dāng)然,LongAlign 使用了 Document Level 的 Mask,實際上 Meta LLaMA 等論文也建議在微調(diào)時使用 Document Level Mask。

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

如下圖 Table 5 所示,使用 Packing 的方案確實可以有效提升訓(xùn)練速度,可以實現(xiàn) 3x 左右的加速,主要是 Packing 后 Padding 少了很多,訓(xùn)練的 Step 數(shù)少了很多:

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

上述結(jié)論也與智譜 AI 在 [2401.18058] LongAlign: A Recipe for Long Context Alignment of Large Language Models 中的結(jié)論類似,如下圖 Figure 5 所示:

Packing Analysis:LLM 樣本 Padding 與 Packing 的對比-AI.x社區(qū)

五、參考鏈接

  1. https://arxiv.org/abs/2410.08081
  2. https://arxiv.org/abs/2401.18058

本文轉(zhuǎn)載自 ??AI閑談??,作者: AI閑談

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
欧美猛男男办公室激情| **性色生活片久久毛片| 国产精品99久久久久久久久久久久 | 91精品国产一区二区| 日韩av中文字幕第一页| 成人在线免费电影| 成人午夜大片免费观看| 国产精彩精品视频| 国产精品成人久久| 欧美hd在线| 国产视频综合在线| 性高潮久久久久久| 日韩精选视频| 婷婷久久综合九色国产成人| 在线成人av电影| 美女毛片在线看| 国产91精品一区二区麻豆网站 | 91在线精品一区二区| 91精品视频在线看| 97人妻一区二区精品视频| 国产一区视频在线观看免费| 精品国产一区二区三区久久狼5月| 黄色免费看视频| 激情综合五月| 欧美日韩久久久| 亚洲爆乳无码专区| 老司机深夜福利在线观看| 亚洲青青青在线视频| 亚洲欧洲国产精品久久| 黄色大片在线看| 91玉足脚交白嫩脚丫在线播放| 91久久精品国产91久久| 在线观看国产精品视频| 日韩激情在线观看| 国产成人精品免费久久久久| 日韩av一区二区在线播放| 亚洲视频日本| 欧美日韩国产成人| 亚洲熟女www一区二区三区| 欧美xxav| 久久精品欧美视频| 午夜三级在线观看| 91亚洲自偷观看高清| 国产午夜一区二区| 久久国产柳州莫菁门| 国产伦精品一区二区三区千人斩| 日韩国产一区三区| 日韩av一二区| 精品一区毛片| 国产一区二区三区精品久久久| 亚洲综合网在线观看| 欧美久久精品| 亚洲天堂av在线播放| 欧美狂猛xxxxx乱大交3| 精品免费av| 色哟哟亚洲精品一区二区| 99久久99久久精品免费看小说.| av在线不卡免费观看| 亚洲无限av看| 极品美妇后花庭翘臀娇吟小说| 91综合久久一区二区| 欧美成人午夜激情| 国产亚洲精品av| 国产精品一区毛片| 国产精品欧美久久久| 在线免费av片| 国产激情视频一区二区三区欧美 | 亚洲一区在线观看免费观看电影高清| 91xxx视频| 国产理论电影在线| 欧美性猛交xxxx富婆弯腰| 热久久精品免费视频| 欧美成人xxxx| 亚洲国产成人精品一区二区| 欧美特黄一区二区三区| 99久久婷婷| 欧美激情二区三区| 波多野结衣 久久| 久久福利视频一区二区| av资源一区二区| 国产中文字幕在线播放| 亚洲欧美电影院| 九色自拍视频在线观看| 黑人一区二区三区| 精品欧美久久久| 亚洲精品一区二区三区影院忠贞| 午夜精品剧场| 国产成人精品免高潮费视频| 国产伦精品一区二区三区四区| 成人av资源站| 正在播放91九色| 僵尸再翻生在线观看| 欧美日韩不卡一区二区| 亚洲蜜桃精久久久久久久久久久久| 日韩一区三区| 亚洲91精品在线观看| 国产精品一区二区三区在线免费观看 | 成人欧美在线观看| 色视频在线看| 亚洲精品乱码久久久久久 | 性欧美hd调教| 欧美精品一区二区三区高清aⅴ | 欧美在线免费播放| 折磨小男生性器羞耻的故事| 久久国产影院| 国产成人av在线| 欧美 日韩 中文字幕| 最新高清无码专区| 日韩 欧美 高清| 极品国产人妖chinesets亚洲人妖| 日韩综合中文字幕| aaa人片在线| 不卡的av网站| 91网站在线观看免费| 国产麻豆一区| 亚洲深夜福利网站| 免费看日韩毛片| 国产福利一区二区| 在线天堂一区av电影| 国精产品一区一区三区四川| 亚洲国产精品久久久久久| 校园春色 亚洲| 国产一二精品视频| 国产高清免费在线| h1515四虎成人| 国产亚洲欧洲高清| 国产精品久久久久久久久久精爆| 91尤物视频在线观看| 美脚丝袜脚交一区二区| 色妞ww精品视频7777| 欧美剧在线观看| 国产精品自偷自拍| 亚洲人成网站在线| 欧美性受xxxx黒人xyx性爽| 日韩精品一区二区久久| 国产精品久久久久久久久男| 黄色电影免费在线看| 一本大道综合伊人精品热热 | 国产精品国产三级国产三级人妇| 可以免费在线看黄的网站| 一区二区三区日本久久久| 538国产精品一区二区在线 | 久久久综合网站| 欧美亚洲另类色图| 九九亚洲精品| 国产精品户外野外| 欧美三级电影一区二区三区| 7777精品伊人久久久大香线蕉的| 中文国语毛片高清视频| 韩国一区二区三区| 精品国产一区二区三区在线| av在线亚洲色图| 午夜精品国产精品大乳美女| 欧美精品久久久久久久久久丰满| 91久久线看在观草草青青| 黄色片在线观看免费| 激情欧美一区二区三区在线观看| 无颜之月在线看| 国产在线播放精品| 欧美在线视频一二三| 国产人成在线视频| 69精品人人人人| 久久精品国产av一区二区三区| 不卡的av在线播放| 我看黄色一级片| 亚洲乱码精品| 精品国产免费久久久久久尖叫| 午夜日韩成人影院| 久久精品福利视频| 天堂网在线观看视频| 欧美亚洲综合一区| 免费看一级一片| 久久久久久9999| 日本一二三四区视频| 99精品久久| 亚洲欧美日韩在线综合| 在线精品自拍| 国产aaa精品| 成人影院在线观看| 日韩精品免费在线视频观看| 一级黄色片在线看| 五月婷婷久久丁香| 成人黄色短视频| 播五月开心婷婷综合| 手机在线免费观看毛片| 影音先锋亚洲电影| 视频在线观看成人| 爱高潮www亚洲精品| 国产精品情侣自拍| av剧情在线观看| 这里只有精品在线观看| 丰满人妻熟女aⅴ一区| 欧美日韩在线不卡| 国产成人无码精品亚洲| 亚洲日本丝袜连裤袜办公室| 波多野结衣视频播放| 国产在线视频一区二区| 99精品视频在线看| 狠色狠色综合久久| 亚洲色图自拍| 美女精品一区最新中文字幕一区二区三区| 国产日韩欧美在线观看| 中文字幕在线直播| 久久免费视频在线观看| 日本a在线播放| 亚洲图中文字幕| 天天干天天做天天操| 欧美一级欧美一级在线播放| 最近中文字幕免费在线观看| 欧美日韩精品在线| 免费网站观看www在线观| 国产精品国产三级国产专播品爱网| 日韩av一二区| 成人美女在线视频| 日本人dh亚洲人ⅹxx| 狠狠色丁香婷婷综合| 亚洲天堂av线| 视频一区视频二区中文字幕| 久久亚洲中文字幕无码| 亚洲视频高清| 成人一级生活片| 亚洲美女视频| 久久久成人精品一区二区三区 | 91在线国产观看| 最新版天堂资源在线| 国产剧情av麻豆香蕉精品| 日本人69视频| 麻豆91精品91久久久的内涵| 人妻无码视频一区二区三区| 久久九九国产| 97视频在线免费播放| 先锋影音久久| 国产精品亚洲a| 久久婷婷久久| 成人在线观看a| 国产一区二区你懂的| 亚洲美免无码中文字幕在线| 伊人影院久久| 欧美国产亚洲一区| 国产视频亚洲| 国模吧无码一区二区三区| 亚洲一区欧美二区| 亚洲精品无码久久久久久| 久久五月激情| 伊人影院综合在线| 国产一区二区三区香蕉| 风韵丰满熟妇啪啪区老熟熟女| 国产成人午夜电影网| 动漫av在线免费观看| 不卡视频在线看| 美女久久久久久久久久| 欧美高清在线视频| 日韩成人短视频| 亚洲国产视频直播| 精品欧美一区二区三区免费观看| 日韩欧美综合在线视频| 国产成人精品亚洲| 欧美乱熟臀69xxxxxx| 精品人妻无码一区二区| 亚洲成年人在线播放| 国产天堂素人系列在线视频| 日韩视频精品在线| 激情av在线| 日本精品久久久久影院| 亚洲国产91视频| 波多野结衣成人在线| 美女精品一区最新中文字幕一区二区三区 | 日韩欧美大尺度| 精品国产www| 日韩精品一区二区三区视频播放| 五月天久久久久久| 在线观看精品国产视频| 久草在线新免费首页资源站| 啪一啪鲁一鲁2019在线视频| 综合久久伊人| 精品中文字幕一区| 888久久久| 干日本少妇首页| 国产乱对白刺激视频不卡| 国产亚洲无码精品| 亚洲人成在线观看一区二区| 偷偷操不一样的久久| 9191久久久久久久久久久| 免费观看成年人视频| 日韩中文字幕精品| 欧亚av在线| 亚洲直播在线一区| 精品在线观看入口| 97久久国产亚洲精品超碰热| 日韩和欧美一区二区三区| 成人啪啪18免费游戏链接| 久久精品视频一区| 久久久久亚洲天堂| 欧美日韩极品在线观看一区| 天堂av中文字幕| 成人97在线观看视频| 成人在线视频播放| 国产精成人品localhost| 日韩在线视频精品| 国产精品后入内射日本在线观看| 国产伦精品一区二区三区视频青涩| 亚洲av片不卡无码久久| 亚洲资源中文字幕| 国产精品人人爽| 在线观看91久久久久久| av日韩亚洲| 国产精品一区在线播放| 天天综合网91| 一区二区三区网址| 国产日产欧美一区二区三区| 日本一区二区不卡在线| 日韩欧美一级二级| 欧美成人高清在线| 国产欧美欧洲在线观看| 国产免费av一区二区三区| 乱人伦xxxx国语对白| 成人妖精视频yjsp地址| 在线免费日韩av| 91精品啪在线观看国产60岁| 午夜在线观看视频| 国产精品久久久久久中文字| 欧美男gay| 男人天堂网视频| 久久影院视频免费| 黄色大片网站在线观看| 亚洲国产精品久久91精品| 91黄页在线观看| 国产日韩精品推荐| 国产精品豆花视频| 真实乱偷全部视频| 一卡二卡三卡日韩欧美| 草逼视频免费看| 欧美精品成人在线| av综合网站| 欧美乱大交xxxxx潮喷l头像| 成人爱爱电影网址| 日韩一区二区视频在线| 精品无码久久久久久国产| 最新中文字幕在线播放| 久久艳妇乳肉豪妇荡乳av| 免费在线欧美黄色| 亚洲精品色午夜无码专区日韩| 色综合久久久久综合体| 二区三区在线播放| 国产日韩欧美影视| 欧美永久精品| 久久久久亚洲无码| 欧美日韩一二三四五区| 男生女生差差差的视频在线观看| 国产成人一区二区| 日本不卡高清| 中文字幕日韩久久| 亚洲成人午夜电影| 日韩在线免费看| 国产精品私拍pans大尺度在线| 国产精品久久久久久久免费观看 | 亚洲网中文字幕| 曰韩精品一区二区| 婷婷国产在线| 国产精品免费看久久久香蕉| 五月激情综合| 东京热av一区| 欧洲亚洲精品在线| 超碰在线免费播放| 久久精品国产精品国产精品污| 日韩一区精品字幕| 污软件在线观看| 日韩精品在线私人| 成人精品国产亚洲| 欧美黄色免费网址| 久久久久久黄色| 99久久99久久久精品棕色圆| 韩国三级日本三级少妇99| 日韩aaaa| 中文字幕天堂av| 欧美又粗又大又爽| 欧美videosex性欧美黑吊| 日韩影片在线播放| 丰满少妇久久久久久久| 波多野结衣家庭主妇| 欧美精品一区在线播放| 九九综合在线| 免费在线观看日韩av| 欧美中文字幕不卡| 678在线观看视频| 一区国产精品| 久久综合五月天婷婷伊人| 国产精品久久久久久久久久久久久久久久久久| 久久久久国产一区二区三区| 色狮一区二区三区四区视频| 国内精品免费视频| 欧美日韩aaaaaa| gay欧美网站| 日本中文字幕在线视频观看| 国产精品午夜免费| 色哟哟在线观看| 国产乱码精品一区二区三区日韩精品| 轻轻草成人在线| 在线能看的av| 欧美第一淫aaasss性|