精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

字節最新大模型秘籍:只挑能有推理潛力的數據訓練!1.3B模型無需標簽自動挑選

人工智能 新聞
無需訓練,無需標簽,只需用1.3B模型給7B模型選擇數據,就能提升模型推理能力,甚至也能提升代碼生成能力。

和人工標記數據說拜拜,利用預訓練語言模型中的注意力機制就能選擇可激發推理能力的訓練數據!

字節Seed團隊最新宣布了一個重要成果——AttentionInfluence

無需訓練,無需標簽,只需用1.3B模型給7B模型選擇數據,就能提升模型推理能力,甚至也能提升代碼生成能力。

以往,篩選數據的方法通常依賴于監督分類器,需要人工或大語言模型進行標注,難免引入領域特定偏見。

字節Seed團隊注意到:

預訓練模型中的檢索頭與檢索和上下文推理緊密相關。

檢索頭在訓練早期就會出現,逐漸增強,并最終在訓練的中后期階段牢固建立,對模型性能起到至關重要的作用。

1.3B參數稠密模型中檢索頭的演化過程,be like:

圖片

但如果直接關閉它們會怎樣?

他們用小型預訓練語言模型通過簡單的注意力頭屏蔽操作,充當強大的模型的數據選擇器。

具體操作是,識別重要檢索頭,屏蔽這些頭以創建性能下降的“弱”模型,計算“弱”模型與原始“強”模型之間的損失差異,根據損失增加幅度對數據進行排名,形成影響分數。

沒想到,實驗后他們得到了一個驚人結果。

將AttentionInfluence方法應用于1.3B參數預訓練語言模型,對SmolLM語料庫進行數據選擇,篩選出73.1B tokens與完整的SmolLM語料庫組合,使用WSD方法預訓練7B模型。

在知識密集型和推理密集型基準測試中模型性能均有提升,具體來說:

MMLU+1.4個百分點、MMLU-Pro+2.7個百分點、AGIEval-en+1.8個百分點、GSM8K+2.7個百分點、HumanEval+3.5個百分點。

圖片

這項研究發布后引來不少網友關注,谷歌DeepMind研究科學家都轉發為其點贊:

圖片

有網友看后表示:

多么簡單而巧妙的數據選擇思路!

圖片

關于這項研究的更多細節,我們接著往下看。

圖片

讓預訓練模型識別重要數據

如前所述,AttentionInfluence方法的核心思想是通過比較基礎模型和弱化參考模型之間的損失差異來評估訓練數據的對推理的影響程度。

實現方法包含兩個主要步驟:檢測特定重要頭部、計算AttentionInfluence分數

檢測特定重要頭部

在本研究中,作者主要關注檢索頭,此前已有研究表明檢索頭與大語言模型的檢索和推理能力高度相關。

受CLongEval中提出的關鍵段落檢索評估任務啟發,團隊采用了一種類似的簡單proxy task,在可控環境下評估大語言模型的檢索能力,并識別與檢索和推理強相關的注意力頭。

為此,他們構建了一個包含800個樣本的合成測試數據集。每個樣本被格式化為一個3-shot自然語言檢索任務,由上下文、三個上下文中的示例和一個查詢hash_key組成。

圖片

每個上下文是一個包含k個鍵值對(key-value pairs)的JSON對象,其中每個鍵是隨機生成的32字符字母數字字符串(hash_key),每個值(text_val)是從網絡文檔語料庫中采樣的自然語言句子。

該任務要求模型從上下文中檢索text_val,并輸出與給定查詢hash_key對應的text_val。

包含三個上下文中的示例(即3-shot)旨在模擬小樣本學習場景,并幫助模型理解任務。考慮到現有預訓練模型的上下文長度限制,團隊將每個測試樣本的總長度(包括輸入提示和答案)限制為接近但不超4096token。

接下來,計算每個注意力頭在測試樣本上的檢索分數。

在這項工作中,團隊使用一個基于類Llama 2架構的1.3B參數模型作為小型預訓練語言模型,使用平均分數作為頭的最終檢索分數,并按該分數對其進行排序,選擇排名前5%的頭作為特別重要的頭

計算AttentionInfluence分數

獲得重要頭部后,接下來計算每個樣本的AttentionInfluence分數。

圖片

首先是創建參考模型,通過屏蔽在第一階段檢測到的基礎模型的重要頭部,獲得參考模型。

然后,使用基礎模型計算語料庫中每個樣本的平均token級交叉熵損失(Lbase),使用參考模型計算相應的損失(Lref)。

最后將Lbase和Lref之間的相對差值作為注意力影響分數,以量化每個樣本的推理影響程度,其計算公式如下:

圖片

由于語言模型對來自不同領域(如通用領域、數學領域、代碼領域)的數據的損失,因分布差異顯著而無法直接比較,團隊將注意力影響分數的比較限制在相同領域內。

團隊認為,注意力影響分數越高,表明樣本具有更高的推理強度。

效果全面分析

實驗設置上,團隊使用Llama2類似的1.3B參數模型作為小型預訓練語言模型,對SmolLM語料庫進行數據選擇.

根據AttentionInfluence分數選擇排名前20%的樣本,約73.1B tokens,使用選定的73.1B tokens與完整的SmolLM語料庫組合,預訓練7B參數模型。

作為對比,基線模型則是僅使用SmolLM語料庫訓練的相同架構和大小的模型。

然后,在小樣本學習設置下,團隊采用一套涵蓋四大類別的綜合基準評估,對模型與基線模型進行全面比較:

  • 綜合基準,包括AGIEval-en、MMLU、MMLU-Pro、GPQA、C-Eval;
  • 數學、代碼和推理,包括GSM8K、MATH、HumanEval、ARC Challenge、DROP、BBH;
  • 常識推理與理解,包括HellaSwag、ARC-Easy、WinoGrande、CommonSenseQA、PiQA、OpenBookQA、TriviaQA;
  • 閱讀理解,以RACE為代表。

主要研究結果顯示,使用AttentionInfluence選擇的數據訓練的模型在多個關鍵基準上顯著優于基線:

圖片

研究還跟蹤了預訓練過程中的性能演變,AttentionInfluence模型在整個預訓練過程中始終優于基線,性能差距在訓練早期(約100B tokens之前)就已顯現,并在整個訓練過程中保持穩定,即使在學習率衰減(LRD)階段,性能優勢仍然存在。

另外,當特定重要頭部被屏蔽時,1.3B模型在某些任務上的性能顯著下降,而AttentionInfluence方法選擇的數據往往能改善7B模型在這些任務上的性能,表明該方法具有預測能力。

將AttentionInfluence應用于更大的7B參數模型進行數據選擇時,能在多個知識密集型和推理密集型基準上獲得更好的性能,表明增加模型規模有助于選擇更高推理強度的樣本。

圖片

為驗證AttentionInfluence的有效性,團隊還設計了兩個指標來量化所選數據的質量:

  • Education Score:評估內容的教育價值
  • Reasoning Score:評估內容的推理強度

實驗結果顯示,AttentionInfluence和FineWeb-Edu分類器在教育相關內容上獲得相當的分數;在推理方面,AttentionInfluence獲得顯著更高的分數;在Python-Edu和OpenWebMath領域,AttentionInfluence選擇的樣本平均長度幾乎是FineWeb-Edu分類器選擇樣本的兩倍。

圖片

團隊也對所選數據進行了多樣性分析,感興趣的童鞋可以查看原論文。

圖片圖片圖片

總之,團隊表示這些結果驗證了AttentionInfluence法能有效地識別高質量的預訓練數據,從而增強大語言模型的知識和推理能力,尤其在需要綜合知識和復雜推理的基準測試中取得了顯著提升。

此外,AttentionInfluence可與 FineWeb-Edu分類器結合使用,以在需要簡單事實性知識、高級推理或兩者兼具的任務中全面提升大語言模型的性能。

論文鏈接:https://arxiv.org/pdf/2505.07293

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-11-22 13:30:00

2023-12-28 17:31:44

PixelLM性能模型

2023-01-05 09:33:37

視覺模型訓練

2025-10-10 01:25:00

大模型訓練數據OpenAI

2025-11-21 12:12:09

2023-10-11 12:32:53

AI模型

2025-09-08 08:50:00

AI模型訓練

2025-06-18 02:30:00

推理能力強化學習大語言模型

2025-05-16 08:58:09

2025-05-16 09:08:00

2025-10-21 08:00:00

2024-06-28 16:03:38

2025-02-12 09:20:12

2023-10-28 13:29:27

2025-07-08 03:11:00

2023-09-14 12:46:00

模型數據

2024-05-15 09:17:30

模型AI

2023-11-29 15:00:00

數據訓練

2025-07-22 10:15:44

2025-07-09 09:25:33

點贊
收藏

51CTO技術棧公眾號

琪琪亚洲精品午夜在线| 色综合天天天天做夜夜夜夜做| 成人av番号网| 国产在线视频你懂的| 天海翼亚洲一区二区三区| 91传媒视频在线播放| 9l视频自拍9l视频自拍| 少妇无码一区二区三区| 毛片基地黄久久久久久天堂| 欧美第一黄网免费网站| 黄瓜视频污在线观看| 成人污污www网站免费丝瓜| 偷偷要91色婷婷| 国产91av视频在线观看| 日韩精品系列| 国内成人精品2018免费看| 欧美在线亚洲在线| 麻豆91精品91久久久| 精品日韩毛片| 欧美精品一区二区三区蜜桃| 一区二区三区 欧美| h片在线观看视频免费| 国产精品美女一区二区三区| 国内一区二区三区在线视频| 91精品国产乱码久久| 国产精品日韩欧美一区| 中文字幕国产亚洲2019| 中文字幕在线观看网址| 伊人精品综合| 91麻豆精品国产91久久久资源速度 | 中文字幕欧美精品在线| 久久久久久久无码| 99亚洲乱人伦aⅴ精品| 欧美精品在线视频| 手机看片福利日韩| 日本免费久久| 色综合久久久久综合体桃花网| 久久99久久99精品| av在线导航| 中文字幕中文字幕一区| 日韩成人在线资源| 香蕉视频黄色片| 波多野结衣91| 狠狠色综合欧美激情| 性猛交xxxx乱大交孕妇印度| 精品伊人久久久久7777人| 国产精品第七十二页| 精品国产xxx| 首页亚洲欧美制服丝腿| 欧美孕妇孕交黑巨大网站| 精品91久久久| 亚洲欧美bt| 日本一本a高清免费不卡| 亚洲永久精品在线观看| 午夜一级久久| 国产精品入口免费视| 久久精品国产亚洲av麻豆蜜芽| 日韩黄色在线观看| 国产精品视频一区二区三区四| 一区二区视频网站| 激情五月激情综合网| 国产欧美精品va在线观看| 中国一级片黄色一级片黄| 麻豆国产精品一区二区三区| 成人一区二区电影| 亚洲高清视频在线播放| 成人avav影音| 欧美精品欧美精品系列c| 可以在线观看的av网站| 国产欧美日韩精品a在线观看| 天堂va久久久噜噜噜久久va| 日本高清中文字幕在线| 亚洲免费资源在线播放| 日韩精品在线中文字幕| 性孕妇free特大另类| 欧美曰成人黄网| 91蝌蚪视频在线| 国内精品国产成人国产三级粉色| 亚洲精品视频中文字幕| 亚洲精品天堂网| 午夜国产一区| 91精品国产777在线观看| 亚洲精品一区二三区| 国产一区二区三区日韩| 精品综合久久| 毛片av在线| 亚洲高清免费视频| 久久婷五月综合| 粉嫩精品导航导航| 永久免费毛片在线播放不卡| 91在线播放观看| 免费看黄裸体一级大秀欧美| 国产精品一二三在线| 亚洲老妇色熟女老太| 久久众筹精品私拍模特| 99久热在线精品视频| 欧美大片免费高清观看| 日韩美女在线视频| 精品人伦一区二区| 中文精品久久| 国产精品久久久久77777| 性做久久久久久久久久| 久久久久久久性| 免费视频爱爱太爽了| av成人在线看| 精品无人国产偷自产在线| 国产成人久久久久| 热久久一区二区| 精品视频免费观看| 中文字幕免费高清电视剧网站在线观看 | 亚洲综合av一区二区三区| 日韩久久久精品| 美国一级黄色录像| 亚洲主播在线| 国产精品久久亚洲| 国产在线观看a视频| 91精品办公室少妇高潮对白| 超碰caoprom| 欧美一区视频| 91久久精品在线| 国产精品一级伦理| 日韩欧美亚洲综合| 中文字幕在线播放一区| 午夜欧美理论片| 91视频九色网站| 97视频精彩视频在线观看| 日韩欧美成人网| 国产二级一片内射视频播放| 欧美日韩亚洲三区| 亚洲一区制服诱惑| 成人日韩欧美| 制服丝袜亚洲播放| 男人在线观看视频| 精品一区二区在线看| 先锋影音网一区| av免费在线一区| 中文字幕免费精品一区| 午夜视频网站在线观看| 国产亚洲一区二区在线观看| 黄在线观看网站| 亚洲人成伊人成综合图片| 久久久噜噜噜久噜久久| 狠狠综合久久av一区二区| 亚洲人午夜精品天堂一二香蕉| 激情综合网俺也去| 欧美军人男男激情gay| 欧洲s码亚洲m码精品一区| 亚洲aⅴ乱码精品成人区| 亚洲国产日产av| japanese在线观看| 亚洲在线日韩| 欧美日韩日本网| 自拍偷自拍亚洲精品被多人伦好爽| 国产视频精品久久久| 一级片视频在线观看| 日本一区二区综合亚洲| 天天色综合天天色| 午夜影院欧美| 爱情岛论坛亚洲入口| 国内高清免费在线视频| 亚洲国产日韩一区| 黄瓜视频在线免费观看| 久久精品免费在线观看| xvideos亚洲人网站| 成人免费xxxxx在线视频| av亚洲免费| 国产自摸综合网| 国产在线高清视频| 日韩午夜精品电影| 国产精品500部| 国产亚洲欧美一区在线观看| 中文字幕 91| 欧美淫片网站| 久久99欧美| 国产精品66| 欧美激情精品久久久| 飘雪影院手机免费高清版在线观看 | 玛丽玛丽电影原版免费观看1977| 麻豆蜜桃在线观看| 亚洲夜晚福利在线观看| 国产乱码久久久| 精品久久久久久久久久久久| 国产一级久久久久毛片精品| 激情久久五月天| 成人一区二区免费视频| 国产99久久| 97在线资源站| 日韩电影av| 欧美多人爱爱视频网站| 久久精品色图| 日韩一区和二区| 中文字幕在线观看视频免费| 亚洲色图.com| b站大片免费直播| 国产成人免费视频精品含羞草妖精| 欧美日韩黄色一级片| 99精品视频在线| 九九九九精品| 国产精品色婷婷在线观看| 国产91精品久久久久久| av电影在线网| 亚洲黄一区二区| 国产绿帽一区二区三区| 图片区日韩欧美亚洲| 一区二区三区影视| 久久精品视频在线看| 性感美女一区二区三区| 免费不卡在线视频| www黄色日本| 欧美三级小说| 亚洲激情一区二区三区| 久久综合社区| 亚洲一区二区中文字幕| 秋霞国产精品| 欧美一区二三区| 9lporm自拍视频区在线| 成人av电影在线播放| 91成人免费看| 外国成人直播| 欧美激情第三页| 最新国产露脸在线观看| 中文字幕久热精品在线视频| 日本一本草久在线中文| 亚洲精品一区二区三区四区高清| 国产精品毛片一区二区在线看舒淇 | 亚洲网址你懂得| 天堂在线视频观看| 精品国产精品一区二区夜夜嗨| 97超碰人人草| 欧美视频一区二| 亚洲一区欧美在线| 亚洲成人免费在线观看| 九九九免费视频| 亚洲欧美另类在线| 精品国产视频在线观看| 日本一区二区三区高清不卡 | 国产精品毛片大码女人| 波多野吉衣中文字幕| 不卡av电影在线播放| 欧洲熟妇的性久久久久久| 国产91精品免费| 国产精品嫩草69影院| 国产成人亚洲综合a∨猫咪| 一级片免费在线观看视频| 久久精品国产精品青草| 天堂一区在线观看| 韩国av一区二区| 一本一道久久a久久综合蜜桃| 久久国产婷婷国产香蕉| 亚洲一区日韩精品| 激情五月激情综合网| 久久精品国产99久久99久久久| 国内成+人亚洲+欧美+综合在线| 三日本三级少妇三级99| 国内精品久久久久影院一蜜桃| 中文字幕色网站| 国产精品中文欧美| 手机免费看av片| 99re8在线精品视频免费播放| 北岛玲一区二区| 国产日韩欧美麻豆| 国产黄色小视频网站| 亚洲视频1区2区| 国产一级做a爱免费视频| 精品国产91乱高清在线观看| 日本一区二区免费电影| 欧美日韩三级视频| 精品国产乱码久久久久久蜜臀网站| 欧美大肚乱孕交hd孕妇| 五月激情婷婷网| 亚洲视频一区二区三区| 麻豆视频免费在线观看| 久久97久久97精品免视看| 超碰高清在线| 国产精品揄拍一区二区| 熟妇人妻中文av无码| 97国产精品videossex| 亚洲天堂视频一区| 国产精品国产三级国产aⅴ无密码| 欧美一区二区三区爽爽爽| 午夜不卡在线视频| 无码人妻丰满熟妇区bbbbxxxx| 欧美久久高跟鞋激| 日本黄视频在线观看| 亚洲一区二区久久久| 中文在线观看免费| 777国产偷窥盗摄精品视频| 激情中国色综合| 国产偷国产偷亚洲高清97cao| 亚洲日产av中文字幕| 九一免费在线观看| 欧美亚洲三区| 色欲欲www成人网站| 久久久777精品电影网影网| 成熟的女同志hd| 色拍拍在线精品视频8848| 国产精品久久影视| 国产视频久久久久久久| sm国产在线调教视频| 欧美中文字幕在线播放| 国产一区2区在线观看| 中文字幕一区在线观看视频| 久久久久久九九九| 日本a级在线| 91国内精品久久| 一区在线不卡| 青娱乐国产91| 亚洲美女少妇无套啪啪呻吟| 一道本在线免费视频| caoporen国产精品视频| 国产高清视频免费在线观看| 午夜精品一区二区三区电影天堂 | 91麻豆精品成人一区二区| 精品国产老师黑色丝袜高跟鞋| 国产探花精品一区二区| 在线观看欧美www| 久久久久久久| 国产欧美日韩伦理| 欧美精品午夜| 在线一区二区不卡| 欧美国产成人精品| 免费的毛片视频| 亚洲精品久久久久久久久久久久 | 国产资源在线播放| 97人洗澡人人免费公开视频碰碰碰| 国产精品xnxxcom| 国产亚洲欧美激情| 丁香花五月激情| 欧美电影在线免费观看| аⅴ资源新版在线天堂| 热久久免费视频精品| 美国成人xxx| 成 年 人 黄 色 大 片大 全| 国产精品66部| 久久久久亚洲av成人片| 日韩一级成人av| 97caopron在线视频| 91在线观看免费高清完整版在线观看| 凹凸成人精品亚洲精品密奴| 亚洲乱码国产一区三区| 久久久久久久久一| 夜夜爽妓女8888视频免费观看| 国产视频久久久久| 精品国产免费人成网站| 麻豆蜜桃91| 丝袜亚洲精品中文字幕一区| 欧美色图亚洲激情| 色婷婷综合五月| 成年人在线观看视频| 国产精品一久久香蕉国产线看观看| 成人影院在线| 久久精品国产露脸对白| 亚洲免费三区一区二区| 亚洲风情第一页| 91国内免费在线视频| 欧洲专线二区三区| 人人干人人干人人| 亚洲欧洲国产日韩| 北条麻妃一二三区| 66m—66摸成人免费视频| 综合国产视频| 伊人色在线观看| 亚洲精品视频在线观看网站| 亚洲AV无码国产精品午夜字幕 | 亚洲高清在线播放| 狠狠色综合播放一区二区| 中国毛片直接看| 亚洲国产精品成人av| 自由日本语热亚洲人| 少妇免费毛片久久久久久久久| 久久电影国产免费久久电影| 国产精品视频一区二区三| 亚洲国产第一页| 澳门av一区二区三区| 中文字幕乱码一区二区三区| 国产成人自拍网| 国产性猛交╳xxx乱大交| 中文在线不卡视频| 无人区乱码一区二区三区| 亚洲欧洲日产国码无码久久99 | 亚洲免费视频在线观看| 国产成人福利夜色影视| 国产精品视频二| 国产欧美精品区一区二区三区| 国产视频第二页| 欧美有码在线视频| 亚洲色图插插| 国产精品久久久久无码av色戒| 91精品一区二区三区久久久久久| 99re6在线精品视频免费播放| 日本日本精品二区免费| 国产高清视频一区| 免费观看日批视频| 久久久久久久一区二区三区| 精品国产一区二区三区久久久蜜臀| 秋霞午夜鲁丝一区二区| 欧洲精品视频在线观看| av丝袜在线| 中国老女人av| 国产日韩欧美激情|