精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?

發(fā)布于 2025-11-11 07:22
瀏覽
0收藏

你花數(shù)百萬訓(xùn)練一個大模型。訓(xùn)練完發(fā)現(xiàn)效果不錯。但你不知道的是:模型可能只學(xué)到了數(shù)據(jù)里20%的知識,剩下80%都浪費了。

怎么證明?很簡單:訓(xùn)練完之后,讓模型在回答問題時去原始訓(xùn)練數(shù)據(jù)里"搜一搜",性能立馬提升——提升幅度相當(dāng)于你多花5倍的錢重新訓(xùn)練一個更大的模型。

這是蘋果和斯坦福研究團隊最近發(fā)現(xiàn)的。他們的論文用大白話說就是:大模型訓(xùn)練時學(xué)得太淺了,數(shù)據(jù)價值浪費嚴(yán)重。

論文的實驗設(shè)計很巧妙,分三步:

第一步:正常訓(xùn)練:用一堆數(shù)據(jù)訓(xùn)練模型,就像平時那樣。

第二步:加個"搜索"功能 :訓(xùn)練完后,讓模型回答問題時,先去訓(xùn)練數(shù)據(jù)里搜索相關(guān)內(nèi)容,再回答。

關(guān)鍵:搜索的數(shù)據(jù)和訓(xùn)練的數(shù)據(jù)完全一樣。

第三步:對比效果:看看"訓(xùn)練"和"訓(xùn)練+搜索"的差距有多大。

測試用的是 MMLU:

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

平均下來,搜索相當(dāng)于讓你多花了5倍的錢訓(xùn)練模型。

但注意:模型越大,這個倍數(shù)越小。說明大模型確實學(xué)得更充分一些。

這是作弊嗎?會不會是搜到了答案?研究團隊專門做了"去污染"實驗(就是把可能包含答案的數(shù)據(jù)刪掉),結(jié)果發(fā)現(xiàn):即使刪掉疑似答案的數(shù)據(jù),提升依然很明顯。MMLU 測試題有 14.1% 能在訓(xùn)練數(shù)據(jù)里找到,數(shù)學(xué)題更夸張,有 32.0%。這說明很多公開數(shù)據(jù)集其實有"泄題"問題。

不過,即便排除這些,提升還是很大。

為什么會這樣?簡單說:訓(xùn)練模型就像讓學(xué)生背書,而搜索就像讓學(xué)生開卷考試。

背書:

?需要把所有知識記在腦子里

?記不住的就丟了

?記住的也可能記錯

開卷考試:

?不用全記住,知道在哪查就行

?現(xiàn)場翻書,不會記錯

?還能理解得更深

所以同樣的訓(xùn)練數(shù)據(jù),模型"背"只能學(xué)到20%,"開卷"就能用上100%。

不同科目差異很大有意思的是,不同類型的題目,搜索的幫助程度差很多:

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

理工科受益最大?這很反常識。

一般認(rèn)為,搜索就是"查資料",應(yīng)該對需要記憶的人文學(xué)科幫助更大。但實際上理工科受益更多。搜索不只是"查字典"。搜到的內(nèi)容本身就能幫模型推理和理解,尤其是理工科的復(fù)雜知識。

再加點技巧,效果更炸裂:研究團隊還測試了在搜索基礎(chǔ)上加一些小技巧:

技巧1:重新排序(reranker)搜出來的內(nèi)容再精選一遍,把最相關(guān)的放前面。

技巧2:多試幾次投票(self-consistency)讓模型回答5次,少數(shù)服從多數(shù)。

技巧3:換著搜(variance reduction)每次搜不同的內(nèi)容,增加多樣性。

最終結(jié)果(用 Llama 3.1 8B 這個公開模型測試):

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

看 SimpleQA 那個提升:從1.5%到74.0%,直接提升50倍!綜合算下來,這些技巧加起來相當(dāng)于讓訓(xùn)練成本增加11倍。

兩個意外發(fā)現(xiàn)

發(fā)現(xiàn)1:訓(xùn)練好用的數(shù)據(jù),搜索不一定好用

大模型預(yù)訓(xùn)練:我們浪費了多少數(shù)據(jù)?-AI.x社區(qū)圖片

FineWeb-edu 用來訓(xùn)練效果更差,但用來搜索反而更好。

這說明:好的訓(xùn)練數(shù)據(jù)和好的搜索數(shù)據(jù),標(biāo)準(zhǔn)可能不一樣。

發(fā)現(xiàn)2:模型不會用搜到的內(nèi)容

論文統(tǒng)計發(fā)現(xiàn):

?把模型從小換成大的 → 39.7% 的答案變了

?加上搜索功能 → 只有 28.1% 的答案變了

這說明什么?

搜索沒幫上的題目,不是因為搜的內(nèi)容不好,而是模型不會用。就像給學(xué)生一本參考書,但學(xué)生不知道怎么看。

所以未來的方向是:教模型更好地利用搜到的內(nèi)容。

這對我們意味著什么?

1. 預(yù)訓(xùn)練可能浪費了很多錢

如果訓(xùn)練時只學(xué)到了20%,那意味著80%的訓(xùn)練成本打了水漂。

OpenAI、Google 花幾億美元訓(xùn)練模型,如果能把訓(xùn)練效率翻倍,能省多少錢?

2. 不用無限堆算力,優(yōu)化方法就能提升很多

現(xiàn)在大家都在拼"誰的GPU多",但這篇論文說:改進訓(xùn)練方法可能更劃算。

與其花5倍的錢買GPU,不如研究怎么讓模型學(xué)得更充分。

3. "搜索"是個有效的低成本方案

訓(xùn)練一次要幾百萬美元,但加個搜索功能成本很低。

對于中小公司來說,這可能是更現(xiàn)實的路徑:

?用開源模型(Llama 等)

?加上自己領(lǐng)域的數(shù)據(jù)檢索

?用測試時技巧優(yōu)化

效果可能不比大廠的超大模型差多少。

4. 測試時優(yōu)化是新方向

以前大家都專注"怎么訓(xùn)練更好",現(xiàn)在發(fā)現(xiàn)"怎么用更好"也很重要。

就像手機,不只是硬件要強,系統(tǒng)優(yōu)化也很關(guān)鍵。

寫在最后:問題比答案更重要

這篇論文最大的價值不是"搜索能提升效果",而是提出了一個問題:

為什么模型訓(xùn)練時學(xué)得這么淺?

可能的原因:

?? 訓(xùn)練算法有問題,沒有充分利用數(shù)據(jù)

?? 模型結(jié)構(gòu)有局限,記不住那么多

?? 訓(xùn)練時間不夠長,還沒學(xué)會

論文說:

今天的訓(xùn)練方法并沒有充分利用訓(xùn)練數(shù)據(jù)中的信息,這給改進留下了很大空間。

換句話說:不用急著搞更大的模型、更多的GPU,先把現(xiàn)有的用好再說。

大模型的進步,不一定要靠"更大、更貴"。"更聰明"可能才是關(guān)鍵。

?標(biāo)題:Reusing Pre-Training Data at Test Time is a Compute Multiplier              (在測試時重用訓(xùn)練數(shù)據(jù),相當(dāng)于算力加倍)

?鏈接:https://arxiv.org/abs/2511.04234

本文轉(zhuǎn)載自??AI帝國??,作者:無影寺

已于2025-11-11 07:22:33修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
久草免费资源站| 中文字幕一区二区三区精彩视频| 中文字字幕在线中文| 不卡日本视频| 欧美一区二区三区白人| 国产肉体ⅹxxx137大胆| 全色精品综合影院| 国产呦萝稀缺另类资源| 7777精品久久久久久| 农村老熟妇乱子伦视频| 精品嫩草影院| 欧美人与禽zozo性伦| 欧美,日韩,国产在线| 男人的天堂在线视频免费观看 | 国产一区深夜福利| 在线免费观看毛片| 亚洲草久电影| 国产午夜精品全部视频播放| 国产吃瓜黑料一区二区| 国产精成人品2018| 精品日本高清在线播放 | 亚洲国产一区二区三区高清| 社区色欧美激情 | 人妻丰满熟妇aⅴ无码| 我要色综合中文字幕| 91成人在线精品| 蜜臀av色欲a片无码精品一区| 欧美极品视频| 欧美激情一区二区三区| 久久久人人爽| 天天操天天干天天爽| 国产精一区二区三区| 国产精品爽黄69天堂a| 伊人中文字幕在线观看| 日韩视频三区| 久久久久久av| 久久综合色综合| 小小影院久久| 日韩中文视频免费在线观看| 国产又黄又粗视频| 伊人久久大香线蕉无限次| 亚洲国产高潮在线观看| 日本黄色www| 精品久久国产一区| 制服视频三区第一页精品| 天天综合网日韩| 视频精品导航| 欧美丝袜丝交足nylons图片| 爆乳熟妇一区二区三区霸乳| 亚洲啊v在线| 欧美日韩午夜剧场| 国产视频九色蝌蚪| 黄色在线网站噜噜噜| 天天影视网天天综合色在线播放| 国产一线二线三线女| 丰满大乳少妇在线观看网站 | 青草青青在线视频| 国产极品在线观看| 偷窥国产亚洲免费视频| 国产精品333| 亚洲伊人av| 色8久久人人97超碰香蕉987| 日韩中文字幕免费在线| 成人在线网站| 欧美男女性生活在线直播观看| 伊人影院综合在线| 91精品网站在线观看| 日韩精品自拍偷拍| 黑丝av在线播放| 九九热爱视频精品视频| 在线播放国产一区中文字幕剧情欧美| 人妻少妇无码精品视频区| 日本一本不卡| 久久久精品国产一区二区| 欧美极品视频在线观看| 99伊人成综合| 国产精品大陆在线观看| 一级片视频免费| 高清av一区二区| 美女一区视频| 欧美日本一道| 午夜私人影院久久久久| 青青在线视频免费| 99精品在线免费观看| 精品国产免费视频| 中文字幕被公侵犯的漂亮人妻| 日韩av自拍| 欧美精品videos| 免费又黄又爽又猛大片午夜| 黑人巨大精品欧美一区| 国产在线欧美日韩| 福利在线播放| 亚洲午夜私人影院| 五月天婷婷激情视频| 免费一级欧美在线大片| 亚洲品质视频自拍网| 久久精品一区二区三区四区五区| 激情成人综合| 国产日韩中文字幕| 天天干天天插天天操| 亚洲欧洲日本在线| 国产精品视频一区二区三区四区五区| av成人在线观看| 亚洲第一视频网站| 人与动物性xxxx| 销魂美女一区二区三区视频在线| 91亚洲精品在线| 韩国福利在线| 亚洲成人一区在线| 亚洲欧美日韩三级| 国产欧美久久一区二区三区| 久久久久久久久中文字幕| 中文字幕一区二区三区波野结| 成人毛片视频在线观看| 亚洲伊人婷婷| 粉嫩一区二区| 亚洲福利在线播放| 草视频在线观看| 久久精品国产秦先生| 欧美精品一区三区在线观看| 国产精品186在线观看在线播放| 欧美午夜精品理论片a级按摩| 国产视频久久久久久| 国内精品嫩模av私拍在线观看| 国产在线播放91| 国产区高清在线| 色综合久久综合网97色综合| 国产麻豆剧传媒精品国产av| 欧美在线网站| 亚洲精品女av网站| 在线观看免费网站黄| 91官网在线免费观看| 泷泽萝拉在线播放| 亚洲一区区二区| 裸模一区二区三区免费| 国语对白在线刺激| 日韩欧美另类在线| 欧美成人aaa片一区国产精品| 久久成人18免费观看| 天堂一区二区三区| 欧美va在线观看| 亚洲欧美在线看| 国产成人无码av| 久久网站最新地址| 午夜肉伦伦影院| 国产乱码精品一区二区亚洲| 国产精品ⅴa在线观看h| 国产永久免费高清在线观看 | 亚洲色图38p| 欧美精品一二| 国产精品主播视频| 三区四区电影在线观看| 欧美日韩一区高清| 啪啪一区二区三区| 国产乱码精品1区2区3区| 欧美日韩中文字幕在线播放| 豆花视频一区| 久久久久亚洲精品| 天天射天天操天天干| 亚洲国产成人porn| 亚洲综合自拍网| 久久午夜视频| 亚洲一区尤物| 99精品中文字幕在线不卡| 久久青草福利网站| 欧美高清成人| 欧美片在线播放| 久久黄色小视频| 91免费视频网址| 亚洲不卡视频在线| 一个色综合网| 国产在线视频欧美一区二区三区| 成人美女大片| 久久视频在线免费观看| 粉嫩av一区二区夜夜嗨| 色综合一区二区三区| 精品丰满少妇一区二区三区| 国产酒店精品激情| 亚洲自偷自拍熟女另类| 欧美高清视频在线观看mv| 91传媒视频在线观看| 成人免费观看在线观看| 在线视频亚洲欧美| 亚洲精品一区二区三区蜜桃| 色综合久久久久综合体| www.97视频| 99精品视频在线播放观看| 99视频在线视频| 欧美性久久久| 日韩资源av在线| 天堂久久av| 国产精品6699| 狂野欧美激情性xxxx欧美| 在线精品国产欧美| 亚洲第一色网站| 欧美性做爰猛烈叫床潮| 久久精品国产亚洲av无码娇色| 久久久av毛片精品| 国产免费无码一区二区| 日日噜噜夜夜狠狠视频欧美人| 日本黄网站色大片免费观看| 精品国产精品国产偷麻豆| 国产99视频精品免费视频36| 成人深夜福利| 热久久99这里有精品| 青青草原国产在线| 中国china体内裑精亚洲片| 成人免费一级视频| 欧美日韩亚洲高清一区二区| 伊人久久综合视频| 最新久久zyz资源站| 亚洲av综合一区二区| 成人午夜激情视频| 五月天开心婷婷| 蜜臀av性久久久久蜜臀aⅴ流畅| 国产美女主播在线| 欧美成人一品| 亚洲欧美日韩国产yyy| 亚洲福利网站| 久久精品国产美女| 91嫩草精品| 亚洲已满18点击进入在线看片| 免费污视频在线一区| 欧美中在线观看| av中文在线资源库| 欧美精品激情在线| 91中文在线| 超碰日本道色综合久久综合| 国产写真视频在线观看| 在线观看欧美成人| 国产高清一级毛片在线不卡| 亚洲欧美另类在线观看| 天天操天天操天天干| 亚洲大胆美女视频| 蜜桃视频久久一区免费观看入口| 日韩色在线观看| 国产av一区二区三区| 欧美高清视频www夜色资源网| 中文字幕激情视频| 欧美性videosxxxxx| 69视频免费看| 色吊一区二区三区| 无码无套少妇毛多18pxxxx| 色婷婷综合久久久中文一区二区| 国产女同在线观看| 偷窥国产亚洲免费视频| 999这里只有精品| 欧美色视频日本高清在线观看| 青青操免费在线视频| 欧美天堂在线观看| 日韩aaaaaa| 欧美性猛交xxxx久久久| 在线视频精品免费| 欧美日韩一区二区在线观看| 国产精品嫩草影院桃色| 欧美一级在线免费| 动漫av一区二区三区| 亚洲激情国产精品| 黄色av网站在线| 在线观看国产精品淫| 操你啦视频在线| 久久久久久久久久久免费精品 | 国产一区视频在线观看免费| h无码动漫在线观看| 亚洲黄色一区| 亚洲色精品三区二区一区| 日本成人在线一区| 精品国产鲁一鲁一区二区三区| 国产传媒久久文化传媒| 欧美夫妇交换xxx| 国产欧美一区二区精品性色| 中文乱码字幕高清一区二区| 亚洲综合色噜噜狠狠| 国产精品国产三级国产专区52| 欧美性色视频在线| 6—12呦国产精品| 精品粉嫩超白一线天av| 国产最新视频在线观看| 久久精品视频在线播放| 国产高清自产拍av在线| 国产精品三级在线| 一区二区免费| 日本欧美精品久久久| 欧美在线国产| 99爱视频在线| 经典三级在线一区| 久久人人妻人人人人妻性色av| 欧美激情在线观看视频免费| 少妇影院在线观看| 日本道精品一区二区三区| av网站在线免费看| 亚洲欧美中文字幕在线一区| 亚洲妇熟xxxx妇色黄| 日本乱人伦a精品| 日本少妇精品亚洲第一区| 欧美日韩电影一区二区三区| 小说区亚洲自拍另类图片专区 | 国产一区二区免费在线| jizz欧美性20| 亚洲女爱视频在线| 中文字幕手机在线视频| 亚洲国产福利在线| 高潮毛片在线观看| 国产成人在线一区| 大奶一区二区三区| 精品久久免费观看| 日韩精彩视频在线观看| 欧美xxxx黑人| 国产精品国产三级国产a| 欧美激情黑白配| 欧美刺激午夜性久久久久久久| 东凛在线观看| 91wwwcom在线观看| www.国产精品一区| 久久久久亚洲av无码专区喷水| 久久久精品网| 国产精品无码在线| 亚洲国产另类精品专区| 国产人妻精品一区二区三| 亚洲天堂影视av| 在线天堂资源| 久久av一区二区| 精品999成人| 亚洲性图第一页| 亚洲免费观看高清完整版在线观看 | 亚欧精品视频一区二区三区| 五月婷婷综合在线| 不卡视频免费在线观看| 久久久国产精品视频| 久久久久黄色| 亚洲高清精品中出| 日韩不卡手机在线v区| 91精品国自产在线| 在线观看亚洲a| 电影在线一区| 国产精品久久久久久久久借妻 | 久久久亚洲精品无码| 国产91精品免费| 国产小视频在线观看免费| 日韩欧美电影在线| 欧美aaa免费| 国产精品乱子乱xxxx| 狠狠爱综合网| 催眠调教后宫乱淫校园| 亚洲成人综合在线| 神马久久久久久久久久| 91国产在线精品| 香蕉久久精品| 成年人小视频网站| 国产精品免费看片| 国产精品久久久久久久免费看| 久久精品成人一区二区三区| 精品国产一级| 无码人妻少妇伦在线电影| www.视频一区| 精品国产xxx| 日韩性xxxx爱| 亚洲精品一二三**| 日日摸日日碰夜夜爽无码| 91丨porny丨首页| 日韩久久久久久久久久| 色av中文字幕一区| 国产精品高清一区二区| 欧美亚洲色图视频| 久久影院午夜片一区| 久久久久久亚洲av无码专区| 色婷婷综合久久久久中文字幕1| 成年永久一区二区三区免费视频| 韩国黄色一级大片| 成+人+亚洲+综合天堂| 久久久精品毛片| 精品国产一区二区三区久久| youjizz亚洲| 国产第一页视频| 亚洲视频在线观看三级| 欧美一级淫片aaaaaa| 国产激情久久久久| 91精品国产乱码久久久久久久| 欧美做受高潮中文字幕| 一本高清dvd不卡在线观看| 毛片在线看片| 精品国产乱码一区二区三区四区| 日韩精品一级二级| 久久久久亚洲AV成人| 国产婷婷色综合av蜜臀av| 亚洲欧洲二区| 日本国产在线播放| 中文字幕一区三区| 天堂网在线中文| 91精品国产综合久久香蕉最新版| 激情综合在线| 亚洲毛片亚洲毛片亚洲毛片| 欧美精品一区二区三| 欧美视频第一| 好吊妞无缓冲视频观看| 1024精品合集| 国产尤物视频在线| 波多野结衣一区二区三区在线观看| 久久精品中文| 精品无码人妻一区二区三|