精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Llama 4訓(xùn)練已開啟!Meta科學(xué)家最新采訪,揭秘Llama 3.1是如何煉成的

人工智能 新聞
最近,Latent Space發(fā)布的播客節(jié)目中請(qǐng)來了Meta的AI科學(xué)家Thomas Scialom。他在節(jié)目中揭秘了Llama 3.1的一些研發(fā)思路,并透露了后續(xù)Llama 4的更新方向。

剛剛發(fā)布的開源「巨無霸」Llama 3.1雖然自帶論文,但依舊激起了廣大網(wǎng)友強(qiáng)烈的好奇心和求知欲。

Llama 3.1都使用了哪些數(shù)據(jù)?其中有多少合成數(shù)據(jù)?為什么不使用MoE架構(gòu)?

后訓(xùn)練與RLHF流程是如何進(jìn)行的?模型評(píng)估是如何進(jìn)行的?

我們什么時(shí)候可以見到Llama 4?Meta是否會(huì)發(fā)展agent?

恰逢Llama 3.1剛剛發(fā)布,Meta科學(xué)家就現(xiàn)身播客節(jié)目Latent Space,秉持著開源分享的精神,對(duì)以上問題都作出了清晰的回答。

圖片

受訪者Thomas Scialom現(xiàn)任Meta的人工智能研究科學(xué)家,領(lǐng)導(dǎo)了Llama 2和Llama 3的后訓(xùn)練,并參加了CodeLlama、Toolformer、Bloom、GAIA等多個(gè)項(xiàng)目。

圖片

以下是采訪內(nèi)容的節(jié)選。

Llama 3.1研發(fā)思路

如何決定參數(shù)規(guī)模

其實(shí)LLM的參數(shù)規(guī)模的選擇需要考慮多種因素,包括scaling law、訓(xùn)練時(shí)間、GPU和硬件的約束等等。

而且,不能只考慮Meta所用的硬件,還有整個(gè)AI社區(qū),并不是每個(gè)人都在使用H100,還有很多不同的GPU型號(hào)和顯存大小。

再加上,目前廣泛應(yīng)用于推理階段的量化技術(shù),比如可以用FP16或FP8精度,這會(huì)改變推理和訓(xùn)練/微調(diào)成本的比重。

以上這些限制因素,都讓模型規(guī)模的選擇成為一個(gè)非常具有挑戰(zhàn)性的問題。

總體而言,著重考慮的是目前已有的算力,在Scaling Law和訓(xùn)練token總量的限制內(nèi),我們進(jìn)行了一些權(quán)衡,找到了一個(gè)有合適推理效率的平衡點(diǎn)。

之所以做到405B這么大規(guī)模,其實(shí)原因很簡單——我們想做出最好的模型,一個(gè)真正與GPT-4比肩的開源模型。(現(xiàn)在是GPT-4o了)雖然目前還沒有完全達(dá)到目標(biāo),但差距正在逐漸縮小。

正如小扎之前宣布的,Meta囤積了越來越多的GPU,因此下一代模型將繼續(xù)擴(kuò)展。

對(duì)于網(wǎng)友們所說的,無法在家里運(yùn)行Llama 3.1,這很有可能是事實(shí)。但如果進(jìn)行FP8量化,依舊可以用128k的上下文窗口在單節(jié)點(diǎn)上運(yùn)行。

從另一個(gè)角度來看,我們還是要寄希望于開源社區(qū)的力量。Llama 1和Llama 2剛剛發(fā)布時(shí),大家同樣認(rèn)為模型太大了,但兩周后它就能在樹莓派上運(yùn)行了。

雖然不能確定Llama 3.1也會(huì)和以前一樣,但通過將模型開源,我們希望可以看到類似的趨勢。

圖片

重新審視Scaling Law

我們所熟知的Scaling Law主要關(guān)注兩個(gè)維度,即模型權(quán)重和訓(xùn)練量,包括訓(xùn)練時(shí)的step、epoch和token總量等等。

基本上,論文的發(fā)現(xiàn)就是,模型規(guī)模是重要因素。因此,GPT-3犯了一個(gè)錯(cuò)誤——模型參數(shù)量遠(yuǎn)遠(yuǎn)超出了token總量的要求。

圖片

論文地址:https://arxiv.org/pdf/2001.08361

這也正是之后的Chinchilla所發(fā)現(xiàn)和強(qiáng)調(diào)的,相比最初的Scaling Law,他們更強(qiáng)調(diào)了訓(xùn)練數(shù)據(jù)token總量的重要性。

圖片

論文地址:https://arxiv.org/pdf/2203.15556

Chinchilla論文想要找到「算力最優(yōu)化」的訓(xùn)練方式,認(rèn)為在有限算力的前提下,存在一個(gè)模型參數(shù)量和訓(xùn)練token數(shù)的最佳比率。

如果你希望在論文的基準(zhǔn)測試中得到最優(yōu)模型,那么Chinchilla本身沒有問題;但Meta要發(fā)布的旗艦?zāi)P瓦€需要更高的推理效率。

因此,我們選擇增加訓(xùn)練的token數(shù),并增加訓(xùn)練時(shí)長,讓模型達(dá)到「過度訓(xùn)練」的狀態(tài)。

這不符合Chinchilla定律,也會(huì)付出額外的算力,但我們希望讓模型有更好的推理表現(xiàn),從而更多地應(yīng)用于開源社區(qū),因此需要做出一些超越Chinchilla定律的選擇。

事實(shí)上,這也是Llama 1的研發(fā)人員所做的事情。我所說的「不要陷入Chinchilla陷阱」就是這個(gè)意思。

圖片

模型架構(gòu)

相比Llama 2, Llama 3的架構(gòu)沒有太多變化,但是在擴(kuò)展數(shù)據(jù)的規(guī)模和質(zhì)量方面,我們作出了很多努力,數(shù)據(jù)集從2T token增加到15T token。

架構(gòu)方面,我認(rèn)為將來會(huì)有更多改進(jìn),甚至不僅僅局限于Transformer。

目前的Tranformer架構(gòu)仍然缺少靈活性,比如,我認(rèn)為對(duì)每個(gè)token使用等量的算力是沒有意義的,因此還有很多研究的空間。

關(guān)于「為什么不使用MoE架構(gòu)」,這個(gè)是我經(jīng)常聽到的質(zhì)疑,其中的原因有多個(gè)方面。

我認(rèn)為,稠密模型只是MoE的一個(gè)特定變體,你可以把它看作只有一個(gè)專家的MoE,因此這只是一個(gè)還沒有優(yōu)化的超參數(shù)而已。

但我們目前正在進(jìn)行一些工作,未來可能會(huì)在這個(gè)超參數(shù)上繼續(xù)探索。

關(guān)于合成數(shù)據(jù)

關(guān)于數(shù)據(jù),我的直覺是,公開互聯(lián)網(wǎng)上充斥著過多文本垃圾,用這些token訓(xùn)練模型是對(duì)算力的浪費(fèi)。

在為Llama 2抓取數(shù)據(jù)時(shí),我們就使用Llama作為分類器,用于過濾出高質(zhì)量的token,并打上主題標(biāo)簽,比如這段文本是和數(shù)學(xué)、法律還是政治有關(guān),這樣可以實(shí)現(xiàn)主題的均衡和多樣性。

Llama 3的后訓(xùn)練過程完全沒有使用人工書寫的答案,僅依靠從Llama 2獲得的合成數(shù)據(jù)。

我非常看好合成數(shù)據(jù),而且隨著模型性能提升,情況也會(huì)變得更好。

LLM的評(píng)估與改進(jìn)

目前的模型研發(fā)有一個(gè)趨勢,就是針對(duì)基準(zhǔn)分?jǐn)?shù)進(jìn)行模型的后訓(xùn)練改進(jìn)。

模型評(píng)估是一個(gè)開放的研究問題,目前還沒有很好的答案,尤其是面對(duì)同一個(gè)模型有如此多的功能。

當(dāng)你試圖提升模型在某個(gè)基準(zhǔn)上的分?jǐn)?shù)時(shí),這就不再是一個(gè)好的基準(zhǔn)了,因?yàn)榭赡軙?huì)存在過擬合,分?jǐn)?shù)提升未必可以遷移成為相似的能力。

因此,語言模型的評(píng)估,尤其是訓(xùn)練后評(píng)估,是一個(gè)非常困難的問題。我們嘗試過很多方法,包括用獎(jiǎng)勵(lì)模型,model-as-a-judge、使用多樣化的提示、多樣化的基準(zhǔn)測試……

我感覺為Llama 2進(jìn)行評(píng)估要比今天容易多了,當(dāng)時(shí)的模型性能比現(xiàn)在相差很多。現(xiàn)在的模型變得如此好,以至于很難找到能擊潰模型的合適prompt,進(jìn)行性能比較并查看邊界情況。

比較模型的其中一個(gè)好辦法就是進(jìn)行多輪RLHF。每次上傳新模型時(shí),只需在所有帶標(biāo)注的prompt上進(jìn)行采樣,讓新舊模型分別回答,再自動(dòng)計(jì)算勝率。

Llama 4與Agent

Meta已經(jīng)在6月開始訓(xùn)練Llama 4模型,而且重點(diǎn)可能圍繞agent技術(shù),并且已經(jīng)在Toolformer等agent工具上進(jìn)行了一些工作。

圖片

論文地址:https://arxiv.org/pdf/2302.04761

但同時(shí)也要意識(shí)到,如果沒有一個(gè)優(yōu)秀的指令模型,Toolformer擴(kuò)展和未來能力也會(huì)大大受限,因此我們研發(fā)了Llama 2和Llama 3。

此外,Meta也曾在一年前發(fā)布GAIA基準(zhǔn),用于評(píng)估模型解決現(xiàn)實(shí)世界問題的能力。

在這個(gè)基準(zhǔn)的排行榜上,基于GPT-3的agent系統(tǒng)得分幾乎接近于零,但GPT-4驅(qū)動(dòng)的系統(tǒng)就有很好的成績,比如30%~40%,這其中就體現(xiàn)出模型的智力差距。

在我看來,agent的各種能力,比如函數(shù)調(diào)用、遵循復(fù)雜指令、預(yù)先規(guī)劃、多步驟推理等等,和模型的這種智力差距是類似的。

圖片

論文地址:https://arxiv.org/pdf/2311.12983

現(xiàn)在有了足夠強(qiáng)大的Llama 3,我將重新專注于agent的構(gòu)建。如果能實(shí)現(xiàn)良好的模型互聯(lián),形成一個(gè)復(fù)雜的agnent系統(tǒng),將獲得幾個(gè)數(shù)量級(jí)的擴(kuò)展,從而實(shí)現(xiàn)規(guī)劃、回溯、網(wǎng)頁導(dǎo)航、代碼執(zhí)行等多種功能。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-07-30 13:48:37

2025-10-10 00:00:10

大語言模型LLM智能

2024-07-24 13:18:17

2012-12-06 15:36:55

CIO

2017-08-04 15:53:10

大數(shù)據(jù)真?zhèn)螖?shù)據(jù)科學(xué)家

2024-07-25 13:36:32

2023-05-23 09:34:16

科學(xué)家AI

2023-07-22 13:24:36

分析模型

2023-07-27 14:11:32

模型開源

2018-02-28 15:03:03

數(shù)據(jù)科學(xué)家數(shù)據(jù)分析職業(yè)

2023-12-28 15:18:37

MetaOpenAI

2024-05-27 09:01:42

Llama 3大型語言模型人工智能

2013-12-18 13:19:43

多核計(jì)算

2023-07-24 14:26:58

OpenAIGPT-4Karpathy

2025-04-08 02:26:00

2015-06-11 10:27:29

數(shù)據(jù)科學(xué)家

2015-08-28 09:22:07

數(shù)據(jù)科學(xué)

2022-11-03 14:13:24

騰訊科學(xué)家

2018-12-24 08:37:44

數(shù)據(jù)科學(xué)家數(shù)據(jù)模型

2012-12-26 10:51:20

數(shù)據(jù)科學(xué)家
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

蜜臀av性久久久久蜜臀av麻豆| 精品一区二区三区中文字幕视频| 99精品偷自拍| 国产99久久久欧美黑人| 国产大屁股喷水视频在线观看| 亚洲精品66| 亚洲va欧美va人人爽| 欧美精品中文字幕一区二区| 亚洲一级在线播放| 欧美三级免费| 亚洲香蕉伊综合在人在线视看| 欧美激情国内自拍| 蜜桃av在线| 18欧美亚洲精品| 狠狠色噜噜狠狠狠狠色吗综合| 日日夜夜狠狠操| 亚洲精品国产首次亮相| 日韩精品视频在线观看免费| 伊人色在线观看| 日韩脚交footjobhd| 最新不卡av在线| 人禽交欧美网站免费| www.爱爱.com| 免费高清在线一区| 欧美一区二区三区图| 国产女片a归国片aa| 国产欧美日韩一区二区三区四区| 欧美一区二区福利在线| 亚洲精品视频导航| 天堂а√在线最新版中文在线| 1000精品久久久久久久久| 欧美第一黄网| 色婷婷激情五月| 国产一区二区久久| 国产色婷婷国产综合在线理论片a| 国产精彩视频在线观看| 一区二区三区午夜视频| 亚洲一区二区久久久| 内射中出日韩无国产剧情| 久久av网站| 欧美老年两性高潮| 波多野结衣天堂| 大胆人体一区| 欧美视频精品一区| 777av视频| 爱情岛亚洲播放路线| 椎名由奈av一区二区三区| 日韩一区二区三区资源| 四虎影视2018在线播放alocalhost| 久久精品国产亚洲高清剧情介绍| 国产成人拍精品视频午夜网站| 国产成人愉拍精品久久 | 久久99精品国产麻豆婷婷洗澡| 欧美专区国产专区| 黑人一级大毛片| 制服诱惑一区二区| 97在线视频免费| 日韩av黄色片| 日韩午夜高潮| 欧美一区二区三区……| 国产剧情在线视频| 久久一本综合频道| 国产精品视频1区| 在线免费看91| 国产一区二区在线免费观看| 91欧美日韩一区| www.黄色小说.com| 国产黄人亚洲片| 国产一区二区三区四区五区在线 | 激情亚洲小说| 欧美区在线观看| 在线播放av中文字幕| 99热这里有精品| 精品久久国产字幕高潮| 艳妇乳肉豪妇荡乳xxx| 国内自拍欧美| 亚洲欧洲国产一区| 精品一区二区三孕妇视频| 欧美成人自拍| 欧美人交a欧美精品| 国产精品99精品| 校园激情久久| 国产自摸综合网| 亚洲不卡免费视频| 97精品国产97久久久久久久久久久久 | 97国产一区二区| 日本一区二区久久精品| 免费网站成人| 亚洲国产欧美在线人成| 久久网站免费视频| 成人免费在线观看视频| 日韩视频免费观看高清在线视频| 制服丝袜av在线| 精品免费av| 欧美日韩国产二区| 国产免费一级视频| 国产美女久久久久| 欧美精品成人一区二区在线观看 | 亚洲人一二三区| 久久99久久久久久| 亚洲www啪成人一区二区| 欧美一级久久久久久久大片| 日韩网站在线播放| 伊人色**天天综合婷婷| 欧美亚洲日本黄色| 国产suv一区二区| 久久品道一品道久久精品| 精品91一区二区三区| 自由日本语热亚洲人| 欧美丰满高潮xxxx喷水动漫| 久久久久麻豆v国产精华液好用吗| 久久视频在线| 欧美亚洲第一页| 国产黄色av片| 国产欧美精品区一区二区三区 | 亚洲开发第一视频在线播放| 亚洲区欧洲区| 欧美日韩极品在线观看一区| 又黄又爽的网站| 欧美欧美天天天天操| 国产精品视频播放| 四虎电影院在线观看| 亚洲精品乱码久久久久久日本蜜臀| 99福利在线观看| 99久久香蕉| 免费91在线视频| 91美女精品网站| 欧美激情在线一区二区| 男人操女人免费| 嗯用力啊快一点好舒服小柔久久| 久久精品亚洲精品| 中文字幕 国产精品| 91玉足脚交白嫩脚丫在线播放| 成人在线免费观看网址| 老司机精品视频网| 亚洲性夜色噜噜噜7777| 久久精品国产成人av| 大白屁股一区二区视频| 浴室偷拍美女洗澡456在线| 麻豆久久久久| 中文字幕亚洲无线码在线一区| 亚洲另类在线观看| 免费看黄网站在线观看| 日韩成人三级| 热草久综合在线| 欧洲av在线播放| 亚洲国产精品久久人人爱蜜臀| 欧美视频亚洲图片| 亚洲成av人片乱码色午夜| 国产精品一二三视频| 国产黄在线观看免费观看不卡| 日韩欧美福利视频| 99久久国产精| 亚洲免费网址| 欧美精品一区二区三区四区五区| 精品极品在线| 亚洲精品不卡在线| 日韩欧美三级在线观看| 91麻豆精品在线观看| 国产免费毛卡片| 精品国产一区二区三区久久久蜜臀| 欧美在线一级视频| 毛片在线免费| 欧美色图片你懂的| 天天操天天摸天天舔| 韩国v欧美v日本v亚洲v| 黄色a级在线观看| 中文在线免费一区三区| 九九热这里只有精品6| 超碰在线观看av| 精品成人在线视频| 性高潮久久久久久久 | 日本在线一二三区| 天天做综合网| 欧美mv和日韩mv的网站| 色吧亚洲视频| 国产69精品久久| 久久精品中文字幕一区| 亚洲不卡免费视频| 色综合久久久久综合体桃花网| wwwwww日本| 麻豆成人91精品二区三区| 宅男av一区二区三区| 视频二区欧美| 91爱爱小视频k| 在线观看美女网站大全免费| 欧美一区二区不卡视频| 国产一级精品视频| 国产精品国产a级| 久久久精品人妻一区二区三区| 精品电影一区| 色综合电影网| 亚洲国产视频二区| 青青草精品毛片| 久操视频在线| 日韩成人av在线| 91在线观看喷潮| 亚洲福利一区二区三区| 日韩毛片无码永久免费看| 国产成人在线观看免费网站| 毛片av免费在线观看| 在线国产一区| 欧美日韩国产综合视频在线| 国产精品一区二区精品| 国产69久久精品成人| 毛片在线看网站| 日韩国产精品视频| 99久久精品国产成人一区二区 | 国产毛片久久久| 国产精品劲爆视频| 19禁羞羞电影院在线观看| 色婷婷综合成人| 少妇性bbb搡bbb爽爽爽欧美| 7777精品伊人久久久大香线蕉完整版| 亚洲视频免费播放| 亚洲欧洲综合另类| 在线视频第一页| 91麻豆国产福利精品| 久久久国产精品久久久| 全部av―极品视觉盛宴亚洲| 国产一区二区视频播放| 91偷拍一区二区三区精品| 久久精品国产综合精品| 香蕉大人久久国产成人av| 国产精品亚洲网站| 在线天堂资源www在线污| 欧美极品美女电影一区| 黄网站在线免费| 中文字幕久热精品视频在线| 无码国产精品一区二区免费16| 欧美一区欧美二区| 在线观看免费观看在线| 91福利资源站| 青青青国产在线| 夜色激情一区二区| 婷婷伊人五月天| 亚洲欧洲成人精品av97| 人人妻人人澡人人爽| 久久这里只有精品6| 五月天激情小说| 成人精品国产福利| 亚洲美女高潮久久久| 国产福利一区二区三区在线视频| 亚洲免费黄色录像| 麻豆精品精品国产自在97香蕉| 国产极品美女高潮无套久久久| 国产日韩欧美一区| 鲁一鲁一鲁一鲁一澡| 99视频+国产日韩欧美| jizz在线免费观看| 麻豆91精品| 黄色大片在线免费看| 国一区二区在线观看| 欧美黄色免费网址| 国内精品嫩模av私拍在线观看| 国产91沈先生在线播放| 国模大胆一区二区三区| 六月婷婷在线视频| 99视频+国产日韩欧美| 欧美aⅴ在线观看| 久久激情久久| 日韩视频在线免费看| 日韩电影在线一区| 日韩在线不卡一区| 国产一区二区三区在线观看免费 | 亚洲欧洲一区二区三区在线观看| 手机看片福利在线观看| 亚洲天堂久久av| 中文字幕日本在线| 欧美另类第一页| caoporn视频在线| 日本免费在线精品| 欧美激情啪啪| 99久久伊人精品影院| 精品网站aaa| 欧美一区二区三区在线免费观看| 日韩电影一区| 亚洲国产精品女人| 国产亚洲福利| 亚洲欧美自偷自拍另类| 国产成人综合亚洲91猫咪| 亚洲图片综合网| 欧美激情一区三区| 黄页网站免费观看| 日本韩国一区二区三区视频| 一区二区视频在线免费观看| 日韩一区二区三区av| 日韩欧美在线番号| 精品久久国产精品| 成人三级高清视频在线看| 国产精品久久久久久久电影| 精品久久国产一区| 农村寡妇一区二区三区| 久久日文中文字幕乱码| 成人午夜精品久久久久久久蜜臀| 日韩影院免费视频| 精品国产一二区| 久久精品免视看| 久久久久99精品成人片毛片| 色综合激情久久| 亚洲AV午夜精品| 亚洲午夜av久久乱码| 手机在线免费看av| 国产精品第1页| 都市激情亚洲欧美| 一本色道婷婷久久欧美| 国产毛片一区| 岛国大片在线免费观看| 中文字幕第一页久久| 日韩免费黄色片| 91精品欧美久久久久久动漫| 九九热视频在线观看| 欧美极品第一页| 亚洲久草在线| 日韩av高清| 99视频精品| 女女调教被c哭捆绑喷水百合| 国产欧美一区二区精品婷婷 | 国产精品视频在线免费观看 | 91丨九色丨尤物| 可以直接看的黄色网址| 欧美亚洲综合一区| 视频在线不卡| 日韩av不卡在线观看| 精品日本一区二区三区在线观看| 四季av一区二区三区免费观看| 亚洲熟妇av日韩熟妇在线| 国产精品12区| 成人免费精品动漫网站| 欧美日韩黄色一区二区| 韩国三级在线观看久| 7m第一福利500精品视频| 一本色道69色精品综合久久| 黄色a级在线观看| 麻豆精品在线播放| 波多野结衣a v在线| 精品国产91久久久久久| 日本高清视频www| 欧美精品videossex88| 日韩一二三区| 97精品国产97久久久久久粉红| 久久99精品久久久久久国产越南| 国产精品情侣呻吟对白视频| 色狠狠桃花综合| 高清性色生活片在线观看| 欧洲永久精品大片ww免费漫画| 久久av国产紧身裤| 国产老熟妇精品观看| www.成人网.com| 国产午夜精品无码| 亚洲精品按摩视频| 亚洲最大网站| 日韩亚洲不卡在线| 看片的网站亚洲| 婷婷激情四射网| 91精品久久久久久蜜臀| 色a资源在线| 国产精品亚洲综合| 久久激情久久| 成人精品一二三区| 制服视频三区第一页精品| 亚洲丝袜精品| 九九99玖玖| 爽好多水快深点欧美视频| 欧美另类z0zx974| 欧美群妇大交群的观看方式| av在线播放观看| 国内精品**久久毛片app| 国产欧美一区二区三区国产幕精品| 天天插天天射天天干| 日本高清不卡一区| 麻豆影院在线观看| 国产精华一区| 天堂一区二区在线免费观看| 蜜臀久久99精品久久久久久| 69久久夜色精品国产69蝌蚪网| av软件在线观看| 欧美精品尤物在线| 老鸭窝一区二区久久精品| 国产亚洲精品久久777777| 精品视频—区二区三区免费| 开心久久婷婷综合中文字幕| 国产资源第一页| 久久蜜桃香蕉精品一区二区三区| 自拍偷拍色综合| 久久久久久久久久久人体| 国产一区二区电影在线观看| 想看黄色一级片| 激情懂色av一区av二区av| 日本在线视频网| 国产日韩欧美一区二区| 青青草国产精品97视觉盛宴| 九九视频在线免费观看| 国产亚洲美女精品久久久| 日本一区二区三区播放| 日韩在线xxx| 一区二区三区欧美亚洲| 黄色av免费在线观看| 成人91视频| 日韩电影在线免费看|