精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

最強大模型 Llama 3.1-405B 架構設計剖析 原創(chuàng)

發(fā)布于 2024-7-25 13:55
瀏覽
0收藏

1、最強大模型 Llama 3.1-405B 簡介

在歷經(jīng)了兩天的提前“泄露風波”后,Llama 3.1 終于正式揭開面紗,由官方對外公布。

新版 Llama 3.1 將其上下文處理能力擴展至 128K,推出了 8B、70B 及 405B 三個不同規(guī)模的版本,再次單槍匹馬地提升了大規(guī)模模型領域的競爭門檻。

對于 AI 大模型領域而言,Llama 3.1 405B 版本具有劃時代的意義,它刷新了開源基礎模型性能的極限。據(jù) Meta 官方透露,該大模型在眾多任務中的表現(xiàn)足以匹敵當前最優(yōu)的閉源模型。

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

Llama3.1 405B數(shù)據(jù)集評測結果

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

Llama3.1 405B人工評估


2、Llama 3.1-405B 架構設計剖析

Llama 3.1共開源了8B、70B、405B三種參數(shù)量的模型,其中 405B 除了FP16精度,還有FP8量化版模型,針對8B額外開源了經(jīng)過內(nèi)容安全分類微調的Llama-Guard-3-8B。

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

架構設計主要看點總結如下:

1. Llama3.1 405B 依然使用 decoder-only 結構的 transformer,沒有使用混合專家。

2. 上下文長度增加到 128K。

3. 在語言模型后訓練階段,405B 通過監(jiān)督微調和直接偏好優(yōu)化等,進一步提升了模型的性能和適應性。監(jiān)督微調使用大量的人工標注數(shù)據(jù)來微調模型,使其能夠更好地遵循人類的指令和偏好;直接偏好優(yōu)化則通過學習人類的偏好來優(yōu)化模型的輸出,使其更加符合人類的期望。

4. 對于小參數(shù)量模型,Meta 使用 405B 模型去提升小參數(shù)量模型的效果。

3、Llama 3.1 預訓練過程剖析

Llama 3.1 的預訓練過程分為三個關鍵階段:1、初始預訓練階段;2、長文本上下文預訓練;3、退火過程??傮w來看,這一流程與現(xiàn)有的一些開源模型訓練方法相似,但技術報告中透露了眾多精細的技術細節(jié)。以下是各階段的詳細描述:

初始預訓練階段:這一階段遵循標準的預訓練流程,訓練初期采用較小的批量大小以保障訓練穩(wěn)定性,隨后逐漸增大批量大小以提高訓練效率,直至達到每批 16M 個token。為了增強模型在多語言和數(shù)學推理方面的能力,特別增加了非英語內(nèi)容和數(shù)學數(shù)據(jù)的比重。

長文本上下文預訓練階段:在預訓練的后半程,使用長文本數(shù)據(jù)進行訓練,以支持高達 128K 個token的上下文窗口。在這一階段,采取了逐步擴展上下文窗口的策略,對于 Llama 3 405B 模型,從最初的 8K token 上下文窗口開始,逐步擴展,最終達到 128K token 的窗口大小。此階段消耗了大約 800B 個token的訓練數(shù)據(jù)。

退火過程:在預訓練的最后 4000 萬個token期間,采取了線性降低學習率至零的策略,同時保持 128K 個token的上下文長度。在這一退火階段,對數(shù)據(jù)混合比例進行了調整,增加了如數(shù)學、代碼、邏輯等高質量數(shù)據(jù)的影響。最終,通過取退火期間多個模型檢查點的平均值,形成了最終的預訓練模型。在訓練后期對高質量數(shù)據(jù)進行上采樣,這一做法在當前也是較為普遍的做法。

4、Llama 3.1 的 Post-Traning 剖析

當前,大型語言模型(LLM)的后訓練主要采用兩種策略,第一種是借鑒自ChatGPT的 SFT+RM+PPO 模式,該模式運用了強化學習,涉及眾多需要調整的超參數(shù),過程較為復雜,不易實現(xiàn);另一種策略是 SFT+DPO 模式,省略了PPO 強化學習部分,簡化了流程,更易于操作。

最強大模型 Llama 3.1-405B 架構設計剖析-AI.x社區(qū)

LLaMA 3.1 在后訓練階段主要采用了 SFT+DPO 模式,并加入了一些獨特的設計。上圖展示了 LLaMA 3.1 整個后訓練流程。起初,使用人工標注數(shù)據(jù)訓練RM 模型,以評估<Prompt, answer>數(shù)據(jù)的質量,隨后利用 RM 進行拒絕采樣。

具體來說,針對一個給定的人工 Prompt,模型生成多個回答,RM 對這些回答進行質量評分,選取評分最高的作為 SFT 數(shù)據(jù),其余則棄用。這樣篩選出的SFT 數(shù)據(jù),結合專門用于提升代碼、數(shù)學、邏輯能力的 SFT 數(shù)據(jù),共同用于微調模型,得到 SFT 模型。

接著,利用人工標注數(shù)據(jù)通過 DPO 模型調整LLM參數(shù),DPO 實質上是一個二分類任務,它從<Prompt,Good Answer,Bad Answer>的三元數(shù)據(jù)中學習,調整模型參數(shù)以促使模型輸出 Good Answer,避免輸出 Bad Answer。這樣就完成了一個后訓練迭代周期。上述過程會多次重復,每次流程相同,不同之處在于,在下一輪拒絕采樣階段生成回答的 LLM 模型,將選擇上一輪流程中產(chǎn)生的若干不同 DPO 模型(具有不同超參數(shù)等)中表現(xiàn)最佳的一個。顯然,隨著迭代的進行,DPO 模型性能不斷提升,因此拒絕采樣中選出的最佳答案質量也逐步提高,進而使得 SFT 模型更加優(yōu)秀,形成了一個正向反饋循環(huán)。可以看出,盡管 RLHF 和 DPO 兩種模式都運用了 RM,但應用場景不同,RLHF 將 RM 評分用于 PPO 強化學習階段,而 LLaMA 3.1 則利用 RM 篩選高質量的 SFT 數(shù)據(jù)。并且,由于拒絕采樣的回答是由 LLM 生成的,這意味著在此過程中大量使用了合成數(shù)據(jù)來訓練 SFT 模型。

5、LLama 3.1 405B 為何不用 MOE 架構?

大模型的 MOE 結構是否能夠提升模型性能?答案并非必然。

早在 ChatGPT 流行之前,研究就已經(jīng)得出結論,從模型性能影響的角度來看,MOE 結構相較于密集型(Dense)模型并不會帶來額外的優(yōu)勢,有時甚至可能存在劣勢。

MOE 架構的主要優(yōu)點在于降低訓練和推理的成本,但這需要以訓練穩(wěn)定性降低和推理時需要更多內(nèi)存來存儲增加的參數(shù)為代價。在用戶數(shù)量龐大、請求頻繁的情況下,推理成本占據(jù)的比重更大,此時 MOE 結構在推理方面更為友好,這也是為什么模型規(guī)模達到一定程度后,其結構會從 Dense 轉向 MOE 的主要原因——這一轉變更多是基于成本和效率的考量,而非性能。

我曾見過一些聲稱MOE結構性能更優(yōu)的說法,但這些觀點缺乏實證支持。Llama 3.1 405B 未采用 MOE 結構,技術報告指出,這是由于考慮到密集型模型在訓練上更為穩(wěn)定,因此選擇了 Dense 結構。與 GPT 4 的 1.8T MOE 模型相比,405B 的 Dense 模型在性能上不相上下,甚至可能更勝一籌(當然,也不排除 GPT 4 可能已經(jīng)是一個經(jīng)過蒸餾的較小模型)。


本文轉載自公眾號玄姐聊AGI  作者:玄姐

原文鏈接:??https://mp.weixin.qq.com/s/rBTL-bePocCctKA8LgYTnw??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
h片视频在线观看| 国产精品一二三在线| 91嫩草在线视频| 蜜臀av粉嫩av懂色av| 免费看污视频的网站| 亚洲日本va午夜在线电影| 鲁大师成人一区二区三区| 欧美日本乱大交xxxxx| 久久精精品视频| 九九视频在线免费观看| 伊人久久综合网另类网站| 久久综合99re88久久爱| 久久久欧美精品| 人妻精油按摩bd高清中文字幕| sese在线视频| 日本三级亚洲精品| 亚洲精品视频免费| 欧美a在线视频| 深夜福利视频在线免费观看| 999国产精品视频| 欧美在线观看视频一区二区三区 | 91成人福利社区| 午夜精品免费在线观看| 99www免费人成精品| 日韩福利小视频| 久久91超碰青草在哪里看| 久久久久国产精品麻豆| 青青久久av北条麻妃黑人| 少妇户外露出[11p]| 大菠萝精品导航| 99久久精品免费看国产| 久久这里只有精品视频首页| 91视频这里只有精品| 欧美激情二区| 国产精品99久久不卡二区| 久久五月情影视| 亚洲av无码国产精品麻豆天美| 日韩精品99| 欧美国产丝袜视频| 国产一区二区丝袜| 91视频免费在线看| 97se亚洲| 欧美性猛交xxxx乱大交极品| 欧美成ee人免费视频| 日本黄色中文字幕| 日韩精品久久久久久久电影99爱| 欧美午夜精品电影| 欧美日韩国产精品激情在线播放| 美女91在线| 26uuu另类欧美亚洲曰本| 午夜精品一区二区三区在线视频 | 99久久婷婷国产综合精品| 国产色婷婷国产综合在线理论片a| 日本久久综合网| 免费在线成人| 国产一区二区av| 国内自拍第二页| 七七成人影院| 一个色综合av| 欧美日韩系列| av一区二区三| 视频一区中文字幕国产| 久久天堂av综合合色| 成人无码精品1区2区3区免费看| 国产在线一区不卡| 欧美性猛交xxxxx水多| 欧美日韩在线一| 3p在线观看| 不卡视频在线看| 国产精品直播网红| 艳妇乳肉豪妇荡乳av| 91久久综合| 一区二区在线视频播放| 精品国产乱码久久久久夜深人妻| 精品日韩视频| 亚洲超碰97人人做人人爱| 91免费黄视频| av免费在线观看网址| 久久亚洲综合色一区二区三区| 国精产品一区二区| 国产美女www爽爽爽视频| 亚洲深爱激情| 欧美美女操人视频| 中文字幕 自拍| 大胆日韩av| 亚洲精品天天看| 精品人妻中文无码av在线 | bl视频在线免费观看| 午夜不卡av免费| 日本熟妇人妻中出| 丁香影院在线| 亚洲天堂成人在线观看| 欧美日产一区二区三区在线观看| avtt亚洲| 亚洲香肠在线观看| 日本精品免费视频| 在线免费av网站| 一区二区三区小说| 日韩不卡视频一区二区| 日本a在线播放| 亚洲成人你懂的| 欧美狂野激情性xxxx在线观| 成人a在线视频免费观看| 国产精品毛片a∨一区二区三区| 精品乱色一区二区中文字幕| 丰满熟妇乱又伦| 国产福利一区二区| 国产亚洲福利社区| 欧美成人高清在线| 欧美午夜激情在线| 中国男女全黄大片| 欧美一区一区| 欧美日韩精品一区二区在线播放| 毛片毛片毛片毛片毛| 亚洲精品三区| 亚洲精品中文字幕有码专区| 国产一区二区播放| 欧美精品aa| 欧美第一黄色网| 久久精品免费av| 一区二区国产在线观看| 午夜精品国产精品大乳美女| 一区二区视频免费| 国内不卡的二区三区中文字幕 | 日韩毛片免费看| 欧美一区二区在线视频| 日韩精品视频网址| 久久99国产精品视频| 尤物精品国产第一福利三区| 日本三级理论片| 欧美亚洲视频| 国产一区免费在线| 日本片在线观看| 精品久久久久久中文字幕| 大陆极品少妇内射aaaaa| 日韩区欧美区| 麻豆一区二区在线观看| 91资源在线视频| 懂色av中文字幕一区二区三区| 国产精品对白一区二区三区| 天堂av中文字幕| 国产午夜亚洲精品不卡| 在线播放 亚洲| 阿v视频在线| 日韩欧美国产不卡| 亚洲av无码成人精品国产| 第九色区aⅴ天堂久久香| 国产成人精品视频| 国产草草影院ccyycom| 国产日韩亚洲欧美综合| 国产视频一区二区三区在线播放| 国产精品视频一区二区三区四蜜臂| 色哟哟网站入口亚洲精品| 免费日韩在线视频| 国产成人免费视频网站高清观看视频 | 久久久午夜精品理论片中文字幕| 国产精品宾馆在线精品酒店| 校园春色另类视频| 深夜福利日韩在线看| 国产精品成人无码| 粉嫩蜜臀av国产精品网站| 国产成人一区二区三区别| 2021年精品国产福利在线| 久久久噜噜噜久久中文字免| 亚洲人视频在线观看| 日韩美女视频一区二区 | 91麻豆精品国产91久久久久| 欧洲熟妇的性久久久久久| 欧美日一区二区在线观看 | 亚洲美女爱爱视频| 欧美久久综合| 精品久久一区二区三区蜜桃| 欧美gay视频| 日韩中文字幕视频在线| 日韩美女黄色片| 久久久久亚洲蜜桃| 色综合色综合色综合色综合| 日韩av中文字幕一区| 不卡av电影院| 日本免费网站在线观看| 亚洲免费在线视频| 天天视频天天爽| 亚洲美女久久| 久久久之久亚州精品露出| 天天操天天干天天| 欧美制服丝袜第一页| 精品无码在线视频| 在线精品一区| 成人av中文| 中文字幕不卡三区视频| 日韩电影免费观看中文字幕| 岛国毛片在线观看| 99久久国产综合色|国产精品| 国产天堂在线播放| 午夜精品久久| 91在线视频免费| 国产精品天堂| 欧美日韩亚洲国产一区| 亚洲av成人精品一区二区三区| 亚洲成人日韩| 91精品国产自产在线| jizz一区二区三区| 精品国产一区二区三区久久狼黑人| 欧美熟女一区二区| 欧美情侣在线播放| 中文在线第一页| 久久久久久久久久看片| 国产大片一区二区三区| 97偷自拍亚洲综合二区| 麻豆91蜜桃| 91国内精品| 91在线高清视频| 黄色成人小视频| 欧美尤物巨大精品爽| 久久米奇亚洲| 欧美日韩一本到| 99热这里只有精品4| 久久国产综合精品| 中文字幕乱码一区二区三区| 97精品资源在线观看| 青草热久免费精品视频| av男人的天堂在线观看| 久久在精品线影院精品国产| av黄色在线观看| 亚洲一级一级97网| 欧美日韩在线精品一区二区三区激情综 | 久久黄色av网站| 国模私拍一区二区| 精品久久久久久久久中文字幕| 久久久久久久久久久网| 91香蕉视频污| 无码国产精品一区二区免费式直播 | 国精产品一区一区三区有限在线| 国产精品剧情一区二区在线观看 | 亚洲制服中文字幕| 日韩经典一区二区| 中文字幕一区二区中文字幕 | 国产亚洲美女久久| 天堂在线免费av| 日韩av最新在线观看| 人妻一区二区三区| 亚洲精品在线观看网站| 激情视频网站在线观看| 亚洲国产日韩一区二区| 免费无码毛片一区二区app| 亚洲精品你懂的| 中文字幕av久久爽一区| 久久精品亚洲国产奇米99| 人人妻人人藻人人爽欧美一区| 免费av网站大全久久| 中国一级黄色录像| 午夜精品久久久久久久四虎美女版| 婷婷亚洲婷婷综合色香五月| 24小时成人在线视频| 国产精品麻豆va在线播放| 手机电影在线观看| 久久99精品久久久久久噜噜| 亚洲色图美国十次| 久久久亚洲精品视频| 欧美另类老肥妇| 久久精品一偷一偷国产| 成人黄色在线电影| 久久久午夜视频| 免费v片在线观看| 国产suv精品一区二区三区88区| 91精品久久久| 国产+人+亚洲| 偷拍中文亚洲欧美动漫| 国产狼人综合免费视频| 欧美不卡在线观看| 国产欧美综合精品一区二区| 欧美**vk| 欧美xxxx吸乳| 夜夜爽av福利精品导航| 中文字幕在线观看第三页| 亚洲毛片视频| 欧美精品一区二区三区免费播放| 在线精品亚洲| 别急慢慢来1978如如2| 国内成人自拍视频| 国产麻豆天美果冻无码视频| 国产精品无码永久免费888| 国产色视频一区二区三区qq号| 日本一区二区三区在线不卡| 黄色片子在线观看| 欧美色欧美亚洲高清在线视频| 中文字幕欧美在线观看| 欧美不卡一区二区三区四区| 99草在线视频| 日韩精品在线视频观看| 日本中文字幕伦在线观看| 一区国产精品视频| 手机在线免费看av| 国产精品精品国产| 亚洲成人va| 国产精品色婷婷视频| 亚洲精品v亚洲精品v日韩精品| 久久久久高清| 亚洲乱码免费伦视频| 先锋影音亚洲资源| 99成人在线| 日韩av影视大全| 久久精品一二三| 久久精品人妻一区二区三区| 欧美三级韩国三级日本三斤| 好吊视频一二三区| 日韩中文视频免费在线观看| 色黄视频在线观看| 丁香五月网久久综合| 日韩精品一区二区三区免费观影 | 国产在线精品一区二区不卡了| 亚洲黄色小视频在线观看| 国产91丝袜在线观看| 99热99这里只有精品| 91成人免费网站| 亚洲日本香蕉视频| 久久久久成人网| 女厕盗摄一区二区三区| 91丨九色丨国产在线| 日本不卡二三区| 欧美日韩第二页| 奇米在线7777在线精品| 中文字幕av观看| 亚洲妇熟xx妇色黄| 亚洲免费成人在线| 久久综合五月天| gogo大尺度成人免费视频| 日韩三级电影| 欧美激情第8页| 国产乱女淫av麻豆国产| 欧美国产日韩一二三区| a片在线免费观看| 中文字幕亚洲欧美日韩2019| 香蕉久久aⅴ一区二区三区| 国产专区欧美专区| 99久久九九| 轻点好疼好大好爽视频| 黄页视频在线91| 亚洲不卡在线播放| 欧美一级精品大片| 亚洲色图欧美视频| 高清欧美性猛交xxxx黑人猛交| 亚洲欧美日本国产| 欧美无砖专区免费| 日本欧美一区二区| 无码人妻丰满熟妇啪啪欧美| 在线亚洲高清视频| 日本少妇xxx| 亚洲国产精品久久久久蝴蝶传媒| 国产乱子夫妻xx黑人xyx真爽| 91丨porny丨在线| 中文字幕免费在线观看视频| 日本道在线观看一区二区| 99热这里精品| 九九久久国产精品| 91蝌蚪精品视频| 香港三级韩国三级日本三级| 久久久久久久久久久久久夜| 国产精品乱码一区二区视频| 国产亚洲一区二区精品| 欧美jizz18| japanese在线播放| av一二三不卡影片| 成人免费视频国产免费| 久久色在线播放| 91在线一区| 日本xxxxxxx免费视频| 国产精品乱码一区二区三区软件 | 午夜激情电影在线播放| 国产欧美精品日韩精品| 99久久国产综合精品成人影院| 天堂网成人在线| 婷婷夜色潮精品综合在线| 免费一级在线观看| 成人网在线免费看| 成人看的羞羞网站| 亚洲免费成人在线视频| 亚洲图片欧美综合| 男人av在线| 92看片淫黄大片看国产片| 日韩午夜av| 国产喷水在线观看| 精品无人国产偷自产在线| 久久亚洲国产精品尤物| 免费视频爱爱太爽了| 国产欧美综合在线| 亚洲第一第二区| 欧美精品亚州精品| 欧美一级做一级爱a做片性| 日本a级片在线播放| 精品一区二区免费| 91精品国自产在线| 日韩欧美123| 欧美va在线观看| 无码粉嫩虎白一线天在线观看| 国产日韩av一区| 亚洲国产精彩视频| 国产日韩欧美中文| 免费亚洲婷婷| 久久久久久国产精品视频|