精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦

發布于 2024-5-24 13:01
瀏覽
0收藏

在 AI 領域,擴展定律(Scaling laws)是理解 LM 擴展趨勢的強大工具,其為廣大研究者提供了一個準則,該定律在理解語言模型的性能如何隨規模變化提供了一個重要指導。


但不幸的是,擴展分析在許多基準測試和后訓練研究中并不常見,因為大多數研究人員沒有計算資源來從頭開始構建擴展法則,并且開放模型的訓練尺度太少,無法進行可靠的擴展預測。


來自斯坦福大學、多倫多大學等機構的研究者提出了一種替代觀察法:可觀察的擴展定律(Observational Scaling Laws),其將語言模型 (LM) 的功能與跨多個模型系列的下游性能聯系起來,而不是像標準計算擴展規律那樣僅在單個系列內。


該方法繞過了模型訓練,而是從基于大約 80 個公開可用的模型上建立擴展定律。但這又引出了另一個問題,從多個模型族構建單一擴展定律面臨巨大的挑戰,原因在于不同模型之間的訓練計算效率和能力存在很大差異。


盡管如此,該研究表明,這些變化與一個簡單的、廣義的擴展定律是一致的,在這個定律中,語言模型性能是低維能力空間(low-dimensional capability space)的函數,而整個模型系列僅在將訓練計算轉換為能力的效率上有所不同。


使用上述方法,該研究展示了許多其他類型的擴展研究具有驚人的可預測性,他們發現:一些涌現現象遵循平滑的 sigmoidal 行為,并且可以從小模型中預測;像 GPT-4 這樣的智能體性能可以從更簡單的非智能體基準中精確預測。此外,該研究還展示了如何預測后訓練干預措施(如思維鏈)對模型的影響。 


研究表明,即使僅使用小型 sub-GPT-3 模型進行擬合,可觀察的擴展定律也能準確預測復雜現象,例如涌現能力、智能體性能和后訓練方法的擴展(例如思維鏈)。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


  • 論文地址:https://arxiv.org/pdf/2405.10938
  • 論文標題:Observational Scaling Laws and the Predictability of Language Model Performance


論文作者共有三位,其中 Yangjun Ruan 為華人作者 ,他本科畢業于浙江大學。


這篇論文也得到了思維鏈提出者 Jason Wei 的轉發評論,Jason Wei 表示,他非常喜歡這項研究。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


論文介紹


該研究觀察到目前存在數百個開放模型,這些模型擁有不同的規模和能力。不過研究者不能直接使用這些模型來計算擴展定律(因為模型族之間的訓練計算效率差異很大),但研究者希望存在一個適用于模型族的更通用的擴展定律。


特別是,本文假設 LM 的下游性能是低維能力空間(例如自然語言理解、推理和代碼生成)函數,模型族的變化僅僅在于它們將訓練計算轉換為這些能力的效率。如果這種關系成立,則意味著從低維能力到跨模型族的下游能力存在對數線性關系(這將允許研究者利用現有模型建立擴展定律)(圖 1)。該研究使用近 80 個公開可用的 LM 獲得了低成本、高分辨率的擴展預測 (右)。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


通過對標準的 LM 基準分析(例如,Open LLM Leaderboard ),研究者發現了一些這樣的能力度量, 這些度量在模型家族內部與計算量之間存在擴展定律關系(R^2 > 0.9)(見下圖 3),并且在不同模型家族與下游指標上也存在這種關系。本文將這種擴展關系稱為可觀察的擴展定律。 


最后,該研究表明使用可觀察的擴展定律成本低且簡單,因為有一些系列模型足以復制該研究的許多核心發現。通過這種方法,該研究發現只需評估 10-20 個模型就可以輕松地對基準和后訓練干預進行擴展預測。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


涌現能力


關于 LM 是否在某些計算閾值下具有不連續出現的「涌現」能力,以及這些能力是否可以使用小模型進行預測,一直存在著激烈的爭論。可觀察的擴展定律表明,其中一些現象遵循平滑的 S 形曲線,并且可以使用小型 sub Llama-2 7B 模型進行準確預測。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


智能體能力


該研究表明,正如 AgentBench 和 AgentBoard 所測量的,LM 作為智能體的更高級、更復雜的能力可以使用可觀察的擴展定律來預測。通過可觀察的擴展定律,該研究僅使用較弱的模型(sub GPT-3.5)就能精確預測 GPT-4 的性能,并將編程能力確定為驅動智能體性能的因素。


后訓練方法擴展


該研究表明,即使將擴展定律擬合到較弱的模型(sub Llama-2 7B)上,擴展定律也可以可靠地預測后訓練方法的收益,例如思維鏈(Chain-of-Thought)、自洽性(Self-Consistency)等等。


總的來說,該研究的貢獻是提出可觀察的擴展定律,利用了計算、簡單能力度量和復雜下游指標之間可預測的對數線性關系。


驗證可觀察的擴展定律


研究者通過實驗驗證了這些擴展定律的有用性。此外,在論文發布后,研究者還預注冊了對未來模型的預測,以測試擴展定律是否對當前的模型過擬合。關于實現過程和收集數據的相關代碼已在 GitHub 上放出:


GitHub 地址:https://github.com/ryoungj/ObsScaling


涌現能力的可預測性


下圖 4 展示了使用 PC(principal capability)度量的預測結果,以及基于訓練 FLOPs 來預測性能的基線結果。可以發現,即使僅僅使用性能不佳的模型,也可以使用本文的 PC 度量來準確預測這些能力。


相反,使用訓練 FLOPs 會導致測試集上的外推效果和訓練集上的擬合效果明顯更差,正如更高的 MSE 值所示。這些差異可能是由不同模型系列的訓練 FLOPs 導致的。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


智能體能力可預測性


下圖 5 展示了使用 PC 度量后,可觀察的擴展定律的預測結果。可以發現,在兩個智能體基準上,使用 PC 度量的留出模型(GPT-4 或 Claude-2)的性能可以從更弱性能(10% 以上的差距)的模型中準確地預測出。


這表明 LMs 的更復雜智能體能力與它們的基礎模型能力息息相關,并能夠基于后者進行預測。這也說明了隨著基干 LMs 持續擴展規模,基于 LM 的智能體能力具有良好的擴展特性。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


后訓練技術的影響


下圖 6a 展示了使用可觀察的擴展定律,CoT 和 SC(Self-Consistency,自洽性)的擴展預測結果。可以發現,使用 CoT 和 CoT+SC 但不使用(Naive)后訓練技術的更強、規模更大模型的性能可以從更弱、更小計算規模(比如模型大小和訓練 FLOPs)的模型中準確預測出。


值得注意的是,兩種技術之間的擴展趨勢不同,其中與使用 CoT 的自洽性相比,CoT 表現出更明顯的擴展趨勢。


從80個模型中構建Scaling Law:華人博士生新作,思維鏈提出者力薦-AI.x社區


更多技術細節請參閱原論文。


本文轉自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/D8yx5Ma38TXjV3Yepa1_Sg??

收藏
回復
舉報
回復
相關推薦
亚洲春色h网| 国产盗摄——sm在线视频| 免费成人在线网站| 欧美精品在线视频观看| 国产十八熟妇av成人一区| 中文在线资源| 中文字幕一区二| 成人免费在线看片| 欧美性猛交xxxx乱大交hd| 亚洲国产精品综合久久久| 亚洲精品wwwww| 免费激情视频在线观看| 丝袜国产在线| 亚洲国产精品黑人久久久| 99精品国产高清一区二区| 国产精品男女视频| 中文一区一区三区免费在线观看| 亚洲裸体xxxx| 91porn在线| julia一区二区三区中文字幕| 亚洲一区二区在线免费观看视频| 视频一区二区在线| 国产视频第二页| 爽爽淫人综合网网站| 欧美日韩成人网| 男人天堂资源网| 天海翼亚洲一区二区三区| 日韩无一区二区| 91女神在线观看| 日本美女一区| 精品国产乱码久久久久酒店| 大片在线观看网站免费收看| 91在线直播| 久久久亚洲高清| 亚洲最大成人网色| 亚洲一区二区影视| 日本伊人色综合网| 日韩美女视频免费在线观看| 久久久国产精品黄毛片| 午夜精品视频一区二区三区在线看| 亚洲毛片在线观看| 免费黄色三级网站| 欧美五码在线| 日韩精品影音先锋| 宇都宫紫苑在线播放| 欧美日韩va| 欧美日韩在线免费视频| 精品少妇无遮挡毛片| 范冰冰一级做a爰片久久毛片| 亚洲超碰精品一区二区| www.亚洲视频.com| 日本三级在线观看网站| 亚洲永久精品国产| av动漫在线播放| 日韩免费影院| 亚洲一区二区三区小说| 免费高清一区二区三区| 毛片在线导航| 精品国产乱码久久久久久婷婷 | 91福利入口| 99热这里只有精品3| 国产成人午夜片在线观看高清观看| 亚洲一区二区三区xxx视频| 精品国自产拍在线观看| 丁香婷婷综合激情五月色| 国产欧美欧洲| 免费黄色在线视频网站| 国产精品色在线| 亚洲第一精品区| 性直播体位视频在线观看| 亚洲图片欧美视频| 各处沟厕大尺度偷拍女厕嘘嘘| 成人性生活av| 欧美日韩国产欧美日美国产精品| 国产精品久久久久久久av福利| 欧美成年网站| 亚洲精品videossex少妇| 亚洲成人黄色av| 99精品在线| 久久久在线观看| 午夜婷婷在线观看| 久久精品国产在热久久| 粉嫩av免费一区二区三区| 色视频在线看| 国产精品国产三级国产aⅴ无密码| 久久观看最新视频| 午夜欧美激情| 91精品婷婷国产综合久久| 香港三日本8a三级少妇三级99| 亚洲裸色大胆大尺寸艺术写真| 日韩在线视频导航| 国产亚洲精久久久久久无码77777| 性一交一乱一区二区洋洋av| 国产在线999| 日本xxxxwww| 国产精品美女久久久久久久| 久久久久99精品成人片| 国产91欧美| 亚洲国产欧美一区| 少妇高潮一区二区三区喷水| 亚洲精品护士| 成人在线中文字幕| 涩涩视频在线观看免费| 亚洲男同性恋视频| 韩国一区二区av| 成人三级av在线| 日韩在线观看免费网站| 亚洲AV无码成人精品区东京热| 韩国av一区二区三区| 欧美亚洲另类久久综合| 三级网站视频在在线播放| 欧美午夜精品久久久久久孕妇| 日本性生活一级片| 五月久久久综合一区二区小说| 26uuu久久噜噜噜噜| 精品人妻午夜一区二区三区四区 | 国产黄色小视频网站| 久久久噜噜噜久久狠狠50岁| 99一区二区| 久草资源在线| 欧美天堂亚洲电影院在线播放| 欧美双性人妖o0| 欧美私人啪啪vps| 91久久综合亚洲鲁鲁五月天| wwwxxx在线观看| 一本大道久久a久久精品综合| 中文字幕一区二区三区乱码不卡| 888久久久| 国产欧美一区二区三区久久人妖 | 亚洲精品一二三**| 久久成人亚洲精品| 一区二区视频网| 国产日韩av一区二区| 成人综合视频在线| 久久国产精品免费精品3p| 欧美高清激情视频| 99久久久久久久| 亚洲欧美国产77777| 五月花丁香婷婷| 99久久婷婷| 成人在线播放av| 黄色网址在线免费| 7777女厕盗摄久久久| 男人在线观看视频| 狠狠色丁香九九婷婷综合五月| 在线播放豆国产99亚洲| 国产综合色激情| 中文字幕亚洲一区二区三区五十路 | 欧美午夜黄色| 色综合中文字幕| 中文字幕一区二区人妻在线不卡| 午夜一区不卡| 日韩一区二区三区高清| 欧美大片1688网站| 日韩在线观看网址| a网站在线观看| 一区二区成人在线视频| 妖精视频一区二区| 国产精品一二| 日韩欧美精品久久| 日韩专区视频网站| 欧美大片在线看免费观看| 成人精品在线播放| 午夜精品一区二区三区免费视频| 国产又黄又粗又猛又爽的视频 | 色片在线免费观看| 一区二区电影| 国产精品美女xx| 自拍网站在线观看| 综合欧美国产视频二区| 99久久精品国产一区色| 婷婷国产在线综合| 亚洲欧洲久久久| 精品一区二区三区在线播放| 欧美一级爱爱视频| 亚洲国产精品嫩草影院久久av| 国产不卡视频在线| 国精产品一区| 亚洲精品福利在线| 波多野结衣视频免费观看| 一区二区中文视频| 国产二级一片内射视频播放| 青青国产91久久久久久| 国产亚洲精品久久久久久久| 一区二区三区日本久久久| 国产视频999| a级大胆欧美人体大胆666| 亚洲视频一区二区| 精品欧美在线观看| 91黄色小视频| 久久久久成人片免费观看蜜芽 | 日韩欧美123区| 99国产一区二区三精品乱码| 牛夜精品久久久久久久| 亚洲精品黄色| 一道本在线观看视频| 婷婷综合成人| 99久久99久久精品国产片| 美女写真久久影院| 欧美黑人巨大xxx极品| 成人性爱视频在线观看| 亚洲国产成人久久综合| 一本色道久久综合精品婷婷| 午夜日韩在线电影| 四虎884aa成人精品| 2024国产精品| 国产精品熟妇一区二区三区四区 | 亚洲aⅴ怡春院| 精品少妇一区二区三区密爱| 99视频超级精品| www.午夜av| 日韩—二三区免费观看av| 日韩av新片网| 一区二区蜜桃| 手机福利在线视频| 欧美中文字幕一区二区| 久久艳妇乳肉豪妇荡乳av| 日本少妇精品亚洲第一区| 国产精品久久久久高潮| 制服丝袜专区在线| 国内精品久久久久久久| 99在线播放| 久热精品视频在线观看| 永久免费av在线| 中文字幕国产亚洲| 国产乱子伦三级在线播放| 精品视频在线导航| 午夜视频1000| 亚洲国产毛片完整版| 亚洲经典一区二区三区| 日韩一区二区三区视频| 一卡二卡三卡在线| 欧美色综合影院| 国产精品无码粉嫩小泬| 色综合天天天天做夜夜夜夜做| 国产情侣在线视频| 香蕉成人啪国产精品视频综合网| 精品99在线观看| 一区二区三区波多野结衣在线观看| 色老板免费视频| 亚洲男人都懂的| 欧产日产国产v| 依依成人综合视频| 农村黄色一级片| 樱花影视一区二区| 国产精品19乱码一区二区三区| 亚洲国产中文字幕| 福利一区二区三区四区| 午夜精品123| 久久国产视频一区| 在线观看亚洲精品| 中文字幕人妻一区二区三区视频| 欧美三级韩国三级日本一级| 97av免费视频| 精品久久久久久最新网址| 你懂的网站在线| 日韩av在线网页| 国产乱理伦片a级在线观看| 最近2019免费中文字幕视频三| 日韩黄色影院| 操日韩av在线电影| 91jq激情在线观看| 日本aⅴ大伊香蕉精品视频| 欧美日韩在线精品一区二区三区激情综合 | 国产美女精品在线| 日本国产在线视频| 99精品热视频| 中文字幕第二区| 亚洲欧美乱综合| 在线看成人av| 欧美专区在线观看一区| 国产按摩一区二区三区| 亚洲精品狠狠操| 国产区视频在线| 久久av.com| 男女羞羞在线观看| 国产日韩av高清| 国产劲爆久久| 日韩av一区二区三区在线| 91精品国产福利在线观看麻豆| 又大又硬又爽免费视频| 日韩精品亚洲专区| 亚洲欧洲日韩综合| 久久久精品免费观看| 裸体武打性艳史| 富二代精品短视频| 国产又粗又猛又爽又黄的视频一| 亚洲电影免费观看高清完整版在线观看 | 亚洲mmav| 成人在线看片| 成人免费在线播放| 久久综合久久网| 蜜乳av一区二区三区| 中文字幕乱视频| 中文字幕一区二区三中文字幕| 亚洲综合小说| 久久99精品久久久久久青青91| av白虎一区| 国产精品亚洲美女av网站| 视频一区视频二区欧美| 欧洲一区二区日韩在线视频观看免费 | 日韩中文字幕一区| 欧美日韩伊人| 最近中文字幕一区二区| 成人高清在线视频| 一级免费黄色录像| 天天综合色天天综合色h| 国产一区二区视频免费观看| 亚洲精品乱码久久久久久金桔影视| 日本电影在线观看网站| 日本久久久久久久久久久| 中文无码日韩欧| 中文字幕日韩一区二区三区| 校园春色综合网| www.四虎精品| 亚洲视频在线一区二区| 天天干天天插天天射| 日韩av在线看| 国产白丝在线观看| 91视频99| 中文一区一区三区免费在线观看| 999精彩视频| 国产亚洲欧洲一区高清在线观看| 日韩精品久久久久久久酒店| 日韩免费一区二区三区在线播放| 日本暖暖在线视频| 国产精品久久久久久久午夜| 亚洲精品合集| 日本日本19xxxⅹhd乱影响| 懂色av噜噜一区二区三区av| 国产精品白丝喷水在线观看| 欧美午夜电影一区| 高清美女视频一区| 国产精品吊钟奶在线| 伊人久久大香线蕉综合网蜜芽| 五十路熟女丰满大屁股| 国产99精品国产| 久久久香蕉视频| 日韩精品一区在线观看| 日韩成人伦理| 俄罗斯精品一区二区三区| 欧美日韩国产精品一区二区亚洲| 亚洲高清av一区二区三区| 亚洲免费av网站| www男人的天堂| 欧美精品18videos性欧美| 国产乱论精品| 131美女爱做视频| 91麻豆精品在线观看| 日韩精品在线免费视频| 国产午夜精品久久久| 亚洲成av在线| 亚洲综合av一区| 国产一区在线观看视频| 精品99久久久久成人网站免费| 精品99999| 综合日韩av| 亚洲欧美成人一区| 国产一区二区三区综合| 久久免费少妇高潮99精品| 亚洲福利视频网| 成人免费无遮挡| 亚洲不卡1区| 免费成人美女在线观看| 男人在线观看视频| 精品国产成人在线影院| 亚洲美女尤物影院| 一区二区三区不卡在线| 国产成人午夜视频| 久久久免费高清视频| 日韩中文字幕不卡视频| 国产一区二区av在线| 国产一二三在线视频| 久久久久久久久一| 亚洲资源在线播放| 久久久久亚洲精品成人网小说| 亚洲区小说区| 亚洲午夜精品一区| 婷婷开心激情综合| 一本一道波多野毛片中文在线 | 欧美亚洲在线观看| 日韩一区二区在线| 亚洲乱妇老熟女爽到高潮的片| 欧美日韩国产精品| 永久免费在线观看视频| 国产区一区二区三区| 日韩高清一区二区| 妺妺窝人体色www在线下载| 亚洲欧美日韩视频一区| 国产成人视屏| 中文字幕乱码人妻综合二区三区| 亚洲蜜臀av乱码久久精品| 欧洲亚洲在线| av免费精品一区二区三区| 久久综合图片| 久久久精品99| 精品国产一区久久久| 丝袜久久网站| 欧美高清精品一区二区| 色婷婷精品久久二区二区蜜臂av |