精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好

發布于 2024-3-27 16:57
瀏覽
0收藏

來自騰訊的研究者們做了一個關于 agent 的scaling property(可拓展性)的工作。發現:通過簡單的采樣投票,大語言模型(LLM)的性能,會隨著實例化agent數量的增加而增強。其第一次在廣泛的場景下驗證了該現象的普遍性,與其他復雜方法的正交性,以及研究了其背后的原因,并提出進一步促成scaling發揮威力的辦法。

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

論文標題:

More Agents Is All You Need

論文地址:

??https://arxiv.org/abs/2402.05120???

代碼地址:

??https://github.com/MoreAgentsIsAllYouNeed/More-Agents-Is-All-You-Need??

本文中,來自騰訊的研究者發現:只需通過一種簡單的采樣投票法,大語言模型的性能就會隨著實例化 agent 的數量的增大而增強,呈現 scaling property(可拓展性),無需復雜的多 LLM agents 協作框架以及prompt工程方法的加持。此外,該方法與現有的復雜方法正交,結合之后,可進一步增強 LLM,其增強程度與任務難度相關。

該論文做了第一個關于 raw agent(指不依賴復雜的prompt工程和協作框架的LLM agent)的 scaling property 的研究,其對各種 LLM 基準進行了全面的實驗,以驗證此發現的普遍性,并研究了可以促進其發生的策略。目前代碼已開源。

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區▲ 多個小模型超過大模型

論文討論了諸多集成 LLM 的相關工作,包括 LLM 自集成、異構 LLM 集成、還有關于多個 LLM Agents 協作框架的工作,并與提出的方法進行了對比,可以看出論文進行了更全面的研究和分析:

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

為了研究大型語言模型的性能如何隨著實例化 agents 數量的增加而提升。論文使用了一種簡單的采樣和投票方法(作者用了 simple (st) 的說法,可見他們認為這個方法也許是最簡單的方法之一)。值得注意的是,此方法可與現有的復雜方法正交結合。它可以被分為兩個階段:

  • 將任務 query 輸入到單個 LLM 或多個 LLM Agents 協作框架中,生成多個輸出;
  • 通過多數投票確定最終結果

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

論文從 Llama2 和 GPT 系列選擇不同規模的語言模型進行評估,任務數據集涵蓋推理和生成等多個領域。實驗結果表明,在所有任務和不同種類、規模的 LLM 上,發現 LLM 的性能隨著實例化 agent 的數量而增加。

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

例如,在 GSM8K 任務上提升了 12% 至 24%,在 MATH 上提升了 6% 至 10%。有趣的是,多個小 LLM 集成可以達到甚至超越較大 LLM 的性能。例如,多個 Llama2-13B 的集成在 GSM8K 上達到了 59% 準確率,超過了單一 Llama2-70B 的 54% 的準確率。

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

進一步地,作者還探索了與其他方法的兼容性。盡管這些方法實現各不相同,但是在與之結合使用時,性能可以進一步提升,并同樣符合實例化 agent 越多,性能增益越強的現象。實驗結果顯示增益范圍從 1% 到 27% 不等,說明這個簡單的方法通過和其他方法正交使用可以進一步增強 LLM 的性能。

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區▲ 基于 LLama13B

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區▲ 基于 LLama70B

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區▲ 基于 GPT-3.5-Turbo

此外,論文還分析了性能提升與問題難度之間的關系。

  • 固有難度:隨著任務固有難度的增加,性能提升(即相對性能增益)也會增加,但當難度達到一定程度后,增益會逐漸減少。這表明在任務過于復雜時,模型的推理能力可能無法跟上,導致性能提升的邊際效應遞減。
  • 步驟數量:隨著解決任務所需的步驟數量增加,性能提升也會增加。這表明在多步驟任務中,通過增加 agent 數量可以幫助模型更好地處理每一步,從而整體提高任務的解決性能。
  • 先驗概率:正確答案的先驗概率越高,性能提升越大。這意味著在正確答案更有可能的情況下,增加 agent 數量更有可能帶來顯著的性能提升。

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

▲ 節點:步驟,虛線:可能的替代步驟。節點的深度:步驟的數量,顏色的強度:固有難度的水平。圖示幫助讀者理解任務的復雜性是如何通過這些維度來衡量的。

基于此,論文提出了兩種優化策略來進一步提升方法的有效性:

  • 逐步采樣和投票(Step-wise Sampling-and-Voting):這種方法將任務分解為多個步驟,并在每個步驟中應用采樣和投票,以減少累積錯誤并提高整體性能。
  • 分層采樣和投票(Hierarchical Sampling-and-Voting):這種方法將低概率任務分解為多個高概率子任務,并分層解決,同時可以使用不同模型來處理不同概率的子任務以降低成本。

數量即力量!騰訊揭秘:Agent數量越多,大語言模型效果越好-AI.x社區

最后,提出了未來的工作方向,包括優化采樣階段以降低成本,并繼續開發相關機制來減輕 LLM 幻覺(hallucinations)的帶來的潛在負面影響,確保這些強大模型的部署既負責任又有益。

本文轉載自讓你更懂AI的 ,作者:PaperWeekly

原文鏈接:??https://mp.weixin.qq.com/s/HCVgn1Lj-jHYpGaXEyMGsA??

收藏
回復
舉報
回復
相關推薦
欧美午夜一区二区| 韩国一区二区三区| 国产视频自拍一区| 日韩精品一区中文字幕| 黄色成年人视频在线观看| 国产超碰在线一区| 国产成人精品久久亚洲高清不卡| 日本免费网站视频| 狠狠一区二区三区| 欧美日韩不卡在线| 黑人糟蹋人妻hd中文字幕| 免费av网站在线观看| 成人蜜臀av电影| 国产精品夜色7777狼人| 日本五十熟hd丰满| 天天做天天爱天天爽综合网| 日韩精品久久久久| 日本高清免费观看| 日本在线中文字幕一区二区三区| 一区二区在线观看免费| 日韩欧美一区二区在线观看| 午夜精品一区二区三| 美女国产一区二区| 国产999在线| 国产在线欧美在线| 91视频综合| 国产欧美中文在线| 69av成人| 国一区二区在线观看| 亚洲欧美精品一区二区| 男人添女人荫蒂国产| 精品亚洲a∨| 一本色道综合亚洲| 你真棒插曲来救救我在线观看| 日韩欧美中文视频| 日本高清中文字幕在线| 2020国产成人综合网| 岛国视频一区免费观看| 国产老女人乱淫免费| 另类专区欧美蜜桃臀第一页| 日本精品视频网站| 女人十八岁毛片| 在线成人黄色| 久久99国产精品久久久久久久久| 婷婷国产成人精品视频| 欧美性感美女一区二区| 国产一区二区三区视频在线观看 | 美女诱惑一区| 欧美亚洲国产精品| 日韩精品在线观看免费| 在线亚洲伦理| 97超级碰碰人国产在线观看| 国产无遮无挡120秒| 极品日韩av| 性色av一区二区三区免费| 久久久久久久久久91| 欧美精品一卡| 久久男人资源视频| 日韩在线观看第一页| 亚洲视频1区| 欧亚精品在线观看| 在线免费观看av网址| 免费观看久久久4p| 亚洲a一级视频| www.好吊色| www.欧美日韩| 久久涩涩网站| 国产日本在线视频| 国产精品色一区二区三区| 日韩精品久久久免费观看| yiren22综合网成人| 成人免费在线播放视频| 狠狠精品干练久久久无码中文字幕| av黄在线观看| 黄色一区二区在线| 日韩中文字幕免费在线| 欧美videos粗暴| 日韩亚洲欧美在线| 成人手机在线免费视频| 国产伦精品一区二区三区千人斩| 中文字幕9999| 麻豆亚洲av成人无码久久精品| 激情一区二区| 国产精品劲爆视频| 精品久久久久久亚洲综合网站| www.久久久久久久久| 神马影院午夜我不卡| 成人video亚洲精品| 亚洲成a人v欧美综合天堂| av动漫免费看| 精品国产伦一区二区三区观看说明| 精品国产乱码久久久久久影片| 国产偷人妻精品一区| 久久大综合网| 91wwwcom在线观看| 中文字幕无码乱码人妻日韩精品| 国产成人午夜视频| 日韩精品大片| h片精品在线观看| 欧美老人xxxx18| 国产伦精品一区二区三区妓女 | 国产成人精品免费| 日韩久久久久久久| 超级碰碰不卡在线视频| 欧美三级在线看| 国产精品一区二区无码对白| 日韩激情免费| 96精品视频在线| 91theporn国产在线观看| 99re成人在线| 国产91在线亚洲| 欧美日韩国产网站| 亚洲精品国产拍免费91在线| 男人av资源站| 日韩影院免费视频| 国产一级精品aaaaa看| 欧美性天天影视| 在线视频一区二区三区| 国产污在线观看| 天天综合一区| 国产欧美韩国高清| 免费动漫网站在线观看| 亚洲韩国一区二区三区| 国产性生活一级片| 欧美黄色录像片| 欧美一性一乱一交一视频| 不卡的日韩av| 亚洲人成小说网站色在线| 天天操天天爱天天爽| 亚欧日韩另类中文欧美| 欧美激情在线狂野欧美精品| 精品国产无码AV| 亚洲特黄一级片| 性刺激的欧美三级视频| 免费精品国产的网站免费观看| 欧美极品少妇xxxxⅹ喷水| 国产毛片毛片毛片毛片毛片| 国产精品久久久久久久岛一牛影视| 欧美aⅴ在线观看| 日韩美女精品| 97av在线视频| 免费国产在线观看| 色老综合老女人久久久| 这里只有久久精品| 久热国产精品| 日韩高清国产精品| 日韩天堂在线| 一区二区导航| 亚洲澳门在线| 欧美成年人在线观看| 一区二区久久精品66国产精品| 国产日韩三级在线| www.xxx亚洲| 精品久久久亚洲| 国产精品视频大全| 欧美成人hd| 午夜在线a亚洲v天堂网2018| 97av在线视频| 欧美日韩视频精品二区| 色婷婷精品大在线视频| 国产精品国产三级国产专业不| 日韩黄色片在线观看| 日韩欧美视频一区二区| 久久日本片精品aaaaa国产| 中文字幕在线亚洲| av手机免费看| 午夜视黄欧洲亚洲| 97超碰在线资源| 麻豆精品视频在线观看视频| 热这里只有精品| av一级亚洲| 欧美一级大片在线观看| 91精品国产综合久久久久久豆腐| 欧美午夜精品免费| 少妇人妻丰满做爰xxx| 成人激情综合网站| 999香蕉视频| 久久中文字幕二区| 国产成人免费观看| 国产一区二区三区影视| 久久国产视频网站| 日韩一区av| 在线不卡中文字幕播放| 国产精品999久久久| 国产亚洲一二三区| 337p日本欧洲亚洲大胆张筱雨| 亚洲欧美日本视频在线观看| 亚洲精品在线视频观看| 最新精品在线| 国产精品美女呻吟| 久久不射影院| 中文在线不卡视频| 人妻精品一区一区三区蜜桃91| 色婷婷综合久久久| 清纯粉嫩极品夜夜嗨av| 久久综合久久鬼色| xxx中文字幕| 久久黄色网页| 女人色极品影院| 成人在线免费视频观看| 国产亚洲一区在线播放| 成人黄色91| 日韩av免费一区| 中文字幕免费高清电视剧网站在线观看| 日韩成人在线网站| 国产成人精品毛片| 日本道精品一区二区三区| 久久机热这里只有精品| 国产精品水嫩水嫩| 菠萝菠萝蜜网站| 国产成人综合自拍| 日本人69视频| 久久免费黄色| av免费观看国产| 亚洲精品国产首次亮相| 先锋影音欧美| 亚洲国产国产| 国产亚洲第一区| 精品视频91| 国产欧美精品一区二区三区介绍| 偷拍自拍在线看| 97免费视频在线播放| 污污网站在线观看| 日韩在线视频二区| 成人高清网站| 一本色道久久88亚洲综合88| 五月婷中文字幕| 欧美精品一区在线观看| www.激情五月| 日韩亚洲欧美一区二区三区| 国产又粗又长视频| 欧美无乱码久久久免费午夜一区| 国产微拍精品一区| 欧美日韩国产丝袜美女| 国产午夜激情视频| 亚洲一二三区在线观看| 久草网在线观看| 亚洲蜜臀av乱码久久精品| 欧美另类videoxo高潮| 国产精品久久久久久妇女6080| 天天躁夜夜躁狠狠是什么心态| 久久综合九色综合久久久精品综合| 成人做爰www看视频软件| 成人一区二区三区| 性色av蜜臀av浪潮av老女人| 大美女一区二区三区| 国产十八熟妇av成人一区| 白白色亚洲国产精品| 一二三不卡视频| www久久精品| 手机av免费看| 国产欧美日韩视频在线观看| 欧美激情亚洲色图| 国产精品欧美一区二区三区| 久草福利资源在线| 一区二区三区四区高清精品免费观看| 欧美黑人性猛交xxx| 亚洲资源中文字幕| 你懂的国产视频| 色噜噜狠狠色综合欧洲selulu| 欧美另类高清videos的特点| 欧美三级三级三级爽爽爽| 国产又爽又黄免费软件| 日韩欧美的一区| 五月婷婷久久久| 亚洲色图美腿丝袜| 麻豆tv在线| 欧美国产日韩视频| 韩国美女久久| 成人免费淫片aa视频免费| 成人涩涩网站| 日本黄网免费一区二区精品| 99热国内精品| 日本人体一区二区| 石原莉奈一区二区三区在线观看| 91制片厂毛片| 国产成人精品免费在线| 伊人网伊人影院| 亚洲欧美色图小说| 色网站在线播放| 欧美日本国产视频| 欧美77777| 这里只有精品视频在线| 黄色的视频在线观看| 日本视频久久久| 精品一区二区三区免费看| 精品国产一区二区三区麻豆小说| 日韩在线高清| 青青草成人免费在线视频| 蜜臀av一区二区| 动漫美女无遮挡免费| 国产精品三级在线观看| 日本少妇吞精囗交| 欧美喷水一区二区| 五月婷婷六月色| 伦理中文字幕亚洲| 日韩免费va| 91精品久久久久久蜜桃| 国产中文精品久高清在线不| 国产爆乳无码一区二区麻豆 | 国产女人18水真多18精品一级做| 国产黄色小视频网站| 色琪琪一区二区三区亚洲区| av一区二区三| 在线亚洲国产精品网| 国产无遮挡裸体视频在线观看| 成人免费淫片视频软件| 国产欧美日韩视频在线| 国产在线日韩在线| 亚洲欧美日韩精品在线| 日本黄视频在线观看| 国产婷婷色综合av蜜臀av| 黄色网页在线免费看| 青草成人免费视频| 一区二区三区视频播放| 亚洲精品国产一区| 久久国产精品毛片| 91丨porny丨对白| 亚洲精品免费在线播放| 中文字幕永久在线视频| ww久久中文字幕| 国产精品久久免费观看| 欧美日韩国产综合新一区| 国产强被迫伦姧在线观看无码| 亚洲人在线视频| 欧产日产国产精品视频 | 又色又爽又黄无遮挡的免费视频| 亚洲成人精品av| 国内精品一区二区三区四区| 我爱我色成人网| 韩国成人av| 亚洲经典在线| 2025中文字幕| 亚洲精品国产精品乱码不99 | av中文资源在线资源免费观看| 亚洲伊人第一页| 自拍偷拍欧美专区| 激情久久综合网| 亚洲精品写真福利| 国产精品欧美激情在线| 色偷偷av一区二区三区| 久久免费资源| 亚洲啪啪av| 老司机一区二区| 美国一级片在线观看| 欧美精品一二三区| 黄色网页在线播放| 91在线观看免费观看| 欧美一区二区三区久久精品| 三日本三级少妇三级99| 一区二区三区在线视频播放| 国产xxxx孕妇| 国外成人免费在线播放| 日韩aaa久久蜜桃av| 久热免费在线观看| 欧美激情综合五月色丁香小说| 中文字幕欧美在线观看| 久久久国产成人精品| 清纯唯美激情亚洲| 日韩视频免费播放| 国产婷婷一区二区| 国产精品久久久久久在线| 欧美剧在线观看| 国产成人澳门| 亚洲五月天综合| 国产精品久久久久久久久搜平片| 99热这里精品| 久久人人看视频| 一道本一区二区三区| 中文字幕第88页| 一区二区三区中文在线观看| 四虎精品一区二区三区| 日韩美女主播视频| 亚洲xxx拳头交| 久久久久麻豆v国产精华液好用吗 在线观看国产免费视频 | 成人免费网站观看| 欧美日韩一区综合| 国产一区二区三区不卡在线观看| 青青草国产在线观看| 精品视频中文字幕| 久久91超碰青草在哪里看| av 日韩 人妻 黑人 综合 无码| av激情综合网| 在线观看中文字幕av| 欧美国产亚洲视频| 国产尤物久久久| 人妻精油按摩bd高清中文字幕| 欧美日韩精品在线播放| 1769在线观看| 国产伦精品一区二区三区免 | 国产在线拍揄自揄视频不卡99| 亚洲先锋成人| 亚洲色图 激情小说| 亚洲国产成人爱av在线播放| 免费高清视频在线一区| 国内精品在线观看视频| 亚洲视频中文字幕| 日本福利午夜视频在线| 99在线视频首页| 美美哒免费高清在线观看视频一区二区|