精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何改進Agents的推理與規(guī)劃?

發(fā)布于 2024-7-26 11:45
瀏覽
0收藏

如果你詢問任何正在使用大型語言模型(LLM)構建智能代理的開發(fā)者,他們很可能會告訴你,智能代理在規(guī)劃和推理方面的不足是影響其可靠性的一個主要問題。

  • 智能代理的規(guī)劃究竟是什么?
  • 目前人們是如何克服這一缺陷的?
  • 我們對智能代理未來規(guī)劃和推理的發(fā)展趨勢有何預測?

接下來的文章將一一解答這些問題。

編輯注:本文經(jīng)翻譯并二次整理自planning-for-agents一文。

規(guī)劃和推理的真正含義是什么?

智能代理的規(guī)劃和推理,指的是它如何思考并決定采取哪些行動,這既包括短期行動也包括長期行動。LLM需要評估所有可用信息,然后決定需要采取哪些步驟,以及當前應該首先執(zhí)行哪一步。

大多數(shù)情況下,開發(fā)者會使用函數(shù)調(diào)用技術來讓LLM選擇要執(zhí)行的行動。這項技術最初由OpenAI在2023年6月引入,隨后在2023年末至2024年初被其他公司采納。通過函數(shù)調(diào)用,開發(fā)者可以為不同的函數(shù)提供JSON格式的模式,并讓LLM生成符合這些模式的對象。

函數(shù)調(diào)用主要用于讓智能代理選擇立即要執(zhí)行的行動。然而,要成功完成一個復雜的任務,通常需要按照順序執(zhí)行一系列行動。對于LLM來說,進行長期規(guī)劃和推理是一項更具挑戰(zhàn)性的任務,原因有二:首先,LLM需要考慮一個長期目標,然后迅速回到需要立即執(zhí)行的短期行動;其次,隨著智能代理執(zhí)行的行動越來越多,這些行動的結果會反饋給LLM,導致上下文窗口擴大,可能會使LLM分心,影響其性能。

和LLM世界中的大多數(shù)事物一樣,很難準確衡量當前模型在規(guī)劃和推理方面的表現(xiàn)。有一些合理的基準測試,比如Berkeley Function Calling Leaderboard,用于評估函數(shù)調(diào)用的能力。我們也進行了一些研究,以評估多步驟應用的效果。但最好的方法是為你的特定問題構建一個評估集,并嘗試自己進行評估。

??根據(jù)經(jīng)驗,我們可以得出一個普遍的結論:規(guī)劃和推理目前還沒有達到現(xiàn)實世界任務所需的水平。

如何改進智能代理的規(guī)劃能力?

改進智能代理規(guī)劃能力的一個簡單方法是確保LLM擁有進行合理規(guī)劃和推理所需的所有必要信息。雖然這聽起來很基礎,但實際上,傳入LLM的提示往往沒有包含足夠的信息。增加一個檢索步驟或澄清提示指令,可以輕松地實現(xiàn)改進。這就是為什么實際查看數(shù)據(jù)并了解LLM實際看到的內(nèi)容至關重要。

接下來,我建議你嘗試改變你的應用程序的認知架構。這里所說的“認知架構”,指的是你的應用程序用于推理的數(shù)據(jù)工程邏輯。你可以考慮兩種類型的認知架構來提高推理能力:通用認知架構和特定領域認知架構。

通用認知架構與特定領域認知架構

通用認知架構試圖以一種通用的方式實現(xiàn)更好的推理,可以應用于任何任務。例如,“計劃和解決”架構,這篇論文提出了一種先制定計劃,然后執(zhí)行計劃中每個步驟的架構。另一個例子是Reflexion架構,這篇論文探討了在智能代理完成任務后增加一個明確的“反思”步驟,以評估任務是否完成得當。

盡管這些想法顯示出了一定的改進,但它們通常對于生產(chǎn)環(huán)境中的智能代理來說過于通用。相反,我們看到智能代理通常采用特定領域的認識架構。這通常體現(xiàn)在特定領域的分類/路由步驟、特定領域的驗證步驟等方面。一些關于規(guī)劃和反思的通用思想可以在這里應用,但它們通常是以特定領域的方式應用的。

以AlphaCodium論文為例,它通過使用所謂的“流程工程”(談論認知架構的另一種方式),實現(xiàn)了最先進的性能。下面是一個他們使用的流程圖。

如何改進Agents的推理與規(guī)劃?-AI.x社區(qū)AlphaCodium流程圖

這個流程非常特定于他們試圖解決的問題。他們告訴智能代理按步驟做什么 - 想出測試,然后想出解決方案,然后迭代更多的測試等。這種認知架構高度特定于領域 - 它不會幫助您寫文章,例如。

為什么特定領域認知架構如此有幫助?

我傾向于從兩個角度來看待這個問題。

首先:你可以將這視為向智能代理傳達它應該做什么的另一種方法。你可以通過提示指令或在代碼中硬編碼特定的轉換來傳達指令。任何一個都是有效的!代碼是極好的傳達你想要發(fā)生的事情的方式。

其次:這本質上是從我們作為工程師的角度,將規(guī)劃責任從LLM中移除。我們基本上是在說:“不用擔心規(guī)劃,LLM,我會為你做的!”當然,我們并沒有從LLM中移除所有的規(guī)劃,因為我們?nèi)匀灰笏谀承┣闆r下進行一些規(guī)劃。

例如,讓我們回顧一下上面的AlphaCodium示例。流程中的步驟基本上是我們?yōu)長LM做的規(guī)劃!我們告訴它首先編寫測試,然后編寫代碼,然后運行測試等。這可能是作者認為編寫軟件的好計劃。如果他們正在計劃如何解決一個問題,這就是他們會怎么做的。而不是在提示中告訴LLM - 它可能會忽略它,不理解它,沒有所有細節(jié) - 他們通過構建特定領域的認識架構來告訴系統(tǒng)要做什么。

??我們看到的幾乎所有高級“智能代理”實際上都有一個非常特定領域和自定義的認知架構。

我們正在使用LangGraph使構建這些自定義認知架構變得更容易。LangGraph的一個主要關注點是可控性。我們設計LangGraph非常低級和高度可控 - 這是因為我們看到這種可控性是100%需要創(chuàng)建可靠的自定義認知架構。

規(guī)劃和推理的未來會是什么樣子?

LLM領域一直在迅速變化和發(fā)展,我們在構建應用程序時,尤其是構建工具時,應該牢記這一點。

我目前的立場是,通用推理將越來越多地被吸收到模型層中。模型將變得越來越智能,無論是通過規(guī)模還是研究突破 - 似乎很愚蠢去反對這一點。模型也會變得更快,更便宜,所以將大量上下文傳遞給它們將變得越來越可行。

然而,我相信無論模型變得多么強大,你總是需要以某種形式向智能代理傳達它應該做什么。因此,我相信提示和自定義架構將一直存在。對于簡單任務,提示可能就足夠了。對于更復雜的任務,您可能希望將它應該如何行為的邏輯放在代碼中。代碼優(yōu)先方法可能更快,更可靠,更易于調(diào)試,并且通常更容易/更符合邏輯地表達。

我最近在播客上與Sequoia的Sonya和Pat討論了這個話題。他們畫了一個很好的圖表,展示了提示、認知架構和模型的角色/重要性可能如何隨時間演變。

如何改進Agents的推理與規(guī)劃?-AI.x社區(qū)圖片

所以,盡管LLM的規(guī)劃和推理肯定會變得更好,我們也堅信,如果您正在構建特定任務的智能代理,那么您將需要構建一個自定義認知架構。

本文轉載自 ??AI小智??,作者: AI小智

收藏
回復
舉報
回復
相關推薦
亚洲人做受高潮| 亚洲欧美综合一区| 99免费在线观看| 在线成人动漫av| 欧美在线综合视频| 国产欧美自拍视频| 亚洲黄色在线免费观看| 亚洲影视在线| 北条麻妃久久精品| 日本五十肥熟交尾| 中文字幕观看在线| 91精品福利| 日韩精品高清在线| 日韩av自拍偷拍| 黑人巨大亚洲一区二区久 | 国产精品视频九色porn| 99久久久精品免费观看国产 | 欧美日韩激情一区| 久久视频这里有精品| 在线a免费看| 成人午夜精品在线| 成人免费大片黄在线播放| 亚洲AV无码国产成人久久| 91久久青草| 欧美性猛交xxxx乱大交| 欧美黑人在线观看| 人人干在线视频| 久久日韩精品一区二区五区| 97人人澡人人爽| 一级特黄aaaaaa大片| 久久婷婷蜜乳一本欲蜜臀| 日本大香伊一区二区三区| 毛片av在线播放| av女优在线| 久久青草欧美一区二区三区| 国产伦理久久久| www.黄色片| 亚洲黄页一区| 久久av.com| 国产精品久久国产精麻豆96堂| 亚洲精品3区| 亚洲精品福利视频| 亚洲少妇一区二区三区| 欧州一区二区三区| 91麻豆精品国产91久久久久| 日本不卡一区二区在线观看| 成人自拍视频网| 成人免费一区二区三区视频 | 91精品人妻一区二区三区四区| 久久久久久一区二区三区四区别墅| 日韩欧美在线免费| 人妻少妇被粗大爽9797pw| 精彩国产在线| 久久影院午夜片一区| 国产美女精品久久久| 成人av手机在线| 国产一区二区三区视频在线播放| 91精品综合视频| 99在线精品视频免费观看软件| 美女视频黄 久久| 国产精品日韩在线| 一区二区三区免费在线视频| 美女视频黄a大片欧美| 国产精品直播网红| 在线观看不卡的av| 激情久久久久久| 欧美极品少妇xxxxx| 久草成人在线视频| 91久久黄色| 国产a级全部精品| 中文字幕一区二区在线视频 | 国产精品极品美女粉嫩高清在线| 波多野结衣视频网址| 日韩高清中文字幕一区| 国产精品中文字幕在线| 99久久国产热无码精品免费| 国产乱对白刺激视频不卡| 99国产视频在线| 亚州精品国产精品乱码不99按摩| 久久久噜噜噜久久中文字幕色伊伊| 日韩一区二区电影在线观看| 日本电影全部在线观看网站视频 | 日本成人在线不卡| caoporn视频在线| 国产精品久久毛片av大全日韩| 制服诱惑一区| 黑人极品ⅴideos精品欧美棵| 国产精品美女久久久久久2018| 色中文字幕在线观看| 日本三级在线观看网站| 色综合天天天天做夜夜夜夜做| 日本va中文字幕| 警花av一区二区三区| 日韩av在线直播| 国产黄a三级三级| 伊人久久大香线蕉综合热线| 国产精品嫩草影院久久久| 国产夫妻在线观看| 久久综合九色综合欧美就去吻 | 欧美另类视频| 日本中文字幕不卡免费| 国产精品嫩草影院精东| www.av亚洲| 中文字幕欧美日韩一区二区三区 | 91日韩欧美| 91国产精品91| 国产一区二区麻豆| 99精品国产91久久久久久| av在线不卡一区| 精品三级久久久久久久电影聊斋| 一区二区三区中文字幕在线观看| 日本精品一区在线观看| 欧美成人一级| 在线观看精品自拍私拍| 日韩伦理在线视频| 国产福利一区在线| 亚洲激情电影在线| 澳门成人av网| 精品第一国产综合精品aⅴ| 波兰性xxxxx极品hd| 久久成人国产| 黑人巨大精品欧美一区二区小视频 | 激情综合一区二区三区| 国产精品999| 好吊色视频一区二区| www.欧美亚洲| 三级在线免费观看| 少妇精品视频在线观看| 亚洲天堂免费视频| 国产在线不卡av| 欧美第十八页| 国产精品久久久久久久久粉嫩av | 四虎永久免费网站| 影音成人av| 亚洲美女www午夜| 在线小视频你懂的| 国产亚洲福利| 国产精品jizz视频| 男同在线观看| 天天综合网天天综合色| 影音先锋资源av| 国产精品分类| 成人在线资源网址| 视频在线观看入口黄最新永久免费国产| 欧美日韩一级二级三级| 男人舔女人下部高潮全视频| 久久综合九色综合欧美狠狠| 快播日韩欧美| 波多野结衣亚洲| 亚洲人成人99网站| 在线免费一区二区| 欧美国产欧美综合| 欧美自拍小视频| 色综合久久网| 国内精品视频久久| 丰满人妻一区二区三区四区53| 亚洲国产精品麻豆| 国产xxxxxxxxx| 亚洲尤物影院| 日本在线视频一区| 欧美激情福利| 麻豆国产精品va在线观看不卡| 国产女18毛片多18精品| 一区二区三区在线视频播放| 年下总裁被打光屁股sp| 日韩视频免费| 日韩影片在线播放| 四虎精品永久免费| 色综合久久中文字幕综合网小说| 成人公开免费视频| 欧美国产97人人爽人人喊| 另类小说色综合| 久久久久久久久久久久久久久久久久久久| 韩剧1988在线观看免费完整版| 天天操天天射天天舔| 色综合 综合色| 99久久久无码国产精品不卡| 国产精品一区二区三区99| 国产av人人夜夜澡人人爽麻豆| 窝窝社区一区二区| 国产精品日韩专区| 香蕉成人app免费看片| 亚洲精品91美女久久久久久久| 麻豆成人免费视频| 1000部国产精品成人观看| 欧美熟妇精品一区二区| 久久亚洲色图| 黄色一级视频播放| 日韩电影在线观看完整免费观看| 国产精品久久久久一区二区| 欧美午夜大胆人体| 亚洲人成在线观看| 99久久免费国产精精品| 欧美日韩一区免费| 男人的天堂久久久| 久久久久久免费| 成年人看片网站| 日本中文字幕一区| 国产a级片网站| 97视频热人人精品免费| 精品乱子伦一区二区三区| 国外成人福利视频| 国产91精品不卡视频| 人妻视频一区二区三区| 欧美亚洲禁片免费| 日本少妇性高潮| 亚洲欧美另类久久久精品2019| 人妻大战黑人白浆狂泄| 懂色av一区二区三区免费看| 亚洲污视频在线观看| 亚洲精品社区| 亚洲区成人777777精品| 国产一区二区欧美| 国产精品久久久久久搜索| 国产在线xxx| 久久久国产精品视频| 国内在线精品| 亚洲精品国产美女| 午夜精品久久久久久久91蜜桃| 欧亚洲嫩模精品一区三区| 久久露脸国语精品国产91| 日韩美女视频一区| 日本一道本视频| 久久综合九色综合欧美亚洲| 欧美双性人妖o0| 国产精品1024| 91亚洲一区二区| 国产在线精品视频| 亚欧激情乱码久久久久久久久| 老司机午夜免费精品视频| 浮妇高潮喷白浆视频| 国产精品第十页| 国产在线无码精品| 亚洲二区三区不卡| 亚洲黄色网址在线观看| 欧美国产美女| 亚洲制服中文| 四季av一区二区三区免费观看| 日本免费高清一区| 精品国产一区二区三区久久久樱花| 国产欧美一区二区三区视频| 456成人影院在线观看| 日本欧美黄网站| 欧美www.| 欧美丰满少妇xxxx| 丝袜在线视频| 欧美精品成人在线| 久色国产在线| 91爱爱小视频k| 成人免费网站视频| 国产精品扒开腿做爽爽爽视频 | 欧美午夜视频| 男人天堂a在线| 国产精品美女久久久| 黄色影院一级片| 久久久久久久欧美精品| 国产一级不卡毛片| 蜜臀av一区二区在线免费观看| 最新天堂中文在线| 国产一区啦啦啦在线观看| 波多野吉衣在线视频| av中文字幕亚洲| 无码h肉动漫在线观看| 国产欧美日韩三级| 少妇高潮在线观看| 亚洲情趣在线观看| 久久免费在线观看视频| 精品国产91久久久久久| 成年人视频免费| 3atv一区二区三区| 丰满人妻妇伦又伦精品国产| 国产午夜精品麻豆| 免费黄色在线观看| 欧美激情精品久久久| 伊人网在线播放| 国产精品视频成人| 影音先锋欧美激情| 日本在线视频不卡| 在线国产一区| 亚洲熟妇av一区二区三区漫画| 免费看日韩精品| 亚洲女则毛耸耸bbw| 2021久久国产精品不只是精品| 久久精品国产亚洲AV成人婷婷| 一区二区三区在线观看欧美| 免费观看成人毛片| 欧美精品精品一区| 国产精品免费无遮挡无码永久视频| 欧美色综合天天久久综合精品| 成人1区2区3区| 一道本无吗dⅴd在线播放一区 | 日本亚洲欧洲色α| 久久99精品久久久野外观看| 欧美不卡福利| 国产一区观看| 手机视频在线观看| 成人av网站免费| 亚洲人与黑人屁股眼交| 狠狠色香婷婷久久亚洲精品| 国产精品一级视频| 精品一区二区三区三区| 成人免费网址| 国产国语videosex另类| 日韩中文字幕在线一区| 午夜久久资源| 国产亚洲亚洲| 国产欧美视频一区| 国产精品久久久久久亚洲毛片| 国产小视频在线免费观看| 8x福利精品第一导航| 国产精品视频二区三区| 国内外成人免费激情在线视频网站 | 狠狠综合久久av一区二区小说| av加勒比在线| 自拍偷拍免费精品| av综合电影网站| 精品久久久久久一区| 欧美日韩专区| 五月六月丁香婷婷| 国产精品剧情在线亚洲| av一级在线观看| 欧美日韩亚洲综合| 丝袜视频国产在线播放| 欧美夫妻性生活视频| 伊人久久一区| 中文有码久久| 麻豆国产一区二区| 美国黑人一级大黄| 欧美午夜电影一区| 你懂的视频在线观看| 97色在线观看免费视频| 国产精品欧美大片| 国产乱子伦精品无码专区| 国产精品996| 国产67194| 欧美一二三四区在线| 国产三区在线观看| 成人久久久久久| 五月激情综合| 日日干日日操日日射| 1024成人网| a天堂在线观看视频| 欧美刺激性大交免费视频| 啊啊啊久久久| 国产精品麻豆免费版| 黑人一区二区三区四区五区| 国产精品探花在线播放| 最新国产の精品合集bt伙计| 这里只有精品6| 久久精品国产96久久久香蕉| 亚洲高清影院| 日韩成人午夜影院| 成人永久看片免费视频天堂| 久久精品这里有| 欧美日韩在线精品一区二区三区激情| 都市激情一区| 成人精品久久久| 国产精品黄色| 久久无码人妻精品一区二区三区 | 亚洲国产精品成人综合 | 在线观看亚洲网站| 欧美一区二区免费| 国产福利在线免费观看| 久久久久久久久一区| 91精品国产麻豆国产在线观看| 福利视频999| 亚洲精品videosex极品| 免费a级片在线观看| 欧美一区二区三区图| 欧美日韩国产免费观看视频| 91免费视频污| 精品久久久国产| www.av在线| 2019亚洲日韩新视频| 精品国产91| 天天操夜夜操很很操| 精品久久久久久中文字幕大豆网 | 中文一区一区三区高中清不卡| 国产精品无码天天爽视频| 欧美精品久久久久久久| 妖精一区二区三区精品视频 | 伊人久久大香线蕉综合影院首页| 日本男女交配视频| 久久婷婷成人综合色| 国产毛片毛片毛片毛片毛片| 8050国产精品久久久久久| 日韩av二区| 在线免费看黄色片| 欧美色图片你懂的| 污污影院在线观看| 日韩精品福利视频| 国产91综合网| 成熟的女同志hd| 亚洲第一偷拍网| 91九色综合| 久久久久久免费看| 中文字幕中文字幕一区| 五月婷婷六月丁香综合| 91久久嫩草影院一区二区| 亚洲欧美成人综合|