精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

智能體的「一方有難八方支援」,一種分布式AI計算新范式誕生了

人工智能 新聞
在今天介紹的這篇論文中,來自 Salesforce Research 的研究者認為,隨著任務復雜度的增加,特別是在開放域環(huán)境中,協(xié)調(diào)多個 agent 來完成一項任務會更好。

最近大型語言模型(LLM)的成功促使越來越多的人探索通過它解決各種復雜的任務,其中 LLM 增強的自主 agent(LAA)尤為引人矚目。LLA 將 LLM 的智能擴展到了順序動作執(zhí)行中,在通過收集觀察結(jié)果與環(huán)境交互并解決復雜任務方面展現(xiàn)出了優(yōu)越性能。這類代表性工作有 BabyAGI、AutoGPT3、ReAct、Langchain 等。

但這些探索可能還不夠,主要在以下三個方面存在局限:

首先,最優(yōu) agent 架構(gòu)尚未確定。以 ReAct 為例,它向 agent 提示預定義的樣本,LLM 學會通過上下文學習生成下一步動作。此外,ReAct 認為一個 agent 在動作執(zhí)行之前應有中間推理步驟。

其次,現(xiàn)有 LAA 中 LLM 能否發(fā)揮多大功效,目前并沒有全面的了解。現(xiàn)在的初步工作只比較了一些 LLM 骨干的性能,比如 ReAct 將 PaLM 作為骨干 LLM,ReWOO 則將 OpenAI 的 text-davinci-003 模型作為 agent 規(guī)劃的指令調(diào)優(yōu) Alpaca 模型。同時目前很少有工作全面比較使用不同預訓練 LLM 的 LAA 性能。最近雖有一些工作發(fā)布了評估 LLM 作為 agent 的基準,但未能共同考慮 agent 架構(gòu)和它們的 LLM 骨干。

最后,越來越復雜的任務可能需要多個 agent 共同發(fā)揮作用。比如 ReWOO 最近發(fā)現(xiàn)將推理從觀察中解耦出來可以提升 LAA 的效率。

在今天介紹的這篇論文中,來自 Salesforce Research 的研究者認為,隨著任務復雜度的增加,特別是在開放域環(huán)境中,協(xié)調(diào)多個 agent 來完成一項任務會更好。舉例而言, 對于網(wǎng)頁導航任務,我們可以使用一個點擊 agent 來與點擊按鈕進行交互,并請求另一個搜索智能體來檢索其他資源。

圖片

論文鏈接:https://arxiv.org/pdf/2308.05960.pdf

研究者建議全面比較 LAA 的性能,并深入探索了 LAA 的 agent 架構(gòu)和 LLM 骨干。具體地講,他們基于現(xiàn)有環(huán)境構(gòu)建了 agent 基準,從而評估建構(gòu)在不同 LLM 骨干之上的不同 agent 架構(gòu)的性能。該 agent 基準中的任務還劃分了不同的復雜程度,使得 agent 性能與任務復雜度的關(guān)聯(lián)分析成為可能。

此外,這些 agent 架構(gòu)在設(shè)計上旨在廣泛驗證現(xiàn)有的設(shè)計選擇。關(guān)于多個 LAA 的編排,研究者提出了一種新穎的架構(gòu) BOLAA,它在多個協(xié)作 agent 之上有一個控制器模塊,用于多個分工 LAA 的選擇和通信。

本文的貢獻主要體現(xiàn)在以下幾個方面:

  • 開發(fā)了 6 種不同的 LAA agent 架構(gòu),并將這些架構(gòu)與不同骨干 LLM 結(jié)合,從而在提示、自我思考和規(guī)劃中驗證 LAA 的設(shè)計直覺。同時開發(fā)了用于編排多 agent 策略的架構(gòu) BOLAA,增加了單體 agent 的動作交互能力;
  • 在決策制定網(wǎng)頁導航環(huán)境和知識推理任務環(huán)境中進行廣泛實驗,報告了最終稀疏獎勵和中間召回方面的性能,這為 LAA 及其兼容的 LLM 的最優(yōu)選擇提供了定性指示;
  • 結(jié)果顯示,與其他 LAA 架構(gòu)相比,BOLAA 在 WebShop 環(huán)境中始終取得了最佳性能。這些表明了在解決復雜任務時多個專業(yè) agent 的協(xié)作至關(guān)重要,可以說應該與訓練具有強泛化能力的大型 LLM 同等重要。

愛丁堡大學博士生符堯認為,這項工作揭示了一種新的分布式計算范式:分布式 AI 計算。在傳統(tǒng)分布式計算中,每個節(jié)點處理部分任務;同樣在分布式 AI 計算中,一個 agent 就變成了處理部分任務的節(jié)點。

圖片

Agent 架構(gòu)

在這部分,研究者比較了不同的 LAA 架構(gòu)。他們首先展示了如何基于現(xiàn)有工作的直覺來設(shè)計不同的單體 LAA,然后展示了多個 LAA 的編碼設(shè)計,即 BOLAA。

每種類型的 LAA 都能夠通過自己的交互策略與環(huán)境交互。常見的 agent 類型包括:

  • Zeroshot LAA
  • ZeroshotThink LAA
  • ReAct LAA
  • PlanAct LAA
  • PlanReAct LAA

圖片

圖片

BOLAA:協(xié)調(diào)多個 agent

盡管現(xiàn)有的 LLM 在完成各種語言理解任務方面取得了成功,但仍有許多問題尚未得到充分探討,如上下文長度限制、上下文內(nèi)學習和泛化能力等。因此,采用單體 LAA 來完成所有任務具有挑戰(zhàn)性,尤其是在任務復雜度較高的情況下。研究者因此提出了一種新的 agent 架構(gòu),用于協(xié)調(diào)多個 LAA。

圖片

如圖 3 所示,BOLAA 有兩個主要模塊,即分工 agent 池和控制器。

分工 agent 池管理多個 LAA,每個 LAA 可能只專注于生成一種類型的執(zhí)行。例如在網(wǎng)絡(luò)導航環(huán)境中,可以建立點擊 LAA 和搜索 LAA。這樣,前者只生成下一個點擊按鈕,而后者只輸出搜索查詢,從而將復雜的任務劃分為可行的任務。控制器的設(shè)計目的是從 agent 池中有選擇地調(diào)用 LAA。

控制器有一個 agent 選擇層,用于選擇最相關(guān)的 LAA 進行調(diào)用。然后,控制器為選定的 LAA 構(gòu)建信息并建立通信。從分工 LAA 獲得響應后,控制器將其解析為可執(zhí)行的操作,然后與環(huán)境交互。

請注意,也可以將這些分工 LAA 設(shè)計為思考 / 計劃 agent。這樣,自我思考和規(guī)劃工作流也會被保留下來。

實驗結(jié)果

研究者從兩個環(huán)境中構(gòu)建了評估基準,WebShop 和 HotPotQA 以及維基百科 API 的用例。

關(guān)于評估指標,研究者使用每個環(huán)境中的獎勵得分來評估 LAA 性能。在 WebShop 環(huán)境中,獎勵被定義為購買商品與 ground-truth 商品之間的屬性重疊率。在 HotPotQA 環(huán)境中,獎勵被定義為 agent 答案與 ground-truth 答案之間的 F1 分數(shù)分級。

此外,研究者為 WebShop 環(huán)境開發(fā)了召回性能,如果在一個任務會話中檢索到 ground-truth 項目,召回性能定義為 1;如果沒有檢索到地面實況項目,召回性能定義為 0。召回率以 WebShop 環(huán)境中所有任務的平均召回分數(shù)來報告。

決策模擬

研究者比較了 WebShop 環(huán)境中 LAA 的決策性能。下表 1 列出了平均獎勵方面的表現(xiàn)。Agent 提示是根據(jù)不同 LLM 模型的最大上下文長度構(gòu)建的。關(guān)于 BOLAA,研究者設(shè)計了一個搜索 LAA 和一個點擊 LAA,分別生成搜索查詢和點擊元素。觀察結(jié)果如下:

圖片

圖片

  • 與其他 LAA 架構(gòu)相比,BOLAA 的性能最佳,尤其是在高性能 LLM 上構(gòu)建時。
  • 將 LLM 與最佳 LAA 架構(gòu)配對至關(guān)重要。
  • 強大的 LLM 能夠在 Zeroshot LAA arch 下進行泛化。
  • 當 Agent 基于開源 LLM 構(gòu)建時,規(guī)劃流通常可以提高性能。

知識推理模擬

隨后,研究者在 HotPotQA 環(huán)境中進行了基準測試,以評估 LAA 的多步驟推理能力。由于在該環(huán)境中,可用的搜索、查找和完成運算都與知識推理有關(guān),很難分開,因此他們將 BOLAA arch 留待此后工作中使用,只比較其他 agent arch 的性能。結(jié)果如下表 3 所示:

圖片

總體來說,ReAct agent 引擎的性能最好,這可以從幾個方面來解釋。

首先,少樣本提示對于 LAA 的行為生成和推理能力是必要的,尤其是在使用較小規(guī)模語言模型進行實驗時。其次,通過比較 ReAct、PlanAct 和 PlanReAct,可以得出結(jié)論:LAA 的規(guī)劃流阻礙了其在知識推理環(huán)境和任務中的表現(xiàn)。原因在于,知識推理任務需要上下文信息來進行推理,而規(guī)劃流是在交互之前執(zhí)行的。因此,這些生成的規(guī)劃往往會導致 LAA 產(chǎn)生更多幻覺。第三,在知識推理任務中,模型大小比上下文長度更重要。大型模型的推理能力更強,因此表現(xiàn)更好。

此外,OpenAI gpt-3.5 模型的卓越推理能力再次得到驗證。研究者還觀察到 Llama2-70b 在所有開源 LLM 中表現(xiàn)最佳,這表明 Llama-2 模型未來可能會進行微調(diào)。

在比較了 LAA 和 LLM 的總體性能之后,研究者對它們在任務復雜度方面的性能進行了更詳細的研究,結(jié)果如下圖所示:

圖片

圖片

更多研究細節(jié),可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2011-11-08 09:44:48

云計算電子郵件數(shù)據(jù)中心

2010-04-22 23:18:59

負載均衡方案

2010-05-13 09:56:58

統(tǒng)一通信領(lǐng)域

2011-05-05 10:43:35

W1100W12001080p

2024-05-13 08:02:10

PostgreSQLRedisson監(jiān)控

2017-12-05 14:55:56

2019-08-27 07:40:47

2024-09-27 08:00:00

2020-05-08 10:20:35

人工智能神經(jīng)網(wǎng)絡(luò)技術(shù)

2021-05-17 09:32:18

分布式存儲問題數(shù)據(jù)

2024-03-08 15:38:40

2023-05-25 11:13:03

CIOIT價值

2013-07-22 10:28:00

大數(shù)據(jù)谷歌亞馬遜

2023-09-01 11:41:48

人工智能機器學習

2024-02-19 14:58:34

編程范式開發(fā)

2024-01-24 09:14:27

編程范式數(shù)據(jù)

2014-06-18 10:40:51

2015-12-08 16:21:15

寶利明威企業(yè)移動管理

2018-08-10 09:00:47

全閃存陣列存儲

2022-05-06 15:56:01

開源物聯(lián)網(wǎng)邊緣計算
點贊
收藏

51CTO技術(shù)棧公眾號

久久夜色精品国产噜噜亚洲av| 亚洲一区二区三区三州| 日韩大胆人体| 久久超碰97中文字幕| 欧美成年人视频网站欧美| 无码人妻精品一区二区三| 97成人资源| 亚洲女子a中天字幕| 国产亚洲福利社区| 一级二级三级视频| 亚洲国产高清一区二区三区| 亚洲日本成人网| 午夜免费一级片| 中文字幕一区久| 自拍偷拍亚洲欧美日韩| 蜜桃日韩视频| www.香蕉视频| 蜜桃在线一区二区三区| 午夜精品久久久久久久男人的天堂| 国产aⅴ激情无码久久久无码| 国产视频一区二区在线播放| 欧美性猛交xxxx富婆弯腰| 国产麻豆电影在线观看| 麻豆国产在线播放| 成人高清视频免费观看| 91精品久久久久久久久久| 日韩不卡在线播放| 国模大胆一区二区三区| 久久精品中文字幕免费mv| 亚洲专区区免费| 国语一区二区三区| 日韩一级大片在线| 亚洲免费黄色录像| 亚洲成人短视频| 精品国产精品自拍| 国产亚洲精品久久久久久久| 无遮挡动作视频在线观看免费入口| www.爱久久.com| dy888夜精品国产专区| 一区二区www| 日韩精品视频网站| 97在线免费观看视频| 青青草原在线免费观看视频| 国产99亚洲| 国产丝袜一区二区三区| 中文字幕人妻一区二区三区| 精品视频在线播放一区二区三区| 欧美三级韩国三级日本一级| 熟妇人妻va精品中文字幕| 蜜桃av在线| 精品久久久久久| 欧美精品久久久久久久自慰| 黄污视频在线观看| 一级日本不卡的影视| 69精品丰满人妻无码视频a片| 麻豆视频在线免费观看| 中文字幕五月欧美| 国产奶头好大揉着好爽视频| 成人午夜在线影视| 亚洲最大色网站| 福利视频免费在线观看| 国产精品186在线观看在线播放| 亚洲综合视频在线| 青青草精品视频在线| 69av成人| 在线中文字幕一区二区| 色婷婷狠狠18| 中文字幕日本一区| 日韩欧美国产成人一区二区| 亚洲国产精品第一页| 九色丨蝌蚪丨成人| 亚洲偷熟乱区亚洲香蕉av| 青娱乐国产视频| 99久久综合| 久久成人18免费网站| 久久精品国产亚洲av香蕉| 亚洲久久一区二区| 国产精品激情av在线播放| 91精品人妻一区二区三区果冻| 久久精品二区亚洲w码| 亚洲xxxx18| 色婷婷在线视频| 欧美激情综合五月色丁香小说| 在线免费观看成人| brazzers在线观看| 91国产免费观看| 波多野结衣免费观看| 福利片一区二区| 亚洲精选一区二区| 男人晚上看的视频| 尤物精品在线| 国产精品久久久av久久久| 99热这里只有精品3| 99久久久免费精品国产一区二区| 日韩aⅴ视频一区二区三区| 九色porny丨首页在线| 五月激情综合婷婷| 亚洲va综合va国产va中文| 999国产精品一区| 亚洲视屏在线播放| 免费在线观看黄视频| 日韩中文字幕不卡| av成人午夜| 国产综合在线观看| 亚洲第一搞黄网站| 国产精品区在线| 日韩成人av在线资源| 日韩亚洲欧美中文高清在线| 97人人澡人人爽人人模亚洲| 久久av资源网| 日韩国产精品一区二区| 欧美xxxxhdvideosex| 欧美日韩亚洲综合一区| 中文字幕一区三区久久女搜查官| 999国产精品视频| 97超视频免费观看| www精品国产| 国产精品无遮挡| 逼特逼视频在线| 亚洲一区二区免费在线观看| 色哟哟入口国产精品| 波多野结衣国产| 国产suv精品一区二区6| 一区二区精品国产| 欧美极品影院| 精品视频在线导航| 精品无码久久久久| 国产一区二区三区精品视频| 午夜精品短视频| 亚洲成a人片| 亚洲国产免费av| 精品无码久久久久| 国产成人亚洲精品狼色在线| 在线播放豆国产99亚洲| 日韩一级二级| 亚洲午夜精品久久久久久性色 | 日本五码在线| 亚洲一区二区高清| 亚洲精品无码久久久久久久| 外国成人免费视频| 成人黄色在线观看| 欧美成人xxx| 欧美三级欧美一级| 黄色av片三级三级三级免费看| 石原莉奈在线亚洲二区| 欧美成人在线免费观看| 黑人精品一区| 亚洲精品自拍视频| 免费的毛片视频| 久久无码av三级| chinese少妇国语对白| 国产精品午夜一区二区三区| 奇米影视亚洲狠狠色| 欧美日韩在线精品一区二区三区激情综 | 亚洲激情视频在线| 中文字幕一区二区三区手机版| 国产成人8x视频一区二区| 国产91沈先生在线播放| 超碰在线成人| 2019av中文字幕| 黄色av网站在线看| 欧美日韩视频在线第一区| 婷婷丁香综合网| 国内精品国产三级国产a久久| 大桥未久一区二区| 亚洲一区网址| 97视频在线播放| 黄色片免费在线| 欧美精品v日韩精品v韩国精品v| 精品国产国产综合精品| 国产福利一区二区三区视频在线| 成年人网站国产| 亚洲高清极品| 国产精品视频免费观看www| 黄色免费在线观看网站| 精品国产sm最大网站免费看| 成年人午夜视频| 国产蜜臀av在线一区二区三区| 不卡中文字幕在线观看| 韩国亚洲精品| 欧美在线一二三区| 国产精品久一| 51精品国产黑色丝袜高跟鞋 | 日本一区二区三区四区在线视频| 五月天激情播播| 亚洲高清电影| 水蜜桃一区二区| 亚洲专区**| 国产精品久久999| 欧美videossex| 国产一区二区三区在线视频| a级片在线播放| 色国产精品一区在线观看| 欧美h片在线观看| 91色在线porny| 免费黄频在线观看| 亚洲一区二区三区免费在线观看| 亚洲蜜桃av| 欧美jizz19性欧美| 国产有码一区二区| 天天综合av| 欧美疯狂做受xxxx高潮| 搞黄视频在线观看| 精品日韩欧美一区二区| 少妇一级淫片日本| 午夜精品一区在线观看| 国精品人伦一区二区三区蜜桃| 99久精品国产| 日韩高清在线一区二区| 久久精品亚洲一区二区| 久久亚洲国产成人精品无码区| 欧美日韩精品在线一区| 国产九色精品| 精品久久久久久久久久岛国gif| 国产精品爱啪在线线免费观看| 99色在线观看| 欧美精品在线免费| 欧美天天影院| 一个人www欧美| 日韩有码电影| 欧美精品一区二区不卡 | 国产麻豆一区| 欧洲成人免费aa| 黑人精品视频| 欧美成人午夜免费视在线看片| 亚洲天天影视| 国产亚洲欧美日韩精品| 你懂的在线视频| 日韩精品久久久久 | 在线观看国产成人av片| 香蕉av在线播放| 精品久久久久久综合日本欧美| 一本色道久久综合精品婷婷| 欧美少妇性性性| 在线观看亚洲黄色| 日本韩国欧美国产| 亚洲中文一区二区| 色婷婷精品久久二区二区蜜臂av | 九九视频免费观看| 亚洲图片你懂的| 天天色天天综合| 一区精品在线播放| 欧美爱爱免费视频| 中文字幕一区av| 日韩av手机在线免费观看| 综合久久久久综合| www.xx日本| 亚洲丝袜另类动漫二区| 日本福利片在线观看| 亚洲另类在线一区| 欧美日韩亚洲国产另类| 亚洲一区国产视频| 日本少妇吞精囗交| 精品久久久国产精品999| 在线天堂中文字幕| 色综合网站在线| 最近中文在线观看| 制服丝袜日韩国产| 国产成人麻豆精品午夜在线| 精品国内二区三区| 手机看片一区二区三区| 亚洲嫩模很污视频| av片在线看| 久久精品国产一区| 欧美xxxx免费虐| 欧美亚洲免费电影| 巨胸喷奶水www久久久免费动漫| 国产精品午夜一区二区欲梦| 91成人短视频在线观看| 国产精品视频入口| 九九久久电影| 在线丝袜欧美日韩制服| 午夜视频精品| 欧美色图色综合| 免费在线看成人av| 欧美日韩一区二区区别是什么 | 国产一区二区成人久久免费影院 | 欧美激情在线免费| 一本久久a久久精品vr综合 | 国产精品成人一区二区| 91精品国产一区二区在线观看| 成人免费视频网站入口| 图片婷婷一区| 一区二区冒白浆视频| 亚洲视屏一区| 免费激情视频在线观看| 国产精品99久久久久久有的能看| 国产精品无码一区二区三| 日本一区二区久久| 国产第100页| 欧美亚洲日本一区| 亚洲va久久久噜噜噜无码久久| 日韩高清免费在线| 老司机午夜在线视频| 2019中文字幕免费视频| 国产视频网站一区二区三区| 久久国产精品99久久久久久丝袜| 日产精品一区二区| 国产视频九色蝌蚪| 精品中文字幕一区二区| 黑人巨大精品欧美| 亚洲欧美一区二区三区极速播放| 97免费在线观看视频| 69久久夜色精品国产69蝌蚪网| 日本精品999| 久久久精品2019中文字幕神马| 天堂√中文最新版在线| 不卡一区二区三区视频| 欧美高清视频手机在在线| 99热成人精品热久久66| 国产成人在线电影| 992在线观看| 色婷婷亚洲综合| 人妻视频一区二区三区| 久久国产一区二区三区| 亚洲综合av一区二区三区| 精品久久久久久一区| 国产精品大片| 黄色片免费网址| 中文字幕不卡在线播放| 日韩欧美国产亚洲| 日韩免费高清视频| 免费黄色在线看| 国产精品免费在线免费| 亚洲8888| 免费高清在线观看免费| k8久久久一区二区三区| 国产亚洲精品久久777777| 在线综合视频播放| 欧美激情办公室videoshd| 国产精品久久一区主播| 自拍视频一区| 国产亚洲欧美在线视频| 99国产一区二区三精品乱码| 久久婷婷一区二区| 欧美成人vps| 亚洲男同gay网站| 99re国产| 18成人免费观看视频| 国产成人精品一区二区三区在线观看| 亚洲视频网在线直播| 亚洲一卡二卡在线观看| 色婷婷**av毛片一区| 欧美日韩视频免费看| 亚洲精品一品区二品区三品区| 免费一级片91| 国产成人免费在线观看视频| 欧美日韩国产小视频在线观看| av在线第一页| 成人av电影天堂| 亚洲最新av| 国产人妖在线观看| 亚洲国产精品尤物yw在线观看| 免费av网站观看| 97超碰蝌蚪网人人做人人爽| 香蕉视频一区| 欧美精品性生活| 亚洲特黄一级片| 精品久久久久久亚洲综合网站 | 欧美美女日韩| 天天久久人人| 久久99国产精品尤物| 欧美成人精品欧美一级私黄| 精品美女在线观看| 成人福利av| 亚洲在线播放电影| 粉嫩嫩av羞羞动漫久久久| 日产精品久久久久| 亚洲性视频网址| 日韩美女在线| 欧美a级免费视频| 99久久99久久精品国产片果冻| 国产免费a视频| 伦伦影院午夜日韩欧美限制| 国产精品sss在线观看av| 欧在线一二三四区| 日韩美女啊v在线免费观看| 成人毛片在线精品国产| 欧亚精品在线观看| 一区二区三区午夜视频| 波多野结衣加勒比| 精品视频一区二区三区免费| 羞羞的视频在线看| 欧美三级电影在线播放| 国内一区二区在线| 亚洲精品77777| 色偷偷9999www| 99精品国产一区二区三区2021| 久久黄色免费看| 亚洲最大色网站| 91在线播放网站| 激情欧美一区二区三区中文字幕| 免费成人在线视频观看| 精品久久免费视频| 日韩视频在线免费观看| 日本亚洲不卡| 先锋资源在线视频| 91国内精品野花午夜精品| 岛国毛片av在线| 在线电影看在线一区二区三区|