精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

教AI Agents學會協作&競爭!首個大模型多智能體框架CAMEL已斬獲3.6k星

人工智能 新聞
AI Agents是當下大模型領域備受關注的話題,用戶可以引入多個扮演不同角色的LLM Agents參與到實際的任務中,Agents之間會進行競爭和協作等多種形式的動態交互,進而產生驚人的群體智能效果。本文介紹了來自KAUST研究團隊的大模型心智交互CAMEL框架(駱駝),CAMEL框架是最早基于ChatGPT的autonomous agents知名項目,目前已被頂級人工智能會議NeurIPS 2

「什么神奇的技巧讓我們變得智能?竅門就是沒有竅門。智慧的力量源于我們巨大的多樣性,而不是任何單一的、完美的原則。」

——人工智能先驅 馬文·明斯基(Marvin Minsky)

目前來看,在機器通向高級智能的道路上,以ChatGPT為代表的大模型(LLMs)應該是必須經過的里程碑之一,它們以聊天對話的人機交互方式在多個領域的復雜任務解決方面取得了非常耀眼的成就。

隨著LLMs的發展,AI Agents(AI智能體)之間的交互框架也逐漸興起,尤其是在一些復雜的專業領域,以角色扮演等模式預置的智能體完全有能力代替人類用戶在任務中扮演的角色,同時,智能體之間通過以協作和競爭形式的動態交互往往能夠帶來意想不到的效果,這就是被OpenAI人工智能專家Andrej Karpathy等人看作是「通向AGI最重要的前沿研究方向」的AI Agents。

該領域發展的時間線如下[2]:

  • 「CAMEL」(駱駝:大模型心智交互框架)- 發布于2023.3.21
  • 「AutoGPT」 - 發布于2023.3.30
  • 「BabyGPT」 - 發布于2023.4.3
  • 「Westworld」 simulation(斯坦福西部世界小鎮) — 發布于2023.4.7

作為最早基于ChatGPT的autonomous agents知名項目,KAUST研究團隊的大模型心智交互CAMEL框架(駱駝)重點探索了一種稱為角色扮演(role-playing)的新型合作代理框架,該框架可以有效緩解智能體對話過程中出現的錯誤現象,從而有效引導智能體完成各種復雜的任務,人類用戶只需要輸入一個初步的想法就可以啟動整個過程。目前,CAMEL已經被國際人工智能頂級會議NeurIPS 2023錄用。

論文鏈接:https://ghli.org/camel.pdf

項目主頁:https://www.camel-ai.org/

AI Agents是當下大模型領域備受關注的話題,用戶可以引入多個扮演不同角色的LLM Agents參與到實際的任務中,Agents之間會進行競爭和協作等多種形式的動態交互,進而產生驚人的群體智能效果。

作者對CAMEL框架設計了靈活的模塊化功能,包括不同代理的實現、各種專業領域的提示示例和AI數據探索框架等,因此CAMEL可以作為一個基礎的Agents后端,支持AI研究者和開發者更加輕松地開發有關于多智能體系統、合作人工智能、博弈論模擬、社會分析、人工智能倫理等方面的應用。

具體的,作者通過涉及兩種角色扮演的合作場景,生成了兩個大型的指令數據集AI Society和AI Code,以及兩個單輪問答數據集AI Math和AI Science,用于探索LLM涌現能力的研究。

CAMEL框架

下圖展示了CAMEL中的role-playing框架,人類用戶需要首先制定一個想要實現的想法或目標,例如:開發一個用于股市場的交易機器人。

這項任務涉及的角色是AI助理智能體(使其扮演Python程序員角色)和AI用戶智能體。

作者首先為CAMEL設置了一個任務細化器(Task Specifier),該細化器會根據輸入的想法來制定一個較為詳細的實現步驟,隨后AI助理智能體(AI Assistant)和AI用戶智能體(AI User)通過聊天的方式來進行協作通信,各自一步步完成指定的任務。

其中協作通信通過系統級的消息傳遞機制來實現,令  為傳遞給AI助理智能體的系統消息, 為傳遞給AI用戶智能體的系統消息。
隨后為AI助理智能體和AI用戶智能體分別實例化為兩個ChatGPT模型  和 ,相應得到AI助理智能體  和AI用戶智能體  。
角色分配完成后,AI助理智能體和AI用戶智能體會按照指令跟隨的方式協作完成任務,令  為時間  時刻獲得的用戶指令消息, 為AI助理智能體給出的解決方案,因而  時刻得到的對話消息集為:

圖片

在下一個時刻  ,AI用戶智能體  會根據歷史對話消息集  ,來生成新的指令  。然后再將新指令消息與歷史對話消息集一起傳遞給AI助理智能體  來生成新一時刻的解決方案:

圖片

CAMEL使用示例

1. 協作角色扮演(cooperate role-playing)

CAMEL內置的協作式role-playing框架可以在人類用戶不具備專業知識的情況下,通過Agents之間的協作方式完成復雜任務,下圖展示了CAMEL開發股市場交易機器人的例子,其中AI助理智能體的扮演的角色是一名Python程序員,而AI用戶智能體扮演的角色為一名股交易員。


圖片

在role-playing框架中,AI智能體都具有特定領域的專業知識,此時我們只需要指定一個原始想法的Prompt,隨后兩個AI智能體就會圍繞著這一想法展開工作,在上圖中,用戶智能體提出交易機器人需要有對股評論的情緒分析功能,隨后助理智能體直接給出了安裝情緒分析和股交易所需的python庫的腳本。

圖片

隨著任務的進行,用戶智能體給出的指示也會越來越明確,上圖中的指示為:定義一個函數以使用Yahoo Finance API獲取特定股的最新股價。助理智能體會根據該指示直接生成一段代碼來解決需求。

2. 具身智能體(embodied agent)

在先前的研究中,AI Agents可以理解為在模擬一些操作,而沒有與現實世界交互或使用外部工具執行操作,目前的LLMs已經具備與互聯網或其他工具API交互的能力,CAMEL也提供了能夠在物理世界中執行各種操作的具身智能體(embodied agent),它們可以瀏覽互聯網、閱讀文檔、創建圖像、音頻和視頻等內容,甚至可以直接執行代碼。

圖片

上圖展示了CAMEL通過使用embodied agent調用HuggingFace提供的Stable Diffusion工具鏈生成駱駝科圖像的樣例,在這一過程中,embodied agent首先會推理出駱駝科所包含的所有動物,隨后調用擴散模型生成圖像并進行保存。

3. critic在環(critic-in-the-loop)

為了增強role-playing框架的可控性,作者團隊還為CAMEL設計了一種critic-in-the-loop,這種機制受到了蒙特卡洛樹搜索(MTCS)方法的啟發,它可以結合人類偏好實現樹搜索的決策邏輯來解決任務,CAMEL可以設置一個中間評價智能體(critic)來根據用戶智能體和助理智能體出的各種觀點進行決策來完成最終任務,整體流程如下圖所示。

圖片

考慮這樣一個場景,我們讓CAMEL主持一場很具體的科研項目討論會,而科研項目的主題「大型語言模型」,CAMEL可以將用戶智能體的角色設置為一個博士后,將助理智能體的角色設置為博士生,而中間評價智能體的角色設置為教授。任務指示博士生來幫助博士后制定研究計劃,需要圍繞大模型的倫理展開研究。

在接到任務后,博士后智能體首先拋出了關于這一項目的三個觀點,表明項目應該首先從調研大模型倫理方面的相關工作著手。

隨后教授智能體會根據這三個觀點給出自己的看法。并且認為觀點2最為合理的,即研究大模型歧視性算法。同時還會給出另外兩個觀點的缺陷,例如觀點1缺乏更加清晰的結構,觀點3的研究范圍太窄等等。

圖片

在教授發言之后,博士生智能體會進行更加具體的項目規劃,例如直接列出一些大模型倫理安全方向的相關文獻,并且討論如何開展具體的研究。

實驗效果

本文的性能評估主要從三個方面進行,并且采用兩個gpt-3.5-turbo作為實驗智能體,實驗的數據集使用CAMEL框架生成的四個AI數據集,其中AI Society和AI Code側重于智能體的對話效果,而AI Math和AI Science側重于智能體的問題解決能力。

1. Agent評估

在這一部分,作者從AI Society和AI Code數據集中分別隨機選擇 100 個任務進行評估,然后使用CAMEL框架和單個gpt-3.5-turbo進行對比實驗。

結果評估方面分為兩部分,一方面由人類受試者對兩種方法給出的解決方案給出453份投票數據,來決定哪種方案更加可行。另一方面,作者提示GPT4模型對兩種方案直接給出評分,具體的對比數據如下表所示。

從上表中可以看出,CAMEL框架給出的解決方案在人類評估和GPT4評估中均大幅優于gpt-3.5-turbo給出的解決方案,其中人類評估和GPT4評估的總體趨勢高度一致。

2. 使用GPT-4對ChatBot評估

在這一部分,作者在CAMEL生成的四個數據集上對LLaMA-7B模型進行了逐步的微調,通過向LLM中不斷注入來自社會、代碼、數學和科學等不同領域的知識,來觀察模型對知識發現的接受效果。

作者首先從AI Society數據集開始,讓模型了解人類的互動常識和社會動態,隨后AI Code和其他數據集的注入,模型獲得了編程邏輯和語法的知識,同時拓寬了模型對科學理論、經驗觀察和實驗方法的理解。

上表展示了模型在20個Society任務、20個代碼編寫任務、20個數學任務和60個科學任務上的測試效果,可以看到在每次添加數據集時,模型在已訓練過的任務域上都會表現得更好。

3. HumanEval

為了進一步評估CAMEL框架的代碼編寫任務解決能力,作者在HumanEval和HumanEval+兩個評估基準上進行了實驗,實驗結果如下表所示。

圖片

上表中清楚地證明了CAMEL框架的卓越性能,它不僅遠遠超過了LLaMA-7B模型,而且還大大超過了Vicuna-7B模型,這表明使用CAMEL生成的數據集在增強LLM處理編碼相關任務方面有獨特的效果。

CAMEL AI開源社區

值得一提的是,CAMEL作者團隊正在構建了一個非常完善的CAMEL AI開源社區,社區Github倉庫已經得到了3600+的star數,社區中涵蓋了CAMEL中各種智能體的實現、數據生成pipeline、數據分析工具和已生成的數據集,以支持AI Agents及其他方面的研究,社區目前已吸引了諸多開源愛好者貢獻代碼。

距離CAMEL項目編寫第一行代碼到現在已有9個月,CAMEL-AI.org開源研究技術社區已經吸引超過20名來自KAUST/劍橋/索邦大學/NUS/CMU/芝加哥大學/斯坦福/杜克大學/北大/上交/哈工大/西電/東北大學/成信大以及工業界等獨立代碼貢獻者。

社區正在尋找全職/兼職/實習貢獻者、工程師和研究人員加入一起學習和探索如何推動構建智能體社會的邊界,杰出貢獻者有機會參與框架和其他研究項目論文的撰寫投稿。

如果感興趣加入CAMEL-AI.org的社區,可以將簡歷發送至camel.ai.team@gmail.com或者添加微信號CamelAIOrg進行咨詢!

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-11-30 16:34:18

2025-07-28 01:33:00

2025-09-25 12:42:33

2025-07-04 16:50:07

工具AI模型

2025-06-09 08:56:00

2025-06-03 09:08:00

2024-08-14 15:00:00

模型數據

2025-04-25 02:30:00

機械臂大模型多模態

2025-04-28 08:29:04

AIMCP智能體

2025-05-22 06:59:53

2025-06-17 06:28:08

2025-07-25 10:31:52

2025-06-10 09:28:31

智能體開發工具

2025-07-29 09:24:21

2025-06-23 10:05:40

2025-08-25 08:45:00

模型代碼開源

2025-09-18 09:00:47

2024-09-12 15:10:00

AI智能體

2024-10-15 17:28:05

點贊
收藏

51CTO技術棧公眾號

日韩影视高清在线观看| 亚洲精品一级片| 日产午夜精品一线二线三线| 91超碰这里只有精品国产| 400部精品国偷自产在线观看| 99精品在线看| 美女网站久久| 欧美大胆a视频| 免费在线观看污| 精品国产亚洲一区二区三区大结局 | 国产精品第二页| 免费看一级一片| 欧美精品乱码| 亚洲激情自拍图| 中文字幕亚洲影院| 成人免费影院| 亚洲一区二区在线观看视频| 亚洲精品免费在线看| 少妇高潮久久久| 韩国av一区二区三区在线观看| 91精品国产高清久久久久久91 | 国产日本欧美视频| 久久久久久久久久久久久av| 欧美女激情福利| 深夜福利91大全| 亚洲理论片在线观看| 国产欧美自拍一区| 日韩免费电影网站| 久久久久久久久久毛片| 四虎影视4hu4虎成人| 在线视频国产区| 精品动漫av| 久久精品男人天堂| 91在线无精精品白丝| 成人av影音| 日韩丝袜美女视频| 不卡中文字幕在线观看| 国产精品99久久久久久董美香| 香蕉加勒比综合久久| 国产a级黄色大片| 成人在线网址| 亚洲特黄一级片| 一区二区三区四区五区精品| 国产小视频在线观看| 26uuu亚洲| 久久精品99| 欧美日韩在线精品一区二区三区激情综 | 欧美最顶级的aⅴ艳星| 久久视频免费在线观看| 欧美日一区二区三区在线观看国产免| 久久av.com| 黄色a级片在线观看| 亚洲欧美偷拍自拍| 久热精品视频在线观看| 久久久精品视频免费观看| 午夜精品一区二区三区国产| 日韩色av导航| 99久久婷婷国产综合| 亚洲午夜精品一区 二区 三区| 精品国偷自产在线| 在线免费观看亚洲视频| 亚洲无吗在线| 欧美亚洲激情视频| 青青视频在线免费观看| 日韩电影在线观看一区| 国产欧美va欧美va香蕉在线| 国产精品高潮呻吟av| 国产一区二区三区四区五区入口| 亚洲专区国产精品| 人妻无码一区二区三区久久99| av高清不卡在线| 免费国产一区二区| 午夜国产福利在线| 亚洲一区二区三区爽爽爽爽爽| 欧美极品美女视频| 久久成人资源| 国产三级电影在线| **欧美大码日韩| 精品一二三四五区| 日韩电影大全网站| 欧美日韩在线观看一区二区 | 中文字幕亚洲乱码熟女1区2区| 日日摸夜夜添夜夜添国产精品 | 97av免费视频| 粉嫩aⅴ一区二区三区四区| 国产欧美丝袜| av午夜在线| 亚洲最新视频在线观看| av动漫在线观看| 亚洲三级在线| 日韩国产在线播放| 亚洲熟女毛茸茸| 一本色道久久综合亚洲精品不| 国产精品久久视频| 黄色一级大片在线免费看国产一| 久久精品欧美日韩精品 | 久久在线精品| 亚洲最大福利网| 免费一级在线观看| 亚洲精品一二三| 国产成人久久婷婷精品流白浆| 日本一区二区三区中文字幕| 亚洲国产高清福利视频| 貂蝉被到爽流白浆在线观看| 亚洲成人在线| 成人黄色午夜影院| 欧洲综合视频| 亚洲高清不卡在线| 亚洲最大天堂网| 九九久久电影| 久久露脸国产精品| 国产精品视频一区二区三区,| 久久综合色鬼综合色| 黄色一级视频播放| 日本黄色一区| 亚洲精品二三区| 久草网站在线观看| 日本怡春院一区二区| 国产精品一区二区不卡视频| 日本精品免费在线观看| 在线观看av的网站| 欧美体内谢she精2性欧美| 18禁一区二区三区| 国产精品99一区二区三区| 日韩av三级在线观看| 日本激情视频网站| 亚洲精品乱码久久久久久| 五月天婷婷亚洲| jizzjizz欧美69巨大| 91成人福利在线| 人妻少妇一区二区三区| 一区二区视频在线| 婷婷激情小说网| 午夜精品一区二区三区国产| 国产美女久久精品| 啊v视频在线| 色哦色哦哦色天天综合| 中文字幕5566| 亚洲作爱视频| 久久综合一区二区三区| 欧美aa一级| 日韩精品在线免费播放| 欧美一二三区视频| 99精品在线免费| 国产极品尤物在线| 欧美1区二区| 欧美中文字幕在线播放| 欧美色18zzzzxxxxx| 欧美性猛交xxxx久久久| 免费a级黄色片| 久久精品日韩欧美| 日本不卡一区二区三区在线观看| 校园春色亚洲色图| 在线视频欧美性高潮| 一级黄色大片免费| 亚洲视频一区在线| 超级砰砰砰97免费观看最新一期| 你懂的国产精品| 国产一区二区三区高清视频| 无码小电影在线观看网站免费| 亚洲精品成人av| 中文字幕精品无| 国产欧美一区二区精品婷婷| 久久久久免费精品| 久久久久久久久国产一区| 99久久久精品免费观看国产| 九九精品调教| 亚洲精品天天看| 亚洲精品一区二区二区| 中文字幕一区免费在线观看 | 青娱乐极品盛宴一区二区| 3d欧美精品动漫xxxx无尽| 日韩午夜av一区| 久视频在线观看| 2020国产精品久久精品美国| 亚洲色图久久久| 欧美在线三级| 乱色588欧美| 性欧美video另类hd尤物| 欧美日韩成人在线观看| 亚洲AV成人无码一二三区在线| 色悠久久久久综合欧美99| 久久成人小视频| 成人永久aaa| 三级4级全黄60分钟| 婷婷综合激情| 蜜桃传媒视频第一区入口在线看| 久久精品嫩草影院| 久久久视频免费观看| 国产在线视频网站| 日韩午夜激情av| 无码人妻精品一区二区| 亚洲精品乱码久久久久久黑人 | 久久av免费看| 亚洲影院在线看| 日本精品不卡| 欧美激情精品久久久久久变态| 噜噜噜噜噜在线视频| 欧美一区午夜视频在线观看 | 日本在线观看高清完整版| 亚洲欧洲国产一区| www.精品视频| 欧美日韩一区二区在线观看| 国产午夜精品一区二区理论影院| 国产精品视频看| 亚洲の无码国产の无码步美| 久久国内精品自在自线400部| 亚洲美免无码中文字幕在线| 91精品国产成人观看| 欧美精品在线一区| 久久365资源| 91成人免费看| 亚洲成人1区| 国产精品精品一区二区三区午夜版| 男女视频在线| 久久高清视频免费| 超碰免费在线| 亚洲视频综合网| 午夜福利一区二区三区| 欧美大胆一级视频| 国产精品一区二区人人爽| 欧美主播一区二区三区美女| 久久久久久久久久影院| 亚洲影院免费观看| 天海翼在线视频| 中日精品一色哟哟| 中文字幕精品综合| 一级黄色片大全| 99麻豆久久久国产精品免费| 老女人性生活视频| 国产自产高清不卡| 亚洲天堂av一区二区| 久久精品国产亚洲高清剧情介绍 | 久久草av在线| 亚洲男人天堂色| 久久久久久久波多野高潮日日| 国产 日韩 欧美在线| 国产综合网站| 国产欧美精品aaaaaa片| 欧美全黄视频| 91亚洲精品国产| 一区二区三区网站| 亚洲天堂第一区| 午夜久久tv| 在线观看污视频| 亚洲国产专区| 奇米影视亚洲色图| 日韩视频精品在线观看| 国产极品尤物在线| 久久国产66| 性欧美极品xxxx欧美一区二区| 日日摸夜夜添夜夜添国产精品| av无码精品一区二区三区| 日韩电影一区二区三区| www.色偷偷.com| 久久99在线观看| 香蕉网在线视频| 99久久夜色精品国产网站| 久久精品综合视频| 国产情人综合久久777777| 91av手机在线| 亚洲亚洲人成综合网络| 日本一级黄色大片| 色综合激情五月| 在线观看中文字幕2021| 日韩视频不卡中文| 无码国产精品96久久久久| 国产一区二区黄| 老司机午夜在线| 久久久久国产精品www| 中文字幕乱码中文乱码51精品| 国产福利视频一区| 国产麻豆精品| 久久五月天婷婷| 日韩一区二区中文| 欧美国产综合在线| 日精品一区二区三区| 九九热视频免费| 97久久超碰精品国产| 一本在线免费视频| 亚洲电影一级黄| 中国黄色一级视频| 欧美成人a视频| yjizz视频网站在线播放| 欧美久久精品午夜青青大伊人| 2021天堂中文幕一二区在线观| 国产精品99久久久久久人| 色一情一乱一伦一区二区三区日本| 香蕉视频成人在线观看| 亚洲精品国产一区二区三区| 成人一区二区三区视频 | 亚洲人吸女人奶水| 日韩 欧美 精品| 欧美日韩国产综合草草| 日本黄色不卡视频| 宅男66日本亚洲欧美视频| gratisvideos另类灌满| 国产在线精品自拍| 亚洲欧美成人vr| 国产精品igao激情视频 | 国产精品一区二区久久久| 色妞ww精品视频7777| 日本在线观看一区二区三区| 亚洲小说欧美另类社区| www.这里只有精品| 久久综合久久99| 精品在线免费观看视频| 欧美视频三区在线播放| 日韩福利一区二区| 欧美激情三级免费| 色婷婷成人网| 日产中文字幕在线精品一区| 亚洲精品日本| 中文字幕一二三| 国产精品国产三级国产aⅴ无密码| 精品欧美一区二区三区免费观看| 91麻豆精品91久久久久久清纯| 黄色电影免费在线看| 国内精品小视频在线观看| 国产精品久久免费视频 | 亚洲三级国产| 小日子的在线观看免费第8集| 日本一区二区高清| 一级片在线观看免费| 亚洲精美色品网站| 日本动漫理论片在线观看网站| 91久久国产综合久久91精品网站| 精品国产一区二区三区噜噜噜| 99精品人妻少妇一区二区 | 精品国产二区在线| 国语对白精品一区二区| 97人人模人人爽人人澡| 亚洲色图另类专区| 一级特黄aaaaaa大片| 日韩中文字幕在线视频播放| 欧美成人免费全部网站| 亚欧洲精品在线视频免费观看| 巨乳诱惑日韩免费av| 亚洲人成人无码网www国产| 色一情一伦一子一伦一区| 欧洲毛片在线| 国产91九色视频| 波多野结衣的一区二区三区| 91淫黄看大片| 国产精品久久影院| 国产精品久久久久久久久久久久久久久久久久 | 成人午夜视屏| 精品无人区一区二区三区竹菊| 国产精品v亚洲精品v日韩精品| 香蕉视频1024| 亚洲国产视频在线| 色丁香婷婷综合久久| 97精品伊人久久久大香线蕉 | 欧美特黄aaaaaa| 亚洲色图美腿丝袜| 青青在线精品| 国产911在线观看| 成人免费黄色大片| 日本va欧美va国产激情| 亚洲欧美激情视频| 97人人做人人爽香蕉精品| 亚洲 欧洲 日韩| 国产成人8x视频一区二区| 日本亚洲色大成网站www久久| 亚洲精品一区二区久| 国产私拍福利精品视频二区| 一区二区免费在线观看| 国产成人自拍网| 99热只有这里有精品| 一区二区欧美激情| 国产精品麻豆| 午夜精品久久久久久久无码| 国产日产欧产精品推荐色| 97人妻精品一区二区三区软件 | av不卡一区二区三区| 在线观看日本网站| 久久中文字幕在线视频| 国产精品调教| 成人3d动漫一区二区三区| 亚洲人成伊人成综合网小说| 日韩一级免费视频| 国产日韩欧美视频| 在线看片日韩| 成人午夜免费影院| 欧美精品一区二区高清在线观看| 国偷自产一区二区免费视频| 亚洲一区精品视频| 99这里都是精品| 国产精品久久久久久久久久久久久久久久久久 | 一区二区三区色| 欧美色视频免费| 97久草视频| 日本一不卡视频| 久久久久久久久久久久久久免费看 | 男人天堂资源在线| 成人羞羞国产免费| 免费一区视频| 国产一级aa大片毛片| 伊人久久大香线蕉av一区二区| 秋霞影院一区|