精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

三個Agent頂個GPT-4,基于開源小模型的那種

人工智能 新聞
本文為基于開源小模型的多智能體協作打開了新思路,并在多個工具調用benchmark上取得了超過單模型Agent baseline,比肩GPT-4的工具調用結果。

真·“三個臭皮匠,頂個諸葛亮”——

基于開源小模型的三個Agent協作,比肩GPT-4的工具調用效果!

話不多說,直接來看兩個系統執行記錄。

用戶表示自己是一個音樂愛好者,想探索不同的音樂流派以及音樂家。于是指定模型使用Deezer和Shazam的API來搜尋一些音樂曲目以及相應藝術家信息。

之后“飾演”三個不同的角色的Agent分工協作,在兩步之內完成了任務

圖片

更難一點的,不指定工具,讓模型找一個最受歡迎的風景畫教程視頻以及上傳該視頻的頻道詳情。

在這種情況下,模型通常會遇到工具狀態變化,出現工具被下架或工具所需參數定義變化的問題。

圖片

然而使用上述方法,模型在第0步試圖使用video_for_simple_youtube_search來獲取視頻詳細信息,但發現這個API已經被破壞,無法調用。

因此飾演planner角色的Agent轉換思路,告訴飾演caller角色的Agent需要嘗試另外一個API,并最終通過嘗試新的API發現了詳細信息,解決了用戶的任務。

這就是中山大學、阿里通義實驗室聯合提出的一種基于開源小模型的多模型協作Agent框架——α-UMi

圖片

α-UMi通過微調多個開源小模型,實現協同作戰,在工具調用等數據集效果比肩GPT-4。

總的來說,相比于其他的基于閉源API框架,α-UMi的優勢有以下幾點:

  • 基于α-UMi多模型協同框架,通過三個小模型:planner、caller和summarizer分別負責路徑規劃、工具調用和總結回復,對小模型進行工作負荷的卸載。
  • 相比單模型Agent支持更靈活的prompt設計。其在ToolBench,ToolAlpaca corpus等多個benchmark上超過單模型Agent框架,獲得比肩GPT-4的性能。
  • 提出了一種“全局-局部”的多階段微調范式(GLPFT),該范式成功在開源小模型上訓練了多模型協作框架,實驗結果表明這種兩階段范式為目前探索出的最佳訓練多模型協作Agent范式,可以被廣泛應用。

多模型協作框架α-UMi長啥樣?

目前,基于大模型調用API、function和代碼解釋器的工具學習Agent,例如OpenAI code interpretor、AutoGPT等項目,在工業界和學術界均引起了廣泛關注。

在外部工具的加持下,大模型能夠自主完成例如網頁瀏覽、數據分析、地址導航等更復雜的任務,因此AI Agent也被譽為大模型落地的一個重要方向。

但上述一些主流項目主要基于閉源ChatGPT、GPT-4大模型,其本身在推理、步驟規劃、調用請求生成和總結回復等能力上已經足夠強。

相比之下開源小模型,由于模型容量和預訓練能力獲取的限制,單個模型無法在推理和規劃、工具調用、回復生成等任務上同時獲得比肩大模型等性能。

為了解決這一問題,本文研究人員提出了α-UMi。

α-UMi包含三個小模型planner、caller和summarizer

圖片

其中planner模型為系統的核心大腦,負責在某一Agent執行步驟內激活caller或summarizer,并給予對應的推理(rationale)指導;

而caller和summarizer則分別負責接收planner的指導完成該步后續工作,caller負責生成于工具交互的指令,summarizer負責總結最終的回復反饋給用戶。

這三個模型都是基于開源小模型進行不同類型數據微調實現的。

此外,研究人員提出了全局-局部多階段微調范式——GLPFT

基于開源小模型,實現多模型協作框架并非一件簡單的事,有兩個作用截然相反的影響因素:

一是生成Rationale,Action和Final Answer三個任務在訓練中可以相互促進的,同時也能增強模型對于Agent任務的全局理解。因此目前大部分工作均訓練單個模型同時生成rationale, action和final answer。

二是模型容量,不同任務的數據配比等也限制了我們很難訓練單個模型同時在三個任務上獲得表現峰值。

下圖中,單模型Agent在各項指標上達到峰值所需的數據量是不同的,很難找到一個在所有指標上達到峰值的數據量和模型檢查點。

而通過多模型協作,可以解決這個問題。

圖片

綜合考慮上述兩點,研究人員提出了一種“全局-局部”的多階段訓練方法,目標在于利用充分利用Rationale,Action和Final Answer在訓練中相互促進的優勢,獲得一個較好的單模型初始化,再進行多模型微調,專攻子任務性能的提升。

圖片

上圖展示了這種多階段微調的流程,在第一階段中,使用預訓練LLM在完成工具調用Agent任務上微調,獲得一個單模型的Agent LLM初始化。

接著,在第二階段中,研究人員對工具調用Agent任務的訓練數據進行重構,分解成生成rationale,生成工具交互action和生成最終回復三個子任務,并將第一階段訓練好的Single-LLM Agent底座復制三份,分別在不同子任務上進一步微調。

性能比肩GPT-4

靜態評估

圖片

在靜態評估中,本文將所有對比baseline的輸出結果與標注輸出進行對比,可以看到:

  • α-UMi系統表現顯著超過了ChatGPT和工具調用開源模型ToolLLaMA,性能與GPT-4比肩。

值得一提的是,ToolLLaMA需要8192的輸出長度以獲得令人滿意的結果,而α-UMi只需要4096的輸入長度,得益于多模型框架帶來的更靈活的prompt設計。

  • 在多模型協作框架模型的微調方案對比上,直接微調三個模型、或單個模型多任務微調均無法使多模型協作框架發揮效果,只有使用多階段微調GLPFT才能達到最佳性能,為后續多模型協同訓練打開了思路。

真實API調用評估

作者也在ToolBench數據集上引入了一種真實API調用的評估方式,實驗結果如下:

圖片

在真實API調用實驗結果中,α-UMi 依然戰勝了ChatGPT和ToolLLaMA,并在成功率上取得了與GPT-4比肩的結果。

模型開銷

看到這可能有人問了,多模型協作會不會引入更多成本?作者也探究了多模型協作框架在訓練、推理及儲存階段的開銷對比:

圖片

總體來說,多模型協作框架確實會在訓練和模型參數儲存上引入更高的開銷,但其推理速度與單模型框架相當。

當然,考慮到多模型協作Agent框架使用7B底座的性能遠超13B單模型Agent性能,總開銷也更少。這意味著可以選擇小模型為底座的多模型協作Agent框架來降低開銷,并超過大模型的單模型Agent框架。

最后研究人員總結道,多智能體協作是未來智能體發展的趨勢,而如何訓練提升開源小模型的多智能體協作能力,是實際落地很關鍵的一環,本文為基于開源小模型的多智能體協作打開了新思路,并在多個工具調用benchmark上取得了超過單模型Agent baseline,比肩GPT-4的工具調用結果。

后續將會增強planner的泛化性,使其使用于更廣泛的Agent任務場景,進行caller模型的本地私有化,使其專注于本地工具調用任務,以及云端大模型結合本地小模型的“大-小”模型協同框架。

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-04-25 16:56:14

GPT-4大模型人工智能

2023-03-28 08:23:38

2023-06-19 08:19:50

2024-01-12 19:07:26

GPT-4AI產品

2023-04-09 16:17:05

ChatGPT人工智能

2023-06-08 11:27:10

模型AI

2023-12-26 08:17:23

微軟GPT-4

2025-04-16 09:35:03

2024-01-18 11:45:35

視覺模型蘋果

2023-05-29 09:29:52

GPT-4語言模型

2023-04-04 09:09:10

GPT-4編程程序員

2024-03-27 09:12:52

自動化智能體

2025-05-30 07:40:56

2023-09-11 15:57:16

人工智能模型GPT-4

2023-08-17 08:00:00

2023-05-22 08:30:35

GPT-4智能編程助手

2022-05-20 10:43:30

AI模型

2023-03-13 00:17:15

GPT-4模型API

2024-02-01 14:56:13

GPT-4開源模型

2024-01-16 12:31:13

OpenAIGLM-4大模型
點贊
收藏

51CTO技術棧公眾號

91亚色免费| 亚洲精品一区二区网址| 亚洲第一精品区| 精品久久久无码中文字幕| 亚洲福利国产| 亚洲精品视频播放| 日本人69视频| av毛片午夜不卡高**水| 国产女同性恋一区二区| 99视频国产精品免费观看| 特级西西444www大精品视频免费看| 啪啪亚洲精品| 欧美三级电影在线| 最新中文字幕一区二区三区 | 日韩欧美手机在线| 99热这里是精品| 国产视频欧美| www.99久久热国产日韩欧美.com| 看全色黄大色黄女片18| 久久麻豆视频| 色综合视频一区二区三区高清| 亚洲高清资源综合久久精品| 人妻少妇精品无码专区久久| 老司机精品视频一区二区三区| 久久免费视频网站| 污软件在线观看| 成人3d动漫在线观看| 亚洲国产精品一区二区久| 波多野结衣国产精品| 欧美极度另类| 婷婷夜色潮精品综合在线| 天天干天天操天天干天天操| 欧美日韩激情视频一区二区三区| 国产精品亚洲专一区二区三区| 5252色成人免费视频| 欧美日韩在线视频免费| 日韩精品一区二区三区免费观看 | 欧美女v视频| 成人性色生活片| 成人在线精品视频| 亚洲无码精品国产| 快she精品国产999| 57pao精品| 国产亚洲欧美精品久久久久久| 97精品国产一区二区三区| 亚洲欧洲在线免费| 亚洲一区二区三区四区五区六区| 亚洲性视频在线| 成人性片免费| av在线不卡免费看| 114国产精品久久免费观看| 中日韩av在线| 日韩二区在线观看| 国产成人一区二区| 岛国av中文字幕| 亚洲欧美bt| 国产91成人video| 日本一级片免费看| 亚洲少妇一区| 国产成人精彩在线视频九色| 日本中文字幕久久| 视频一区欧美精品| 国产精品jvid在线观看蜜臀 | 欧美系列在线观看| 国产九九在线视频| 国产亚洲欧美日韩精品一区二区三区| 色综合一区二区三区| 欧美 日韩精品| 欧美一级大片| 欧美日韩免费视频| 色婷婷一区二区三区在线观看| 久久伊人久久| 精品国产91乱码一区二区三区 | 香蕉久久精品| 国产亚洲一区精品| 韩国一级黄色录像| 国内精品久久久久久久影视蜜臀| 久久久久久久久91| 97人人澡人人爽人人模亚洲| 久久国产精品久久w女人spa| 国产精品久久久久久久av电影 | 五月天色婷婷综合| 污污网站在线观看| 亚洲国产一区在线观看| 亚洲午夜精品久久久久久人妖| 综合日韩av| 欧美日韩中文一区| 91成人在线观看喷潮蘑菇| 久久黄色影视| 亚洲人挤奶视频| 色94色欧美sute亚洲线路一久 | 国产超碰精品| 91麻豆精品91久久久久同性| 大桥未久恸哭の女教师| 视频一区中文| 久久国产加勒比精品无码| 日韩少妇裸体做爰视频| 久久精品国产亚洲aⅴ| 99九九视频| 久久免费看视频| 亚洲精选在线视频| 蜜臀视频一区二区三区| 亚洲国产尤物| 精品1区2区在线观看| 91成人精品一区二区| 韩日精品视频| 国产精品私拍pans大尺度在线| 亚洲风情第一页| 久久精品夜夜夜夜久久| 日本一区午夜艳熟免费| 不卡亚洲精品| 日韩精品极品毛片系列视频| 91视频综合网| 日韩精品五月天| 国产亚洲精品自在久久| 麻豆av免费在线观看| 欧美午夜宅男影院在线观看| 特黄特色免费视频| 欧美限制电影| 欧美在线观看网站| 亚洲黄色小说网址| 综合欧美一区二区三区| www日韩视频| 美女网站色精品尤物极品姐弟| x99av成人免费| 在线观看日本网站| 99久久亚洲一区二区三区青草| 最新欧美日韩亚洲| 成人综合网站| 国产一区二区三区日韩欧美| 久久久久久久久久免费视频| 国产v综合v亚洲欧| 天堂v在线视频| 国产成人精选| 亚洲欧美日韩精品| 亚洲免费激情视频| 成人午夜激情在线| 久久深夜福利免费观看| 大陆极品少妇内射aaaaa| 中文字幕日韩在线| 欧美成在线观看| 91 中文字幕| 亚洲国产精品传媒在线观看| 一区二区在线播放视频| 美女精品一区最新中文字幕一区二区三区| 久久久免费电影| www.国产麻豆| 一区二区三区中文字幕电影| 中文字幕在线视频一区二区| 亚欧美无遮挡hd高清在线视频| 国产精品美女久久久免费| 免费播放片a高清在线观看| 欧美性xxxx极品高清hd直播| theav精尽人亡av| 国产日韩亚洲| 日本一区视频在线播放| 日韩和的一区二在线| 一二美女精品欧洲| 91精品中文字幕| 亚洲视频在线一区| 日本少妇一区二区三区| 欧美a级在线| 国产精品久久久久久久久久直播 | 国产伦精品一区二区三区高清版| 丝袜综合欧美| 亚洲第一区在线观看| 成年人午夜视频| 久久久久9999亚洲精品| 五月婷婷深爱五月| 国产精品99久久| 91偷拍精品一区二区三区| 欧美aaa免费| 日韩电影在线观看永久视频免费网站| 欧美性猛交bbbbb精品| 国产欧美日韩在线| 97人人爽人人| 亚洲激情自拍| 四虎一区二区| 99精品中文字幕在线不卡 | 亚洲无线观看| 青草成人免费视频| 日本中文字幕在线观看| av在线看片| 欧美在线小视频| 国产成人av免费在线观看| 福利一区二区在线观看| www一区二区www免费| 日韩不卡一区| 精品久久蜜桃| 亚洲综合视频| 5566成人精品视频免费| 日韩黄色影院| 国产丝袜一区二区三区| 一起草av在线| 欧美视频在线观看免费| 国精产品视频一二二区| 不卡的av在线| 一女二男3p波多野结衣| 国内精品美女在线观看 | 无码人妻一区二区三区免费n鬼沢| 国产精品试看| 伊人再见免费在线观看高清版 | 懂色av一区二区三区四区五区| 国产欧美啪啪| 成人免费在线网址| 欧美电影网站| 欧美精品电影在线| 最新97超碰在线| 亚洲精品动漫100p| 999久久久久久| 欧洲视频一区二区| 日韩欧美一区二区一幕| 亚洲三级在线看| 性猛交娇小69hd| 99久精品国产| 大桥未久恸哭の女教师| 国内不卡的二区三区中文字幕| 91国视频在线| 欧美午夜在线| 91手机视频在线| 成人看的羞羞网站| 久久亚洲一区二区| 国产精品中文字幕制服诱惑| 成人xvideos免费视频| 久久毛片亚洲| 91成人在线视频| 成人av影院在线观看| 久久国产精品久久久久久| 在线免费观看黄色| 国产亚洲xxx| 日韩大胆视频| 亚洲精品中文字幕女同| 欧美熟妇乱码在线一区| 日韩欧美的一区| 99精品在线视频观看| 欧美人与性动xxxx| 亚洲熟女乱色一区二区三区久久久| 色综合视频一区二区三区高清| 在线观看国产亚洲| 激情久久av一区av二区av三区| 黄页网站免费观看| 一区二区三区波多野结衣在线观看| 无码黑人精品一区二区| 国产精品乱码久久久久久| 永久免费av无码网站性色av| 久久久亚洲欧洲日产国码αv| 日本xxxx裸体xxxx| 久久夜色精品国产欧美乱极品| 在线精品一区二区三区| jlzzjlzz亚洲日本少妇| 中文字幕日韩三级片| 91丨国产丨九色丨pron| 性欧美13一14内谢| 国产视频一区在线播放| 免费一级黄色录像| 最新日韩在线视频| 久久精品www人人爽人人| 亚洲国产一区视频| av资源免费观看| 色婷婷av久久久久久久| 中文字幕男人天堂| 3d成人动漫网站| 亚洲国产成人在线观看| 亚洲国产高清福利视频| 日夜干在线视频| 一区二区欧美久久| 国产在线更新| 久久久免费电影| 日韩电影免费观看高清完整版| 国产成人精品在线观看| 亚洲精品伦理| 风间由美一区二区三区| 色先锋久久影院av| 相泽南亚洲一区二区在线播放| **女人18毛片一区二区| 日韩成人三级视频| 亚洲一区二区三区免费在线观看| av网站在线不卡| 国产乱码精品一区二区三区五月婷| 农村末发育av片一区二区| www激情久久| 国产日韩欧美在线观看视频| 午夜国产精品影院在线观看| 中文人妻av久久人妻18| 日韩一区二区免费视频| 香蕉视频黄色片| 在线观看国产精品91| 男女在线视频| 国产精品成人播放| 精品久久国产一区| 欧美日韩亚洲免费| 午夜日韩视频| 三级在线免费看| 粉嫩高潮美女一区二区三区| 一级黄色片大全| 一区二区三区精品在线| 亚洲黄网在线观看| 欧美成人vps| av网站在线免费播放| 久久久最新网址| 亚洲欧美专区| 欧美日韩亚洲一区二区三区在线观看| 中文字幕日韩一区二区不卡 | 韩国v欧美v日本v亚洲v| 亚洲色图14p| 亚洲黄色小说网站| 中文字幕人妻互换av久久| 亚洲电影免费观看高清| 国产色在线观看| 国产精品白嫩美女在线观看| 极品国产人妖chinesets亚洲人妖 激情亚洲另类图片区小说区 | 久久久久亚洲精品成人网小说| 国产激情久久| 欧美激情第一页在线观看| 欧美激情亚洲| 男生操女生视频在线观看| 久久久精品影视| 欧美三级午夜理伦| 精品奇米国产一区二区三区| 欧美激情午夜| 国产精品99久久久久久人| 老司机aⅴ在线精品导航| av一区二区三区免费观看| 久久99国产精品久久99 | 一区二区在线电影| 一本色道久久综合无码人妻| 亚洲片在线资源| 亚洲欧美韩国| 精品欧美一区二区精品久久| 国产精品xvideos88| 在线免费黄色小视频| 国产精品国产三级国产| 最新中文字幕免费| 一区二区在线视频| 日韩性xxx| 欧美在线视频二区| 久久久久国产精品一区三寸| 亚洲国产第一区| 欧美三级xxx| 日韩欧美电影在线观看| 欧美诱惑福利视频| 久久不见久久见国语| 日本免费一级视频| 久久先锋资源网| 凹凸精品一区二区三区| 一级做a爰片久久毛片美女图片| 欧美影视资讯| 亚洲最新在线| 国产一区日韩二区欧美三区| 国产美女久久久久久| 91.com视频| 日本一本在线免费福利| 99在线视频首页| 亚洲一级网站| 国产高清自拍视频| 在线欧美日韩精品| 天天影视久久综合| 91欧美精品成人综合在线观看| 欧美一区二区三区久久精品茉莉花| 免费欧美一级片| 性做久久久久久久免费看| 手机在线观看毛片| 国产91免费观看| 国产精品精品| www日本在线观看| 欧美视频中文字幕在线| av天在线观看| 亚洲一区二区三区sesese| 伊人久久成人| 欧美做受xxxxxⅹ性视频| 欧美日韩视频一区二区| 在线不卡日本v二区707| 国产91免费视频| 美日韩精品视频| 国产精品99久久久久久成人| 日韩精品一区二区三区在线| 91福利在线免费| 水蜜桃一区二区| 国产99久久久国产精品| 国产污视频网站| 欧美成年人视频网站| 美日韩黄色大片| 色婷婷成人在线| 亚洲国产精品麻豆| 国产一二在线观看| 成人黄动漫网站免费| 日韩精品一二区| 久草视频免费在线播放| 国产亚洲aⅴaaaaaa毛片| 亚洲精品视频一二三区| 欧美综合在线观看视频| 亚洲乱码国产乱码精品精98午夜| 日本一区视频| 91在线看www| 日韩精品午夜视频| 国产午夜久久久| 日韩中文字在线| 在线看成人短视频| 久久久久久久久久久久国产精品| 91九色02白丝porn|