精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

GPT-3.5逆襲GPT-4!谷歌DeepMind華人天團,讓LLM像人類一樣制作工具,完勝CoT

人工智能
最近,來自Google DeepMind,普林斯頓和斯坦福的頂尖華人團隊提出了一種全新的框架?,F在,LLM可以像人類一樣制作自己的工具了!

ChatGPT等大語言模型誕生以來,憑著強大的語言理解能力、生成能力、邏輯推理能力等,已經被人類玩出了花。

而OpenAI公開GPT-4后,最大的驚喜之一,莫過于插件模式的引入了。

插件使得GPT-4可以執行代碼、搜索引擎、集成各種APP的功能。這無疑是對于LLM后續應用模式的一大突破。

圖片

顯然,通過工具的使用,我們可以顯著地提升LLM的生產力,

但是,如果沒有合適的工具怎么辦?

——那就讓LLM自己造!

最近,來自Google DeepMind,普林斯頓和斯坦福的華人團隊提出了一種閉環框架,讓LLM可以通過程序的形式,制作并使用全新的工具(能重復使用的那種)。

簡單來說,就是讓一個LLM作為工具制造者制作新工具,另一個LLM作為工具使用者,使用工具來解決新問題。

圖片

論文地址:https://arxiv.org/abs/2305.17126

項目地址:https://github.com/ctlllll/LLM-ToolMaker

基于這個框架,LLM就變得像人類的祖先一樣,能夠自我開發,并且學會使用工具。

同時,這種工具制造者和使用者之間的分工,在不降低生成工具和解決方案質量的情況下,就能實現成本效益。

結果顯示,當使用GPT-4作為工具制造者,GPT-3.5 Turbo作為工具使用者時,可以在成本低、速度快的GPT-3.5 Turbo上實現與GPT-4相當的性能。

讓LLM自己造工具

雖然LLM很好用,但如果問題太多的話,直接丟給GPT-4這種性能很強的模型,成本會非常高。

另一方面,輕量級模型在成本效益上很高,但通常在處理復雜任務時遇到困難。

LATM通過利用強大的模型作為工具制造者,為請求中觀察到的任務生成可重復使用的工具(以Python函數實現),并將工具傳遞給一個成本效益高的工具使用者模型,用于解決后續請求中的類似實例。

這種方法使得輕量級模型在保持更高的成本效率的同時,能夠達到與強大模型相當的性能。

圖片


LATM的閉環框架

LATM可以分為兩個階段:

1. 制造工具:一個強大但更昂貴的模型作為工具制造者,從一些示例中生成通用且可重復使用的工具;

2. 使用工具:一個輕量且更便宜的模型作為工具使用者,使用工具來解決任務的各種實例。

制造工具階段可以進一步劃分為三個子階段:

(1)工具提議:工具制造者試圖從一些訓練示例中生成工具(Python函數),如果工具無法執行,報告錯誤并生成新的(修復函數中的問題);

(2)工具驗證:工具制造者在驗證樣本上運行單元測試,如果工具沒有通過測試,報告錯誤并生成新的測試(修復單元測試中函數調用的問題);

(3)工具封裝:封裝函數代碼和如何從單元測試中將問題轉換為函數調用的示例,為工具使用者準備可用的工具。

圖片

LATM的流程

在現實世界的場景中,任務實例通常都是按順序來的。為了適應這種數據流,團隊引入了第三個LLM——分派器。

具體來說,當收到一個新的任務實例時,分派器首先確定是否有適合當前任務的工具。

· 如果存在合適的工具,分派器將實例及其相應的工具傳遞給工具使用者進行任務解決。

· 如果沒有找到合適的工具,分派器將該實例識別為新任務,并使用強大的模型甚至調用人類標注者來解決該實例。

鑒于分派任務的簡單性,分派器可以是一個配備了適當提示的輕量級模型,這只會為整個流程增加很小的成本。

結果顯示,分派器可以有效地識別現有的工具,而且對于沒有見過的任務也不會有顯著的性能下降。

圖片

分派器的工作流程

在下面這個任務示例中,需要根據給定的幾個條件確定五個對象的順序。

在工具提議階段,工具制造者(如GPT-4)會寫一個通用的Python函數,能夠解決任務中提供的k個示例(實驗中k=3)。

然后,工具制造者會生成一個搜索算法,枚舉所有可能的排序,并根據給定的條件進行驗證

在工具使用階段,工具使用者將每個自然語言問題轉化為一系列條件,生成函數調用,利用工具解決每個任務實例。

圖片

工具提議和工具使用階段(邏輯推理任務)

結果顯示,不管是由人類編寫還是由GPT-4生成,CoT在任務完成的準確率上,都會被LATM吊打。

圖片

使用GPT-4生成的CoT的準確性

如表1所示,當被用作工具制造者時,GPT-4會搜索所有排列組合,并選出滿足給定約束條件的,最終成功解決任務。

而且,工具制造者即便是接收到了錯誤的信息,也依然有能力進行糾正。

圖片

工具制造者為解決任務而生成的函數

在表2中,團隊將思維鏈提示方法和LATM的性能進行了比較。

結果顯示,有了工具的幫助,像GPT-3.5 Turbo這樣的輕量級模型可以實現與GPT-4相當的性能,并顯著優于CoT提示。

而且,能夠利用工具的GPT-3.5 Turbo在平均成本上,也比直接用GPT-4低得多。

有趣的是,對于Dyck語言任務,作為工具使用者的GPT-3.5 Turbo,甚至甚至超過了同樣作為使用者的GPT-4。

在研究錯誤的案例時,團隊發現,在將問題轉化為函數調用時,GPT-4有時會自發地去「解決」問題。然而,這是完全不必要的,而且還會導致函數輸出錯誤。

圖片

LATM和思維鏈(CoT)的性能比較

此外,在所有的模型中,GPT-3.5 Turbo也有著最佳的性價比。

圖片

各種工具使用者模型的性能比較

不過,雖然GPT-3.5 Turbo在作為使用者時表現出色,但它并不能很好地扮演工具制造者的角色。

結果顯示,對于像邏輯推理這樣比較困難的任務,GPT-3.5 Turbo一次都沒成功。

也就是說,使用一個強大的模型作為工具的制造者,是很有必要的。

圖片

GPT-4和GPT-3.5 Turbo在生成新工具時的成功率

LATM Prompt

圖片

工具制造

圖片

工具驗證

圖片

工具封裝

圖片

分派器

封裝工具


圖片



邏輯推理

圖片

查找隨機對象

圖片

Dyck語言

圖片

單詞排序

圖片


余數定理

圖片

安排會議

作者介紹

論文一作Tianle Cai(蔡天樂),是普林斯頓大學的一年級博士生。

在此之前,他就讀于北京大學,主修應用數學,同時兼修計算機科學。

他的興趣非常廣泛,橫跨機器學習的很堵領域。比如,優化,表征學習,架構設計(Transformer,圖神經網絡等)。宗旨就是,讓機器學習更通用,更高效,更可靠。

圖片

Xuezhi Wang是谷歌大腦的研究科學家。

在此之前,她于2016年在卡耐基梅隆大學計算機科學系獲得博士學位,于2011年在清華大學取得計算機科學學士學位。

她的主要興趣是NLP模型的魯棒性和公平性,以及在語言模型中實現系統化的泛化。

圖片

Tengyu Ma(馬騰宇)是斯坦福大學計算機科學和統計學的助理教授。

他的研究興趣廣泛,包括機器學習、算法及其理論方面的課題,如深度學習、(深度)強化學習、預訓練/基礎模型、魯棒性、非凸優化、分布式優化和高維統計。

圖片

Xinyun Chen(陳昕昀)是谷歌大腦的高級研究科學家。

在此之前,她于2022年在加州大學伯克利分校獲得計算機科學博士學位,并在上海交通大學ACM班獲得計算機科學學士學位。

她的研究興趣是神經程序合成和對抗性機器學習。

圖片

Denny Zhou是谷歌大腦和DeepMind推理團隊的創始人和負責人。

研究方向是通過建立和教授大型語言模型(LLMs)來解決人工通用智能(AGI)問題,實現人類水平的推理。

研究突破包括:指令調整(FLAN2)、思維鏈提示、自洽性解碼、最小到最大提示,以及LLMs的涌現特性。

值得一提的是,谷歌首席執行官Sundar Pichai在2022年谷歌I/O大會上介紹了他們的工作。

圖片

參考資料:https://arxiv.org/abs/2305.17126

責任編輯:武曉燕 來源: 新智元
相關推薦

2023-05-05 09:42:12

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-10-13 13:12:44

2023-09-06 16:44:03

2023-03-20 08:19:23

GPT-4OpenAI

2023-10-31 15:26:02

阿里云通義千問

2024-01-26 08:36:07

OpenAIGPT-4?人工智能

2023-06-05 12:32:48

模型論文

2024-05-20 08:40:00

2023-06-21 13:37:41

模型研究

2023-03-29 10:31:40

MIT論文

2023-08-27 12:54:59

GPT-4神秘版本Code

2023-07-04 14:01:26

GPT-4模型

2023-10-30 17:23:54

數據模型

2023-06-19 08:19:50

2023-10-10 13:59:00

模型研究

2024-01-29 10:31:00

AI模型

2023-11-06 12:46:00

AI數據

2023-12-12 13:57:00

GPT-3.5MistralAI

2025-04-16 09:35:03

點贊
收藏

51CTO技術棧公眾號

97免费视频观看| 成人免费淫片视频软件| 亚洲最大成人网站| 欧美日韩免费电影| 亚洲在线观看免费视频| 蜜桃网站成人| 99久久久国产精品无码网爆| 亚洲美女网站| 日韩亚洲成人av在线| 日韩女优在线视频| 国产精品久久久久av电视剧| 亚洲黄色免费网站| 欧美精品一区二区三区在线四季 | 99久久www免费| 精品国产露脸精彩对白| 久久久久国产一区| 国产不卡人人| 亚洲激情自拍视频| 新呦u视频一区二区| 手机看片福利永久| 国产一区二区三区综合| 国产精品扒开腿做爽爽爽男男 | 在线观看91视频| 男人天堂a在线| 日本成人网址| 欧美精彩视频一区二区三区| 久久精品aaaaaa毛片| www.av网站| 国产专区综合网| 国产精品欧美日韩一区二区| 日韩黄色一级大片| 亚洲国产免费看| 欧美另类交人妖| 免费观看特级毛片| 第四色成人网| 亚洲欧洲午夜一线一品| 在线观看国产三级| 大陆精大陆国产国语精品| 欧美日本在线观看| 欧美激情亚洲天堂| 黄色的网站在线观看| 久久综合色8888| 国产精品成人一区二区三区 | 久久精品123| 久久久久亚洲精品成人网小说| 亚洲一二三精品| 要久久爱电视剧全集完整观看| 日韩美女一区二区三区四区| 国产又大又黄又粗的视频| tube8在线hd| 国产精品电影一区二区| 亚洲国产婷婷香蕉久久久久久99| 青春草在线观看| av中文字幕一区| 肥熟一91porny丨九色丨| 中文字幕视频二区| 丝袜美腿亚洲综合| 国产91精品青草社区| 精品无码人妻一区二区三| 久久久国产精品| 正在播放亚洲1区| 一级特黄曰皮片视频| 偷窥自拍亚洲色图精选| 精品国产乱码久久久久久图片| 亚洲精品mv在线观看| 日本美女久久| 欧美日韩一区精品| 91免费视频污| 视频一区日韩精品| 精品奇米国产一区二区三区| 两女双腿交缠激烈磨豆腐| www.欧美视频| 91精品国产综合久久婷婷香蕉| 亚洲36d大奶网| 国产成人福利夜色影视| 欧美在线观看视频一区二区 | 久久精品国产亚洲AV成人婷婷| 亚洲制服欧美另类| 亚洲欧美另类人妖| 精品无码国产污污污免费网站| 清纯唯美亚洲经典中文字幕| 日韩av影视综合网| 醉酒壮男gay强迫野外xx| 亚洲图片久久| 国产亚洲成精品久久| 欧美日韩中文字幕视频| 99久久99热这里只有精品| 日韩中文字幕在线免费观看| 国内毛片毛片毛片毛片毛片| 在线日韩中文| 日韩免费黄色av| 国产美女www| 久草精品在线观看| 97av自拍| 天堂a√在线| 国产亚洲美州欧州综合国| 性欧美精品一区二区三区在线播放| 搞黄视频在线观看| 亚洲色图一区二区三区| 国产高清不卡无码视频| 国产h片在线观看| 欧美性色黄大片| 自拍一级黄色片| 日韩手机在线| 蜜臀久久99精品久久久无需会员 | 九色在线播放| 国产精品久久久久久久久免费桃花| 香蕉视频免费版| 成人女同在线观看| 欧美日韩国产首页| 精品人妻在线视频| 久久网站免费观看| 午夜精品在线观看| 艳妇乳肉豪妇荡乳av无码福利| 久久99精品国产麻豆不卡| 国产伦理久久久| 国产午夜视频在线观看| 亚洲乱码精品一二三四区日韩在线| 久久久久久久9| 国产一区二区三区影视| 91精品国产一区二区三区 | 在线成人视屏| 精品免费视频.| 一级黄色片网址| 狠狠噜噜久久| 国产精选久久久久久| 亚洲免费成人在线| 国产精品美女久久久久久久网站| 白白操在线视频| 成人看片网页| 亚洲国产一区自拍| 国精产品一区一区二区三区mba| 国产欧美一区二区三区国产幕精品| 91精品久久久久久久久久久久久| 天堂√在线中文官网在线| 亚洲免费观看高清完整版在线观看| 精品这里只有精品| 中韩乱幕日产无线码一区| 国产一区二区黄| 国产精品黄色网| 国产一区二区三区观看| 日韩亚洲视频| 日韩欧美一中文字暮专区| 日韩一区二区三区观看| 很污很黄的网站| 久久久久一区| 精品国产乱码一区二区三区四区| 成人毛片av在线| 欧美日韩精品系列| 无码人妻精品一区二区三应用大全| 欧美日韩99| 92国产精品视频| 日本高清在线观看wwwww色| 图片区日韩欧美亚洲| 91视频福利网| 在线中文一区| 亚洲综合大片69999| 黄色免费在线观看| 欧美精品一卡二卡| 国产中文字幕久久| 老司机一区二区| 亚洲一区二区三区色| 成人交换视频| 在线观看日韩欧美| 五月激情丁香网| 国产精品久久夜| 不卡av免费在线| 91亚洲一区| 91精品国产综合久久久久久蜜臀| 1769在线观看| 欧美美女网站色| 战狼4完整免费观看在线播放版| 蜜桃久久av一区| 午夜精品电影在线观看| 亚洲精品一区三区三区在线观看| 伊人成人开心激情综合网| 正在播放木下凛凛xv99| 日本一区二区三区国色天香 | 国产一区二区三区四区五区入口| 综合网五月天| 欧洲大片精品免费永久看nba| 久久成人这里只有精品| 亚洲第一成年人网站| 午夜精品视频一区| 加勒比一区二区| 奇米综合一区二区三区精品视频| 亚洲精品一区二| 国产精品视频一区视频二区| 欧美激情国产日韩精品一区18| 丰满肉肉bbwwbbww| 欧美日韩国产限制| 日本黄色网址大全| 国产乱码精品一区二区三区av| 欧美在线观看黄| 亚洲午夜久久| 国产美女精品视频免费观看| 9191在线播放| 亚洲国产精品推荐| 中文字幕黄色av| 一区二区三区中文在线| yy6080午夜| 免费看黄色91| 99在线免费视频观看| 精品中国亚洲| 成人做爰www免费看视频网站| 成人免费高清观看| 中国人与牲禽动交精品| 亚洲AV无码精品自拍| 日韩欧美中文在线| 欧美三级小视频| 久久亚洲精品国产精品紫薇| 艹b视频在线观看| 亚洲高清成人| 亚洲国产精品久久久久婷婷老年 | 精品国产日本| 成人短视频软件网站大全app| 国内精品久久久久影院 日本资源| 黄色av免费在线观看| 日韩精品一区在线| 看黄色一级大片| 香港成人在线视频| 亚洲女同二女同志奶水| zzijzzij亚洲日本少妇熟睡| 天天爽夜夜爽一区二区三区| 国内成人在线| 亚洲欧洲一区二区在线观看| 精品国产导航| 亚洲一区二区久久久久久| 国产精品迅雷| 欧美激情一级二级| 免费黄网站在线播放| 亚洲精选在线观看| 成人毛片视频免费看| 欧美日韩一卡二卡| 国产性一乱一性一伧一色| 亚洲精品一二三四区| 卡一卡二卡三在线观看| 26uuu亚洲综合色| 国产午夜在线一区二区三区| 国产在线麻豆精品观看| 亚洲综合色在线观看| 久久精品一区| 国内外成人激情视频| 好吊一区二区三区| 日本在线观看不卡| 乱中年女人伦av一区二区| 99三级在线| 成人a在线观看高清电影| 5566成人精品视频免费| 丁香花视频在线观看| 欧美激情高清视频| 日本精品600av| 美日韩精品视频免费看| 国产调教视频在线观看| 久久久999成人| 国产91在线视频蝌蚪| 日韩中文字幕免费| 日本在线视频观看| 色婷婷综合成人| 在线看女人毛片| 久久综合伊人77777蜜臀| 免费大片在线观看www| 深夜精品寂寞黄网站在线观看| av在线免费观看网站| 亚洲香蕉成人av网站在线观看| 色在线免费视频| 亚洲欧美中文在线视频| 久久久久久久影视| 亚洲天堂第二页| 二区三区在线| 综合国产在线观看| 手机在线免费av| 国产做受高潮69| 中文字幕在线高清| 日本精品久久久久影院| 外国成人直播| 国产精品自拍视频| 精品国产一区二区三区2021| 97se在线视频| 麻豆精品99| 精品免费日产一区一区三区免费| 成人精品亚洲| 可以免费看的黄色网址| 激情视频一区二区三区| 日本www在线播放| 日韩精品91亚洲二区在线观看 | 亚洲制服欧美久久| 欧美二区不卡| 免费av观看网址| 玖玖在线精品| 91插插插影院| 岛国精品一区二区| 国产调教在线观看| 亚洲精品国产成人久久av盗摄| 国产精品99re| 欧美主播一区二区三区美女| 国产精品久久久久久无人区| 精品久久人人做人人爱| 免费在线观看污视频| 日韩中文字幕在线观看| 成人在线免费观看黄色| 国产精品www网站| 国产精品欧美一区二区三区不卡 | 久久6免费高清热精品| 黄色亚洲网站| 7777奇米亚洲综合久久| 亚州国产精品| 亚洲在线视频一区二区| 日韩亚洲国产精品| 中文字幕亚洲欧洲| av毛片久久久久**hd| 日本 欧美 国产| 欧美日韩中文在线| 国产毛片一区二区三区va在线| 亚洲国产精品美女| 男女啪啪在线观看| 国产成人涩涩涩视频在线观看 | 偷拍亚洲欧洲综合| 一区二区精品视频在线观看| 日韩激情视频在线| 欧美性videos| 日韩av电影手机在线| 国产精品视频一区二区三区综合| 欧美亚洲免费高清在线观看| 综合久久亚洲| 成年网站在线播放| 91麻豆精品秘密| 久久午夜鲁丝片午夜精品| 欧美日韩国产一二三| 欧美日韩在线精品一区二区三区激情综| 最新的欧美黄色| 美女av在线免费看| 韩国一区二区三区美女美女秀| 香港欧美日韩三级黄色一级电影网站| 国产免费人做人爱午夜视频| 懂色av噜噜一区二区三区av| 日韩三级在线观看视频| 欧洲日韩一区二区三区| 午夜在线观看视频18| 欧美日韩国产999| 日韩欧美一区二区三区免费观看| 免费看成人片| 一区二区黄色| 男人网站在线观看| 亚洲国产欧美在线| 国产视频一区二区三| 日韩在线免费av| 国外成人福利视频| 日韩欧美电影一区二区| 中文一区二区| 亚洲一级黄色录像| 欧美艳星brazzers| 国产日本在线| 国产精品久久二区| 成人免费a**址| 在线观看高清免费视频| 国产欧美精品在线观看| 久久久蜜桃一区二区| 最近中文字幕日韩精品| 日韩美女在线| 免费成人进口网站| 国产一区二区电影| 久久久.www| 日韩免费观看高清完整版 | 超碰91人人草人人干| 亚洲精品第一| 一道本在线观看视频| 日韩成人伦理电影在线观看| 午夜国产小视频| 日韩欧美一区二区免费| 超清av在线| 久久久免费看| 日韩成人一级大片| 日本黄色录像视频| 日韩欧美国产综合在线一区二区三区| 在线观看完整版免费| 国产精品久久久久一区二区 | 国产亚洲精品v| 国产精品九九九九九| 欧美伊人久久久久久久久影院| 日本精品一区二区三区在线播放| 亚洲精品日产aⅴ| 亚洲国产三级| 日韩av片在线| 日韩一区二区免费电影| 国产蜜臀在线| 青青草原亚洲| 黄页视频在线91| 久久久精品91| 精品小视频在线| 亚洲最大的免费视频网站| www.欧美黄色| 久久久亚洲欧洲日产国码αv| 制服丝袜在线一区| 欧美高跟鞋交xxxxhd| 日韩av影院| 亚洲天堂国产视频| 亚洲综合丝袜美腿| 91在线网址| 国产日韩二区|