精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MACT:如何用多Agent框架思路實現表格問答

發布于 2025-1-14 12:10
瀏覽
0收藏

1. 表格問答的現狀

表格問答(TQA,Table Question Answering)是指依據表格形式的數據來回答問題。表格問答任務的任務也越來越復雜,要解決這些復雜任務,就得執行多個推理步驟(多步驟)或者運用不同的推理策略(多類別)。。

處理 TQA 中這些復雜實例的一種常見方法是規劃,生成詳細的逐步計劃并引導推理過程。該方向有兩種方法:

? 針對開源大型語言模型(LLMs)進行微調,但微調需要高質量的數據,通常難以獲取

? 使用閉源的商業 LLMs,閉源商業 LLMs 成本高

為了解決以上問題,作者提出了一個結合工具使用的多智能體協作框架(MACT,Multi-Agent Collaboration with Tool)。既不依賴閉源 LLMs,也無需微調。

2. 什么是MACT?

MACT是一個為 TQA 配備了一組工具的多智能體協作框架。如下圖所示,包含了四個主要模塊:內存、規劃智能體、編碼智能體、工具集。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

MACT包括五個核心階段動作:動作生成、動作選擇、工具選擇/代碼創建、觀察計算以及內存狀態更新。

2.1 動作生成(Action Generation)

作者參考了ReAct方法,鑒于之前有研究表明生成動作時,一同生成想法能帶來性能的提升,所以作者采用了完整的ReAct方法:即想法、動作和觀察一起生成。

把一個動作定義為兩部分:意圖和指令。

例如,“檢索 [檢索法國和德國的出口數量]”。意圖是動作的目的,比如“檢索”就是從輸入表中提取信息。指令(用括號標記)詳細說明了意圖。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表展示了框架中定義的六種意圖類型及其對應的指令示例。

? 檢索:執行從表中提取信息的所有操作,包括直接查詢、過濾和分組。

? 計算:需要計算、計數或比較的指令則由“計算”來處理。

? 搜索:為了滿足表或文本上下文中不存在的外部(事實性)知識的需求,增加了“搜索”意圖。

? 讀取:涵蓋了表-文本問答中對上下文推理的需求,指的是從作為TQA實例提供的文本中提取信息的指令。

? 完成:規劃智能體停止生成更多動作,并結束迭代執行,提供相應的指令中的最終答案。

? 詢問:基于規劃智能體的內部知識來檢索答案.

2.2 動作選擇(Action Selection)

運用選擇函數從動作集合中挑選最有潛力的動作。選擇函數采用了自洽性(self-consistency),從采樣動作集合中輸出最頻繁的動作。若出現平局,則選擇最先采樣的那個最頻繁動作。

2.3 工具選擇與使用

為了滿足【搜索】、【計算】、【檢索】這些意圖,作者引入了一組工具:Wiki百科搜索工具、計算器工具、Python代碼工具。

? Wiki百科搜索工具:維基百科搜索API,接收指令中指定的目標實體,并返回相應維基百科條目的第一段。

? 計算器工具:由Python解釋器驅動,接受生成的公式,并輸出答案。“計算”的指令也可以是文本描述,比如“計算表中每個國家的平均獎牌數量”。

? Python代碼工具:【檢索】意圖由Python代碼工具完成,根據指令生成的Python代碼檢索表中的目標單元格,返回執行結果。

對于“讀取”“詢問”和“完成”,不使用工具。

3. 效果評估

對 MACT 在四個 TQA 基準上的性能與 SoTA TQA 系統進行了對比評估。

3.1 與其他TQA模型(框架)相比

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

如上圖所示,當GPT-3.5作為底層模型時,MACT超越了所有的TQA模型(除在 WTQ 上的 Mix-SC)。表明與單代理 TQA 模型相比,代理策略是有效的。

猜測MACT與 Mix-SC 之間的性能差距源于 Mix-SC 中特定于數據的表清理和答案格式控制。相比之下,MACT 不包含任何特定于數據集的預處理或后處理步驟,從而能普遍適用于任何數據集。

MACT 在各個數據集中都優于各種開源 LLM,證明了智能體的有效性。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表還給出了使用不同模型作為不同智能體部分的MACT的結果。

比如:MACT (Qw + CL)是指 Qwen 作為規劃代理,CodeLLaMA 作為編碼代理。

MACT (Qw + CL)比單獨使用 Qwen 和 CodeLLaMA 獲得了更高的 EM 分數,證明使用多個智能體進行規劃和編碼的有效性。

MACT (Qw + CL)在所有數據集中平均比 _SC(Qw + CL)高出約 6 個 EM 點,凸顯了我們的協作技術相對于簡單采用兩個獨立代理的最頻繁預測的優越性。我們還發現,擁有用于代碼生成的專家編碼代理(MACT (Qw + Qw)與 MACT (Qw + CL))顯著提高了性能。

3.2 與微調的TQA模型相比

MACT 在數據集之間的泛化能力優于微調的 TQA 系統。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表展示了與先前微調的 TQA 模型進行了比較。通常,微調模型在用于微調的數據集上的性能相當高,但在其他數據集上測試時 EM 會大幅下降。

相比之下,MACT 不使用微調模型,因此能夠應用于任何具有良好泛化性能的數據集。當使用 LlaMA-7b 作為規劃代理時,MACT 展現出了與 Protrix 相當的結果,盡管它未進行微調。使用更好的規劃代理會帶來更好的結果。這也體現了 MACT 在骨干模型方面的穩健性。

3.3 MACT調用LLM次數對比

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表展示了MACT與其他方法調用LLM次數對比。對于 Binder 和 Dater,無論問題復雜程度如何,SC 都執行固定次數。導致每個實例的提示數量很多,因而效率低下。

相比之下,MACT 在生成方面具有靈活性,因為迭代次數取決于問題的復雜性。例如,對于 WTQ,大多數問題可以在三步內解決,使得每個實例最多總共提示 25 次。如果結合效率優化模塊,這可能節省多達三分之一的迭代,每個實例的生成總數甚至更低(約 15 次),使 MACT 在效率方面與其他方法相當。MACT 的迭代性質可能導致更高的生成上限。然而,它也能處理更復雜的問題,使該方法更貼合現實生活的需求。

3.4 多智能體協作與工具使用的效果

通過三種情形展開消融研究,探究 MACT 中專業智能體和工具使用的有效性。

MACT:如何用多Agent框架思路實現表格問答-AI.x社區圖片

上表結果表明,工具和編碼工具均對框架性能有所貢獻。然而,它們對最終性能的貢獻各異。

比如,去除搜索工具對結果幾乎無影響,而進一步去除編碼代理和 Python 解釋器時,性能大幅下降。或許是由于工具和編碼代理的使用頻率所致。

發現搜索工具幾乎未被使用,而編碼代理在幾乎每次查詢中都會被調用。可能由于維基百科是 LLM 常見的預訓練語料庫,多數信息可能已被編碼。不過,鑒于 LLM 已知會出現幻覺且編碼知識可能未及時更新,搜索工具仍可能有所幫助。

消融操作對 WTQ 和 TAT 的影響大于 CRT 和 SCITAB。可能歸因于數據集特征:CRT 包含眾多是非問題,SCITAB 由三元分類數據集轉換而來。因此,在諸如 WTQ 和 TAT 這類答案分布更豐富的數據集上,猜測正確最終答案的幾率高于前者。通過評估 CRT 中除是非答案之外的實例,發現當消融工具和編碼代理時,性能下降 8.23 。

3.5 錯誤分析

從每個數據集中隨機抽取 MACT 失敗的 50 個實例并進行錯誤分析。

? 約一半的錯誤源自編碼代理生成的無效或錯誤代碼。要么是未能理解指令從而生成錯誤代碼,要么因復雜的表數據類型導致代碼執行不成功。這表明表預處理的重要性。

? 第二種錯誤類型可歸因于評估。發現約三分之一的失敗源于嚴格的評估指標(精確匹配準確率)。這對 TAT 數據集上 MACT 的性能影響最大,因為其答案為長文本字符串。

? 其余錯誤情況在很大程度上可歸咎于規劃代理的失敗。意味著規劃代理未能正確分解問題。

4. 局限性

? 由于具備多表復雜推理的數據集稀缺,MACT 主要在單表設置下進行評估。雖然該框架通過在輸入中連接多個表能夠輕松擴展以處理多表情況,但在多表設置中的效果尚不明確。

? 僅在英語語境中研究 TQA,然而存在眾多多語言 TQA 基準和挑戰。

本文轉載自 ??大語言模型論文跟蹤??,作者:HuggingAGI

收藏
回復
舉報
回復
相關推薦
日韩免费福利电影在线观看| 亚洲国产精品成人综合色在线婷婷| 欧美成人免费大片| 亚洲一区二区三区黄色| 伊人久久综合一区二区| 国产精品久久久一本精品| 91原创国产| 日本黄色一级视频| 欧美激情第8页| 亚洲视屏在线播放| 精产国品一区二区三区| 黄色综合网址| 一区二区欧美视频| 亚洲欧美一区二区原创| 人成网站在线观看| 免费看精品久久片| 午夜精品久久久久久久久久久久久 | 女人天堂av在线播放| 日本一区二区免费在线| 国产一区二区三区黄| 国产女18毛片多18精品| 丝袜a∨在线一区二区三区不卡| 九九精品视频在线观看| 国产午夜精品久久久久久久久| 久久九九热re6这里有精品| 欧美少妇性性性| 欧美网站免费观看| 啪啪免费视频一区| 成人欧美一区二区三区1314| 欧美成人第一区| 国产综合在线播放| 国产黄色精品视频| 成人h片在线播放免费网站| 中文人妻av久久人妻18| 亚洲精品在线二区| 欧美激情免费观看| √天堂中文官网8在线| 清纯唯美日韩| 亚洲情综合五月天| 极品白嫩丰满美女无套| 给我免费播放日韩视频| 欧美一区二区三区在线观看| 亚洲xxx在线观看| av免费在线一区| 色狠狠一区二区| 精品久久久久av| 成人美女大片| 日韩欧美中文字幕在线播放| 日本一区午夜艳熟免费| 黄色大片在线| 亚洲国产成人av好男人在线观看| 国产在线观看欧美| 免费不卡av| 亚洲国产日韩a在线播放性色| 成人手机视频在线| 丝袜美腿美女被狂躁在线观看| 欧美激情中文字幕| 中文字幕久久综合| 成a人片在线观看| 怡红院av一区二区三区| 四虎4hu永久免费入口| 羞羞网站在线看| 亚洲一区二区三区四区的| 嫩草影院中文字幕| 超碰在线公开| 欧美日韩亚洲激情| av免费网站观看| 成人福利片在线| 制服丝袜亚洲网站| 日本女人性视频| 加勒比色老久久爱综合网| 日韩精品免费电影| 在线国产视频一区| 97精品97| 欧美夫妻性视频| 日韩av在线电影| 老司机一区二区三区| 国产成人综合亚洲| 97国产精品久久久| 成人精品视频一区二区三区尤物| 国产一区二区三区无遮挡| 三级视频网站在线| 国产欧美日韩综合| 老司机午夜免费福利视频| 人人澡人人添人人爽一区二区| 午夜av区久久| 91n.com在线观看| 国产精品成人**免费视频| 日韩欧美视频在线| 精品88久久久久88久久久| 乱亲女秽乱长久久久| 精品亚洲乱码一区二区 | 成人做爰69片免费看网站| 精品国产一区二区三区免费| 成人高清网站| 一区二区三区日韩精品视频| 少妇高潮喷水久久久久久久久久| 国产第一亚洲| 精品国产一区二区三区不卡| 女女互磨互喷水高潮les呻吟 | 日本在线xxx| 丁香婷婷久久| 亚洲精品www| 久久久精品少妇| 午夜亚洲福利在线老司机| 成人免费福利视频| 日本一区二区三区在线观看视频| 亚洲欧洲日产国码二区| av免费观看大全| 国产第一精品| 亚洲日本成人女熟在线观看| 免费人成年激情视频在线观看| 日日夜夜一区二区| 国产亚洲一区二区三区在线播放| 午夜免费福利在线观看| 色妞www精品视频| 天天躁日日躁狠狠躁免费麻豆| 日韩激情免费| 国产福利精品视频| 午夜国产在线视频| 亚洲一区二区三区四区在线免费观看| 国产91色在线观看| 亚洲女娇小黑人粗硬| 欧美国产日韩一区二区在线观看 | 亚洲一区综合| 亚洲最大网站| 亚洲国产小视频在线观看| 国产性生活大片| 日韩电影在线观看网站| 久久久福利视频| 草草影院在线| 精品国产免费久久| 欧美成人综合色| 激情国产一区二区| 一级日韩一区在线观看| 日韩成人高清| 亚洲夜晚福利在线观看| 久久精品视频7| 91在线看国产| 亚洲午夜无码av毛片久久| 狠狠久久伊人| 午夜精品一区二区三区视频免费看 | 日韩1区2区3区| 欧美午夜视频在线| 国产精品伦理| 亚洲欧美一区二区激情| 亚洲成人第一网站| 久久精品在线观看| 国产真人无码作爱视频免费| 国产一区二区三区日韩精品| 日本一区二区在线播放| 国产日韩精品在线看| 色狠狠桃花综合| 日本污视频网站| 久久精品国产第一区二区三区| 亚洲精品第一区二区三区| 欧美亚洲黄色| 久久国产色av| 欧美 日韩 国产 成人 在线 91| 亚洲mv大片欧洲mv大片精品| 国产熟女高潮一区二区三区| 午夜影院日韩| 日本一区二区三不卡| 成人国产一区| 久色乳综合思思在线视频| www黄色网址| 午夜a成v人精品| 久久精品国产亚洲av久| 蜜臀av性久久久久蜜臀aⅴ流畅 | 欧美天堂一区二区三区| 色欲一区二区三区精品a片| 国产精品资源在线观看| 九一国产精品视频| 人人狠狠综合久久亚洲婷| 成人免费视频网| 国产www视频在线观看| 日韩精品免费在线视频观看| 夜夜躁狠狠躁日日躁av| 一级中文字幕一区二区| 日韩乱码人妻无码中文字幕久久| 日韩精品欧美成人高清一区二区| 秋霞在线一区二区| 日韩欧美中文字幕电影| 国产精品青草久久久久福利99| 影院在线观看全集免费观看| 亚洲精品国产免费| 伊人成人在线观看| 亚洲va在线va天堂| 天天爽天天爽天天爽| www.成人在线| 亚洲一区精品视频在线观看| 1000部精品久久久久久久久| 日韩免费电影一区二区| 综合伊人久久| 国产精品久久久久久久久影视| 性欧美videos高清hd4k| 国产亚洲xxx| 草草视频在线播放| 日本精品视频一区二区| 国产亚洲精品久久久久久打不开| 国产性天天综合网| 久久综合在线观看| 久久久久久久尹人综合网亚洲| 中文字幕の友人北条麻妃| 九九综合在线| 国产欧美一区二区三区不卡高清| 成人综合网站| 热99精品只有里视频精品| 亚洲91av| 久久精品成人一区二区三区| 三级在线播放| 亚洲成人网久久久| 国产日韩欧美视频在线观看| 欧美制服丝袜第一页| 西西44rtwww国产精品| 一区二区三区国产| 亚洲国产123| 国产人成一区二区三区影院| 美女又爽又黄视频毛茸茸| 国产成人日日夜夜| 天天干天天色天天干| 久久在线精品| 丰满少妇被猛烈进入高清播放| 黄色成人在线网址| 99久久99久久精品| 五月久久久综合一区二区小说| 日韩精品国内| 九一国产精品| 欧美激情第一页在线观看| 精品按摩偷拍| 国产一区二区三区av在线| 欧美午夜在线播放| 91中文在线观看| 色999久久久精品人人澡69| 国产美女久久精品| 欧美暴力调教| 国产精品久久一| 国产精品第一| 国产日产亚洲精品| 电影中文字幕一区二区| 成人中文字幕+乱码+中文字幕| 日韩在线电影| 91影视免费在线观看| 亚洲综合资源| 亚洲影院色无极综合| 国产精品毛片无码| 成人羞羞国产免费| 日本精品在线观看| 国产激情一区二区三区在线观看| 欧美欧美在线| 激情小说网站亚洲综合网| 狼人天天伊人久久| 欧洲精品码一区二区三区免费看| 一区二区小说| 日韩三级在线播放| 欧美激情电影| 欧美日韩激情四射| 亚洲影院免费| 久久久久久三级| 激情五月激情综合网| 国产老头和老头xxxx×| 99久久综合精品| 三级网站在线免费观看| 国产精品理伦片| 91在线播放观看| 黄色精品一区二区| 中文字幕在线观看免费| 正在播放亚洲一区| 韩国av电影在线观看| 亚洲性线免费观看视频成熟| 秋霞a级毛片在线看| 欧美韩日一区二区| 丁香六月综合| 91久久精品国产91久久| 国产欧美一区二区三区米奇| 欧美精品尤物在线| 亚洲一区二区三区| 日韩黄色短视频| 日韩—二三区免费观看av| 日韩a一级欧美一级| heyzo一本久久综合| 91成人精品一区二区| 亚洲一区二区三区四区在线观看| 亚洲GV成人无码久久精品| 91麻豆精品国产91久久久久久 | 国语对白做受69| 日本精品网站| 国产欧美日韩综合精品二区| 精品精品99| 国产xxxx振车| 另类小说一区二区三区| 星空大象在线观看免费播放| 中文字幕中文在线不卡住| 国产污视频在线观看| 欧美日韩综合色| 亚洲区小说区图片区| 久久夜色撩人精品| 日韩a**中文字幕| www日韩av| 欧美国产一级| 日韩手机在线观看视频| 成人午夜av电影| 欧美一级特黄高清视频| 色综合天天综合色综合av| 国产刺激高潮av| 久久伊人精品视频| 成人毛片免费| 久久精品国产精品青草色艺| 欧美成人日本| 在线观看免费av网址| 久久久久青草大香线综合精品| 久青草视频在线观看| 91精品麻豆日日躁夜夜躁| 懂色av中文在线| 欧美亚洲另类视频| 91蜜桃臀久久一区二区| 成年人视频大全| 极品美女销魂一区二区三区| 日本高清黄色片| 在线视频欧美精品| 日本福利午夜视频在线| 国产综合在线视频| 午夜日韩影院| 警花观音坐莲激情销魂小说| 久久99日本精品| 欧美成人短视频| 欧美性色综合网| p色视频免费在线观看| 欧洲精品在线视频| 色综合久久中文| 热99这里只有精品| 97国产一区二区| 圆产精品久久久久久久久久久| 日韩精品在线一区| 人妖欧美1区| 国产精品一区视频| 亚洲精选在线| 强迫凌虐淫辱の牝奴在线观看| 亚洲图片一区二区| 无套内谢的新婚少妇国语播放| 久久久久久中文字幕| www.丝袜精品| 欧美不卡在线播放| 久久夜色精品一区| 激情网站在线观看| 中文字幕av一区中文字幕天堂| 精品网站在线| 中文字幕制服丝袜在线| 国产原创一区二区| 欧美成人aaa片一区国产精品| 欧美不卡123| 91福利在线免费| 久久久久久a亚洲欧洲aⅴ| 亚洲欧美日韩一区在线观看| 精品人伦一区二区三电影 | 日本高清一区二区视频| 亚洲欧美区自拍先锋| 亚洲国产精品久久久久爰性色| 久久久久久国产精品| 亚洲第一福利专区| 久久久久久久片| 综合自拍亚洲综合图不卡区| 国产情侣激情自拍| 韩国三级电影久久久久久| 久久99高清| 三区视频在线观看| 亚洲午夜成aⅴ人片| 丝袜视频国产在线播放| 国产精品美女主播| 欧美91精品| 在线 丝袜 欧美 日韩 制服| 欧美性大战久久久久久久蜜臀| 麻豆电影在线播放| 精品高清视频| 日本vs亚洲vs韩国一区三区 | 99国内精品久久久久久久软件| 亚洲人成久久| 东方伊人免费在线观看| 日韩一区二区精品在线观看| 欧美在线极品| 伊人婷婷久久| 99热这里都是精品| 亚洲天堂男人网| 欧美激情小视频| 国内精品久久久久久99蜜桃| 91香蕉视频在线观看视频| 欧美丝袜一区二区三区| 欧美性videos| 久久久久久久有限公司| 狠狠色丁香婷婷综合| 午夜毛片在线观看| 久久综合色影院| 亚洲人成亚洲精品| 国产chinesehd精品露脸| 色婷婷av一区二区三区之一色屋| 污污视频在线| 亚洲人成影视在线观看| 99免费精品在线观看| av av片在线看| 国产精品偷伦一区二区|