精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Agent RL和智能體自我進化的關鍵一步:TaskCraft實現復雜智能體任務的自動生成

人工智能 新聞
OPPO 研究院的研究者提出了 TaskCraft,一個面向智能體任務的自動化生成框架,旨在高效構建具備可擴展難度、多工具協同與可驗證執行路徑的智能體任務實例。

近年來,基于智能體的強化學習(Agent + RL)與智能體優化(Agent Optimization)在學術界引發了廣泛關注。然而,實現具備工具調用能力的端到端智能體訓練,首要瓶頸在于高質量任務數據的極度稀缺。當前如 GAIA 與 BrowserComp 等主流數據集在構建過程中高度依賴人工標注,因而在規模與任務復雜性方面均存在明顯限制——BrowserComp 僅涵蓋約 1300 個搜索任務,GAIA 則僅提供約 500 條多工具協同任務樣本。與基礎大模型訓練中動輒萬級以上的指令數據相比,差距十分顯著。

盡管在基礎模型階段,像 self-instruct 這樣的自監督方法已經借助大語言模型(LLM)成功構建了大規模的指令型數據,有效提升了模型的通用性和泛化能力,但在智能體(Agent)場景下,這類靜態指令數據卻難以滿足實際需求。原因在于,復雜的智能體任務通常需要模型與環境進行持續的動態交互,同時涉及多工具的協同操作和多步驟推理。而傳統的指令數據缺乏這種交互性和操作性,導致其在智能體訓練中遷移性差、適用性有限。

為應對上述挑戰,OPPO 研究院的研究者提出了 TaskCraft,一個面向智能體任務的自動化生成框架,旨在高效構建具備可擴展難度、多工具協同與可驗證執行路徑的智能體任務實例。TaskCraft 通過統一的流程化建構機制,擺脫了對人工標注的依賴,能夠系統性地產生覆蓋多種工具(如 URL、PDF、HTML、Image 等)的復雜任務場景,并支持任務目標的自動驗證,確保數據質量與執行閉環。 基于該框架,研究團隊構建并開源了一個包含約 41,000 條智能體任務的合成數據集,顯著擴展了現有 Agent 數據資源的規模與多樣性,為后續通用智能體的訓練與評估提供了有力支撐。

圖片

  • 論文標題:TaskCraft: Automated Generation of Agentic Tasks
  • 論文地址:https://arxiv.org/abs/2506.10055
  • Github:https://github.com/OPPO-PersonalAI/TaskCraft
  • 數據集:https://huggingface.co/datasets/PersonalAILab/TaskCraft

數據生成

生成過程主要分為兩大部分:第一部分 生成簡單且可驗證的原子任務;第二部分 通過深度拓展和寬度拓展,不斷構建新的原子任務,使復雜性逐步提升。

原子任務的生成

圖片

原子結構生成示意圖

可以簡單理解為,從原始數據中提取核心問題,然后確保問題必須通過特定工具來解決。整個流程包含以下四個關鍵步驟:

1.收集信息:系統從多種來源(網頁、PDF、圖片等)提取信息。例如,企業財報、一張統計圖或一篇新聞文章。

2.識別關鍵內容: 利用LLM從這些文檔中提取候選結論,比如:2025 年蘋果公司總收入為 383.3 億美元

3.生成問題:LLM需要將這些候選結論轉換為工具回答的問題。例如:“在財務報告《Apple 2025 年度報告》中,2025 年的總收入是多少?”(答案:383.3 億美元)

4.驗證任務:每個原子任務被保留必須滿足以下兩個條件:

  • 必須依賴工具才能解答( LLM 無法直接推導答案)。
  • 必須經過 Agent 驗證,確保能夠順利執行任務。

任務拓展

任務拓展旨在將一個簡單任務逐步演化為更具層次和挑戰性的復雜任務,使 Agent 必須通過多個步驟才能完成任務。拓展方式主要包括深度拓展寬度拓展

圖片

深度拓展示意圖

其中,深度拓展的目標是為了構建可被拆解為一系列相互依賴的任務。每一步都依賴前一步的結果,從而構建出一條多步推理鏈。其主要包括以下四步:

1.確認主任務與拓展標識符:拓展標識符一般是具有強特殊性的文本,往往作為獲取工具上下文的輸入關鍵字。例如對于任務:“電影《星際穿越》的導演是誰?”(答案:克里斯托弗·諾蘭),其中的拓展標識符是:《星際穿越》。

2.執行Agent搜索,構造新的輔助原子任務:Search Agent以拓展標識符為線索執行搜索,并從搜索結果中構造一個新的原子任務,其答案即為該拓展標識符。例如:“哪部美國著名科幻電影是在 2014 年 11 月 7 日上映的?”(答案:《星際穿越》)

3.合并輔助原子任務,更新主任務:將輔助原子任務與原主任務進行融合,構建一個邏輯連貫的復合任務。例如:“2014 年 11 月 7 日上映的美國著名科幻電影,它的導演是誰?“(答案:克里斯托弗·諾蘭)

4.驗證任務合理性:為了規避對合并問題的整體驗證,研究者采用了多種規則對合并后的主任務進行語義驗證,包括:超集驗證、關系驗證、信息泄露驗證、替換合理性驗證等。

而寬度拓展則是通過選擇兩個(或多個)結構兼容的原子任務,這些任務應來自同一信息源(如同一篇網頁或 PDF),且答案之間不存在因果依賴。使用 LLM 將多個任務的語義合并成一個自然、流暢且具備完整性的新任務

圖片

寬度拓展示意圖

通過 Prompt Learning 提升任務生成效率

在 TaskCraft 的任務構建流程中,Prompt 的設計起到了至關重要的作用。研究團隊采用了自舉式 few-shot 提示優化機制,基于生成的任務數據對提示進行了迭代優化,從而實現了提示模板的自我進化。如表1,實驗結果顯示,原子任務的生成通過率從初始的 54.9% 提高至 68.1%,同時平均生成時間減少了近 20%。在深度拓展任務中,6 輪任務擴展的成功率由 41% 提升至 51.2%,進一步驗證了生成數據在提升任務構建質量與效率方面的顯著效果。

圖片

表1 Prompt Learning實驗結果

對智能體基礎模型進行SFT訓練

其次,研究團隊進一步評估了 TaskCraft 所生成任務數據在提升大模型能力方面的實際效果。以 Qwen2.5-3B 系列為基礎,研究者基于三個典型的多跳問答數據集(HotpotQA、Musique 和 Bamboogle)的訓練集,生成了約32k條多跳任務以及軌跡,并利用這些生成數據對模型進行監督微調(SFT)。如表2,實驗結果表明,經過微調后,Base 模型的平均性能提升了 14%,Instruct 模型提升了 6%,說明 TaskCraft 生成的數據在增強大模型的推理能力與工具調用表現方面具有顯著成效。此外,當這些微調模型與強化學習方法 Search-R1 相結合時,模型性能進一步提升,進一步證明 TaskCraft 所生成的任務數據不僅能用于監督學習,也可作為強化學習的優質訓練起點。

圖片

表2 監督微調效果

此外,你可能會好奇:引入搜索 Agent 是否真的有必要?為此,研究團隊設計了一項對比實驗,比較了兩種任務構建方式的效果:一是直接使用 GPT-4.1 基于某個結論生成任務,另一種則是借助基于 GPT-4.1 的 Search Agent 自動生成任務。結果如表 3 所示,TaskCraft 構建范式在多項指標上表現更優。

圖片

表3任務構建范式的有效性分析

相比之下,TaskCraft 生成的任務具有顯著更高的通過率,驗證時間更短,且工具使用次數更符合“原子任務”的定義(理論最優為:一次輸入索引 + 一次目標工具調用)。此外,任務的工具調用次數也更穩定,方差更小,反映出 TaskCraft 在保持原子任務難度的一致性方面具備更強的優勢。 

圖片

原子數據域分布

基于 TaskCraft,研究者構建了一個包含約 41,000 個 agentic 任務的大規模數據集,為 AI 智能體的系統化調優與評估提供了堅實的基礎。該數據集覆蓋多個工具使用場景,包括網頁搜索、PDF 閱讀、圖像理解等,任務結構層次豐富,難度可控,支持原子級任務和多跳復雜任務。由于所有任務都附帶了真實的執行軌跡,不僅可以進行監督式微調(SFT),還能為強化學習(RL)提供高質量的訓練數據起點。這使得該數據集可廣泛應用于智能體基礎模型的能力增強、Agent 推理策略的評估,以及多工具調用環境下的泛化能力測試。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-31 02:00:00

智能體Agent人工超級智能

2024-06-13 09:20:26

2025-08-11 09:16:00

2025-09-05 09:54:44

2021-02-07 10:01:31

AI 數據人工智能

2025-10-13 09:46:12

2025-08-18 09:08:00

2025-08-28 07:09:00

智能體AI數據平臺

2025-05-20 08:00:45

2024-10-18 15:20:00

2024-07-23 14:10:48

2024-02-06 12:50:27

模型數據

2025-11-20 10:33:22

2021-09-07 10:06:00

人工智能機器學習技術

2025-06-10 04:00:00

2024-05-11 08:27:41

Agent智能體GPT

2025-04-01 08:05:00

智能體人工智能MCP
點贊
收藏

51CTO技術棧公眾號

91精品国产综合久久久久久漫画 | 亚洲啊啊啊啊啊| 91麻豆成人精品国产免费网站| 999国产精品永久免费视频app| 国产在线国偷精品免费看| 日韩在线小视频| 亚洲欧洲国产视频| 影视一区二区三区| 亚洲精品欧美专区| 麻豆精品传媒视频| 国产www视频| 久热综合在线亚洲精品| 欧美成人免费小视频| 无码人妻精品一区二区三区温州 | 日本一区二区在线免费观看| 78精品国产综合久久香蕉| 亚洲一区二区av电影| 日本一区二区免费看| 高清毛片aaaaaaaaa片| 秋霞电影网一区二区| 欧美极品xxxx| 大地资源高清在线视频观看| 欧美三级自拍| 精品乱码亚洲一区二区不卡| 一起操在线视频| 欧美日韩视频网站| 亚洲成人在线观看视频| 桥本有菜av在线| 成人不用播放器| 99riav久久精品riav| 91在线短视频| 国产伦精品一区二区三区四区 | 天堂a√中文在线| 国产精品一二三四| 成人羞羞国产免费| 综合久久中文字幕| 久久亚洲二区| 欧美亚洲国产视频| 日韩在线观看第一页| 欧美黄色精品| 欧美精品日韩www.p站| 欧美性生交大片| 久久国产中文字幕| 自拍偷拍免费精品| 国产美女免费网站| sdde在线播放一区二区| 亚洲精品中文字| 最近中文字幕无免费| 在线精品国产亚洲| 日韩一区二区三| 美女又黄又免费的视频| 日韩精品免费视频一区二区三区| 欧美日韩你懂的| 手机视频在线观看| 国产欧美自拍| 欧美日韩精品电影| 九九九九九伊人| 精品成人18| 日韩一卡二卡三卡| 韩国三级视频在线观看| 国产欧美啪啪| 日韩高清人体午夜| 成人免费无遮挡无码黄漫视频| 一本色道久久综合亚洲精品酒店| 亚洲精品一区av在线播放| 久操视频免费看| 香蕉视频一区二区三区| 亚洲欧美激情视频| 国产精品酒店视频| 91精品啪在线观看国产18| 久久伊人色综合| 麻豆changesxxx国产| 雨宫琴音一区二区在线| 欧美最猛性xxxxx免费| 91视频在线视频| 麻豆中文一区二区| 国产传媒一区二区三区| 日本精品专区| 国产精品久久久一本精品| 中文字幕在线乱| 爱福利在线视频| 色综合久久99| 在线视频观看一区二区| 国产精品1luya在线播放| 亚洲欧美另类中文字幕| 男人天堂资源网| 国产精品啊啊啊| 欧日韩不卡在线视频| 96亚洲精品久久久蜜桃| 成人av电影在线| 亚洲高清不卡一区| 成人片在线看| 色综合一个色综合亚洲| 亚洲精品在线网址| 九九亚洲视频| 色综合视频网站| 色老头一区二区| 国产精品91xxx| 日韩电影在线播放| 欧美黑人xx片| 欧美日韩免费一区二区三区 | 亚洲电影男人天堂| 日韩在线中文字幕| 日韩免费av片| 久久成人免费网站| 久久久久久久久久久久久久久久av | 一区二区三区在线视频111| 日本在线观看高清完整版| 日韩欧美国产免费播放| 韩国三级丰满少妇高潮| 久久av网址| 国内精品久久久久久中文字幕 | 国产女人被狂躁到高潮小说| 亚洲自啪免费| 99蜜桃在线观看免费视频网站| 美国一级片在线免费观看视频| 伊人色综合久久天天人手人婷| 日韩一级片播放| 欧美日韩一区二区三区在线电影 | 亚洲国产精品专区久久| 欧美做爰爽爽爽爽爽爽| 日韩国产欧美三级| 鲁丝一区二区三区免费| 国产理论电影在线| 91精品久久久久久久久99蜜臂| 青青草视频播放| 影音先锋中文字幕一区| 粉嫩精品一区二区三区在线观看 | 久久久久久香蕉网| 国产精品色综合| 欧美国产精品一区二区| aa免费在线观看| 偷窥自拍亚洲色图精选| 欧美激情一区二区三区成人| 99免费在线视频| 亚洲欧洲日韩女同| 日韩国产一区久久| 51漫画成人app入口| 日韩午夜在线影院| 亚洲最大的黄色网址| 久久国产精品99精品国产| 亚洲乱码一区二区三区三上悠亚| 亚洲天堂一区二区| 亚洲欧美日韩在线一区| 中文字幕国产在线观看| 2024国产精品视频| 国产69精品久久久久久久| 成人av影音| 久久免费在线观看| 手机在线精品视频| 精品福利在线视频| 国产日韩一区二区在线| 麻豆成人入口| 4438全国成人免费| 免费在线超碰| 欧美又粗又大又爽| 你懂得视频在线观看| 蜜桃视频第一区免费观看| 亚洲精品日韩精品| 亚洲人成777| 久久电影一区二区| 亚洲第九十九页| 午夜精品久久久| 国产精品无码一区二区三区免费| 另类国产ts人妖高潮视频| 日本不卡一区| 免费一区二区三区四区| 美女精品久久久| 免费国产黄色片| 日本高清成人免费播放| www.4hu95.com四虎| 另类小说综合欧美亚洲| 一级特黄妇女高潮| 人妖一区二区三区| 国产男人精品视频| 欧美精品videosex| 亚洲人成电影网站色| 一道本在线视频| 一区二区三区欧美久久| 欧美精品欧美极品欧美激情| 老司机精品视频网站| 在线看成人av电影| 成人av影音| 国产精品男人的天堂| a级片国产精品自在拍在线播放| 精品国产凹凸成av人导航| www.国产毛片| 一区二区三区免费| 人妻视频一区二区| 国产成人福利片| 欧美伦理视频在线观看| 欧美区日韩区| 欧美激情第一页在线观看| 亚洲色图图片| 日韩免费在线视频| 三级资源在线| 亚洲欧洲日韩国产| www.色呦呦| 欧美婷婷六月丁香综合色| 日韩精品视频免费播放| 国产欧美日韩久久| 中文字幕a在线观看| 久久精品国产成人一区二区三区| 久久久性生活视频| 仙踪林久久久久久久999| 精品欧美国产| 麻豆一二三区精品蜜桃| 国产91色在线| 国产高清在线a视频大全| 深夜福利亚洲导航| 每日更新在线观看av| 精品噜噜噜噜久久久久久久久试看| 国产精品sm调教免费专区| 午夜免费久久看| 欧美国产日韩在线观看成人| 偷偷操不一样的久久| 久久中文在线| 国产老熟妇精品观看| 99久久.com| 色狠狠久久av五月综合| 欧美中文一区| 成人免费在线看片| 日韩国产大片| 国产精品久久久久久久久久ktv| 超碰97国产精品人人cao| 久久在线免费视频| 黄色视屏免费在线观看| 中文字幕在线观看日韩| 黄色在线播放| 精品亚洲一区二区三区在线观看 | 亚洲人成免费电影| 日韩大片b站免费观看直播| 亚洲成在人线av| 亚洲第一色视频| 91精品国产综合久久久久久久久久 | 国产欧美日韩综合精品二区| 免费观看亚洲视频大全| 91精品视频一区| 亚洲aⅴ网站| 成人黄色大片在线免费观看| 国产精品久久久久久久久免费高清| 欧美自拍大量在线观看| 一区二区电影免费观看| 欧美做爰性生交视频| 欧美大片免费观看网址| 日韩av免费在线观看| 日韩电影免费观| 国产不卡av在线免费观看| 亚洲综合在线电影| 国产精品啪视频| 美女视频一区| 91免费看网站| 超碰成人在线观看| 久久久99爱| 国产精品亚洲二区| 亚洲精品国产精品国自产观看| 日韩av免费大片| 国产又爽又黄ai换脸| 你懂的国产精品永久在线| av久久久久久| 亚洲经典自拍| www.xxx亚洲| 国产综合久久久久影院| av电影中文字幕| 91老司机福利 在线| 成年人在线免费看片| 中文字幕在线观看一区| 精品久久久久久中文字幕动漫| 亚洲不卡在线视频| 色哟哟国产精品| 亚洲在线免费观看视频| 日韩午夜激情免费电影| 污污网站免费在线观看| 国产亚洲精品美女| av免费在线观看网址| 久久人91精品久久久久久不卡| 91精品论坛| 成人久久久久久久| 成人爽a毛片| 日本在线免费观看一区| 久久久久久免费视频| 免费一级特黄毛片| 日本女优在线视频一区二区| 亚洲在线观看网站| 91天堂素人约啪| 天天色天天综合| 污片在线观看一区二区| 中文字幕人妻色偷偷久久| 日韩一区二区三区四区| 久草在线青青草| 欧美激情免费视频| 韩国女主播一区二区| 岛国一区二区三区高清视频| 激情婷婷综合| 成年人看的毛片| 精品亚洲成a人| 欧美成人午夜精品免费| 日韩美女精品在线| 精品国产xxx| 日韩美女一区二区三区四区| 九色在线视频| 97在线观看视频国产| 精品视频一区二区三区在线观看| 欧美日韩亚洲一区二区三区在线观看| 久久久久午夜电影| 国产又黄又猛又粗又爽的视频| 成人性视频网站| 国产视频精品免费| 日本久久电影网| 性xxxx搡xxxxx搡欧美| 久久成年人免费电影| 欧美不卡高清一区二区三区| 精品国产电影| 精品999成人| 精品人妻一区二区三| 国产精品色噜噜| 91在线视频免费播放| 亚洲二区中文字幕| 三级资源在线| 好吊日精品视频| 精品一区二区中文字幕| 国产98色在线|日韩| 一区二区三区影视| 欧美性xxxxxx少妇| 国产日本在线| 国产91色在线免费| 亚洲大片精品免费| 一女被多男玩喷潮视频| 国产精品18久久久久久vr| 亚洲精品一区二区三区在线播放| 色婷婷av一区二区三区大白胸| 五月激情婷婷综合| 91精品国产高清| 国产96在线亚洲| 日韩中字在线观看| 成人久久久精品乱码一区二区三区| 国产精品老熟女一区二区| 欧美精品在线一区二区三区| 992tv免费直播在线观看| 国产精品第二页| 成人羞羞网站入口免费| 污污的网站18| 国产精品久久久久影院亚瑟| 中文人妻熟女乱又乱精品| 伊人男人综合视频网| 国产成人免费精品| 亚洲一区二区三区加勒比| 欧美aaaaa成人免费观看视频| 成熟人妻av无码专区| 欧美日韩在线精品一区二区三区激情 | 肉肉av福利一精品导航| 在线不卡av电影| 91福利资源站| 毛片在线播放a| 91成人免费在线观看| 黄页网站一区| 97人妻精品一区二区三区免 | 婷婷综合成人| 午夜激情福利在线| 亚洲欧洲色图综合| 国产视频第一页| 欧美性大战久久久| 亚洲成人激情小说| 国产精品成人一区二区三区夜夜夜| 中文字幕人妻一区二区三区视频 | 精品肉丝脚一区二区三区| 亚洲精品久久久久| 国产精品高清乱码在线观看| 亚洲一区二区在| 国产成人在线网站| 可以免费在线观看的av| 在线视频欧美日韩精品| 日韩中文在线| 男人天堂网视频| 国产精品白丝在线| 黄色www视频| 国产精品成人免费视频| 亚洲乱码电影| 欧美图片激情小说| 久久久久国产精品人| 国产精品区在线观看| 午夜精品一区二区三区在线播放 | 久久精品成人动漫| 给我免费播放日韩视频| 99视频在线视频| 一区二区欧美精品| 韩国三级av在线免费观看| 91在线视频成人| 久久高清国产| 久久久久亚洲av片无码下载蜜桃| 亚洲美女视频网| 久久久久久爱| 九九热在线免费| 亚洲成在人线在线播放| 亚洲搞黄视频| 欧美精品欧美精品| 懂色中文一区二区在线播放| 波多野结衣一区二区三区四区| 欧美黑人性视频| 久久在线视频免费观看|