精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

智能體系統如何「邊做邊學」?斯坦福團隊探索在線優化的新范式

人工智能 新聞
斯坦福大學聯合德州農工大學(Texas A&M)、加州大學圣地亞哥分校(UC San Diego)和 Lambda 的研究團隊提出了 AgentFlow 框架,通過多個獨立 Agent 模塊協作,并且提出 Flow-GRPO 算法用于訓練。

如何讓智能體進行復雜推理與工具調用?傳統方法主要有兩類:訓練單一的大語言模型,使其同時承擔思考與工具調用的任務;要么依賴靜態提示詞驅動的 training-free 智能體系統。

然而,前者在長鏈推理、工具多樣化與動態環境反饋下訓練常變得不穩定,缺乏可擴展性(scalability);后者則缺少學習與適應能力,難以應對復雜場景。

為此,斯坦福大學聯合德州農工大學(Texas A&M)、加州大學圣地亞哥分校(UC San Diego)和 Lambda 的研究團隊提出了 AgentFlow 框架,通過多個獨立 Agent 模塊協作,并且提出 Flow-GRPO 算法用于訓練。在評測中,AgentFlow 在搜索、代理、數學與科學任務上均取得顯著提升,即便是 3B 模型,也能超越 405B 的 Llama-3.1 和 200B 的 GPT-4o。

該方法創新性地將智能體協作推理與強化學習融為一體,提出流中強化學習機制,讓智能體系統在推理流中協同演化,形成「動態共振」效應。使其在長期規劃能力、工具調用效率和動態推理深度上實現大幅提升,并在搜索、數學、科學及智能體任務等多個領域展現優秀的泛化能力。

  • 項目主頁:https://agentflow.stanford.edu/
  • 論文鏈接:https://huggingface.co/papers/2510.05592
  • 開源代碼:https://github.com/lupantech/AgentFlow
  • 開源模型:https://huggingface.co/AgentFlow
  • 在線 Demo:https://huggingface.co/spaces/AgentFlow/agentflow
  • YouTube 視頻:https://www.youtube.com/watch?v=kIQbCQIH1SI

該工作目前不僅在 X 上收獲了超高的關注度,同時榮登 Huggingface Paper 日榜第二名!

https://x.com/lupantech/status/1976016000345919803

https://huggingface.co/papers/date/2025-10-08

研究動機:

從「單兵作戰」到「團隊協作」 

目前,讓語言模型學會使用工具進行復雜任務推理主要有兩種思路:一種是訓練一個「全能型」模型,讓它既要思考又要調用工具,所有操作都在一個完整的上下文中交織進行;另一種是采用「智能體系統」,將任務分解給多個專門化的智能體模塊協同完成。

第一種方法在簡單場景中表現良好,但在面對長鏈推理、多樣化工具調用以及動態環境反饋時,訓練過程往往不穩定,難以實現良好的可擴展性。第二種方法雖然具備更高的靈活性,但多數系統依賴人工設計的提示詞與邏輯,缺乏從經驗中自我學習與優化的能力。

這使得研究團隊思考:能否讓智能體系統也具備「邊做邊學」的能力,使其能夠在交互中不斷進化?

AgentFlow:

在流中學習的智能體系統

為了解決以上挑戰,研究團隊提出了 AgentFlow —— 一個可訓練的、工具集成的智能體系統,旨在突破現有方法在可擴展性與泛化能力上的限制。AgentFlow 采用了模塊化的智能體結構,由四個具備記憶能力的專門化智能體協同配合,共同完成復雜推理,從而實現「即時學習」:

  • 規劃器(Action Planner):分析任務、制定策略并選擇最合適的工具
  • 執行器(Tool Executor):調用工具集并整合工具執行結果
  • 驗證器(Verifier):基于系統維護的累積記憶評估中間結果是否滿足目標與約束 
  • 生成器(Generator):整合所有信息與驗證反饋,生成最終答案或行動建議

AgentFlow 的關鍵創新在于:規劃器(Planner)并非固定不變,而是能夠在智能體交互的「流」(flow)中實時進行 on-policy 優化,使決策過程隨著環境變化及其他智能體的反饋不斷自適應進化。通過這一機制,各模塊在推理流中協同演化,使整個智能體系統在復雜環境下實現自適應推理(adaptive reasoning)與魯棒工具調用(robust tool-calling)。

Flow-GRPO:

流中強化學習優化算法

實現智能體流中強化學習訓練的核心挑戰在于多輪信用分配(multi-turn credit assignment):即如何在長時跨度(long-horizon)且獎勵稀疏(sparse reward)的條件下,穩定且高效地訓練。為此團隊提出動作級別的(Action Level)的多輪推理優化目標:

通過將軌跡最終結果的成功或失敗信號(outcome reward)廣播至每一步,將原本復雜的多輪強化學習問題轉化為一系列可處理的單輪策略更新。該方法不僅緩解了獎勵稀疏問題,還顯著提升了訓練效率,為智能體在復雜多輪推理中的穩定學習提供了基礎。

實驗結果:

AgentFlow 全面基準測試

為了充分評估 AgentFlow 的泛化能力與高效性,研究團隊在 10 個跨各個領域的基準測試上進行了系統評測,涵蓋知識檢索、智能體任務、數學推理和科學推理四大類。 以 Qwen-2.5-7B-Instruct 為基座模型的 AgentFlow 在各項基準上均超越現有領先方法:

  • 知識檢索(Search):提升 +14.9%
  • 智能體推理(Agentic Reasoning):提升 +14.0%
  • 數學推理(Math):提升 +14.5%
  • 科學推理(Science):提升 +4.1% 

值得注意的是,AgentFlow 的表現甚至超過了大規模的專有模型,如 GPT-4o(~200B)。

實驗發現:

小模型的「大智慧」

研究團隊在 10 個基準測試上進行了評估,涵蓋知識檢索、智能體任務、數學推理和科學推理四大類。 一些有趣的發現:

  • 模型規模不是唯一答案

使用 7B 參數的 AgentFlow 在多個任務上超過了約 200B 參數的 GPT-4o,Llama3.1-405B,在搜索任務上領先 8.2%,在智能體任務上領先 15.8%。這再一次展現了,合理的系統設計和訓練方法可能比單純堆砌參數訓練 All in one 的大模型更有效。

  • 「在流中學習」至關重要

對比實驗顯示,若采用離線監督學習(SFT)方式訓練規劃器,性能反而顯著下降,平均降低 19%。這表明,智能體在真實交互環境「流」中進行在線學習是實現高效推理的必要條件。此外,盡管 AgentFlow 的推理流本身能夠利用其強大的任務分解能力帶來顯著性能提升,但仍可能出現循環錯誤或卡頓問題。通過在真實環境中的訓練,智能體系統展現出快速修正錯誤的工具調用、更精細的子任務規劃,以及全局任務解決性能的提升。

這些結果進一步證明了模塊協作機制以及流中強化學習在提升多輪智能體系統穩定性與效率方面的顯著作用。

  • 自主發現新的解決路徑

有意思的是,經過 Flow-GRPO 的強化訓練規劃器,系統學會了根據任務特點選擇合適的工具組合;同時,經過訓練的系統會自發探索出新的工具使用模式,比如組合使用維基百科搜索(Wikipedia Search)和特定網頁增強搜索(Web Search)的連招,通過工具鏈獲得更加深入地信息挖掘,而這些模式幾乎沒有在未訓練的推理流中出現。

  • 動態推理深度與性能提升

對于相同的數據集下的不同難度任務:譬如說多跳搜索(Multihop Search),智能體任務中的密集長鏈推理任務,AgentFlow 在經過 Flow-GRPO 訓練后能夠隨著最大限制推理步數的上升穩步提升性能,同時又不會大幅提升平均推理步數——這表示對于長難任務會增加有效的推理步數來提升正確率,而不會一味地所有任務都隨著最大輪數限制而延長推理步數。

結語

AgentFlow 為智能體訓練提供了一種全新的思路:與其追求一個功能完備的單一大語言模型或「一次性完美」的智能體系統,不如讓智能體在系統中自我適應與持續學習。通過將群體智能與「邊做邊學」的范式相結合,AgentFlow 使智能體系統能夠在協同演化中不斷優化,從而高效應對復雜任務。

盡管從研究探索到實際應用仍有較長的距離,但這樣的工作讓我們看到:Agentic AI 依然蘊藏著巨大的潛力與想象空間。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-24 12:07:12

2025-09-08 09:10:00

2023-07-07 17:03:23

AI智能

2013-01-31 09:45:14

斯坦福超級電腦百萬內核

2012-03-21 21:38:27

蘋果

2021-07-06 10:37:37

模型人工智能深度學習

2025-07-03 05:00:00

2024-10-21 12:40:00

視頻生成模型

2018-08-13 21:19:07

Weld開源數據

2023-02-14 09:45:11

模型測試

2024-09-26 10:23:46

2019-03-27 10:47:05

人工智能法律AI

2024-10-17 10:23:26

2009-05-19 09:06:41

Apple斯坦福iPhone

2019-12-16 14:33:01

AI人工智能斯坦福

2025-06-04 08:00:00

2022-08-29 14:43:24

斯坦福大學李飛飛AI

2024-07-22 08:00:00

機器人虛擬

2023-08-10 14:01:08

開源虛擬

2024-05-06 07:10:00

李飛飛智能空間
點贊
收藏

51CTO技術棧公眾號

亚洲激情在线观看视频免费| 性xxxx视频播放免费| av午夜在线观看| 成人app下载| 66m—66摸成人免费视频| 毛茸茸多毛bbb毛多视频| 日韩高清在线| 亚洲精品欧美在线| 精品国产乱码久久久久| 日韩免费av网站| 久久久久电影| 日韩欧美一级片| 欧洲av无码放荡人妇网站| 婷婷成人激情| 99re免费视频精品全部| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 天天av天天操| 漫画在线观看av| 亚洲同性同志一二三专区| 精品国产一二| 国产激情久久久久久熟女老人av| 久久一区欧美| 欧美激情极品视频| 国产主播av在线| 欧美交a欧美精品喷水| 欧美午夜电影网| 自拍日韩亚洲一区在线| 国产午夜精品久久久久免费视| 99久久精品99国产精品| 99国产盗摄| 成人黄色片在线观看| 精品99视频| 色狠狠久久aa北条麻妃| 男女黄床上色视频| 欧美黑白配在线| 精品国产sm最大网站免费看| 日韩av一卡二卡三卡| 国模套图日韩精品一区二区| 亚洲国产精品精华液网站| 小说区视频区图片区| 中文字幕av日韩精品| 国产一区二区视频在线观看免费| 欧美猛男男男激情videos| 精品少妇一区二区三区| 欧美国产日韩另类| 午夜av成人| 色播五月激情综合网| av日韩一区二区三区| 天天干在线视频论坛| 亚洲视频一区二区在线观看| 亚洲精品国产一区| 可以在线观看的av网站| 91丨porny丨国产入口| 国产亚洲欧美一区二区| 粉嫩av一区二区夜夜嗨| 国产成人三级在线观看| 亚洲精品免费在线视频| 国产日韩欧美一区二区东京热| 美洲天堂一区二卡三卡四卡视频| 国产精品扒开腿做| 国产亚洲欧美日韩高清| 日韩精品一级中文字幕精品视频免费观看 | 日韩欧美成人网| 成 年 人 黄 色 大 片大 全| 里番在线播放| 亚洲一二三四久久| 精品人妻少妇一区二区| 丁香花在线影院| 亚洲成人你懂的| 国产3p露脸普通话对白| 9999精品成人免费毛片在线看| 亚洲超丰满肉感bbw| 久久久久免费看黄a片app| 国产高清中文字幕| 50路60路老熟妇啪啪| 免费一区二区三区在在线视频| 日韩精品乱码久久久久久| 亚洲青色在线| 欧美亚洲国产另类| 无码任你躁久久久久久久| 日本中文在线一区| 成人两性免费视频| 成 人 黄 色 片 在线播放| 国产成人精品三级麻豆| 国产福利久久| 青青草视频在线观看| 久久综合久色欧美综合狠狠| 欧美一区二区三区成人久久片| 国产特黄在线| 亚洲日本青草视频在线怡红院| 久久久天堂国产精品| 超碰高清在线| 日本久久一区二区三区| 岛国av免费在线| 在这里有精品| 亚洲男人天堂2024| 国产高清视频免费在线观看| 国语自产精品视频在线看8查询8| 2019中文字幕在线| 中文字幕人妻丝袜乱一区三区| 国产一区二区不卡| 久精品国产欧美| 99青草视频在线播放视| 一区二区三区中文免费| 国产综合免费视频| 欧美三级一区| 亚洲毛茸茸少妇高潮呻吟| 中文字幕第69页| 在线日本高清免费不卡| 国产不卡视频在线| 国产理论片在线观看| 91在线精品秘密一区二区| 亚洲综合欧美日韩| 男人av在线播放| 91精品国产综合久久久久久久| 99re久久精品国产| 综合激情网站| 国产精品日韩精品| 四虎电影院在线观看| 亚洲欧美激情小说另类| 亚洲色精品三区二区一区| 97久久亚洲| 日韩在线视频免费观看高清中文| 久久精品一偷一偷国产| 亚洲av熟女高潮一区二区| 日韩欧美在线中字| 欧美亚洲国产视频小说| xxxwww在线观看| 国产精品伦理一区二区| 不卡影院一区二区| 欧美美女啪啪| 欧美国产高跟鞋裸体秀xxxhd| 一区二区视频在线免费观看| 91蜜桃网址入口| 免费视频爱爱太爽了| 91麻豆精品国产综合久久久| 亚洲小视频在线观看| 九九热在线视频播放| 成人性生交大合| 中国女人做爰视频| 日本一区二区中文字幕| 在线播放日韩av| 色老头一区二区| 久久综合久久综合久久综合| 欧美极品欧美精品欧美| 国产96在线亚洲| 欧美黄色小视频| 国产高清不卡视频| 亚洲啪啪综合av一区二区三区| 少妇一级淫免费播放| 欧美精品一区二区久久| 国产不卡视频在线| 第一页在线观看| 91国产丝袜在线播放| 在线免费观看麻豆| 久久久精品午夜少妇| 欧美日韩国产免费一区二区三区 | 91欧美激情一区二区三区成人| 97在线国产视频| 福利在线一区| 欧美在线视频在线播放完整版免费观看 | 91在线中文| 精品三级av在线| 国产精品.www| 99久久99久久综合| 亚洲成熟丰满熟妇高潮xxxxx| 中文字幕伦av一区二区邻居| 国产va免费精品高清在线| 都市激情在线视频| 欧美色爱综合网| 182在线观看视频| 国产黄色精品视频| 国产精品无码av在线播放| 思热99re视热频这里只精品| 日本中文字幕久久看| av影片免费在线观看| 91福利社在线观看| 99热6这里只有精品| 麻豆精品新av中文字幕| 亚洲一区 在线播放| 超碰在线成人| 日韩av日韩在线观看| 日本在线人成| 精品国产人成亚洲区| 青草青青在线视频| 在线观看xxxx| 国产精品成人一区二区三区夜夜夜 | 中文字幕在线1| 精品制服美女久久| 久久久久久人妻一区二区三区| 自拍视频一区| 91在线精品视频| 麻豆蜜桃在线观看| 色悠悠久久88| 嫩草影院一区二区| 欧美视频一区二区| 国产大片中文字幕| 国产精品人妖ts系列视频| 91精品又粗又猛又爽| 三级欧美在线一区| 免费极品av一视觉盛宴| 欧美人与拘性视交免费看| 91美女福利视频高清| 中文字幕乱码中文乱码51精品| 久久精品99久久久久久久久| 天堂网在线资源| 欧美精品粉嫩高潮一区二区| 成人毛片18女人毛片| 亚洲视频图片小说| 精品少妇一区二区三区免费观| 国产美女久久久久| 成年人视频在线免费| 国产精品v欧美精品v日本精品动漫| 欧美亚洲精品日韩| 国产66精品| 91久久国产自产拍夜夜嗨| 成人在线高清| 91国内产香蕉| 日本资源在线| 日韩视频免费在线观看| 你懂的好爽在线观看| 欧美精品一区二区三区蜜桃 | 91精品国产高清一区二区三区蜜臀| 免费看日韩毛片| 亚洲精品国产a| 亚洲激情图片网| 99久久亚洲精品| 国产一区二区在线影院| 91黄色在线看| 亚洲成av人电影| 亚洲国产精品一区在线观看不卡 | 牛牛精品在线视频| 日韩一区二区在线视频| 国产香蕉视频在线看| 亚洲精品suv精品一区二区| 亚洲a视频在线| 欧美一区二区三区视频免费| 中文字幕人妻精品一区| 欧美在线免费视屏| 黄色av网站免费| 色综合久久久久久久| 国产成人无码精品亚洲| 亚洲成人自拍网| 青青草免费av| 亚洲三级电影网站| 永久看片925tv| 中文字幕综合网| 波兰性xxxxx极品hd| 国产精品免费久久久久| 黑人と日本人の交わりビデオ| 国产性天天综合网| 丰腴饱满的极品熟妇| 久久久综合网站| 成人精品999| 久久嫩草精品久久久精品| fc2在线中文字幕| 精品在线观看免费| 能在线观看的av网站| 妖精视频成人观看www| 青青在线视频免费观看| 午夜久久黄色| 欧美乱做爰xxxⅹ久久久| 欧美欧美全黄| 日本一本中文字幕| 99av国产精品欲麻豆| 热99这里只有精品| 久久av最新网址| 日韩视频在线免费看| 秋霞国产午夜精品免费视频| 久久国产精品国产精品| 精品一区二区三区免费观看 | 免费看一级黄色| 最新国产精品久久精品| 青青草手机视频在线观看| 亚洲电影一区二区| 国产毛片aaa| 欧美亚洲一区三区| 国产三级视频在线播放| 亚洲成人精品视频在线观看| 日本一区二区三区在线观看视频| 成人勉费视频| 欧美乱大交做爰xxxⅹ性3| 成年人国产在线观看| 欧美亚洲国产视频| 日本一区二区三区中文字幕| 风间由美久久久| 精品一区三区| 在线一区高清| 在线成人av| 少妇性l交大片| 国产激情视频一区二区三区欧美 | 久久中文娱乐网| 欧美性猛交xxxx乱大交少妇| 亚洲国产一二三| 中文字幕在线天堂| 日韩三级视频在线观看| 日韩三级电影网| 久久久电影免费观看完整版| 高潮在线视频| 国产中文字幕日韩| 久久男人av| 国产系列第一页| 久久福利精品| 99国产精品免费视频| 国产校园另类小说区| 国产高潮流白浆| 色偷偷一区二区三区| 国产超碰人人模人人爽人人添| 精品一区电影国产| 黄色免费网站在线观看| 日本久久久久久久久久久| 激情五月综合婷婷| 日本最新一区二区三区视频观看| 欧美精品1区| 亚洲精品久久久中文字幕| 91在线porny国产在线看| 精品国产精品国产精品| 在线观看日韩一区| 欧美天堂在线视频| 日韩在线视频线视频免费网站| 天堂av在线网| 国产高清精品一区二区| 国产精品成人av| 男人插女人下面免费视频| 不卡的av在线播放| 欧美成人黄色网| 欧美日韩精品三区| 久久久久久久久亚洲精品| 久久久之久亚州精品露出| 99热这里有精品| 日韩精品另类天天更新| 亚洲专区免费| 四季av综合网站| 亚洲一区二区成人在线观看| 国产日韩一级片| 日韩视频在线一区| 日韩a**中文字幕| 欧美大香线蕉线伊人久久| 99人久久精品视频最新地址| 国产精品一区二区在线免费观看| 亚洲欧洲日韩综合一区二区| 中文字幕在线观看欧美| 亚洲小视频在线观看| 日韩三区免费| 日本精品一区二区| 天堂久久一区二区三区| 插吧插吧综合网| 午夜免费一区| 91牛牛免费视频| 93在线视频精品免费观看| 爱情岛论坛vip永久入口| 国产偷国产偷亚洲高清人白洁| 久久青青草原亚洲av无码麻豆| 亚洲精品福利在线观看| 爱搞国产精品| 久久久99国产精品免费| 久久av最新网址| 99精品欧美一区二区| 欧美日韩亚洲综合在线| 米奇精品一区二区三区| 成人性教育视频在线观看| 91成人观看| 久久久久久久久久影视| 午夜精品视频在线观看| 色婷婷av一区二区三区之e本道| 91精品91久久久久久| 精品一区毛片| 亚洲精品www.| 亚洲综合色婷婷| 香蕉视频911| 国产成人免费av| 999视频精品| 中国男女全黄大片| 大伊人狠狠躁夜夜躁av一区| 国产午夜视频在线观看| 成人av番号网| 狠狠爱成人网| 久久av无码精品人妻系列试探| 欧美中文字幕亚洲一区二区va在线| 麻豆tv入口在线看| 国产女人水真多18毛片18精品 | 国产成人精品视频ⅴa片软件竹菊| 国产欧美日韩一区二区三区在线观看| 中文字幕在线网站| 久久久久久亚洲| 北条麻妃国产九九九精品小说| 亚洲五月激情网| 欧美日韩国产限制| 91美女视频在线| 国产精品国产三级国产专区53| 久久永久免费| 欧美又粗又大又长| 亚洲美女性视频| 欧美经典影片视频网站| 成人羞羞国产免费网站| 亚洲激情中文1区| 精品电影在线| 国产91社区| 美女网站一区二区| 国产无码精品在线观看|