精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI在線強化學習“邊做邊學”,斯坦福團隊讓7B小模型性能飆升,甚至超越GPT-4o

人工智能 新聞
AgentFlow,是一種能夠在線優化智能體系統的新范式,可以持續提升智能體系統對于復雜問題的推理能力。

斯坦福等新框架,用在線強化學習讓智能體系統“以小搏大”,領先GPT-4o——

AgentFlow,是一種能夠在線優化智能體系統的新范式,可以持續提升智能體系統對于復雜問題的推理能力。

它由規劃器、執行器、驗證器、生成器四個專業智能體組成的團隊通過共享內存進行協作,利用新方法Flow-GRPO,在系統內部直接對其規劃器智能體進行實時優化。

以Qwen-2.5-7B-Instruct為基座模型的AgentFlow在10個基準測試中表現突出:

搜索任務提升14.9%、智能體任務提升14.0%、數學任務提升14.5%、科學任務提升4.1%。

多項任務表現甚至超越比其大50倍的模型,超越GPT-4o、Llama3.1-405B。

AgentFlow發布后,受到業界不少廣泛關注與看好。

網友紛紛表示方向很棒:

多智能體流(multi-agent flow)給人的感覺就像“相位耦合推理”(phase-coupled reasoning)。很期待看到“協同能力”取代“規?!?,成為衡量智能的指標。

Flow-GRPO采用共享內存的多智能體架構設計精妙。其中驗證智能體對幻覺化工具調用的阻斷機制尤為關鍵——它能顯著減少智能體工作流中典型的多步推理鏈誤差傳播。

所以,AgentFlow究竟長啥樣?

工具集成的智能體系統+流中強化學習訓練

自“AI下半場”開啟以來,智能體(Agent)在垂直領域與通用場景中呈現出井噴式發展。然而,在復雜決策與持續優化能力方面,當前智能體仍存在一定局限。如何將智能體的推理能力與強化學習的自我進化機制深度融合,成為突破這一瓶頸的關鍵所在。

在今年早些時候,隨著DeepSeek-R1的發布,推理模型的訓練方式迎來了新的啟發。不久之后,伊利諾伊大學香檳分校(UIUC)發布Search-R1,系統揭示了如何通過強化學習,訓練能夠自主推理并調用外部工具的推理模型(Tool-Integrated Reasoning Models)。

而在此之前,智能體系統(Agentic System)的發展也從系統層面推動了智能體協作與可擴展性的提升,為后續相關研究奠定了堅實基礎。

例如,LangGraph、PydanticAI、OWL等框架在智能體通信、任務規劃與工具調用等方面進行了多樣化的探索,為智能體生態的快速演進提供了有力支撐。

而AgentFlow提出了一種新范式,其中由四個具備記憶能力的專門化智能體協同配合:

規劃器負責分析任務并選擇工具,執行器調用工具并整合結果,驗證器基于累積記憶評估中間結果,生成器整合信息生成最終答案。

對于每個新任務,規劃器在智能體交互的“流”中根據環境變化及其他智能體的反饋實時進行on-policy優化,各模塊在推理流中協同演化并不斷調整決策策略。這些優化隨后被整合到系統的記憶中,形成一個閉環的自適應推理過程,使整個智能體系統在復雜環境下實現魯棒的工具調用與持續進化。

其中,AgentFlow包含了以下幾個關鍵組件:

模塊化智能體結構。

AgentFlow采用了四個具備記憶能力的專門化智能體協同配合,共同完成復雜推理,從而實現“即時學習”:

(i)規劃器(Action Planner):分析任務、制定策略并選擇最合適的工具;

(ii)執行器(Tool Executor):調用工具集并整合工具執行結果;

(iii)驗證器(Verifier):基于系統維護的累積記憶評估中間結果是否滿足目標與約束;

(iv)生成器(Generator):整合所有信息與驗證反饋,生成最終答案或行動建議。

AgentFlow流中強化學習。

AgentFlow的關鍵創新在于:規劃器(Planner)并非固定不變,而是能夠在智能體交互的”流”(flow)中實時進行on-policy優化,使決策過程隨著環境變化及其他智能體的反饋不斷自適應進化。集成過程分為三個步驟:

(i)環境感知與記憶檢索;

(ii)動作規劃與工具選擇;

(iii)策略優化與記憶更新。

Flow-GRPO:流中強化學習優化算法。

實現智能體流中強化學習訓練的核心挑戰在于多輪信用分配(multi-turn credit assignment):即如何在長時跨度(long-horizon)且獎勵稀疏(sparse reward)的條件下,穩定且高效地訓練。為此團隊提出動作級別的(Action Level)的多輪推理優化目標。

如圖2所示,通過將軌跡最終結果的成功或失敗信號(outcome reward)廣播至每一步,將原本復雜的多輪強化學習問題轉化為一系列可處理的單輪策略更新。該方法不僅緩解了獎勵稀疏問題,還顯著提升了訓練效率,為智能體在復雜多輪推理中的穩定學習提供了基礎。

實驗結果

為了充分評估AgentFlow的泛化能力與高效性,研究團隊在10個跨各個領域的基準測試上進行了系統評測,涵蓋知識檢索、智能體任務、數學推理和科學推理四大類。

以Qwen-2.5-7B-Instruct為基座模型的AgentFlow在各項基準上均超越現有領先方法:

  • 知識檢索(Search):提升14.9%
  • 智能體推理(Agentic Reasoning):提升14.0%
  • 數學推理(Math):提升14.5%
  • 科學推理(Science):提升4.1%

值得注意的是,AgentFlow的表現甚至超過了大規模的專有模型,如GPT-4o(~200B)。

表1、2展示了AgentFlow在不同類型任務上的評估結果,表明了在有效性(相對提高高達14.9%)和效率(平均推理步數優化)上均優于基準方法。

研究團隊在10個基準測試上進行了評估,涵蓋知識檢索、智能體任務、數學推理和科學推理四大類。一些有趣的發現:

1、模型規模不是唯一答案

使用7B參數的AgentFlow在多個任務上超過了約200B參數的GPT-4o,Llama3.1-405B,在搜索任務上領先8.2%,在智能體任務上領先15.8%。這再一次展現了,合理的系統設計和訓練方法可能比單純堆砌參數訓練All in one的大模型更有效。

2、“在流中學習”至關重要

對比實驗顯示,若采用離線監督學習(SFT)方式訓練規劃器,性能反而顯著下降,平均降低19%。

這表明,智能體在真實交互環境“流”中進行在線學習是實現高效推理的必要條件。

此外,盡管AgentFlow的推理流本身能夠利用其強大的任務分解能力帶來顯著性能提升,但仍可能出現循環錯誤或卡頓問題。通過在真實環境中的訓練,智能體系統展現出快速修正錯誤的工具調用、更精細的子任務規劃,以及全局任務解決性能的提升。

這些結果進一步證明了模塊協作機制以及流中強化學習在提升多輪智能體系統穩定性與效率方面的顯著作用。

3、自主發現新的解決路徑

有意思的是,經過Flow-GRPO的強化訓練規劃器,系統學會了根據任務特點選擇合適的工具組合;同時,經過訓練的系統會自發探索出新的工具使用模式,比如組合使用維基百科搜索(Wikipedia Search)和特定網頁增強搜索(Web Search)的連招,通過工具鏈獲得更加深入地信息挖掘,而這些模式幾乎沒有在未訓練的推理流中出現。

4、動態推理深度與性能提升

對于相同的數據集下的不同難度任務:譬如說多跳搜索(Multihop Search),智能體任務中的密集長鏈推理任務,AgentFlow在經過 FlowGRPO訓練后能夠隨著最大限制推理步數的上升穩步提升性能,同時又不會大幅提升平均推理步數——這表示對于長難任務會增加有效的推理步數來提升正確率,而不會一味地所有任務都隨著最大輪數限制而延長推理步數。

總之,AgentFlow為智能體訓練提供了一種全新的思路:

與其追求一個功能完備的單一大語言模型或“一次性完美”的智能體系統,不如讓智能體在系統中自我適應與持續學習。

通過將群體智能與“邊做邊學”的范式相結合,AgentFlow使智能體系統能夠在協同演化中不斷優化,從而高效應對復雜任務。

盡管從研究探索到實際應用仍有較長的距離,但這讓團隊看見Agentic AI依然蘊藏著巨大的潛力與想象空間。

論文地址:https://arxiv.org/abs/2510.05592

項目主頁:https://agentflow.stanford.edu/

Github倉庫:https://github.com/lupantech/AgentFlow

在線Demo:https://huggingface.co/spaces/AgentFlow/agentflow

YouTube視頻:https://www.youtube.com/watch?v=kIQbCQIH1SI

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-11-04 08:42:27

2025-09-24 08:53:10

2025-01-06 12:46:16

模型數據訓練

2025-10-24 17:29:54

2025-09-28 15:35:32

AI模型強化學習

2025-03-12 10:38:05

2024-12-20 12:30:00

模型AI數據

2025-02-25 12:30:00

2025-01-03 10:55:22

2025-07-14 09:00:00

2025-08-14 10:25:11

2025-06-10 09:07:00

2023-11-13 07:51:58

ChatGPT研究

2024-02-07 12:39:00

AI數據

2024-09-23 15:04:16

2025-03-11 13:07:58

2024-04-07 13:40:20

2023-03-14 13:45:14

模型AI

2025-04-25 13:34:53

R1DeepSeekAgent

2024-05-17 17:25:44

點贊
收藏

51CTO技術棧公眾號

国产高清在线一区| 久久影院免费观看| 国产aaaaa毛片| 久久久久久国产精品免费无遮挡 | 精品久久久久成人码免费动漫| 欧美精品一区二区三区久久久竹菊| 亚洲国产精品成人精品| 91制片厂毛片| heyzo高清国产精品| 国产欧美精品一区二区三区四区 | 网友自拍一区| 在线不卡一区二区| 男人操女人免费软件| 日本免费在线观看| 99久久精品免费看国产免费软件| 国产精品久久久| 久热精品在线观看| 日韩综合网站| 亚洲精品视频网上网址在线观看 | 久久久久久av无码免费看大片| 欧美激情第8页| 国产一区二区三区在线| 成人做爰69片免费| 小说区图片区亚洲| 色婷婷av一区二区三区软件| av中文字幕av| av电影在线观看一区二区三区| 成人av在线观| 成人啪啪免费看| 波多野结衣一区二区在线| 好看不卡的中文字幕| 久久精品国产2020观看福利| 国产中年熟女高潮大集合| 成人精品动漫一区二区三区| 9191久久久久久久久久久| 久久无码高潮喷水| 麻豆视频在线观看免费网站黄| 伊人色综合久久天天| 综合视频在线观看| avtt亚洲| 国产精品乱码一区二区三区软件| 欧美精品久久久| 日本一区高清| 91尤物视频在线观看| av一区二区三区在线观看| 国产又粗又猛又爽又黄的| 另类成人小视频在线| 国产精品日韩欧美大师| 国产一卡二卡三卡| 欧美一级久久| 人九九综合九九宗合| 好看的av在线| 乱人伦精品视频在线观看| 欧美一级淫片aaaaaaa视频| 四虎永久在线精品| 99视频一区| 欧美又大粗又爽又黄大片视频| 国产乱子伦农村叉叉叉| 欧洲在线视频| 亚洲国产精品久久久久婷婷884 | а√资源新版在线天堂| 中文字幕视频一区| 中文字幕一区二区三区四区五区| 日韩三级影院| 亚洲免费观看高清完整版在线观看熊 | 久久久久久电影| 欧美人xxxxx| 95在线视频| 亚洲激情六月丁香| 久久av喷吹av高潮av| 青春草视频在线观看| 性欧美大战久久久久久久久| 国产91在线免费| 国模冰冰炮一区二区| 在线看国产一区| 天天综合网日韩| 国产精品亚洲四区在线观看| 欧美成人综合网站| 毛茸茸多毛bbb毛多视频| 欧美日韩在线网站| 美女精品视频一区| 日韩美女视频网站| 日韩在线a电影| 国产专区精品视频| www.蜜臀av| 国产亚洲欧美一区在线观看| 中国一区二区三区| av中文字幕在线看| 欧美性受极品xxxx喷水| 一级黄色免费毛片| 婷婷精品在线| 久久黄色av网站| 国产女同在线观看| 蜜桃视频免费观看一区| 成人一区二区三区四区| 免费a级毛片在线观看| 亚洲视频一区二区在线观看| 又大又硬又爽免费视频| 精品123区| 精品盗摄一区二区三区| 日韩福利在线视频| 激情综合网址| 国产日韩欧美成人| 天天干免费视频| 《视频一区视频二区| www.中文字幕在线| 欧美二区观看| 国产一区二区久久精品| 国产亚洲精品码| 日韩—二三区免费观看av| 97人人模人人爽人人少妇| 国产香蕉视频在线看| 亚洲综合色婷婷| 怡红院亚洲色图| 欧美大片网址| 欧美激情a在线| 中文字幕久久久久| 99久久99精品久久久久久| 正在播放亚洲| 久久久一本精品| 欧美成人一区二区三区| 精品人妻中文无码av在线| 在线日韩电影| 99久久伊人精品影院| 午夜国产福利在线| 91国偷自产一区二区开放时间 | aaa级黄色片| 国产精品乱码妇女bbbb| 国产精品亚洲二区在线观看| 都市激情亚洲| 欧美理论电影在线观看| 中文字幕视频免费观看| 久久美女高清视频| 黄色片视频在线免费观看| 88久久精品| 欧美国产日产韩国视频| 国产视频手机在线| 亚洲视频在线观看三级| 久久6免费视频| 亚洲成人精品| 国产一区二中文字幕在线看| 777电影在线观看| 欧美在线观看一区二区| 成年人网站免费在线观看| 国产欧美综合一区二区三区| 超碰97人人人人人蜜桃| 神马午夜伦理不卡| 日韩欧美一级片| 农村妇女精品一区二区| 国产馆精品极品| 久久av高潮av| 6080亚洲理论片在线观看| 欧美国产第一页| 亚洲第一成年人网站| 一区二区三区中文在线观看| 亚洲精品乱码久久久久久9色| 欧美阿v一级看视频| 亚洲精品日韩激情在线电影| 2021国产在线| 日韩午夜激情电影| 国产在线一区视频| 91视频免费播放| 日韩欧美国产免费| 欧美一区二区麻豆红桃视频| 国产精品久久久久久久久久新婚 | 97精品国产97久久久久久免费| 亚洲精品久久久久久久久久| 亚洲小说欧美激情另类| 好吊色视频一区二区三区| 亚洲一区二区三区高清不卡| 欧美日韩精品免费观看 | 999视频在线免费观看| 日本天码aⅴ片在线电影网站| 亚洲国产成人91精品| 国产农村妇女aaaaa视频| 久久久不卡网国产精品二区| 搡女人真爽免费午夜网站| 91一区二区三区四区| 99精品国产一区二区| sm久久捆绑调教精品一区| 亚洲欧洲在线播放| 国产又粗又猛视频| 亚洲一区二区欧美日韩| 在线免费看黄视频| 精品一区二区三区日韩| 成人免费视频91| 日韩精品久久| 国产日韩在线一区二区三区| 桃花岛成人影院| 欧美日韩高清区| 欧美一区二区视频| 日韩一区二区三区免费看| 日本一级淫片免费放| 国产精品免费视频观看| 制服丝袜av在线| 久久国产精品区| av之家在线观看| 99久久www免费| 久久精品99| 免费观看亚洲视频大全| 日本一区二区三区四区视频| 在线中文字幕第一页| 亚洲欧美成人精品| 精品美女www爽爽爽视频| 色94色欧美sute亚洲线路一ni | 欧美色123| 亚洲精品国产精品久久| 国产精品超碰| 成人久久久久久| 最新日韩一区| 97超级碰碰碰久久久| 黄色免费网站在线| 一区二区三区视频观看| 免费观看黄色一级视频| 欧美一区二区福利视频| 中文字幕日韩免费| 五月综合激情日本mⅴ| 久久国产高清视频| 国产视频视频一区| 日本xxx在线播放| 国产成人在线电影| 国产高清av片| 久久99久久精品欧美| 北条麻妃在线一区| 国产日韩专区| 青青草成人免费在线视频| 欧美黄色aaaa| 佐佐木明希av| 香蕉久久网站| 宅男一区二区三区| 日韩在线观看| 午夜精品一区二区在线观看的| 亚洲女娇小黑人粗硬| 极品日韩久久| 欧美爱爱网站| 久久亚洲一区二区| 任你躁在线精品免费| 国产一区二区在线观看免费播放| 亚洲精选av| 成人免费视频网站入口| 91九色鹿精品国产综合久久香蕉| 91精品视频播放| 国产一区二区三区亚洲综合| 国产欧美va欧美va香蕉在线| 成人在线观看免费播放| 国产精品美女呻吟| 久久精品女人天堂av免费观看 | 久久精品视频va| 国产欧美久久久久久久久| 久久精品人人做人人爽| 国产美女在线观看| 欧美极品美女电影一区| www.51av欧美视频| 欧美亚洲另类在线| 欧美电影免费观看网站| 国产91免费看片| 97欧美成人| 成人激情视频在线| 在线播放一区二区精品视频| 国产伦精品一区二区三| 日韩mv欧美mv国产网站| 欧美日韩精品不卡| 欧美电影《睫毛膏》| 日本女人高潮视频| 国内精品久久久久久久97牛牛 | 亚洲国内高清视频| 视频二区在线| 宅男66日本亚洲欧美视频| 日本三级视频在线播放| 欧美大尺度在线观看| 国产高清视频色在线www| 欧美中文在线免费| 亚洲成人毛片| 国产福利一区二区三区在线观看| 日韩高清成人在线| 亚洲mv在线看| 欧美久久视频| 99热成人精品热久久66| 精品一区二区三区在线观看国产| wwwww在线观看| www欧美成人18+| 暗呦丨小u女国产精品| 亚洲国产成人va在线观看天堂| av网站中文字幕| 欧美高清视频在线高清观看mv色露露十八| 国产夫妻性生活视频| 国产网站欧美日韩免费精品在线观看| 欧洲不卡av| 91av在线视频观看| av在线成人| 美媛馆国产精品一区二区| 久久久久美女| av观看免费在线| 国产一区二区不卡| 久久精品国产亚洲av麻豆| 中文字幕制服丝袜成人av| 青青草av在线播放| 91精品国产麻豆国产自产在线| 亚洲av成人无码久久精品老人 | 日韩高清国产精品| 国产精品草草| www欧美激情| 99麻豆久久久国产精品免费 | 国产综合内射日韩久| 国产精品久久久久久久蜜臀| 日韩黄色精品视频| 7777精品伊人久久久大香线蕉| 人人九九精品| 久久全国免费视频| 99国内精品久久久久| 欧洲亚洲一区二区| 亚洲区欧美区| 五月六月丁香婷婷| 久久精品亚洲国产奇米99| 国产精选第一页| 日韩午夜激情电影| 免费大片在线观看www| 奇米影视亚洲狠狠色| 国产精品调教| 男女啪啪免费观看| 麻豆精品精品国产自在97香蕉| 精品久久久久久中文字幕人妻最新| 夜夜夜精品看看| 国产男女裸体做爰爽爽| 中日韩美女免费视频网站在线观看| 三级在线看中文字幕完整版| 成人av免费在线看| 亚洲最新色图| 九九九九九国产| 国产精品免费看片| 夜夜爽妓女8888视频免费观看| 精品视频在线播放色网色视频| 久草在线新免费首页资源站| 亚洲xxx大片| 欧美.日韩.国产.一区.二区| 亚洲国产午夜精品| 成人免费一区二区三区在线观看 | 日韩精品在线一区| 污污的视频在线观看| 91超碰在线免费观看| 亚洲精品电影| 日韩精品――色哟哟| 亚洲精品成人精品456| 国产视频手机在线| 欧美另类交人妖| 在线精品自拍| 男的插女的下面视频| 成人国产视频在线观看| 国产大片中文字幕在线观看| 精品国产伦一区二区三区观看体验| 欧美精品videosex| 国产自产在线视频一区| 91久久黄色| 国产成人无码精品久久二区三| 色94色欧美sute亚洲线路二| 国产高清在线看| 91精品久久久久久久久中文字幕| 国产精品精品| 性欧美18—19sex性高清| 亚洲成人777| 国产在线视频网址| 国产欧美日韩最新| 欧美片第1页综合| 性欧美丰满熟妇xxxx性久久久| 欧美天堂在线观看| 97视频在线观看网站| 亚洲在线观看视频网站| 激情文学一区| 性猛交娇小69hd| 在线不卡中文字幕| 爱啪视频在线观看视频免费| 欧美专区一二三| 韩国精品在线观看| 成年人免费看毛片| 在线观看视频99| 91大神精品| 久久精品网站视频| 亚洲人123区| 亚洲色大成网站www| 国产精品久久久久高潮| 欧美欧美天天天天操| 自拍偷拍视频亚洲| 91精品久久久久久久久99蜜臂| 91福利在线免费| 色狠狠久久av五月综合| 国产成人综合自拍| 成人免费毛片男人用品| 久久在线观看视频| 精品福利一区| 中文字幕 日韩 欧美| 欧美日韩国产精品| 国产在线激情| 欧洲亚洲一区二区| 懂色av一区二区三区免费观看| 亚洲av无码精品一区二区| 欧美猛少妇色xxxxx| 国产最新精品| 女同性αv亚洲女同志| 欧美午夜免费电影| а√在线天堂官网|