精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

斯坦福7B智能體全面超越GPT-4o,推理流登頂HF

人工智能 新聞
傳統智能體系統難以兼顧穩定性和學習能力,斯坦福等學者提出AgentFlow框架,通過模塊化和實時強化學習,在推理中持續優化策略,并使小規模模型在多項任務中超越GPT-4o,為AI發展開辟新思路。

當前AI Agent的發展正陷入兩難的境地:

一方面,訓練「全能型」大模型讓其同時承擔推理、規劃與工具調用,雖具一體化優勢,但在長鏈推理中往往訓練不穩定、擴展性受限;

另一方面,基于prompt的智能體系統雖具靈活性,卻缺乏學習與自我優化能力,無法從交互中持續進化。

如何突破這一瓶頸?

斯坦福大學聯合德州農工大學(Texas A&M)、加州大學圣地亞哥分校(UC San Diego)和Lambda的研究團隊給出了新答案:讓智能體系統在推理「流」中進行在線強化學習,從而實現持續的自我提升與能力進化

論文地址: https://arxiv.org/abs/2510.05592

項目主頁: https://agentflow.stanford.edu/

開源代碼: https://github.com/lupantech/AgentFlow

在線展示:https://huggingface.co/spaces/AgentFlow/agentflow

視頻教程:https://www.youtube.com/watch?v=kIQbCQIH1SI

他們提出AgentFlow框架采用模塊化架構,通過4個專門化智能體協同工作,配合專門設計的Flow-GRPO算法,使系統能夠在真實交互環境中持續優化決策策略。

實驗結果顯示,僅7B參數的AgentFlow在搜索、數學、科學等多個任務上全面超越GPT-4o(約200B參數)和 Llama-3.1-405B。

團隊負責人在推特上分享了工作,獲得了極大的關注。

該工作目前已登上HuggingFace Paper日榜第二名,以及周最火Huggingface 項目。

長鏈推理中的信用分配難題

訓練智能體系統面臨的核心挑戰是多輪信用分配(multi-turn credit assignment)問題:在長時跨度、獎勵稀疏的環境中,如何準確判斷每一步決策對最終結果的貢獻?

傳統的單一模型方法將所有功能集成在一個LLM中,通過特殊標簽(如 <tool_call>)一體化輸出思考、工具調用和回復。

這種方式在短鏈任務中有效,但在復雜場景下容易出現:推理鏈過長導致訓練不穩定、工具選擇錯誤難以追溯、無法根據環境反饋動態調整策略。

而現有的智能體系統(如 LangGraph、OWL、Pydantic、AutoGen)雖然實現了模塊化,但大多依賴固定的 prompt 工程,缺乏從經驗中學習的機制。

AgentFlow多模塊實時交互

在「流」中學習

AgentFlow的設計思路是:將復雜的推理任務分解給專門化的智能體模塊,同時讓核心決策模塊能夠在交互中持續學習

四模塊協同架構

系統由四個具備記憶能力的專門化智能體組成:

  • 規劃器(Action Planner):分析任務需求,制定執行策略,選擇最合適的工具。這是系統的核心決策模塊,也是唯一需要訓練的部分。
  • 執行器(Tool Executor):負責實際調用工具API,整合工具返回結果。
  • 驗證器(Verifier):基于系統累積的歷史記憶,評估中間結果是否符合任務目標和約束條件。
  • 生成器(Generator):整合所有信息和驗證反饋,生成最終答案或下一步行動建議。

關鍵創新在于:規劃器不是靜態的,而是通過在線(on-policy) 強化學習在推理流中實時優化

每輪交互后,系統會根據最終結果的成功或失敗,更新規劃器的決策策略,并將優化結果整合到系統記憶中,形成閉環的自適應學習過程。

Flow-GRPO算法

解決信用分配問題

團隊提出Flow-GRPO(Flow-based Group Relative Policy Optimization)算法,專門針對多輪推理場景設計。核心思想是將軌跡最終的獎勵信號(成功/失敗)廣播到每一步動作,把復雜的多輪強化學習問題轉化為一系列單輪策略更新。

具體做法是:

1. 收集完整的推理軌跡(從初始任務到最終結果);

2. 根據最終結果計算 outcome reward;

3. 將這個 reward 分配給軌跡中每個規劃動作;

4. 使用相對優勢函數計算每個動作的優勢,進行策略梯度更新。

這種方法有效緩解了獎勵稀疏問題,同時保持了訓練的穩定性。

在線學習使系統能夠:快速糾正錯誤的工具調用、探索更優的子任務分解方式、根據環境反饋動態調整推理深度。

實驗結果:小模型的逆襲

研究團隊在10個跨領域基準上進行了系統評測,覆蓋知識檢索、智能體任務、數學推理和科學推理四大類。

性能對比

以Qwen-2.5-7B-Instruct為基座模型,AgentFlow 在所有類別中均顯著領先。

知識檢索:相比基線提升14.9%

智能體推理:提升14.0%

數學推理:提升14.5%

科學推理:提升4.1%

更令人驚訝的是跨規模對比結果:

  • 7B的AgentFlow在搜索任務上比GPT-4o(約200B)高8.2%
  • 在智能體任務上比Llama-3.1-405B高15.8%
  • 3B模型的AgentFlow也能在多項任務中超越405B的基線模型

消融實驗的關鍵發現

1. 在線學習 vs 離線學習

對比實驗顯示,如果用傳統SFT方式訓練規劃器,性能反而會平均下降19%。這證明在真實交互環境中的在線學習是實現高效推理的必要條件

2. 自主探索新策略

根據任務特點選擇合適的工具組合;同時,經過訓練的系統會自發探索出新的工具使用模式,比如組合使用維基百科搜索(Wikipedia Search) 和特定網頁增強搜索(Web Search)的連招,通過工具鏈獲得更加深入地信息挖掘,而這些模式幾乎沒有在未訓練的推理流中出現。

3. 動態推理深度

在多跳搜索等密集推理任務中,訓練后的AgentFlow展現出「智能的懶惰」:對簡單任務保持較少的推理步數,對復雜任務才會增加推理深度。

隨著最大步數限制的提升,性能穩步上升但平均步數不會同比例增長。

4. 模塊協作的價值

雖然推理流本身就能帶來性能提升,但未經訓練的系統容易出現循環錯誤或卡頓。

通過強化學習訓練后,系統在工具調用準確性、子任務規劃精細度和全局性能上都有明顯改善。作者團隊提供過了一個例子來生動展示了在實驗中的有趣發現。

在這個例子中,在經過Flow-GRPO訓練前的推理系統,一旦遇到了諸如這里的python變量定義錯誤,便會反復輸出相同的子目標和工具調用,極大地浪費時間和推理效率。

在經過Flow-GRPO在線更新后,動作規劃器能夠根據之前的錯誤自動調整用更確切的子目標和任務描述來指導后續步驟,并且經過這樣的隨機應變后,一步成功。

這個例子也極大程度展現了,在智能體系統真實推理中進行強化學習的極大潛力。

技術意義與未來展望

AgentFlow的工作價值在于:

1.提供了新的訓練范式

證明了智能體系統可以通過在線強化學習獲得類似大模型的學習能力,且在特定任務上效率更高。

2.驗證了「小而精」的可行性

在合理的系統設計下,小模型通過模塊化協作和持續學習,可以在復雜推理任務中超越大規模通用模型。

3.為可擴展AI提供思路

模塊化架構使得系統可以靈活添加新工具、調整模塊功能。

AgentFlow至少讓我們看到:Agentic AI的發展不必完全依賴模型規模的堆砌,系統架構創新+高效訓練方法可能是更值得探索的方向。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-10-24 12:07:12

2025-03-12 10:38:05

2025-06-06 14:17:11

模型訓練AI

2025-08-14 10:25:11

2025-09-24 08:53:10

2024-12-20 12:30:00

模型AI數據

2025-01-03 10:55:22

2023-09-21 12:31:54

AI數據

2024-11-11 09:47:00

AI開源

2025-07-14 09:00:00

2025-06-10 09:07:00

2025-02-28 09:52:00

2024-08-15 15:45:00

AI訓練

2024-06-11 14:30:18

2023-03-15 10:35:16

GPTAI

2024-03-04 13:36:00

模型訓練

2025-04-16 15:28:31

模型AI數據

2025-04-11 09:10:00

模型開源AI

2025-02-17 12:24:43

2024-09-29 13:07:16

點贊
收藏

51CTO技術棧公眾號

老司机精品免费视频| 日韩中文字幕在线不卡| 亚洲永久精品一区| 91精品国产乱码久久久久久久| 欧美一级黄色大片| 青青草国产精品视频| av在线资源站| 国产凹凸在线观看一区二区| 欧美在线视频a| 熟女少妇a性色生活片毛片| 成人h动漫免费观看网站| 一本大道久久精品懂色aⅴ| 在线无限看免费粉色视频| 女人18毛片一区二区三区| 蜜臀精品久久久久久蜜臀 | 希岛爱理av一区二区三区| 欧美刺激午夜性久久久久久久| 欧美三级午夜理伦三级| 性欧美高清come| 国产欧美日韩精品在线| 国产欧美日韩综合一区在线观看 | 日韩视频在线观看一区二区| 日本中文字幕片| 免费av不卡在线观看| 国产精品网站在线| 蜜桃欧美视频| 蜜桃久久一区二区三区| 精东粉嫩av免费一区二区三区| 欧美在线不卡区| 九九九久久久久| 成人在线视频免费观看| 亚洲国产精品成人精品| 亚洲女人在线观看| 亚洲欧美在线人成swag| 色婷婷久久99综合精品jk白丝| 欧美一区二区激情| 国产网站在线免费观看 | 男人操女人的视频网站| 欧美一区二区三区激情视频| 日韩精品中文字幕在线观看| 亚洲精品一区二区三区精华液| 国产精品蜜臀| 日韩三级在线| 日韩激情视频在线| 亚洲色图欧美另类| 欧美一区一区| 666欧美在线视频| 在线观看亚洲色图| 欧美色片在线观看| 91福利小视频| 50路60路老熟妇啪啪| 涩涩涩在线视频| 午夜一区二区三区在线观看| 国产精品一色哟哟| 男男gaygays亚洲| 一区二区三区四区乱视频| 欧美xxxx吸乳| 日韩免费影院| 亚洲一区成人在线| 日韩xxxx视频| 爱啪视频在线观看视频免费| 99久久国产综合精品色伊| 日韩免费电影一区| 日韩欧美中文视频| 亚洲视频资源| 日韩美一区二区三区| 少妇极品熟妇人妻无码| 一区二区三区四区高清视频| 精品少妇一区二区| 精品国产av色一区二区深夜久久| 久热这里只有精品在线| 亚洲sss综合天堂久久| 蜜桃视频无码区在线观看| 久久九九精品视频| 日韩女同互慰一区二区| 无码人妻一区二区三区免费n鬼沢| 国产视频一区二| 欧美成人aa大片| 日本伊人精品一区二区三区介绍| 国产精成人品免费观看| 不卡中文字幕| 久久影院中文字幕| 国产在线免费视频| 日韩精品亚洲一区| 91亚洲精品在线| 蜜桃久久一区二区三区| 久久久精品免费观看| 夜夜爽99久久国产综合精品女不卡| 国产精品久久麻豆| 天天综合网天天综合色| 国产精品天天av精麻传媒| 香蕉久久久久久| 精品国产乱码久久久久久牛牛 | 亚洲欧美日韩精品综合在线观看| 快射av在线播放一区| 无吗不卡中文字幕| 最新天堂中文在线| 免费成人蒂法| 色婷婷av一区二区三区久久| 久久国产免费观看| 日韩中文字幕麻豆| 成人片在线免费看| 在线观看国产原创自拍视频| 亚洲福利一区二区| 第一区免费在线观看| 成人av综合网| 久久精品国产亚洲精品| 日韩精品在线免费视频| 国产一区二区三区视频在线播放| 欧美成人第一区| av大全在线| 91国产视频在线观看| 91精品国产高清91久久久久久| 久久91成人| 国内精品小视频在线观看| 又污又黄的网站| 91麻豆免费视频| 一卡二卡三卡视频| 亚洲免费一区| 一区二区欧美日韩视频| 日韩少妇高潮抽搐| 国产黄色成人av| 亚洲国产日韩综合一区| 最新日韩精品| 亚洲黄色有码视频| 久久99久久98精品免观看软件 | 欧美视频中文在线看| 欧美xxxx黑人| 91成人超碰| 国产精品免费一区豆花| 能在线看的av| 岛国精品视频在线播放| 岛国精品一区二区三区| 午夜精品久久| 91网站在线看| 男人天堂手机在线| 欧美三级韩国三级日本一级| 无码人妻精品一区二区中文| 国产精品视频久久一区| 懂色中文一区二区三区在线视频| 黄色免费网站在线| 欧美日韩在线观看一区二区| 国产精品久久久久久久av| 狂野欧美性猛交xxxx巴西| 老牛影视免费一区二区| 美女av在线免费看| 日韩精品高清在线| 五月婷婷色丁香| 91麻豆精东视频| 日韩亚洲在线视频| 欧美伦理在线视频| 国产精品久久久久久久久久99| 狠狠v欧美ⅴ日韩v亚洲v大胸| 欧美日韩国产精品一区二区三区四区 | 成人短视频app| 亚洲另类激情图| 久久久久久少妇| 久久久高清一区二区三区| 国产精品69页| 99国产**精品****| 91久久精品美女高潮| av文字幕在线观看| 日韩精品一区二区在线观看| 免费又黄又爽又色的视频| 国产成人aaa| 人妻av中文系列| 免费欧美一区| 国产欧美在线观看| 成年人网站在线| 亚洲国产精品va| 午夜久久久久久久久久影院| 国产精品视频第一区| 在线观看中文av| 亚洲无线一线二线三线区别av| 精品久久sese| 久久99久久久精品欧美 | 国产拍在线视频| 亚洲全黄一级网站| 国产乱码久久久| 亚洲电影一区二区| 美国美女黄色片| 国产精品1区二区.| 精品人妻一区二区三区四区在线 | 亚洲天堂免费视频| 91麻豆成人精品国产| 一区av在线播放| 国产jk精品白丝av在线观看| 国精产品一区一区三区mba桃花| 国产手机免费视频| 菠萝蜜一区二区| 波多野结衣精品久久| 亚洲承认视频| 九九热这里只有在线精品视| 视频二区在线| 欧美一区二区三区免费视频| 国产精品人人人人| 亚洲免费观看视频| 久久久久久国产精品无码| 国产精品综合一区二区| 久久久久久久激情| 欧美日韩mv| 日韩视频在线播放| 成人av综合网| 91在线免费观看网站| 免费v片在线观看| 九九热最新视频//这里只有精品| 国产一区二区三区福利| 精品处破学生在线二十三| 日韩欧美一级大片| 黑人极品videos精品欧美裸| 欧美日韩在线视频免费| 中文字幕精品三区| 97人妻天天摸天天爽天天| 国产成人免费在线观看不卡| 中文字幕第80页| 在线亚洲国产精品网站| 国产欧美123| 国产精品成人a在线观看| 美女视频久久| 国产福利一区二区精品秒拍| 91久久久久久久久| 亚洲电影有码| 热草久综合在线| 免费在线小视频| 色综合导航网站| 老司机精品影院| 亚洲精品一区久久久久久| 欧美最近摘花xxxx摘花| 米仓穗香在线观看| 国产成人福利av| 91精品久久久久久久久不口人| 中文在线资源| 久久人人爽国产| av片在线观看| 久久视频免费在线播放| 永久免费av片在线观看全网站| 亚洲色图15p| 欧洲免费在线视频| 日韩精品日韩在线观看| 无码国产精品一区二区免费16| 欧美大胆人体bbbb| 亚洲精品成人区在线观看| 91精品国产欧美一区二区成人| 亚洲字幕av一区二区三区四区| 欧美在线观看你懂的| 天天爽夜夜爽人人爽| 日韩欧美在线免费| 国产情侣自拍av| 精品福利樱桃av导航| 国产午夜福利片| 午夜精品久久久久影视| 日韩三级一区二区三区| 欧美日韩亚洲激情| 亚洲视频 欧美视频| 色老汉一区二区三区| 欧美一区二区三区网站| 国产在线播放精品| 国内精品久久久久久久97牛牛 | 久久精品日产第一区二区三区乱码 | 91精品中文字幕一区二区三区| 国产精品无码白浆高潮| 欧美一区二区成人6969| 亚洲第一色网站| 亚洲国产小视频| 国内精品在线视频| 久久精品电影一区二区| yellow91字幕网在线| 孩xxxx性bbbb欧美| 激情开心成人网| 成人黄色影片在线| 亚洲1区在线观看| 久久国产精品 国产精品| 视频一区在线观看| a级黄色片网站| 国产精品v亚洲精品v日韩精品| 亚洲人成在线观看| 亚洲一二区在线| 影音先锋欧美激情| 好看的日韩精品视频在线| 一区二区导航| 一区二区三区三区在线| 国产精品扒开腿做爽爽爽软件| 国产午夜福利视频在线观看| 秋霞午夜av一区二区三区| www.偷拍.com| 久久久综合精品| 51精品免费网站| 精品久久久久久久久久久久久| 亚洲精品国产欧美在线观看| 欧美一区二区三区免费大片| 日本人妖在线| 久久久99免费视频| 午夜影院在线播放| 亚洲自拍偷拍色片视频| 一本久久青青| 8x8x华人在线| 日韩精品欧美精品| 天天躁日日躁狠狠躁免费麻豆| 国产拍揄自揄精品视频麻豆| 国产一级视频在线| 欧美性生活久久| 深夜福利视频网站| 久久久成人的性感天堂| 色网在线免费观看| 北条麻妃高清一区| 91麻豆国产自产在线观看亚洲 | 高清亚洲高清| 在线亚洲男人天堂| 日韩av官网| 国产精品久久9| 亚洲高清在线一区| 欧美一进一出视频| 在线电影一区| 91丝袜超薄交口足| 国产午夜精品美女毛片视频| 久草国产在线视频| 欧美裸体bbwbbwbbw| 免费动漫网站在线观看| 久久久天堂国产精品女人| 天天综合91| 色婷婷精品国产一区二区三区| 一本一道久久综合狠狠老精东影业| 精品人妻一区二区三区免费| 国产精品短视频| wwwwww在线观看| 亚洲欧洲在线免费| av高清不卡| 久久精品一区二区三区不卡免费视频| 好吊视频一区二区三区四区| 99精品视频国产| 国产精品成人午夜| 最近中文字幕免费观看| 亚洲片国产一区一级在线观看| 亚洲精品永久免费视频| 久久涩涩网站| 99视频精品免费观看| av漫画在线观看| 亚洲影院久久精品| www.中文字幕| 欧美国产精品va在线观看| 一级毛片精品毛片| 99久热在线精品视频| 国产精品一区二区黑丝| 午夜免费激情视频| 日韩一区二区在线看片| 中文字幕有码在线视频| 亚洲tv在线观看| 欧美人与禽猛交乱配视频| 丰满饥渴老女人hd| 亚洲一区二区三区四区的| 日本美女一级视频| 欧洲成人免费视频| 成久久久网站| 又色又爽又黄视频| 亚洲精品国产第一综合99久久| 国产黄色av网站| 97高清免费视频| 一道本一区二区三区| www日韩在线观看| 国产精品理论片| www.午夜激情| 538国产精品一区二区在线| 免费观看不卡av| 69久久久久久| 亚洲精品一二三| 天天躁日日躁狠狠躁喷水| 欧美主播福利视频| 欧美精品一区二区三区中文字幕| 成人性生交免费看| 一区二区三区精品在线观看| 人妻va精品va欧美va| 日韩美女在线看| 久久亚洲专区| 亚洲欧洲国产视频| 欧美日韩在线免费观看| a视频网址在线观看| 91成人免费视频| 亚洲一区不卡| 欧美88888| 亚洲福利小视频| 国产69精品久久久久按摩| 国产爆乳无码一区二区麻豆| 久久众筹精品私拍模特| 国产精品视频一区二区三区,| 欧美精品videosex牲欧美| 国产欧美日韩视频在线| 深夜做爰性大片蜜桃| 欧美视频在线看| av网站网址在线观看| 久久久久久亚洲精品不卡4k岛国| 男女性色大片免费观看一区二区| 麻豆一区产品精品蜜桃的特点| 亚洲男人7777| 日韩三级久久| 亚洲男人天堂色| 亚洲午夜日本在线观看| av男人的天堂在线| 精品国产_亚洲人成在线| 久久99国内精品| 久久亚洲精品国产|