精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

周靖人署名,通義實驗室開源智能體自進化系統(tǒng):讓模型學會“自我反思”,14B也能越級打怪

人工智能 新聞
通過自我提問、自我導航、自我歸因三個模塊,AgentEvolver可以在開放環(huán)境中自主演化出行為能力。

智能體自進化,阿里開源了新成果。

通義實驗室提出了一種能夠自進化的智能體系統(tǒng)——AgentEvolver。

通過自我提問、自我導航、自我歸因三個模塊,AgentEvolver可以在開放環(huán)境中自主演化出行為能力。

在相同規(guī)模的14B模型上,AgentEvolver將基準模型的平均完成率從29.8%大幅提高到57.6%。

目前該系統(tǒng)已在GitHub上線,技術報告也同步發(fā)布,作者署名當中包括了阿里副總裁、阿里云智能CTO周靖人。

模型智能體效果飛升

從綜合性能來看,AgentEvolver在AppWorld和BFCL v3等長程復雜任務基準測試中展現(xiàn)了驚人的爆發(fā)力。

以14B模型為基座,其任務平均完成率(avg@8)從29.8%飆升至57.6%,實現(xiàn)了近乎翻倍的性能增長;在最佳嘗試(best@8)指標上,更是達到了76.7%的高位。

在更小參數(shù)量的7B模型上的提升也同樣顯著,平均完成率從15.8%躍升至45.2%,證明了該框架對不同規(guī)模模型的普適性增強能力。

這種進化不僅體現(xiàn)在分數(shù)的增長,更帶來了“越級挑戰(zhàn)”的效果,經(jīng)過強化后的14B模型,在特定任務上的表現(xiàn)已經(jīng)超越了未經(jīng)過同類優(yōu)化的32B乃至更大參數(shù)量的模型(如Qwen2.5-32B)。

除了最終效果的上限被拔高,AgentEvolver在學習效率上也表現(xiàn)出了極速收斂的特性。

實驗表明,在達到基線模型90%性能水平時,AgentEvolver所需的訓練步數(shù)大幅減少,在AppWorld任務中減少了55.6%,在BFCL任務中更是減少了66.7%。

這意味著它不僅學得更好,而且學得更快,極大地降低了訓練的時間成本和算力消耗。

并且這種自進化獲得的能力具備極強的跨域泛化性。

研究人員發(fā)現(xiàn),僅使用合成數(shù)據(jù)訓練出的模型,在遷移到未曾見過的全新領域時,依然保持了極高的性能。

例如,在AppWorld上訓練的模型直接用于解決BFCL任務時,性能衰減微乎其微。

這說明AgentEvolver并非是在記憶特定環(huán)境的題庫,而是真正掌握了通用的工具使用與推理邏輯能力。

AgentEvolver如何實現(xiàn)自進化?

AgentEvolver的本質(zhì)是利用LLM自身的理解力,構建了一個數(shù)據(jù)-探索-反饋的自動化流程。

從整體架構來看,系統(tǒng)由Master節(jié)點統(tǒng)一調(diào)度,驅動著由任務生成、軌跡采樣、經(jīng)驗總結和模型優(yōu)化這四個階段構成的自動化閉環(huán),實現(xiàn)了無需人工干預的持續(xù)迭代。

為了支持大規(guī)模訓練,框架采用了服務化解耦設計,將環(huán)境服務、模型服務和封裝了Agent邏輯的執(zhí)行層拆分為獨立服務。

針對長程任務中Token消耗大、記憶管理難的痛點,系統(tǒng)還引入了上下文管理器,在保證推理連貫性的同時,有效控制了顯存開銷,并支持從滑動窗口到自主記憶管理的多種策略。

系統(tǒng)內(nèi)置了基礎因果、推理增強、滑動窗口以及自主上下文管理四種典型范式,涵蓋了從追求極致效率到賦予Agent主動刪減記憶權利的不同需求。

在此架構支撐下,AgentEvolver通過三個核心機制——自我提問、自我導航與自我歸因——實現(xiàn)了能力的自主演化。

自進化的邏輯起點始于對環(huán)境的主動認知與任務構建。

面對新環(huán)境無任務可做的冷啟動困境,系統(tǒng)通過自我提問(Self-Questioning)機制,利用LLM的生成能力結合環(huán)境探索中感知的特征(如API功能或界面布局),主動合成具有挑戰(zhàn)性且符合邏輯的候選任務來構建訓練課程。

這使得系統(tǒng)能夠自動生產(chǎn)出覆蓋不同難度和多樣性的訓練集,有效打破了對外部數(shù)據(jù)的依賴,解決了強化學習中常見環(huán)境適應性差的問題。

當訓練課程確立后,如何避免在復雜環(huán)境中的盲目試錯,決定了進化的速度。

對此,系統(tǒng)引入了自我導航(Self-Navigating)機制來破解低效探索的難題。

該機制將歷史探索中的成功軌跡和失敗教訓抽象為結構化的文本經(jīng)驗。

在執(zhí)行新任務時,智能體不再是從零開始,而是能夠通過檢索相似的過往經(jīng)驗,利用上下文學習指導當前的決策路徑。

這種機制讓智能體具備了“舉一反三”的能力,能夠避開已知的錯誤路徑,顯著提高了探索成功率。

而在執(zhí)行環(huán)節(jié)之外,如何從成敗中提取精準的反饋信號,同樣是決定進化質(zhì)量的關鍵。

針對長程任務中往往只有做完最后一步才知道成敗的獎勵稀疏痛點,AgentEvolver設計了自我歸因(Self-Attributing)機制。

系統(tǒng)引入了基于LLM的過程獎勵模型,不再粗放地依賴最終結果,而是對軌跡中的每一個動作步驟進行細粒度的因果分析和打分。

這種機制將粗粒度的結果獎勵轉化為細粒度的過程監(jiān)督信號,極大地提升了策略優(yōu)化的樣本效率,確保每一次嘗試都能轉化為有效的學習信號。

GitHub:https://github.com/modelscope/AgentEvolver
技術報告:https://arxiv.org/abs/2511.10395

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-08-26 09:08:00

2025-01-27 13:30:00

2025-07-30 09:07:00

2015-11-12 13:11:17

TensorFlow人工智能系統(tǒng)谷歌

2025-10-22 09:00:00

2019-01-31 09:00:00

開源實驗室管理系統(tǒng)

2024-11-20 09:38:40

2025-09-23 03:00:00

2025-06-12 08:46:00

2025-07-22 10:45:55

2023-10-17 12:33:27

AI模型

2021-08-04 09:48:05

數(shù)字化

2024-06-13 09:20:26

2013-04-07 09:38:00

HPC硬件HPC高性能計算

2025-09-18 10:10:31

2025-07-31 02:00:00

智能體Agent人工超級智能

2023-06-01 12:48:43

阿里云AI助手AI

2025-10-17 09:00:00

AI模型代碼

2025-08-14 09:00:00

模型訓練數(shù)據(jù)

2025-03-10 12:09:37

點贊
收藏

51CTO技術棧公眾號

亚洲一区二区三区在线播放| 91精品成人| 在线观看视频一区二区欧美日韩| 日韩av不卡播放| www.超碰在线.com| 午夜一级久久| 日韩网站免费观看高清| 老熟女高潮一区二区三区| 国产免费不卡| 亚洲精品老司机| 欧美日韩国产精品一区二区| 国产露脸无套对白在线播放| 一区二区三区国产在线| www.色综合| 第四色在线视频| 亚洲精品一区二区在线播放∴| 亚洲电影在线播放| 亚洲一区3d动漫同人无遮挡| 少妇无码一区二区三区| 久久69国产一区二区蜜臀| 97成人在线视频| 成人涩涩小片视频日本| 美女毛片一区二区三区四区| 日韩一级片网站| 中文字幕国产传媒| 九色porny丨首页入口在线| 中文字幕在线不卡一区二区三区| 久久狠狠久久综合桃花| 国产成人三级在线播放| 日本在线不卡视频| 69**夜色精品国产69乱| 一区二区三区影视| 日韩一区电影| 欧美福利电影网| 麻豆高清免费国产一区| 欧美一区二区高清| 国产精品人人妻人人爽人人牛| 羞羞电影在线观看www| 欧美激情自拍偷拍| 精品中文字幕人| 亚洲精品国产手机| 国内精品国产成人| 国产日韩av在线| 国产中文字幕视频| 一区二区三区导航| 97久久久免费福利网址| 国产亚洲自拍av| 午夜欧美精品久久久久久久| 久久精品最新地址| 天堂网av2018| 久久国产影院| 色偷偷综合社区| 丁香花五月婷婷| 欧美热在线视频精品999| 国产网站欧美日韩免费精品在线观看 | 丝袜av一区| 亚洲成年人在线| 无码人妻一区二区三区精品视频| 欧洲一区在线| 欧美一二三区在线观看| 女人扒开腿免费视频app| 麻豆国产一区| 精品国产一区二区精华| 三级视频网站在线观看| 啪啪激情综合网| 亚洲精品一二区| 一级片视频免费看| 国内精品伊人久久久| 中文字幕日韩专区| 希岛爱理中文字幕| 国产精品99免费看| 51精品国产黑色丝袜高跟鞋| 国产91精品看黄网站在线观看| 午夜宅男久久久| 国产精品日韩久久久久| 91丨九色丨蝌蚪丨对白| 国产精品一区二区果冻传媒| 国产精品9999久久久久仙踪林| 成人久久久精品国产乱码一区二区| 丁香婷婷综合网| 麻豆成人在线播放| 五月天激情视频在线观看| 国产毛片欧美毛片久久久| 九九视频精品全部免费播放| 一区二区欧美日韩视频| 久久人妻无码aⅴ毛片a片app| 久久久久久久久久久久久久久久久久 | 日韩系列欧美系列| 欧美情侣性视频| xxxx.国产| 麻豆成人久久精品二区三区红 | 欧美在线观看视频网站| 99热这里有精品| 亚洲成年网站在线观看| 欧美波霸videosex极品| 欧美日韩一卡| 国产极品精品在线观看| 国产三级在线观看视频| 91丨porny丨国产| 亚洲永久激情精品| 草美女在线观看| 欧美性大战xxxxx久久久| 久久久久久久久久久影视| 香蕉久久精品日日躁夜夜躁| 精品国产一区二区三区四区在线观看 | 91精品国产综合久久福利| 国产高清成人久久| 97精品视频| 欧美中文字幕视频在线观看| 国产人妖在线播放| 久久久91精品国产一区二区精品| 欧美与动交zoz0z| 激情开心成人网| 欧美成人a∨高清免费观看| 美国一级黄色录像| 国产日韩免费| av在线不卡观看| 天堂а√在线官网| 色呦呦一区二区三区| 绯色av蜜臀vs少妇| 亚洲91视频| 国产精品免费小视频| 亚洲色欧美另类| 亚洲图片欧美视频| 伊人精品视频在线观看| 日韩国产在线| 国产精品91久久| 日本中文字幕一区二区有码在线 | 一区视频网站| 日韩中文字在线| 男人的天堂avav| 免费看啪啪网站| 三级在线电影| 亚洲一区二区视频在线| 亚洲天堂2018av| 黄色工厂在线观看| 免费福利视频一区二区三区| 欧美变态口味重另类| 色偷偷www8888| 日本视频在线一区| 日本高清一区| 在线天堂资源| 日韩成人在线视频观看| 黄色一级片中国| 国产一区美女在线| 国产又黄又爽免费视频| 日韩欧美2区| 一本色道久久88亚洲综合88| 色老头在线视频| 国产亚洲精品福利| 日韩avxxx| 羞羞色国产精品网站| 91精品国产乱码久久久久久久久| 十八禁一区二区三区| 亚洲大片免费看| 亚洲一区二区三区综合| 亚洲欧美日韩一区在线观看| 狠狠久久综合婷婷不卡| 欧美男人天堂| 亚洲天堂视频在线观看| 在线观看国产精品入口男同| 国产精品亚洲一区二区三区在线观看| 色哟哟一区二区在线观看| www.狠狠爱| 六月丁香综合在线视频| 亚洲精品不卡| 欧美日韩在线中文字幕| 日韩精品色哟哟| 亚洲欧美影院| 国产视频一区二| 久久久久久91| 日本福利片在线| 欧美三级一区二区| 日本妇女毛茸茸| 99精品黄色片免费大全| 成人在线激情网| 日本一区二区免费高清| 亚洲综合自拍一区| 高清在线视频不卡| 国产亚洲成精品久久| 国产影视一区二区| 亚洲sss视频在线视频| 9.1成人看片免费版| 毛片av一区二区| 国产精品国三级国产av| 午夜精品福利影院| 91久久精品国产91久久性色| 黄网在线免费看| 亚洲视屏在线播放| www天堂在线| 色88888久久久久久影院按摩| 网站永久看片免费| 成人免费观看男女羞羞视频| 污污视频网站免费观看| 亚洲天天影视网| 欧美极品色图| 视频一区视频二区欧美| 欧美最顶级的aⅴ艳星| 视频免费一区| 亚洲精品videossex少妇| 亚洲图片在线播放| 高潮白浆女日韩av免费看| 任我爽在线视频| 99国内精品久久| 波多野结衣三级视频| 日韩av不卡一区二区| 青青草成人免费在线视频| 五月天激情综合网| 日本在线观看一区二区| 99国产精品久久一区二区三区| 国产精品96久久久久久| gogo高清在线播放免费| 久久亚洲精品成人| 国产在线一在线二| 亚洲精品wwwww| www.色日本| 91精品国产美女浴室洗澡无遮挡| 亚洲国产精品无码久久久| 亚洲一本大道在线| 日本中文在线视频| 欧美韩国日本综合| 亚洲最大成人网站| 97久久久精品综合88久久| 欧美人与性动交α欧美精品| 看电视剧不卡顿的网站| 亚洲精品中文字幕无码蜜桃| 亚洲影院在线| 成人性免费视频| 极品中文字幕一区| www婷婷av久久久影片| 我不卡手机影院| 亚洲人成人77777线观看| 国产精品美女久久久久久不卡 | 亚洲图片视频小说| 国产精品久久久一本精品| 短视频在线观看| 菠萝蜜视频在线观看一区| 男生和女生一起差差差视频| 精品一区二区三区在线观看| 99视频在线视频| 日本一不卡视频| wwwwww.色| 日韩精品乱码免费| 日日碰狠狠躁久久躁婷婷| 欧美亚洲三级| 久久精品午夜福利| 久久久久国产精品一区三寸| 国产精品一区二区免费在线观看| 亚洲久久视频| 黄色动漫网站入口| 老司机午夜免费精品视频| 成熟老妇女视频| 首页亚洲欧美制服丝腿| 91色国产在线| 久久精品久久精品| 欧美xxxxxbbbbb| 国产精品18久久久久久vr| 亚洲综合欧美综合| 欧美女v视频| 日韩成人久久久| 天天综合在线视频| 精品视频久久久久久久| 污版视频在线观看| 国产一二三av| 97超视频在线观看| 奇米精品一区二区三区在线观看| 国产淫片av片久久久久久| 国产精品女同一区二区| 国产精品一区2区3区| 久久久水蜜桃| 国产精品探花在线观看| 日韩成人在线资源| 天天久久综合| 久青草视频在线播放| 国产农村妇女精品一二区| 美女黄色片视频| 国产一区二区按摩在线观看| fc2成人免费视频| 亚洲国产91视频| 久久99精品久久久久婷婷| 欧美性生交大片免网| 大荫蒂性生交片| 亚洲欧洲一级| 日韩美女在线观看| 里番在线观看网站| 九九热这里只有精品免费看| 大桥未久在线视频| 国产精品日韩欧美综合| 欧美一区一区| 精品国产乱码久久久久久久软件| 国产丝袜在线播放| 欧美视频中文字幕| 国产成人a人亚洲精品无码| 亚洲精品福利在线观看| 美女欧美视频在线观看免费 | 亚洲一级不卡视频| 色av性av丰满av| 欧美一级理论片| 久草福利在线视频| 欧美日韩电影在线观看| 日本综合视频| 国产在线精品一区二区三区》| 日韩电影一区| 国模吧无码一区二区三区| 韩国成人福利片在线播放| 四虎影成人精品a片| 亚洲一区二区三区美女| 在线观看免费高清视频| 亚洲国产精久久久久久 | 久久久午夜视频| 暖暖日本在线观看| 欧美专区在线| 99热这里只有精品免费| 久久午夜激情| japanese在线观看| 亚洲欧美一区二区久久| 国产性生活视频| 亚洲电影在线看| 婷婷色在线播放| 成人在线视频福利| 国产成人三级| 欧美日韩激情视频在线观看| 国产成人99久久亚洲综合精品| 成人性生交大片免费看无遮挡aⅴ| 偷拍日韩校园综合在线| 精品国产黄色片| 久热国产精品视频| 国产精品原创视频| 日韩三级电影免费观看| 野花国产精品入口| 波多野结衣一二三区| 亚洲国产欧美在线| www.好吊色| 成人97在线观看视频| 亚洲狼人在线| 在线观看欧美激情| 久久国产精品99久久人人澡| 91社区视频在线观看| 欧美综合在线视频| 国产黄在线观看| 国产精品美女免费| 人人狠狠综合久久亚洲婷婷| 鲁一鲁一鲁一鲁一av| 欧美激情一区二区三区蜜桃视频| 欧美男人亚洲天堂| 亚洲天堂开心观看| 亚洲精品国产嫩草在线观看| 神马欧美一区二区| 久久福利视频一区二区| 国产白丝一区二区三区| 91精品在线观看入口| 性xxxfreexxxx性欧美| av一区二区三区免费| 日韩视频一区二区三区在线播放免费观看| 俄罗斯黄色录像| 精品国产户外野外| 免费在线观看一级毛片| 国产精品男人的天堂| 999视频精品| 男插女视频网站| 亚洲成人自拍偷拍| 久香视频在线观看| 国产精品亚洲一区二区三区| 亚洲91精品| 中文字幕在线视频播放| 色琪琪一区二区三区亚洲区| 在线观看h片| 91国产在线免费观看| 伊人久久综合| a级大片在线观看| 欧美日韩高清在线播放| 日韩av官网| 免费99视频| 国内国产精品久久| 一级片中文字幕| 日韩亚洲综合在线| 操欧美女人视频| avav在线看| 亚洲人亚洲人成电影网站色| 乱精品一区字幕二区| 国产精品爱久久久久久久| 久久久精品久久久久久96| 艳妇乳肉亭妇荡乳av| 欧美色男人天堂| 久久亚洲导航| 色播五月综合| 成人综合在线观看| 伊人久久亚洲综合| 欧美激情xxxx| 不卡视频在线| 日本少妇xxxx| 欧美一区二区三区在线看| 五月婷婷综合久久| 91在线国产福利| 天天躁日日躁aaaxxⅹ| 欧美日韩一区二区三区在线看 | 色天天色综合| 亚洲制服在线观看| 91久久精品日日躁夜夜躁欧美| 精品国产白色丝袜高跟鞋|