精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

突破Claude-4編程上限!自進化Agent框架拿下新SOTA,底模越好性能越高,已開源

人工智能
隨著Claude 4模型的發布,SE-Agent的性能被推向新的高度:在SWE-Bench Verify上,它取得了高達80%的Top-1 Resolution Rate,再次刷新了領域紀錄。

突破多步推理瓶頸,讓Claude-3.7-Sonnet解題成功率暴增20.6%。

在SWE-Bench Verified上刷新開源框架SOTA!

中科院、清華大學、階躍星辰等提出SE-Agent,一個創新的自進化(Self-Evolution)框架。

它不再滿足于簡單地“多想幾次”,而是讓智能體學會系統性地修訂、重組與精煉其整個思考過程,通過多軌跡間的相互啟發與對抗,探索更廣闊、更多樣化的解決方案空間。

隨著Claude 4模型的發布,SE-Agent的性能被推向新的高度:在SWE-Bench Verify上,它取得了高達80%的Top-1 Resolution Rate,再次刷新了領域紀錄

這充分證明該框架可以隨著基礎模型升級而不斷進步。

圖片圖片

核心思想:從“獨立嘗試”到“集體進化”

大語言模型(LLM)驅動的智能體在處理復雜推理和工具使用方面展現了驚人的潛力,尤其是在軟件工程等需要多步驟交互的任務上。然而,現有方法(如蒙特卡洛樹搜索 MCTS)常常陷入困境:它們將每次的解決嘗試(即“軌跡”)視為獨立事件,忽視了不同解決方案路徑之間的內在聯系,導致思維固化,難以跳出局部最優解。

通俗來說,傳統智能體就像一群各自為戰的士兵,雖然人數眾多,但缺乏協同。SE-Agent則引入了“進化”的視角,將每一次解決問題的完整路徑(軌跡)視為一個“物種”,通過三大核心操作,讓這些“物種”在一個“生態系統”中迭代進化,優勝劣汰。

圖片圖片

SE-Agent的三大進化算子

1、修訂(Revision)-深度自省與定向改進

生成初始多樣性:首先,通過多樣的規劃策略和可控的“突變”,生成一個包含不同解題思路的初始軌跡池,確保進化的起點足夠豐富。

反思與修正:隨后,智能體對每一條初始軌跡進行“復盤”,分析其優缺點、邏輯斷點和潛在的改進空間,然后進行有針對性的修正,消除邏輯不一致和冗余推理,完成個體的自我完善。

2、重組(Recombination)-跨軌跡的“雜交”與學習

這是SE-Agent最具創新性的部分。它不再將軌跡視為孤島,而是促進它們之間的“知識共享”。

交叉融合(Crossover):識別并提取不同軌跡中的高效片段(例如,一個軌跡擅長定位問題,另一個擅長編寫修復代碼),然后將這些“優勢基因”組合起來,創造出全新的、更強大的混合軌跡。

知識遷移(Transfer Learning):將成功軌跡中的關鍵策略和洞見,系統性地“嫁接”到其他表現較差的軌跡上,實現“差生”向“優等生”的學習。

3、精煉(Refinement)-多維評估與優化選擇

在每一輪進化后,SE-Agent會通過一個多維度評估函數(綜合考量任務完成度、推理質量和效率)對所有新舊軌跡進行打分。

精英選擇:保留得分最高的“精英”軌跡,同時通過策略性選擇確保軌跡的多樣性,避免所有方案趨同。這個過程不斷迭代,直到找到能夠穩健解決問題的最優解。

在最具挑戰性的代碼基準上實現 SOTA

研究團隊以SWE agent作為我們的Baseline,在公認極具挑戰性的SWE-bench Verified基準(包含500個真實GitHub問題)上對SE-Agent進行了全面評測。結果顯示,SE-Agent在所有測試的LLM上都實現了顯著的性能提升。

開源模型表現(Pass@1):

  • DeepSeek-V3:從31.6%提升至54.8%(+73%相對提升)
  • Qwen-2.5-72B:從18.8%提升至38.8%(+106%相對提升)
  • Llama-3.1-70B:從15.4%提升至32.6%(+112%相對提升)

閉源模型表現(Pass@1):

  • GPT-4o:從22.4%提升至40.4%(+80%相對提升)
  • Claude-3.7-Sonnet:從40.6%提升至61.2%(+51%相對提升)

圖片圖片

值得注意的是,SE-Agent在Claude-3.7-Sonnet上達到了61.2%的首次嘗試成功率,這創造了開源智能體框架在SWE-bench Verified上的最佳性能記錄。消融實驗進一步證明,修訂和重組兩大模塊對于框架的成功至關重要。

核心優勢與技術突破

SE-Agent的成功源于對現有智能體范式的幾大核心突破:

1、真正的解決方案多樣性:不同于傳統方法僅在表面表達上有所不同,SE-Agent通過軌跡級干預,生成本質上不同的解決路徑,大幅擴展了候選解決方案空間。

2、跨軌跡協同智能:SE-Agent充分利用軌跡間的豐富相互依賴關系和潛在協同效應,實現了集體智慧的最大化,突破了單一智能體的認知局限。

3、高效進化收斂:相比傳統遺傳算法,SE-Agent通過結構化的進化機制,能在顯著更少的進化周期內實現高質量結果。

4、模型無關的即插即用:SE-Agent作為一個獨立的優化模塊,可與現有智能體框架無縫集成,在多種 LLM 上都展現出一致的、強大的性能提升。

案例研究:SE-Agent如何跳出思維定勢?

在一個scikit-learn的真實Bug修復案例中,傳統智能體的問題顯露無遺。

圖片圖片

傳統智能體(上圖):所有嘗試都緊盯報錯信息出現的_validation.py文件,提出的修復方案幾乎是“換湯不換藥”的重復,始終無法觸及問題的根源,導致測試失敗。

SE-Agent(下圖):通過軌跡的重組與進化,SE-Agent強迫自己探索了完全不同的方向。它跳出了最初報錯的文件,成功定位到根源在于multioutput.py文件缺少了一個關鍵字段的寫入。最終,通過一行代碼的根本性修復,完美通過了所有測試。

這個案例生動地說明了SE-Agent如何通過在軌跡層面進行演化,有效避免了“隧道視野”,從而發現那些隱藏更深、也更為關鍵的解決方案。

結論與技術影響

SE-Agent的提出,為提升LLM智能體的復雜推理能力提供了一個全新的、高效的范式。其重要影響在于:

1、開創了軌跡級優化范式:從傳統的參數調整轉向系統性的推理路徑操作,為智能體能力提升提供了新的理論基礎。

2、驗證了集體智慧機制:證明了通過跨軌跡學習實現智能體群體智慧的有機融合,是突破單一智能體認知瓶頸的有效途徑。

3、構建了自進化智能系統:為實現能夠持續自我改進的智能體系統鋪平了道路。

展望未來,研究團隊計劃將SE-Agent的自進化思想擴展到更廣泛的路徑搜索問題中,例如強化學習策略發現、具身智能規劃等,為通往更強大、更魯棒的通用人工智能持續貢獻力量。

論文標題: SE-Agent: Self-Evolution Trajectory Optimization in Multi-Step Reasoning with LLM-Based Agents

論文鏈接: https://arxiv.org/pdf/2508.02085

開源代碼: https://github.com/JARVIS-Xs/SE-Agent

責任編輯:武曉燕 來源: 量子位
相關推薦

2024-03-25 13:06:00

數據訓練

2025-02-10 08:30:00

2025-07-29 09:03:00

2025-06-17 09:07:24

2022-04-08 14:40:59

框架訓練模型

2025-07-22 11:38:38

2025-10-31 08:50:00

AI模型開源

2024-01-06 17:12:44

視頻AI

2025-09-29 14:04:07

開源AI模型

2025-07-08 09:00:00

2022-12-25 13:59:09

模型架構

2025-01-03 15:39:02

2025-04-27 08:30:00

2023-05-15 15:38:59

AI模型

2024-04-02 09:17:50

AI數據開源

2023-03-20 13:43:00

AI論文

2025-01-26 11:00:00

2025-10-13 08:50:00

2024-01-18 10:57:35

AIM模型NLP

2010-08-31 11:06:37

點贊
收藏

51CTO技術棧公眾號

国产亚洲欧美久久久久 | 欧美xxxx中国| 欧美日韩一区二区欧美激情| 一区二区三区四区在线视频 | 欧美xxx性| 国产精品白丝在线| 国产一区二区视频在线免费观看| 日日摸天天添天天添破| 99热在线成人| 亚洲精品ady| 欧美成年人视频在线观看| 四虎影院观看视频在线观看 | 最新国产露脸在线观看| 91网站最新网址| 国产精品午夜视频| 日韩在线观看第一页| 欧美gayvideo| 精品一区二区三区三区| 红桃视频 国产| 亚洲天堂电影| 亚洲自拍欧美精品| 亚洲视频导航| 精品美女视频在线观看免费软件| 国产乱码精品1区2区3区| 国产91免费观看| 国产一级在线观看视频| 国产精品久久久久久久免费观看| 亚洲国产一区二区三区在线观看| 制服丝袜中文字幕第一页 | 久久精品影视| 国产网站欧美日韩免费精品在线观看| 午夜视频在线免费看| 精品无人乱码一区二区三区| 亚洲6080在线| 青青在线视频免费观看| 午夜免费视频在线国产| 国产亚洲婷婷免费| 久热国产精品视频一区二区三区| 国产成人久久精品77777综合 | 欧美国产先锋| www.国产精品一二区| 亚洲第一综合网| 日韩动漫一区| 日韩高清中文字幕| 男男做爰猛烈叫床爽爽小说| 亚洲一二av| 日韩欧美国产一区二区三区| 爱爱爱爱免费视频| 久久99久久久精品欧美| 在线视频你懂得一区| 91传媒久久久| 超碰在线公开| 天天色综合天天| www.日本在线播放| yellow在线观看网址| 亚洲午夜久久久| 欧美精品在欧美一区二区| gogo在线观看| 一区二区三区免费网站| 久久免费一级片| 黄网站免费在线播放| 国产精品的网站| 伊人久久av导航| 午夜在线小视频| 亚洲欧美日韩久久| 青青青青在线视频| sm捆绑调教国产免费网站在线观看 | 欧美另类videos死尸| www.成年人| 91国内精品| 日韩国产激情在线| av男人的天堂av| 日韩欧美中文| 九九热这里只有精品6| 久久亚洲成人av| 一本色道久久综合一区| 国产91在线播放九色快色| 国产免费www| 黄色日韩网站视频| 国产成人免费观看| 欧美日韩免费做爰大片| 国产精品免费观看视频| 大陆极品少妇内射aaaaaa| a天堂资源在线| 日本道精品一区二区三区| 亚洲天堂网2018| 国产精品欧美大片| 亚洲色图第一页| 免费看一级大片| 亚洲日本久久| 国产精品尤物福利片在线观看| 欧美另类高清videos的特点| 国产一区日韩二区欧美三区| 国产精品一区二区不卡视频| 男女污污视频在线观看| 亚洲色图丝袜美腿| 日韩av三级在线| 韩国精品视频在线观看| 亚洲第一中文字幕| 91在线无精精品白丝| 亚洲欧美伊人| 国产成人精品一区| 亚洲第一天堂影院| 国产农村妇女精品| 草b视频在线观看| 成人在线视频观看| 亚洲第一在线视频| 老司机成人免费视频| 免费日韩av片| 1区1区3区4区产品乱码芒果精品| 国产在线自天天| 亚洲综合色在线| 亚洲欧美视频二区| 久久综合五月婷婷| 欧美久久久精品| 国产一级片一区二区| www.66久久| 日韩一级片一区二区| 成人在线免费电影网站| 亚洲精品中文字幕av| 欧美成人片在线观看| 免费在线观看不卡| 欧美日韩一区在线播放| 女同一区二区免费aⅴ| 欧美日韩一区二区电影| 无码国产69精品久久久久同性| 欧美99在线视频观看| 国产精品视频自在线| 青青色在线视频| 亚洲成人免费视| 精产国品一区二区三区| 999久久久国产精品| 国产精品mp4| 日韩a在线观看| 亚洲3atv精品一区二区三区| 五月天六月丁香| 国产精品毛片一区二区在线看| 日韩av电影中文字幕| 天堂中文资源在线观看| 亚洲一区二区三区四区不卡| 久久aaaa片一区二区| 中文字幕一区二区精品区| 国产欧美日韩免费看aⅴ视频| 国产中文字幕在线观看| 在线看国产一区| 成人片黄网站色大片免费毛片| 夜夜嗨网站十八久久| 国产无套精品一区二区| 大黄网站在线观看| 亚洲电影中文字幕| 日韩免费在线视频观看| 成人免费毛片app| 精品国偷自产一区二区三区| 97久久综合区小说区图片区| 欧美激情综合亚洲一二区| 成人av免费播放| 亚洲成人精品影院| 午夜一区二区三区免费| 国产免费成人| 日韩欧美精品久久| 欧美日韩视频免费看| 日韩网站免费观看| 国产强被迫伦姧在线观看无码| 国产精品国产三级国产aⅴ中文| 777一区二区| 亚洲欧美一级二级三级| 国产精品99久久久久久久| gogo久久| 亚洲精品一区中文| 中文字幕有码视频| 亚洲精品中文字幕乱码三区| 伊人久久一区二区三区| 亚洲在线视频| 一本久久a久久精品vr综合| 国产精品99久久免费| 欧美精品电影免费在线观看| 天天操天天舔天天干| 在线观看区一区二| 麻豆明星ai换脸视频| 成人精品国产福利| 99久久激情视频| 97精品一区| 超碰97在线播放| 综合毛片免费视频| 久久精品国产成人精品| 免费av一级片| 欧美系列日韩一区| 久久精品波多野结衣| 成人污视频在线观看| 欧在线一二三四区| 欧美一区国产在线| 女人一区二区三区| 不卡的国产精品| 91精品国产色综合久久不卡98口 | 99在线小视频| 欧美性猛交xxxx富婆弯腰| 亚洲精品国产精品乱码在线观看| 成人免费视频一区二区| www.99av.com| 激情久久一区| 一区二区三区四区视频在线| 久久97久久97精品免视看秋霞| 国产精品久久久av久久久| 色黄网站在线观看| 一区二区三区亚洲| 少妇喷水在线观看| 日韩一区二区三区观看| 天天爱天天做天天爽| 亚洲伊人色欲综合网| 中文字幕精品亚洲| 26uuu精品一区二区| 香蕉视频xxxx| 蜜桃av一区二区三区电影| 国产精品国产亚洲精品看不卡| 色乱码一区二区三区网站| 精品国产福利| 国产在线一区不卡| 国产精品爽黄69| 日韩欧美精品一区二区三区| 久久夜精品va视频免费观看| a黄色在线观看| 亚洲精品久久久久久久久久久久| 国产乱人乱偷精品视频| 欧美在线不卡视频| 男人天堂2024| 欧美日韩亚洲激情| 国产中文字字幕乱码无限| 成人欧美一区二区三区1314| 蜜臀久久99精品久久久久久| 91小视频免费看| 美女搡bbb又爽又猛又黄www| 国产在线国偷精品免费看| xxxx一级片| 日本欧美一区二区三区| 少妇高清精品毛片在线视频 | www欧美激情| 久久九九精品| 精品国产免费av| 亚洲一区二区三区四区五区午夜 | 欧美aaaaa喷水| 免费萌白酱国产一区二区三区| 99在线高清视频在线播放| 国产高清精品二区| 91久久国产精品91久久性色| 久久精品97| 91精品在线国产| 不卡精品视频| 超碰97国产在线| 美女视频免费精品| 久久精品国产精品青草色艺| 久久精品亚洲成在人线av网址| 国产主播一区二区三区四区| 国产女人18毛片水真多18精品| 国产精品乱子乱xxxx| 欧美深夜视频| 日本一区二区在线视频| 欧洲福利电影| 中文字幕一区二区三区乱码| 性xxxx欧美老肥妇牲乱| 日本高清xxxx| 亚洲国产欧美国产综合一区| 国产精品裸体瑜伽视频| 久久都是精品| 一区二区三区 日韩| 久久er99精品| 一级网站在线观看| 成人午夜免费av| 少妇光屁股影院| 欧美激情在线看| 亚洲综合网在线| 午夜国产精品一区| 一级黄色av片| 91麻豆精品国产自产在线观看一区 | 国产精品主播| 色免费在线视频| 国产精品99久久久久久似苏梦涵 | 日韩 欧美 高清| 老司机午夜精品| 国产乱淫av麻豆国产免费| 99国产精品久久久久| 亚洲成人黄色av| 一区二区三区四区精品在线视频| 青青草av在线播放| 欧美日本在线观看| 日本免费一区视频| 一区二区成人av| 三级资源在线| 国产成人一区二区| 亚洲国产aⅴ精品一区二区| 国产主播一区二区三区四区| 久久美女视频| 老太脱裤让老头玩ⅹxxxx| 日韩av在线发布| 18禁一区二区三区| 中文字幕av在线一区二区三区| 成年人av电影| 欧洲一区在线观看| 亚洲精品国偷拍自产在线观看蜜桃| 亚洲免费视频网站| 制服丝袜在线播放| 国产精品99久久久久久久久久久久 | 国产极品一区二区| 国产精品每日更新| 在线观看亚洲天堂| 欧美一区二区视频在线观看2022| 色视频在线看| 九九久久国产精品| 高清av一区二区三区| 国产一区在线观| 婷婷综合伊人| 人妻无码视频一区二区三区| 国产精品 欧美精品| 五月婷婷六月香| 欧美特级www| 成人午夜免费在线观看| 久久精品久久久久久| 日韩精选视频| 久久日韩精品| 激情欧美国产欧美| 天天久久综合网| 国产精品久久久久9999吃药| 亚洲另类在线观看| 亚洲国产精品久久久久秋霞不卡| 国产人成网在线播放va免费| 国产精品免费一区| 国产成人精品三级高清久久91| 日韩国产成人无码av毛片| 黑人精品欧美一区二区蜜桃 | 欧美日韩在线网站| av动漫在线观看| 白白色亚洲国产精品| 九九在线观看视频| 日韩视频一区二区在线观看| 免费网站看v片在线a| 国产精自产拍久久久久久蜜| 精品久久美女| 中文字幕第21页| 国产亚洲短视频| 国语对白做受69按摩| 亚洲色图校园春色| 日本成人三级电影| 欧美一级二级三级九九九| 亚洲在线播放| 免费看污黄网站在线观看| 欧美日韩一区二区在线| 亚洲人成色777777精品音频| 97在线视频免费播放| 蜜桃一区av| 黄色网页免费在线观看| 99国产精品久久久久久久久久久| 国产免费av一区二区| 日韩黄色高清视频| 久久毛片亚洲| 深田咏美在线x99av| 秋霞成人午夜伦在线观看| 久久嫩草捆绑紧缚| 欧美一区二区福利在线| 久操av在线| 精品一区二区久久久久久久网站| 国产一区二区三区成人欧美日韩在线观看 | 美女黄色片网站| 国产成人综合在线播放| 久久精品视频9| 日韩成人免费视频| 暖暖成人免费视频| 四虎一区二区| 国产在线精品视频| 国产精品1234区| 亚洲女人被黑人巨大进入al| 久久久久黄色| youjizz.com在线观看| 99re成人精品视频| 老熟妇一区二区三区啪啪| 久久久久www| 精品伊人久久久| www.99av.com| 亚洲最大成人网4388xx| 亚洲日本香蕉视频| 成人久久一区二区| 狠狠爱综合网| 久久亚洲AV无码专区成人国产| 欧美丰满一区二区免费视频| 97在线超碰| 午夜精品一区二区在线观看的 | 欧美综合天天夜夜久久| 黄在线免费观看| 麻豆精品视频| 国产在线国偷精品免费看| 五月天激情国产综合婷婷婷| 色偷偷88888欧美精品久久久| 51亚洲精品| 一级特黄性色生活片| 亚洲在线免费播放| 大乳在线免费观看| www.av一区视频| 轻轻草成人在线| 日韩特黄一级片| 久久国产精彩视频| 精品高清久久| 性欧美丰满熟妇xxxx性久久久|