精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

登頂開源AI軟件工程師榜首,UIUC無Agent方案輕松解決SWE-bench真實編程問題

人工智能 新聞 開源
Agentless 是一種自動解決軟件開發問題的方法,它使用簡單的兩階段方法進行定位和修復,以修復代碼庫中的 bug。

這篇論文的作者均來自伊利諾伊大學香檳分校(UIUC)張令明老師團隊,包括:Steven Xia,四年級博士生,研究方向是基于 AI 大模型的自動代碼修復;鄧茵琳,四年級博士生,研究方向是基于 AI 大模型的代碼生成;Soren Dunn,科研實習生,目前為 UIUC 大三學生。張令明老師現任 UIUC 計算機系副教授,主要從事軟件工程、機器學習、代碼大模型的相關研究。

更多詳細信息請見張老師的個人主頁:https://lingming.cs.illinois.edu/

自從 Devin(首個全自動 AI 軟件工程師)提出以來,針對軟件工程的 AI Agent 的設計成為研究的焦點,越來越多基于 Agent 的 AI 自動軟件工程師被提出,并在 SWE-bench 數據集上取得了不俗的表現、自動修復了許多真實的 GitHub issue。

然而,復雜的 Agent 系統會帶來額外的開銷和不確定性,我們真的需要使用如此復雜的 Agent 來解決 GitHub issue 嗎?不依賴 Agent 的解決方案能接近它們的性能嗎?

從這兩個問題出發,伊利諾伊大學香檳分校(UIUC)張令明老師團隊提出了 OpenAutoCoder-Agentless,一個簡單高效并且完全開源的無 Agent 方案,僅需 $0.34 就能解決一個真實的 GitHub issue。Agentless 在短短幾天內在 GitHub 上已經吸引了超過 300 GitHub Star,并登上了 DAIR.AI 每周最熱 ML 論文榜單前三。

圖片


  • 論文:AGENTLESS : Demystifying LLM-based Software Engineering Agents
  • 論文地址:https://huggingface.co/papers/2407.01489
  • 開源代碼:https://github.com/OpenAutoCoder/Agentless

AWS 研究科學家 Leo Boytsov 表示:“Agentless 框架表現優異,超過所有開源 Agent 解決方案,幾乎達到 SWE Bench Lite 最高水平(27%)。而且,它以顯著更低的成本擊敗了所有開源方案。該框架采用分層查詢方法(通過向 LLM 提問來查找文件、類、函數等)以確定補丁位置。雖然利用 LLM,但不允許 LLM 做出規劃決策。”

圖片

Agentless 是一種自動解決軟件開發問題的方法,它使用簡單的兩階段方法進行定位和修復,以修復代碼庫中的 bug。在定位階段,Agentless 以分層方式來逐步縮小到可疑的文件、類 / 函數和具體的編輯位置。對于修復,它使用簡單的 diff 格式(參考自開源工具 Aider)來生成多個候選補丁,并對其進行過濾和排序。

圖片

研究者將 Agentless 與現有的 AI Software Agent 進行了比較,其中包括最先進的開源和商業 / 閉源項目。令人驚訝的是,Agentless 可以以更低的成本超越所有現有的開源 Software Agent!Agentless 解決了 27.33% 的問題,是開源方案中最高的,并且解決每個問題平均僅需 $0.29,在所有問題上(包括能解決和未解決的)平均只需要約 $0.34。

圖片

不僅如此,Agentless 還有改進的潛力。在考慮所有生成的補丁時,Agentless 可以解決 41% 的問題,這個上限表明補丁排序和選擇階段有顯著的改進空間。此外,Agentless 能夠解決一些即使是最好的商業工具(Alibaba Lingma Agent)也無法解決的獨特問題,這表明它可以作為現有工具的補充。

圖片

對 SWE-bench Lite 數據集的分析

研究者還對 SWE-bench Lite 數據集進行了人工檢查和詳細分析。

研究發現,SWE-bench Lite 數據集中,有 4.3% 的問題在問題描述中直接給出了完整的答案,也就是正確的修復補丁。而另外 10% 的問題描述了正確解決方案的確切步驟。這表明,SWE-bench Lite 中的某些問題可能更容易解決。

此外,研究團隊觀察到有 4.3% 的問題在問題描述中包含了用戶提議的解決方案或者步驟,但這些方案與開發人員的真實補丁并不一致。這進一步揭示了該基準測試的潛在問題,因為這些誤導性解決方案可能導致 AI 工具僅通過遵循問題描述來生成不正確的解決方案。

在問題描述質量方面,研究者觀察到,雖然 SWE-bench Lite 中大部分的任務都包含了足夠的信息,并且許多任務還提供了失敗示例來復現錯誤,但是仍有 9.3% 的問題沒有包含足夠的信息。例如需要實現一個新的函數或者添加一個錯誤信息,但是特定的函數名或者特定的錯誤信息字符串并沒有在問題描述中給出。這意味著即使正確實現了底層功能,如果函數名或錯誤信息字符串不完全匹配,測試也會失敗。

圖片

普林斯頓大學的研究人員,同時也是 SWE-Bench 的作者之一,Ofir Press 確認了他們的發現:“Agentless 對 SWE-bench Lite 進行了不錯的手動分析。他們認為 Lite 上的理論最高得分可能是 90.7%。我覺得實際的上限可能會更低(大約 80%)。一些問題的信息不足,另一些問題的測試過于嚴格。”

圖片

SWE-bench Lite-S:經過過濾的嚴格問題子集

針對這些問題,研究者提出了一個嚴格的問題子集 SWE-bench Lite-S(包含 252 個問題)。具體來說,從 SWE-bench Lite(包含 300 個問題)中排除了那些在問題描述中包含確切補丁、誤導性解決方案或未提供足夠信息的問題。這樣可以去除不合理的問題,并使基準測試的難度水平標準化。與原始的 SWE-bench Lite 相比,過濾后的基準測試更準確地反映了自動軟件開發工具的真實能力。

結語

盡管基于 Agent 的軟件開發非常有前景,作者們認為技術和研究社區是時候停下來思考其關鍵設計與評估方法,而不是急于發布更多的 Agent。研究者希望 Agentless 可以幫助重置未來軟件工程 Agent 的基線和方向。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-09-20 11:30:14

2025-10-13 09:33:19

2025-06-27 08:05:24

2025-07-07 13:50:56

AI編程算法

2025-05-15 09:13:00

2009-12-29 09:11:11

軟件工程師職業排行

2012-06-19 15:11:04

軟件工程師

2022-01-16 07:12:30

軟件工程師吵架開發

2009-02-11 13:15:54

軟件工程師女工程師google

2025-05-23 09:45:01

2023-06-05 10:07:13

軟件工程平臺工程師

2025-07-03 14:58:16

模型開源AI

2017-11-09 14:12:44

大數據軟件工程師算法工程師

2025-09-16 09:09:03

2022-07-29 09:12:44

軟件硬件開發

2022-04-18 10:13:32

軟件開發寫作

2022-09-16 08:00:00

軟件工程師求職薪酬

2014-08-20 10:24:11

軟件工程師

2010-08-10 13:29:58

軟件工程師
點贊
收藏

51CTO技術棧公眾號

日本网站在线观看一区二区三区 | 亚洲精品视频在线看| 亚洲a在线观看| 久久久久久av无码免费网站| 性欧美xxxx免费岛国不卡电影| 色网站国产精品| 少妇熟女一区二区| 香蕉av一区二区三区| 日日夜夜精品视频免费| 美日韩在线视频| 成人免费毛片糖心| 99精品国产一区二区三区2021 | 在线免费观看高清视频| 在线精品一区| 日韩中文字在线| 潘金莲一级淫片aaaaa| 亚洲精品.com| 亚洲无人区一区| 伊人久久青草| 你懂的在线网址| 国产河南妇女毛片精品久久久| 日韩av电影国产| 加勒比av在线播放| 久久亚洲精品中文字幕蜜潮电影| 亚洲国产精品久久91精品| 91高清国产视频| 亚洲第一影院| 婷婷夜色潮精品综合在线| 伊人久久av导航| 久久经典视频| 99国产精品久久| 成人91视频| 国产精品福利电影| 蜜桃精品在线观看| 欧日韩在线观看| 精品国产乱码一区二区| 欧美久久九九| 大胆人体色综合| 国产免费嫩草影院| 成人在线免费小视频| 日韩av网址在线观看| 男人添女人荫蒂国产| 国产精品白丝久久av网站| 欧美影院精品一区| 欧美综合在线观看视频| 亚洲最大网站| 欧美日韩国产精品专区| 无码中文字幕色专区| 污污视频在线| 亚洲激情在线播放| 国产一级大片免费看| 国产精品实拍| 亚洲精品国产一区二区精华液| 伊人久久99| 免费在线看黄网站| 亚洲视频一二区| 日本xxxxx18| www免费视频观看在线| 亚洲免费观看高清完整版在线观看| 亚洲在线欧美| 国产人成网在线播放va免费| 成人免费在线观看入口| 免费久久久久久| 91小视频xxxx网站在线| 一区二区三区在线视频免费 | 日韩午夜av| 欧美性视频精品| 无码人妻丰满熟妇区bbbbxxxx| 久久成人免费| 国产精品一区二区久久久| 在线观看国产成人| 国产麻豆日韩欧美久久| 99热在线国产| 天天操天天射天天舔| 久久亚洲捆绑美女| 亚洲激情一区二区三区| 久久77777| 亚洲福利视频一区| 欧美aⅴ在线观看| 成人在线观看免费播放| 欧美一区二区私人影院日本| 久草免费资源站| 亚洲警察之高压线| 色哟哟网站入口亚洲精品| 91嫩草|国产丨精品入口| 国产精品xvideos88| 97香蕉久久超级碰碰高清版| 日韩一级在线视频| 激情图片小说一区| 国产视频一区二区三区四区| 免费黄网站在线观看| 成人免费一区二区三区视频| 无码熟妇人妻av在线电影| jizz内谢中国亚洲jizz| 欧美区一区二区三区| 成人啪啪18免费游戏链接| 国产无遮挡裸体免费久久| 亚洲天堂av网| 欧美日韩大片在线观看| 久久天堂成人| 成人免费视频视频在| 国模吧精品人体gogo| 亚洲免费伊人电影| 国产福利影院在线观看| 亚洲码欧美码一区二区三区| 亚洲人成网7777777国产| 国产精品三区在线观看| 日韩二区在线观看| 国产一区二区久久久| 91精品专区| 午夜精品久久久久久久久久 | 蜜桃视频成人在线观看| 中文在线资源| 精品欧美一区二区三区精品久久 | 精品国产99| 欧美激情久久久| 91在线精品入口| 99re这里只有精品视频首页| 国产高潮呻吟久久久| 性欧美hd调教| 日韩电视剧在线观看免费网站| 尤物在线免费视频| 日韩电影在线观看电影| 久久精品国产一区二区三区不卡| 羞羞视频在线观看不卡| 欧美性受极品xxxx喷水| 中文字幕高清视频| 夜夜嗨一区二区三区| 亚洲www视频| 日韩欧美小视频| 欧美最新大片在线看| 岛国精品资源网站| 国产精品观看| 98国产高清一区| 国产成人l区| 6080日韩午夜伦伦午夜伦| 欧美人妻一区二区三区| 国产亚洲激情| 久久精品日产第一区二区三区| 秋霞在线午夜| 精品国产一二三区| 久久久久久福利| 成人一区在线看| 91传媒免费视频| 日韩精品视频在线看| 精品久久久999| 国产欧美一级片| 亚洲日本va午夜在线影院| 欧美wwwwwww| 日韩系列欧美系列| 国产欧美久久久久久| 91成人高清| 欧美男男青年gay1069videost | 综合久久亚洲| 亚洲最大激情中文字幕| av在线下载| 精品美女在线观看| 国产无遮挡又黄又爽| av电影在线观看不卡| www在线观看免费| 一区三区在线欧| 国产精品久久久久久久久影视| freemovies性欧美| 欧美日韩一区二区三区四区五区| 国产精品综合激情| 国产老女人精品毛片久久| 久久久天堂国产精品| 91久久偷偷做嫩草影院电| 久久久久久久91| 深夜福利视频在线免费观看| 色综合天天综合网国产成人综合天 | 99久久免费精品国产72精品九九 | 亚洲欧洲精品在线| 伊人久久大香伊蕉在人线观看热v 伊人久久大香线蕉综合影院首页 伊人久久大香 | 久久久久久久久久电影| 日韩av片网站| 午夜精品久久| 欧美二级三级| 日韩成人一区| 国模私拍视频一区| 国内av一区二区三区| 91麻豆精品国产91久久久久| 1024手机在线视频| 99国产精品国产精品毛片| 欧美伦理片在线看| 欧美成人久久| 欧美不卡三区| 国产精选久久| 欧美在线观看网址综合| 日韩毛片久久久| 欧美mv和日韩mv的网站| 日韩欧美国产另类| 夜夜爽夜夜爽精品视频| 四虎影成人精品a片| 黄色日韩网站视频| 逼特逼视频在线| 亚洲国产精品久久久天堂| 久草精品电影| 警花av一区二区三区| 青青草精品毛片| 日本高清成人vr专区| 亚洲人线精品午夜| 丰满少妇被猛烈进入| 欧美在线色视频| 日韩黄色在线视频| 中文字幕亚洲区| 大黑人交xxx极品hd| 国产精品一级二级三级| 激情婷婷综合网| 在线欧美不卡| 天天做天天爱天天高潮| 国产videos久久| 成人免费在线看片| 国产精品原创视频| 青青青国产精品一区二区| 日本h片在线| 日韩在线观看免费| 国产露出视频在线观看| 亚洲国产精久久久久久| 国产乱淫片视频| 在线这里只有精品| 啦啦啦免费高清视频在线观看| 亚洲精品视频在线观看网站| 三级黄色片在线观看| 国产午夜精品一区二区| 精品中文字幕在线播放| 国产高清久久久久| 手机在线免费毛片| 麻豆精品国产91久久久久久| 无码人妻丰满熟妇区五十路百度| 狠狠色狠狠色综合日日tαg | 亚洲日本国产| 国产av熟女一区二区三区| 999成人精品视频线3| 免费看成人av| 蜜桃成人av| 久久久久一区二区三区| 国产一区二区三区亚洲| 国产91亚洲精品一区二区三区| 亚洲男男av| 成人黄色av免费在线观看| 国产精品亲子伦av一区二区三区| 国产成人中文字幕| 成人开心激情| 国产精品嫩草视频| 成人免费黄色| 国产日韩欧美日韩| 欧美亚洲人成在线| 91精品国产综合久久香蕉922| 青娱乐极品盛宴一区二区| 国产精品人成电影| 日韩美香港a一级毛片| 国产日韩欧美电影在线观看| 亚洲日本免费电影| 亚洲自拍欧美色图| 网站一区二区| 国产精品果冻传媒潘| 精品综合久久88少妇激情| 极品尤物一区二区三区| 欧洲亚洲视频| 日本在线高清视频一区| 波多野结衣在线观看一区二区| 亚洲高清资源综合久久精品| 日韩在线理论| 成人在线免费高清视频| 悠悠资源网久久精品| 欧美牲交a欧美牲交| 久久中文欧美| 久久久精品高清| 国产成人啪免费观看软件| 一级黄色免费视频| 久久综合狠狠综合| 国产美女网站视频| 一区二区三区影院| 国产区一区二区三| 欧美日韩一区不卡| www.香蕉视频| 亚洲欧美日韩国产成人| 日本在线播放| 久久久在线视频| 日韩成人动漫| 亚洲自拍偷拍区| 亚洲大片精品免费| 伊人久久大香线蕉精品| 一区二区视频欧美| 亚洲福利精品视频| 大美女一区二区三区| 成人免费av片| 亚洲欧美激情在线| 无码aⅴ精品一区二区三区| 337p亚洲精品色噜噜狠狠| 内射后入在线观看一区| 在线播放国产一区中文字幕剧情欧美| 成人免费高清| 日韩美女视频免费在线观看| 国产精品xnxxcom| 欧美精品成人一区二区在线观看| 91精品国产91久久久久久黑人| 无码中文字幕色专区| 韩国女主播成人在线观看| 真人bbbbbbbbb毛片| 亚洲欧美在线视频| av大片在线免费观看| 欧美一区二区三区在线视频 | 日韩一区二区av| 蜜桃视频在线观看免费视频| 国产精品爽爽ⅴa在线观看| 精品亚洲免a| www.激情网| 久久黄色级2电影| 精品人妻一区二区三区视频| 一区二区在线观看视频| 亚洲天堂视频在线播放| 亚洲电影天堂av| 97caopor国产在线视频| 国产免费一区二区三区在线观看| 久久精品色综合| 青青草视频在线视频| 美腿丝袜亚洲三区| 国精产品一区一区三区免费视频| 一区二区视频在线看| 亚洲天堂网在线观看视频| 亚洲欧美视频在线| 看黄在线观看| 国产精品.com| 欧美国产激情| 免费黄频在线观看| 国产精品人妖ts系列视频| 天天干天天干天天| 亚洲韩国欧洲国产日产av| av网址在线播放| 国产一区私人高清影院| 波多野结衣一区| 免费一级特黄录像| 国产女人18毛片水真多成人如厕 | 欧美精品第一页| 在线视频二区| 国产精品伦子伦免费视频| 亚洲警察之高压线| 女人另类性混交zo| 91理论电影在线观看| 久久免费激情视频| 亚洲精品国产精品国自产在线| www.综合网.com| 国产精品久久国产精品| 欧美日韩午夜| 国产日韩视频一区| 性做久久久久久久久| 欧美一级一区二区三区| 国产69精品99久久久久久宅男| 一区二区三区在线资源| 国产手机免费视频| 99久久国产综合精品女不卡| 日韩 国产 在线| 日韩va亚洲va欧洲va国产| 亚洲精品国产精品国产| 日韩精品无码一区二区三区| 日韩专区在线视频| 国产又粗又猛又爽又黄的视频小说| 欧美亚洲国产bt| 免费人成在线观看播放视频 | 激情五月婷婷久久| 国产精品蜜臀在线观看| 国产夫妻性生活视频| 国a精品视频大全| 国产一区二区在线| 国产成人在线综合| 亚洲电影第三页| 欧美孕妇孕交xxⅹ孕妇交| 国产精品中文字幕在线| 欧美日韩一视频区二区| 亚洲色图14p| 欧美性受xxxx黑人xyx| 色呦呦呦在线观看| 鲁丝片一区二区三区| 久久电影网站中文字幕| 精品无码免费视频| 亚洲视频国产视频| 欧美大片91| 欧美韩国日本在线| 亚洲天天做日日做天天谢日日欢 | 亚洲av无码国产精品永久一区 | 99精品视频一区| 中文字幕+乱码+中文字幕明步| 另类视频在线观看| 天天久久夜夜| 污视频在线观看免费网站| 天天操天天综合网| 日本高清视频在线播放| 国产私拍一区| 精品伊人久久久久7777人| 日韩无码精品一区二区三区| 自拍偷拍亚洲区| 精品人人人人| 51自拍视频在线观看| 色综合久久综合中文综合网| 黄色的网站在线观看| 日本高清一区| 成人爱爱电影网址| 怡春院在线视频|