精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Paper2Code:好像復(fù)現(xiàn)論文成了可能

發(fā)布于 2025-5-8 00:35
瀏覽
0收藏

引言

可重復(fù)性是科學(xué)進(jìn)步的基石,然而在機(jī)器學(xué)習(xí)領(lǐng)域,許多已發(fā)表論文并未附帶相應(yīng)的代碼實現(xiàn),阻礙了結(jié)果驗證并延緩了科研進(jìn)程。為了解決這一難題,KAIST 與 DeepAuto.ai 的研究團(tuán)隊提出了 PaperCoder——一種自動化框架,能夠從機(jī)器學(xué)習(xí)研究論文中直接生成可執(zhí)行的代碼庫。

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

PaperCoder 框架概述圖 1:PaperCoder 的三階段流程,展示了如何通過規(guī)劃、分析和編碼,將論文轉(zhuǎn)換為完整的代碼庫。

相比于依賴現(xiàn)有代碼片段或 API 的傳統(tǒng)方案,PaperCoder 通過多代理系統(tǒng),利用大型語言模型(LLM)模擬人類的軟件開發(fā)流程,自動生成端到端、可執(zhí)行的代碼庫。該系統(tǒng)由規(guī)劃、分析和生成三個階段組成,每個階段由專門的 LLM 代理協(xié)同完成。

機(jī)器學(xué)習(xí)中的可重復(fù)性危機(jī)

機(jī)器學(xué)習(xí)社區(qū)正面臨嚴(yán)峻的可重復(fù)性挑戰(zhàn)。對近期頂級會議論文的統(tǒng)計顯示,公開代碼的比例極低:

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

機(jī)器學(xué)習(xí)會議中的代碼可用性圖 2:ICLR、NeurIPS 和 ICML 2024 上公開代碼的論文比例。

如圖所示,ICLR 2024 公開代碼的論文僅占 21.2%,NeurIPS 2024 為 10.9%,ICML 2024 僅有 31.6%。缺乏實現(xiàn)細(xì)節(jié)使研究人員難以復(fù)現(xiàn)和擴(kuò)展已有工作,進(jìn)而拖慢整個領(lǐng)域的發(fā)展。

PaperCoder 框架

PaperCoder 將“從論文到代碼”的任務(wù)形式化為軟件開發(fā)問題:

?R:包含方法與算法描述的研究論文

?C:生成的代碼庫

?M:基于 LLM 的轉(zhuǎn)換模型

該框架仿照人類開發(fā)流程,分為三個階段:

1.規(guī)劃階段

? 制定整體架構(gòu)路線圖(UML 類圖、時序圖)

? 確定文件依賴關(guān)系

? 生成配置文件

2.分析階段

? 對每個文件和函數(shù)進(jìn)行細(xì)粒度解析

? 分析輸入/輸出、模塊交互和算法細(xì)節(jié)

? 標(biāo)注關(guān)鍵組件(例如位置編碼、優(yōu)化器實現(xiàn))

3.生成階段

? 按照規(guī)劃階段確定的順序,合成完整代碼庫

每一階段由相應(yīng)的 LLM 代理執(zhí)行,各代理協(xié)同工作,確保論文中的重要細(xì)節(jié)被準(zhǔn)確提取并融入生成的代碼中。

技術(shù)實現(xiàn)

PaperCoder 通過對比樸素方法,凸顯其結(jié)構(gòu)化流程的優(yōu)勢:

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

PaperCoder 詳細(xì)實現(xiàn)圖 3:PaperCoder 與直接輸入 LLM 的樸素方法對比。

?樸素方法:將整篇論文直接喂入 LLM,往往忽略位置編碼或優(yōu)化器等細(xì)節(jié),導(dǎo)致生成的代碼錯誤頻發(fā)。

?PaperCoder

a.規(guī)劃:整體設(shè)計、UML 繪制、依賴規(guī)劃、配置生成

b.分析:細(xì)粒度解析每個模塊,識別關(guān)鍵算法組件

c.編碼:基于分析結(jié)果,逐步合成、實現(xiàn)所有必要功能

通過這種分層設(shè)計,PaperCoder 能精確捕捉諸如位置編碼實現(xiàn)、帶特定超參數(shù)的 Adam 優(yōu)化器等細(xì)節(jié),生成高質(zhì)量、易執(zhí)行的代碼。

評估方法

PaperCoder 的性能評估包括定量指標(biāo)與人工評估:

1.參考評估:將生成代碼與公開參考實現(xiàn)進(jìn)行對比

2.無參考評估:在缺乏參考實現(xiàn)的場景下,評估代碼質(zhì)量

3.人工評估:由原論文作者或領(lǐng)域?qū)<掖蚍?/p>

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

評估方法之間的相關(guān)性圖 4:基于參考評估與無參考評估得分的相關(guān)性 (r = 0.79)。

相關(guān)性高達(dá) 0.79,表明即使在無參考實現(xiàn)的情況下,也能可靠評估生成代碼的正確性。

結(jié)果與性能

實驗結(jié)果表明,PaperCoder 相較基線方法具有顯著優(yōu)勢:

1.超越現(xiàn)有基線:優(yōu)于 ChatDev、MetaGPT 等通用方案

2.組件貢獻(xiàn)明顯:規(guī)劃、分析、生成三階段均對性能提升有所貢獻(xiàn)(通過消融實驗驗證)

3.高執(zhí)行率:生成代碼幾乎無誤,僅需對 0.48% 的行數(shù)做小幅修改即可運行

4.出色的復(fù)現(xiàn)能力:在 Paper2Code 與 PaperBench 基準(zhǔn)上均表現(xiàn)優(yōu)異,成功復(fù)現(xiàn)論文關(guān)鍵組件

人工評估

由原論文作者及多位領(lǐng)域?qū)<疫M(jìn)行的人工評估顯示:

?77%的評審者認(rèn)為生成的代碼庫最佳

?85%的評審者反饋生成結(jié)果對其研究有顯著幫助

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

人工評估表格圖 5:人工評估示例表格

評估涵蓋數(shù)據(jù)處理、方法實現(xiàn)及實驗流程,充分驗證了 PaperCoder 在真實科研場景中的應(yīng)用價值。

局限性和未來工作

盡管 PaperCoder 已展現(xiàn)強(qiáng)大能力,但仍存在以下局限:

1.領(lǐng)域局限:目前僅針對機(jī)器學(xué)習(xí)論文,尚未擴(kuò)展到其他科學(xué)領(lǐng)域

2.評估依賴:主要依賴模型指標(biāo),缺乏更多自動化執(zhí)行評估方式

3.復(fù)雜算法:對高度復(fù)雜或全新算法的支持仍有挑戰(zhàn)

4.依賴管理:跨環(huán)境兼容性及外部依賴管理需進(jìn)一步完善

未來工作可聚焦于:

? 將框架擴(kuò)展至更多學(xué)科

? 引入自動化調(diào)試與故障定位評估

? 集成更豐富的執(zhí)行評估指標(biāo)

? 強(qiáng)化依賴性管理與環(huán)境適配

結(jié)論

Paper2Code 引領(lǐng)了從科研論文到可執(zhí)行代碼的自動化新范式,通過多代理 LLM 系統(tǒng)重塑人類軟件開發(fā)流程,實現(xiàn)端到端的代碼生成與復(fù)現(xiàn)。三階段方法確保關(guān)鍵細(xì)節(jié)無遺漏,定量與人工評估均證明了其有效性。PaperCoder 有望加速機(jī)器學(xué)習(xí)及其他領(lǐng)域的研究進(jìn)展,為構(gòu)建更加開放、高效的科研生態(tài)注入新動能。

本文轉(zhuǎn)載自??芝士AI吃魚??,作者:芝士AI吃魚

已于2025-5-8 11:30:18修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
午夜av区久久| 久久99国产精品免费| 欧美成人精品福利| 亚洲国产成人精品无码区99| 深夜福利视频在线观看| 免费在线成人网| 久久艹在线视频| 国产精品久久AV无码| 蜜桃视频成人m3u8| 亚洲欧洲av另类| 国产日韩一区二区三区| 无码无套少妇毛多18pxxxx| 先锋资源久久| 亚洲国产欧美一区二区丝袜黑人 | 午夜大片在线观看| 黑人玩欧美人三根一起进| 久久婷婷色综合| 91久久嫩草影院一区二区| 精品美女久久久久| 91综合在线| 亚洲摸下面视频| 国产在线a视频| 朝桐光一区二区| 亚洲国产一区视频| 亚洲视频小说| 天堂av电影在线观看| 精品一区二区三区免费| 欧美综合激情网| 久久久综合久久久| 日韩一区三区| 亚洲三级免费看| 污污免费在线观看| 日韩成人视屏| 欧亚一区二区三区| 久久国产亚洲精品无码| 2024最新电影免费在线观看| 国产欧美中文在线| 麻豆av一区| 免费国产精品视频| 国产精品系列在线播放| 日本伊人精品一区二区三区介绍| 日本免费在线播放| 亚洲欧美亚洲| 久久视频在线直播| 天堂а√在线中文在线鲁大师| 日韩在线黄色| 亚洲国产日韩欧美在线图片| 337p日本欧洲亚洲大胆张筱雨| 欧美美女被草| 欧美日韩亚洲高清一区二区| www.国产区| 免费福利视频一区二区三区| 亚洲不卡av一区二区三区| 视色,视色影院,视色影库,视色网| 2017亚洲天堂1024| 中文字幕欧美日韩一区| 日韩高清av| 国产永久免费高清在线观看视频| 久久久久免费观看| 日本婷婷久久久久久久久一区二区| 视频二区在线| 久久亚洲一级片| 欧美中日韩免费视频| 九一国产在线| 久久精品在这里| 青青草久久网络| 国产天堂素人系列在线视频| 国产清纯白嫩初高生在线观看91 | 91国在线观看| 国产wwwxx| 日韩一级特黄| 91精品国产一区二区| 中文字幕亚洲日本| 精品久久对白| 亚洲人a成www在线影院| 精品成人无码一区二区三区| 久久一区二区中文字幕| 久久国产精品偷| 久久午夜无码鲁丝片| 亚洲福利免费| 日本免费久久高清视频| 涩涩视频在线观看| 精品无人区卡一卡二卡三乱码免费卡| 亚洲一区亚洲二区| 国产综合视频在线| 久久先锋资源网| 亚洲一区二区三区乱码| 在线观看av免费| 精品免费在线视频| 91制片厂毛片| 免费一级欧美片在线观看网站| 精品国产伦理网| 国产免费无遮挡吸奶头视频| 欧美电影免费观看高清| 国产69精品99久久久久久宅男| 在线观看免费av片| 久久99在线观看| 国产欧美韩日| 在线激情小视频| 亚洲一区在线看| 日韩欧美xxxx| 中文字幕一区图| 亚洲女人被黑人巨大进入| 午夜精品一区二区三级视频| 一区二区日本视频| 成人免费视频网址| 天天av综合网| 中文字幕永久在线不卡| 欧美深夜福利视频| 成人污版视频| 亚洲男人av电影| 久久久久久久福利| 日本免费新一区视频| 国产精品99久久久久久久| 成年人视频在线免费观看| 亚洲午夜精品一区二区三区他趣| 黄色国产小视频| 欧美变态网站| 不卡av电影院| 亚洲av人无码激艳猛片服务器| 成人性生交大片免费看中文 | 亚洲成人激情小说| 欧美激情理论| 国产经典一区二区| 亚洲 欧美 激情 小说 另类| 一级特黄大欧美久久久| 成人日韩在线视频| 教室别恋欧美无删减版| 98精品国产自产在线观看 | 国产精品一区二区男女羞羞无遮挡 | 日本一区二区免费在线观看| 久久电影网站中文字幕| 日韩区国产区| 小h片在线观看| 精品国产sm最大网站| 人妻人人澡人人添人人爽| 日本免费新一区视频| 日本一区二区三区在线视频 | 天堂中文在线资| 无吗不卡中文字幕| 成年女人免费视频| 欧美午夜不卡| 亚洲综合自拍一区| 中文字幕伦理免费在线视频 | 亚洲欧洲日本精品| 成人久久一区| 国产高清视频一区三区| 国产在线电影| 欧美中文字幕一区二区三区| 91网站免费入口| 久久久久久穴| 日本一区高清在线视频| 欧美黑人粗大| 国产小视频91| 亚洲天堂一二三| 国产精品白丝在线| 两性午夜免费视频| 国产精品chinese| 福利视频久久| 草草视频在线| 亚洲男人7777| 中文字幕 视频一区| 中文字幕在线视频一区| 欧美xxxx黑人| 国产精品久久久亚洲一区| 久久久久久久久久久久久久久久av| 亚洲精品日产| 在线观看国产精品淫| 91成人国产综合久久精品| 日韩一区在线看| 免费黄色在线播放| 国产精品综合| 亚洲图片欧洲图片日韩av| 伊人久久大香伊蕉在人线观看热v| 理论片在线不卡免费观看| 成人av手机在线| 精品日韩美女的视频高清| 免费一级黄色录像| 国产精品99久久久| 日韩av在线第一页| 久久在线视频| 国精产品一区二区| 欧美成人家庭影院| 久久久久久久一区二区三区| 日本一本草久在线中文| 欧美夫妻性生活| 日韩欧美亚洲国产| 国产亚洲综合性久久久影院| av噜噜在线观看| 夜夜爽av福利精品导航| 亚洲日本精品| 国产96在线亚洲| 国产精品日韩欧美| 国产网红在线观看| 中文字幕av一区| 亚洲精品一区二区三区区别 | 国产内射老熟女aaaa∵| 婷婷中文字幕一区三区| 麻豆视频免费在线播放| 成人高清视频在线| 国产又大又黄又猛| 亚洲福利久久| 无码人妻aⅴ一区二区三区日本| 日韩影视高清在线观看| 91pron在线| 免费污视频在线一区| 欧美激情精品久久久| www.成人.com| 亚洲精品久久久久中文字幕欢迎你| 中文字幕第31页| 黄色一区二区在线| 日韩高清dvd碟片| 国产日产欧美一区| 色哟哟无码精品一区二区三区| 蜜臀a∨国产成人精品| 少妇高潮喷水在线观看| 中文字幕亚洲精品乱码 | 国产在线一二| 亚洲国产福利在线| 国产青青草视频| 一本在线高清不卡dvd| 日韩av电影网址| 亚洲免费观看高清完整版在线观看 | 99er精品视频| 国产精品美女网站| 欧美成人精品一区二区男人小说| 欧美精品videos性欧美| bt在线麻豆视频| 久久夜色精品国产亚洲aⅴ| av在线免费一区| 亚洲欧洲一区二区三区在线观看| 欧美特黄一级视频| 精品久久久久久久久久久院品网 | 懂色av懂色av粉嫩av| 国产精品麻豆一区二区| 鲁丝一区二区三区| 久久老女人爱爱| 欧美丰满少妇人妻精品| 成人福利视频在线看| 色综合久久久无码中文字幕波多| 国内精品久久久久影院色| 玖玖爱视频在线| 免费观看在线综合| 中文字幕网av| 免费久久精品视频| 黄色永久免费网站| 久久精品国产精品亚洲综合| 天天爱天天操天天干| 日韩电影在线观看一区| 国产一区视频免费观看| 日本欧洲一区二区| 天堂一区在线观看| 激情综合色丁香一区二区| 91小视频在线播放| 国产精品99久| 稀缺呦国内精品呦| 99久久久久免费精品国产| 久久久国产精品无码| 久久夜色精品国产噜噜av| 国产精品jizz| 欧美国产视频在线| 成年人免费视频播放| 一区视频在线播放| 玖玖爱免费视频| 亚洲成人激情综合网| 可以在线观看av的网站| 欧美性色视频在线| 中文字幕免费观看视频| 91麻豆精品国产91久久久更新时间| 国产伦理吴梦梦伦理| 日韩精品一区二区三区老鸭窝| 亚洲男人第一天堂| 亚洲免费影视第一页| 日本不卡视频| 欧美激情小视频| 亚洲伊人av| 国产精品专区第二| 综合激情网...| 欧美三级网色| 亚洲久久久久| 播放灌醉水嫩大学生国内精品| 奇米影视在线99精品| 日本女人性视频| 久久久久久久电影| 最新一区二区三区| 黑人狂躁日本妞一区二区三区| 最新国产中文字幕| 欧美videossexotv100| 欧美日韩国产综合视频| 久久精品夜夜夜夜夜久久| 9999精品成人免费毛片在线看 | 成人av网站在线| 国产91丝袜美女在线播放| 亚洲精品中文字幕乱码三区| 黄色在线视频网址| 日韩丝袜情趣美女图片| 视频一区二区在线播放| 久久九九有精品国产23| 乡村艳史在线观看| av成人免费观看| 欧洲三级视频| 久久成人福利视频| 久久99国产乱子伦精品免费| 熟女丰满老熟女熟妇| 亚洲人成网站精品片在线观看 | 欧美日韩中文精品| 秋霞网一区二区| 久久久精品国产亚洲| 久久青青视频| 国产精品日韩欧美一区二区三区| 日韩精品看片| 国产精品亚洲αv天堂无码| 国产一区二区三区在线观看免费 | 欧美国产日本高清在线 | 亚洲一区久久久| 欧美综合一区| 男人操女人免费软件| 国产成人午夜片在线观看高清观看| www色com| 日韩欧美国产高清91| 成人午夜免费在线观看| 久久久国产精品视频| 中文.日本.精品| 久久天天狠狠| 亚洲午夜电影| 又色又爽又黄18网站| 国产精品福利一区二区三区| 欧美一级淫片免费视频黄| 亚洲国产天堂网精品网站| 一区二区三区伦理| 91久久久精品| 99精品美女| 蜜臀av免费观看| 国产精品午夜久久| 久久久久亚洲视频| 亚洲视频国产视频| 亚洲欧美se| 久久综合狠狠综合久久综青草 | 中文字幕色av一区二区三区| 日韩不卡高清视频| 亚洲男子天堂网| 全亚洲第一av番号网站| 久久这里精品国产99丫e6| 亚洲一区欧美激情| 青青草福利视频| 欧美香蕉大胸在线视频观看| 色综合888| 日本中文字幕不卡免费| 狠狠色狠狠色综合婷婷tag| 欧美国产日韩在线播放| 国产日产亚洲精品系列| 欧美 亚洲 另类 激情 另类| 伊人男人综合视频网| 国产精品第一国产精品| 一区二区成人国产精品| 激情综合色播激情啊| 欧美精品videos极品| 欧美成人bangbros| 国产污视频在线播放| 精品在线观看一区二区| 久久精品伊人| 91成人精品一区二区| 91精品国产一区二区三区| 羞羞的网站在线观看| 激情五月综合色婷婷一区二区 | 国产一区二区三区电影在线观看| 欧美日韩一区二区在线免费观看| 国产欧美综合在线观看第十页| 伊人精品一区二区三区| 久久夜色精品国产亚洲aⅴ| 高清精品xnxxcom| 日韩手机在线观看视频| 国产精品的网站| 亚洲国产精品二区| 欧洲成人免费aa| 999视频精品| av不卡中文字幕| 日韩欧美在线字幕| 免费高清在线观看| 官网99热精品| 美女网站久久| 国产精品嫩草影院俄罗斯| 精品国产a毛片| 久久夜夜操妹子| 久久久久久久久影视| 久久免费的精品国产v∧| 中文字幕视频一区二区| 欧美黄色三级网站| 免费观看久久av| 超碰在线超碰在线| 精品久久久久久亚洲国产300| av资源网站在线观看| 99电影在线观看| 日本成人在线一区| 精品一级少妇久久久久久久| 亚洲欧美日韩爽爽影院| 日韩一区二区三区高清在线观看| 国产午夜福利视频在线观看| 亚洲三级小视频| 伦理片一区二区三区|