精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICLR 2025 | 真正「Deep」的「Research」,通過強化學習實現可自主進化的科研智能體來了!

人工智能 新聞
牛津大學教授 Will MacAskill 最新預言未來 AI 的增長率足以在不到 10 年的時間里,推動相當于 100 年的技術進步。

CycleResearcher 研究團隊成員包括:張岳教授,西湖大學人工智能系教授,工學院副院長,其指導的博士生朱敏郡、張鴻博、鮑光勝、訪問學生翁詣軒;UCL 訪問研究員楊林易博士,25 Fall 入職南方科技大學擬任獨立 PI,博士生導師,研究員。

AI 技術不斷進步,科研自動化浪潮正在深刻改變學術世界!近日,來自西湖大學、UCL 等機構的研究團隊在自動化科研方向發布了一項突破性的成果:CycleResearcher 。 CycleResearcher 首次實現了可訓練的科研流程的全鏈路端到端訓練,覆蓋智能文獻檢索、模型主動提問、強化學習迭代優化論文創新點、方法論架構設計、實驗設計到論文自動生成的完整閉環。 

值得一提的是,同類功能在 OpenAI 商業化方案中需支付高達 2 萬美元 / 月的服務費用,而團隊開源了所有代碼、數據、和 Demo:

圖片

  • 論文鏈接:https://openreview.net/forum?id=bjcsVLoHYs
  • 網頁鏈接:https://ai-researcher.net/
  • 代碼鏈接:https://github.com/zhu-minjun/Researcher

牛津大學教授 Will MacAskill 最新預言未來 AI 的增長率足以在不到 10 年的時間里,推動相當于 100 年的技術進步。如何讓 AI 實現「遞歸自我改進」成為了解決這個問題的關鍵!然而,現有的一系列工作包括 SakanaAI 公司于去年 8 月發布的 AI Scientist、香港大學最近發布的 AI-Researcher 都是基于調用 API 構建推理的框架去實現自動化科研,而無法被訓練優化。CycleResearcher(模型上傳于 24 年 8 月)是全球首個通過強化學習迭代優化訓練實現的 AI 科研智能體。

圖片

圖 1: AI Researcher 功能展示圖

CycleResearcher 首次實現了通過強化學習進行科研過程的自動迭代改進,它能夠模擬完整的科研流程,包括文獻綜述、研究構思、論文撰寫,以及模擬實驗結果。

研究團隊主要干了三件事情:

1)數據集: 發布了兩個大規模數據集 Review-5k 和 Research-14k,用于評估和訓練學術論文評審和生成模型。

2)CycleResearcher 模型: 可以生成質量接近人類撰寫預印本的論文(評分 5.36 分),實現 31.07% 的接受率。

3)CycleReviewer 模型: 一個做論文評審的模型,在平均絕對誤差 (MAE) 方面顯示出令人鼓舞的結果,與人類評審員相比,平均絕對誤差(MAE)降低了 26.89%。

利用商業大型語言模型(LLMs)作為研究助理或想法生成器已經取得了顯著進展,但在多達上萬次模擬同行評議中通過反饋而自我進化的自動科研大模型從未實現過。這項研究的提出旨在解決了這個領域難題。

圖片

圖 2: CycleResearcher 訓練框架圖

創新點詳細解讀:

1. 高質量數據集與模型規模化:為訓練 CycleResearcher,研究團隊專門構建了包含近 1.5 萬篇高質量學術論文的數據集(Research-14K),數據來源覆蓋了 ICLR、NeurIPS、ICML、ACL、EMNLP、CVPR 和 ICCV 等頂級會議。提供了多個不同規模的模型(12B、72B、123B),滿足不同科研需求。

2. 強化學習與迭代反饋機制:如圖二所示,CycleResearcher 的核心技術,在于其采用迭代式偏好優化(Iterative SimPO)的訓練框架,這一方法使得在線強化學習(Online RLHF)成為了可能。這個框架包含兩個關鍵模型:策略模型 (CycleResearcger) 和獎勵模型 (DeepReveiwer)。

3. 指令微調(SFT)熱身階段:策略模型 CycleResearcher 負責生成論文的各個部分,它首先會進行廣泛的文獻綜述,從輸入的 bib 文件中獲取所有參考文獻及其摘要,全面了解研究背景。然后,它會交替生成論文的大綱和正文,確保邏輯流暢。具體來說,它會先生成動機和大綱中的主要思想,然后生成標題、摘要、引言和方法部分。接下來,概述實驗設置和結果,隨后生成實驗設計和模擬結果(注意,這里的實驗結果是模擬的)。最后,它會分析實驗結果并形成結論。整個過程就像一位經驗豐富的科研人員在撰寫論文一樣,有條不紊,邏輯清晰。獎勵模型 CycleReviewer 則負責模擬同行評議,對生成的論文進行評估和反饋。它會從多個維度對論文進行打分,并給出具體的評審意見。

4. 迭代反饋訓練階段:研究人員首先通過拒絕采樣獲取樣本,通過 CycleReviewer 的打分構成偏好對,兩個模型相互配合,通過強化學習的方式不斷優化,CycleResearcher 根據 CycleReviewer 的反饋不斷改進自身的論文生成策略,CycleReviewer 則根據 CycleResearcher 生成的論文不斷提高自身的評審能力。兩個模型交互反饋,不斷優化策略。在 Iterative SimPO 算法中,SimPO 算法雖然可以幫助 AI 區分 “好” 論文和 “壞” 論文,但它不能保證 AI 生成的文本是流暢的。因此,我們將 SimPO 損失和 NLL 損失結合起來,讓 AI 模型既能寫出高質量的論文,又能保證文本的流暢性。

5. 實驗結果:CycleResearcher 生成論文的模擬評審平均得分達到 5.36 分,超過目前 AI Scientist 的 4.31 分,且十分接近人類真實預印本的平均水平(5.24 分)。同時,CycleResearcher 論文的接受率達到了 35.13%,遠高于 AI Scientist 的 0%。

總結

1.這篇工作首次提出了一個用于自動化整個研究生命周期的迭代強化學習框架 通過集成 CycleResearcher(策略模型)和 CycleReviewer(獎勵模型),該框架能夠模擬真實世界的研究 - 評論 - 改進的迭代循環。

2.團隊發布了兩個大規模數據集,用于學術論文生成和評論的評估與訓練 Review-5k 和 Research-14k 數據集專為捕捉機器學習中同行評審和研究論文生成的復雜性而設計,為評估和訓練學術論文生成和評審模型提供了寶貴的資源。

3.CycleResearcher 在研究構思和實驗設計方面表現出一致的性能,可以達到人類撰寫預印本的論文質量,接近會議接受論文的質量。 這表明 LLM 可以在科學研究和同行評審過程中做出有意義的貢獻。

我們堅信科研工具應當開放共享,因此提供了完整的開源資源套件:

pip install ai_researcher

開源套件包含:

1. 不同規模模型:所有模型均支持本地部署

  • CycleResearcher:提供 12B、72B 和 123B 三種規模
  • CycleReviewer:提供 8B、70B 和 123B 三種規模
  • DeepReviewer:提供 7B 和 14B 兩種規模 

2. 大規模訓練數據集: 

  • Review-5K:包含 4,989 篇論文的專業評審數據
  • Research-14K:包含 14,911 篇高質量論文的結構化數據
  • DeepReview-13K:包含 13,378 篇論文的多維度深度評審數據

3. 詳盡教程: 

  • CycleResearcher 教程:https://github.com/zhu-minjun/Researcher/blob/main/Tutorial/tutorial_1.ipynb
  • CycleReviewer 教程:https://github.com/zhu-minjun/Researcher/blob/main/Tutorial/tutorial_2.ipynb
  • DeepReviewer 教程:https://github.com/zhu-minjun/Researcher/blob/main/Tutorial/tutorial_3.ipynb
責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-23 10:12:14

算法強化學習

2024-05-30 16:37:29

2025-08-01 09:05:00

2025-08-12 08:58:03

2025-07-24 09:05:00

2024-07-22 08:30:00

神經網絡AI

2025-03-10 12:09:37

2017-03-28 10:15:07

2023-08-28 06:52:29

2025-10-10 08:33:49

2025-07-01 09:05:28

2017-04-04 19:52:24

強化學習深度學習機器學習

2025-06-03 06:12:03

2025-10-11 04:00:00

2023-10-19 13:25:00

AI訓練

2020-05-06 16:07:05

百度飛槳

2024-07-23 14:10:48

2022-11-02 14:02:02

強化學習訓練

2025-01-06 09:45:00

AI訓練數據

2023-06-16 20:50:13

大模型
點贊
收藏

51CTO技術棧公眾號

欧美片一区二区三区| 中文字幕在线一区| 4438全国成人免费| 极品人妻videosss人妻| 九色porny视频在线观看| 91丨porny丨国产入口| 日韩免费视频在线观看| 成人黄色短视频| 日本xxxxxwwwww| 乱码第一页成人| 日韩福利在线播放| 午夜免费一区二区| 成人免费看片| 91麻豆视频网站| 国产精品最新在线观看| 欧美黑吊大战白妞| 国产精品入口久久| 日韩一区二区三| 成人av一级片| 国产成人午夜| 91捆绑美女网站| 国产日产亚洲精品| 国产免费av一区二区| 欧美日韩一二三四| 欧美电影一区二区| 中国丰满熟妇xxxx性| 2021av在线| 99久久婷婷国产综合精品| 国产精品久久久久福利| 久久久久久久久久99| 国产亚洲一区| 精品免费一区二区三区| 香港日本韩国三级网站| 大桥未久在线视频| 亚洲欧美激情在线| 日本在线成人一区二区| www男人的天堂| 免费在线观看一区二区三区| 国内久久久精品| 黄色录像一级片| 成人6969www免费视频| 欧美成人性战久久| 亚洲黄色av片| 99蜜月精品久久91| 狠狠做深爱婷婷久久综合一区| 一区二区三区欧美成人| 日本一区二区三区在线观看视频| 亚洲免费观看在线| 欧美夫妻性生活视频| 亚洲欧美激情一区二区| 日韩欧美美女在线观看| 国产精品人成在线观看免费| 国产精品视频在线免费观看| 国内av在线播放| 嫩草成人www欧美| 97在线视频国产| 真实国产乱子伦对白在线| 日本激情一区| 国产亚洲精品久久久久久777 | 欧美精品一卡| 日韩网站免费观看高清| www在线观看免费视频| 精品一区二区男人吃奶| 精品成人私密视频| 性生交大片免费看l| 亚洲伦理久久| 欧美精品乱人伦久久久久久| youjizzxxxx18| 国产经典一区| 欧美视频在线一区二区三区| 欧美在线一区视频| 国产第一页在线| 夜夜嗨av一区二区三区中文字幕 | 88av在线播放| 福利片在线一区二区| 日韩欧美的一区| 久久久久久久久久影视| 激情小说一区| 日韩av中文字幕在线免费观看| 香港三日本8a三级少妇三级99 | 精品视频第一区| 视频国产一区二区三区| 久久男人中文字幕资源站| 亚洲同性gay激情无套| 久久人人爽国产| 久久精品人妻一区二区三区| 国精品一区二区| 午夜精品视频在线| 午夜婷婷在线观看| 免费国产亚洲视频| 亚洲一区二区中文字幕| 成人久久久精品国产乱码一区二区| 懂色av中文字幕一区二区三区| 国产精品v欧美精品v日韩| 手机看片一区二区| 91啪亚洲精品| 一区二区视频国产| 麻豆福利在线观看| 日韩欧美亚洲国产一区| 91激情视频在线| 国产亚洲高清在线观看| 亚洲第一av在线| 91精品国自产在线| 欧美精品一卡| 青草青草久热精品视频在线网站| 国产精品熟女视频| 国产精品99久久久久久似苏梦涵 | 女人抽搐喷水高潮国产精品| 国产一区二区三区精品久久久| 开心激情五月网| 亚洲精品色图| 国产一区视频在线播放| 理论片中文字幕| 99久久久精品| 日韩欧美亚洲在线| 日本天码aⅴ片在线电影网站| 狠狠久久五月精品中文字幕| 亚洲免费黄色录像| 亚洲女娇小黑人粗硬| 欧美床上激情在线观看| 久久久成人免费视频| 日本视频在线| av成人免费在线观看| 日本一区网站| 在线观看日本黄色| v片在线观看| 色噜噜狠狠色综合欧洲selulu| 99视频在线观看视频| 九一成人免费视频| 欧美日韩国产999| 国产成人精品一区二区色戒| 成人丝袜18视频在线观看| 亚洲国产一区二区三区在线| 深夜av在线| 欧美成人女星排行榜| 亚洲毛片亚洲毛片亚洲毛片| 国产精品日本| 99久久精品免费看国产一区二区三区| 加勒比一区二区三区在线| 亚洲精品中文在线影院| 青青草精品视频在线观看| 女同一区二区三区| 国模私拍一区二区三区| 国产免费av电影| 中文字幕不卡在线观看| 国模无码视频一区二区三区| 欧美男男gaygay1069| 亚洲欧美精品在线| 九九热在线免费观看| 成人午夜激情视频| 黄色成人在线免费观看| 国产精品亚洲欧美日韩一区在线 | 成年人三级视频| 午夜福利一区二区三区| 一区二区三区丝袜| 久久成年人网站| 国产精品99久久精品| 欧美日韩午夜视频在线观看| 天天操精品视频| 天天综合网91| 国产主播精品在线| 国产视频中文字幕在线观看| 欧美日韩精品一区二区三区蜜桃| 精品人妻一区二区三区日产乱码卜| 欧美私人啪啪vps| 成人高清在线观看| 性欧美videoshd高清| 欧美一区永久视频免费观看| 日韩一区二区不卡视频| 国产在线精品不卡| 久久国产精品久久精品国产| 天堂√8在线中文| 日韩av中文字幕在线播放| 国产性xxxx高清| 91在线精品秘密一区二区| 精品视频免费在线播放| av成人综合| 91成人在线观看国产| 天堂成人在线| 欧美自拍偷拍午夜视频| 亚洲色图日韩精品| 国产一区二区三区黄视频| 69精品丰满人妻无码视频a片| av成人app永久免费| 韩剧1988在线观看免费完整版| 神马久久久久久久久久| 一本久久精品一区二区| 国产又黄又粗视频| 精品亚洲porn| 国产精品av免费观看| 精品福利一区| 日本 国产 欧美色综合| 精品国产综合久久| 亚洲第一会所001| 视频直播国产精品| av网站在线免费看| 亚洲444eee在线观看| 亚洲一区二区三区蜜桃| 精品夜夜嗨av一区二区三区| 国产精品久久国产| 久久99国产精品视频| 国产日韩欧美在线看| 久久香蕉av| 亚洲欧美精品在线| 国产在成人精品线拍偷自揄拍| 亚洲夂夂婷婷色拍ww47| 蜜臀av粉嫩av懂色av| 秋霞午夜鲁丝一区二区老狼| 黄色激情在线视频| 波多野结衣在线观看一区二区| 国产一区私人高清影院| 黄色漫画在线免费看| 色哟哟网站入口亚洲精品| 欧美 日韩 国产 成人 在线 91| 日本精品一区二区三区高清| 99精品久久久久| 国产欧美一区二区在线观看| 中文字幕第六页| 亚洲欧美日韩专区| 日产精品久久久久久久蜜臀| 国产精品午夜一区二区三区| 91视频免费进入| gogo亚洲高清大胆美女人体| 欧美寡妇偷汉性猛交| 水蜜桃色314在线观看| av电影免费在线看| 日韩在线视频观看| 男人天堂亚洲二区| 精品国产1区二区| 91九色蝌蚪91por成人| 日韩欧美在线字幕| 欧美成人精品欧美一| 欧美高清在线精品一区| 国产激情视频网站| 国产精品一区久久久久| 91n.com在线观看| 夜夜夜久久久| 福利在线小视频| 日本成人小视频| 青青成人在线| 欧美男人操女人视频| 91九色对白| 自拍偷拍亚洲图片| 国产精品自产拍高潮在线观看| 二区三区不卡| 97视频免费在线看| 成人在线高清免费| 欧美乱妇高清无乱码| 超碰在线caoporn| 日韩视频亚洲视频| av在线电影播放| 国产小视频91| jizz在线观看视频| 一区二区三区www| 国产在线观看黄| 国产一区二区三区视频在线观看 | 国产成人综合在线观看| 热久久久久久久久| 麻豆成人免费电影| 一道本在线免费视频| 麻豆国产精品官网| 一二三av在线| 国产精品一区在线观看你懂的| √天堂资源在线| 精品在线播放免费| 中文字幕av一区二区三区人妻少妇| 久草中文综合在线| 亚洲国产欧美日韩在线| 国产a精品视频| 久久精品aⅴ无码中文字字幕重口| 粉嫩13p一区二区三区| 精品熟女一区二区三区| 99亚偷拍自图区亚洲| 国产人妻人伦精品1国产丝袜| 波多野结衣视频一区| 免费的av网站| 国产欧美一区二区三区鸳鸯浴| 美国黑人一级大黄| 国产福利片在线| 亚洲欧美国产va在线影院| 国产中文字幕在线看| 中文字幕精品久久久久| 黄在线免费看| 久久久久久久香蕉网| 免费网站在线观看人| 68精品久久久久久欧美| 肉色欧美久久久久久久免费看| 欧美在线激情网| 亚洲日本免费电影| 含羞草久久爱69一区| 精品国产午夜| 亚洲乱码日产精品bd在线观看| 亚洲国产精品第一区二区三区| 人妻有码中文字幕| 极品尤物av久久免费看| 佐佐木明希电影| 国产午夜精品一区二区三区嫩草| 午夜国产福利视频| 亚洲成精国产精品女| 在线观看你懂的网站| 欧美成人一区二区三区在线观看| 亚洲国产综合一区| 亚洲天堂av在线播放| 尤物在线网址| 国产精品视频自在线| av不卡一区| 亚洲精品在线视频观看| 欧美日一区二区三区在线观看国产免| 阿v天堂2018| 九九**精品视频免费播放| 3d动漫精品啪啪一区二区下载| 亚洲激情男女视频| 亚洲一区二区天堂| 亚洲欧美日韩一区二区三区在线| 色呦呦在线视频| 成人欧美一区二区三区黑人| 国产剧情一区| 欧美精品99久久| 粉嫩在线一区二区三区视频| 国产免费一区二区三区四区| 欧美性xxxxx极品少妇| 天堂av电影在线观看| 久久青草福利网站| 亚洲一区 二区| 亚洲黄色网址在线观看| 蜜臀av一区二区在线免费观看 | 香蕉久久夜色精品国产更新时间| 9191国产视频| 久久国产福利国产秒拍| x88av在线| 中文字幕资源网在线观看免费| 国产精品99久久久久久久久久久久 | 一卡二卡欧美日韩| av一级黄色片| 久久国产精品视频| www欧美在线观看| 综合一区中文字幕| 精品一区二区三区蜜桃| 日本成人精品视频| 欧美日韩视频在线第一区| 国产一二在线观看| 日韩av免费在线观看| 日韩免费电影在线观看| 成年人视频观看| 26uuu久久综合| 亚洲 欧美 成人| 亚洲色图美腿丝袜| 成人久久网站| 艳色歌舞团一区二区三区| 麻豆精品国产91久久久久久| 在线观看日本黄色| 欧美一区二区视频在线观看2020 | 亚洲二区三区不卡| 少妇性l交大片7724com| 亚洲综合久久久久| 人妻va精品va欧美va| 91成人精品网站| 国产乱码精品一区二区三区四区| 别急慢慢来1978如如2| 国产精品污www在线观看| 中文字幕在线观看你懂的| 久久精品国产一区二区三区| 国产在线视频欧美一区| 国产欧美精品aaaaaa片| 91色.com| 中文字幕av久久爽| 成人97在线观看视频| 77成人影视| 苍井空浴缸大战猛男120分钟| 亚洲国产精品精华液ab| 国产三级漂亮女教师| 性色av一区二区三区免费| 欧美男gay| 国产不卡的av| 黑丝美女久久久| 女女色综合影院| 国产伦理一区二区三区| 久久永久免费| 波多野结衣亚洲一区二区| 精品欧美一区二区久久| 美女100%一区| 成人污网站在线观看| 93久久精品日日躁夜夜躁欧美| 精品乱码一区内射人妻无码| 欧美另类99xxxxx| 蜜桃国内精品久久久久软件9| 91精品999| 精品国产1区2区| 黄色在线免费看| 精品视频免费观看| 狠狠色综合日日| 国产黄色片免费看| 久久精品视频va| 小说区图片区色综合区| 一级黄色录像在线观看| 午夜日韩在线电影| 国产激情在线观看| 欧美性bbwbbwbbwhd| 日韩免费va| 久久久久五月天|