AI水論文還得AI治:西湖大學(xué)首次模擬人類專家思考鏈,AI審稿分鐘級給出全面反饋
審稿不用再等了,高質(zhì)量的AI審稿平臺來了!
如今,AI生成的論文數(shù)量激增,如何從海量的AI “水文”中篩選出真正高質(zhì)量的研究成果,已經(jīng)成為學(xué)術(shù)界必須直面的難題。
為此,西湖大學(xué)自然語言處理實驗室推出了首個AI生成學(xué)術(shù)成果的開放預(yù)印本平臺AiraXiv,以及首個模擬人類專家思考鏈的AI審稿人系統(tǒng)DeepReview。
AiraXiv平臺地址:https://airaxiv.comDeepReview論文地址:https://arxiv.org/abs/2503.08569

AiraXiv用于集中管理和展示AI生成的論文,從而減少其對傳統(tǒng)人工審稿流程的干擾。
DeepReview則能在短短數(shù)分鐘內(nèi)給出比肩人類專家思考鏈的審稿意見,對大量AI生成論文進(jìn)行初步篩選,為后續(xù)的人類專家評審提供參考。
基于數(shù)據(jù)集DeepReview-13K,研究人員訓(xùn)練了DeepReviewer-14B模型,其在使用更少tokens的情況下,性能優(yōu)于CycleReviewer-70B。
不僅如此,在最佳模式下,DeepReviewer-14B在評測中還分別以88.21%和80.20%的勝率超越了GPT-o1和DeepSeek-R1。

AiraXiv:AI生成的學(xué)術(shù)成果的開放舞臺
作為首個致力于AI生成的學(xué)術(shù)成果歸檔、展現(xiàn)與評審的開放預(yù)印本平臺,AiraXiv旨在為AI創(chuàng)造的研究成果提供獨立且專業(yè)的展示渠道,讓優(yōu)秀的AI作品脫穎而出,同時減輕傳統(tǒng)學(xué)術(shù)社區(qū)的負(fù)擔(dān)。
在AiraXiv上,研究人員可以:
- 快速上傳:研究者可以一鍵提交由AI生成的研究工作,無需繁復(fù)流程。
- 即時審稿:每篇論文都可送入DeepReview,幾分鐘內(nèi)即可得到詳細(xì)反饋。
- 高效瀏覽:系統(tǒng)為每篇論文生成關(guān)鍵詞與洞見總結(jié),幫助研究者快速抓住要點。
- Spotlight推薦:得到AI審稿人認(rèn)可的優(yōu)秀論文將被突出展示。
AiraXiv的目標(biāo)是對AI生成的論文進(jìn)行單獨歸檔和管理,以減輕低質(zhì)量內(nèi)容對傳統(tǒng)審稿流程的影響。
同時,它也為高質(zhì)量的AI生成科研成果提供了獨立的存儲和檢索渠道,使研究者能夠更高效地獲取有價值的工作。

除此之外,AiraXiv還支持與arXiv的無縫對接:用戶可以直接輸入arXiv ID,便可直接查看原文以及獲得AI審稿意見。
同時,平臺還會自動同步最新的cs.AI論文并生成AI審稿意見參考,幫助研究者高效追蹤前沿進(jìn)展。

DeepReview:比肩人類專家的AI審稿人系統(tǒng)
DeepReview是首個模擬人類專家思考鏈的多階段AI審稿系統(tǒng),目標(biāo)是讓AI能夠像人類專家一樣,進(jìn)行系統(tǒng)化、可解釋的論文評審。其審稿過程分為三個核心環(huán)節(jié):
創(chuàng)新性驗證:檢索并對比相關(guān)文獻(xiàn),判斷論文的新穎性與引用的準(zhǔn)確性。
多維度評估:從合理性、表達(dá)、貢獻(xiàn)等維度,綜合模擬多名審稿專家的意見。
可靠性驗證:檢查論文邏輯一致性與結(jié)論可靠性,避免出現(xiàn)“幻覺式”評價。

在這一框架下,DeepReview能夠像真實學(xué)者一樣,輸出循證且全面的審稿意見。
首先,它可以模擬專家審稿,并參照人類審稿標(biāo)準(zhǔn),明確列出 “Strengths & Weaknesses”。
其次是無論論文優(yōu)劣,它都會給出完整且有建設(shè)性的意見,而非“一句帶過”。
最后,它可以將人類專家往往需要數(shù)周甚至數(shù)月的審稿周期壓縮至數(shù)分鐘,并獲得完整且結(jié)構(gòu)化的評審意見。
這種方式不僅可以自動過濾低質(zhì)量“水文”,讓真正有價值的研究脫穎而出,同時還能幫助人類專家將有限的時間與精力集中在最值得關(guān)注的突破性成果上。

未來展望
目前,AiraXiv與DeepReview只是冰山一角,更廣闊的探索才剛剛啟程。
未來,平臺將逐步拓展覆蓋范圍,不僅面向計算機科學(xué)領(lǐng)域,還會延伸至更多學(xué)科與應(yīng)用場景。
同時,平臺還會持續(xù)改進(jìn)論文關(guān)鍵信息的提取與展示方式,從而提升優(yōu)質(zhì)成果的可見性與傳播效率。
從更長遠(yuǎn)的角度來看,這類平臺和系統(tǒng)也折射出科研生態(tài)的潛在變化:AI或許能夠在選題、實驗、論文寫作與初步審稿等環(huán)節(jié)發(fā)揮越來越大的作用,而人類研究者則將更多地聚焦在具有創(chuàng)造性和突破性的研究問題上。
AiraXiv與DeepReview的實踐可以視作這一方向上的早期嘗試,未來仍需更多研究者共同參與,才能推動形成更高效、透明的學(xué)術(shù)交流生態(tài)。
西湖大學(xué)自然語言處理實驗室(WestlakeNLP)成立于2018年9月,由張岳教授領(lǐng)導(dǎo)。
張岳教授畢業(yè)于牛津大學(xué),獲博士學(xué)位,現(xiàn)任西湖大學(xué)工學(xué)院副院長。他著有劍橋大學(xué)出版社出版的《自然語言處理》一書,并擔(dān)任過EMNLP 2022等多個頂級NLP會議的程序委員會主席。
該實驗室目前專注于語言模型推理、泛化和通用人工智能以及自然語言處理的基礎(chǔ)與應(yīng)用研究,探索通用人工智能的實現(xiàn)路徑,推動 AI Scientist(AI科學(xué)家)的發(fā)展,使其能夠真正參與并加速科學(xué)發(fā)現(xiàn),促進(jìn)人類科學(xué)的持續(xù)進(jìn)步。
實驗室主頁:https://westlakenlp.com/






























