精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

上交大揭露大模型審稿風險:一句話就能讓論文評分飛升

人工智能
雖然 LLM 在提升審稿效率和質量方面有潛力,研究者們強調必須謹慎推進其應用。只有在確保其風險可控且有有效的防范機制后,才能負責任地將 LLM 整合進學術同行評審中,避免破壞學術出版的公正性和嚴謹性。

大語言模型(LLMs)正以前所未有的方式,深刻影響著學術同行評審的格局。同行評審作為科學研究的基石,其重要性毋庸置疑。然而,隨著大語言模型逐漸滲透到這一核心過程,我們是否已經準備好面對它可能帶來的深遠影響?在這場變革之前,我們必須清醒地認識到其中潛藏的風險,并采取切實可行的防范措施。

近年來,大語言模型在多個領域展現出了令人驚嘆的潛力。同行評審作為一項既繁瑣又至關重要的任務,正在引起越來越多學者的關注并嘗試利用大語言模型來輔助甚至替代審稿,力圖提高這一傳統流程的效率。

斯坦福大學的研究團隊便在《NEJM AI》子刊上發布了相關研究,指出大語言模型能夠生成與人類審稿人相似的審稿意見。而根據斯坦福團隊的估算,最近的若干個 AI 頂會中,竟有高達 6.5% 至 16.9% 的論文內容由大語言模型顯著調整過!同樣,瑞士洛桑聯邦理工大學(EPFL)的研究發現,ICLR 2024 的審稿過程中,約 15.8% 的評審意見是 AI 輔助生成的!與此同時,越來越多的人開始在社交媒體上抱怨審稿人利用大語言模型進行審稿。

種種現象表明,大語言模型已經悄然滲透到了學術審稿的最前線,顯現出一種不容忽視的趨勢。然而,在其大規模使用之前,我們對其潛在的風險卻沒有一個清醒的認知。這無疑給同行評議的可靠性帶來了巨大的風險。

在此背景下,上海交通大學、佐治亞理工學院、上海市人工智能實驗室、佐治亞大學與牛津大學的科研團隊聯合展開了深入研究,發表了最新論文《Are we there yet? Revealing the risks of utilizing large language models in scholarly peer review》,揭示了大語言模型在審稿中潛藏的風險。研究表明:

  • 操控風險:作者可能通過在文章中巧妙插入肉眼無法察覺的文本,直接操控大語言模型生成的審稿意見,甚至操控最終的論文評分。
  • 隱性操控:大語言模型傾向于復述作者主動在文章中揭示的局限性,令作者可以通過有意暴露輕微缺陷,從而隱秘地操控審稿過程。
  • 幻覺問題:更為嚴重的是,大語言模型可能對空白文章生成虛構的審稿意見,揭示了「模型幻覺」問題在審稿中的潛在威脅。
  • 偏見問題:大語言模型在審稿過程中也暴露了明顯的偏好,尤其對文章長度和著名作者及機構的偏愛,極大影響評審的公正性。

這些發現暴露出了我們在擁抱新技術的同時,可能忽視的重大風險。為此,研究者們發出了警示:學界應當暫停使用大語言模型替代審稿工作,并呼吁制定有效的防范措施,確保科技進步能夠在更加健康、透明的框架內進行。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2412.01708
  • 項目主頁:https://rui-ye.github.io/BadLLMReviewer
  • 調查問卷:https://forms.gle/c9tH3sXrVFtnDgjQ6

顯式操縱

研究者們首先揭示了一種低成本卻十分有效操縱手段:文章的作者可以通過在文中插入微小、幾乎不可見的指令性文字,即可輕松引導審稿模型強調文章的創新性與影響力,同時弱化文章的缺陷(如語法錯誤等)!插入的文字,盡管在常規人工審稿過程中幾乎不可見,但在當前常見的自動化的 LLM 審稿過程中,依然會被提取并與文章內容一同解析,能夠被審稿模型誤認為提示詞,進而操縱模型生成高度正面的反饋,極大提高文章接收概率,危害審稿系統的公平可靠性。

圖片

圖 1. 作者可在文章中插入肉眼不可見、極小的白色文字

研究團隊對三款主流大語言模型審稿系統進行了測試,結果令人震驚:在面對這種顯式操控時,所有模型都未能幸免。測試前,文章的評分僅接近邊界分數(Borderline);然而,插入操控文字后,文章的評分暴漲,甚至高達 8 分!—— 這一分數在 ICLR 等頂級會議中,意味著論文被接收概率極大。

這一現象清晰地表明,操控手段能夠以驚人的效率扭曲審稿系統的判斷,顯著改變文章的最終命運。如果沒有強有力的防范機制,這種操控行為可能會極大地影響學術評審的公平性,甚至對整個科研環境的可信度造成無法估量的損害。

圖片

圖 2. 顯式操縱可使論文評分飛漲

隱式操縱

然而,顯式操控雖然有效,卻也容易被學術界視為不道德甚至作弊行為,因此一些 「謹慎」的作者可能會選擇回避這種方法。那么,是否還有一種更為微妙、隱蔽且更具潛在威脅的操控方式呢?答案是肯定的。

研究者們發現了一種更為隱蔽的操控方式:作者主動披露文章的局限性,尤其是在論文的「Limitations」章節中。這種做法,甚至是學術會議的推薦做法。然而,研究顯示,大語言模型審稿時,生成的審稿內容與論文局限性部分的內容竟高度一致!

圖片

圖 3. 大語言模型容易復述作者在文章中主動揭露的 Limitations

研究者們接著系統對比了人類審稿與論文局限性內容之間的一致性,以及大語言模型審稿與局限性內容之間的一致性。結果顯示大語言模型審稿與局限性內容之間的一致性遠遠高于人類審稿與局限性內容之間的一致性。這意味著,不同于人類審稿人,大語言模型容易被文章本身的信息所左右,缺乏獨立批判性思維,而這正是合格審稿人需具備的基本條件。

這一發現揭示了一個深刻的風險:學術作者可以故意暴露一些微不足道的問題,從而間接引導大語言模型產生有利于論文的審稿意見。更嚴重的是,與顯式操控相比,隱式操控更難察覺,更難防范,也更難定性,卻能對學術評審的公平性構成嚴重威脅。

圖片

圖 4. 大語言模型比真人更容易復述作者在文章中主動揭露的 Limitations

內在缺陷:幻覺

更令人震驚的是,研究者們還發現了大語言模型審稿過程中的一個根本性缺陷 —— 幻覺問題。有時,即使一篇文章根本沒有內容,審稿模型依然能生成長篇大論的審稿意見。在測試中,研究者們輸入了一個空白文章,結果發現其中一款審稿模型竟然對這篇空白文章生成了完整的審稿意見!雖然另外兩款模型識別出了輸入為空白并未作出評價,但這種「無中生有」的現象依然令人不寒而栗。

圖片

圖 5. 大語言模型可能無中生有的審稿內容

更進一步,研究者們不斷增加輸入給審稿模型的內容(空白 -> 僅標題 -> 標題摘要引言 -> 全篇),發現當進一步加入摘要和引言部分后,所有三種審稿系統的評分竟幾乎與完整論文一致。

這一發現揭示了大語言模型在同行評審中的巨大不可靠性:即使文章內容尚未完善,模型仍可能生成似是而非的評審意見,給出與完整論文相似的評分,嚴重扭曲了評審的實際質量。

圖片

圖 6. 大語言模型可能給不完整的文章高分

內在缺陷:偏好

除了幻覺問題,大語言模型在同行評審中還可能表現出令人擔憂的偏見。研究者們深入探討了大語言模型評分與文章長度之間的關系,結果發現:大部分審稿系統對論文長度有顯著的偏好:論文越長,接受的概率越高。這一偏好無疑會使得那些寫得更長、更繁復的文章在評審中占得先機,極大削弱了評審的公正性。


圖片

圖 7. 大語言模型偏向于更長的文章

此外,研究者們還對大語言模型是否會受到作者機構的影響進行了測試。在單盲審稿模式下,他們嘗試將作者的機構名替換為計算機科學領域頂尖的大學(如 MIT 等)或 LLMs 領域的領先公司(如 OpenAI 等),并將作者名字替換為圖靈獎得主。結果令人驚訝,所有這些替換均顯著提高了文章的接受概率,揭示了大語言模型在審稿過程中存在的系統性偏見。

這一現象表明,若大語言模型成為同行評審的一部分,它將極有可能加劇現有學術評價體系中的不公平問題,進一步放大「名校效應」和「名人效應」。

圖片

圖 8. 大語言模型審稿被作者機構顯著影響

倡議與總結

隨著大語言模型(LLM)在學術同行評審中的應用日益增多,研究者們深入分析了其潛在風險,并提出了相應的建議,旨在確保學術審稿過程的公正性和嚴謹性。基于研究結果,研究者們提出以下倡議:

  • 暫停 LLM 在同行評審中的替代性使用:研究者們呼吁在充分了解 LLM 的風險并采取有效防范措施之前,暫停其在同行評審中的替代式應用。
  • 引入檢測工具與問責機制:研究者們呼吁期刊和會議組織者引入全面的檢測工具與問責機制,以識別并應對審稿過程中可能的操控行為;并引入懲罰措施來遏制這些行為的發生。
  • 將 LLM 作為輔助工具使用:展望未來,研究者們認為隨著投稿數量的持續增加,LLM 在審稿過程中的自動化潛力不可忽視。盡管 LLM 目前還無法完全取代人類審稿,但其仍有潛力作為審稿過程的補充工具,提供額外反饋以提升審稿質量。
  • 增強 LLM 審稿系統的穩健性與安全性:未來應致力于開發一種能夠有效整合 LLM 的同行評審流程,既能最大化它們的潛力,又能有效防范我們已識別的風險,增強其穩健性和安全性。

總結而言,雖然 LLM 在提升審稿效率和質量方面有潛力,研究者們強調必須謹慎推進其應用。只有在確保其風險可控且有有效的防范機制后,才能負責任地將 LLM 整合進學術同行評審中,避免破壞學術出版的公正性和嚴謹性。

責任編輯:姜華 來源: 機器之心
相關推薦

2015-08-03 10:21:04

設計模式表達

2020-11-27 09:57:11

Python代碼PyPy

2023-09-05 23:34:52

Kubernetes云原生

2024-04-01 13:03:00

AI模型

2021-11-29 09:45:32

模型人工智能深度學習

2023-05-08 15:44:23

3D數字人

2010-03-29 11:55:12

無線上網報錯

2024-02-08 09:33:37

蘋果AI

2022-12-12 13:45:46

模型修圖

2019-09-05 10:13:28

2018-01-15 10:45:43

社交網絡互聯網巨頭百度

2014-05-07 10:47:51

移動金融互聯網金融GMIC

2020-12-16 10:43:44

PythonPyPy代碼

2023-08-28 00:53:03

AI3D

2019-08-15 11:42:56

程序員電腦軟件

2023-09-06 15:23:30

Docker容器K8S

2011-06-03 16:42:47

SEO

2025-08-18 17:20:17

AI大模型數據
點贊
收藏

51CTO技術棧公眾號

理论片午午伦夜理片在线播放| 99久久婷婷国产综合精品电影 | 亚洲精品无码久久久久| 国产精品一区二区无码对白| 美女av在线播放| 波多野结衣中文一区| 欧美一级视频在线观看| 欧美大片xxxx| 日韩三级视频| 在线成人高清不卡| 欧美日韩在线视频一区二区三区| 日韩理伦片在线| 99久久精品99国产精品| 国产精品自拍偷拍视频| 日韩无码精品一区二区三区| 日韩精品电影| 日韩av一区在线观看| 玩弄japan白嫩少妇hd| 欧美xxxx黑人又粗又长| 欧美激情一区二区| 国产综合精品一区二区三区| 亚洲综合精品国产一区二区三区 | 99re91这里只有精品| 欧美在线观看禁18| 日韩欧美视频网站| 在线xxxx| 亚洲色图在线看| 日韩色妇久久av| 色资源在线观看| 成人av在线电影| 亚洲伊人一本大道中文字幕| 欧美一区二区三区久久久| 亚洲高清av| 久久精品视频在线观看| a资源在线观看| 在线成人动漫av| 亚洲国产精品中文| 制服丝袜av在线| 伊人久久影院| 日韩欧美国产精品一区| 九九热视频免费| 国产欧美日韩电影| 欧美高清一级片在线| 99热手机在线| 91p九色成人| 色婷婷狠狠综合| 欧美日韩国产精品激情在线播放| sm捆绑调教国产免费网站在线观看| 亚洲精品亚洲人成人网在线播放| 制服国产精品| 在线视频国产区| 一区二区三区四区av| 黄色一级片网址| 黄网站免费在线观看| 国产精品久久久久天堂| 亚洲日本精品国产第一区| 都市激情一区| 中文字幕日韩av资源站| 一区二区三区我不卡| 91精品专区| 中文字幕人成不卡一区| 正在播放91九色| 中日韩高清电影网| 亚洲午夜视频在线| 久色视频在线播放| 老司机2019福利精品视频导航| 日韩欧美一区二区三区久久| 久久久久免费精品| 国产精品一区二区免费福利视频| 欧美日韩免费高清一区色橹橹| 手机视频在线观看| www一区二区三区| 欧美va亚洲va在线观看蝴蝶网| 香蕉久久久久久av成人| 久久久久久毛片免费看| 成人在线国产视频| 亚洲国产综合一区| av亚洲产国偷v产偷v自拍| 久久艹中文字幕| 成a人v在线播放| 亚洲精品中文在线观看| 国产婷婷一区二区三区| 桃花岛tv亚洲品质| 欧美男生操女生| 日本天堂在线播放| 国产欧美日韩一区二区三区四区 | 国产尤物视频在线| 自拍av一区二区三区| www.国产二区| 中文一区一区三区高中清不卡免费| 欧洲另类一二三四区| 在线免费看污网站| 久久视频在线观看| 中文字幕无线精品亚洲乱码一区| 极品久久久久久| 国产精品一级| 成人免费高清完整版在线观看| www三级免费| 国产欧美综合在线观看第十页| 伊人久久大香线蕉av一区| 男人天堂亚洲| 欧美三级电影精品| 国产精品入口麻豆| 97视频精品| 538国产精品一区二区免费视频| 中文字幕日本人妻久久久免费| 国产成人免费视频网站| 视频一区视频二区视频三区高| 3d成人动漫在线| 香蕉av福利精品导航| 日韩av卡一卡二| 欧美日韩麻豆| 欧美日本黄视频| 中文字幕 国产| 91在线看国产| 人人妻人人澡人人爽欧美一区双 | 亚洲午夜久久久久久久久红桃| 五月激情综合| 国产精品pans私拍| 欧美熟妇另类久久久久久不卡| 国产精品国产三级国产有无不卡 | 日本一区免费在线观看| 9999在线视频| 日韩一区二区三免费高清| 91中文字精品一区二区| 久久久久国产精品嫩草影院| 一区二区三区精品| 亚洲三级在线观看视频| 精品一区电影| 热99精品里视频精品| 亚洲毛片欧洲毛片国产一品色| 国产精品免费aⅴ片在线观看| 日本在线xxx| 精品福利一区| 欧美激情在线有限公司| va婷婷在线免费观看| 国产精品国产精品国产专区不蜜| 大香煮伊手机一区| 亚洲免费专区| 国产91精品久久久久| 秋霞av鲁丝片一区二区| 亚洲一区二区视频在线观看| 91亚洲一区二区| 久久久人成影片免费观看| 国产精品久久久久久久美男| 国产精品免费观看| 91高清在线观看| 精品人伦一区二区| 日韩在线观看一区二区| 日韩av高清在线播放| 爱啪啪综合导航| 日韩精品在线观看一区| 日本韩国欧美中文字幕| 2020日本不卡一区二区视频| 国产视频九色蝌蚪| 丝袜美腿一区二区三区动态图| 国外成人在线视频| 肉丝一区二区| 在线观看一区二区视频| 国产调教在线观看| 精品一区二区三区欧美| 免费看污污视频| 在线精品视频一区| 午夜精品福利在线观看| 青青草在线播放| 91成人国产精品| 国产精品免费在线视频| 国产精品77777| 欧美日韩性生活片| 国产精品一区2区3区| 国产精品揄拍一区二区| a天堂中文在线| 欧美一区二区三区免费在线看| 国产a免费视频| 97超碰欧美中文字幕| 亚洲乱码中文字幕久久孕妇黑人| 国内精品久久久久久99蜜桃| 成人免费福利在线| 久久青草伊人| 久久精品青青大伊人av| 亚洲乱码在线观看| 91成人国产精品| 少妇久久久久久被弄高潮| 91视频xxxx| 国产视频1区2区3区| 国内精品99| 欧美日韩一区二区三区免费| 亚洲欧洲日韩精品在线| 韩国视频理论视频久久| shkd中文字幕久久在线观看| 日韩一级黄色片| 国产精品21p| 亚洲人一二三区| 一女三黑人理论片在线| 狠狠色丁香久久婷婷综合_中| 黄网站欧美内射| 国产精品久久久久久影院8一贰佰| 动漫精品视频| 欧美一区二区三区婷婷| 97人人做人人爱| 欧美成年黄网站色视频| 日韩国产精品一区| 国产欧美一区二区三区视频在线观看| 午夜久久久影院| 成年人网站在线观看视频| 2019国产精品| 苍井空张开腿实干12次| 久久国产福利国产秒拍| 九色在线视频观看| 欧美精选在线| 亚洲电影一二三区| 亚洲人成网亚洲欧洲无码| 亚洲直播在线一区| 成人精品高清在线视频| 欧美资源在线观看| 激情影院在线| 俺去亚洲欧洲欧美日韩| 丁香在线视频| 亚洲美女中文字幕| 三级小视频在线观看| 欧美一级二级三级蜜桃| 中文字幕免费高清在线观看| 欧美性极品少妇精品网站| 久久一区二区三| 亚洲乱码国产乱码精品精可以看| 黄色免费一级视频| 久久精品水蜜桃av综合天堂| 香港三日本8a三级少妇三级99| 国产成人综合视频| 欧美日韩久久婷婷| 精品一区二区三区免费视频| 手机视频在线观看| 日本强好片久久久久久aaa| av免费播放网址| 国产欧美日韩一区二区三区在线| 蜜臀精品一区二区| 精品1区2区3区4区| 欧美狂野激情性xxxx在线观| 你懂的视频一区二区| 91免费视频黄| 欧美在线网站| 久久观看最新视频| 亚洲大奶少妇| 91系列在线播放| 懂色av色香蕉一区二区蜜桃| 91精品国产综合久久香蕉922| 草莓视频成人appios| 国产精品扒开腿做爽爽爽男男| 韩国主播福利视频一区二区三区| 欧美亚洲成人免费| 欧美黑人一区| 国产精品久久久亚洲| 成人精品高清在线视频| 91精品久久久久久久久久久| 精品国产亚洲一区二区三区| 亚洲一区二区三区乱码aⅴ| 欧美日韩中出| 国产乱码一区| 久久99性xxx老妇胖精品| 日韩av大全| 久久久久久久久丰满| 亚洲黄色网址在线观看| 欧美aa国产视频| 久久这里只有精品23| 亚洲欧美日本日韩| 我看黄色一级片| 国产在线播放一区三区四| gogo亚洲国模私拍人体| 99麻豆久久久国产精品免费| 欧美做受xxxxxⅹ性视频| 国产精品免费久久久久| 欧美精品一级片| 色综合久久天天| 国产精品久久影视| 亚洲第一精品夜夜躁人人躁| 欧美日韩激情视频一区二区三区| 中文字幕日韩av| 国产精品186在线观看在线播放| 18一19gay欧美视频网站| 成人国产精选| 高清视频在线观看一区| 九色精品91| 国产免费一区二区三区四在线播放| 伊人成人在线| 久久99爱视频| 成人午夜在线视频| 久久久久99精品成人| 亚洲国产精品一区二区久久| 精品成人无码久久久久久| 欧美一级国产精品| 国产在线观看精品一区| 久久99久久亚洲国产| 日韩三区在线| 成人欧美视频在线| 成人直播大秀| 国产精品12345| 国产最新精品精品你懂的| 亚洲久久久久久| 亚洲天堂精品视频| 亚洲精品午夜国产va久久成人| 欧美日韩三级在线| 日本人妻丰满熟妇久久久久久| 亚洲性69xxxbbb| 黄色激情在线播放| 亚洲在线观看视频网站| 精品久久精品| 国产二级片在线观看| 国产最新精品免费| 蜜臀久久99精品久久久久久| 亚洲午夜一区二区三区| 国产乱色精品成人免费视频| 亚洲视频视频在线| 91禁在线看| av免费观看久久| 欧美激情电影| 九色91popny| 久久影院视频免费| 精品美女久久久久| 日韩精品在线看片z| 欧美激情免费| 国产精品自拍偷拍视频| 国产乱码精品一区二区亚洲 | 欧美一区二区三区日韩视频| 大胆av不用播放器在线播放| 2021久久精品国产99国产精品| 日韩精品视频一区二区三区| 国产系列第一页| 另类小说综合欧美亚洲| 日本成人免费视频| 色噜噜狠狠成人中文综合 | 视频二区欧美毛片免费观看| 亚洲精品乱码久久久久久蜜桃91| 日韩国产高清影视| 人妻一区二区视频| 日本韩国欧美一区二区三区| 色视频在线观看福利| 538国产精品一区二区免费视频 | 视频在线精品一区| 巨乳诱惑日韩免费av| 一级黄色片大全| 色激情天天射综合网| 日本高清中文字幕二区在线| 青草青草久热精品视频在线观看| 欧美aaaaa级| 黄色av网址在线播放| www国产亚洲精品久久麻豆| 日韩欧美三级视频| 精品香蕉一区二区三区| 成人欧美大片| 日韩av不卡在线播放| 毛片av中文字幕一区二区| 国产精品夜夜夜爽阿娇| 91精品国产色综合久久不卡电影| 麻豆网在线观看| 亚洲japanese制服美女| 国产字幕视频一区二区| 精品国产av色一区二区深夜久久| 都市激情亚洲色图| 国产三级视频在线播放线观看| 国产精品中文字幕在线观看| 99欧美视频| 性高潮免费视频| 黑人巨大精品欧美一区二区一视频| 亚洲人在线观看视频| 国产精品九九九| 在线中文字幕第一区| 韩国av中国字幕| 日韩欧美中文免费| 在线国产91| av免费精品一区二区三区| 亚洲综合二区| 我要看一级黄色录像| 欧美va在线播放| 国产亚洲一区二区手机在线观看 | 日本亚洲三级在线| 黄色录像二级片| 亚洲国产另类 国产精品国产免费| 欧美7777| 在线观看三级网站| 99精品久久99久久久久| 一区二区视频免费| 欧美黄色性视频| 123成人网| 4444在线观看| 久久久综合精品| 影音先锋黄色网址| 97高清免费视频| 91亚洲自偷观看高清| 三级视频网站在线观看| 欧美性猛交xxxx黑人交| xxxx另类黑人| 一级二级三级欧美| 99热这里都是精品| 国产永久免费视频| 欧美在线观看网址综合| 午夜精品网站| 久久久免费看片| 国产视频精品久久久| 麻豆一区在线| 亚洲xxxx2d动漫1|