圖片也要查重了?期刊用AI審論文防造假,旋轉(zhuǎn)/翻轉(zhuǎn)/拉伸都不行
大數(shù)據(jù)文摘出品
最近兩年關(guān)于學術(shù)造假的爆料一直不少,尤其是“圖像復(fù)用”,一些頂尖高校的教授甚至院士都被指出存在一圖多用的情況。
顯然,這樣的情況除了有人專門去深扒,審稿人自己肯定記不住這些圖片是不是和前面的論文雷同了,所以只依靠審稿人去判斷,“圖片復(fù)用”的情況肯定還是會一直發(fā)生。
情況在現(xiàn)在有了轉(zhuǎn)機。
據(jù)Nature官網(wǎng)的News欄目報道,在一項研究發(fā)表在美國癌癥研究協(xié)會(AACR)出版的十種期刊上之前,它要接受一次不同尋常的額外檢查——AI審稿。
自2021年1月以來,AACR在經(jīng)過同行評審后擬定接受的所有稿件上都使用了AI軟件, 其目的就是找出存在雷同的圖像,包括已被旋轉(zhuǎn)、濾波、翻轉(zhuǎn)或拉伸的。
先自動再手動,爭取不放過一個,已經(jīng)有四家在使用
美國癌癥研究協(xié)會(AACR)是這一AI技術(shù)的早期采用者。
為了避免發(fā)表帶有篡改圖片的論文,許多期刊雇人手工審查提交的稿件,通常使用軟件來輔助檢查發(fā)現(xiàn)的內(nèi)容,這些被篡改的圖片可能是由于徹頭徹尾的欺騙,也可能是為了美化發(fā)現(xiàn)的不當企圖。
但Nature獲悉,在過去一年里,至少有4家期刊已經(jīng)開始將這一過程自動化,依靠人工智能軟件在手稿發(fā)表之前發(fā)現(xiàn)圖片重復(fù)或者部分重復(fù)。
“AACR在接收以色列Rehovot的一家名為Proofig的公司提供這項服務(wù)之前,也嘗試了很多軟件產(chǎn)品。”Daniel Evanko說,他是該協(xié)會在賓夕法尼亞州費城的期刊運營主管。 “我們對此非常滿意,”他補充道。他希望這種篩查將有助于研究人員,并在發(fā)表后減少問題。
AI只是完成第一次初篩,當AI標記有問題的圖像后,仍然需要專業(yè)的編輯來判斷。
例如,如果數(shù)據(jù)集本來就需要顯示兩次——并論文中附有解釋——那么重復(fù)的圖像可能是合適的,或者有些復(fù)制可能只是簡單的論文排版過程中的復(fù)制粘貼錯誤,這樣不算造假,AI發(fā)現(xiàn)的所有這些問題只能通過編輯和作者之間的討論來解決。
然而,既然人工智能正變得足夠高效和低成本,專家們表示,未來幾年內(nèi),一波AI自動圖像檢查助手可能會席卷學術(shù)出版行業(yè),就像10年前使用軟件檢查手稿是否抄襲成為一種常規(guī)做法一樣。出版業(yè)組織也說,他們正在研究如何比較不同期刊的手稿圖像。
其他圖像完整性專家對這一趨勢表示歡迎,但同時也警告說,目前還沒有對各種軟件產(chǎn)品進行公開比較,而且自動檢查可能會出現(xiàn)太多的誤報或遺漏的操作。
從長遠來看,對軟件審查的依賴可能也會促使欺詐者使用AI反過來來欺騙AI,就像某些人通過修改文本來逃避審查一樣。
“我擔心,我們正在進入一場與基于AI的技術(shù)的軍備競賽,這可能導(dǎo)致不可能找到的深度造假,”德國《EMBO報告》(EMBO Reports)的主編貝爾納德•波拉爾表示。
進入AI審查時代?一些機構(gòu)還在觀望
2016年,由微生物學家、加利福尼亞州的圖像分析顧問伊麗莎白·比克領(lǐng)導(dǎo)的一項對大約20000篇生物醫(yī)學論文的人工分析表明,多達4%的論文可能包含有問題的圖像復(fù)制。
現(xiàn)實是,通常每年只有大約1%的論文得到更正,更少比例的論文被撤銷。
盡管事實如此,但很多機構(gòu)對于AI查找圖片復(fù)制還是持謹慎態(tài)度。公共科學圖書館(PLOS)的一位發(fā)言人表示,他們正在“熱切地”監(jiān)測工具的進展情況,這些工具可以“可靠地識別常見的圖像完整性問題,并且可以大規(guī)模應(yīng)用”。
Elsevier表示,他們“仍在測試”軟件,不過也指出,其部分期刊在發(fā)表前會篩選所有接受的論文,“使用軟件工具和手工分析相結(jié)合的方法”,檢查圖像是否存在問題。
2020年4月,Wiley引入了一項臨時接受的手稿圖像篩選服務(wù),目前已有120多種期刊使用這項服務(wù),但這項服務(wù)目前是由軟件輔助手工篩選,一位發(fā)言人說。
出版Nature的Springer Nature表示,它正在評估一些外部工具,同時整理數(shù)據(jù),以訓練自己的軟件,這些軟件將“結(jié)合相互互補的人工智能和人類元素,以識別有問題的圖像”。
【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】































