精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

又遇到「GPT寫的review」了?看看北大&密歇根的這個研究工作

人工智能 新聞
低質量的審稿是一直讓研究者頭疼的事情。大語言模型(LLMs)的流行給審稿質量帶來轉機了嗎?

本文是對發表在計算經濟學頂級會議ACM Conference on Economics and Computation (EC'24)上的論文Eliciting Informative Text Evaluations with Large Language Models的解讀。該論文由北京大學前沿計算研究中心孔雨晴課題組與密歇根大學Grant Schoenenbeck課題組合作完成,共同一作為北京大學計算機學院博士生陸宇暄和密歇根大學博士生許晟偉。

圖片

圖片

  • 論文鏈接:https://arxiv.org/abs/2405.15077
  • 現場交流 Oral at EC’24:

Yale School of Management, New Haven, Room 2400

Wednesday, July 10. 14:30–16:00 (EDT)

介紹

你遇到過“ChatGPT”味道十足的審稿意見嗎?質量如何呢?

低質量的審稿是一直讓研究者頭疼的事情。大語言模型(LLMs)的流行給審稿質量帶來轉機了嗎?

不妨看看下面這兩個例子,你能夠分辨其中哪個是由ChatGPT-4o生成的嗎?

例1:

… The paper is engaging and addresses a highly pertinent issue: information elicitation in the context of Large Language Models (LLMs). The concept of computing conditional probability using an LLM is both elegant and innovative. …

… A primary concern is the robustness of the method used to estimate conditional probability with an LLM, which may require additional experimentation and methodological refinement to ensure reliability and applicability across diverse scenarios. …

例2:

… The paper presents a novel application of LLMs to enhance peer prediction mechanisms, which is a significant step forward from traditional methods that focus on simpler report types. …

… While the mechanisms are theoretically sound, their practical implementation, especially in real-world settings with diverse and complex textual inputs, might pose significant challenges. …

當你仔細品讀這兩個例子的語法使用和遣詞造句后,不知道有沒有分辨出來二者之間的區別。

現在公布答案:第一個例子為人類審稿人撰寫,而第二個例子則是由ChatGPT-4o生成的。

可以看出來,GPT-4o的審稿意見“看起來不錯”,但指出的問題往往是泛泛而談,這種“challenge in real-world settings”的問題對99%的研究都是適用的,而人類審稿人的意見則更加具體和實際。

即使目前大模型的能力在不斷增強,若干研究也已經探索了使用大模型輔助生成論文審稿意見的可能;但不可否認的是,大模型使得生成低質量審稿意見的成本變得無限低,這也讓學術界對濫用大模型生成低質量審稿意見感到擔憂。

如何激勵審稿人提供高質量的審稿意見呢?

粗暴的使用大模型檢測工具往往是不可取的,因為合理的運用大模型可以為非英語母語的審稿人提供必要的語言支持。而且隨著大模型的進化,當他能夠提供合理質量的審稿時,并不應當完全排斥大模型的使用。

問題的關鍵是,意見本身應當是高質量的,具有建設性和批判性的,而不是語言是如何表達的。

方法概述

來自北京大學和密歇根大學的研究者提出了兩種機制,Generative Peer Prediction Mechanism (GPPM) 和 Generative Synopsis Peer Prediction Mechanism (GSPPM),使得高質量的匯報能夠取得(期望意義上)更高的評分。

  • GPPM的靈感來自于香農互信息(Mutual Information),假設有兩個審稿人Alice和Bob,Alice的分數是,Alice的審稿意見圖片能提供多少關于Bob的審稿意見圖片的信息。
  • 在此基礎上,GSPPM試圖過濾掉審稿意見中的無效信息,例如對論文內容的概括。

方法的核心在于如何衡量Alice對于Bob意見的信息量。研究者推廣了Peer Prediction Mechanism [Miller et al., 2004],提出了使用LLM來估計圖片,作為Alice的分數。

研究團隊提出了兩種估計方法,TOKENJUDGMENT

其中,

  • TOKEN利用了LLM predict next token的能力。值得注意的是,利用大模型將文本報告預處理成統一的格式非常重要,這避免了不同語言風格和用詞習慣帶來的噪聲等影響,研究者稱這一方法為Token-Preprocess。
  • JUDGMENT提供了一種在只有Chatbot API情況下的解決方案。如上圖所示,帶有文本預處理的TOKEN實現表現整體好于JUDGMENT實現。

實驗結果

1. GPPM和GSPPM是否有能力區分出人類審稿意見和LLM生成的審稿意見?

在ICLR 2020 OpenReview數據集上,研究者隨機選出300篇論文,對每篇論文隨機指定一對Alice和Bob,然后他們將Alice的審稿意見替換為LLM(GPT-4或GPT-3.5)生成的審稿意見,觀察Alice的分數是否顯著下降。

圖片

實驗發現,在兩種機制下,分數下降都非常顯著,而且GPT-3.5生成的審稿造成的分數下降比GPT-4更加顯著。從而顯示出三種質量等級,從高到低依次是人類,GPT-4,GPT-3.5,符合預期。

同時,GSPPM的分數顯著性更高,這是由于GSPPM進一步降低了由論文概括等與意見無關的信息帶來的噪聲等影響,從而突出了審稿意見質量帶來的差異。

2. 不同估值方法是否能檢測低質量的評論意見?

與審稿類似的文本評價在互聯網經濟(例如餐廳點評,商品評價),在線課堂(例如同伴互評)等場景被廣泛應用,它們都可能會遇到低質量報告帶來的問題。因此,研究團隊還分別在Yelp餐廳點評數據集和ICLR2020 OpenReview數據集,實驗了人為降低文本評價質量是否會帶來顯著的分數下降,答案是肯定的。我們發現Token-Preprocess檢測低質量評論的能力最顯著。

圖片

三種人為降低報告質量帶來的分數下降顯著性(Yelp餐廳點評數據集)

圖片

三種人為降低報告質量帶來的分數下降顯著性(ICLR2020 OpenReview數據集)

方法和理論結果

本文的理論依據主要來源于用信息論的方法量化隨機變量之間的相關性,研究團隊用大模型的預測能力作為實現量化文本相關性的手段。

注意到,如下公式所示,Alice的期望分數就是圖片,其中圖片對Alice為常數。因此Alice想要獲得高分,就需要增加自己的審稿意見能提供Bob的意見的信息量,即圖片

圖片

圖片

根據以上思路,該團隊證明了在LLM的估計近似準確的假設下,所有人都提供高質量的信息是一個近似貝葉斯納什均衡(Bayesian Nash Equilibrium):即對于每個人,提供更差的審稿意見會帶來更低的期望分數。

未來工作

這篇論文率先在計算經濟學領域中,提出激勵高質量文本評價的機制。這樣一個全新的交叉領域帶來了若干開放問題,例如

  • 能否收集人類對審稿意見的評分,驗證與文中機制評分的相關系數?
  • 能否進一步降低文中機制評分的噪聲?
  • 能否在其他領域測試文中機制的能力,如中文文本?

研究者在論文中提供了更多細節討論,并歡迎讀者進一步討論和交流。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2009-12-03 14:53:49

.NET Framew

2017-06-06 17:03:59

機器學習模型算法

2023-07-18 19:11:21

配置信令系統

2022-02-23 14:18:53

If-Else入參接口

2017-05-23 08:54:51

2019-09-06 10:31:45

軟件開發地圖

2021-06-08 13:55:41

AI 數據人工智能

2024-06-04 08:30:32

2020-06-19 10:17:11

Code ReviewKPI代碼

2023-03-27 17:45:16

研究AI

2021-01-25 20:47:43

技術研發實踐

2024-05-14 07:30:52

OpenAIGPT-4模型

2025-05-30 01:30:00

Anthropic技巧AI

2024-12-20 14:37:47

2025-09-04 09:04:13

2023-03-16 19:17:57

2018-08-16 15:11:47

Code ReviewPPT代碼

2020-07-20 14:10:48

AI 數據人工智能

2023-08-10 09:00:00

2021-09-09 18:12:22

內存分段式網絡
點贊
收藏

51CTO技術棧公眾號

亚洲综合免费观看高清完整版| 爽好多水快深点欧美视频| 538在线一区二区精品国产| 欧美精品一区二区性色a+v| 亚洲乱码国产乱码精品精软件| 妖精视频成人观看www| 亚洲免费一在线| 色综合五月婷婷| 欧美一级鲁丝片| 中文字幕国产精品一区二区| 99久久精品免费看国产一区二区三区 | 在线视频cao| 中文字幕一区二区三区四区| 国产一区二区不卡视频| 中文字幕理论片| 亚洲日本黄色| 色噜噜久久综合伊人一本| 第一页在线视频| 亚洲精品555| 偷拍与自拍一区| 在线不卡日本| 国产一区二区影视| 国产精品亚洲第一区在线暖暖韩国 | 国内精品久久久久久久97牛牛 | 91福利社在线观看| www.国产二区| 在线观看精品一区二区三区| 99久久精品免费看国产| 国产在线高清精品| 青娱乐在线免费视频| 亚洲人成高清| 欧美黑人xxxⅹ高潮交| 天堂av免费在线| 国产精品中文字幕亚洲欧美| 亚洲国产精品va在线| 亚洲第一天堂久久| 韩国理伦片久久电影网| 91成人免费电影| 国产综合免费视频| 国产精品yjizz视频网| 亚洲美女屁股眼交3| 亚洲欧美久久久久一区二区三区| 日韩欧美在线观看一区二区| 成人精品一区二区三区四区| 亚洲一区美女视频在线观看免费| 中国老头性行为xxxx| 久久精品导航| 人体精品一二三区| 久久国产黄色片| 亚洲美女色禁图| 国内精品美女av在线播放| caoporn91| 亚洲精品一二三区区别| 色婷婷综合久久久久中文字幕1| 性欧美精品男男| av亚洲在线观看| 国产一区二区三区在线看| 国产熟妇久久777777| 精品国产一区二区三区| 一区二区在线视频播放| 少妇高潮惨叫久久久久| 99精品一区| 久久天堂av综合合色| 国产黄色小视频网站| 一区二区三区在线| 欧美精品在线视频观看| 18精品爽视频在线观看| 精品91视频| 97av在线视频| www.com亚洲| 精品一区二区三区免费毛片爱 | 亚洲视频一区在线播放| 久久99久国产精品黄毛片色诱| 成人日韩av在线| www.色呦呦| 99久久精品费精品国产一区二区| 美国av一区二区三区| 黄色av免费在线观看| 中文字幕一区日韩精品欧美| 女同性恋一区二区| 国产网站在线| 欧美日韩中字一区| 秋霞午夜鲁丝一区二区| 欧美精品中文| 中文字幕一区日韩电影| 波多野结衣不卡视频| 亚洲黑丝一区二区| 国产精品第二页| 国产强被迫伦姧在线观看无码| 成人sese在线| 日韩av一区二区三区在线观看| 欧美a在线看| 亚洲成人av资源| 美女黄色片视频| 日韩一区二区三区在线看| 日韩av中文字幕在线免费观看| av片在线免费看| 亚洲经典自拍| 国产美女久久精品香蕉69| 亚洲奶汁xxxx哺乳期| 久久久久久久久久久黄色| 国产精品亚洲天堂| 国产高潮在线| 91精品国产一区二区三区香蕉| 日本少妇毛茸茸| 久久久久久久久久久久久久| 97福利一区二区| 国产精品伦理一区| 久久综合九色综合欧美就去吻| 一区二区三区四区欧美| 天堂√8在线中文| 欧美一区二区美女| 亚洲图片另类小说| 一区在线免费| 91精品在线观看视频| 蜜桃免费在线| 亚洲成人综合视频| www.亚洲自拍| 青青草91久久久久久久久| 国内精品久久影院| 精品黑人一区二区三区国语馆| 久久精品一区二区三区不卡牛牛| 国产精彩视频一区二区| 国产精品一区二区精品视频观看| 亚洲天堂av高清| 日韩欧美高清在线观看| 国产另类ts人妖一区二区| 日韩精品无码一区二区三区| 人人草在线视频| 欧美mv日韩mv| 欧美 日韩 国产 一区二区三区| 日韩精品一卡二卡三卡四卡无卡| 久久精品二区| 欧美男男tv网站在线播放| 日韩欧美另类在线| 精品国产精品国产精品| 美女一区二区三区| 视频在线99re| 在线观看精品| 亚洲天堂免费视频| 日韩欧美成人一区二区三区| 91片在线免费观看| 久久亚洲中文字幕无码| 国产精品jk白丝蜜臀av小说| 欧美黑人国产人伦爽爽爽| 性做久久久久久久| 亚洲在线久久| kk眼镜猥琐国模调教系列一区二区 | 亚洲开心激情网| 久久久久99精品| 国产成人精品一区二| 路边理发店露脸熟妇泻火| 99国内精品久久久久| 北条麻妃99精品青青久久| 中文字幕你懂的| 中文字幕在线不卡一区二区三区 | 国产成人在线影院| 久久人妻无码一区二区| 日韩一二三区| 久久久欧美一区二区| 色婷婷激情五月| 天天亚洲美女在线视频| www.久久av| 日韩有码一区二区三区| 亚洲不卡1区| 玖玖精品在线| 中文字幕av一区二区三区谷原希美| 国产一级片一区二区| 国产精品久久久久一区二区三区共| www.污污视频| 亚洲夜间福利| 欧美激情论坛| 青娱乐极品盛宴一区二区| 久久视频在线免费观看| 后进极品白嫩翘臀在线视频| 婷婷激情综合网| 欧美黄色高清视频| 国产美女精品一区二区三区| 日本大胆人体视频| 人人网欧美视频| 国产精品第七十二页| av观看在线| 国产视频精品在线| 中文字幕免费播放| 亚洲韩国精品一区| 精品国产成人亚洲午夜福利| 极品美女销魂一区二区三区 | 欧美剧在线免费观看网站| 欧美成年人视频网站欧美| 欧美做爰爽爽爽爽爽爽| 成人h精品动漫一区二区三区| 99久久激情视频| 亚洲综合小说| 欧美精品一区二区三区四区五区| 亚洲成人高清| 5566成人精品视频免费| 免费av不卡| 精品亚洲夜色av98在线观看| 国产又粗又长视频| 婷婷综合在线观看| 日日碰狠狠添天天爽| 成人在线视频首页| 美女喷白浆视频| 亚洲视频观看| 伊人情人网综合| 午夜a一级毛片亚洲欧洲| 成人黄色大片在线免费观看| 欧美一级鲁丝片| 欧美成人精品不卡视频在线观看| 欧美日韩在线精品一区二区三区激情综| 欧美日韩精品久久久| 亚洲日本视频在线观看| 亚洲精品免费一二三区| 一级片久久久久| 大胆亚洲人体视频| 亚洲国产日韩欧美在线观看| 亚洲精品国产日韩| 成人午夜免费剧场| 国产一区二区三区站长工具| 国产伦精品一区二区三区免费视频| 精品美女一区| 欧美在线日韩在线| 国精一区二区三区| 日韩三级影视基地| 国产高清美女一级毛片久久| 亚洲精品wwww| 亚洲免费成人网| 日韩欧美中文字幕精品| www深夜成人a√在线| 国产成人免费网站| 思思久久精品视频| 视频一区二区三区中文字幕| 女人天堂av手机在线| 激情欧美国产欧美| 国产91在线亚洲| 一本一本久久a久久综合精品| 日本一区二区在线视频| 亚洲日本三级| 免费看成人av| 亚洲男人都懂第一日本| 久草热久草热线频97精品| www.豆豆成人网.com| 91入口在线观看| 精品国模一区二区三区欧美 | www.欧美色图| 国产免费一区二区三区最新6| 国产suv精品一区二区三区| 黄色a级三级三级三级| 国内精品伊人久久久久av影院| 99国产精品久久久久久| 久久国产尿小便嘘嘘| 日本人69视频| 国产一区二区不卡在线| 国产探花在线观看视频| 国产综合色产在线精品| 精品人妻一区二区三区免费| 国产一区二区三区免费观看| 欧美日韩理论片| 国产麻豆成人传媒免费观看| 俄罗斯女人裸体性做爰| 成人网男人的天堂| 国产 中文 字幕 日韩 在线| 91欧美一区二区| 中文字幕欧美激情极品| 国产精品成人在线观看| 欧美日韩精品亚洲精品| 亚洲成人资源网| 精品免费囯产一区二区三区| 91黄色激情网站| 亚洲在线精品视频| 日韩欧美综合在线| 亚洲 美腿 欧美 偷拍| 亚洲欧洲日本专区| 色多多视频在线观看| 色综合天天狠天天透天天伊人 | 国产精品999| 欧美在线se| 国产专区一区二区| 精品久久91| 国产尤物av一区二区三区| 亚洲美女一区| xxww在线观看| 成人黄色在线视频| 久久久久亚洲av无码a片| 亚洲欧美色图小说| 天天干在线播放| 欧美美女bb生活片| 色婷婷av一区二区三区之红樱桃 | 国产成人精品日本亚洲11| 天堂在线精品| 在线视频一二三区| 国产视频亚洲| 免费黄频在线观看| 91麻豆国产自产在线观看| 亚洲 欧美 变态 另类 综合| 天天av天天翘天天综合网| 91福利在线观看视频| 亚洲精品www久久久久久广东| 在线视频91p| 欧美亚洲国产精品| 精品国产三区在线| 日本一区二区三区视频免费看| 狠狠干成人综合网| 亚洲综合欧美在线| 久久这里只有精品首页| 婷婷久久综合网| 在线观看一区二区视频| 亚洲精品久久久蜜桃动漫 | 99亚洲伊人久久精品影院红桃| 国产精品视频中文字幕| 91网站黄www| 精品国产欧美日韩不卡在线观看| 深夜av在线| 在线视频国产日韩| www.51av欧美视频| 成人免费在线视频网站| 久久爱www成人| 久久这里只有精品23| 国产一区二区调教| 国产一区二区三区精品在线| 亚洲成a人片综合在线| va视频在线观看| 揄拍成人国产精品视频| 亚洲欧美韩国| 国产综合欧美在线看| 欧美日韩精品一本二本三本| 在线黄色免费观看| 欧美激情在线看| 丰满少妇xoxoxo视频| 日韩精品免费一线在线观看| 色女人在线视频| 91人人爽人人爽人人精88v| 欧美日韩在线网站| 好男人www社区| 久久精品一区二区三区四区| 五月婷婷开心网| 亚洲福利视频久久| 成人性生交大片免费看在线播放| 亚洲在线视频福利| 91超碰国产精品| 在线播放黄色av| 亚洲三级电影全部在线观看高清| 亚洲视频一区在线播放| 日韩中文字幕第一页| 久久夜夜久久| 熟妇熟女乱妇乱女网站| 精品一二线国产| 亚洲波多野结衣| 制服.丝袜.亚洲.另类.中文| 麻豆传媒在线观看| 91欧美视频网站| 欧美不卡一区| 黑森林av导航| 欧美日韩美女在线观看| 美国一级片在线免费观看视频| 日本欧美爱爱爱| 欧美一区电影| 日本77777| 一级做a爱片久久| 神宫寺奈绪一区二区三区| 97精品国产97久久久久久春色| 丝袜久久网站| 无码少妇一区二区三区芒果| 中文字幕乱码一区二区免费| 亚洲专区第一页| 久久91精品国产91久久久| 国产精品网址| 韩国一区二区av| 国产精品国产三级国产| 国产av无码专区亚洲av| 欧美极品美女视频网站在线观看免费 | 日韩av成人网| 午夜欧美2019年伦理| 国内三级在线观看| 国产主播欧美精品| 国产精品观看| 欧美性xxxx图片| 欧美日韩一区二区三区在线看| av大全在线| 蜜桃av噜噜一区二区三| 精品一区中文字幕| 日韩成人一区二区三区| 亚洲桃花岛网站| 一区二区三区在线免费看 | 麻豆精品视频在线观看免费| 久草视频手机在线观看| 亚洲人成毛片在线播放| 久久综合给合| 92看片淫黄大片一级| 中文字幕一区二区三中文字幕| 欧美一级片免费| 国产欧美日韩丝袜精品一区| 激情综合网址| 欧美a在线播放| 日韩精品在线网站| 国精品产品一区| 缅甸午夜性猛交xxxx| 国产精品久久久久桃色tv| 亚洲日本中文字幕在线| 91丨九色丨国产在线|