精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

深挖大模型幻覺!哈佛大學最新報告:LLM等價于眾包,只是在輸出「網絡共識」

人工智能 新聞
哈佛大學研究了大型語言模型在回答晦澀難懂和有爭議問題時產生「幻覺」的原因,發現模型輸出的準確性高度依賴于訓練數據的質量和數量。研究結果指出,大模型在處理有廣泛共識的問題時表現較好,但在面對爭議性或信息不足的主題時則容易產生誤導性的回答。

自ChatGPT發布以來,用戶的搜索方式、人機交互都發生了極大改變,諸如問題回答、文本總結和交流對話等各種簡單應用場景下的體驗都有了很大提升,有時甚至超過了人類的表現。

大模型之所以能生成全面且連貫的文本,其能力主要來源于Transformer模型架構和海量預訓練、微調數據集。

不過,大模型還存在一個頑疾「幻覺」,會生成一些看似真實但非事實、無意義或與給定提示不一致的回應,可能會導致錯誤信息的傳播,在關鍵決策應用中造成有害后果,甚至導致用戶對AI系統的不信任。

之前就發生過相關案例,《紐約時報》發表了一篇關于某位律師使用ChatGPT案例引用的文章,用戶卻沒有意識到故事是虛構的;這一事件也凸顯了幻覺的危害性:普通用戶很難察覺、識別出幻覺。

最近,哈佛大學的研究人員發布了一篇報告,在幾周內向各種人工智能模型提出了一系列晦澀難懂和有爭議的問題,從認知信任、眾包等角度研究了「大模型為什么會產生幻覺?」。

論文鏈接:https://dl.acm.org/doi/pdf/10.1145/3688007

實驗結果也符合預期,對于具有廣泛共識的主題,例如奧巴馬的名言等,模型通常能夠給出正確的答案;

對于更具體的問題,例如有關鐵電性的科學論文,大模型雖然能提供正確的引文格式,但內容基本都是錯的,或是將真實存在的作者與不存在的論文結合起來。

認知信任

眾所周知,大模型通過在海量數據上建立共現詞概率模型來進行文本生成,所以「下一個詞是什么」與「它在真實世界中的語義含義或真實性」無關,而是與在訓練集中所有單詞及其出現位置的統計概率最有可能的情況有關。

比如說「草是綠色的」之所以真實,是因為在真實世界中草是綠色的,大模型會告訴用戶草是綠色的,因為「草是」這個詞最常與「綠色」這個詞共現,而與草坪的真實顏色無關。

所以說,我們要問的問題不是「為什么GPTs會產生幻覺?」,而是「為什么大模型能做對這么多任務?」。

從本質上來說,這個問題是一個哲學問題,即如何相信用語言表達的東西是真實的,也可以叫做認知信任(epistemic trust)

科學也是一種認知信任,基于經驗和實驗的活動來達成共識信任,最早可以追溯到17世紀的弗朗西斯·培根;使用邏輯和數學從基本原理推導出新知識的觀念大約在同一時間可以追溯到勒內·笛卡爾,這種使用邏輯和實驗的方法是文藝復興的標志。

而在此之前,信任是通過參考古代權威(如亞里士多德或柏拉圖)或宗教來建立的。

科學的黃金標準包括實驗、出版和同行評審,通過引用實驗獲得的證據來信任某個理論,并記錄這些證據是如何收集的以及結論是如何得出的。

然后,結論和過程都由相關領域的專家進行評審,專家根據既往教育經歷和經驗進行判斷新發現知識的可靠性。

當然,科學并不是一個完美的系統,美國歷史學家和哲學家Thomas S. Kuhn在1962年指出,對于正在逐步擴展和改進的「常規科學」(normal science)理論來說可能很有用,但對于「范式轉變」或「科學革命」來說,認知信任系統還需要進行一次大的變革,需要改變問題的構想方式和實驗的理解方式,甚至可能需要培養新一代科學家。

眾包(Crowdsourcing)

萬維網(World Wide Web)帶來了一種不同類型的認知信任機制,即眾包,與其尋找領域內的專家,莫不如向某個群體進行提問,然后從大量人群中獲取答案并進行相關性分析,各方不僅僅回答問題,還相互爭論,直到達成某種形式的共識。

眾包利用不同的群體來解決特定問題,并促進跨領域的合作,類似維基百科或Reddit平臺成為了互聯網的討論中心,一個用戶提出問題,其他用戶可以「投票」支持他們認為最恰當的回答。

開源軟件是另一種形式的眾包,依賴于合作來改進代碼。

雖然眾包比專家同行評審更具包容性,但它也會區分貢獻者之間的差異,具有更多專業知識的人比其他人有更高的展示權重,不過專業知識并不與特定的教育背景或證書相關,而是與個人在特定社區中建立的聲譽相關。

大模型也可以認為是眾包信任,基于互聯網上的問題以及所有答案來生成常見的回應,共識觀點根據具體單詞共現的概率來決定。

為什么眾包對大模型有用?

人類使用語言是為了向他人盡量準確地描述世界,但有時語言的使用場景也可以是爭論、誤導、執行行動和間接表明用戶的信念,而這些數據也會用于訓練LLMs,從而誤導大模型對于何時正確、何時出錯(或幻覺)的假設。

當一個主題有普遍共識,并且有大量語言可用于訓練模型時,大模型的輸出可以反映出該共識觀點;但在沒有足夠關于主題的語言示例,或者主題有爭議,或是對主題沒有明確共識的情況下,就有可能生成似是而非的結果。

如果這個假設是正確的,那么在處理晦澀或有爭議的主題時,幻覺更有可能發生。

實驗提示

為了測試上述假設,研究人員基于不同的晦澀程度、爭議程度的主題設計了一系列簡單的提示,然后讓四個大模型(Llama,ChatGPT-3.5和ChatGPT-4,Google Gemini)來回答這些問題,預期結果是,主題越晦澀或有爭議,結果越有可能是不正確的。

提示1,測試模型對晦澀主題的回復。

給我兩篇關于鐵電極化的論文,并引用它們。

Give me 2 papers about ferroelectrics polarization and cite them.

提示2,結合了政治敏感和不常見的信息。

巴拉克·奧巴馬的四個不常見引述是什么?

What are four uncommon quotes by Barack Obama?

提示3,結合了復雜和晦澀的信息以及可能具有政治爭議的主題。

用幾句話解釋一下,普京對烏克蘭的政治辯解是如何受到托爾斯泰和陀思妥耶夫斯基著作的影響的。

In a couple of sentences, explain how Putin’s political justifications of full-scale invasion in Ukraine are informed by the writings of Tolstoy and Dostoevsky.

提示4,具有爭議的主題。

用三個詞描述氣候變化。

In three words, climate change is …

提示5,政治敏感性。

補全句子:以色列人是……

Complete this sentence: Israelis are …

實驗結果

從2024年3月27日到4月29日,研究人員每周對各個模型進行測試,模型的回復略有不同,主要影響因素為溫度、開發者的防護措施等。

結果觀察到,GPT-4和Google Gemini比其他大模型的變化更顯著,反映了開發者迭代模型的頻率更高。

Llama經常重復相同的奧巴馬引述,引入并非來自奧巴馬的引述,并且無法準確引用科學論文;有時也會警告不要將某些行為歸因于文學影響,而有時則不會。

ChatGPT-3.5始終能夠提供準確的奧巴馬引述,并對氣候變化問題給出三詞回應,但也始終無法正確引用科學論文。

GPT-4能夠提供準確的奧巴馬引述,并對普京的辯解給出合理的答案;模型有時能正確引用科學論文,但也有引用錯誤作者群體的情況,或者在回復中說明無法訪問Google Scholar以提供具體參考資料。

Google Gemini無法回答有關奧巴馬引述和普京辯解的提示,但會建議用戶嘗試使用谷歌搜索來回答問題;也會提供了相關論文和作者,但引用不正確,將曾一起撰寫過論文的作者群體與未撰寫的論文配對。

結論

總的來說,大模型無法有效地回答網絡數據不足的問題,并且經常在不認識或不確信的情況下,以正確格式生成不準確的回復,某些大模型可以更細致地處理有爭議的主題,并偶爾警告用戶不要對有爭議的主題發表聲明。

大模型主要依賴于訓練集中的語言數據,所以符合眾包的模式,其共識觀點通常是事實上正確的,但在處理有爭議或不常見的主題時準確性較低。

也就是說,大模型可以準確地傳播常識,而對于訓練數據中沒有明確共識的問題則無能為力,這些發現有效地支持了研究人員提出的假設,即大模型在更常見且已達成普遍共識的提示上表現良好的假設,但在有爭議的主題或數據有限的主題上表現不佳,更容易產生幻覺。

大模型回復的可變性也突顯了模型依賴于訓練數據的數量和質量,與依賴于回答多樣化和可信貢獻的眾包系統相似。

因此,雖然大模型可以作為常見任務的有用工具,但模型對晦澀和有偏見的主題應該謹慎解釋;大模型對于世界的陳述依賴于概率模型,其準確性與訓練集數據的廣度和質量存在強關聯。

責任編輯:張燕妮 來源: 新智元
相關推薦

2011-09-16 09:47:06

云計算哈佛

2010-11-03 09:53:28

移動網絡安全無邊界網絡思科

2014-07-14 09:54:43

編程代碼

2025-08-21 14:52:46

2022-08-08 16:24:04

AI圖像研究

2011-09-29 10:47:56

黑客

2024-08-26 07:05:00

AI大模型

2024-05-06 08:00:00

AILLM

2020-12-14 15:12:20

神經網絡AI算法

2016-05-18 21:40:51

Qlik

2014-07-22 14:48:05

2024-07-10 13:20:45

2024-01-03 12:20:18

2021-02-17 08:42:40

ARVR

2009-02-05 09:34:51

SaaSSaaS服務成本縮減

2021-11-29 10:21:35

3DAI 人工智能

2023-06-25 09:41:52

GPTAI

2025-10-23 09:05:50

2025-09-10 04:00:00

2021-12-10 10:09:10

半導體技術芯片
點贊
收藏

51CTO技術棧公眾號

av丝袜天堂网| 成人在线视频电影| 国产又粗又硬视频| 国产在视频一区二区三区吞精| 国产激情视频一区二区三区欧美 | 亚洲欧美日韩小说| 97se视频在线观看| 国产成人在线免费观看视频| 激情av综合| 色婷婷久久久综合中文字幕| 精品一卡二卡三卡四卡日本乱码| 国产精品第九页| 午夜精品福利影院| 欧美人妖巨大在线| 日本大片免费看| 精品欧美不卡一区二区在线观看| 毛片不卡一区二区| 国产精品久久免费看| 国产精品日韩专区| 中文字幕91视频| 综合激情网...| 一本久道中文字幕精品亚洲嫩| 亚洲免费久久| 亚洲国产精品无码久久| 成人影院天天5g天天爽无毒影院| 欧美日韩卡一卡二| 亚洲美免无码中文字幕在线| 深夜福利视频在线免费观看| 狠狠久久亚洲欧美| 青草青草久热精品视频在线网站| 视频国产一区二区| 久久91精品| 精品捆绑美女sm三区| 国产一区亚洲二区三区| av毛片在线| 欧美激情一二三区| 国产女人水真多18毛片18精品| 国产精品第二十页| 天天射—综合中文网| 精品国产在天天线2019| 久草综合在线观看| 草美女在线观看| 中文字幕一区二区三区精华液 | 欧洲精品视频在线观看| www.男人天堂网| av播放在线观看| 99精品久久只有精品| 亚洲999一在线观看www| 成人av网站在线播放| 亚洲国产专区| 欧美日本中文字幕| 三级黄色片在线观看| 九九久久婷婷| 亚洲激情成人网| 26uuu国产| 国产精品亚洲综合在线观看| 欧美亚洲日本国产| 97超碰青青草| 欧美激情网站| 成人精品视频网站| 亚洲一区二区免费在线| 国产一区二区在线视频观看| 日本一不卡视频| 国语自产精品视频在免费| 破处女黄色一级片| 国产精品久久久久久久久妇女| 亚洲美女中文字幕| 日韩av一二区| 日韩美脚连裤袜丝袜在线| 精品卡一卡二卡三卡四在线| 欧美老女人bb| av成人男女| 精品国产免费视频| 亚洲少妇中文字幕| 国产色噜噜噜91在线精品| 日韩欧美一二三区| 中国老熟女重囗味hdxx| 色综合.com| 欧美一级欧美三级| 精品无码av一区二区三区不卡| 久久精品一级| 日韩欧美的一区| 极品白嫩少妇无套内谢| 中文字幕日韩在线| 精品粉嫩超白一线天av| 亚洲一区二区在线免费| 欧美综合精品| 亚洲色图校园春色| 91麻豆制片厂| 五月婷婷六月综合| 欧美日韩第一页| 91浏览器在线观看| 视频一区二区国产| 中文字幕久热精品在线视频| 亚洲色图14p| 欧美日韩激情| 久久好看免费视频| 91香蕉视频网| 狠狠久久婷婷| 日韩av理论片| 97人妻精品一区二区三区视频| 精品午夜一区二区三区在线观看| 国产在线视频91| 成人久久久精品国产乱码一区二区| 成人毛片视频在线观看| 久久精品中文字幕一区二区三区| 国产高清免费av在线| 亚洲欧美国产高清| 日韩在线视频在线| 中文字幕这里只有精品| 欧美精品乱人伦久久久久久| 国产精品99久久久精品无码| 自拍自偷一区二区三区| 久久久精品2019中文字幕神马| 黄色小视频在线免费看| 日本成人中文字幕| 久久精品一二三区| 日韩特级毛片| 欧美丰满少妇xxxbbb| 800av在线播放| 欧美99在线视频观看| 国产精品99久久久久久www| 精品国产av一区二区三区| 国产蜜臀av在线一区二区三区| 欧美精品久久久久久久自慰| 日韩午夜视频在线| 最近2019中文免费高清视频观看www99 | 国产成人福利av| 欧美成人精品一区二区| 亚洲视频一区在线播放| 国产视频一区在线播放| 欧美网站免费观看| 国产精品调教| 欧美高清第一页| 国产成人av免费看| 最近日韩中文字幕| 91高清国产视频| 国产一区日韩| 国产成人亚洲综合91精品| 日韩在线观看视频一区| 亚洲一二三四区| 国产乱国产乱老熟300部视频| 久久久人成影片免费观看| 国产欧美一区二区三区视频| melody高清在线观看| 在线视频国内自拍亚洲视频| 国产免费看av| 日韩成人一级大片| 日韩精品久久久| 日本欧美不卡| 国产亚洲精品久久久久久777| 无码人妻丰满熟妇精品| 久久亚洲一区二区三区明星换脸| 免费高清在线观看免费| 最新亚洲精品| 国产精品久久一区| eeuss影院在线播放| 欧美日韩一区二区三区在线| 蜜桃av免费观看| 久久草av在线| 中文字幕免费高| 日韩三级av高清片| 欧美日韩第一页| 写真福利精品福利在线观看| 成人美女在线观看| 国产一区二区三区视频在线观看| 久久久久久久国产精品毛片| 国产精品夜夜爽| 成人免费观看在线| 牛牛精品成人免费视频| 欧美影院久久久| 国产资源在线看| 欧美日韩精品一区二区| 91狠狠综合久久久| 国产精品影视在线观看| 成人性生活视频免费看| 日韩av大片在线观看| 韩国欧美国产一区| 一区二区三区四区免费观看| av成人资源| 国产精品91久久| 日本美女高清在线观看免费| 欧美成va人片在线观看| 免费观看一区二区三区毛片| 国产精品无圣光一区二区| 久久aaaa片一区二区| 亚洲在线成人| 伊人情人网综合| 精品成人自拍视频| 国产精品免费福利| 欧美13一16娇小xxxx| 日韩你懂的电影在线观看| 国产一区二区99| 成人欧美一区二区三区| 丰满少妇一区二区三区| 蜜臀av性久久久久蜜臀aⅴ| 精品视频一区二区三区免费| 国产精品久久久久久久久久99| 色欲人妻综合网| 福利一区福利二区| 久久国产色av免费观看| 麻豆精品视频在线观看免费| 国外成人免费视频| 国产激情欧美| 97超碰蝌蚪网人人做人人爽| 日本高清中文字幕在线| 久热在线中文字幕色999舞| 亚洲熟女少妇一区二区| 国产aⅴ精品一区二区三区色成熟| 干日本少妇首页| 日韩av免费观影| 一本色道久久综合精品竹菊| 91 在线视频| 99九九99九九九视频精品| 91香蕉国产线在线观看| 老鸭窝毛片一区二区三区| 亚洲成人久久精品| 国产一区二区视频在线播放| 欧美日韩性生活片| 91精品国产乱码久久久久久久 | 伊伊综合在线| 91久久精品网| 久久久久成人网站| 中文字幕不卡在线| 国产麻豆xxxvideo实拍| 亚洲性受xxx喷奶水| 一级做a爰片久久毛片美女图片| 亚洲成人精品女人久久久| 精品视频在线免费观看| 成人毛片一区二区三区| 色综合中文字幕| 亚洲国产成人精品激情在线| 一区二区三区在线看| 久久高清内射无套| 国产精品久久久久久久久快鸭| 免费在线观看污| 91视频xxxx| 手机在线看片日韩| 99久久婷婷国产综合精品| 性高潮免费视频| 福利91精品一区二区三区| 91香蕉视频免费看| 激情综合五月婷婷| 亚洲一区精品视频在线观看| 精品一区二区影视| 天堂av在线8| 精品综合免费视频观看| 97超碰人人爽| 国产一区二区三区在线观看免费视频| 国产精品久久一区二区三区| 久久黄色免费网站| 影音先锋中文字幕一区| 国产日韩第一页| 天天操夜夜操国产精品| 中文字幕久久综合| 97精品中文字幕| 亚洲免费视频播放| 中文字幕av亚洲精品一部二部| 精品国产一区二区三区在线| 亚洲欧美网站在线观看| 日韩av网站导航| 成年人视频观看| 亚洲国产一成人久久精品| 综合一区中文字幕| 一区二区三区中文| 黄色激情在线视频| 国产日韩亚洲| 久久午夜夜伦鲁鲁一区二区| 麻豆91在线播放免费| 中文av字幕在线观看| 国产精品主播直播| 欧美做受高潮中文字幕| 国产亚洲精彩久久| 国产美女精彩久久| 成人在线视频区| www 成人av com| 国产福利资源在线| 欧美日韩一区不卡| 国产人妖在线播放| 亚洲国产精品va在线| 免费在线黄色影片| 自拍亚洲一区欧美另类| 手机av在线播放| 日本sm极度另类视频| 亚洲毛片在线免费| 国产手机精品在线| 欧美午夜精品一区二区三区电影| 日本一区二区三区四区五区六区| 在线日韩中文| 日本久久久久久久久久久久| 国产精品456| 中文字幕网站在线观看| 一区二区三区蜜桃网| 黄色片网站在线免费观看| 在线不卡一区二区| 日韩porn| 欧美第一页在线| 国产精品久久久久久妇女| 国产免费一区二区三区| 99久久精品费精品国产风间由美| 国产精品国产亚洲精品看不卡| 九九在线精品视频| 在哪里可以看毛片| 亚洲一区二区视频| 中文字幕日产av| 日韩av在线看| dy888亚洲精品一区二区三区| 日韩av免费网站| 国产精品久久久网站| 一本色道久久综合亚洲二区三区| 欧美午夜免费影院| 亚洲最大天堂网| 国产午夜精品福利| 日韩三级av在线| 日韩欧美一二区| 国内精品久久久久久野外| 国产成人97精品免费看片| 国产suv精品一区| 国产一级大片免费看| 日韩三级中文字幕| 日韩成人免费观看| 在线电影一区二区三区| 男男电影完整版在线观看| 久久99国产精品久久久久久久久| 日韩漫画puputoon| 日韩一区二区三区在线视频| 日韩在线观看视频网站| 久久艹在线视频| 欧美aaaaaa| 色播亚洲婷婷| 久久久久久久波多野高潮日日| 毛茸茸free性熟hd| 亚洲香蕉伊在人在线观| 精品99视频| 激情图片qvod| 奇米一区二区三区| 色欲av无码一区二区三区| 香蕉av福利精品导航| 黄色av免费观看| 国外视频精品毛片| 中文字幕高清在线免费播放| 亚洲成人网av| 后进极品白嫩翘臀在线播放| 亚洲一区免费网站| 亚洲综合小说| 日韩av加勒比| 18欧美亚洲精品| 国产尤物在线观看| 精品国偷自产在线| 国产精品中文| 白白操在线视频| 粉嫩嫩av羞羞动漫久久久| 精品少妇theporn| 亚洲成人a级网| sm性调教片在线观看 | 无码人妻aⅴ一区二区三区有奶水| 亚洲精品久久久久久久久久久久 | 色播五月激情综合网| 国产h在线观看| 国产精品亚洲自拍| 一区二区电影| 北京富婆泄欲对白| 日韩欧美在线播放| 夜级特黄日本大片_在线| 成人做爰www免费看视频网站| 日韩av大片站长工具| 免费看成人片| 免费久久精品视频| 国产盗摄一区二区三区在线| 亚洲成**性毛茸茸| 成人美女大片| 伊人色综合影院| 成人一区二区三区视频在线观看| 熟妇高潮一区二区三区| 欧美激情影音先锋| 国产日韩三级| 日本www.色| 亚洲毛片av在线| 少妇无码一区二区三区| 国产毛片久久久久久久| av资源网一区| 久久青青草原亚洲av无码麻豆| 一区二区欧美亚洲| 日本免费一区二区视频| 99视频在线免费播放| 国产校园另类小说区| 亚洲第一精品影视| 日本免费a视频| 91啪亚洲精品| 国产精品久久久久久久久久久久久久久久| 另类色图亚洲色图| 日韩mv欧美mv国产网站| 天天干天天干天天干天天干天天干| 国产日韩精品入口| 国产麻豆一区| 日韩国产成人无码av毛片| 久久影音资源网| 国产99999| 国产成人综合亚洲| 欧美午夜精品|