精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

LLM幻覺問題全梳理!哈工大團隊50頁綜述重磅發布

人工智能 新聞
重磅!哈爾濱工程大學研究團隊發布50頁綜述,細致盤點有關LLM幻覺問題你該知道的所有事。

幻覺,老朋友了。

自打LLM進入我們的視野,幻覺問題就一直是一道坎,困擾著無數開發人員。

當然,有關大語言模型幻覺的問題已經有了無數研究。

最近,來自哈工大和華為的團隊發表了一篇50頁的大綜述,對有關LLM幻覺問題的最新進展來了一個全面而深入的概述。

這篇綜述從LLM幻覺的創新分類方法出發,深入探究了可能導致幻覺的因素,并對檢測幻覺的方法和基準進行了概述。

這其中肯定也少不了業內比較有代表性的減輕幻覺的方法。

論文地址:https://arxiv.org/abs/2311.05232

下面,我們就來看一看本篇綜述中主要講了些什么內容。

想深入學習的朋友,可以移步文章底部的參考鏈接,閱讀論文原文。

幻覺大分類

首先,先來看看有哪些種類的幻覺。

上圖中,左邊是事實性的幻覺。當LLM被問到誰是第一個在月球上漫步的人時,LLM編了個人物出來,甚至還說得有模有樣。

右邊則是文本摘要模型中的忠實度問題,可以看到LLM在看到這段新聞后,直接把年份概括錯了。

在本篇綜述中,研究人員深入分析了LLM中幻覺的起源,涵蓋了從數據、訓練到推理階段的一系列促成因素。

在這一框架內,研究人員指出了與數據相關的潛在原因。例如,有缺陷的數據源和未優化的數據利用,或是在預訓練和對齊過程中可能會誘發幻覺的訓練策略,以及源于解碼策略的隨機性和推理過程中不完善的表征等等。

此外,研究人員還全面概述了專為檢測LLM中的幻覺而設計的各種有效方法,以及與LLM幻覺相關的基準的詳盡概述,和作為評估LLM產生幻覺的程度和檢測方法有效性的試驗平臺。

下圖即為本篇綜述所涉及到的內容、前人研究,以及論文。

下圖是一張更為詳細的LLM幻覺種類圖。

在事實型幻覺和忠實度幻覺下,還包括更為細致的分類。

事實型幻覺:

a)事實不一致

當問LLM,誰是第一位登月的人時,LLM回答說是加加林,而非阿姆斯特朗。這種屬于答案與事實不一致,因為確有加加林其人,所以不屬于捏造。

b)事實捏造

當讓LLM介紹一下獨角獸的起源時,LLM并沒有指出世界上沒有獨角獸這種生物,反倒是編了一大段。這種現實世界中沒有的,稱之為捏造。

忠實度幻覺又包括:指令-答案的不一致、文本不一致,以及邏輯不一致。

a)指令-答案不一致

當LLM被要求翻譯一個問句時,LLM輸出的答案實際上回答了問題,沒有進行翻譯。因此是一種指令和答案的不一致。

b)文本不一致

這類不一致更多出現在概括類任務中。LLM可能會罔顧給出的文本,總結一個錯的出來。

c)邏輯不一致

在被要求給出2x+3=11的方程解法時,第一步LLM指出,兩邊同時減去3,得到2x=8.接下來在兩邊除以2的操作中,LLM輸出的答案是3.

8除以2怎么會等于3呢?

幻覺產生原理

數據

接下來,綜述開始梳理有關幻覺產生原理的內容。

第一類,數據問題。

·錯誤信息和偏見。鑒于對大規模語料庫的需求日益增長,啟發式數據收集方法被用來有效收集大量數據。

這種方法在提供大量數據的同時,可能會無意中引入錯誤信息,增加出現模仿性錯誤的風險。此外,社會偏見也會在無意中被引入LLMs的學習過程。

這些偏差主要包括重復偏差和各種社會偏差(Social Biases)。

要知道,LLM預訓練的主要目的是模仿訓練分布。所以當LLM在事實不正確的數據上接受訓練時,它們可能會無意中放大這些不準確的數據,從而可能導致事實不正確的幻覺。

神經網絡,尤其是大型語言模型,具有記憶訓練數據的內在傾向。研究表明,這種記憶趨勢會隨著模型規模的擴大而增強。

然而,在預訓練數據中存在重復信息的情況下,固有的記憶能力就會出現問題。這種重復會使 LLM 從泛化轉向記憶,最終產生重復偏差,即LLM會過度優先回憶重復的數據,導致幻覺,最終偏離所需的內容。

除了這些偏見,數據分布的差異也是產生幻覺的潛在原因。

下一種情況是,LLM通常會存在知識邊界。

雖然大量的預培訓語料庫為法律碩士提供了廣泛的事實知識,但它們本身也有局限性。這種局限性主要體現在兩個方面:缺乏最新的事實知識和專業領域知識。

雖說LLM在通用領域的各種下游任務中表現出了卓越的性能,但由于這些通用型LLMs主要是在廣泛的公開數據集上進行訓練,它們在專業領域的專業知識受到缺乏相關訓練數據的內在限制。

因此,當遇到需要特定領域知識的問題時,如醫學和法律問題,這些模型可能會表現出明顯的幻覺,通常表現為捏造事實。

此外,還有過時的事實知識。除了特定領域知識的不足,LLMs知識邊界的另一個內在限制是其獲取最新知識的能力有限。

蘊含在LLM中的事實知識具有明確的時間界限,隨著時間的推移可能會過時。

這些模型一旦經過訓練,其內部知識就永遠不會更新。

而鑒于我們這個世界的動態性和不斷變化的本質,這就構成了一個挑戰。當面對超越其時間范圍的領域知識時,LLMs往往會采用捏造事實或提供過去可能正確,但現在已經過時的答案的方法來試圖「蒙混過關」。

下圖中,上半部分即為LLM缺失特定領域內的專業知識——phenylketonuria(苯丙酮尿)。

下半部分即為最簡單的一個知識過時的案例。2018年韓國平昌舉辦冬奧會,2022年北京舉辦冬奧會。LLM并沒有有關后者的知識儲備。

由此可見,LLM中與數據有關的幻覺主要源于錯誤的數據源和不佳的數據利用情況。數據源中的錯誤信息和固有偏差不僅會傳播模仿性虛假信息,還會引入有偏差的輸出,從而導致各種形式的幻覺。

在處理特定領域的知識或遇到快速更新的事實知識時,LLM所擁有知識的局限性就會變得很明顯。

在數據利用方面,LLMs 往往會捕捉到虛假的相關性,在回憶知識(尤其是長尾信息)和復雜推理場景中表現出困難,從而進一步加劇幻覺。

這些挑戰突出表明,亟需提高數據質量,增強模型更有效地學習和回憶事實知識的能力。

訓練

現在,綜述把目光轉向LLM的訓練階段。

LLM的訓練過程主要包括兩個主要階段:

預訓練階段,LLMs在這一階段學習通用表征并捕捉廣泛的知識。

對齊階段,LLMs在這一階段進行調整,以更好地使用戶指令和人類的基本價值觀保持一致。雖然這一過程使LLM 具備了還算不錯的性能,但這些階段中的任何不足都可能無意中導致幻覺的發生。

預訓練是LLM的基礎階段,通常采用基于transformer的架構,在龐大的語料庫中進行因果語言建模。

然而,固有的架構設計和研究人員所采用的特定訓練策略,可能會產生與幻覺相關的問題。如上所說,LLM通常采用基于transformer的架構,遵循GPT建立的范式,它們通過因果語言建模目標獲取表征,OPT和Llama-2等模型都是這一框架的典范。

除了結構缺陷,訓練策略也起著至關重要的作用。值得注意的是,自回歸生成模型的訓練和推理之間的差異導致了暴露偏差(Exposure Bias)現象。

而在對齊階段,一般涉及兩個主要過程,即監督微調和從人類反饋中強化學習(RLHF),是釋放LLM能力并使其符合人類偏好的關鍵一步。

雖然對齊能顯著提高 LLM 響應的質量,但也會帶來產生幻覺的風險。

主要分為兩方面:能力不對齊和信念不對齊(Capability Misalignment、Belief Misalignment)。

如何檢測幻覺?

檢測LLM中的幻覺對于確保生成內容的可靠性和可信度來說至關重要。

傳統的衡量標準主要依賴于詞語重疊,無法區分可信內容和幻覺內容之間的細微差別。

這一挑戰凸顯了針對LLM幻覺采用更先進的檢測方法的必要性。研究人員指出,鑒于這些幻覺的多樣性,檢測方法也相應地有所不同。

這里僅詳細介紹一例——

·檢索外部事實

如下圖所示,為了有效地指出LLM輸出中不準確的事實,一種比較直觀的策略是,直接將模型生成的內容與可靠的知識來源進行比較。

這種方法與事實檢查任務的工作流程非常吻合。然而,傳統的事實核查方法往往出于實用性考慮而采用了簡化假設,導致在應用于復雜的現實世界場景時有可能會出現偏差。

在認識到這些限制因素以后,一些研究者提出,要更加重視真實世界的場景,即從時間受限、未經整理的網絡資源中獲取證據。

他們首創了一種全自動的工作流,集成多個組成部分,包括原始文檔檢索、細粒度檢索、真實性分類等等。

當然,還有不少其他研究者提出了另外一些辦法,比如FACTSCORE,專門用于長文本生成的細粒度事實度量。

圖片

其它方法還包括不確定性估計,如下圖所示。

有關忠實度幻覺的檢測,也有不少相關研究,如下圖所示。

其中包括基于事實度量:通過檢測生成內容與源內容之間的事實重疊度來評估忠實度。

基于分類器的度量:利用經過訓練的分類器來區分生成內容與源內容之間的關聯程度。

基于QA的度量方法:利用問題解答系統來驗證源內容與生成內容之間的信息一致性。

不確定性估計:通過測量模型對其生成輸出的置信度來評估忠實度。

基于prompt的度量方法:讓LLM充當評估者,通過特定的prompt策略來評估生成內容的忠實度。

之后,哈工大團隊還將較為前沿的減輕幻覺的方法進行了整理,針對上述提到的各類問題,分別提供可行的解決辦法。

總結

總而言之,在論文的最后,哈工大的研究人員表示,在這份全面的綜述中,他們對大型語言模型中的幻覺現象進行了深入研究,深入探討了其潛在原因的復雜性、開創性的檢測方法和相關基準,以及有效的緩解策略。

雖然開發者們在這個問題上已經有了不少進步,但大型語言模型中的幻覺問題仍然是一個令人關注的持續性問題,需要繼續研究。

此外,本篇論文還可以作為推進安全可信的AI的指路明燈。

哈工大團隊表示,希望通過對幻覺這一復雜問題的探索,為這些有志之士提供寶貴的見解,推動AI技術向更可靠、更安全的方向發展。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-10-29 22:38:59

2025-06-16 14:39:56

模型開源框架

2023-10-07 13:17:44

2025-05-27 15:21:06

LLM模型AI

2025-06-25 09:32:11

2021-12-17 10:00:38

2021 Ventur

2025-08-06 09:10:10

2025-04-27 09:07:00

模型安全AI

2013-11-04 14:46:18

2015-10-27 09:25:01

2023-02-28 13:09:53

訓練模型

2023-12-01 14:36:33

模型數據

2025-01-09 12:32:57

2010-06-11 17:35:08

路由協議

2025-08-19 08:58:17

2022-09-04 19:22:46

開發科技

2025-04-08 02:22:00

2025-10-11 18:05:23

智能論文AI

2025-08-06 13:45:28

機器學習AI模型

2025-01-10 00:00:00

點贊
收藏

51CTO技術棧公眾號

久久噜噜亚洲综合| 国产一区二区三区不卡视频网站| 亚洲日本一区二区| 91中文精品字幕在线视频| 久久久久久久久毛片| 国产一区丝袜| 欧美日韩欧美一区二区| 国产一区二区三区在线免费| 天堂资源中文在线| 奇米四色…亚洲| 欧美激情久久久久久| 成年人免费观看视频网站| 电影中文字幕一区二区| 图片区小说区国产精品视频| 亚洲欧美成人一区| 亚洲毛片在线播放| 日本伊人色综合网| 欧美国产日韩一区二区| 亚洲午夜久久久久久久国产| 日本免费精品| 欧美色国产精品| 六月婷婷在线视频| 亚洲一区免费看| 刘亦菲国产毛片bd| 欧美巨大xxxx| 欧美丰满少妇xxxxx高潮对白| 无罩大乳的熟妇正在播放| 午夜免费福利在线观看| av色综合久久天堂av综合| 国产日韩在线观看av| 国产成人一区二区三区影院在线| 51精产品一区一区三区| 亚洲天堂第二页| 精品一区二区三区四区五区六区| 久久av影院| 色婷婷综合久久| 91专区在线观看| 久草在线新免费首页资源站| 中文字幕va一区二区三区| 九九九九九精品| 精品国产无码一区二区| 久久国产精品色| 国产精品久久久久久久久久小说| 日韩精品在线不卡| 亚洲欧美亚洲| 另类视频在线观看| 登山的目的在线| 999国产在线视频| 日本乱码一区二区三区不卡| 国产亚洲一区二区三区四区| 国产精品免费在线播放| jizz中国少妇| 国产毛片精品视频| 成人疯狂猛交xxx| 91av国产精品| 捆绑调教一区二区三区| 国产精品久久久久久久久久新婚| 成年人av网站| 日本在线观看不卡视频| 国产成人一区二| 天天干天天操天天操| 另类天堂av| 国产成人在线一区二区| 日本黄色中文字幕| 琪琪一区二区三区| 成人免费激情视频| 国产毛片一区二区三区va在线| 精品中文字幕一区二区| 91手机视频在线观看| 国产欧美第一页| 国产成人激情av| 国产专区一区二区| 手机福利在线| 中文字幕不卡一区| 欧美性受xxxx黑人猛交88| 激情成人四房播| 一区二区三区av电影 | 亚洲图片中文字幕| 久久99精品一区二区三区三区| 成人免费在线视频网站| 性欧美videos另类hd| 成人午夜又粗又硬又大| 免费精品视频一区二区三区| 成人亚洲综合天堂| 亚洲视频网在线直播| 婷婷开心久久网| 久久精品国产一区二区三区日韩| 噜噜噜噜噜在线视频| 欧美激情综合在线| 97超碰免费观看| 91桃色在线观看| 色婷婷国产精品综合在线观看| www.日本xxxx| 国产午夜久久av| 日韩精品免费综合视频在线播放| 日本猛少妇色xxxxx免费网站| 久久久久久久久久久久久久久久久久| 欧美极品欧美精品欧美视频 | 亚洲女同另类| 久久久久中文字幕2018| av大片在线免费观看| 蜜臀av一区二区在线观看| 亚洲在线视频观看| 水中色av综合| 亚洲免费观看在线观看| 欧美亚洲另类色图| 国产一区二区三区精品在线观看| 日韩经典一区二区三区| 国产极品国产极品| 免费一区视频| 99视频免费观看| caoporn国产精品免费视频| 亚洲综合色丁香婷婷六月图片| 亚洲国产精品毛片av不卡在线| 欧美国产中文高清| 在线看日韩欧美| 日操夜操天天操| 国产一区不卡在线| 日韩中文字幕一区二区| 少女频道在线观看高清| 欧洲av在线精品| 免费黄色三级网站| 91精品推荐| 国产精品成av人在线视午夜片 | 亚洲人成77777| 在线免费av资源| 日韩精品专区在线影院重磅| 殴美一级黄色片| 久久裸体视频| 国内精品国语自产拍在线观看| 国产成人午夜| 欧美性受xxxx| 国产精品密蕾丝袜| 国产人成精品一区二区三| 91精品天堂| 黄色成人影院| 911精品国产一区二区在线| 久久国产柳州莫菁门| 亚洲欧美卡通另类91av| 黄色91av| 九色porny丨入口在线| 日韩免费视频线观看| 国产视频精品免费| 奇米四色…亚洲| 午夜久久资源| 影音成人av| 中文字幕成人精品久久不卡| 一级一片免费看| 久久久精品日韩欧美| 精品国产免费av| 日韩美女毛片| 日韩av电影免费观看高清| 日韩资源在线| 日韩欧美在线观看视频| av鲁丝一区鲁丝二区鲁丝三区| 亚洲黄色高清| 九九九九九九精品| 国产精品迅雷| 一区二区三区亚洲| 91成年人视频| 亚洲欧美日韩国产手机在线| 欧美精品 - 色网| 永久91嫩草亚洲精品人人| 亚洲一区中文字幕| 久久av色综合| 日韩精品视频免费专区在线播放| 久久久精品福利| 日本一区二区视频在线| 97超碰成人在线| 欧美一区二区| 久久精品日产第一区二区三区乱码| 极品在线视频| 国产亚洲欧洲黄色| 91精东传媒理伦片在线观看| 亚洲激情图片一区| 亚洲成人av免费在线观看| 久久激情婷婷| 中文字幕日韩一区二区三区| 亚洲成av人片在线观看www| 欧美激情综合色| 国产三级在线| 欧美丰满嫩嫩电影| 国产第一页在线播放| 26uuu国产电影一区二区| 在线观看高清免费视频| 久久久久久美女精品| 精品国产免费一区二区三区 | 91精品国产高清一区二区三区蜜臀| 欧美做爰爽爽爽爽爽爽| 91亚洲资源网| 激情视频免费网站| 欧美精品99| 欧美日韩国产免费一区二区三区 | 午夜亚洲伦理| 一本色道久久综合亚洲二区三区| 亚洲性视频在线| 国产国语刺激对白av不卡| 成人ww免费完整版在线观看| 亚洲成人教育av| 亚洲一区二区激情| 午夜视黄欧洲亚洲| 国产白丝一区二区三区| fc2成人免费人成在线观看播放 | 高清不卡一二三区| 日韩有码免费视频| 欧美a级片网站| 日本不卡一区| 成人h动漫精品一区二区器材| 国产99视频在线观看| 午夜激情在线| 中文字幕日韩在线视频| 天天操天天操天天干| 欧美精三区欧美精三区| 国产极品美女高潮无套嗷嗷叫酒店| 国产女主播在线一区二区| 熟女人妻一区二区三区免费看| 日本最新不卡在线| 怡红院av亚洲一区二区三区h| 99久精品视频在线观看视频| 欧美极品一区二区| 丁香5月婷婷久久| 成人精品久久久| 精品三区视频| 日韩男女性生活视频| 超碰成人av| 欧美激情三级免费| 成年视频在线观看| 最近2019中文字幕大全第二页 | 国产一区二区三区在线免费观看| 亚洲国产www| 91精品国产综合久久精品图片| 伊人久久久久久久久久久久| 亚洲va天堂va国产va久| 69av视频在线| 一区二区在线看| 小泽玛利亚一区二区免费| 国产欧美日韩综合精品一区二区| 玖草视频在线观看| eeuss影院一区二区三区 | 26uuu国产电影一区二区| 老熟女高潮一区二区三区| 国内精品免费**视频| 91国内在线播放| 久久99国产精品久久| 第四色婷婷基地| 日本va欧美va瓶| 狠狠热免费视频| 视频一区二区三区中文字幕| 日韩网址在线观看| 国产亚洲欧洲| 免费在线观看日韩视频| 亚洲免费一区二区| 草草草在线视频| 视频一区二区三区中文字幕| 熟妇人妻va精品中文字幕| 日一区二区三区| 九九热在线免费| 开心九九激情九九欧美日韩精美视频电影 | 触手亚洲一区二区三区| 亚洲午夜国产成人av电影男同| 成人在线免费观看| 精品国产一区二区在线| 久久久久久久久免费视频| 日韩视频在线观看免费| 国产不卡在线| 国内精品久久久久久久久| 成人ssswww在线播放| 欧美在线一级视频| 精品国模一区二区三区| 国产视频999| 日韩精品一区二区三区中文| 国产精品午夜av在线| 久久悠悠精品综合网| 蜜桃av久久久亚洲精品| 精品久久综合| 男同互操gay射视频在线看| 国产精品a级| 国产日产欧美视频| 免费欧美在线视频| 国产伦理在线观看| 91在线一区二区三区| 黄色片在线观看免费| 亚洲人亚洲人成电影网站色| 国产大片中文字幕| 欧美午夜免费电影| 性做久久久久久久久久| 亚洲欧美日韩一区在线| 国产福利在线播放麻豆| 91成人国产在线观看| 久久亚洲资源中文字| dy888夜精品国产专区| 在线成人动漫av| 在线观看av的网址| 噜噜爱69成人精品| 午夜免费一级片| 91在线视频免费91| 欧美做爰啪啪xxxⅹ性| 精品国产精品自拍| 国产精品永久久久久久久久久| 亚洲精品美女免费| 色开心亚洲综合| 91禁国产网站| 国产精品一区二区三区av| 久久久久资源| 91精品99| 一级在线免费视频| av一区二区久久| 手机在线免费看片| 色婷婷亚洲综合| 欧美精品www在线观看| 成年人在线观看视频| 久久久久久91香蕉国产| 国精品产品一区| 久久伊人一区| 狠狠综合久久| 特黄视频免费观看| 久久久.com| 日本系列第一页| 日韩午夜激情视频| 最新真实国产在线视频| 日韩av高清不卡| 国产伦精品一区二区三区免费优势 | 中文有码一区| 日韩xxxx视频| 国产精品1区二区.| 中文乱码字幕高清一区二区| 色婷婷av一区二区三区之一色屋| 日韩性xxxx| 欧美黑人狂野猛交老妇| 91精品亚洲一区在线观看| 日韩av免费电影| 国产精品日本欧美一区二区三区| av地址在线观看| 亚洲美女在线一区| 91精东传媒理伦片在线观看| 在线观看91久久久久久| 免费成人在线电影| 好看的日韩精品| 亚洲二区在线| 亚洲图片综合网| 性欧美疯狂xxxxbbbb| 亚洲精品.www| 欧美区二区三区| 无人区乱码一区二区三区| 日本一区二区三区四区五区六区| 精品一区二区久久久| 色www亚洲国产阿娇yao| 欧美性做爰猛烈叫床潮| 成人高清网站| 国产精品视频免费在线观看| 欧美日韩激情在线一区二区三区| 超碰97人人射妻| 国产午夜精品久久久久久免费视 | 久久久久一区二区三区| 一本色道久久综合亚洲精品高清 | 99久久久久久久| 色综合色综合网色综合| 亚洲无线观看| 大j8黑人w巨大888a片| 久久网这里都是精品| 中文字幕精品无| 精品国偷自产在线| 亚洲国产欧美在线观看| 国产美女在线一区| 99久久99精品久久久久久| 天堂在线免费观看视频| 亚洲午夜性刺激影院| 69堂精品视频在线播放| 亚洲欧美日韩不卡一区二区三区| 狠狠色丁香婷综合久久| 国产在线视频卡一卡二| 日韩av在线网| 天天免费亚洲黑人免费| 亚洲自拍三区| 国产激情偷乱视频一区二区三区| 久久久久国产精品夜夜夜夜夜| 337p日本欧洲亚洲大胆精品| 黄视频网站在线观看| 热re99久久精品国产99热| 黄一区二区三区| 久久久久噜噜噜亚洲熟女综合| 精品成人a区在线观看| 中文字幕在线视频久| 天天爽天天狠久久久| 国产一二精品视频| 日韩三级视频在线| 国产一区av在线| 免费看日产一区二区三区| 国产精品入口芒果| 国产亚洲精品中文字幕| 国产口爆吞精一区二区| 91精品国产91久久久久| 欧洲三级视频| 成人做爰www看视频软件 | 国产美女永久免费| 久久久久免费视频| 精品日产免费二区日产免费二区| 色网站在线视频| 欧美视频在线免费| 麻豆视频在线观看免费|