精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

機(jī)器學(xué)習(xí) | 大模型為什么會(huì)出現(xiàn)"幻覺"?

發(fā)布于 2025-9-22 07:03
瀏覽
0收藏

最近 ??OpenAI?? 發(fā)表了一篇文章《Why Language Models Hallucinate》,解釋為什么會(huì)出現(xiàn) "幻覺",周末我讀了一下,總結(jié)這篇文章。

什么是"幻覺"?

幻覺是語(yǔ)言模型生成了似是而非的答案,即使很簡(jiǎn)單的問題,但是模型可能給出一些不符合事實(shí)的答案,比如:

機(jī)器學(xué)習(xí) | 大模型為什么會(huì)出現(xiàn)"幻覺"?-AI.x社區(qū)

問題:請(qǐng)用一句話回復(fù),其中第三個(gè)詞是 “dog”
回答:I have a dog. 詞列表:I, have, dog, a.

以上就是一個(gè) "幻覺" 錯(cuò)誤,??dog?? 并不是第三個(gè)詞。

幻覺分類:

  • 內(nèi)在幻覺(Intrinsic Hallucinations):生成的內(nèi)容與輸入的源信息沖突,類似上面的這個(gè)問題。
  • 外在幻覺(Extrinsic Hallucinations):生成了與源信息無(wú)關(guān)的內(nèi)容,大部分情況是沒有原始事實(shí),會(huì)導(dǎo)致大模型開始 “胡說八道”。

為什么會(huì)出現(xiàn) "幻覺"?

錯(cuò)誤的獎(jiǎng)勵(lì)機(jī)制

"幻覺" 出現(xiàn)的一個(gè)原因源于目前的評(píng)估方法所設(shè)的錯(cuò)誤獎(jiǎng)勵(lì)機(jī)制。想像一下我們?cè)谧鲞x擇題的時(shí)候,對(duì)于不知道答案的情況下,我們會(huì)怎么選擇?我們直接回答不知道,還是猜測(cè)一個(gè)答案?大家應(yīng)該更傾向猜測(cè)一個(gè)答案,畢竟有一定的概率猜中答案,這樣就能獲得分?jǐn)?shù),如果留空則沒有獎(jiǎng)勵(lì)分?jǐn)?shù)。同樣,如果只以準(zhǔn)確度(即完全答對(duì)問題的百分比)來為模型評(píng)分,那就會(huì)鼓勵(lì)模型猜測(cè),而不是說"我不知道"。所以根本原因是模型在訓(xùn)練過程中,并沒有將棄權(quán)作為評(píng)估模型的一個(gè)指標(biāo),而是根據(jù)準(zhǔn)確度來排列模型的先后次序。

機(jī)器學(xué)習(xí) | 大模型為什么會(huì)出現(xiàn)"幻覺"?-AI.x社區(qū)

以上是大模型幻覺率的排行榜,可以看到 "幻覺" 并不是模型越大,"幻覺" 就越低,而是和本身的模型評(píng)分標(biāo)準(zhǔn)相關(guān)。盡管知道錯(cuò)誤的獎(jiǎng)勵(lì)機(jī)制會(huì)導(dǎo)致 "幻覺" 的出現(xiàn),但衡量準(zhǔn)確度的評(píng)分機(jī)制仍在排行榜和模型資料卡上占據(jù)主導(dǎo)地位,促使開發(fā)人員建立傾向猜測(cè)而非選擇不作答的模型,這樣就進(jìn)一步加劇模型更加自信的提供錯(cuò)誤答案。

預(yù)訓(xùn)練數(shù)據(jù)和微調(diào)問題

"幻覺" 出現(xiàn)的另一個(gè)原因就是預(yù)訓(xùn)練本身就是概率預(yù)測(cè)下一個(gè)詞,這里必然存在一定概率出現(xiàn)非事實(shí)回答,這個(gè)時(shí)候有人可能會(huì)說:為啥拼寫和符號(hào)等問題不會(huì)錯(cuò)?這個(gè)是由于某些事實(shí)的數(shù)據(jù)量小,或者事實(shí)沒有規(guī)律可言的情況下,模型只能按照概率選擇下一個(gè)詞,導(dǎo)致開始 "胡說八道",所以模型的學(xué)習(xí)目標(biāo)(最小化交叉熵?fù)p失進(jìn)行概率密度估計(jì))在統(tǒng)計(jì)上必然會(huì)導(dǎo)致其生成錯(cuò)誤。

同時(shí),Gekhman等人在研究中討論了一個(gè)問題:用新知識(shí)進(jìn)行LLM微調(diào)是否會(huì)促使幻覺現(xiàn)象的發(fā)生。發(fā)現(xiàn) ??LLM?? 學(xué)習(xí)帶有新知識(shí)的樣本,要比學(xué)習(xí)與模型預(yù)先存在的知識(shí)樣本,學(xué)得更慢,一旦學(xué)習(xí)了這些帶有新知識(shí)的樣本,模型產(chǎn)生幻覺的傾向就會(huì)增加。

如何減少 "幻覺"?

基于如上兩個(gè)出現(xiàn)的原因,其對(duì)應(yīng)方案如下。

完善的評(píng)分準(zhǔn)則

對(duì)于模型訓(xùn)練過程中相對(duì)于表示不確定答案,向自信的錯(cuò)誤答案施予更嚴(yán)重的懲罰,并對(duì)表示不確定的答案給予部分分?jǐn)?shù)。論文中認(rèn)為只針對(duì)表示不確定的答案增設(shè)若干新測(cè)試尚不足夠,更有必要更新以準(zhǔn)確度為基礎(chǔ)的熱門評(píng)估機(jī)制,借此令評(píng)分標(biāo)準(zhǔn)不再鼓勵(lì)猜測(cè)。假如主要的評(píng)分機(jī)制持續(xù)獎(jiǎng)勵(lì)僥幸猜測(cè),模型就會(huì)持續(xù)學(xué)習(xí)猜想答案,修定評(píng)分機(jī)制更有助擴(kuò)大幻覺減少技術(shù)的采納范圍。

提升訓(xùn)練數(shù)據(jù)質(zhì)量或者引入外部數(shù)據(jù)

分布偏移:當(dāng)測(cè)試或用戶提問的分布與訓(xùn)練數(shù)據(jù)分布不同時(shí)(OOD),模型更易出錯(cuò)。垃圾進(jìn),垃圾出:訓(xùn)練數(shù)據(jù)本身包含的錯(cuò)誤、半真半假的信息和偏見,會(huì)被模型學(xué)習(xí)并復(fù)制。所以高質(zhì)量的訓(xùn)練數(shù)據(jù)對(duì)于模型是非常重要的,對(duì)于模型不了解的知識(shí),應(yīng)選擇類似 ??RAG?? 等外部數(shù)據(jù)源,補(bǔ)充一些事實(shí)的缺失問題。

參考

(1)??https://zhuanlan.zhihu.com/p/721611756??

(2)https://openai.com/zh-Hant-HK/index/why-language-models-hallucinate/

本文轉(zhuǎn)載自??周末程序猿??,作者:周末程序猿

已于2025-9-22 11:05:06修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
亚洲综合精品| 久久91在线| 自拍av一区二区三区| 99国产超薄丝袜足j在线观看 | 亚洲欧洲性图库| 鬼打鬼之黄金道士1992林正英| 欧美不卡视频在线观看| 精品国产一区二区三区四区| 欧美一级高清片在线观看| 国产特级淫片高清视频| 日本三级在线视频| 99精品久久只有精品| 国产主播精品在线| 99热只有这里有精品| 婷婷亚洲图片| 亚洲片av在线| 美女搡bbb又爽又猛又黄www| 久久久免费人体| 欧美午夜激情小视频| 九九久久九九久久| av一区在线观看| 99热这里都是精品| 91传媒在线免费观看| 天天爱天天做天天爽| 精品二区视频| 欧美成人精品不卡视频在线观看| 日韩av在线看免费观看| 懂色av一区二区| 69av一区二区三区| 日本免费观看网站| 中文在线最新版地址| 一个色妞综合视频在线观看| 老司机av福利| 无遮挡动作视频在线观看免费入口| 26uuu久久天堂性欧美| www 成人av com| 国产欧美第一页| 精品亚洲免费视频| 国产欧美日韩精品丝袜高跟鞋| 国产成人无码av| 亚洲美女一区| 97免费中文视频在线观看| 国产av无码专区亚洲av毛网站| 日韩在线视频精品| 中文字幕欧美国内| 天堂网av2018| 欧美成人激情| 久久精品一区中文字幕| 国产精品国产三级国产传播| av在线不卡顿| 综合欧美国产视频二区| 最新日韩免费视频| 91综合久久| 久久国产精品久久久久久| 黑人操日本美女| 天天揉久久久久亚洲精品| 精品激情国产视频| 日韩精品一区二区亚洲av性色 | 日本在线播放视频| 一本综合久久| 奇米影视亚洲狠狠色| 日本中文字幕在线| 日韩成人av影视| 国产欧美一区二区白浆黑人| 91午夜交换视频| 国产精品中文字幕日韩精品| 草莓视频一区| 香蕉视频免费在线看| 国产亚洲欧洲997久久综合| 视频一区不卡| 草莓福利社区在线| 亚洲成人免费av| 亚洲国产精品久久久久爰色欲| 在线观看欧美日韩电影| 欧美丝袜第三区| 两性午夜免费视频| 久久草在线视频| 亚洲一级免费视频| 欧美肥妇bbwbbw| 韩国亚洲精品| 国外成人性视频| 日本中文字幕第一页| 麻豆精品在线播放| 国产伦精品一区二区三区免费视频 | 日本va欧美va精品| 91欧美精品午夜性色福利在线| 国产欧美久久久精品免费| 波多野结衣中文一区| 日产精品一线二线三线芒果| a级影片在线观看| 红桃av永久久久| 亚洲人视频在线| 噜噜噜狠狠夜夜躁精品仙踪林| 亚洲人免费视频| 欧美成人三级在线观看| 老鸭窝亚洲一区二区三区| 国产在线播放91| 三级在线电影| 夜夜精品浪潮av一区二区三区| av免费网站观看| 91亚洲精品视频在线观看| 亚洲美女性视频| 国产盗摄x88av| 日本不卡中文字幕| 国产精品亚洲综合| 青青青青在线| 色综合天天综合网天天狠天天| 一本之道在线视频| 国产尤物久久久| 性欧美亚洲xxxx乳在线观看| 国产精品探花视频| 久久久蜜桃精品| 丰满少妇大力进入| 日韩有码欧美| 亚洲人午夜精品免费| 日本免费在线播放| 国产麻豆午夜三级精品| 日本成人三级电影网站| 99久久精品免费看国产小宝寻花| 欧美精品xxxxbbbb| 亚洲精品成人av久久| 国产欧美一区二区三区国产幕精品| 91麻豆国产语对白在线观看| 国产午夜精品一区理论片| 婷婷综合在线观看| 成人区人妻精品一区二| 欧美欧美全黄| 91丝袜美腿美女视频网站| 国产黄色在线| 色琪琪一区二区三区亚洲区| 国产乱了高清露脸对白| 国模一区二区三区| 91久久久亚洲精品| 黄色小网站在线观看| 欧美亚洲高清一区二区三区不卡| 捆绑凌虐一区二区三区| 一区二区自拍| 官网99热精品| av在线视屏| 亚洲大胆人体在线| 国产一级在线观看视频| 成人在线一区二区三区| 美脚丝袜脚交一区二区| 成人在线视频中文字幕| 国外成人在线视频| 天天干在线观看| 无码av中文一区二区三区桃花岛| 中文字幕乱视频| 亚洲人成人一区二区三区| 国产乱码精品一区二区三区日韩精品 | 欧美中文一区二区| 国产精品视频地址| 在线中文资源天堂| 欧美猛男超大videosgay| 中文字幕在线观看2018| 国产一区二区精品久久99| 中文字幕色呦呦| 日韩一级淫片| 久久久久久这里只有精品| 无码国产精品一区二区免费16| 婷婷综合另类小说色区| www.久久国产| 麻豆一区二区三区| 特级西西人体www高清大胆| 凹凸成人在线| 欧洲成人免费视频| 在线观看黄av| 日韩亚洲欧美一区| 1级黄色大片儿| 国产女人水真多18毛片18精品视频| 一区二区成人网| 亚洲激情中文| 国语精品免费视频| 韩国成人在线| 超碰精品一区二区三区乱码| 亚洲精品无遮挡| 日韩欧美在线视频日韩欧美在线视频 | 欧美韩日一区二区三区四区| 久久婷婷中文字幕| 136国产福利精品导航网址| 日本在线成人一区二区| 久久久国产精品入口麻豆| 高清视频欧美一级| 爱久久·www| 日韩欧美国产一二三区| 国产精品第5页| 亚洲天堂2014| yy1111111| 美腿丝袜亚洲色图| 全黄性性激高免费视频| 成人综合一区| 国产一区二区三区黄| 99久久er| 97国产在线视频| 麻豆av在线免费看| 国产视频亚洲精品| 国产成年妇视频| 在线视频你懂得一区| 国产一级av毛片| 欧美国产日韩亚洲一区| 在线精品视频播放| 久久成人精品无人区| 成年网站在线免费观看| 综合天堂av久久久久久久| 蜜桃欧美视频| 久久狠狠久久| 亚洲最大成人免费视频| 97精品国产综合久久久动漫日韩 | 99精品视频在线观看| 日韩视频在线观看一区二区三区| 久久亚洲国产精品一区二区| 国产一级做a爰片久久毛片男| 久久中文字幕av| 欧美日本韩国一区二区三区| 大陆精大陆国产国语精品| 国产日韩精品在线观看| 456成人影院在线观看| 欧美在线影院在线视频| 超清av在线| 欧美成年人视频网站| h视频在线免费| 亚洲精选在线观看| 秋霞av鲁丝片一区二区| 日韩精品一区二区在线| av网站在线免费看| 欧美亚一区二区| 午夜久久久久久久久久影院| 精品久久久久久| 精品在线视频免费观看| 亚洲最大成人综合| 久草网视频在线观看| 亚洲视频在线一区观看| 亚洲人与黑人屁股眼交| 日本一区二区成人| 91精品国自产在线| 国产欧美一区二区精品性| 受虐m奴xxx在线观看| 91免费观看视频在线| 亚洲精品乱码久久久久久久| 风间由美一区二区三区在线观看| 在线观看免费看片| 国产精品综合二区| 欧美一级大片免费看| 国产精品1区2区| 男人女人拔萝卜视频| 国产传媒一区在线| 久久久久久无码精品人妻一区二区| 国产在线不卡一区| 国产调教打屁股xxxx网站| 粉嫩嫩av羞羞动漫久久久| 99久久久无码国产精品性波多| 高清视频一区二区| yjizz视频| 91麻豆蜜桃一区二区三区| 日韩人妻一区二区三区| 337p粉嫩大胆色噜噜噜噜亚洲| 久久成人激情视频| 国产精品看片你懂得| 精品无码一区二区三区蜜臀| 玉足女爽爽91| www.av麻豆| 在线亚洲免费视频| 91久久精品无码一区二区| 日韩亚洲欧美成人一区| 亚洲精品一区二区三区蜜桃| 日韩精品高清在线观看| porn亚洲| 欧美成人免费一级人片100| 国产99re66在线视频| 97视频免费在线看| 欧美精品高清| 成人日韩在线电影| 成人在线视频你懂的| 日本一区二区三区免费看| 亚洲精品在线观看91| 国产日韩亚洲欧美在线| 亚洲一区一卡| 一区二区三区欧美精品| 成人av在线一区二区三区| 三上悠亚影音先锋| 亚洲精品一二三| 好看的av在线| 91精品婷婷国产综合久久性色| 欧美一级特黄aaaaaa| 在线观看精品自拍私拍| 日本在线视频网址| 国产精品福利在线观看| 视频一区日韩精品| 欧美中日韩一区二区三区| 91精品秘密在线观看| 久久免费视频3| 九色porny丨国产精品| 欧美双性人妖o0| 中文字幕中文在线不卡住| 精品成人免费视频| 欧美精品在欧美一区二区少妇| 污视频在线免费| xxx成人少妇69| 欧美美女日韩| aa成人免费视频| 91麻豆精品国产91久久久平台| 欧美综合在线播放| 国内精品伊人久久久久影院对白| 久久无码人妻精品一区二区三区| 亚洲日本在线视频观看| 欧美一区二区三区网站| 亚洲成人xxx| 麻豆影视在线观看_| 国产成人一区三区| 免费看久久久| 麻豆传媒网站在线观看| 免费xxxx性欧美18vr| 久久久久久久久久久国产精品| 亚洲精品高清视频在线观看| 波多野结衣绝顶大高潮| 日韩电影中文 亚洲精品乱码| huan性巨大欧美| 国产区亚洲区欧美区| 国产99精品| 伊人成色综合网| 丁香激情综合五月| 欧美日韩精品在线观看视频| 欧美精品 国产精品| 在线免费观看黄| 国产精品免费一区豆花| 少妇一区二区视频| 欧美成人xxxxx| 成人av网址在线观看| 久久久久久欧美精品se一二三四| 8x福利精品第一导航| 欧美三级电影一区二区三区| 国产脚交av在线一区二区| 伊人久久综合影院| 九色在线视频观看| 不卡视频一二三四| 日韩毛片在线视频| 亚洲精品美女免费| 久草在线资源站手机版| 精品免费二区三区三区高中清不卡| 国产在线日韩| 欧美日韩人妻精品一区在线| 午夜一区二区三区在线观看| 亚洲精品一级片| 国语自产在线不卡| 极品束缚调教一区二区网站 | 久热精品在线| 国产精品密蕾丝袜| 欧美亚洲国产怡红院影院| 91网在线播放| 91精品视频大全| 欧美在线首页| 蜜臀av粉嫩av懂色av| 污片在线观看一区二区| 香港一级纯黄大片| 国产a∨精品一区二区三区不卡| 精品国产一区二区三区香蕉沈先生| 亚洲免费看av| 综合久久一区二区三区| 亚洲免费一级片| 欧美在线不卡区| 日韩精品中文字幕第1页| 久久艹这里只有精品| 亚洲综合成人在线视频| 四虎精品在永久在线观看 | 糖心vlog精品一区二区| 日日狠狠久久偷偷四色综合免费| 国产精品亚洲欧美日韩一区在线| 欧美美女黄色网| 99久久精品久久久久久清纯| 中文字幕黄色片| 不卡av日日日| 牛牛精品成人免费视频| 少妇黄色一级片| 亚洲精品日日夜夜| 色视频在线观看| 成人国产亚洲精品a区天堂华泰| 国产精品激情| 日韩一级av毛片| 日韩精品一区二| 久久sese| 免费观看国产视频在线| 99久久久久久| 一区二区三区精彩视频| 久久久午夜视频| 色综合蜜月久久综合网| 无码人妻一区二区三区在线| 在线日韩一区二区| 国产黄色大片在线观看| 日韩高清国产精品| 国产成a人亚洲精品| 成人小视频在线播放| 欧美人与性动交| 精品理论电影在线| jjzz黄色片| 欧美日韩成人激情| 日本三级一区| 肉大捧一出免费观看网站在线播放| 2欧美一区二区三区在线观看视频| 国产男男gay体育生白袜| 日产精品99久久久久久|