精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何檢測并盡量減少AI模型中的幻覺?

譯文 精選
人工智能
一些國家已開始起草有關(guān)AI模型的法規(guī),以提供使用和適用性方面的框架。不妨弄清楚神經(jīng)網(wǎng)絡(luò)為何、如何開始產(chǎn)生幻覺,以及如何盡量避免這個(gè)問題。

譯者 | 布加迪

審校 | 重樓

我們幾乎每天都會(huì)聽到關(guān)于更廣泛地成功實(shí)施AI工具的故事。隨著ChatGPT、Midjourney及其他模型向公眾開放,越來越多的人開始在日常生活中依賴AI。

雖然機(jī)器學(xué)習(xí)算法很明顯能夠滿足更具挑戰(zhàn)性的需求,但它們還不夠完美。AI頻繁出現(xiàn)的幻覺問題阻礙它們成為人類最可靠的替代者。雖然對(duì)于普通用戶來說,AI錯(cuò)誤只是一笑了之的小故障,但對(duì)于業(yè)務(wù)流程來說,這種不可預(yù)測性可能導(dǎo)致各種后果,輕則失去客戶信任,重則官司纏身。

一些國家已開始起草有關(guān)AI模型的法規(guī),以提供使用和適用性方面的框架。不妨弄清楚神經(jīng)網(wǎng)絡(luò)為何、如何開始產(chǎn)生幻覺,以及如何盡量避免這個(gè)問題。

什么是AI幻覺?

雖然有時(shí)我們無法確定AI錯(cuò)誤的原因,但幻覺通常來源于生成式系統(tǒng)創(chuàng)建文本的方式。AI在響應(yīng)用戶的查詢時(shí),根據(jù)一系列之前的數(shù)據(jù)給出一組可能的單詞。一些單詞跟在其他單詞之后的可能性不是確保最后一句話準(zhǔn)確的可靠方法。AI可以拼湊出聽起來似乎合理但不一定準(zhǔn)確的術(shù)語——在人類看來,這些術(shù)語可能看起來完全是無稽之談。一個(gè)例子是向ChatGPT詢問哪些國家有匹配和不匹配的結(jié)算市場。雖然它能夠提供“連續(xù)凈結(jié)算”(CNS)作為匹配結(jié)算系統(tǒng)的例子,但我對(duì)系統(tǒng)所在的國家(本例中是美國)感興趣,提示在這里生成了錯(cuò)誤的輸出。

然而,有時(shí)檢測AI幻覺可能來得比較棘手。雖然一些錯(cuò)誤很明顯,但其他錯(cuò)誤比較微妙,可能不會(huì)被人注意到,當(dāng)輸出是自動(dòng)處理的或者由在該領(lǐng)域?qū)I(yè)知識(shí)有限的人處理時(shí)尤為如此。未被發(fā)現(xiàn)的AI問題可能會(huì)導(dǎo)致不可預(yù)見、不想要的后果。在擁有準(zhǔn)確可靠信息至關(guān)重要的領(lǐng)域尤其如此。此外,一個(gè)提示越專門化,AI模型的準(zhǔn)確性通常可能因缺乏它可能參閱的支持性補(bǔ)充材料而有所不同。上面的CNS例子就是一個(gè)典例;我無法通過谷歌搜索找到國家列表,希望ChatGPT可以提供一份整合的列表,但后者面臨類似的障礙。

以下是因AI幻覺而出現(xiàn)的幾類常見問題:

  • 不準(zhǔn)確的決策:AI幻覺可能導(dǎo)致不正確的決策和診斷,特別是在醫(yī)療保健或信息安全等準(zhǔn)確度至關(guān)重要的領(lǐng)域,對(duì)個(gè)人和企業(yè)都是有害的。
  • 歧視性和冒犯性的結(jié)果:幻覺可能導(dǎo)致生成歧視性或冒犯性的結(jié)果,這可能會(huì)損害組織的聲譽(yù),并導(dǎo)致道德和法律問題。
  • 不可靠的分析:如果AI生成不準(zhǔn)確的數(shù)據(jù),它可能導(dǎo)致不可靠的分析結(jié)果。組織可能會(huì)根據(jù)不正確的信息做出決策,結(jié)果可能付出高昂的代價(jià)。有時(shí)數(shù)據(jù)可能過時(shí),一個(gè)典例就是ChatGPT的免費(fèi)版本,它只保存到2022年的數(shù)據(jù),因此從中收集的數(shù)據(jù)可能不可靠。
  • 倫理和法律問題:由于幻覺,AI模型可能會(huì)泄露敏感信息或生成冒犯性內(nèi)容,從而導(dǎo)致法律問題。
  • 錯(cuò)誤信息:生成虛假信息會(huì)給公司和最終用戶帶來各種問題,比如破壞信任、傷害或負(fù)面影響公眾輿論。

為什么LLM會(huì)產(chǎn)生幻覺?

AI幻覺是一個(gè)復(fù)雜的問題,用戶和開發(fā)人員都不完全清楚其原因。以下是可能導(dǎo)致或促成幻覺的幾個(gè)關(guān)鍵因素:

  • 訓(xùn)練數(shù)據(jù)不完整或有偏差。如果訓(xùn)練數(shù)據(jù)集有限及/或提示未全覆蓋可能的場景,模型可能無法充分響應(yīng)查詢。如果用于訓(xùn)練AI的數(shù)據(jù)含有偏差,模型輸出也會(huì)有這樣的偏差。
  • 過度訓(xùn)練和缺乏上下文。使用特定數(shù)據(jù)過度訓(xùn)練的模型可能會(huì)喪失對(duì)新的、不可預(yù)見的情形做出適當(dāng)響應(yīng)的能力,尤其是在缺乏上下文信息的情況下。建議將數(shù)據(jù)集分為三種類型:訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測試數(shù)據(jù),這種劃分確保了模型面對(duì)測試模型和樣本數(shù)據(jù)之外的數(shù)據(jù)都有上佳的表現(xiàn)。
  • 誤解或不適當(dāng)?shù)哪P蛥?shù)大小。模型參數(shù)大小不當(dāng)可能會(huì)導(dǎo)致不可預(yù)測的AI行為,特別是在復(fù)雜查詢或不尋常情形下。
  • 不清楚的提示。用戶使用時(shí),模棱兩可或過于籠統(tǒng)的用戶查詢可能導(dǎo)致不可預(yù)測或不相關(guān)的響應(yīng)。

如何避免幻覺?

重要的是要記住,LLM就像“黑盒子”——就連數(shù)據(jù)科學(xué)家也無法完全遵循生成過程并預(yù)測輸出。這就是為什么無法百分之百保護(hù)貴公司不受AI幻覺的影響。目前,使用AI模型的公司需要專注于預(yù)防、檢測和盡量減少AI幻覺。以下是維護(hù)機(jī)器學(xué)習(xí)模型的幾個(gè)技巧:

  • 徹底清理和準(zhǔn)備用于訓(xùn)練和調(diào)整AI模型的數(shù)據(jù)。這不僅需要?jiǎng)h除不相關(guān)或錯(cuò)誤的信息,還需要確保數(shù)據(jù)的多樣性,并代表不同的觀點(diǎn)。
  • 注意AI模型的大小和復(fù)雜性。許多公司都在竭力開發(fā)更龐大、更復(fù)雜的AI模型,以提升它們的功能。然而,這也可能導(dǎo)致模型過度飽和,甚至對(duì)開發(fā)人員自己來說,解讀和解釋模型工作也是一個(gè)挑戰(zhàn)。

為了從一開始就避免這些不確定性和混亂,通過強(qiáng)調(diào)AI模型的可解讀性和可解釋性來規(guī)劃模型的開發(fā)很重要。這意味著記錄模型構(gòu)建過程,為關(guān)鍵利益相關(guān)者確保透明度,并選擇這樣一種架構(gòu):盡管數(shù)據(jù)量和用戶需求不斷增長,仍易于解讀和解釋模型性能。這也將有助于滿足監(jiān)管要求,因?yàn)檫@個(gè)領(lǐng)域受到政府的嚴(yán)格審查。

  • 進(jìn)行徹底的測試。AI模型測試不僅應(yīng)該包括標(biāo)準(zhǔn)查詢和處理常見輸入格式,還應(yīng)該分析其在極端條件下和處理復(fù)雜查詢時(shí)的行為。測試AI對(duì)各種輸入的響應(yīng)可以預(yù)測模型在各種情形下的表現(xiàn)。這可能有助于在用戶遇到不準(zhǔn)確的結(jié)果之前改進(jìn)數(shù)據(jù)和模型架構(gòu)。
  • 確保人參與驗(yàn)證過程。這也許是識(shí)別可能不被自動(dòng)檢查注意的細(xì)微差別的關(guān)鍵。從事這項(xiàng)任務(wù)的人員應(yīng)該在AI和技術(shù)、客戶服務(wù)和合規(guī)等方面具備相應(yīng)的技能和經(jīng)驗(yàn)。
  • 另一個(gè)關(guān)鍵因素是定期從最終用戶那里收集反饋,特別是在模型已經(jīng)實(shí)施、正在積極使用之后。AI模型的用戶可能會(huì)提供人工智能幻覺及其他偏差方面的寶貴見解。為了使這個(gè)過程有效,重要的是建立方便的、易于訪問的反饋渠道。
  • 定期監(jiān)測和更新AI模型以保持其有效性很重要。應(yīng)該基于用戶反饋、團(tuán)隊(duì)研究、當(dāng)前行業(yè)趨勢(shì)以及來自質(zhì)保和監(jiān)測工具的性能數(shù)據(jù)進(jìn)行這番改進(jìn)。持續(xù)監(jiān)測模型性能并根據(jù)收集到的分析信息進(jìn)行主動(dòng)改進(jìn),可以大大降低產(chǎn)生幻覺的風(fēng)險(xiǎn)。

如果你不使用AI模型來處理敏感信息,可以嘗試運(yùn)用搜索增強(qiáng)生成來減少幻覺的風(fēng)險(xiǎn)。AI將不再單單依賴現(xiàn)有的訓(xùn)練數(shù)據(jù)和來自用戶的上下文,而是將在網(wǎng)上搜索相關(guān)信息。然而,這項(xiàng)技術(shù)還沒有顯示出非常可靠的結(jié)果。未經(jīng)過濾的搜索結(jié)果有時(shí)就像AI模型幻覺一樣不真實(shí)。

幻覺總是不好的嗎?

在AI系統(tǒng)中,幻覺和創(chuàng)造力之間的關(guān)系似乎類似人類想象力的過程。人類常常通過讓自己的思想游離于現(xiàn)實(shí)之外來構(gòu)思出創(chuàng)意。

生成最具創(chuàng)新性和獨(dú)創(chuàng)性結(jié)果的AI模型也往往有時(shí)生成并不基于事實(shí)真相的內(nèi)容。一些專家認(rèn)為,完全擺脫幻覺可能會(huì)損害創(chuàng)意內(nèi)容的創(chuàng)作。

然而,重要的是要明白一點(diǎn):這種類型的輸出常常缺乏事實(shí)基礎(chǔ)和邏輯思維,因而它們不適合基于事實(shí)的任務(wù)。

原文標(biāo)題:How to Detect and Minimise Hallucinations in AI Models,作者:Parth Sonara

責(zé)任編輯:姜華 來源: 51CTO內(nèi)容精選
相關(guān)推薦

2025-05-08 06:00:00

AI幻覺AI人工智能

2024-01-09 14:05:15

大型語言模型RAG向量數(shù)據(jù)庫

2023-09-14 12:35:59

2024-04-30 11:44:24

2023-07-18 18:44:35

光纖網(wǎng)絡(luò)綜合布線

2023-12-10 15:15:18

開源模型工具

2025-06-13 08:06:41

2020-09-29 13:00:55

Windows 10Windows操作系統(tǒng)

2023-11-16 16:37:02

2024-12-31 08:03:12

2025-10-27 13:18:56

2023-09-27 10:23:06

人工智能語言模型

2023-05-24 15:15:55

2024-09-13 12:31:21

谷歌DataGemmaAI

2025-11-10 09:00:00

AI大模型幻覺

2024-01-04 16:41:29

大型語言模型自然語言處理

2025-06-27 08:40:00

模型推理AI

2025-05-26 01:45:00

LLMAI信任

2025-07-22 07:00:00

AIGenAI人工智能

2025-04-28 12:28:27

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

免费污视频在线一区| 日本精品专区| 亚洲激情黄色| 国产亚洲a∨片在线观看| 欧美日韩一区二区三区69堂| www久久日com| 99精品一区二区| 国产精品网红直播| 成年人免费看毛片| 国产精品成人a在线观看| 亚洲国产精品999| 91女神在线观看| 国产在线精彩视频| 亚洲天堂2016| 日本一区二区三区四区在线观看 | 超碰激情在线| 亚洲欧洲av一区二区三区久久| 国产精品大全| 91一区二区视频| 每日更新成人在线视频| 欧美极品欧美精品欧美视频| www久久久久久久| 国产精品玖玖玖在线资源| 欧美三级日韩三级| 99热成人精品热久久66| 日本中文字幕中出在线| 中文字幕av一区二区三区免费看| 国产伦精品一区二区三| 91av久久久| 久久久xxx| 97激碰免费视频| 久久久综合久久| 亚洲成人一区| 久久久国产一区| 欧美亚洲色综久久精品国产| 亚洲三级精品| 日韩成人在线网站| 丰满岳乱妇一区二区 | 青娱乐精品视频在线| 91国内精品久久| 国产亚洲欧美精品久久久www | 久久久一区二区| 国产精品手机在线| 国产91绿帽单男绿奴| 国产麻豆精品在线观看| 国产在线视频欧美| 中文字幕精品一区二区精| 久久婷婷久久| 日韩av手机在线看| 欧美a视频在线观看| 亚洲在线网站| 人人爽久久涩噜噜噜网站| 日韩欧美亚洲一区二区三区| 亚洲国产精品第一区二区三区| 欧美人与性动交a欧美精品| 欧美色图亚洲视频| 91av精品| 欧美国产第一页| 久久精品国产亚洲AV无码麻豆 | 亚洲国产一二三区| 成+人+亚洲+综合天堂| 国产伦精品一区二区三区高清版| 亚洲精品成人电影| 成人动漫av在线| 精品国产91亚洲一区二区三区www 精品国产_亚洲人成在线 | 91视频88av| 性少妇videosexfreexxx片| 国产成人亚洲综合a∨婷婷图片| 成人女保姆的销魂服务| 精品人妻无码一区二区色欲产成人| 国产美女久久久久| 国产精品自拍首页| 全部免费毛片在线播放网站| 国产婷婷色一区二区三区在线| 日韩欧美第二区在线观看| 欧美69xxxx| 亚洲国产精品一区二区久久| 无码人妻丰满熟妇区毛片18| 久久久人成影片一区二区三区在哪下载 | 日韩美一区二区| 麻豆久久久久久| 不卡日韩av| 欧美午夜黄色| 国产精品天干天干在观线| 免费观看黄色的网站| 好久没做在线观看| 日本高清不卡aⅴ免费网站| 一女二男3p波多野结衣| 日韩一二三区在线观看| 精品亚洲一区二区| 91麻豆精品久久毛片一级| 欧美片第1页综合| 日韩av电影免费观看高清| 一级黄色免费看| 成人福利视频在线看| 视频一区视频二区视频三区高 | 性欧美长视频免费观看不卡| 波多野结衣黄色网址| 国产九九视频一区二区三区| 久久99蜜桃综合影院免费观看| 992tv免费直播在线观看| 亚洲福利视频一区| 99热一区二区| 偷拍精品福利视频导航| 久久九九有精品国产23| 国产精品久久久久久久久久久久久久久久久 | 国产精品免费看久久久香蕉| 亚洲a视频在线| 欧美国产一区二区| a级黄色一级片| 高清不卡一区| 一本一本久久a久久精品牛牛影视| 1024手机在线视频| 男男成人高潮片免费网站| 精品一区二区不卡| av网址在线| 在线中文字幕不卡| 亚洲男女在线观看| 欧美成人午夜| 91精品久久久久久久久久另类| 肉丝一区二区| 一二三区精品视频| 交换做爰国语对白| 欧美成免费一区二区视频| 欧美一级视频在线观看| 丰满人妻一区二区三区四区53| 亚洲国产成人私人影院tom| 欧美大片一区二区三区| 精品二区视频| 亚洲人成在线观看一区二区| 国产中文字幕二区| 欧美欧美在线| 久久亚洲精品中文字幕冲田杏梨| 精品一区二区无码| 久久久久青草大香线综合精品| 日本人体一区二区| 亚洲图色一区二区三区| 精品国产一区二区三区四区在线观看 | 久久免费精品视频在这里| 日本中文字幕成人| 亚洲人午夜射精精品日韩| 亚洲午夜免费视频| www.四虎精品| 在线观看不卡| 国产日韩一区欧美| 久久电影网站| 亚洲精品国产电影| 日韩成人免费观看| av午夜精品一区二区三区| 久久久亚洲国产精品| 超碰成人免费| 91精品国产高清久久久久久久久| 三级在线观看网站| 欧美日韩国产一区中文午夜| 在线免费观看污视频| 午夜在线观看免费一区| 久久久久久久久久久久久9999| 欧美办公室脚交xxxx| 日韩av网址在线观看| 免费黄色网址在线| 日本一区二区在线不卡| 欧美美女性视频| 中文精品久久| 国产精品日韩欧美一区二区| 成av人片在线观看www| 国产视频欧美视频| 中文字幕av第一页| 日韩理论片网站| 性一交一黄一片| 9久re热视频在线精品| 欧美不卡福利| 全球中文成人在线| 久久99精品久久久久久琪琪 | 成人av午夜影院| 国产免费一区二区三区视频| 激情综合网站| 亚洲精品日韩av| av丝袜在线| 亚洲视频网站在线观看| 91免费视频播放| 亚洲一区二区三区三| 女人被狂躁c到高潮| 美女一区二区视频| 17c丨国产丨精品视频| 青青草久久爱| 成人欧美一区二区三区黑人| av福利在线导航| 中文字幕日韩综合av| 成人爽a毛片一区二区| 色综合网色综合| www日韩在线| 99久久国产综合精品色伊 | 成人黄色视屏网站| 欧美日韩福利电影| 九色视频网站在线观看| 欧美一区二区成人| 日韩综合在线观看| 尤物视频一区二区| 欧美福利第一页| 大桥未久av一区二区三区中文| 日韩视频第二页| 中文字幕午夜精品一区二区三区| 欧美日韩无遮挡| 999在线精品| 国产日韩视频在线观看| www.综合| 九九热在线精品视频| 川上优的av在线一区二区| 欧美成人高清电影在线| 97人妻精品视频一区| 亚洲成人福利片| 中国一级片在线观看| 久久免费午夜影院| 中国xxxx性xxxx产国| 国产一区二区成人久久免费影院 | aaa国产一区| 国产精品熟女一区二区不卡| 日本欧美在线看| 色欲av无码一区二区人妻| 午夜国产一区| 大桥未久一区二区| 久久精品播放| 日本一区二区三区四区高清视频| 黄色网一区二区| 99中文字幕| 精品视频一区二区三区| 国产欧美日韩高清| 精品视频在线一区二区在线| 青草成人免费视频| 女厕盗摄一区二区三区| 久久久日本电影| 久久亚洲导航| 九九精品在线观看| av文字幕在线观看| 久久精品视频播放| 免费大片在线观看www| 中文字幕日韩精品有码视频| 国产51人人成人人人人爽色哟哟 | 国产精品免费视频一区二区| 国产精品白丝久久av网站| 国产精品一区二区性色av| 中文字幕av一区二区三区佐山爱| 国产91ⅴ在线精品免费观看| 午夜影院在线观看国产主播| 午夜精品一区二区三区av| 黄页网站大全在线免费观看| 欧美—级a级欧美特级ar全黄| 欧美四级在线| 欧美精品福利视频| а√天堂8资源中文在线| 97在线日本国产| 正在播放日韩精品| 国产91在线播放九色快色| 神马电影网我不卡| 国产精品久久久久久久电影| 成人在线视频观看| 成人免费黄色网| 6080成人| 久久久影院一区二区三区| 国产一区二区三区探花| 亚洲美女搞黄| 91精品二区| 国产午夜福利100集发布| 美女精品在线| 一区二区三区欧美精品| 国产成人在线视频网站| 朝桐光av一区二区三区| 国产嫩草影院久久久久| 波多野结衣在线网址| 亚洲国产美女搞黄色| 97久久久久久久| 欧美偷拍一区二区| xxxwww在线观看| 日韩va亚洲va欧洲va国产| 福利片在线看| 久久99国产精品自在自在app | 欧美这里有精品| 96亚洲精品久久久蜜桃| 欧美va亚洲va| 国产女人在线视频| 久久91亚洲精品中文字幕| 性欧美18~19sex高清播放| 国产精品一区二区三区在线播放| 91嫩草精品| 日韩精品一区二区三区外面 | 黄色动漫网站入口| 美女脱光内衣内裤视频久久网站| 麻豆传媒在线看| 久久久精品欧美丰满| 男人操女人的视频网站| 精品福利视频导航| 一区二区三区免费观看视频| 欧美精品一区二区三| 91露出在线| 韩国精品美女www爽爽爽视频| 欧美色片在线观看| 国产精品一区二区免费| 日韩欧美午夜| 成人免费观看毛片| 国产aⅴ综合色| 阿v天堂2014| 欧美日韩亚洲国产一区| jlzzjlzzjlzz亚洲人| 国产一区二区三区视频| 福利网站在线观看| 亚洲va国产va天堂va久久| 亚洲小说图片视频| 日韩在线观看a| 久久成人免费网站| 成人性生交大免费看| 亚洲影视在线播放| 国产精品国产av| 在线成人激情黄色| 一区二区三区短视频| 成人三级视频在线观看一区二区| 日韩激情在线| 精品中文字幕av| 粉嫩高潮美女一区二区三区| 激情高潮到大叫狂喷水| 色噜噜狠狠成人中文综合| 黄色成人一级片| 欧美日韩成人免费| 国产精品欧美一区二区三区不卡 | 国产三级在线观看完整版| 精品露脸国产偷人在视频| 亚洲黄色在线观看视频| 美女啪啪无遮挡免费久久网站| www.国产精品| 天堂av一区二区| 久久午夜影视| caopeng视频| 一本大道综合伊人精品热热 | 久久久久久久久久久视频| 成人自拍视频在线观看| 加勒比av在线播放| 日韩亚洲国产中文字幕欧美| av大大超碰在线| 亚洲资源在线看| 欧美 日韩 国产精品免费观看| 视频区 图片区 小说区| 亚洲欧美中日韩| 国产熟女一区二区丰满| 久久夜精品香蕉| 亚洲免费一区三区| 黄色三级中文字幕| 成人一二三区视频| 日韩免费av片| 日韩成人在线免费观看| sese综合| 日韩久久在线| 精久久久久久久久久久| 手机在线免费看片| 日韩欧美一级精品久久| 男女羞羞视频在线观看| 国产精品手机在线| 欧美一级专区| 秋霞网一区二区三区| 欧美日韩国产精品成人| а√资源新版在线天堂| 99久热re在线精品视频| 亚洲午夜伦理| 精品夜夜澡人妻无码av| 色94色欧美sute亚洲线路一久| 岛国在线视频| 成人免费网站在线观看| 欧美1区视频| 51调教丨国产调教视频| 欧美在线不卡一区| 成人三级网址| 精品九九九九| 奇米色777欧美一区二区| 亚洲天堂一级片| 亚洲国产成人av在线| 欧美三区四区| 国产91视频一区| 久久午夜老司机| 国产精品亚洲欧美在线播放| 久久久伊人日本| 欧美日韩中文一区二区| 免费在线观看日韩av| 狠狠综合久久av一区二区小说| 日本免费在线观看| 国产欧美日韩一区二区三区| 日韩av网站在线观看| 青青青在线视频| 亚洲天堂免费观看| 亚洲经典视频| 一本久道综合色婷婷五月| 一区二区三区四区亚洲| 欧美男男激情freegay| 91在线观看免费观看| 乱码第一页成人| 欧美一区免费观看| 亚洲欧美国产va在线影院| 人人精品久久| 欧美日韩激情视频在线观看| 综合久久给合久久狠狠狠97色 | 国产九九九九九| 国产精品久久久久三级| 五月婷婷综合久久|