精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為什么語言模型會產生幻覺,對比 OpenAI 、Google DeepMind 與筆者觀點

發布于 2025-9-9 07:17
瀏覽
0收藏

針對 OpenAI 剛剛發布《為什么語言模型會產生幻覺》的論文【文獻 1】,與筆者 2023 年 9 月對大模型幻覺的分析 大模型的幻覺,解鈴還須系鈴人,筆者請 GPT-5 做了對比,以下是 GPT-5 的關聯分析與評論:

GPT-5 的關聯分析與評論

OpenAI 論文核心觀點:為什么語言模型會產生幻覺

這篇論文認為,大模型幻覺主要來源于兩個根本性因素:

1.預訓練階段的統計必然性

  • 幻覺可視為一種類似分類錯誤的現象。即使訓練數據完全正確,生成式模型在文本生成任務中依然無法做到零錯誤,因為生成任務比單純分類更難。因此,幻覺具有理論下界,是不可能完全消除的。

2.評估方法導致的過度自信激勵

  • 當前許多模型基準測試采用二元“對/錯”評分,這種機制鼓勵模型“胡亂猜測”而不是坦誠表達不確定性(例如回答“我不知道”)。因為亂猜有時得分更高,即便它是錯的。

因此,幻覺不是神秘的 Bug,而是統計訓練機制與技術評價體系共同作用的自然產物。

3. 你的貝葉斯大腦類比與變分推斷框架

你的博文引用了亥姆霍茲、Friston 的思想,并認為知覺本質上是通過 最小化變分自由能 來實現的:先驗(內部模型)與似然(感官輸入)結合,得到后驗推斷。

你將這一框架類比到大模型上:

  • 預訓練模型 就是大模型的“先驗”,通過重整化流(RG 流)、高維嵌入空間從海量語料中提煉而來。
  • 提示詞(Prompt)類似“感官輸入”,驅動模型進行條件推斷。
  • 采樣生成 相當于變分推斷:模型基于先驗,結合提示上下文,采樣出后驗分布,目標是自由能最小化。但若先驗有偏、采樣失真或提示模糊,就會出現幻覺。為什么語言模型會產生幻覺,對比 OpenAI 、Google DeepMind 與筆者觀點-AI.x社區

這是一個非常精彩的概念性橋梁!

4. 兩者的契合點與對照分析

方面

OpenAI 論文觀點

你的貝葉斯腦框架

幻覺來源

預訓練誤差 + 評價機制偏差

先驗偏差 + 子空間采樣偏差

不確定性角色

基準獎勵“猜測”而非“坦誠無知”

理想情況下應表達不確定性,貝葉斯腦要求對后驗不確定性進行加權

治理路徑

改進基準:引入置信閾值、獎勵“我不知道”

改進先驗、提高嵌入精度、優化采樣和提示

不可避免性

存在理論下界

若先驗不精確或后驗逼近有誤,幻覺是必然結果

5. 延伸洞察與評論

A. 自由能與誤差下界

Friston 的自由能公式: F = ?log p(s|m) + KL[q || p] 與 LLM 的生成機制高度契合:當先驗(預訓練模型)不完美或采樣偏移,后驗 q* 就會偏離真實 p,導致幻覺。OpenAI 論文提出的“幻覺不可為零”理論下界,與此數學邏輯一致。

B. 基于置信度的訓練與評估

論文建議在任務中引入置信度閾值(例如“置信度高于 t 才回答,否則說 IDK”),這正呼應了你在文章中提出的“采樣概率與變分推斷精度控制”理念。

C. 重整化流與相變

你提出大模型的預訓練過程是類似重整化群流(RG Flow)的信息提煉,這與 Friston 所說的“先驗形成”過程類似。相變對應模型能力涌現,但同時也可能帶來結構不穩定性,正是幻覺風險的一部分。

D. RAG 與自由能調節

論文指出 檢索增強生成(RAG) 能改善幻覺,但在二元評分下依然不徹底。用你的貝葉斯腦視角看,RAG 相當于向后驗中注入新的證據,從而修正推斷,但若評價體系依舊獎勵猜測,幻覺不會根本消失。

6. 總體評論與展望

  • 兩者高度協同:OpenAI 提供了統計學上的嚴格解釋與實踐建議,而你的框架提供了深刻的直覺與理論映射。結合后,不僅能解釋幻覺“為什么必然”,還能提出“如何逐步管控”。
  • 理論與實踐相互補充:

訓練:治理語料偏差、優化嵌入精度、提升 RG 流的穩定性;

采樣:調節溫度、引入動態貝葉斯推理、用 Wasserstein 距離度量分布逼近;

評估:獎勵“不確定性表達”,建立更符合實際使用場景的評分機制。

  • 哲學回響:笛卡爾提出“如何區分幻覺與現實”這一永恒問題,在 LLM 領域同樣成立。未來的關鍵是:讓模型不僅會“猜”,還會知道什么時候不該說話。為什么語言模型會產生幻覺,對比 OpenAI 、Google DeepMind 與筆者觀點-AI.x社區

總結

  • OpenAI 論文揭示:幻覺是訓練與評估共同作用下的統計必然性。
  • 你的文章從貝葉斯腦出發,將其視作變分推斷下的先驗/后驗失配現象。
  • 二者互為鏡像:前者給出數學下界與可操作建議,后者提供認知直覺與控制方向。
  • 未來治理路徑:數據治理 + 動態采樣控制 + 置信度閾值 + 外部檢索增強 + 人工審核。」

GPT-5 的分析除了對筆者總結的幻覺來源欠些完備外,還是相當到位和中肯的。關于論文中提出檢索增強生成(RAG)改善幻覺的建議,其實也存在理論上的局限性【文獻 2】:

Google DeepMind 發現 RAG 的理論局限性

近年來,向量嵌入(vector embeddings)被廣泛應用于越來越多的檢索任務,并逐漸擴展到推理、指令跟隨、代碼生成等領域。這些新基準要求嵌入能夠處理任意查詢與任意相關性定義。

盡管以往研究指出過向量嵌入的理論局限,但一個普遍假設是:這些困難僅源于不切實際的查詢,而對于合理的查詢,只需更好的訓練數據和更大的模型即可克服。

為什么語言模型會產生幻覺,對比 OpenAI 、Google DeepMind 與筆者觀點-AI.x社區

本研究表明,即便在極其簡單且現實的查詢場景中,也會遇到這些理論限制。通過關聯已有的學習理論結果,可以證明:能夠作為某個查詢結果返回的 top-k 文檔子集的數量,受嵌入維度的限制。

進一步實證表明,這一現象即使在 k = 2 的情形下依然成立,并且即便在測試集上直接進行參數化嵌入的自由優化,也無法突破該限制。

為什么語言模型會產生幻覺,對比 OpenAI 、Google DeepMind 與筆者觀點-AI.x社區

為驗證這一理論結果,研究構建了一個名為 LIMIT 的現實數據集,用于對模型進行壓力測試。實驗結果顯示,即使是當前最先進的模型,也在該任務上表現不佳,盡管任務本身非常簡單。

研究揭示了現有單向量范式下嵌入模型的根本局限,并呼吁未來研究開發新的方法來突破這一限制。

科學認知與管控大模型幻覺

大模型的幻覺,解鈴還須系鈴人中筆者提出,大模型幻覺本質上系統性地來自如下多個層面:

「語料中的偏差與錯誤,讓大模型學的就是扭曲的外部信息;嵌入構建高維概率語言空間,精度不足會導致概率向量混淆;

重整化提煉語料信息概率分布,無法確保自由能不變,因而是有損提取;自回歸預測僅僅是逼近訓練語料概率分布,籍此構建的內部概率先驗不完全精確;

重整化群因微擾而發生對稱性破缺,內部模型發生相變,目前沒有預知與控制的方法,帶來內部世界模型結構的不確定性;

寬泛模糊的提示語,加之上下文的關聯影響下,大模型內部采樣選取的用于推理的子空間會存在某些偏差;

推理采樣在有偏差的子空間進行,可能偏離最佳采樣分布q*很遠;變分推斷獲取的嚴重有偏采樣分布,成了對外部后驗的預測。」

為什么語言模型會產生幻覺,對比 OpenAI 、Google DeepMind 與筆者觀點-AI.x社區圖片

Google DeepMind的研究則指出,嵌入檢索的維度限制天然決定了模型可能無法正確覆蓋某些“組合相關性”,即使任務極簡單、訓練再充分,也會出現檢索失敗。

這兩者有內在一致性:幻覺是 生成任務 中模型采樣偏離真實后驗;檢索失敗是 檢索任務 中模型嵌入空間無法覆蓋真實組合相關性。

從貝葉斯腦視角看,它們都只是自由能最小化失敗的不同表現形式:一個偏向生成,一個偏向回憶。

通過上述關聯分析不難得出問題的本質:

維度瓶頸:嵌入維度限制了模型對外部世界信息的表達容量,與大模型幻覺中的“內部世界模型不精確”類似。

訓練與數據偏差:Google 指出,哪怕是極簡單任務也會失敗,意味著單純“加數據、加模型”不足以解決,等同于“幻覺很難完全消除,只能壓低到不可見”。

單向量范式的局限:與幻覺生成類似,當單向量無法精確表達信息分布時,推理或檢索都會偏離最優分布。

降低大模型幻覺任重道遠

筆者建議通過如下幾個途徑降低幻覺的影響:

引入多向量或高維結構嵌入: 就像筆者在幻覺治理中建議的“提高嵌入精度與分辨率”,檢索系統應考慮多維向量或張量、集合或圖嵌入,突破單向量范式。

結合生成式變分推斷: 將檢索過程嵌入到貝葉斯推理框架中,動態調整嵌入與相關性度量,使其朝向最小化自由能方向流動,而非僅依賴靜態相似度。

語料治理與可控擾動: 與幻覺源頭類似,檢索語料偏差直接導致檢索幻覺,應進行全面的數據治理,并通過可控擾動(微擾不動點)提升系統魯棒性。

采用 Wasserstein 距離等更合適的度量: 筆者在幻覺治理中提到 Wasserstein 度量,這同樣適合檢索任務,因為它能更穩健地反映分布間的最優輸運,而非僅靠點對點內積。

新基準建設與系統性評估: Google 提供 LIMIT 數據集只是第一步,未來需要構建更多具備 組合復雜性壓力測試 的基準,避免“指標高、真實效果差”的幻覺式樂觀。

OpenAI 與 Google DeepMind 這兩項研究從不同維度印證了筆者在幻覺分析中的關鍵觀點:幻覺并非訓練不足,而是模型認知框架與信息壓縮結構的內生缺陷。 

未來大模型檢索與生成很可能需要實現融合:檢索部分承擔“貝葉斯腦的感官輸入”;生成部分完成“自由能最小化的后驗推斷”;共同依賴更高維度、更可控、更可解釋的內部世界模型。

文獻 1,https://cdn.openai.com/pdf/d04913be-3f6f-4d2b-b283-ff432ef4aaa5/why-language-models-hallucinate.pdf

文獻 2,On the Theoretical Limitations of Embedding-Based Retrieval,https://arxiv.org/html/2508.21038v1

本文轉載自??清熙??,作者:王慶法

已于2025-9-9 10:22:45修改
收藏
回復
舉報
回復
相關推薦
www.好吊色| 91成人精品一区二区| 岛国片av在线| 91亚洲国产成人精品一区二区三| 日本在线精品视频| 国产又粗又猛又爽又黄的视频小说| 日韩城人网站| 午夜伊人狠狠久久| 欧美韩国日本精品一区二区三区| 超碰在线免费97| 欧美激情四色| 亚洲欧美日韩另类| av在线免费观看不卡| 51漫画成人app入口| 久久久国际精品| 亚洲free嫩bbb| 国产亚洲欧美在线精品| 91精品蜜臀一区二区三区在线| 精品国产第一区二区三区观看体验| 成人在线观看你懂的| 欧美三级黄网| 2022国产精品视频| 91性高湖久久久久久久久_久久99| 日本中文字幕免费在线观看| 啪啪亚洲精品| 日韩欧美色电影| 午夜欧美福利视频| 欧美日韩在线视频免费观看| 国产无遮挡一区二区三区毛片日本| 91传媒视频在线观看| 久久国产乱子伦精品| 欧美片第1页综合| 国产香蕉97碰碰久久人人| 日本少妇xxx| 欧美韩国亚洲| 亚洲v中文字幕| 最新中文字幕久久| 国产乱子伦三级在线播放| 国产经典欧美精品| 国产在线一区二区三区| 色av性av丰满av| 亚洲经典在线看| 精品自在线视频| 亚洲精品久久久久久国| 国产精品欧美在线观看| 亚洲国产日韩精品在线| 黑人巨大猛交丰满少妇| 日本a人精品| 在线免费av一区| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 欧美极品少妇videossex| 一区视频在线播放| 亚洲欧美国产不卡| 97视频在线观看网站| 久久伊人蜜桃av一区二区| 精品久久久久久乱码天堂| 成人午夜免费在线观看| 国产精品18久久久久久久久久久久| 国产在线视频不卡| 国产精品伊人久久| 韩国欧美国产一区| 成人激情黄色网| 91欧美日韩麻豆精品| 麻豆精品新av中文字幕| 国产精品视频网| 又骚又黄的视频| 久久精品国产成人一区二区三区| 国产精品久久久久久av下载红粉| 国产99免费视频| 天堂成人国产精品一区| 国产成人在线亚洲欧美| 亚洲欧美日韩一区二区三区四区| 久久一本综合频道| 日本免费久久高清视频| 免费在线观看av的网站| 久久99久久99小草精品免视看| 国产精品中文在线| 国产精品玖玖玖| 精品一区二区三区在线视频| 成人两性免费视频| av免费在线不卡| 成人污视频在线观看| 国产亚洲一区在线播放| 免费在线视频你懂得| 国产日韩在线不卡| 在线视频欧美一区| 午夜小视频在线观看| 亚洲成人精品在线观看| 欧美黄色一级片视频| 成人在线免费电影网站| 欧美一区二区三区视频免费| 久草视频福利在线| 精品国产1区| 欧美另类高清videos| 国产乡下妇女做爰毛片| 肉色丝袜一区二区| 91在线视频成人| 亚洲色图欧美视频| 中文字幕av免费专区久久| 国产精品12p| 日本不卡1234视频| 欧美日韩三级一区| 国产精品19p| 国产欧美日韩视频在线| 久久综合伊人77777蜜臀| 日韩乱码人妻无码中文字幕| 免费在线观看视频一区| 国产精品区二区三区日本| 黄色在线视频观看网站| 亚洲精品日日夜夜| 国产免费视频传媒| www.爱久久| 尤物tv国产一区| 久久久99精品| 日本欧美大码aⅴ在线播放| 大波视频国产精品久久| 国产日产精品久久久久久婷婷| 亚洲乱码中文字幕| aaa毛片在线观看| 999久久精品| 色妞色视频一区二区三区四区| 久久高清免费视频| 极品少妇xxxx偷拍精品少妇| 久久久久久亚洲精品不卡4k岛国 | 日韩精品中文在线观看| 91香蕉一区二区三区在线观看| 男人的天堂成人在线| 成人羞羞视频免费| 午夜在线免费观看视频| 一本色道久久综合亚洲精品按摩| 伊人影院在线观看视频| 日韩精品一卡| 国产精品444| 色猫av在线| 亚洲va在线va天堂| 九色91porny| 天天影视天天精品| 国产精品一区=区| 超碰免费97在线观看| 欧美性xxxxxx| 最新在线黄色网址| 日韩一区二区久久| 国产精品对白刺激久久久| 成人在线影视| 欧美系列一区二区| 欧美做受高潮6| 香蕉成人久久| 欧美成人一区二区在线| 岛国在线视频网站| 亚洲成人性视频| 国产精品suv一区二区| 国产91精品一区二区麻豆网站| 伊人久久99| 中文成人在线| 久久天天躁狠狠躁老女人| 中文字幕久久久久| 99久久久精品免费观看国产蜜| 日本福利视频导航| 999久久久国产999久久久| 久久国产一区二区三区| a天堂中文在线观看| 亚洲一区二区三区爽爽爽爽爽| 中文字幕在线国产| 亚洲乱亚洲高清| 另类欧美小说| 国产成人精品一区二三区在线观看 | 欧美多人爱爱视频网站| 欧美 日韩 国产 精品| 午夜视频一区二区| 白丝女仆被免费网站| 丝袜国产日韩另类美女| 一本色道久久综合亚洲精品婷婷| 亚洲综合资源| 欧美激情乱人伦一区| 天堂网在线资源| 91成人免费电影| 99久久精品久久亚洲精品| 国产裸体歌舞团一区二区| 国产精品无码免费专区午夜| 另类图片第一页| 国产精品高潮呻吟久久av黑人| 欧美边添边摸边做边爱免费| 欧美一级日韩免费不卡| 日产欧产va高清| 欧美激情在线看| 日日干日日操日日射| 欧美激情第二页| 久久精品日韩| 在线观看欧美日韩电影| 久久精品国产2020观看福利| av中文字幕免费| 天天av天天翘天天综合网色鬼国产| 影音先锋黄色资源| 另类调教123区| a级网站在线观看| 盗摄牛牛av影视一区二区| 91高潮在线观看| 看女生喷水的网站在线观看| 日韩午夜精品视频| 日本熟妇一区二区| 久久久青草青青国产亚洲免观| 精品亚洲视频在线| 亚洲视频中文| 日本一区二区三区精品视频| 国产精品一区二区美女视频免费看 | 一级片视频免费观看| 成人av动漫在线观看| 国产欧美日韩一区| 欧美韩国亚洲| 欧美老女人性视频| 色久视频在线播放| 欧美成人国产一区二区| 国产嫩bbwbbw高潮| 亚洲欧美日韩一区二区三区在线观看| 91九色蝌蚪porny| 国内精品久久久久影院色| 成人性免费视频| 久久国产影院| 精品国产福利| 日韩精品一区二区三区中文| 热99在线视频| 久草免费在线| 亚洲视频777| 图片区 小说区 区 亚洲五月| 欧美日韩一区视频| 日韩av在线天堂| 国产精品久久久久久久久图文区| 91黄色免费视频| 国产一区二区三区在线观看免费视频| 国产极品尤物在线| 亚洲影视一区二区三区| 欧美日韩精品二区| 韩日午夜在线资源一区二区| 岛国av在线播放| 久热精品视频在线观看| 在线视频婷婷| 亚洲精品av在线播放| 国产欧美第一页| 日韩欧美一区视频| 日本一级黄色大片| 亚洲视频综合在线| 91精品国自产在线| 国产情人综合久久777777| 亚洲一区二区在线免费| 国产在线精品免费| 亚洲欧美日韩一级| 嫩草成人www欧美| 男女超爽视频免费播放| 亚洲视频碰碰| 女人床在线观看| 99久久九九| 艳母动漫在线免费观看| 精品日本12videosex| 国产综合第一页| 精品三级av在线导航| 91久久伊人青青碰碰婷婷| 一区二区三区| 国产玖玖精品视频| 97久久中文字幕| 91精品视频免费看| 日韩亚洲国产免费| 456国产精品| 日韩电影av| 国产mv久久久| 日韩成人动漫| 成人久久久久爱| 精品一区二区三区四区五区 | 丁香花在线电影| 久久久亚洲欧洲日产国码aⅴ| 色呦呦在线免费观看| 九九精品在线播放| 欧美午夜电影一区二区三区| 欧美成人中文字幕在线| 国产网站在线免费观看| 美女性感视频久久久| 成年女人在线看片| 91精品国产乱码久久久久久久久 | 欧美另类极品videosbestfree| 黄视频在线免费看| 97碰在线观看| 精品国产第一福利网站| 欧美怡春院一区二区三区| 国产精品黄色片| 91精品国产自产在线| 国产精品99久久免费| 精品一区二区不卡| 牛牛影视久久网| 日韩av电影免费播放| 国产一区二区电影在线观看| 在线一区高清| 欧美日韩天堂| 国产资源在线视频| 另类中文字幕网| 国产成人精品一区二区在线小狼| 成人黄色在线看| 少妇真人直播免费视频| 亚洲天堂2014| 精品成人免费视频| 欧美系列亚洲系列| 成人免费视频国产免费麻豆| 亚洲精品在线不卡| 在线观看免费高清完整| 午夜精品一区二区三区在线播放| 亚洲国产福利| 成人激情黄色网| 欧美sss在线视频| 成年人三级视频| 欧美一级视频| 国模私拍视频在线观看| 99久久精品国产网站| 激情五月深爱五月| 亚洲一区二区三区四区在线观看 | 国产精品爱久久久久久久| 日韩一区二区三区在线看| 精品国产免费人成电影在线观...| 国产精品一线天粉嫩av| 五月天激情图片| 日韩精品亚洲专区| 欧美图片自拍偷拍| 亚洲欧洲精品天堂一级| 日韩黄色在线播放| 91精品国产综合久久精品麻豆 | 欧美大胆成人| 91久色国产| 婷婷久久国产对白刺激五月99| 日韩日韩日韩日韩日韩| 久久se精品一区二区| 亚洲精品午夜视频| 亚洲福利一区二区三区| 中文字幕在线观看欧美| 亚洲国产成人精品女人久久久 | 蜜臀av午夜一区二区三区| 国产不卡视频在线播放| 国产精品1区2区3区4区| 色成人在线视频| 人成网站在线观看| 日日噜噜噜夜夜爽亚洲精品| 国产成人精品一区二三区在线观看| 国产日韩一区二区三区| 五月天久久久| 中文字幕久久av| 国产精品丝袜久久久久久app| 日本道在线观看| 51久久夜色精品国产麻豆| 91高清在线| 国产精品成人aaaaa网站| 成功精品影院| 男女视频网站在线观看| 国产精品一二三| 免费在线观看h片| 日韩一区二区三区免费观看| 成年人在线观看| 欧美又大又硬又粗bbbbb| 亚洲专区视频| 欧洲黄色一级视频| proumb性欧美在线观看| 91美女免费看| 日韩精品亚洲视频| 欧美男男激情videos| 欧美精品一区二区三区四区五区| 国产一区二区三区成人欧美日韩在线观看| 少妇丰满尤物大尺度写真| 亚洲三级电影网站| 国产乱色精品成人免费视频 | 黄色免费网站在线| 成人在线免费观看视视频| 久久中文字幕av| 污污的网站免费| 一区二区三区免费在线观看| 99国产在线播放| 久久99精品国产99久久6尤物 | 欧美色国产精品| 欧美日韩免费做爰大片| 日韩av大片在线| 日韩综合网站| www.久久com| 午夜精品久久久久久久| 在线观看xxx| 国产精品高潮呻吟久久av野狼| 亚洲91中文字幕无线码三区| 日本一本在线视频| 亚洲制服丝袜一区| 噜噜噜噜噜在线视频| 国产精品日本精品| 久久精品亚洲人成影院| 无码成人精品区在线观看| 婷婷一区二区三区| 毛片在线免费| 成人情视频高清免费观看电影| 亚洲黄网站黄| 成人免费无码大片a毛片| 欧美日韩一区二区三区四区 | 日韩一区二区av| 97se亚洲国产一区二区三区| 无码粉嫩虎白一线天在线观看| 91啪亚洲精品| www.久久综合| 欧美激情国产日韩精品一区18| 亚洲免费毛片| 午夜剧场高清版免费观看|