理解 RAG 第八部分:緩解 RAG 中的幻覺

在可能阻礙語言模型性能的各種問題和挑戰(zhàn)中,幻覺往往位居榜首。當(dāng)語言模型生成虛假、誤導(dǎo)或無意義的信息時,就會出現(xiàn)幻覺。在檢索增強生成 (RAG) 系統(tǒng)中,語言模型通過檢索和整合外部信息來增強事實依據(jù),這個問題得到了緩解,但并未完全消除。
在我們理解 RAG 文章系列的新一期中,我們將探討幻覺問題,與獨立語言模型相比,它們在 RAG 系統(tǒng)中的表現(xiàn)如何,最重要的是,如何解決這個具有挑戰(zhàn)性的問題。
為什么 RAG 系統(tǒng)中的幻覺仍然會發(fā)生
正如本系列的開篇所討論的,RAG 系統(tǒng)相較于傳統(tǒng)語言模型的主要優(yōu)勢之一是能夠通過檢索和整合事實準(zhǔn)確的信息來減少幻覺,但幻覺仍然可能由于多種原因而產(chǎn)生。事實上,幻覺仍然是 RAG 系統(tǒng)中最重大的挑戰(zhàn)之一,尤其是那些檢索精度有限或知識庫質(zhì)量不夠高的方法。
RAG 系統(tǒng)中仍然可能出現(xiàn)幻覺的一個原因很簡單:如果檢索到的數(shù)據(jù)包含錯誤,則生成的響應(yīng)也可能不正確或具有誤導(dǎo)性。在依賴于知識庫(通常是文檔語料庫,但有時也是結(jié)構(gòu)化數(shù)據(jù)庫)的 RAG 系統(tǒng)中,數(shù)據(jù)由人為輸入、傳感器收集等,因此條目包含錯誤或不準(zhǔn)確的信息并不少見。當(dāng) RAG 的檢索器優(yōu)先考慮或誤解這些“損壞的”數(shù)據(jù)條目或文檔時,出現(xiàn)幻覺的風(fēng)險就會增加。如果用戶在 RAG 系統(tǒng)中查詢與該人相關(guān)的人名,文檔或數(shù)據(jù)庫中錯誤輸入的人名就足以觸發(fā)“幻覺秀”……或者更糟的是,如果用戶就是那個人!
當(dāng)檢索到的信息缺乏足夠的細(xì)節(jié)或上下文細(xì)微差別(這些對于正確解讀至關(guān)重要)時,就會出現(xiàn)另一個問題。例如,銀行聊天機器人 RAG 系統(tǒng)背后的檢索器可能會檢索有關(guān)抵押貸款條件的信息來響應(yīng)客戶的查詢。但是,如果客戶是殘疾人士或特殊身份,有資格享受額外福利,而檢索器未能檢索到這些特定信息,則生成的響應(yīng)可能會錯失客戶的關(guān)鍵機會。這不僅會導(dǎo)致錯誤信息,還可能導(dǎo)致糟糕的用戶體驗,從而可能導(dǎo)致客戶轉(zhuǎn)向競爭對手。
無論哪種情況,生成器(RAG 系統(tǒng)內(nèi)的語言模型)都會嘗試根據(jù)不完整或誤導(dǎo)性的數(shù)據(jù)構(gòu)建響應(yīng),從而導(dǎo)致不可靠或不準(zhǔn)確的輸出。
緩解 RAG 系統(tǒng)中的幻覺
廣義上講,我們可以識別和分類三種類型的策略或焦點來減輕 RAG 系統(tǒng)中的幻覺:數(shù)據(jù)、上下文以及檢索器和生成器內(nèi)的 AI 和推理過程。
數(shù)據(jù)相關(guān)的緩解策略
減少幻覺的關(guān)鍵在于確保檢索器使用的知識庫中包含高質(zhì)量且經(jīng)過精心整理的數(shù)據(jù)。如果檢索到的文檔包含錯誤、不精確的條目、過時的信息或偏見,生成器可能會給出誤導(dǎo)性或不正確的響應(yīng)。為了提高可靠性,可以采取的策略包括嚴(yán)格的數(shù)據(jù)管理、持續(xù)系統(tǒng)地更新知識庫、自動化的事實核查方法以及過濾掉低質(zhì)量或不相關(guān)的來源。
與環(huán)境相關(guān)的緩解策略
即使數(shù)據(jù)的質(zhì)量和準(zhǔn)確性已經(jīng)得到提升,如果模型未能完全捕捉用戶意圖或檢索所有相關(guān)信息,仍然可能出現(xiàn)幻覺。為了解決這個問題,專注于上下文改進的策略包括優(yōu)化檢索技術(shù)、使用查詢擴展進行精細(xì)搜索、應(yīng)用重排序模型優(yōu)先選擇與特定場景最相關(guān)的文檔,以及采用先進的提示工程技術(shù)。這些策略可能有助于提高檢索到的信息和上下文的相關(guān)性,從而使最終傳遞給生成器的提示能夠提供堅實的上下文基礎(chǔ)。
人工智能與推理過程相關(guān)的緩解策略
最后,即使擁有結(jié)構(gòu)良好的上下文和高質(zhì)量的數(shù)據(jù),語言模型執(zhí)行的推理過程仍然可能導(dǎo)致幻覺。為了應(yīng)對這一最終挑戰(zhàn),常見的策略包括使用指令遵循數(shù)據(jù)集(旨在幫助語言模型理解和遵循明確指令的訓(xùn)練實例集合)對模型進行微調(diào)、結(jié)合邏輯推理和常識推理技術(shù)、利用事實核查 API 等外部驗證工具,以及在 RAG 工作流中集成多步驟推理框架,以產(chǎn)生更連貫、更精確的響應(yīng)。
減輕 | 主要焦點 | 關(guān)鍵策略與技巧 | 效益/成果 |
數(shù)據(jù) | 整理并維護高質(zhì)量數(shù)據(jù) | 嚴(yán)格管理、持續(xù)更新、自動核實事實、過濾低質(zhì)量來源 | 減少因信息過時或不準(zhǔn)確而導(dǎo)致的錯誤;提高事實依據(jù) |
語境 | 捕捉用戶意圖并增強檢索細(xì)節(jié) | 優(yōu)化檢索方法、查詢擴展、重新排序模型、高級提示工程 | 提高檢索信息的相關(guān)性和完整性 |
人工智能與推理 | 完善模型決策和推理 | 使用指令數(shù)據(jù)集、邏輯和常識推理、多步驟框架、外部驗證工具進行微調(diào) | 減輕固有的模型幻覺,從而產(chǎn)生更連貫的反應(yīng) |
小結(jié)
幻覺是當(dāng)今基于語言模型的人工智能系統(tǒng)面臨的一個關(guān)鍵問題,RAG 系統(tǒng)盡管能夠部分解決這一問題,卻也不例外。本文探討了 RAG 背景下的幻覺問題,重點闡述了在生成響應(yīng)之前檢索外部信息的系統(tǒng)中仍可能出現(xiàn)幻覺的原因,并提出了可在 RAG 系統(tǒng)、數(shù)據(jù)庫和知識庫中實施的幾種實用策略,以緩解幻覺問題。




































