精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

RAG真能提升LLM推理能力?人大最新研究:數據有噪聲,RAG性能不升反降

人工智能
RAG通過納入外部文檔可以輔助LLM進行更復雜的推理,降低問題求解所需的推理深度,但由于文檔噪聲的存在,其提升效果可能會受限。中國人民大學的研究表明,盡管RAG可以提升LLM的推理能力,但這種提升作用并不是無限的,并且會受到文檔中噪聲信息的影響。通過DPrompt tuning的方法,可以在一定程度上提升LLM在面對噪聲時的性能。

近年來,大語言模型已經在多種任務上表現出來出色的能力,然而,由于缺乏事實性信息,當前的LLM經常出現嚴重的幻覺現象;此外,LLM中的知識是通過其參數進行編碼記憶,這意味著要融入新知識需要進一步的微調,消耗大量的時間與計算資源。因此,通過結合外部檢索器來增強LLM的性能,已經成為了主流的方案。

盡管RAG在現代LLM中被廣泛采用,但對于RAG如何輔助推理的深入理解仍然是一個未解的問題。目前,大多數研究人員主要將RAG視為提供領域特定知識的方法,并常常試圖通過RAG使LLM適應特定子領域。然而,RAG在增強推理能力方面的影響尚未得到深入研究。

近日,來自中國人民大學的學者指出,RAG可以幫助LLM提升其推理能力,但其提升有限,并且由于retriever中的噪聲,RAG甚至可能造成推理能力的下降。

圖片圖片

論文地址:https://export.arxiv.org/abs/2410.02338

背景與動機

我們可以將LLM視為計算 ??(??∣??),其中q 代表問題query,??是相應的答案。

在這種情況下,檢索增強生成(RAG)可以表示為 ??(??∣??,??1,??2,…,????),其中 ???? 是基于query ??檢索到的第 ?? 個文檔。

此外,眾所周知的prompt方法「思維鏈」(CoT)顯著增強了LLMs的推理能力,它可以表示為 ??(??∣??,??1,??2,…,????),其中 ???? 表示逐步推理的結果。CoT和RAG都旨在將額外的信息融入到輸入中,以獲得更好的性能。理論上和實驗上都已證明,CoT能夠有效提升LLMs的推理能力。那么問題是:RAG是否也能增強LLMs的推理能力?

由于LLM的層數有限,其推理能力局限于固定深度。當將推理路徑概念化為一棵樹時,其最大深度保持不變。思維鏈(Chain of Thought, CoT)通過逐步推理或解釋來生成答案,而不是直接提供答案,其形式化表達為 ??1=??(??), ??2=??(??,??1),…,??=??(??,??1,…,????)。

這一過程允許CoT通過多次執行??來有效擴展推理深度,隨著CoT步驟的增加,潛在地達到無限深度。

相比之下,檢索增強生成(RAG)并不支持多次推理;它檢索現有的相關信息來生成答案,因此無法堆疊transformer層數。

雖然RAG不能通過堆疊LLM層數來增強推理能力,但檢索到的文檔可能包含中間推理結果,從而減少了推理所需的層數,使LLM能夠處理更復雜的問題,進而幫助提升其推理能力。

樹形推理結構

對于一個具有 ??層的推理樹 ??,令第 ?? 層的節點數量為 ????,并將第 ?? 層的第 ?? 個節點表示為 ????,??。檢索到的文檔 ?? 包含的相關信息可以用來替換某些推理節點的內容。

例如,考慮query「Who is the actor playing Jason on General Hospital?」。

在這種情況下,可能存在一個節點 ????,??,它表示關于「what is General Hospital?」的信息。如果我們提供一個包含「General Hospital」詳細信息的文檔,那么 ????,?? 的計算就可以通過從該文檔中提取相關信息來有效替代。

該文檔不僅簡化了 ????,?? 的計算,還消除了所有僅與 ????,?? 相連的節點。這些節點只對 ????,?? 的推理有貢獻,既然 ????,?? 的信息可以直接從文檔中得出,那么它們的推理就變得不必要了。因此,檢索到與節點 ????,?? 相關的單個文檔可能會減少多個下層節點的存在。這一過程類似于核武器中的裂變反應,減少一個節點會觸發其他多個節點的減少。

因此,如果某一層 ??′ 的所有節點都通過檢索增強生成(RAG)方法被簡化,任何 ??≤??′ 的層都可以被消除,從而有效降低整體的推理深度。

圖片圖片

如上圖所示,推理樹由4層組成,我們檢索到了3個文檔 ??1, ??2, ??3,分別為節點 ??2,0、??1,1 和 ??2,2 提供了信息。

通過文檔 ??1,節點 ??1,0 也可以被移除,因為它只對 ??2,0 有貢獻;通過文檔 ??2,??0,1 也不再需要;由于文檔 ??3,節點 ??1,2 和 ??1,3也可以唄移除。

因此,第一層的所有4個節點都可以通過文檔信息消除,這意味著第一層和第零層的所有節點都是不必要的。這樣,推理深度從4層減少到了2層。因此,借助相關文檔,RAG可以有效降低問題的推理復雜度,使LLM能夠解決更復雜的問題。

我們可以觀察到,消除單個節點會顯著影響較淺層中的許多節點,類似于裂變反應。如果這種裂變過程能夠無限擴展,RAG可能會大大增強LLMs的推理能力。

然而,如果裂變反應在某個閾值處停止,其效果可能會受到限制。因此,為了評估RAG能夠減少多少層,關鍵在于確定這一類似裂變的過程是否會終止。理解這一動態對于評估RAG如何提升推理能力以及LLMs在復雜問題求解中的整體效率至關重要。

顯然,針對第??層,該層節點被erase的概率由兩個部分組成,一是由于上層節點的推理不再需要,二是某個文檔中包含該節點的信息,假設某個文檔中包含該節點的信息的概率為一個常數??

p,并且在第??+1層中有????+1%被消除,那么第??層節點被消除的概率可以是????=??(????+1)=??(??).

令 ??(??)=??(??)???,表示第 ?? 層的增長,可以考慮在 (0,1) 區間內存在一個點 ??^,使得 ??(??^)=0。

如果在 ??>??^時,??(??)<0,表明被消除的節點數預期會比前一層更少,意味著裂變反應不會無限傳播,而是會達到一個臨界閾值。超過這一點后,下一層被消除的節點數預計會比當前層減少,從而限制裂變反應的擴展。

圖片圖片

由上圖可見,當 ??^存在時,節點被erase的概率會逐漸收斂到 ??^,無法無限擴張下去,同時 ??^的位置取決于層與層之間連接的系數程度和某個文檔中包含節點的信息的概率。當層與層之間連接十分稀疏時或者retriever的性能很強,那么就可以使 ??^>1,那么節點被erase的概率就會收斂到1,即可erase一整個layer從而降低問題所需的推理深度,使LLM可以解決更復雜的問題。

文檔噪聲

然而,在實際的RAG場景中,從文檔中檢索到的信息并不總是可以直接使用,通常需要進一步處理,因為文檔可能包含噪聲信息,而且有些文檔甚至可能包含錯誤的答案。這些噪聲和干擾文檔會對性能產生負面影響。

雖然一些研究嘗試微調模型以過濾噪聲和干擾文檔,但該方法使LLM先完成過濾再進行推理,降低了推理能力。此外,一些研究訓練另一個過濾模型,但這種方法會導致額外的推理成本,并且無法消除文檔中內涵的固有噪聲。

因此,出現了一個關鍵問題:過濾無關文檔是否困難,我們能否在有限的層數內有效解決它? 如果過濾噪聲所需的成本甚至超過了RAG帶來的幫助,那么RAG將無法提升推理能力。

令 ?? 表示標記的相關性,????=0 表示標記 第 ??個token ????是噪聲,否則該token是相關的。

圖片表示LLM的原始注意力層。我們假設期望的自注意力函數為:

圖片圖片

對模型的微調可以表示為

圖片圖片

其中圖片,ΔW 表示其余項。

在這種情況下,如果我們需要圖片, 我們需要對于所有的相關的token ????,有

圖片

因此,需要對于所有的相關token,有圖片為一個常數,才可以使得圖片

Triple-Wise Problem

對于輸入序列圖片, ?? 表示每個token的相關性。

具體來說,對于每個token ????,相關性得分 ????=0 表示該標記與查詢無關。

需要注意的是,計算 ????不僅僅依賴于該token ????和query;相反,它可能需要涉及三個或更多token。

例如,假設輸入為「Alice is exhausted, but Bob is still very excited, showing no signs of fatigue. How does Bob feel?」,單詞「exhausted」是一個噪聲token,應在推理過程中排除。

然而,確定該token的相關性需要考慮query中的「Bob」以及「exhausted」的主語「Alice」。因此,識別一個標記的相關性需要來自多個token的信息,而自注意力機制僅在成對之間計算關系,這使得在單個transformer層內解決此問題變得困難。

在檢索增強生成(RAG)場景中,我們可以簡化這個triple wise problem。通過預先計算文檔中的信息,并將這些匯總信息表示為一個或幾個額外的token(virtual token),我們可以僅使用來自token本身、query和virtual token的信息來評估標記的相關性。在這種情況下,使triple wise problem變為了pair-wise problem。

在判斷token ????是否相關時,不再需要遍歷所有的輸入token ????以尋找和query的沖突,僅需遍歷所有的virtual token即可。

我們微調一個bert模型以獲取文檔的表征,并通過MLP將其映射到合適的維度,將其作為virtual token插入到模型的輸入prompt中進行微調,實驗結果如下

圖片圖片

其中gold代表document中只包含一個文檔,該文檔直接包含了query的答案,但該文檔中仍然存在一定的噪聲;gold dis代表文檔中包含gold文檔以及distracting文檔,distracting文檔中包含錯誤的答案。由上圖可見,DPrompt tuning有效提升了LLM在面對噪聲時的性能。

參考資料:

https://arxiv.org/html/2410.02338v2

責任編輯:武曉燕 來源: 新智元
相關推薦

2024-01-15 08:13:47

緩存數據庫性能優化

2024-10-07 08:49:25

2025-03-06 10:41:32

2014-11-24 09:23:22

華為數據中心

2024-12-23 07:20:00

LLM逆向思維語言模型

2025-04-21 06:25:00

2025-06-05 03:00:00

AutoRefineRAGLLM

2024-02-01 15:01:26

AI訓練

2025-11-05 09:25:09

2024-03-22 16:13:42

LLMRAGXGBoost

2024-04-30 09:48:33

LLMRAG人工智能

2025-04-21 08:11:09

2025-05-20 06:00:00

AI人工智能RAG

2023-12-26 12:03:52

AI模型

2024-01-11 16:24:12

人工智能RAG

2025-10-30 02:11:00

2024-01-03 14:41:30

iOS 17蘋果

2025-02-06 13:50:06

2024-03-26 00:00:07

2024-10-24 08:07:25

大語言模型LLMRAG模型
點贊
收藏

51CTO技術棧公眾號

26uuu国产一区二区三区| 国产精品va| 欧美日韩激情一区| 青青视频免费在线观看| 少妇高潮久久久| 老司机午夜免费精品视频| 日韩一区二区三区在线播放| av不卡中文字幕| 肉色欧美久久久久久久免费看| 中文字幕一区二区三区视频| 国产精品有限公司| 高潮无码精品色欲av午夜福利| 亚洲成av人电影| 亚洲精品视频免费在线观看| 污污视频网站在线| 原纱央莉成人av片| 亚洲综合男人的天堂| 亚洲毛片aa| 亚洲av激情无码专区在线播放| 久久一二三四| 久久久久久久亚洲精品| 国产精品酒店视频| 日韩在线黄色| 欧美变态凌虐bdsm| 五月激情五月婷婷| 精品视频在线一区二区在线| 亚洲成a人片在线观看中文| 亚洲一区二三| 黄色免费在线播放| 成人免费看的视频| 亚洲一区二区三区xxx视频| aaa在线视频| 国产日韩欧美高清免费| 欧美高清不卡在线| 人人干在线观看| 日本一区二区在线看| 日韩av在线免费看| chinese麻豆新拍video| 亚洲成人黄色| 777亚洲妇女| 五月天中文字幕在线| 91精品国产经典在线观看| 一本色道久久综合亚洲91| 人妻夜夜添夜夜无码av| 色呦呦在线免费观看| 亚洲美女偷拍久久| 欧美一级黄色录像片| 蜜芽在线免费观看| 日韩理论片在线| 久久精品国产精品亚洲精品色| аⅴ资源新版在线天堂| 久久久久久麻豆| 欧美精彩一区二区三区| 青青草视频在线免费观看| 97成人超碰视| 欧美亚洲免费高清在线观看 | 欧美日韩中文字幕视频| 性欧美lx╳lx╳| 亚洲欧美综合区自拍另类| 巨胸大乳www视频免费观看| 伊人久久大香线蕉无限次| 精品视频在线导航| 中文字幕被公侵犯的漂亮人妻| 九色精品国产蝌蚪| 中文字幕欧美日韩va免费视频| 日本午夜精品视频| 在线国产一区二区| 久久久女女女女999久久| 日韩三级小视频| 玖玖在线精品| 成人疯狂猛交xxx| 国产裸体无遮挡| 不卡一区二区在线| 欧美一区视久久| 老司机在线看片网av| 亚洲在线视频网站| 成年人免费在线播放| julia一区二区三区中文字幕| 欧美女孩性生活视频| 国产一精品一aⅴ一免费| 亚洲精品国产setv| 色午夜这里只有精品| 青青草原在线免费观看| 国产精品毛片在线| 国产日本欧美一区| 欧美一区二区三区激情| 久久美女艺术照精彩视频福利播放 | 大奶在线精品| 亚洲香蕉伊综合在人在线视看| 欧美自拍偷拍网| 精品福利av| 国产精品国产亚洲伊人久久| a级片在线免费看| www精品美女久久久tv| 成年人免费观看的视频| 9999精品成人免费毛片在线看| 色综合久久久久综合| 欧美一级视频在线| 欧洲精品一区| 久久伊人精品天天| 日日噜噜噜噜人人爽亚洲精品| 精品亚洲porn| 蜜桃av久久久亚洲精品| 黄色免费在线观看网站| 色综合久久中文字幕综合网 | 91捆绑美女网站| 热这里只有精品| 欧美精品日日操| 日韩精品一区国产麻豆| 国产精品理论在线| 一本色道久久综合| 97操在线视频| 亚洲成人三级| 91精品91久久久中77777| 亚洲精品久久一区二区三区777| 欧美久久精品一级c片| 国内精品400部情侣激情| 一区二区三区免费观看视频| 久久女同精品一区二区| 99久久国产综合精品五月天喷水| 看片一区二区| 亚洲人成在线观| 日韩欧美亚洲国产| 国产精品99久久久久| 亚洲欧美国产不卡| 欧美精品资源| 亚洲网站视频福利| 青草视频在线观看免费| 丁香婷婷综合网| 激情六月天婷婷| 精品亚洲a∨一区二区三区18| 在线观看日韩av| 99超碰在线观看| 99久久国产综合精品麻豆| 成人一区二区av| 国产欧美88| 久久九九热免费视频| www.av88| 国产女主播一区| 无码人妻丰满熟妇区毛片| 欧美18xxxx| 午夜精品视频网站| 天天操天天干天天爽| 午夜精品一区二区三区免费视频| 中国特级黄色片| 欧美日韩亚洲一区| 国产高清精品一区二区| 92久久精品| 亚洲国产欧美在线成人app| 久青草视频在线观看| 国产91色综合久久免费分享| 99在线免费视频观看| 91综合久久爱com| 91精品国产免费久久久久久 | 中文字幕av一区二区三区高 | 欧美视频在线观看视频| 风间由美中文字幕在线看视频国产欧美 | 成人黄色在线电影| 欧美r级电影在线观看| 国产亚洲精品成人| 91亚洲午夜精品久久久久久| av网址在线观看免费| 精品国内自产拍在线观看视频| 国产成人jvid在线播放| 91网页在线观看| 91超碰这里只有精品国产| 中文字幕影音先锋| 99在线精品一区二区三区| 精品中文字幕av| 日韩免费特黄一二三区| av一区观看| 亚洲最新无码中文字幕久久| 日韩中文字幕国产| 午夜精品久久久久久久99| 精品久久久久久久久久久久| 国产免费无遮挡吸奶头视频| 激情欧美日韩一区二区| www.好吊操| 国产永久精品大片wwwapp| 91久久国产婷婷一区二区| wwwwxxxx在线观看| 国产亚洲在线播放| 99热这里只有精品1| 精品久久久久久亚洲精品| 成年人看的免费视频| 国产成人av电影在线| 草草草在线视频| 午夜久久久久| 色阁综合av| 国产精品成人自拍| 国产欧美一区二区三区视频 | 国产精品久久91| 福利在线导航136| 在线播放精品一区二区三区 | 中文字幕最新精品| 日韩专区第一页| 欧美日韩精品一区视频| 国产精品自拍视频一区| 国产精品美女久久久久久久久| 特级特黄刘亦菲aaa级| 热久久一区二区| 两根大肉大捧一进一出好爽视频| 99久久夜色精品国产亚洲狼| 久久超碰亚洲| 亚洲欧洲国产精品一区| 国产日韩专区在线| 欧美18av| 97久久精品人人澡人人爽缅北| 日本免费在线观看| 亚洲图片欧美日产| 污污的视频网站在线观看| 91精品国产91久久久久久一区二区 | 欧亚乱熟女一区二区在线| 久久se精品一区精品二区| 日韩网址在线观看| 影音先锋亚洲精品| 免费的av在线| 国产精品二区不卡| 日本一区二区三区www| 卡通动漫国产精品| 高清视频一区| 日韩在线观看中文字幕| 国产日韩欧美影视| 日韩福利影视| 国产精品视频yy9099| 人人鲁人人莫人人爱精品| 97国产精品视频| 第一av在线| 欧美另类老女人| 最近中文字幕免费mv2018在线| 精品国产一区二区三区在线观看| 国产高清在线| 亚洲午夜精品久久久久久久久久久久| 色香蕉在线视频| 欧美精品一区二区三| 亚洲国产综合一区| 精品国产一区二区三区久久久蜜月| 国产精品特级毛片一区二区三区| 欧美日韩黄色一区二区| 中文字幕视频在线播放| 欧美色综合网站| 在线视频免费观看一区| 欧美美女网站色| 国产成人精品免费看视频| 欧美一区二区三区免费视频| av官网在线观看| 日韩美女视频在线| 六月婷婷中文字幕| 亚洲精品v欧美精品v日韩精品| 国产综合在线播放| 亚洲精品福利资源站| 精品一区2区三区| 青青艹在线观看| 色妞www精品视频| 国产情侣免费视频| 欧美日韩一区精品| 国产精品自产拍| 日韩一区二区三区视频在线 | 日韩电影免费观看在线观看| 天天插天天干天天操| 国产视频精品xxxx| 国产私人尤物无码不卡| 中文字幕日韩专区| www在线免费观看视频| 久久久久亚洲精品国产| 美女91在线看| 国产精品女主播视频| www久久久| 国产有色视频色综合| 精品盗摄女厕tp美女嘘嘘| 一区二区三区四区五区视频 | 国产欧美日本一区二区三区| 一区二区三区在线播放视频| 一区二区三区中文字幕电影| 国产成人精品一区二三区| 色噜噜狠狠色综合欧洲selulu| 在线视频播放大全| 亚洲第一天堂av| 二区在线观看| 久久成人精品一区二区三区| а√在线中文在线新版| 国产精品久久久久久av下载红粉| 亚洲a成人v| 久久99国产精品99久久| 欧美好骚综合网| 欧美精品自拍视频| 毛片一区二区三区| 四虎精品一区二区| 国产精品国产a级| 韩国av免费观看| 欧美日韩高清一区二区三区| 欧美一级淫片aaaaaa| 一区二区三区四区视频| 日本伦理一区二区| 国产精品免费视频久久久| 99a精品视频在线观看| 日产国产精品精品a∨ | 美女喷白浆视频| 国产凹凸在线观看一区二区 | 一区二区三区蜜桃| 69av视频在线观看| 亚洲国产精品小视频| 高清毛片在线看| 97精品在线视频| 日韩精品一区国产| 午夜精品短视频| 在线亚洲伦理| 日本女人性视频| 国产精品女上位| 国产剧情在线视频| 亚洲第一页中文字幕| 毛片网站在线免费观看| 国产ts人妖一区二区三区| 99精品中文字幕在线不卡| 在线观看成人av| 日韩av高清在线观看| 双性尿奴穿贞c带憋尿| 一区二区三区资源| 97视频免费在线| 中文字幕亚洲一区在线观看| 中文字幕在线高清| 国产在线一区二区三区播放| 好吊日精品视频| 一区二区三区人妻| 亚洲三级在线播放| 一区二区www| 色偷偷av一区二区三区乱| а√天堂资源国产精品| 欧美日韩高清免费| 国产精品三上| 菠萝菠萝蜜网站| 性久久久久久久久久久久| 亚洲第一免费视频| 久久99热精品这里久久精品| 国产乱码精品一区二区三区亚洲人 | 亚洲成av人片一区二区密柚| wwwwwxxxx日本| 成人欧美一区二区三区黑人麻豆| 伊人久久成人网| 精品国产欧美一区二区五十路| 最新日韩一区| 日韩欧美亚洲精品| 蜜桃免费网站一区二区三区| 日本人亚洲人jjzzjjz| 欧美视频中文字幕| 尤物网在线观看| 91色中文字幕| 欧美三级午夜理伦三级中文幕| 性生交大片免费看l| 亚洲一二三区视频在线观看| 丰满肉肉bbwwbbww| 国内偷自视频区视频综合 | 国产高清视频一区| 久久久久久久久久网站| 欧美成va人片在线观看| sis001亚洲原创区| 欧美精品123| 久久99九九99精品| 免费人成视频在线| 日韩精品在线观看视频| 日本在线中文字幕一区二区三区| 性欧美.com| 国产精品综合一区二区三区| 麻豆亚洲av熟女国产一区二| 亚洲成人a**站| 蜜臀国产一区| 小说区视频区图片区| 成人在线视频一区二区| 日韩成人在线免费视频| 亚洲天堂av在线播放| 日韩黄色三级在线观看| 日韩视频 中文字幕| 91丨国产丨九色丨pron| 中国一区二区视频| 久久99国产综合精品女同| 日本韩国欧美超级黄在线观看| 可以免费在线看黄的网站| **性色生活片久久毛片| 日韩在线视频第一页| 国产精品久久久久影院日本 | 国产精品嫩草久久久久| 精品人妻久久久久一区二区三区 | 欧美人与性动交a欧美精品| 色爱av综合网| 999久久久精品视频| 精品国产31久久久久久| 日本视频在线播放| 国内精品视频在线播放| 久久精品国产精品亚洲红杏| 国产无精乱码一区二区三区| 伊人久久久久久久久久久| 伊色综合久久之综合久久| 成人黄色片视频| 一区二区高清免费观看影视大全 | 精品人妻无码一区二区三区蜜桃一 | 亚洲精品在线免费观看视频| 欧洲av一区二区| av免费观看国产| 亚洲乱码国产乱码精品精98午夜| 日韩a在线观看|