精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當RAG遇上噪聲難題:中科院團隊提出“段落注入”,讓LLMs在推理中辨偽存真

人工智能
中科院的團隊發表于2025年SIGIR-AP會議的一項研究,為解決這一難題提供了新思路。該研究從LLMs的推理與自我反思能力出發,提出“段落注入(Passage Injection)”方法,將檢索段落實例性地融入模型推理過程,既提升了RAG系統的整體性能,又顯著增強了模型對噪聲的抵御能力。

在檢索增強生成(RAG)技術廣泛應用的今天,一個關鍵問題始終困擾著開發者:檢索到的段落往往夾雜噪聲(低質量、無關甚至誤導性內容),這些噪聲會誤導大語言模型(LLMs),導致生成錯誤答案,嚴重削弱RAG系統的可靠性。

中科院的團隊發表于2025年SIGIR-AP會議的一項研究,為解決這一難題提供了新思路。該研究從LLMs的推理與自我反思能力出發,提出“段落注入(Passage Injection)”方法,將檢索段落實例性地融入模型推理過程,既提升了RAG系統的整體性能,又顯著增強了模型對噪聲的抵御能力。

  • 論文地址:https://arxiv.org/pdf/2507.19333
  • 項目地址:https://github.com/Trustworthy-Information-Access/Passage-Injection

01研究背景:RAG的痛點與LLMs的新能力

RAG的核心價值與噪聲困境

RAG的核心邏輯是“檢索+生成”:通過檢索器從外部語料庫中獲取與問題相關的段落,再將這些段落作為補充知識輸入LLMs,幫助模型突破“參數知識有限”的瓶頸,在知識密集型任務(如事實問答)中表現更優。

現實中,檢索器無法保證100%獲取高質量段落——可能檢索到與問題無關的“隨機噪聲”,也可能遇到篡改關鍵信息的“反事實噪聲”(例如將“北愛爾蘭屬于英國”錯誤表述為“屬于美國”)。這些噪聲會讓LLMs“誤入歧途”,生成錯誤答案,成為RAG系統可靠性的最大短板。

推理增強型LLMs的新機遇

近年來,推理增強型LLMs(如Qwen3、DeepSeek-R1)成為研究熱點。這類模型的核心優勢在于:生成最終答案前,會在特定標記(如</think></think>)內生成中間推理步驟,并通過自我反思識別、修正推理中的錯誤。

這一能力為解決RAG噪聲問題提供了靈感:如果能將檢索到的段落(包括噪聲段落)融入模型的推理過程,而非簡單拼接在輸入開頭,模型或許能像審視自身推理一樣,主動辨別段落中的錯誤,從而減少噪聲干擾。

02方法解析:從“輸入拼接”到“推理注入”

要理解“段落注入”的創新之處,需先明確推理增強型LLMs的工作邏輯,以及傳統RAG的局限。  

基礎:推理增強型LLMs的問答流程

對于任意問題q,推理增強型LLMs的問答過程分為三個階段,核心是“顯式推理”:

  • 輸入階段(Input Phase):模型接收并編碼問題q;
  • 推理階段(Reasoning Phase):模型在</think></think>標簽內生成推理與自我反思過程(例如“要回答‘Jamie Dornan的國籍’,需先確認他的出生地...”);
  • 響應階段(Response Phase):在</think></think>標簽后生成最終答案a。

這種流程能讓模型充分利用內部知識,但也可能導致“過度思考”——推理路徑過長、計算開銷增加,甚至產生幻覺。

目前,為LLMs賦予這種推理能力主要有兩種方式:

  • 強化學習:讓模型自主探索推理路徑(如Qwen3系列);
  • 蒸餾技術:通過教師模型的監督學習獲得推理能力(如DeepSeek-R1-Distill-Qwen)。

傳統RAG的局限:基礎RAG(Vanilla RAG)

傳統RAG的做法非常直接:將檢索到的段落集合DDD與問題qqq拼接后,直接輸入模型的“輸入階段”,即“問題+段落”的固定格式。

這種方式的核心問題是注意力不足:模型可能將段落視為“背景信息”,而非需要仔細校驗的“推理依據”,一旦段落包含噪聲,模型很容易被誤導。

例如在“Jamie Dornan的國籍”問題中,若檢索段落錯誤表述“北愛爾蘭是美國的一部分”,基礎RAG會直接采信這一信息,生成“美國”的錯誤答案(如圖1(a)左側所示)。

創新方案:段落注入(Passage Injection)

“段落注入”的核心改變是將段落從“輸入階段”移至“推理階段”

  1. 仍遵循“先檢索后閱讀”流程:用檢索器(如BM25)獲取與問題q相關的段落集合D;
  2. 輸入階段僅提供問題q,不附加任何段落;
  3. 推理階段中,模型先將段落集合D嵌入</think></think>標簽內的推理過程,再結合自身知識分析段落內容;
  4. 最后通過自我反思識別段落中的錯誤(若有),生成正確答案。

以“Jamie Dornan的國籍”問題為例,段落注入會讓模型在推理階段主動分析:“段落提到‘北愛爾蘭屬于美國’,這與我的知識沖突——北愛爾蘭實際是英國的一部分,因此段落此處存在錯誤,正確國籍應為英國”(如圖1(a)右側所示)。

消融實驗:指令注入(Instruction Injection)

為驗證“段落融入推理”的必要性,研究還設計了“指令注入”作為對照:僅將“如何使用段落”的指令(如“需結合段落與自身知識回答”)注入推理階段,段落本身仍留在輸入階段。

這一設置用于排除“僅靠指令提醒”的影響——后續實驗證明,僅注入指令的效果遠不及注入段落,說明“讓模型在推理中直接校驗段落內容”才是關鍵。

03實驗驗證:從通用場景到噪聲挑戰

為全面驗證“段落注入”的效果,研究設計了三類實驗:通用RAG場景、噪聲場景(隨機噪聲+反事實噪聲)、正確段落場景,覆蓋了RAG的核心應用場景。  

通用RAG場景:性能全面提升

在無額外噪聲的通用場景中,“段落注入”展現出顯著優勢:

  • 全模型最優:無論模型規模(8B/14B/32B)或類型(原生推理模型/蒸餾模型),段落注入的平均F1分數均高于基礎RAG與指令注入;
  • 多跳任務增益更明顯:相較于單跳任務(PopQA),多跳任務(如HotpotQA)的性能提升幅度更大——原因是多跳問題需要更復雜的推理,段落注入能幫助模型更精準地利用段落中的多步關聯信息;
  • 蒸餾模型的特殊性:蒸餾模型(DeepSeek-R1-Distill-Qwen-32B)在基礎RAG場景下表現優于原生模型(Qwen3-32B),但段落注入對其提升幅度更小——推測是因為蒸餾模型的推理能力源于“模仿教師模型”,而非自主探索,對推理過程的修改敏感度較低。

噪聲場景:魯棒性顯著增強

噪聲是RAG的核心痛點,研究重點測試了兩種典型噪聲:

  • 隨機噪聲:為每個問題隨機匹配3個無關段落(如問“國籍”,給“天氣”相關段落);
  • 反事實噪聲:采用ConFiQA數據集,段落表述流暢但關鍵事實錯誤(如“愛因斯坦發明了電燈”)。

實驗結果(如圖2所示)顯示:

  • 兩種噪聲下均占優:無論隨機噪聲還是反事實噪聲,段落注入的F1分數均顯著高于基礎RAG,尤其在更難的反事實噪聲場景中,優勢更明顯;
  • 抗干擾能力的關鍵:指令注入雖能提升一定魯棒性,但遠不及段落注入——證明“讓模型在推理中直接校驗段落”是抵御噪聲的核心;
  • 模型規模不影響優勢:從8B到32B參數模型,段落注入的提升趨勢一致,說明該方法對不同規模的推理增強型LLMs均適用。

正確段落場景:不犧牲有用信息

除了抵御噪聲,RAG還需高效利用“正確段落”(包含答案的高質量段落)。研究在僅提供正確段落的場景中測試發現:

  • 基礎RAG性能相當:段落注入在正確段落場景下,并未因“推理階段融入”而降低效率,說明其在抵御噪聲的同時,不影響對有用信息的利用;
  • 模型更受益:在8B小模型上,段落注入的性能略優于基礎RAG——原因是小模型的參數知識有限,將正確段落融入推理能幫助其更精準地提取關鍵信息,而32B大模型已能直接從輸入中高效獲取正確信息。

額外優勢:減少過度思考,縮短輸出長度

實驗還發現一個意外收獲:段落注入能顯著縮短模型的輸出長度(如表2所示)。例如Qwen3-32B在CWQ數據集上,基礎RAG的平均輸出長度為2267字符,而段落注入僅為1199字符。

這是因為段落注入讓模型的推理更“聚焦”——無需在輸入中反復掃描段落,而是在推理階段直接結合段落分析,減少了冗余的思考過程,既降低計算開銷,又讓答案更簡潔。

04總結

“段落注入(Passage Injection)” 方法在RAG系統優化中展現出明確價值:不僅能顯著提升系統整體性能,強化模型對噪聲段落的魯棒性,還能在抵御噪聲的同時,兼顧對有用段落的有效利用,為 RAG 系統的可靠性提升提供了新思路。然而,從實際應用場景的適配性來看,該方法在當前多數 RAG 應用中仍存在一定適用性局限,需從模型依賴與時延需求兩方面客觀審視。

從模型適配性角度,段落注入方法的核心優勢高度依賴推理增強型大語言模型(LLMs)的特性 —— 這類模型具備顯式的中間推理與自我反思能力,能夠將檢索段落融入推理過程,主動識別并抵御噪聲。但當前多數 RAG 應用場景為平衡成本與運行效率,更傾向于采用非推理型基礎 LLM(如側重生成速度的輕量型模型)。這類非推理模型缺乏 “顯式中間推理階段” 這一技術前提,既無法實現 “將檢索段落嵌入推理過程” 的操作,也難以發揮段落注入在噪聲識別、錯誤修正上的核心價值,最終導致方法與實際場景的模型基礎不匹配,限制了其應用范圍。

從時延需求角度,段落注入方法在推理階段需額外完成檢索段落的融入、內容分析與錯誤校驗,相較于基礎 RAG(Vanilla RAG)“直接將段落拼接至輸入” 的簡單流程,顯著增加了推理鏈路的復雜度與計算步驟。而多數 RAG 實際應用(如實時問答系統、智能客服對話機器人等)對時延敏感度極高,要求模型在短時間內快速響應并生成結果,段落注入帶來的時延增量可能超出場景可接受范圍,進而影響用戶體驗或系統整體運行效率。

綜上,盡管段落注入在推理增強型 LLM 適配場景與噪聲敏感型任務中表現出突出的性能優勢,但受限于當前多數 RAG 應用對 “非推理模型” 的依賴,以及對 “低時延” 的核心需求,該方法在主流應用場景中的適配性仍有待提升。未來探索檢索端與生成端的協同優化,若推理模型在思考過程中能識別出 “哪些段落是噪聲”“哪些段落對推理有用”,這種來自推理階段的反饋(本質是對檢索結果質量的判斷),理論上可作為強化學習的獎勵信號,反哺檢索器的優化(如調整檢索策略、優化相關性排序算法),從源頭減少噪聲段落的檢索,進一步提升 RAG 系統的整體性能。

責任編輯:龐桂玉 來源: 小白學AI算法
相關推薦

2025-09-04 07:52:16

2025-10-28 08:44:00

AI計算機智能體

2023-06-27 17:35:39

FastSAM模型SAM

2025-09-08 09:35:15

2025-10-29 16:16:49

Auto-RAGRAG大語言模型

2025-02-08 13:30:00

2022-02-19 08:21:21

中科院量子計算編程軟件

2025-03-07 09:57:01

2013-05-22 09:33:09

交互設計設計時間

2022-02-24 16:15:16

OpenHarmon鴻蒙OpenEuler

2016-10-21 15:57:39

Rust編輯語言Fedora

2018-02-28 16:20:57

中科睿芯

2023-07-17 11:02:36

模型開源

2025-08-28 09:09:00

AI強化學習模型

2024-08-08 13:04:28

2017-06-28 11:34:55

銳捷 醫療 物聯網

2015-01-07 15:49:21

大數據SSD

2017-08-18 14:47:31

DDD微服務架構

2025-06-09 09:32:35

2025-05-09 08:40:00

點贊
收藏

51CTO技術棧公眾號

国产精品白丝av嫩草影院| 国产三级在线| 国产亚洲毛片在线| 神马国产精品影院av| 色综合久久久无码中文字幕波多| h片在线观看视频免费| 国产欧美一区视频| 国产精品国产三级国产专区53 | 综合综合综合综合综合网| 欧美性感一区二区三区| 国产免费一区二区视频| 在线免费观看的av网站| 99在线热播精品免费| 成人网址在线观看| 国产一级片av| 日韩亚洲国产欧美| 欧美精品一区在线播放| 微拍福利一区二区| 欧美亚视频在线中文字幕免费| 欧美精品一区三区在线观看| 蜜桃av乱码一区二区三区| 国产一区二区视频在线看| 欧美日韩一区二区在线播放| 中文字幕乱码免费| 国产高清视频在线播放| 成人国产精品免费| 亚洲a∨日韩av高清在线观看| 国产精品va无码一区二区三区| 欧美日本精品| 日韩在线国产精品| 97人妻人人揉人人躁人人| 欧美交a欧美精品喷水| 日韩欧美一级二级三级久久久| 97公开免费视频| 午夜不卡影院| 欧美日韩性视频| 久久av综合网| 激情影院在线| 一区二区三区**美女毛片| 一区二区三区国| 91看片在线观看| 久久久久久久久99精品| 国产精品成人一区二区三区 | 日韩精品三区四区| 国产成人欧美在线观看| 在线免费黄色av| 国产精品日韩久久久| 久久全球大尺度高清视频| 久久97人妻无码一区二区三区| 91精品电影| 久久影视免费观看 | 午夜久久久影院| 无码人妻少妇伦在线电影| 国产www视频在线观看| 樱花草国产18久久久久| 国产日韩欧美大片| 久草在线资源站资源站| 亚洲成人动漫一区| 国产日韩av网站| 欲香欲色天天天综合和网| 色综合天天视频在线观看| www.亚洲天堂网| 日本中文字幕一区二区| 欧美日韩成人激情| 欧美日韩理论片| 视频在线一区| 日韩成人av网| 成熟人妻av无码专区| 久久中文亚洲字幕| 九色91av视频| 日韩一区二区视频在线| 日韩高清不卡一区二区| 亚洲xxxxx| 亚洲av毛片成人精品| 国产亚洲欧美日韩在线一区| 中文字幕一区二区中文字幕| 羞羞的视频在线看| 色悠悠亚洲一区二区| 91女神在线观看| avtt综合网| 亚洲三级 欧美三级| 亚洲人做受高潮| 狠狠入ady亚洲精品经典电影| 欧美专区在线观看| 国产又黄又粗又硬| 99久久精品免费观看| 视频在线99re| 国产精品186在线观看在线播放| 日韩欧美在线视频日韩欧美在线视频| 国产日韩欧美久久| 日本成人a网站| 日韩在线观看免费av| 日本一级淫片色费放| 久久精品av麻豆的观看方式| 国产精品国产三级国产专区53| 国产精品一区二区三区四区色 | 可以在线观看av的网站| 青青草国产成人av片免费| 99re在线播放| 91在线免费看| 岛国av一区二区三区| 亚洲欧美偷拍另类| 国产欧美日韩精品一区二区免费 | 日韩在线观看你懂的| 91国产丝袜播放在线| 韩国一区二区视频| 日韩精品无码一区二区三区| 欧洲精品二区| 9191国产精品| 欧美 日韩 成人| 最新成人av网站| 亚洲a成v人在线观看| 国产精品一区在线看| 岛国av午夜精品| 国产人成视频在线观看| 欧美韩国一区| 国产综合久久久久| 国产免费av高清在线| 欧美日韩国产精品专区 | 国产麻豆一区二区三区精品视频| 久久久免费观看视频| 国产免费久久久| 国产精品乱码久久久久久| 国产成人亚洲精品无码h在线| 日韩精品一区国产| 久久五月天色综合| 中文字幕在线播出| 国产日韩欧美精品一区| 日本精品免费在线观看| 老司机精品在线| 久久久久久久一区二区| 国产ts人妖调教重口男| 国产精品国产三级国产aⅴ原创| 成人免费xxxxx在线视频| 亚欧日韩另类中文欧美| 97在线视频免费播放| 亚洲av无码国产精品久久不卡| 亚洲欧美在线aaa| 九九热精品国产| 天天综合国产| 91天堂在线视频| 国产网站在线免费观看| 在线播放中文字幕一区| 亚洲一级理论片| 另类欧美日韩国产在线| 艳色歌舞团一区二区三区| 91综合国产| 视频一区视频二区国产精品 | 精品无码人妻一区二区三区| 国产成人综合在线观看| 喜爱夜蒲2在线| h视频久久久| 91精品国产一区| 青青草手机在线| 色94色欧美sute亚洲线路一久| 无码人妻aⅴ一区二区三区69岛| 久久美女性网| 亚洲看片网站| 欧美电影院免费观看| 欧美激情一二三| 亚洲色欧美另类| 色狠狠一区二区| 潘金莲一级黄色片| 国产河南妇女毛片精品久久久| 成人免费看片'免费看| 精品伊人久久久| 国产精品日韩精品| 99福利在线| 精品在线欧美视频| 在线不卡免费视频| 亚洲一区二区在线免费观看视频 | 国产精品久久久久久久浪潮网站 | 日本wwww视频| 97偷自拍亚洲综合二区| 国产精品国产一区二区| 欧美极品免费| 久久精品小视频| 天天躁日日躁狠狠躁喷水| 91福利在线导航| 国产黄色片在线免费观看| 91原创在线视频| 奇米影视四色在线| 精品电影一区| 亚洲 日韩 国产第一区| 一区二区在线视频观看| 国产99久久精品一区二区 夜夜躁日日躁| 伊人在线视频| 日韩精品久久久久| 国产美女自慰在线观看| 婷婷丁香激情综合| 午夜激情福利电影| 99精品欧美一区| 亚洲高清视频免费| 久久精品亚洲| 高清无码视频直接看| 蜜臀av免费一区二区三区| 91老司机在线| 免费看av不卡| 久久久免费精品| 老司机精品影院| 亚洲欧美日韩视频一区| 亚洲乱码在线观看| 欧美三级日韩三级| 国产一级片毛片| 亚洲一区二区高清| 亚洲综合视频网站| 中文字幕精品在线不卡| 亚洲蜜桃精久久久久久久久久久久| 精彩视频一区二区三区| 免费av网址在线| 日韩视频久久| 人妻激情另类乱人伦人妻| 99视频精品全部免费在线视频| 欧美连裤袜在线视频| 精品女人视频| 国产精品 日韩| 免费精品一区二区三区在线观看| 国产精品国产福利国产秒拍| 国产一二三在线| 欧美高清视频在线播放| 国产激情在线视频| 日韩中文字幕免费看| 国产视频在线看| 亚洲精品少妇网址| 视频一区二区在线播放| 欧美成人a在线| www.中文字幕| 日韩一卡二卡三卡| www.com在线观看| 91精品国产欧美一区二区18 | 久久久成人免费视频| 激情久久av一区av二区av三区| 久久精品波多野结衣| 亚洲激情图片一区| 青娱乐国产在线| 亚洲综合一区二区三区| 久久精品www人人爽人人| 亚洲综合另类小说| 国产亚洲成人av| 亚洲综合免费观看高清完整版在线| 欧美成人精品欧美一级私黄| 亚洲三级在线免费观看| 成人涩涩小片视频日本| 亚洲色图欧美激情| 欧美日韩在线视频免费| 一级女性全黄久久生活片免费| 久久久久久国产精品免费播放| 一区二区三区欧美激情| 日本系列第一页| 福利一区福利二区微拍刺激| 日本高清不卡码| 精品视频在线免费观看| 一区二区www| 欧美大片顶级少妇| 日本免费网站在线观看| 国产丝袜精品视频| jizz日韩| 久久精品国产欧美激情| 亚洲性图自拍| 2020国产精品视频| 日韩欧美一区二区三区免费观看| 国产乱人伦真实精品视频| 成人51免费| 国产伦精品一区二区三区高清版| 任你弄精品视频免费观看| 日韩一区国产在线观看| 亚洲精品久久久| 亚洲人精品午夜射精日韩| 男人天堂欧美日韩| 成年人三级黄色片| 国产白丝网站精品污在线入口 | 亚洲视频在线观看三级| 久久久精品国产sm调教| 精品日韩美女的视频高清| 在线播放一级片| 亚洲国产精品人久久电影| 毛片免费在线观看| 欧美成人一区二区三区电影| www.51av欧美视频| 国产男女猛烈无遮挡91| 国产精品极品| 亚洲一区三区| 国产一区二区三区的电影| 91最新在线观看| 国产成人在线免费观看| 日韩在线免费观看av| 亚洲精品成人少妇| 黄色av网站免费观看| 日韩欧美国产午夜精品| 成人免费在线视频网| 久久免费视频在线观看| 亚洲人体在线| 欧美一区1区三区3区公司| 雨宫琴音一区二区三区| aaaaaa亚洲| 成人午夜电影小说| 狂野欧美性猛交| 欧美日韩在线一区| www.亚洲黄色| 精品国产自在精品国产浪潮| 蜜桃麻豆av在线| 99re6热在线精品视频播放速度| 欧美呦呦网站| 黄色一级大片在线观看| 成人黄色a**站在线观看| 91久久国产综合| 欧美日韩高清一区| 国产精品一区二区三区四区色| 91精品国产网站| 国产精品成人自拍| 18视频在线观看娇喘| 奇米777欧美一区二区| a天堂视频在线观看| 伊人开心综合网| 国产精品自偷自拍| www.99久久热国产日韩欧美.com| 韩国精品主播一区二区在线观看| 鲁片一区二区三区| 亚洲精品综合| 亚洲精品鲁一鲁一区二区三区 | www激情久久| 日韩欧美视频在线免费观看| 精品日韩99亚洲| 男女在线观看视频| 亚洲精品女av网站| 自拍偷拍欧美专区| 手机免费av片| 国产精品久久精品日日| 波多野结衣视频网址| 亚洲欧美在线看| 欧美成人免费电影| 欧美日韩在线精品一区二区三区| 亚洲欧美日韩国产一区二区| 国产精品无码永久免费不卡| 精品色蜜蜜精品视频在线观看| 天堂在线资源网| 51ⅴ精品国产91久久久久久| 国产精品自在线拍| 国产原创中文在线观看| www.欧美日韩国产在线| 中文字幕亚洲精品在线| 日韩高清a**址| 中文字幕在线直播| 欧美一区免费视频| 天堂成人免费av电影一区| 韩国三级hd中文字幕| 欧美日韩一区成人| 欧美成人三区| 动漫一区二区在线| 亚洲三级网站| 国产精品扒开腿做爽爽| 91黄视频在线| 国产激情视频在线| 国产精品传媒毛片三区| 午夜在线精品| 农村老熟妇乱子伦视频| 日韩午夜激情视频| 九色porny丨国产首页在线| 欧美日韩精品一区| 老司机免费视频一区二区三区| 欧美成人777| 亚洲丁香久久久| 欧洲av一区二区| 特级西西444| 99久久国产综合精品女不卡| 国产情侣小视频| 亚洲二区精品| 91福利国产成人精品播放| 中文文精品字幕一区二区| 黄色大片在线免费看| 91美女精品福利| 中文字幕永久在线观看| 欧美成人午夜影院| 亚洲深夜福利在线观看| 91av视频免费观看| 亚洲成人在线网站| 九色视频成人自拍| 91九色视频在线| 亚洲久久一区| 色偷偷男人天堂| 亚洲成人久久电影| 欧美日韩尤物久久| 国产av熟女一区二区三区| 91蝌蚪国产九色| 国产乱叫456在线| 91精品国产99| 99精品视频在线观看播放| 中国xxxx性xxxx产国| 精品视频在线免费看| 欧产日产国产精品视频| 国产精品av免费| 91麻豆精品秘密| 亚洲av色香蕉一区二区三区| 国产精品高潮呻吟视频| 一区视频在线看| 蜜桃av.com| 亚洲欧美国产另类| 国产精品三p一区二区| 亚洲高清视频免费| 91极品美女在线|