精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

EMNLP 2025 | CARE:無需外部工具,讓大模型原生檢索增強推理實現上下文高保真

人工智能 新聞
來自 MetaGPT、蒙特利爾大學和 Mila 研究所、麥吉爾大學、耶魯大學等機構的研究團隊發布 CARE 框架,一個新穎的原生檢索增強推理框架,教會 LLM 將推理過程中的上下文事實與模型自身的檢索能力有機結合起來。

近日,來自 MetaGPT、蒙特利爾大學和 Mila 研究所、麥吉爾大學、耶魯大學等機構的研究團隊發布 CARE 框架,一個新穎的原生檢索增強推理框架,教會 LLM 將推理過程中的上下文事實與模型自身的檢索能力有機結合起來。該框架現已全面開源,包括訓練數據集、訓練代碼、模型 checkpoints 和評估代碼,為社區提供一套完整的、可復現工作。

  • 項目主頁:https://foundationagents.github.io/CARE
  • 論文地址:https://arxiv.org/abs/2509.13683
  • 開源代碼:https://github.com/FoundationAgents/CARE
  • 開源模型 & 數據集:

https://huggingface.co/collections/sheryc/care-datasets-emnlp-2025-68be35242afab58f4bed7d97

https://huggingface.co/collections/sheryc/care-checkpoints-emnlp-2025-68be35dbd732816c9d98f258

研究背景

從“外部搜索”到“原生檢索”的轉變

1、現有方法的困境

目前解決上下文保真度問題主要有兩條路:1. 搭建復雜的 RAG 系統,依賴向量數據庫、檢索器等一整套基礎設施;2. 讓模型去調用搜索引擎,但這樣反而忽略了用戶已經提供的寶貴信息。這兩種方法都把檢索當作一個獨立的外部過程,沒有真正融入模型的思考流程。與此同時,目前的LLM有著較強的多任務能力,所以檢索器和理解模型在長上下文閱讀中或許可以被LLM所統一。

2、CARE:讓檢索成為推理的一部分

CARE 的突破在于提出了原生檢索增強推理這一全新范式。簡單來說,就是教會模型在推理過程中利用模型本身的能力自然地引用輸入文本中的關鍵信息。就像學生在答題時會在試卷上劃重點一樣,模型會在思考過程中插入類似“根據文檔第三段提到...”這樣的引用,確保每一步推理都有據可依。

這種方法的優勢顯而易見:不需要額外的檢索系統,不增加推理延遲,部署極其簡單。對于使用 LLM 的項目來說,只需要替換模型權重就能獲得顯著的性能提升。

技術實現:兩階段訓練策略

CARE 采用了精心設計的兩階段訓練流程,確保模型既能學會檢索-推理的格式,又能在各種場景下靈活運用。

第一階段:讓模型學會“引用”

研究團隊首先基于 HotpotQA 數據集構建了訓練數據。通過一個巧妙的數據生成流程,他們將原始的問答數據轉換成包含明確引用的推理鏈。例如,當模型需要回答“約翰的媽媽買的電影票價格合理嗎”時,它會先思考“需要從用戶輸入中抽取約翰的媽媽買票的價格”,再利用自身能力自回歸地引用用戶輸入中出現的原文片段“票價是 15 美元”。之后,它再次思考“需要從用戶輸入中抽取普通票價”,再自回歸地引用“普通場次票價范圍是 10-12 美元”,最后得出結論。

這個階段使用監督學習,讓模型熟悉這種“先查找,再推理”的思考模式。關鍵是使用特殊標記來標識引用內容,讓模型清楚地區分哪些是從原文提取的事實,哪些是自己的推理。

第二階段:強化學習優化檢索質量

然而,僅僅學會格式還不夠,模型需要知道什么時候該檢索,檢索什么內容。第二階段采用強化學習,通過三個精心設計的獎勵信號來引導模型:

準確性獎勵確保最終答案正確,格式獎勵保證輸出規范,研究團隊在檢索獎勵上進行了創新:它鼓勵模型檢索的內容必須真實存在于原文中,不能憑空捏造。這個看似簡單的約束,實際上極大地提升了模型的上下文忠實度。

在此基礎上,為了讓模型能夠適應各種不同長度的輸入輸出,研究團隊引入了課程學習策略,讓模型從簡單的短文本問答逐步過渡到復雜的多跳推理任務。這就像教小孩先學會在一頁紙上找答案,再逐步學會在整本書中尋找線索。

評估效果

為了全面驗證 CARE 框架的有效性,研究團隊在真實世界和反事實(Counterfactual)兩大類問答基準上進行了嚴謹的實驗,并與多種主流方法進行了對比。實驗結果清晰地表明,CARE 在模型上下文保真度和回答準確性方面取得了全面且顯著的提升。

真實世界問答任務:全面超越現有方法

在涵蓋了多領域、長文本、多跳推理等復雜場景的四大主流 QA 基準(MFQA, HotpotQA, 2WikiMQA, MuSiQue)上,CARE 表現出了壓倒性的優勢。

  • 性能顯著提升:實驗數據顯示,以 Llama-3.1-8B 模型為例,搭載了 CARE 框架后的模型平均 F1 分數提升了 15.29%。 這一提升在需要綜合多個信息點進行推理的復雜多跳任務(如 2WikiMQA 和 MuSiQue)上尤為明顯,漲幅分別達到了 29.42% 和 18.92%
  • 普適性強:無論是在 Llama 還是 Qwen 等不同架構和尺寸的模型上,CARE 都能帶來一致的性能增益,證明了該框架的強大通用性。

反事實問答任務:真正做到“忠于原文”

為了測試模型在面對與自身“知識”相悖的上下文時,是否能堅守原文信息,研究團隊在 CofCA 基準上進行了測試。這被認為是檢驗模型上下文保真度的“試金石”。CofCA基準將測試中使用的長文檔由維基百科替換為了真實世界中不存在的信息,利用反事實的上下文,測試模型在用戶輸入極度OOD時的幻覺表現。

  • 上下文保真度大幅領先:CARE 能夠在給定上下文與模型預訓練知識沖突時,依然準確依據上下文作答,在 LLaMA-3.1 8B 上實現了 13.69% 的性能飛躍。
  • 揭示外部搜索的弊端:相比之下,依賴外部搜索引擎的傳統方法在這一任務上表現不佳,因為外部信息反而加劇了模型混淆,導致其忽略了眼前的“標準答案”。這凸顯了 CARE 原生檢索范式的關鍵優勢:優先并忠實于用戶提供的即時信息。

事實檢索能力評估:答得對,更找得準

CARE 的成功不僅體現在最終答案的準確性上。通過在 HotpotQA 基準上對模型檢索出的事實進行直接評估,研究團隊發現:

  • 檢索質量更高:與其他方法相比,CARE 在定位和提取關鍵支撐事實方面的能力更強,其檢索內容的 BLEU 和 ROUGE-L 分數均達到最高。 這證明了 CARE 真正學會了如何在推理過程中精準地“引用”原文,為最終答案的可靠性提供了堅實的基礎。

綜合來看,CARE 框架通過其創新的原生檢索增強推理機制,不僅在各項評估中取得了 SOTA 級別的性能,更重要的是,它為解決大型語言模型在實際應用中的“幻覺”和“上下文遺忘”問題,提供了一條高效、低成本且易于部署的全新路徑。

總結

針對 LLM 在上下文中容易丟失事實信息的固有問題,雖然已有借助 RAG 流程或調用檢索引擎進行改進的方式,但使得整體流程更長,耗時更久。CARE 則通過一種結合課程學習策略 + RL 的方法來提升 LLM 自身檢索能力,讓模型更多關注到上下文中的事實信息并進一步回答的更準確。這種使用原生檢索增強推理的范式降低了使用者的對接成本,具備更靈活的落地應用性。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-09-28 07:00:00

2024-09-05 08:24:09

2025-10-11 18:05:23

AI智能體模型

2024-03-14 08:11:45

模型RoPELlama

2024-01-29 08:49:36

RAG模型檢索

2025-10-31 01:00:00

2025-05-07 08:35:11

2025-03-18 08:14:05

2022-09-15 08:01:14

繼承基礎設施基礎服務

2017-05-11 14:00:02

Flask請求上下文應用上下文

2025-03-04 08:42:19

2024-03-29 14:04:00

模型訓練

2012-12-31 10:01:34

SELinuxSELinux安全

2024-04-30 16:17:34

RAGLLM

2025-08-07 08:00:00

2023-11-24 17:01:30

模型推理

2023-10-23 13:23:03

數據訓練

2022-09-14 13:13:51

JavaScript上下文
點贊
收藏

51CTO技術棧公眾號

精品福利一二区| 国产精品毛片a∨一区二区三区| 久久久久久18| 真实乱视频国产免费观看| 久久青草免费| 亚洲国产日韩在线一区模特| 欧美连裤袜在线视频| 亚洲综合网av| 日韩午夜在线电影| 在线丨暗呦小u女国产精品| 亚洲男人天堂2021| 性欧美freesex顶级少妇| 国产精品美女一区二区三区| 成人看片视频| 亚洲精品一区二三区| 91精品国产91久久久久久黑人| 亚洲国产精品久久久| 91热这里只有精品| 美女91在线| 欧美激情一区二区三区不卡| 官网99热精品| 91一区二区视频| 玖玖精品视频| 午夜精品免费视频| 欧美视频一区二区在线| 亚洲精品动态| 亚洲精品在线观看视频| 波多野结衣国产精品| 日本乱码一区二区三区不卡| 综合久久综合久久| 水蜜桃亚洲一二三四在线| 黄色片一区二区三区| 精品一区二区三区免费视频| 日韩av电影手机在线| 国产一级性生活| 亚洲综合自拍| 色系列之999| 播金莲一级淫片aaaaaaa| japanese色系久久精品| 91精品国产免费| 538任你躁在线精品免费| 中文字幕成在线观看| 亚洲国产综合91精品麻豆| 偷拍盗摄高潮叫床对白清晰| √新版天堂资源在线资源| 久久久www成人免费无遮挡大片| 国产精品亚洲综合| 国模无码一区二区三区| 成人综合婷婷国产精品久久免费| 91在线视频导航| 国产精品免费无遮挡| 久久久久久夜| 国产精品福利观看| 中文在线观看av| 日本91福利区| 久久久久久亚洲精品中文字幕| 欧美久久久久久久久久久久| 欧美精品1区| 九九热最新视频//这里只有精品| 久久久久亚洲AV成人| 欧美不卡一区| 久久久久这里只有精品| 精品无码免费视频| 在线成人国产| 欧美亚洲第一区| 老熟妇仑乱一区二区av| 日韩影院在线观看| 国产精品爽爽ⅴa在线观看| 亚洲天堂aaa| 国产最新精品免费| 99久久国产免费免费| 丰满熟妇人妻中文字幕| 99精品在线观看视频| 久久久久se| 97视频在线观看网站| 综合网在线视频| 国产乱子伦精品视频| 草莓视频丝瓜在线观看丝瓜18| 亚洲成人你懂的| 99精品免费在线观看| 日韩精品三区| 欧美精品色一区二区三区| 古装做爰无遮挡三级聊斋艳谭| 一区二区在线免费播放| 日韩大片免费观看视频播放| 亚洲国产av一区| 久久理论电影| 欧美国产日韩一区二区在线观看| 国产精品一区二区6| 日韩中文字幕亚洲一区二区va在线| 国产精品一区久久| 亚洲精品一区二区三区不卡| 久久婷婷久久一区二区三区| 亚洲一区二区三区色| 日韩特级毛片| 在线视频亚洲一区| 亚洲少妇一区二区| 精品中文一区| 欧美大秀在线观看| 中文在线免费观看| 成人禁用看黄a在线| 日韩亚洲欧美精品| 538视频在线| 欧美麻豆精品久久久久久| 无码任你躁久久久久久老妇| 色无极亚洲影院| 88xx成人精品| av在线亚洲天堂| 国产亚洲午夜高清国产拍精品| 97在线免费视频观看| 亚洲日本网址| 亚洲国产一区二区三区四区| av最新在线观看| 模特精品在线| 国产尤物91| √天堂8在线网| 欧美精品在线一区二区| 人妻体内射精一区二区| 在线成人黄色| 91精品国产91久久久久青草| 1769视频在线播放免费观看| 欧美视频第一页| 在线免费看黄色片| 午夜欧美精品| 成人黄色免费片| 超碰97在线免费观看| 精品久久久久久中文字幕| 免费看的av网站| 日韩国产一区二区三区| 日韩免费在线视频| 亚洲色图另类小说| 亚洲成av人片观看| 国产大尺度视频| 久久久国产精品| 国产一区二区色| 成人免费在线视频网| 一本在线高清不卡dvd| 在线免费观看污视频| 欧美日韩亚洲国产精品| 亚洲精品日产aⅴ| 日韩黄色影院| 精品视频在线视频| 色婷婷国产精品免| 免费在线看成人av| 日本一区免费| 成人国产精品一区二区免费麻豆| 亚洲欧洲偷拍精品| 人妻 日韩精品 中文字幕| 99久久久久久99| 鲁一鲁一鲁一鲁一澡| 日韩精品丝袜美腿| 欧美一区二区三区精品电影| 国产又爽又黄网站亚洲视频123| 欧美日韩激情美女| 成人片黄网站色大片免费毛片| 亚洲一区观看| 三区精品视频观看| 成人免费一区| 精品国产自在精品国产浪潮| 国产伦理一区二区| 亚洲激情av在线| 国产在线不卡av| 蜜桃伊人久久| 亚洲免费视频一区| 精品中文字幕一区二区三区四区 | 亚洲欧美日韩精品永久在线| 亚洲国产成人高清精品| 无套内谢大学处破女www小说| 国产欧美三级| 亚洲v国产v| 久久爱www.| 91国自产精品中文字幕亚洲| 九一国产在线| 制服丝袜中文字幕一区| 免看一级a毛片一片成人不卡| 成人精品一区二区三区中文字幕 | 免费xxxx性欧美18vr| 国产又黄又爽免费视频| 久久这里只有精品一区二区| 欧美一区二区.| 麻豆影院在线观看| 亚洲大胆人体在线| 亚洲免费视频二区| 亚洲精品成人悠悠色影视| 欧产日产国产精品98| 日韩精品视频网| 欧美日韩午夜爽爽| 亚洲动漫精品| 亚洲综合在线小说| 亚洲黄色免费av| 久久夜色精品国产| 神马亚洲视频| 人禽交欧美网站| 欧美性受黑人性爽| 人人网欧美视频| 国产精品自产拍高潮在线观看| av片在线观看网站| 亚洲欧美福利视频| 国产视频手机在线| 一本大道av一区二区在线播放| 日韩三级在线观看视频| 99re亚洲国产精品| 亚洲免费在线播放视频| 亚洲一区二区网站| 国产精品日韩三级| 精品在线99| 国产乱码一区| 91精品一久久香蕉国产线看观看| 欧美一区第一页| 欧美人与牲禽动交com| 中文日韩电影网站| 午夜影院免费体验区| 欧美日韩亚洲综合在线 欧美亚洲特黄一级| 国产一级做a爱免费视频| 国产精品美女久久福利网站| 亚洲调教欧美在线| 国产剧情一区二区| 污视频网址在线观看| 久久婷婷丁香| 黄色一级视频在线播放| 一区二区三区在线电影| 香蕉久久免费影视| 亚洲肉体裸体xxxx137| 91黄在线观看| 国产一区二区三区视频在线| 国产精品成人国产乱一区| 理论不卡电影大全神| 欧美日韩成人在线播放| 久久久久久国产精品免费无遮挡| 亚洲最新av网址| 日本a一级在线免费播放| 日韩欧美美女一区二区三区| 97超碰资源站| 欧美日韩国产成人在线91| 亚洲精品一区二三区| 在线视频欧美区| 波多野结衣一二区| 日本韩国欧美国产| 天堂网视频在线| 欧美性猛交xxxx偷拍洗澡| 午夜影院在线看| 黄网站色欧美视频| 国产欧美一区二区三区在线看蜜臂| 亚洲成a人v欧美综合天堂下载| 久久久久久久久久久97| 亚洲一线二线三线久久久| 久久精品一级片| 亚洲狠狠爱一区二区三区| 福利一区二区三区四区| 亚洲一区二区中文在线| 日本少妇xxxx动漫| 天天亚洲美女在线视频| 精品欧美一区二区三区免费观看| 精品久久久久久亚洲精品| 色一情一乱一伦| 在线看日韩精品电影| 正在播放亚洲精品| 欧美精品一二三| 亚洲毛片在线播放| 亚洲第一天堂av| 国产鲁鲁视频在线观看免费| 综合欧美国产视频二区| 欧美黑人激情| 欧美乱大交xxxxx另类电影| 密臀av在线| 日本久久久久久久| 日韩电影精品| 97人人香蕉| 日韩欧美国产大片| 色综合久久av| 欧美va亚洲va日韩∨a综合色| 很污的网站在线观看| 香蕉久久国产| 老司机午夜性大片| 成人综合婷婷国产精品久久| 亚洲最大的黄色网| 中文字幕成人网| 久草成人在线视频| 欧美午夜精品在线| 国产又粗又黄又爽的视频| 欧美不卡激情三级在线观看| 性感美女一级片| 日韩一区二区三区在线播放| 国产第一页在线| 国产精品青草久久久久福利99| japansex久久高清精品| 久久96国产精品久久99软件| 欧美丝袜一区| 日本人体一区二区| 蜜桃一区二区三区在线观看| 极品白嫩的小少妇| 国产日韩欧美在线一区| 免费在线观看国产精品| 色婷婷综合久久久| www.桃色av嫩草.com| 一区二区三区四区精品| 精品精品导航| 国产免费一区视频观看免费 | www.成人爱| 亚洲自拍偷拍第一页| 免费电影一区二区三区| 浴室偷拍美女洗澡456在线| 久久这里只有| 中文字幕人妻一区二区三区| 国产精品电影一区二区| 在线观看亚洲天堂| 欧美一区二区三区视频在线 | 色综合久综合久久综合久鬼88| 日韩网站中文字幕| 国产精品有限公司| 先锋资源久久| 青青草av网站| 91视频在线看| 精品视频一区二区在线观看| 欧美日韩高清一区二区不卡| 日本成人一区二区三区| 久久久久久久久久久免费 | 青青草伊人久久| 国产精品无码午夜福利| 亚洲一区二区三区小说| 国产精品毛片一区二区在线看舒淇| 亚洲天堂男人的天堂| 美女av在线免费看| 国产免费一区| 欧美色综合网| 人妻av一区二区三区| 亚洲欧美日韩系列| 一二区在线观看| 在线观看国产精品淫| 欧美18—19sex性hd| 免费av在线一区二区| 日韩一区二区久久| 欧美xxxxx少妇| 亚洲一区二区三区美女| 精品国产乱码一区二区三| 久久九九有精品国产23| 日本成人在线网站| 亚洲国产欧美不卡在线观看| 天堂在线亚洲视频| 欧美特黄一区二区三区| 欧美性xxxx极品高清hd直播| 五月天婷婷视频| 欧美在线视频a| 自拍偷拍一区| 国产精品无码专区av在线播放 | 日韩免费电影一区| 成人在线观看亚洲| 91欧美激情另类亚洲| 91精品国产视频| 黄页网站在线看| 亚洲成av人影院| 欧美女子与性| 国产精品免费电影| 99久久www免费| 中文字幕无码毛片免费看| 亚洲精品视频在线观看网站| 国产sm主人调教女m视频| 久久成人av网站| 都市激情久久| 丰满人妻中伦妇伦精品app| 337p粉嫩大胆噜噜噜噜噜91av | 女人高潮被爽到呻吟在线观看| 国内精品视频在线播放| 久久精品中文| 日本裸体美女视频| 精品久久国产字幕高潮| 在线视频cao| 一级做a爰片久久| 高清国产午夜精品久久久久久| 黄色片视频网站| 一区二区三区黄色| 日韩精品第二页| 欧美无砖专区免费| 久久久影视传媒| 国产乱叫456在线| 97在线视频国产| 成人综合久久| 男男受被啪到高潮自述| 黑人巨大精品欧美一区二区三区| av资源种子在线观看| 91老司机在线| 亚洲麻豆视频| 美女福利视频网| 亚洲成人av在线播放| 素人一区二区三区| 菠萝蜜视频在线观看入口| 久久综合色天天久久综合图片| 亚洲图片小说视频| 久久久人成影片一区二区三区观看| 亚洲精品一级二级三级| 色网站在线视频| 日韩欧美成人区| 18加网站在线| 亚洲国产日韩欧美| 成人精品免费网站| 夜夜嗨av禁果av粉嫩avhd| 91po在线观看91精品国产性色| 99久久夜色精品国产亚洲1000部| 国产 xxxx| 日韩免费福利电影在线观看|