RAG數據召回優化方案——先進行標量召回再進行相似度召回原創

AI探索時代

發布于 2025-10-9 06:56

瀏覽

0收藏

“ RAG召回時最好進行多次過濾，這樣才能大大提升召回文檔的質量。”

關于RAG數據召回技術，大家都都知道現在普遍使用的是相似度(語義)召回方式；但對沒有真正實際操作過的人來說，可能會認為RAG只能進行相似度召回；但在真正的業務場景中，標量召回的效果可能會比相似度召回更好。

原因在于，RAG的目的是為了更準確的召回與問題相關的內容，但并沒有限制具體的召回方式，不論是傳統的字符匹配，分詞技術(如es)，還是現在爆火的相似度計算都可以作為數據召回的手段，而且可以根據不同的場景選擇合適的召回方式。

標量召回和相似度召回

標量召回就是基于傳統的字段匹配的方式，而相似度召回是基于向量計算的方式；其分別對應傳統的關系型數據庫和現在的向量數據庫。

向量數據庫作為一個相對比較新的中間件，可能部分剛開始學習向量數據庫的人并不了解其運作機制，可能會有人認為其只支持向量計算。

但事實是，向量數據庫和傳統的數據庫并沒有什么特別本質的區別，其更像是在傳統數據庫的基礎之上，增加了向量計算，以及單獨的向量字段，因此向量數據庫同樣支持傳統的字符匹配模式。

RAG數據召回優化方案——先進行標量召回再進行相似度召回-AI.x社區

我們都知道在RAG中有一個非常重要的組件——Embedding嵌入模型，其作用是把自然語言轉換成向量形式。

而向量數據庫的運作原理就是，在文檔處理階段，通過對文檔進行拆分，然后再通過embedding模型把拆分之后的文檔轉換成向量模式，之后保存到向量數據庫中的向量字段中。

然后在用戶提問時，通過同樣的方式把用戶問題轉換成向量模式，之后再通過某種計算方式對用戶問題和拆分的文檔進行向量匹配，如歐式距離，余弦相似度計算等方式，來計算用戶問題和具體文檔之間的相似度，相似度越高，其語義相關性越大；這就是相似度召回的基本原理。

但是呢，相似度計算畢竟不是很準確，特別是在語義不明確的情況下；其召回的數據質量真的無法保證，因此這時就需要使用標量召回配合相似度召回來提升文檔的召回質量。

RAG數據召回優化方案——先進行標量召回再進行相似度召回-AI.x社區

舉例來說，針對不同的用戶可能存在不同的特性，然后可以把這些特性作為文檔的屬性進行數據隔離；如有些文檔屬于部門專有文檔，有些文檔屬于用戶文檔，有些文檔又屬于企業內部文檔；而部門名稱，用戶文檔，企業文檔等都屬于數據特征。

因此，不同用戶提出的問題，可以先根據用戶所在的部門，或者屬于消費者和管理者的角色，先篩選出對于角色的文檔；然后再次基礎之后，在進行相似度召回，這樣就能大大提升文檔召回的準確率。

本文轉載自???AI探索時代??? 作者：DFires

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

RAG

數據召回

Embedding嵌入模

贊

回復

舉報

回復

相關推薦

Advanced RAG 07：在 RAG 系統中進行表格數據處理的新思路

Baihai_IDP ? 7831瀏覽 ? 0回復
如何訓練LLM自動在RAG和參數記憶之間進行選擇

51CTO內容精選 ? 4080瀏覽 ? 0回復
Advanced RAG 11：對用戶輸入的內容進行「分類處理」和「再優化」

Baihai_IDP ? 3893瀏覽 ? 0回復
披上Agent盔甲的RAG，從此不再只是召回生成！

探索AGI ? 3751瀏覽 ? 0回復
SELF-REFINE: 通過自反饋進行迭代優化

AIRoobt ? 6112瀏覽 ? 0回復
適用于TTS語音處理項目的召回模型：詞袋模型究竟是個啥？和語義召回相比有什么優劣？

AI博物院 ? 3640瀏覽 ? 0回復
再看多模態RAG進行文檔問答的方案

大模型自然語言處理 ? 4147瀏覽 ? 0回復
解鎖Agentic RAG，使用LangChain和OpenAI進行實踐

小虎哦哦 ? 5433瀏覽 ? 0回復
怎么提升向量數據庫的召回準確率

AI探索時代 ? 4531瀏覽 ? 0回復
使用YOLO進行目標檢測

一起AI技術 ? 4861瀏覽 ? 0回復
Contextual Embedding讓chunk自帶上下文，精準召回，效果立竿見影！

AI博物院 ? 2925瀏覽 ? 0回復
關于RAG應用中怎么高質量的進行數據召回——召回策略的研究

AI探索時代 ? 3563瀏覽 ? 0回復
在RAG中文檔處理質量參差不齊的情況下——提升召回精度的企業級解決方案

AI探索時代 ? 1440瀏覽 ? 0回復
RAG中召回率和召回準確度的區別和聯系

AI探索時代 ? 1550瀏覽 ? 0回復
DoorDash如何利用知識圖譜增強大模型提升搜索召回精度

知識圖譜科技 ? 1162瀏覽 ? 0回復
記一次RAG問題優化——當需要從多個向量庫中召回數據會面臨那些問題？

AI探索時代 ? 1166瀏覽 ? 0回復
RAG數據召回詳細技術解決方案

AI探索時代 ? 1703瀏覽 ? 0回復
基于大模型的智能問答場景解決方案——RAG提升召回率的關鍵

AI探索時代 ? 1285瀏覽 ? 0回復
提升RAG召回和生成效果策略之——小塊檢索，大塊生成

AI探索時代 ? 244瀏覽 ? 0回復

AI探索時代

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

51CTO

51CTO博客

51CTO學堂

RAG數據召回優化方案——先進行標量召回再進行相似度召回原創

標量召回和相似度召回

目錄

51CTO

51CTO博客

51CTO學堂

RAG數據召回優化方案——先進行標量召回再進行相似度召回 原創

標量召回和相似度召回

目錄

RAG數據召回優化方案——先進行標量召回再進行相似度召回原創