精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率

發布于 2024-9-23 09:42
瀏覽
0收藏

在知識庫問答等場景中,RAG已經成為當下最流行的LLM應用范式,為LLM提供又全又準的上下文信息是眾多RAG技術努力的方向。在傳統的 RAG 解決方案中,編碼信息時往往會丟失上下文,這導致系統無法從知識庫中檢索到相關信息,如何能夠更好地保留上下文信息成為了問題關鍵。

Anthropic 研究團隊提出了“Contextual Retrieval(上下文檢索)”的創新方法在此領域取得了顯著進展。近日,他們發表文章[1]可披露了這一技術的細節,他們通過上下文嵌入(Contextual Embeddings)和上下文 BM25(Contextual BM25)(文本檢索)可以將檢索失敗率減少 49%,聯合重排序(reranking),失敗率可減少 67%。

我們一起來了解這一方法的核心內容。

上下文檢索的創新點

傳統的 RAG 系統在分割文檔時會破壞上下文,導致檢索到的信息分塊缺乏足夠的背景信息。

例如,假設你有一個包含財務信息的知識庫,并收到以下問題:“ACME 公司在 2023 年第二季度的收入增長是多少?”一個相關的分塊可能包含這樣的文本:“公司的收入比上一季度增長了 3%。”然而,這個分塊本身并沒有指定是哪家公司或相關的時間段,導致難以檢索到正確的信息或有效地使用這些信息。

研究團隊嘗試過一些業內流行的改進措施,諸如:分塊中添加文檔摘要(adding generic document summaries to chunks)[2],假設文檔嵌入(hypothetical document embedding)[3],以及索引摘要(summary-based indexing)[4],但都效果不佳。

他們通過大量實驗摸索,采用上下文檢索時通過在嵌入前為每個分塊添加特定的解釋性上下文(Contextual Embeddings)和創建 BM25 索引(Contextual BM25)來解決這個問題。例如:

原始分塊 = "公司的收入比上一季度增長了3%。"
上下文化分塊 = "這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。"

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區圖片

這種方法顯著提高了檢索的準確性,特別是在處理包含特定標識符或技術術語的查詢時。

如何實現上下文檢索

手動為知識庫中的成千上萬個分塊添加上下文顯然是不現實的。為此,研究團隊使用了 Claude 模型,通過一個特定的提示生成每個分塊的簡潔上下文,生成的上下文通常為 50-100 個 token,然后在嵌入和創建 BM25 索引之前將其添加到分塊中。

這是官方 prompt 示例:

<document>
{{WHOLE_DOCUMENT}}
</document>
Here is the chunk we want to situate within the whole document
<chunk>
{{CHUNK_CONTENT}}
</chunk>
Please give a short succinct context to situate this chunk within the overall document for the purposes of improving search retrieval of the chunk. Answer only with the succinct context and nothing else.

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

以下是詳細的實現步驟:

  1. 生成上下文

首先,研究團隊使用 Claude 為每個分塊生成上下文。通過設計一個特定的提示,Claude 可以為每個分塊生成簡潔而有意義的上下文。

例如,假設我們有一個分塊:

“公司的收入比上一季度增長了3%。”

我們可以設計一個提示,讓 Claude 生成上下文:

“請為以下分塊生成一個簡潔的上下文:‘公司的收入比上一季度增長了3%。’”

Claude 可能會生成以下上下文:

“這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。”
  1. 添加上下文到分塊

生成上下文后,將其添加到原始分塊中。這樣,每個分塊都包含了足夠的背景信息,便于后續的檢索和使用。

上下文化分塊 = "這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。"
  1. 創建嵌入

接下來,使用嵌入模型將上下文化分塊轉換為向量嵌入。向量嵌入是高維空間中的點,表示文本的語義含義。常用的嵌入模型包括 Voyage 和 Gemini,它們在實驗中表現出色。

嵌入向量 = 嵌入模型(上下文化分塊)
  1. 創建 BM25 索引

除了生成嵌入,還需要為上下文化分塊創建 BM25 索引。BM25 是一種基于詞頻和逆文檔頻率的檢索算法,能夠有效地衡量文本分塊與查詢之間的相關性。

BM25索引 = BM25模型(上下文化分塊)
  1. 存儲和檢索

將生成的嵌入向量和 BM25 索引存儲在向量數據庫和 BM25 索引庫中。這樣,當用戶輸入查詢時,系統可以同時使用嵌入向量和 BM25 索引進行檢索,從而找到最相關的上下文化分塊。

向量數據庫.存儲(嵌入向量)
BM25索引庫.存儲(BM25索引)
  1. 重排序

在檢索到相關分塊后,使用重排序技術對分塊進行過濾和排序,確保只有最相關的分塊被傳遞給生成模型。重排序可以顯著提高檢索的準確性和相關性。

相關分塊 = 向量數據庫.檢索(查詢)
重排序分塊 = 重排序模型(相關分塊)

在實現上下文檢索時,研究團隊特別指出需要考慮以下幾點:

  1. 分塊策略:考慮如何將文檔分割成分塊分塊大小、邊界和重疊的選擇會影響檢索性能。
  2. 嵌入模型:選擇合適的嵌入模型,對提高上下文檢索性能幫助更大,Gemini[5]Voyage[6]在測試中表現更好。
  3. 自定義上下文提示:雖然通用提示效果良好,但仍然可能需要針對一些場景定制提示來獲得更好的結果。
  4. 分塊的數量:將更多的塊添加到上下文窗口中,增加了包含相關信息的可能性。然而,過多的信息可能會使模型分心,因此存在一個限制。研究團隊嘗試了提供 5、10 和 20 塊,發現使用 20 塊在這三個選項中表現最佳,但仍然在一些具體場景中進行實驗選擇。
  5. 持續評估:通過將上下文化的語塊傳遞給響應生成器,并區分上下文和語塊,可以改進響應生成。

效果如何

研究團隊的實驗結果顯示:

  • 上下文嵌入將前 20 個分塊的檢索失敗率減少了 35%(從 5.7%降至 3.7%)。
  • 結合上下文嵌入和上下文 BM25 將前 20 個分塊的檢索失敗率減少了 49%(從 5.7%降至 2.9%)。

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

同時,利用提示緩存技術降低了使用成本。通過提示緩存,您不需要為每一塊都傳遞參考文檔。您只需將文檔加載到緩存中一次,然后引用之前緩存的內容即可。假設每塊有 800 個 token,8k 個 token 的文檔,50 個 token 的上下文指令,以及每塊 100 個 token 的上下文,生成上下文化塊的一次性成本為每百萬文檔 token1.02 美元。

聯合重排序進一步提升性能

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

在傳統 RAG 中,AI 系統會從知識庫中檢索到大量潛在相關的信息分塊。對于大型知識庫,這一初始檢索往往會返回大量分塊,有時多達數百個,且相關性和重要性各不相同。重排序是一種常用的過濾技術,確保只有最相關的分塊被傳遞給模型。實驗結果顯示,重排序后的上下文嵌入和上下文 BM25 將前 20 個分塊的檢索失敗率減少了 67%(從 5.7%降至 1.9%)。

Anthropic提出Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

同時注意,由于重排序在運行時增加了額外的步驟,即使所有分塊都是并行評分,也必然會增加一小部分延遲,在重排序大量分塊時表現更加明顯。重排序在使用更多分塊以獲得更好性能與更少分塊以降低延遲和成本之間存在取舍,這需要在具體的場景下嘗試不同的設置,以找到合適的平衡點。

總結

研究團隊通過大量的實驗,為大家指出了一個新的提升 RAG 性能的方法,為開發者指出了實踐新方向。

同時,研究團隊基于大量實驗的結果,給出了一些關鍵的經驗總結:

  1. 嵌入+BM25 比單獨使用嵌入效果更好(向量檢索與文本檢索相結合);
  2. Voyage 和 Gemini 是測試中效果最好的嵌入模型;
  3. 將前 20 個分塊傳遞給模型比僅傳遞前 10 個或前 5 個分塊更有效;
  4. 分塊添加上下文顯著提高了檢索準確性;
  5. 重排序比不重排序效果更好;
  6. 所有這些改進措施可以疊加:結合上下文嵌入(Voyage 或 Gemini)、上下文 BM25 和重排序步驟,并將前 20 個分塊添加到提示中,可以最大化性能提升。

對于該方法感興趣的讀者,可以在cookbook[7]指導下上手體驗。

參考資料

[1]文章: https://www.anthropic.com/news/contextual-retrieval

[2]分塊中添加文檔摘要(adding generic document summaries to chunks): https://aclanthology.org/W02-0405.pdf

[3]假設文檔嵌入(hypothetical document embedding): https://arxiv.org/abs/2212.10496

[4]索引摘要(summary-based indexing): https://www.llamaindex.ai/blog/a-new-document-summary-index-for-llm-powered-qa-systems-9a32ece2f9ec

[5]Gemini: https://ai.google.dev/gemini-api/docs/embeddings

[6]Voyage: https://www.voyageai.com/

[7]cookbook: https://github.com/anthropics/anthropic-cookbook/tree/main/skills/contextual-embeddings

本文轉載自 ??AI工程化??,作者: ully

收藏
回復
舉報
回復
相關推薦
亚洲成人一级片| 亚洲 欧美 变态 另类 综合| 亚洲天堂手机| 亚洲国产电影在线观看| 9a蜜桃久久久久久免费| 日韩精品1区2区| 99久久99久久精品国产片果冰| 国产欧美日韩不卡免费| 91热福利电影| 日本中文字幕第一页| 五月久久久综合一区二区小说| 一区二区日韩av| 狠狠色伊人亚洲综合网站色| 亚洲av人无码激艳猛片服务器| 在线视频亚洲专区| 日韩一级高清毛片| www.四虎成人| 丝袜在线观看| 国产精品免费视频网站| 国产一区二区三区高清| 91成人在线免费| 国产精品日本| 欧美多人乱p欧美4p久久| 美女100%露胸无遮挡| 国产美女撒尿一区二区| 91精品国产高清一区二区三区蜜臀| 日本特级黄色大片| 免费在线视频你懂得| 国产成人免费视频网站| 国产噜噜噜噜久久久久久久久| 天天舔天天操天天干| 久久香蕉精品香蕉| 欧美一二三区在线| 亚洲a级黄色片| av在线一区不卡| 亚洲第一福利一区| 女女百合国产免费网站| 日本a在线播放| 国产欧美日韩三级| 欧美日韩国产高清视频| 男人的天堂在线视频| 99久久精品免费精品国产| yy111111少妇影院日韩夜片| 国产美女精品视频国产| 精品一区二区综合| 国产女人精品视频| 国内av在线播放| 蜜臀久久久99精品久久久久久| 久久综合久久88| 日本成人精品视频| 欧美激情777| 少妇高潮久久久久久潘金莲| 一级免费黄色录像| 欧美午夜精彩| 中文字幕av一区二区三区谷原希美| 日本一二三区在线| 成人综合日日夜夜| 欧美一级在线观看| 麻豆av免费看| 欧美三级电影在线| 91在线视频播放地址| 91在线|亚洲| 国产免费av观看| 国产在线视频一区二区三区| 欧美最猛黑人xxxx黑人猛叫黄| 老司机福利在线观看| 成人综合专区| 色视频www在线播放国产成人| wwwxx日本| 韩国精品福利一区二区三区| 日韩成人中文字幕在线观看| 免费污网站在线观看| 精品国产午夜| 久久久久www| 久久精品免费在线| 毛片一区二区| 成人中心免费视频| 欧美一级一区二区三区| 久久久精品国产免费观看同学| 91久久精品美女高潮| 国内精品久久久久久久久久久| 久久久久久婷| 成人激情免费在线| 日本黄视频在线观看| 国产亚洲美州欧州综合国| 亚洲日本精品一区| 免费在线播放电影| 色94色欧美sute亚洲线路一ni| 精品无码一区二区三区爱欲| 超碰超碰人人人人精品| 欧美人伦禁忌dvd放荡欲情| 蜜桃视频无码区在线观看| 日韩高清成人在线| 日韩专区在线播放| 日韩免费一级片| 美洲天堂一区二卡三卡四卡视频| 国产精品高清网站| www.成人免费视频| 久久日韩粉嫩一区二区三区| 亚洲国产激情一区二区三区| 欧美人与牲禽动交com| 日本精品一级二级| 免费观看一区二区三区| 国产欧美久久一区二区三区| 欧美激情手机在线视频| 中文无码精品一区二区三区| a在线播放不卡| 在线免费观看一区二区三区| 婷婷婷国产在线视频| 国产精品国产三级国产a| 波多野结衣综合网| 成人免费91| 亚洲视频在线免费看| 久久综合色综合| 久久精品国产一区二区三区免费看| 国产精欧美一区二区三区| 性生活免费网站| 中文字幕在线不卡视频| 久久久久久久久久久久久久国产| 国产乱码午夜在线视频| 这里只有精品电影| 精品成人无码一区二区三区| 99国产成+人+综合+亚洲欧美| 国产69精品久久久| 国产精品一区二区三区在线免费观看| 麻豆免费看一区二区三区| 久久精品综合一区| 后进极品白嫩翘臀在线播放| 制服丝袜国产精品| 在线看片中文字幕| 久久久久久久尹人综合网亚洲| 国产精品福利在线观看网址| 偷拍自拍在线| 激情av一区二区| 日韩一级性生活片| 国产精品久久久久久久久久久久久久久| 欧美日韩国产一级二级| 国产伦精品一区二区三区妓女| 妖精一区二区三区精品视频| 国内精品久久久久久久久| www.亚洲天堂.com| 一区二区三区加勒比av| 黄色片子免费看| 91tv官网精品成人亚洲| 国产色视频一区| 国产毛片毛片毛片毛片毛片| 国产精品区一区二区三区| 高清一区二区视频| 精品国产a一区二区三区v免费| 中文字幕欧美日韩| 免费看污视频的网站| 久久精品网站免费观看| 国产精品天天av精麻传媒| 成人在线电影在线观看视频| 国产精品日日摸夜夜添夜夜av| jlzzjlzzjlzz亚洲人| 亚洲视频免费在线观看| 无码人妻少妇色欲av一区二区| 麻豆一区二区| 国产91精品久久久久久| 黄色片在线免费观看| 欧美在线看片a免费观看| 亚洲最大成人综合网| 蜜桃av噜噜一区二区三区小说| 精品国产乱码久久久久软件| 极品在线视频| 亚洲人成自拍网站| 伊人网中文字幕| 亚洲色图欧洲色图婷婷| 五月天中文字幕在线| 欧美日韩调教| 精品一区在线播放| 国产成人精品一区二区三区免费| 91超碰这里只有精品国产| 超碰97av在线| 国产精品一区二区三区四区| 精品少妇在线视频| 西野翔中文久久精品字幕| 国产精品国产亚洲伊人久久| 26uuu亚洲电影在线观看| 亚洲国产中文字幕久久网| 看黄色一级大片| 亚洲日本成人在线观看| 中国一级特黄录像播放| 日韩高清中文字幕一区| 国产亚洲精品久久久久久久| 香蕉久久夜色精品国产更新时间| 欧美激情综合色| 黄网在线观看| 欧美一区日本一区韩国一区| 免费在线观看黄网站| 国产精品美女www爽爽爽| 日本一级大毛片a一| 久久综合九色综合欧美狠狠| 手机成人av在线| 亚洲免费毛片| 97超碰人人模人人爽人人看| 成人精品电影在线| 欧美国产精品人人做人人爱| www.中文字幕久久久| 精品国产网站在线观看| 无码久久精品国产亚洲av影片| 久久九九99视频| 国产又黄又嫩又滑又白| 日韩精品一二三区| 日韩精品一区在线视频| 天天精品视频| 欧美精品中文字幕一区二区| 一区二区精彩视频| 国产精品日韩在线| 亚洲风情在线资源| 欧美黄色性视频| www 日韩| 亚洲精品中文字| 亚洲第一视频在线播放| 欧美日韩高清一区二区| 国产免费av一区| 亚洲成人免费在线观看| 免费精品在线视频| 国产欧美一区二区三区鸳鸯浴 | 国产69精品久久app免费版| 欧美精品丝袜中出| 波多野结衣小视频| 黑人欧美xxxx| 国产在线一区视频| 亚洲精品乱码久久久久久久久| 亚洲v在线观看| 国内久久精品视频| 国内自拍视频网| 日韩一区精品字幕| 国产真实乱子伦| 亚洲午夜一区| 大西瓜av在线| 欧美日本三区| 影音先锋成人资源网站| 99久久久久| 影音先锋欧美在线| 日韩在线观看| 一区高清视频| 久久精品不卡| 色噜噜色狠狠狠狠狠综合色一| 成人久久精品| 91香蕉亚洲精品| 久久精品嫩草影院| 国产在线观看一区二区三区 | 天天操狠狠操夜夜操| 老色鬼久久亚洲一区二区| 日韩久久一级片| 老司机免费视频久久| 亚洲熟妇av一区二区三区| 亚洲一区久久| 日本xxxxxxx免费视频| 日韩专区一卡二卡| 手机在线成人免费视频| 蜜桃精品在线观看| 亚洲精品永久视频| 国内精品伊人久久久久影院对白| 六月丁香婷婷激情| 天堂va蜜桃一区二区三区 | 亚洲av毛片基地| 中文字幕乱码日本亚洲一区二区 | 久久99成人| 亚洲自拍小视频| 亚洲乱码一区| 久久久久综合一区二区三区| 在线一级成人| 中文字幕欧美人与畜| 欧美区一区二| 免费黄色福利视频| 日本不卡视频在线观看| 手机免费av片| caoporn国产精品| 国产精品久久免费观看| 中文字幕综合网| 国产一级免费观看| 欧美午夜女人视频在线| 91久久久久国产一区二区| 日韩欧美一级二级三级| 无码国产精品96久久久久| 国产亚洲一区二区在线| 成人影院在线看| 91精品国产免费久久久久久 | 97在线精品| 干日本少妇视频| 中日韩男男gay无套| 久久久久久久久久福利| 久久亚洲美女| 北条麻妃亚洲一区| 91蝌蚪porny九色| 国产精品视频一区二区三 | 伊人国产在线观看| 欧美性jizz18性欧美| 国产丝袜在线视频| 亚洲精品资源美女情侣酒店 | 久久综合久久久久88| japanese中文字幕| 一区二区三区免费看视频| 国产午夜精品久久久久| 欧美一区二区不卡视频| 极品美乳网红视频免费在线观看| 亚洲人在线视频| 51xtv成人影院| 国产精品久久久久久中文字| 一区二区在线免费播放| 亚洲日本精品| 久久一区亚洲| 精品熟女一区二区三区| 中文字幕亚洲不卡| 国产免费一级视频| 欧美精品一区二区三区很污很色的| 手机看片一区二区三区| 久久精品成人欧美大片| 三级成人黄色影院| 久久6免费高清热精品| jk漫画禁漫成人入口| 国产高清自拍一区| 亚洲自拍偷拍网| 麻豆一区二区三区视频| 91麻豆精品在线观看| 国产在线视频第一页| 91精品一区二区三区在线观看| 国产成人精品免费看视频| 亚洲视频在线播放| 日本在线播放一二三区| 成人欧美视频在线| 国产精品va| 性鲍视频在线观看| 最新中文字幕一区二区三区| 中文字幕乱码人妻二区三区| 亚洲男子天堂网| 欧美aaaaa性bbbbb小妇| 国产精品久久国产三级国电话系列| 少妇高潮一区二区三区| 水蜜桃色314在线观看| 成人午夜电影小说| 精品少妇久久久| 精品国产一区二区在线观看| 色在线视频网| 国产高清精品一区二区三区| 国产综合色产| 在线播放第一页| 午夜视频在线观看一区二区 | 免费黄网站欧美| 高潮毛片无遮挡| 色婷婷久久99综合精品jk白丝 | 国产精品一区二区在线观看网站| 插我舔内射18免费视频| 亚洲国产精品久久久男人的天堂| 无码无套少妇毛多18pxxxx| 亚洲欧美国产va在线影院| 一级毛片久久久| 欧美一卡2卡3卡4卡无卡免费观看水多多| 日韩国产一区二区| 奇米视频888| 亚洲精品乱码久久久久久| 99国产成人精品| 欧美激情奇米色| 美女视频亚洲色图| 北条麻妃视频在线| 国产精品女人毛片| 国产喷水福利在线视频| 欧美人成在线视频| 欧美日韩一区二区三区在线电影 | 久久婷婷av| 中国女人特级毛片| 欧美精品黑人性xxxx| av在线free| 精品国产乱码久久久久久丨区2区| 99久久婷婷这里只有精品| 午夜免费一级片| 亚洲国产视频在线| 天堂网中文字幕| 国产亚洲精品久久| 日本一区二区三区视频在线看 | 日本韩国一区二区三区视频| 国产免费永久在线观看| 国产主播在线一区| 在线国产精品一区| 精品人伦一区二区三电影 | 欧美三级在线观看视频| 久久久久久久久久久久久久久99| 久久精品一级片| 日韩精品视频在线观看网址| 成人全视频免费观看在线看| 91视频成人免费| 久久色在线观看| 一级黄色免费片| 91精品国产乱码久久久久久蜜臀| 超碰成人免费| 向日葵污视频在线观看| 亚洲一区免费在线观看| 成全电影播放在线观看国语| av成人午夜| 日韩成人午夜精品| 国产在线观看99| 日韩有码在线观看| 精品精品精品| 久久久久久久久久毛片| 色综合天天综合网国产成人综合天 | 天堂va久久久噜噜噜久久va|