精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率 原創

發布于 2024-11-14 10:13
瀏覽
0收藏

?在當前的知識檢索領域,RAG技術正引領著最新潮流,它的目標是為大型語言模型(LLM)提供豐富而精確的上下文信息。然而,傳統RAG方法在處理信息時經常會忽略上下文細節,這限制了其從知識庫中提取相關信息的能力。解決如何有效保存上下文信息的問題,已成為該領域的重點。

針對這一挑戰,Anthropic的研究團隊提出了一種名為“上下文檢索”的創新技術,使得在這一領域取得了重大突破。他們最近發表的研究詳細介紹了這一技術,展示了如何通過上下文嵌入和上下文敏感的BM25算法顯著降低檢索失敗率。讓我們深入探討這一方法的關鍵要素。

關于使用較長提示符的說明

有時候最簡單的解決方案就是最好的。如果你的知識庫小于200,000個token(大約500頁的材料),你可以在給出模型的提示中包含整個知識庫,而不需要RAG或類似的方法。

幾周前,Claude發布了快速緩存,這使得這種方法更快,更具成本效益。開發人員現在可以在API調用之間緩存頻繁使用的提示,將延遲減少2倍以上,成本降低高達90%(可以通過閱讀prompt caching cookbook了解它是如何工作的)。

但是,隨著知識庫的增長,您將需要一個更具可擴展性的解決方案。這就是上下文檢索的用武之地。

擴展到更大的知識庫

對于不適合上下文窗口的較大知識庫,RAG是典型的解決方案。RAG通過使用以下步驟預處理知識庫來工作:

  1. 將知識庫(文檔的“語料庫”)分解為更小的文本塊,通常不超過幾百個標記;
  2. 使用嵌入模型將這些塊轉換為編碼含義的向量嵌入;
  3. 將這些嵌入存儲在矢量數據庫中,以便根據語義相似性進行搜索。

在運行時,當用戶向模型輸入查詢時,向量數據庫用于基于與查詢的語義相似性來找到最相關的塊。然后,將最相關的塊添加到發送到生成模型的提示中。

雖然嵌入模型擅長捕捉語義關系,但它們可能會錯過關鍵的精確匹配。幸運的是,有一種更古老的技術可以幫助解決這些問題。BM 25是一個排名功能,它使用詞匯匹配來查找精確的單詞或短語匹配。它對于包含唯一標識符或技術術語的查詢特別有效。BM 25基于TF-IDF概念,TF-IDF衡量一個單詞對集合中文檔的重要性。BM 25通過考慮文檔長度并將飽和函數應用于詞頻來細化這一點,這有助于防止常見詞主導結果。

假設用戶在技術支持數據庫中查詢“Error code TS-999”。嵌入模型通常可以找到有關錯誤代碼的內容,但可能會錯過精確的“TS-999”匹配。BM 25查找此特定文本字符串以識別相關文檔。

RAG解決方案可以通過使用以下步驟結合嵌入和BM 25技術來更準確地檢索最適用的塊:

  1. 將知識庫(文檔的“語料庫”)分解為更小的文本塊,通常不超過幾百個標記;
  2. 為這些塊創建TF-IDF編碼和語義嵌入;
  3. 使用BM 25來找到基于精確匹配的頂部塊;
  4. 基于語義相似度,使用嵌入來找到頂部塊;
  5. 使用融合技術對來自(3)和(4)的結果進行聚合和去重;
  6. 將前K個塊添加到提示符中以生成響應。

通過利用BM 25和嵌入模型,傳統的RAG系統可以提供更全面和準確的結果,平衡精確的術語匹配和更廣泛的語義理解。

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

這種方法使您能夠經濟高效地擴展到巨大的知識庫,遠遠超出了單個提示中所能容納的內容。但是這些傳統的RAG系統有一個顯著的局限性:它們經常破壞上下文。

傳統RAG中的語境難題

在傳統的RAG中,文檔通常被分成更小的塊以進行有效的檢索。雖然這種方法對于許多應用程序都很有效,但當單個塊缺乏足夠的上下文時,它可能會導致問題。

例如,假設您的知識庫中嵌入了一系列財務信息,您收到了以下問題:“ACME Corp在2023年第二季度的收入增長是多少?"

一個相關的塊可能包含這樣的文本:“公司的收入比上一季度增長了3%。“然而,這一大塊本身并沒有指定它所指的是哪家公司或相關的時間段,因此很難檢索正確的信息或有效地使用這些信息。

Contextual Retrieval

上下文檢索簡介

上下文檢索通過在嵌入之前將特定于塊的解釋性上下文前置到每個塊(Contextual Embeddings)并創建BM 25索引(Contextual BM25)來解決這個問題。

下面是一個如何轉換塊的示例:

原始分塊 = "公司的收入比上一季度增長了3%。"
上下文化分塊 = "這個分塊來自ACME公司在2023年第二季度的SEC文件;上一季度的收入為3.14億美元。公司的收入比上一季度增長了3%。"

值得注意的是,過去已經提出了使用上下文來改進檢索的其他方法。其他建議包括:將通用文檔摘要添加到塊,假設文檔嵌入和基于摘要的索引。這些方法的收益和性能都很低。

實現上下文檢索

手動為知識庫中的成千上萬個分塊添加上下文顯然是不現實的。為此,研究團隊使用了 Claude 模型,通過一個特定的提示生成每個分塊的簡潔上下文,生成的上下文通常為 50-100 個 token,然后在嵌入和創建 BM25 索引之前將其添加到分塊中。對應的prompt示例:

<document> 
{{WHOLE_DOCUMENT}} 
</document> 
Here is the chunk we want to situate within the whole document 
<chunk> 
{{CHUNK_CONTENT}} 
</chunk> 
Please give a short succinct context to situate this chunk within the overall document for the purposes of improving search retrieval of the chunk. Answer only with the succinct context and nothing else.

下面是預處理流程在實踐中的樣子:

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

使用Prompt Caching降低上下文檢索成本

上下文檢索得益于Prompt Caching功能,通過Claude可以以低成本獨特地實現。有了提示緩存,您不需要為每個塊傳入參考文檔。您只需將文檔加載到緩存中一次,然后引用之前緩存的內容。假設800個令牌的塊,8k令牌的文檔,50令牌的上下文指令,以及每個塊的100令牌的上下文,生成上下文化塊的一次性成本是每百萬文檔令牌1.02美元。

注意事項

在實現上下文檢索時,需要記住幾個注意事項:

  1. 塊邊界:考慮如何將文檔拆分為塊。塊大小、塊邊界和塊重疊的選擇會影響檢索性能。
  2. 嵌入模型:雖然上下文檢索提高了我們測試的所有嵌入模型的性能,但某些模型可能比其他模型受益更多。Gemini和Voyage嵌入特別有效。
  3. 自定義prompt:雖然通用提示效果很好,但您可以使用針對特定領域或用例定制的提示(例如,包括可能僅在知識庫中的其他文檔中定義的關鍵術語的詞匯表)來實現更好的結果。
  4. **塊的數量:**在上下文窗口中添加更多的塊可以增加包含相關信息的機會。然而,更多的信息可能會分散模型的注意力,所以這是有限制的。嘗試使用5、10和20塊,發現使用20塊是這些選項中性能最好的,但值得在您的用例中進行試驗。

通過Rerank進一步提升性能

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

在傳統 RAG 中,AI 系統會從知識庫中檢索到大量潛在相關的信息分塊。對于大型知識庫,這一初始檢索往往會返回大量分塊,有時多達數百個,且相關性和重要性各不相同。重排序是一種常用的過濾技術,確保只有最相關的分塊被傳遞給模型。實驗結果顯示,重排序后的上下文嵌入和上下文 BM25 將前 20 個分塊的檢索失敗率減少了 67%(從 5.7%降至 1.9%)。

Anthropic研究團隊提出新技術,引入Contextual Retrieval讓RAG再進化,大幅降低檢索失敗率-AI.x社區

成本和延遲考慮

重排序的一個重要考慮因素是對延遲和成本的影響,特別是在對大量塊進行重排序時。因為重排序在運行時增加了一個額外的步驟,所以它不可避免地增加了少量的延遲,即使重排序器并行地對所有塊進行評分。在重新排序更多塊以獲得更好的性能與重新排序更少塊以降低延遲和成本之間存在固有的權衡。建議您在特定用例中嘗試不同的設置,以找到正確的平衡。

總結

研究團隊通過大量的實驗,為大家指出了一個新的提升 RAG 性能的方法,為開發者指出了實踐新方向。同時,研究團隊基于大量實驗的結果,給出了一些關鍵的經驗總結:

  1. Embeddings+BM25 比單獨使用Embeddings效果更好
  2. Voyage 和 Gemini 是測試中效果最好的嵌入模型
  3. 將前20個塊傳遞給模型比只傳遞前10個或前5個塊更有效
  4. 在語塊中加入上下文可以大大提高檢索的準確率
  5. 采用重排序的方法比起不進行重排序
  6. 將這些改進策略綜合起來:為了最大限度地提高性能,我們可以將contextual embeddings(來自Voyage或Gemini)與contextual BM25結合起來,再加上重新排序步驟,并將20個塊添加到提示符中。

?

本文轉載自公眾號AI 博物院 作者:longyunfeigu

原文鏈接:??https://mp.weixin.qq.com/s/qEZ-oyzFYDmWJJ0ycFLzDg??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦
国产不卡在线视频| 国产精品红桃| 欧美一区二区福利视频| www.国产二区| 国产视频网站在线| 国产一二精品视频| 欧美亚洲日本网站| 人人澡人人澡人人看| 久草在线综合| 欧美一区二区三区人| 欧美黄网站在线观看| 91亚洲天堂| 久久九九久精品国产免费直播| 亚洲精品欧美极品| 免费看毛片网站| 欧美日本三区| 日韩在线视频导航| 国产又粗又长又爽| 涩涩屋成人免费视频软件 | 精品一区二区三区人妻| 精品国产123区| 亚洲第一中文字幕在线观看| 中文字幕在线综合| 三级成人黄色影院| 精品久久久久久电影| 青青草原网站在线观看| h视频在线免费| 99国产精品一区| 粉嫩高清一区二区三区精品视频| 亚洲天天综合网| 久久人人精品| 日韩av片免费在线观看| 日本在线视频免费观看| 国产综合精品| 欧美成人午夜视频| 永久免费看片直接| 日韩欧美一区二区三区在线视频| 亚洲免费伊人电影在线观看av| 久久无码专区国产精品s| 电影一区二区| 欧美伊人久久久久久久久影院| 日本三级免费观看| 高清毛片在线观看| 亚洲成人黄色影院| 大陆av在线播放| av影片在线| 亚洲一区二区精品视频| 女人床在线观看| 国产原厂视频在线观看| 亚洲欧洲av在线| 美国av在线播放| 黄色成人在线观看| 亚洲欧美另类久久久精品| 天天做天天爱天天高潮| 黄色av网站在线播放| 亚洲欧美一区二区三区孕妇| ijzzijzzij亚洲大全| 18av在线播放| 亚洲成a人片在线不卡一二三区| 精品无码国产一区二区三区av| 波多野结衣中文字幕久久| 亚洲成人免费av| 日韩av片在线看| 欧美片第1页| 欧美性videosxxxxx| 亚洲精品性视频| 亚洲精品69| 日韩欧美二区三区| chinese麻豆新拍video| 欧洲亚洲视频| 一区二区亚洲精品国产| 久久精品一区二区三区四区五区| 亚洲男女av一区二区| 欧美丰满少妇xxxxx| 久久99精品波多结衣一区| 日日摸夜夜添夜夜添国产精品| 国产精品福利久久久| 国产精品天天操| 粉嫩13p一区二区三区| 久久久久久99| 一级毛片视频在线观看| 亚洲精品老司机| 日韩欧美一区二| 国产精品成人国产| 欧美成人综合网站| 大又大又粗又硬又爽少妇毛片| 色999日韩| 性色av一区二区三区免费 | 欧美系列一区二区| 性感美女一区二区三区| 精品中文字幕一区二区三区av| 色吧影院999| 国产精品99无码一区二区| 久久看片网站| 国产精品.com| av在线免费观看网站| 亚洲午夜精品一区二区三区他趣| 色诱视频在线观看| 99re6热只有精品免费观看| 亚洲网站视频福利| 国产亚洲成人精品| 久久99国产精品久久99果冻传媒| 懂色av一区二区三区在线播放| 高h视频在线| 婷婷激情综合网| 日本高清免费在线视频| 精品国产91乱码一区二区三区四区 | 日本久久91av| 丰满少妇一级片| 国产精品拍天天在线| 国产精品12345| 日本电影久久久| 精品视频在线观看日韩| 久久久久久久福利| 久久爱另类一区二区小说| 欧美二区在线看| 第一av在线| 在线91免费看| 伊人影院综合网| 亚洲综合社区| 国产一区二区久久久| av片在线观看永久免费| 欧美日韩在线不卡| 国产成人福利在线| 欧美一级一区| 精品日本一区二区| av第一福利在线导航| 日韩一级二级三级| 久久久久久视频| 美女视频黄a大片欧美| 欧洲在线视频一区| 欧美大片免费| 亚洲欧美另类人妖| 国产又黄又猛又粗又爽| av激情综合网| 成人午夜精品久久久久久久蜜臀| 试看120秒一区二区三区| 欧美成年人网站| a级片在线免费看| 亚洲欧洲一区二区在线播放| 五月婷婷六月合| 青青草综合网| 国产在线a不卡| 欧美尤物美女在线| 91精品欧美综合在线观看最新| 国产精品一区二区亚洲| 老鸭窝一区二区久久精品| 亚洲精品一区二区三区四区五区 | 国产精品1000部啪视频| 亚洲一区图片| 欧美系列一区| 国产成人免费| 少妇av一区二区三区| 国产精品人人爽| 一区二区三区欧美日| 日批免费观看视频| 国产日韩1区| 欧美精品亚洲精品| 97成人超碰| 色伦专区97中文字幕| 国产免费一区二区三区最新不卡| 亚洲男人的天堂一区二区| 农村末发育av片一区二区| 在线欧美亚洲| 日本不卡一区二区三区视频| 成人黄色免费观看| 欧美成人久久久| 少妇精品高潮欲妇又嫩中文字幕| 欧美性极品xxxx做受| 精品人妻一区二区三区四区| 久久国产综合精品| 东北少妇不带套对白| 九九综合在线| 91在线|亚洲| 91精品国产黑色瑜伽裤| 免费xxxx性欧美18vr| 色狠狠久久av五月综合|| 亚洲精品aa| 久久久免费高清电视剧观看| 天堂在线中文| 欧美日韩国产美女| 国产精品a成v人在线播放| 国产日产精品_国产精品毛片| 国产亚洲短视频| 国产a级一级片| 91精品1区| 好看的日韩精品视频在线| 97成人超碰| 日韩午夜小视频| 性少妇xx生活| gogogo免费视频观看亚洲一| 男女男精品视频站| 在线免费高清一区二区三区| 日韩精品一区二区三区丰满| 91亚洲精品视频在线观看| 欧美成人精品影院| 成人资源www网在线最新版| 精品三级在线观看| 自拍偷拍色综合| 日本欧美在线视频免费观看| 色一情一伦一子一伦一区| 男生裸体视频网站| 国产一区二区三区不卡在线观看 | 青青草国产精品亚洲专区无| 经典三级在线视频| 精品在线99| 狠狠色综合欧美激情| 日韩精品成人| 国产欧美精品在线| 欧美va在线观看| 欧洲中文字幕国产精品| 2024短剧网剧在线观看| 色播久久人人爽人人爽人人片视av| 日本一二三区在线视频| 亚洲国产精品99久久| 国产免费久久久久| 中文字幕国产精品一区二区| 中文字幕在线免费看线人| 可以免费看不卡的av网站| 日本丰满少妇黄大片在线观看| 97青娱国产盛宴精品视频| 成人日韩在线电影| 久久婷婷五月综合色丁香| 热久久视久久精品18亚洲精品| 91资源在线观看| 在线日韩av片| 欧美一级特黄高清视频| 欧美国产日韩在线观看| 男女做爰猛烈刺激| 国产精品ⅴa有声小说| 91福利国产精品| 在线观看免费av片| 国产九色精品成人porny| 不卡一区二区三区视频| 老司机在线永久免费观看| 精品av久久707| 日韩在线 中文字幕| 国产精品狼人久久影院观看方式| 日本中文字幕网址| 国产欧美一级| 亚洲一区二区三区加勒比| 日韩精品免费| 自拍偷拍一区二区三区| 国产韩国精品一区二区三区| 色乱码一区二区三区熟女| 亚洲最大av| 免费网站在线观看视频| 久久美女免费视频| 国产精品久久久久久久久久久久久久久 | 欧美午夜不卡在线观看免费| 麻豆影视在线播放| www国产精品av| jizzzz日本| 久久99国产精品久久99| 妺妺窝人体色www在线小说| 亚洲在线成人| 日本888xxxx| 久久国产精品免费| 欧美特黄aaa| 懂色av一区二区三区蜜臀| 最新av免费在线观看| 国产一区二区免费在线| av在线网站免费观看| 国产精品一二三| 国产白嫩美女无套久久| 国产喷白浆一区二区三区| √天堂中文官网8在线| 亚洲午夜一区二区| 极品国产91在线网站| 图片区亚洲欧美小说区| 99一区二区| 中文字幕一区二区三区中文字幕| 韩国国内大量揄拍精品视频| 欧美性xxx| 91久久嫩草影院一区二区| jizz久久久久久| 91九色偷拍| 亚洲精品在线播放| 999日本视频| 97视频一区| 日韩国产欧美精品| 很黄很黄激情成人| 国产男女激情视频| 欧美亚洲不卡| 国产91在线亚洲| 久久亚洲国产精品一区二区| 91大神免费观看| 91网上在线视频| 日本一级特级毛片视频| 欧美性猛交xxxx久久久| av网站免费播放| 亚洲香蕉成视频在线观看| 青草青在线视频| 国产精品视频在线播放| 久久久久97| 一区二区三区四区五区精品| 欧美成人一区二免费视频软件| 欧美激情国产精品日韩| 亚洲精选91| 日韩中文在线字幕| 婷婷亚洲五月色综合| 欧美 国产 日本| 国产·精品毛片| 国产freexxxx性播放麻豆| 91社区在线观看播放| 色噜噜国产精品视频一区二区| 麻豆成全视频免费观看在线看| 亚洲va电影大全| 女人丝袜激情亚洲| 日韩中文字幕在线视频观看 | 欧美激情亚洲视频| 成人午夜sm精品久久久久久久| 国外成人免费视频| 老司机aⅴ在线精品导航| 男人j进女人j| 狠狠狠色丁香婷婷综合激情| 国产美女免费无遮挡| 亚洲成人综合在线| 国产不卡av在线播放| 中文字幕日韩欧美在线| 欧美福利在线播放| 精品麻豆av| 99人久久精品视频最新地址| 亚洲综合123| 国产精品二三区| 精品久久久久久久久久久久久久久久 | 亚洲久草在线视频| 亚洲精品无码久久久久| 亚洲欧美国产精品久久久久久久| 污视频网站免费在线观看| 国产欧美中文字幕| 成人精品电影| 国产 福利 在线| 国产精品毛片| 中文字幕人妻熟女人妻a片| 亚洲中午字幕| 国产亚洲无码精品| 中文字幕精品—区二区四季| 做爰无遮挡三级| 欧美猛男gaygay网站| 麻豆网站在线| 91超碰rencao97精品| 欧美日本一区二区高清播放视频| 色婷婷综合在线观看| 樱花草国产18久久久久| 亚洲免费成人在线| 久久久免费电影| 欧美日韩看看2015永久免费 | 播五月开心婷婷综合| 国产成人啪精品午夜在线观看| 亚洲成人久久网| 一区二区三区四区日本视频| 欧美精品一区二区三区在线四季| 噜噜噜91成人网| 永久免费观看片现看| 69堂成人精品免费视频| 亚洲精品天堂| 国新精品乱码一区二区三区18| 午夜在线一区二区| 国产视频三区四区| 在线电影院国产精品| 青春草免费在线视频| 久久综合九色综合久99| 奇米一区二区三区| 校园春色 亚洲| 亚洲精品成人久久久| 亚洲天堂1区| 日本丰满大乳奶| 91在线你懂得| 亚洲最大成人av| 久久久久在线观看| 禁断一区二区三区在线| 午夜av中文字幕| 天天影视涩香欲综合网| 成人在线免费电影| 91亚洲国产成人久久精品网站| 影音先锋久久资源网| 亚洲不卡的av| 亚洲成人三级在线| 国产成人免费精品| 九色自拍视频在线观看| 国产精品女主播在线观看| 亚洲欧美国产高清va在线播放| 国产成人福利视频| 国产精品a久久久久| 国产免费无遮挡吸奶头视频| 日韩视频在线你懂得| 日韩影片中文字幕| a级黄色片免费| 欧美精彩视频一区二区三区| 亚洲高清视频网站| 国产精品视频免费在线观看| 亚洲视频精品| 国产三级aaa| 亚洲跨种族黑人xxx| 中文字幕视频精品一区二区三区| 精品免费国产一区二区| 亚洲成人777| 黄色小网站在线观看| 青青草原亚洲|