精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

論文解讀:迄今為止最好的 RAG 技術(shù)棧

發(fā)布于 2024-11-22 11:43
瀏覽
0收藏

概述

這篇文章深入探討了 Wang 等人在 2024 年的研究,旨在為構(gòu)建高效的檢索增強(qiáng)生成(RAG)系統(tǒng)提供最佳實(shí)踐建議。文章由 Towards AI 的聯(lián)合創(chuàng)始人兼 CTO Louis-Francois 撰寫,分析了 RAG 系統(tǒng)的核心組件與策略。

主要內(nèi)容摘要

  • 查詢分類:通過(guò)分類任務(wù)決定是否需要進(jìn)行檢索,確保系統(tǒng)只在必要時(shí)檢索外部數(shù)據(jù)。
  • 數(shù)據(jù)分塊:為數(shù)據(jù)選擇合適的塊大小至關(guān)重要,理想的塊大小在 256 至 512 個(gè) token 之間,有助于減少噪音和提高效率。
  • 元數(shù)據(jù)與混合搜索:元數(shù)據(jù)(如標(biāo)題或關(guān)鍵詞)與混合搜索(結(jié)合語(yǔ)義搜索和傳統(tǒng)關(guān)鍵詞搜索 BM25)可顯著提升檢索精度。
  • 嵌入模型選擇:挑選適合的嵌入模型,文章推薦使用像 FlagEmbedding 這樣性能與效率均衡的模型。
  • 向量數(shù)據(jù)庫(kù):使用像 Milvus 這樣的高性能向量數(shù)據(jù)庫(kù)來(lái)處理大量檢索請(qǐng)求,確保系統(tǒng)的長(zhǎng)期穩(wěn)定性。
  • 查詢轉(zhuǎn)換:在檢索前進(jìn)行查詢轉(zhuǎn)換以提高準(zhǔn)確性,如通過(guò)查詢重寫或分解復(fù)雜問(wèn)題,改進(jìn)系統(tǒng)的檢索表現(xiàn)。
  • 重新排序與文檔打包:在文檔檢索后,通過(guò) reranking 技術(shù)提升結(jié)果的相關(guān)性,并進(jìn)行文檔重新打包,以優(yōu)化信息呈現(xiàn)。
  • 摘要:生成之前進(jìn)行文檔摘要,有助于去除冗余信息,降低生成成本。
  • 微調(diào)生成模型:通過(guò)對(duì)生成模型進(jìn)行微調(diào),提高模型處理復(fù)雜查詢和去除無(wú)關(guān)信息的能力。
  • 多模態(tài)檢索:整合多模態(tài)技術(shù)處理圖像查詢,并基于類似內(nèi)容進(jìn)行檢索,進(jìn)一步提高系統(tǒng)的響應(yīng)準(zhǔn)確性。

意見

  • Wang 等人的研究被認(rèn)為是 RAG 系統(tǒng)的“洞察金礦”。
  • 查詢分類對(duì)于確定何時(shí)需要檢索至關(guān)重要。
  • 數(shù)據(jù)的最佳塊大小介于 256 到 512 個(gè)令牌之間,但可能因數(shù)據(jù)集而異。
  • 元數(shù)據(jù)和混合搜索是高效檢索的首選,而不是 HyDE 等更復(fù)雜的方法。
  • 建議使用 FlagEmbedding 的 LLM,因?yàn)樗谛阅芎痛笮≈g取得了平衡。
  • Monot5 是最受歡迎的重新排名模型,因?yàn)樗谛阅芎托手g取得了平衡。
  • 建議以“相反”的順序重新打包文檔,以改進(jìn) LLM 的生成過(guò)程。
  • 像 Recomp 這樣的摘要工具對(duì)于減少提示長(zhǎng)度和成本很有價(jià)值。
  • 使用相關(guān)文檔和隨機(jī)文檔的混合來(lái)微調(diào)生成器有利于處理不相關(guān)的信息。
  • 多模態(tài)檢索是處理文本和圖像的系統(tǒng)的一個(gè)重要考慮因素。
  • 該論文承認(rèn)了未來(lái)研究的局限性和領(lǐng)域,例如獵犬和發(fā)電機(jī)的聯(lián)合訓(xùn)練。

探索每個(gè)組件

大家早上好!我是 Towards AI 的聯(lián)合創(chuàng)始人兼首席技術(shù)官 Louis-Francois,今天,我們正在深入研究可能是最好的檢索增強(qiáng)一代 (RAG) 技術(shù)棧——這要?dú)w功于 Wang 等人在 2024 年的一項(xiàng)出色研究。

這是構(gòu)建最佳 RAG 系統(tǒng)的見解金礦,我在這里為您分解它。

那么,是什么讓 RAG 系統(tǒng)真正成為頂級(jí)的系統(tǒng)呢?是組件,對(duì)吧?讓我們回顧一下最好的組件以及它們的工作原理,這樣您也可以使您的 RAG 系統(tǒng)成為頂級(jí)系統(tǒng)并獲得多模式獎(jiǎng)勵(lì)。

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)圖片

查詢分類

讓我們從 Query Classification

Wang 等人創(chuàng)建了 15 個(gè)任務(wù)類別,確定查詢是否提供了足夠的信息或是否需要檢索。他們訓(xùn)練了一個(gè)二元分類器來(lái)分隔任務(wù),在不需要檢索的地方標(biāo)記為“sufficient”,在需要檢索時(shí)標(biāo)記為“insufficient”。在此圖像中,黃色表示不需要,紅色表示去獲取一些文檔!

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

分塊

接下來(lái):分塊。這里的挑戰(zhàn)是為您的數(shù)據(jù)找到完美的數(shù)據(jù)塊大小。太長(zhǎng)了?您會(huì)增加不必要的噪音和成本。太短了?你錯(cuò)過(guò)了上下文。

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

Wang 等人發(fā)現(xiàn) 256 到 512 個(gè)標(biāo)記之間的塊大小效果最好。但請(qǐng)記住,這因數(shù)據(jù)而異 - 因此請(qǐng)務(wù)必運(yùn)行您的評(píng)估!專業(yè)提示:使用 small2big(從小塊開始進(jìn)行搜索,然后移動(dòng)到較大的塊進(jìn)行生成),或嘗試滑動(dòng)窗口以重疊塊之間的標(biāo)記。

元數(shù)據(jù)和混合搜索

利用您的元數(shù)據(jù)!添加標(biāo)題、關(guān)鍵字甚至假設(shè)問(wèn)題等內(nèi)容。將其與 Hybrid Search

HyDE(生成偽文檔以增強(qiáng)檢索)很酷,可以帶來(lái)更好的結(jié)果,但效率非常低。現(xiàn)在,堅(jiān)持使用 Hybrid Search——它取得了更好的平衡,尤其是在原型設(shè)計(jì)方面。

嵌入模型

選擇正確的 嵌入模型

你不想要打網(wǎng)球的足球鞋。

來(lái)自 FlagEmbedding 的 LLM 最適合這項(xiàng)研究——性能和大小的完美平衡。不太大,也不太小——恰到好處。

請(qǐng)注意,他們只測(cè)試了開源模型,因此 Cohere 和 OpenAI 被淘汰出局。否則,Cohere 可能是您最好的選擇。

矢量數(shù)據(jù)庫(kù)

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

現(xiàn)在是數(shù)據(jù)庫(kù)。對(duì)于長(zhǎng)期使用,Milvus

查詢轉(zhuǎn)換

在檢索之前,您必須 轉(zhuǎn)換 這些用戶查詢!無(wú)論是通過(guò) 查詢重寫 以使其清晰,還是通過(guò)查詢 分解 將復(fù)雜問(wèn)題分解為更小的問(wèn)題并檢索每個(gè)子問(wèn)題,甚至生成偽文檔(如 HyDE

重新排名

現(xiàn)在我們來(lái)談?wù)? Reranking

在這項(xiàng)研究中,monoT5 脫穎而出,成為平衡性能和效率的最佳選擇。它微調(diào) T5 模型,以根據(jù)文檔與查詢的相關(guān)性對(duì)文檔重新排序,確保最佳匹配優(yōu)先。 RankLLaMA  總體性能最好,但 TILDEv2

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

文檔重新打包

重新排名后,您需要進(jìn)行一些 Document Repacking

綜述


然后,在調(diào)用 LLM,您希望使用 Summarization

使用 Recomp

微調(diào)生成器

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

最后,您是否應(yīng)該微調(diào)用于生成的 LLM?絕對(duì)!使用相關(guān)文檔和隨機(jī)文檔的混合進(jìn)行微調(diào)可以提高生成器處理不相關(guān)信息的能力。它使模型更加健壯,并有助于它給出更好的整體響應(yīng)。論文中沒有提供確切的比率,但結(jié)果很明確:微調(diào)是值得的!不過(guò),這顯然也取決于您的域。

多模態(tài)

論文解讀:迄今為止最好的 RAG 技術(shù)棧-AI.x社區(qū)

處理圖像?實(shí)施多模式檢索。對(duì)于文本到圖像,在數(shù)據(jù)庫(kù)中查詢相似圖像可以加快該過(guò)程。在圖像到文本中,匹配相似的圖像可檢索準(zhǔn)確的預(yù)存儲(chǔ)字幕。這一切都與接地氣有關(guān)——檢索真實(shí)的、經(jīng)過(guò)驗(yàn)證的信息。

結(jié)論

簡(jiǎn)而言之,Wang 等人的這篇論文為我們提供了一個(gè)構(gòu)建高效 RAG 系統(tǒng)的堅(jiān)實(shí)藍(lán)圖。但請(qǐng)記住,這只是一篇論文,并未涵蓋 RAG 管道的各個(gè)方面。例如,獵犬和發(fā)電機(jī)的聯(lián)合訓(xùn)練沒有被探索,這可能會(huì)釋放更多的潛力。由于成本原因,他們也沒有深入研究分塊技術(shù),但這是一個(gè)值得探索的方向。

我強(qiáng)烈建議您查看完整的論文以獲取更多信息。我們最近還出版了《Building LLMs for Production》一書,其中充滿了 RAG 和微調(diào)見解、技巧和實(shí)際示例,可幫助您構(gòu)建和改進(jìn)基于 LLM 的系統(tǒng)。該鏈接也位于下面的實(shí)體書和電子書版本的描述中。

一如既往,感謝您的閱讀。如果您覺得此分析有幫助或有任何評(píng)論,請(qǐng)?jiān)谙旅娴脑u(píng)論中告訴我,我們下次見!

引用

用于生產(chǎn)的構(gòu)建LLMs:https://amzn.to/4bqYU9b

Wang et al., 2024 (論文參考):https://arxiv.org/abs/2407.01219

LLM(嵌入模型):https://github.com/FlagOpen/FlagEmbedding/tree/master/FlagEmbedding/llm_embedder

Milvus (vector database):https://milvus.io/

Liu et al., 2024 (文檔重新包裝): https://arxiv.org/abs/2307.03172

Recomp (摘要工具):https://github.com/carriex/recomp

RagLlmFine Tuning人工智能嵌入

本文轉(zhuǎn)載自 ??AI大模型世界??,作者: Louis-Francois

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
免费在线观看91| 中文欧美在线视频| 久久久久久久激情| 午夜激情视频在线观看| 国产传媒一区在线| 欧美性受xxx| 日韩av毛片在线观看| 2020国产精品极品色在线观看| 五月婷婷另类国产| 亚洲精品一区二区三区av| 朝桐光av在线一区二区三区| 久久不射网站| 欧美国产日韩一区二区在线观看 | 不卡视频一二三| 国产精品久久久久久五月尺| 久久这里只有精品免费| 日本在线电影一区二区三区| 亚洲国产精品国自产拍av秋霞| 鲁一鲁一鲁一鲁一av| 俺来也官网欧美久久精品| 国产精品萝li| 欧美日本韩国一区二区三区| 亚洲AV无码精品色毛片浪潮| 美腿丝袜亚洲综合| 91超碰中文字幕久久精品| 日韩免费av一区| 女人丝袜激情亚洲| 精品国产91乱码一区二区三区 | 日本一级淫片演员| 成人高清免费在线播放| 久久久影视传媒| 国产精品视频入口| 精品乱子伦一区二区| 免费成人在线观看| 国产97在线|亚洲| 日本高清www免费视频| 中文精品久久| 久久久国产精品一区| 手机毛片在线观看| 国内精品久久久久久久久电影网 | 国产精品揄拍100视频| 日韩在线观看一区二区三区| 欧美区视频在线观看| 欧美三级理论片| 精品日本视频| 在线影院国内精品| av视屏在线播放| 日本美女一区| 91福利在线免费观看| 激情五月开心婷婷| 校园春色亚洲色图| 色妹子一区二区| 欧美国产日韩在线播放| 欧美特大特白屁股xxxx| 在线精品视频一区二区| 三级a在线观看| 玖玖精品在线| 欧美精品在线观看一区二区| 中文字幕第一页在线视频| 久久久久伊人| 777午夜精品免费视频| 51自拍视频在线观看| 福利一区三区| 欧美v国产在线一区二区三区| 女人扒开腿免费视频app| 国产成人77亚洲精品www| 欧美日韩国产美| 国产大片一区二区三区| ccyy激情综合| 日韩av综合网站| 色婷婷在线影院| 成人同人动漫免费观看| 久久精品成人动漫| 久久免费公开视频| 国产偷自视频区视频一区二区| 欧美在线视频网站| 一本色道久久综合熟妇| 国产一区二区三区黄视频| 国产成人一区二区三区免费看| 日韩一区免费视频| 久久久亚洲综合| 精品少妇人妻av一区二区| 青春草视频在线| 狠狠干狠狠久久| 亚洲 激情 在线| 亚洲网一区二区三区| 亚洲精选一区二区| 艳妇荡乳欲伦69影片| 狠狠综合久久| 国产成人一区二区| 国产毛片一区二区三区va在线 | 欧美日韩国产在线播放网站| 九色91porny| 亚洲宅男一区| 粗暴蹂躏中文一区二区三区| 国产午夜福利精品| 美女网站视频久久| 国内精品二区| 超碰公开在线| 色诱视频网站一区| 亚欧精品在线视频| 国产欧美久久一区二区三区| 九九热精品视频| 无码人妻一区二区三区免费| 国产精品一区二区久激情瑜伽| 久久久一本精品99久久精品66| 麻豆传媒在线完整视频| 色综合久久综合网97色综合 | 91原创在线视频| 四虎免费在线观看视频| 久久人体大尺度| 欧美大片拔萝卜| 亚洲精品自拍视频在线观看| 亚洲男人影院| 成人h在线播放| 男人天堂久久久| 黑人巨大精品欧美一区二区免费| 日韩欧美中文视频| 日韩在线观看一区 | 伊人伊人伊人久久| 日韩av在线电影| 国产美女一区二区| 日韩欧美视频一区二区三区四区 | 综合av在线| 国产精品久久久久久久天堂| 亚洲 精品 综合 精品 自拍| 亚洲久本草在线中文字幕| 中文字幕第36页| 天海翼亚洲一区二区三区| 九九视频这里只有精品| 亚洲性在线观看| 久久精品人人做人人综合| 国自产拍偷拍精品啪啪一区二区| 久久精品九色| 久久九九有精品国产23| 在线免费av片| 国产精品毛片无遮挡高清| 黄色三级视频片| 国产欧美一区二区三区精品观看| 欧美性一区二区三区| 手机在线精品视频| 偷窥少妇高潮呻吟av久久免费| 97人人模人人爽人人澡| 欧美一区免费| 亚洲自拍偷拍视频| 少妇视频在线| 精品捆绑美女sm三区| 欧美精品乱码视频一二专区| 国产精品一色哟哟哟| 大桥未久一区二区三区| 另类视频一区二区三区| 欧美激情xxxx性bbbb| www.精品久久| 亚洲五码中文字幕| 日韩无码精品一区二区| 99精品久久| 美媛馆国产精品一区二区| 毛片免费看不卡网站| 国产一区二区av| 亚洲性生活大片| 亚洲精品老司机| 91黄色免费视频| 久久av在线| www.午夜色| 91精品国产自产精品男人的天堂| 欧美福利小视频| 无码精品黑人一区二区三区| 欧美特级www| 国精产品视频一二二区| 国产在线日韩欧美| av高清在线免费观看| 在线一级成人| 成人网在线观看| 91探花在线观看| 亚洲人成网站在线播| 一级片一区二区三区| 亚洲一区视频在线观看视频| 成年人的黄色片| 日韩电影在线免费观看| 一二三四中文字幕| 偷拍亚洲精品| 成人精品久久一区二区三区| 91桃色在线观看| 中文字幕在线日韩| 成人乱码一区二区三区| 91久久久免费一区二区| 日本福利片在线观看| 97成人超碰视| 欧美一级小视频| 亚洲中字在线| 艳母动漫在线观看| 亚洲品质自拍| 成人性教育视频在线观看| sm久久捆绑调教精品一区| 中文字幕国产精品久久| 丰满肥臀噗嗤啊x99av| 精品视频一区二区不卡| 国产精品30p| 亚洲欧洲日产国码二区| 在线观看日韩精品视频| 国产酒店精品激情| 天天影视综合色| 亚洲福利专区| 日本三日本三级少妇三级66| 香蕉久久精品| 成人国产一区二区| 国产成人免费| 欧美在线观看日本一区| 亚洲资源一区| 最好看的2019年中文视频| 头脑特工队2免费完整版在线观看| 欧美日韩国产综合久久| 久草视频一区二区| 亚洲不卡一区二区三区| 日韩欧美国产成人精品免费| 国产午夜精品一区二区三区视频 | 欧美精品精品精品精品免费| 137大胆人体在线观看| 亚洲欧美国产精品专区久久| 人妻妺妺窝人体色www聚色窝 | 久久艹这里只有精品| 奇米影视一区二区三区| www.com毛片| 伊人成年综合电影网| 国产一二三四五| 91亚洲国产成人久久精品| 日韩高清三级| 免费精品国产| 老牛影视免费一区二区| 日韩在线黄色| 久久久一本精品99久久精品66| jizz性欧美2| 国产精品一区二区三区精品| 看亚洲a级一级毛片| 91成人免费视频| 精品午夜视频| 成人精品水蜜桃| 涩爱av色老久久精品偷偷鲁| 91在线观看欧美日韩| 懂色av色香蕉一区二区蜜桃| 亚洲在线www| 亚洲国产中文在线| 国产精品一区二区三区四区五区 | 精品国产91洋老外米糕| 欧美亚洲精品在线观看| 亚洲精品在线观看视频| 欧美视频一二区| 亚洲韩国青草视频| 日本高清视频网站| 亚洲国内精品在线| 免费a在线观看| 在线日韩av观看| 免费大片在线观看www| 久久精品国产久精国产一老狼| 欧美一区二区三区在线观看免费| 精品国产美女在线| 亚洲h片在线看| 97在线日本国产| 在线观看欧美日韩电影| 国产精品91一区| 亚洲精品第一| 国产精品久久国产三级国电话系列| 亚洲精品a区| 久久久精彩视频| 青青草91久久久久久久久| 在线丝袜欧美日韩制服| 欧美日韩亚洲一区| 91国视频在线| 蜜桃av噜噜一区二区三区小说| 日本不卡一区二区在线观看| 国产精品1区2区3区在线观看| 在线观看一区二区三区四区| 91蝌蚪porny九色| 国产黄色片在线| 亚洲国产综合在线| 色老头一区二区| 日韩一区和二区| 男人av在线| 欧美大成色www永久网站婷| 中文在线资源| 成人羞羞国产免费| 丝袜美腿一区二区三区动态图 | 米奇精品一区二区三区| 久久免费视频在线观看| 欧美日韩尤物久久| 国产女主播一区二区三区| 欧美日韩一区二区三区视频播放| 麻豆映画在线观看| 久久精品道一区二区三区| 欧美激情国内自拍| 久久久久久久久蜜桃| 国产精品三区在线观看| 色哟哟一区二区三区| 国产成人麻豆精品午夜在线| 国产一区二区三区在线看| 免费男女羞羞的视频网站在线观看| 人人澡人人澡人人看欧美| а天堂中文最新一区二区三区| 精品日本一区二区三区在线观看| 9999国产精品| 免费一级特黄特色毛片久久看| 蜜桃精品视频在线| 爱爱免费小视频| 一区二区三区欧美日| 制服丝袜在线一区| 精品香蕉一区二区三区| 羞羞视频在线观看免费| 国产精品久久久久久亚洲影视| 老司机精品视频在线播放| 亚洲一区bb| 视频一区二区欧美| 无码一区二区精品| 一区二区三区在线免费播放| 中文字幕一区二区在线视频| 亚洲韩国青草视频| 美洲精品一卡2卡三卡4卡四卡| 国产日韩欧美影视| 欧美日韩第一| 国产免费一区二区三区视频| 成人精品免费看| 欧美黄片一区二区三区| 欧美夫妻性生活| 成a人片在线观看www视频| 欧洲成人在线观看| 欧美做受69| 欧美在线一区视频| 丰满放荡岳乱妇91ww| 草视频在线观看| 日韩一区二区免费高清| 精品国产丝袜高跟鞋| 国产精品视频永久免费播放 | 400部精品国偷自产在线观看| 日韩激情一二三区| 欧美熟妇激情一区二区三区| 狠狠久久亚洲欧美专区| 天天综合天天综合| 57pao成人国产永久免费| 日本一区福利在线| 免费看的黄色大片| 99精品国产91久久久久久 | 精品视频色一区| 中文字幕在线播放| 国产拍精品一二三| 久久国产小视频| 五月天婷婷亚洲| 亚洲美女区一区| 亚洲成人一级片| 韩国国内大量揄拍精品视频| 老汉色老汉首页av亚洲| 国产欧美在线一区| 久久综合九色综合欧美就去吻| 特级做a爱片免费69| 亚洲欧洲xxxx| 成人在线不卡| 国内精品国产三级国产99| 国产精品自在在线| xxxxxx国产| 亚洲精品视频网上网址在线观看| 欧美极度另类| 亚洲一区三区电影在线观看| 国内精品国产三级国产a久久| 日韩在线中文字幕视频| 精品国产乱码久久| 绿色成人影院| 日韩妆和欧美的一区二区| 麻豆91精品91久久久的内涵| 波多野结衣家庭教师| 亚洲电影第1页| 卡通欧美亚洲| 黄频视频在线观看| 成人精品免费网站| 狠狠狠狠狠狠狠| 久久九九免费视频| 成人动漫视频| 一级在线免费视频| 亚洲综合无码一区二区| 青青色在线视频| 国产在线999| 在线观看一区| 在线免费观看视频| 欧美变态凌虐bdsm| 婷婷午夜社区一区| 丰满人妻一区二区三区53号| 99精品欧美一区二区蜜桃免费 | 图片区小说区区亚洲五月| 狠狠v欧美v日韩v亚洲ⅴ| 日韩乱码一区二区| 色婷婷**av毛片一区| 久久人人爽人人爽人人片av不| 无码人妻精品一区二区三区66| 一区二区免费看| 超碰国产在线观看| 成人综合av网| 麻豆视频一区二区| 国产福利拍拍拍| 久久成人免费视频| 国产日产精品一区二区三区四区的观看方式| 一级做a免费视频| 欧美日韩综合视频| 色呦呦呦在线观看|