精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

盤(pán)點(diǎn)RAG中最容易犯的五個(gè)錯(cuò)誤

人工智能
基于向量的檢索無(wú)疑是 RAG 成功的重要因素。向量嵌入非常適合映射文本的語(yǔ)義含義。它們也適用于不同大小的文本。你的查詢(xún)可能是一句話(huà),但你的文檔存儲(chǔ)包含整頁(yè)文章?——向量搜索可以處理。

我大部分時(shí)間都在構(gòu)建和改進(jìn) Retrieval-Augmented Generation (RAG) 應(yīng)用。

我相信 RAG 可能是最受歡迎的 AI 應(yīng)用之一。它無(wú)處不在,從聊天機(jī)器人到文檔摘要。

圖片圖片

我也相信,由于各種原因,許多 RAG 應(yīng)用最終未能部署,其中很多并非技術(shù)原因。然而,我希望自己早知道一些技術(shù)方面的知識(shí),以創(chuàng)建更有效的 RAG。

但這就是我們學(xué)習(xí)新事物的方式。沒(méi)有比構(gòu)建并失敗更好的工程學(xué)習(xí)方法了。

從我的失敗中,我學(xué)到了一些寶貴的經(jīng)驗(yàn)教訓(xùn),這些經(jīng)驗(yàn)對(duì)首次構(gòu)建 RAG 的人很有幫助。你不必重復(fù)我犯過(guò)的錯(cuò)誤,這樣你就能更快前進(jìn)。

那么,讓我們談?wù)劦谝粋€(gè)錯(cuò)誤。

向量數(shù)據(jù)庫(kù)并非硬性規(guī)定

幾乎所有關(guān)于 RAG 的網(wǎng)絡(luò)教程都使用向量數(shù)據(jù)庫(kù)。如果你搜索過(guò) RAG 相關(guān)內(nèi)容,你會(huì)明白我的意思。

基于向量的檢索無(wú)疑是 RAG 成功的重要因素。向量嵌入非常適合映射文本的語(yǔ)義含義。它們也適用于不同大小的文本。你的查詢(xún)可能是一句話(huà),但你的文檔存儲(chǔ)包含整頁(yè)文章?——向量搜索可以處理。

然而,檢索并不僅限于基于向量的檢索。

RAG 可以從互聯(lián)網(wǎng)、關(guān)系數(shù)據(jù)庫(kù)、Neo4J 中的知識(shí)圖譜或三者的組合中檢索信息。

在許多情況下,我注意到混合方法能帶來(lái)更好的性能。

對(duì)于通用應(yīng)用,你可以使用向量數(shù)據(jù)庫(kù),但當(dāng)向量數(shù)據(jù)庫(kù)中沒(méi)有所需信息時(shí),你可以搜索互聯(lián)網(wǎng)。

對(duì)于客戶(hù)聊天機(jī)器人,你可能需要讓 RAG 訪問(wèn)部分客戶(hù)數(shù)據(jù)庫(kù),這可以是關(guān)系數(shù)據(jù)庫(kù)。

企業(yè)的知識(shí)管理系統(tǒng)可能會(huì)創(chuàng)建一個(gè)知識(shí)圖譜,并從中檢索信息,而不是使用向量數(shù)據(jù)庫(kù)。

這些都是 RAG 的定義。

然而,選擇數(shù)據(jù)源的過(guò)程并非直截了當(dāng)。你需要嘗試各種選項(xiàng),了解每種方法的優(yōu)點(diǎn)。接受或拒絕一個(gè)想法的理由可能受技術(shù)和業(yè)務(wù)因素的影響。

例如,你可以為每個(gè)客戶(hù)簡(jiǎn)介信息創(chuàng)建文本版本并進(jìn)行向量化以供檢索。這對(duì)于查詢(xún)來(lái)說(shuō)可能很高效,因?yàn)槟阒惶幚硪粋€(gè)數(shù)據(jù)庫(kù)。但它的準(zhǔn)確性可能不如運(yùn)行 SQL 查詢(xún)。這是技術(shù)原因。

然而,讓 LLM 運(yùn)行 SQL 查詢(xún)可能導(dǎo)致 SQL 注入攻擊。這是技術(shù)和業(yè)務(wù)上的問(wèn)題。

向量數(shù)據(jù)庫(kù)在語(yǔ)義檢索方面也很高效。但這并不意味著其他數(shù)據(jù)庫(kù)不能處理語(yǔ)義檢索;幾乎所有其他數(shù)據(jù)庫(kù)都可以進(jìn)行向量搜索。

因此,如果你決定在 RAG 中使用某種形式的向量嵌入,這里還有一個(gè)建議。

優(yōu)先選擇經(jīng)過(guò)微調(diào)的小模型

嵌入模型可以將任何內(nèi)容轉(zhuǎn)化為向量形式。大型模型的性能通常優(yōu)于小型模型。

但這并不意味著越大越好。

別管模型大小。所有模型都在公開(kāi)數(shù)據(jù)集上訓(xùn)練。它們能區(qū)分“蘋(píng)果”水果和“蘋(píng)果”品牌。但如果你和朋友用“蘋(píng)果”作為暗號(hào),嵌入模型無(wú)法知道。

然而,我們創(chuàng)建的幾乎所有應(yīng)用都專(zhuān)注于一個(gè)小的細(xì)分領(lǐng)域。

對(duì)于這些應(yīng)用,大型模型的收益是微不足道的。

這里有一個(gè)不同的做法。

為你的領(lǐng)域數(shù)據(jù)創(chuàng)建一個(gè)數(shù)據(jù)集,并對(duì)小型嵌入模型進(jìn)行微調(diào)。

小型模型足以捕捉語(yǔ)言細(xì)微差別,但可能無(wú)法理解在不同語(yǔ)境中有特殊含義的詞。

但仔細(xì)想想,你的模型為什么需要理解木星的衛(wèi)星?

小型模型更高效。它們速度快,成本低。

為了彌補(bǔ)模型在領(lǐng)域知識(shí)方面的不足,你可以對(duì)其進(jìn)行微調(diào)。

這兩個(gè)建議可以?xún)?yōu)化索引部分以實(shí)現(xiàn)高效檢索。然而,檢索過(guò)程也可以進(jìn)一步優(yōu)化。

檢索過(guò)程可以更高級(jí)

最直接的檢索過(guò)程是直接查詢(xún)。

如果你使用向量數(shù)據(jù)庫(kù),可以對(duì)用戶(hù)輸入進(jìn)行語(yǔ)義搜索。否則,你可以使用 LLM 生成 SQL 或 Cipher 查詢(xún)。

必要時(shí)你還可以調(diào)用 HTTP 端點(diǎn)。

但直接查詢(xún)方法很少能產(chǎn)生可靠的上下文。

你可以以更高級(jí)的方式查詢(xún)數(shù)據(jù)源。例如,你可以嘗試查詢(xún)路由技術(shù)來(lái)決定從哪個(gè)數(shù)據(jù)源獲取數(shù)據(jù)。具有良好推理能力的 LLM 可以用于此目的。你還可以在小型模型上進(jìn)行指令微調(diào),以節(jié)省成本并降低延遲。

另一種技術(shù)是鏈?zhǔn)秸?qǐng)求。對(duì)于初始查詢(xún),我們可以從數(shù)據(jù)源獲取信息。然后,根據(jù)獲取的文檔,我們可以獲取后續(xù)文檔。

分塊是 RAG 中最具挑戰(zhàn)性且至關(guān)重要的部分

當(dāng)上下文包含無(wú)關(guān)信息時(shí),LLM 容易出現(xiàn)幻覺(jué)。

防止 RAG 幻覺(jué)的最佳方法是分塊。

現(xiàn)代 LLM 可能支持更長(zhǎng)的上下文長(zhǎng)度。例如,Gemini 2.5 Pro 支持高達(dá) 200 萬(wàn)個(gè) token,足以容納兩到三本大學(xué)級(jí)別的物理教科書(shū)。

但對(duì)于基礎(chǔ)力學(xué)問(wèn)題,你很少需要量子物理的上下文信息。

如果你將教科書(shū)分解成較小的部分,可能每個(gè)部分只討論一個(gè)主題,你就能只獲取回答問(wèn)題所需的相關(guān)信息。

這里的挑戰(zhàn)在于分塊技術(shù)有很多種。每種技術(shù)都有其優(yōu)缺點(diǎn)。適合你領(lǐng)域的技術(shù)可能不適用于其他領(lǐng)域。

遞歸字符分塊可能是最簡(jiǎn)單的,也是我的默認(rèn)選擇。然而,它假設(shè)文本中每個(gè)主題的討論長(zhǎng)度相等,這很少是事實(shí)。盡管如此,這是最好的起點(diǎn)。

圖片圖片

你甚至可以嘗試主題聚類(lèi)和代理分塊。

嘗試重新排序

最后但同樣重要的是,重新排序。

事實(shí)證明,相關(guān)分塊的位置是高質(zhì)量 LLM 響應(yīng)的關(guān)鍵因素。

然而,常規(guī)向量搜索甚至數(shù)據(jù)庫(kù)查詢(xún)的排序方式并不智能。LLM 可以做到。

因此,我們使用專(zhuān)門(mén)的大型語(yǔ)言模型 (LLM) 作為重新排序器,重新排列獲取的上下文并進(jìn)一步過(guò)濾,找出最相關(guān)的分塊。

這種二級(jí)重新排序在某些應(yīng)用中有幫助,但在其他應(yīng)用中未必。但你可以使用一些技術(shù)來(lái)改進(jìn)重新排序的結(jié)果。

其中之一是獲取大量初始結(jié)果。寬松定義初始標(biāo)準(zhǔn)會(huì)拉取一些無(wú)關(guān)上下文,但會(huì)增加獲取正確內(nèi)容的概率。

圖片圖片

重新排序器現(xiàn)在可以處理這個(gè)大型集合并過(guò)濾出更相關(guān)的部分。

最終思考

構(gòu)建 RAG 已成為任何 LLM 應(yīng)用的必備。即使是 200 萬(wàn) token 的上下文窗口也無(wú)法挑戰(zhàn)它。

我們開(kāi)發(fā)的原型通常未能部署。部分原因歸于業(yè)務(wù)決策,但也有可以解決的技術(shù)原因。

本文是我在構(gòu)建 RAG 方面的經(jīng)驗(yàn)總結(jié)。

雖然這不是一個(gè)全面的列表,但考慮這五個(gè)方面將確保你開(kāi)發(fā)出更持久的 RAG。

責(zé)任編輯:武曉燕 來(lái)源: PyTorch研習(xí)社
相關(guān)推薦

2015-08-26 10:00:31

獨(dú)立游戲cp錯(cuò)誤

2019-11-01 14:19:02

大數(shù)據(jù)機(jī)器學(xué)習(xí)工具

2023-07-19 11:19:37

AI項(xiàng)目人工智能

2016-11-02 12:56:58

Linux新手錯(cuò)誤

2023-01-09 12:06:33

2022-06-28 10:13:09

Pandas錯(cuò)誤Python

2011-05-31 15:38:37

CSS

2022-05-17 09:32:24

Bash編程Linux

2019-04-24 08:56:34

Java開(kāi)發(fā)人員常犯錯(cuò)誤

2016-11-30 14:15:34

網(wǎng)絡(luò)布線(xiàn)錯(cuò)誤

2011-04-18 12:55:04

JavaScript開(kāi)發(fā)者

2022-12-26 11:02:06

云計(jì)算CIOIT

2015-07-29 10:46:20

Java錯(cuò)誤

2012-08-31 10:09:04

用戶(hù)體驗(yàn)錯(cuò)誤初創(chuàng)團(tuán)隊(duì)

2018-04-04 09:55:18

語(yǔ)言PHP易犯錯(cuò)誤

2012-09-21 14:02:36

創(chuàng)業(yè)創(chuàng)業(yè)團(tuán)隊(duì)用戶(hù)體驗(yàn)

2021-09-02 08:40:10

程序員錯(cuò)誤

2009-07-10 09:20:11

IT人才經(jīng)驗(yàn)談

2024-05-27 16:27:22

2011-07-06 08:49:05

程序員
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美高清日韩| www.com.cn成人| 国产精品一二三四五| 欧美疯狂xxxx大交乱88av| 麻豆av免费看| 女人让男人操自己视频在线观看| 久久一留热品黄| 国产欧美日韩亚洲精品| 免费无遮挡无码永久在线观看视频| 粉嫩的18在线观看极品精品| 91久久精品一区二区| 椎名由奈jux491在线播放| 国产1区在线观看| 日本中文字幕一区| 久久久这里只有精品视频| 国产成人一区二区在线观看| 香蕉成人app| 在线一区二区三区四区五区 | 精品国产日韩欧美| 欧美一区二区精品| 狠狠热免费视频| 久久亚洲导航| 中文字幕日本不卡| 神马影院一区二区三区| 免费观看黄色av| 激情久久久久久久久久久久久久久久| 2019国产精品自在线拍国产不卡| 国产喷水在线观看| 精品一区不卡| 日韩精品免费在线观看| 91pony九色| 草莓视频成人appios| 午夜精品久久久久久久久| 中文字幕一区二区三区精彩视频 | 日韩中文字幕在线免费观看| 欧美大片免费播放器| 亚洲乱码一区| 在线播放91灌醉迷j高跟美女| 成人观看免费完整观看| 不卡视频观看| 亚洲午夜影视影院在线观看| 欧美大片免费播放| av中文字幕在线| 久久久久综合网| 国产在线精品一区二区三区》| 国产精品欧美综合亚洲| 青青草97国产精品免费观看无弹窗版| 91chinesevideo永久地址| 国产性生活网站| 欧美日本精品| 久久成人在线视频| 久久国产波多野结衣| 色无极亚洲影院| 国产一区二区三区丝袜| av男人的天堂av| 国产成人手机高清在线观看网站| 精品在线小视频| 97人妻精品一区二区三区免| 久久99精品国产自在现线| 欧美精品一区二区三区在线 | 日本三级免费观看| 亚洲综合电影| 日本乱码高清不卡字幕| 国产视频在线视频| 国产精品原创视频| 91精品国产91久久久久久一区二区| 成人日韩在线视频| 国产aa精品| 日韩免费成人网| 国产69视频在线观看| 国产精品玖玖玖在线资源| 亚洲精品一区二区三区蜜桃下载| 成人免费无码大片a毛片| 清纯唯美亚洲经典中文字幕| 亚洲美女在线观看| 成人做爰69片免网站| 999国产精品999久久久久久| 麻豆乱码国产一区二区三区| 九九九免费视频| 中文精品在线| 国产精品久久久久久久久免费看| 伊人网免费视频| 国产成人精品免费视频网站| 精品视频免费观看| a中文在线播放| 亚洲综合区在线| 91精品国产91久久久久麻豆 主演| 涩涩视频网站在线观看| 欧美色综合影院| 极品人妻一区二区| 要久久电视剧全集免费| 久久国内精品一国内精品| 欧美色图一区二区| 亚洲欧美高清| 91免费看片在线| 无套内谢的新婚少妇国语播放| 国产亚洲成aⅴ人片在线观看 | 777奇米四色成人影色区| 精品人妻在线视频| 欧美日韩黑人| 欧美激情视频在线免费观看 欧美视频免费一 | 人妻少妇精品久久| 国产在线|日韩| 日韩欧美不卡在线观看视频| 中文幕无线码中文字蜜桃| 天天做综合网| 青青久久av北条麻妃海外网| 国产婷婷一区二区三区久久| 91蜜桃免费观看视频| 2025韩国大尺度电影| 黄色软件视频在线观看| 欧美精品第1页| 性高潮久久久久久久| 国产精品v一区二区三区| 国产精品第2页| 少妇人妻精品一区二区三区| 18成人在线视频| 日日碰狠狠躁久久躁婷婷| aaa国产精品视频| 日韩在线小视频| 国产精品va无码一区二区三区| 国产精品亚洲成人| 亚洲视频精品一区| 欧美91看片特黄aaaa| 亚洲精品一区在线观看| 少妇人妻丰满做爰xxx| 日韩精品国产精品| 精品一卡二卡三卡四卡日本乱码| 黄色成人影院| 欧美色综合天天久久综合精品| 9.1成人看片| 在线视频观看日韩| 99精品99久久久久久宅男| 亚洲欧美视频一区二区| 在线视频国内自拍亚洲视频| 精品夜夜澡人妻无码av| 亚洲欧洲另类| 国产精品美女诱惑| 午夜小视频在线观看| 4438x亚洲最大成人网| 天堂资源在线视频| 日韩激情视频在线观看| 日本成人黄色免费看| 日本а中文在线天堂| 精品国精品国产尤物美女| 唐朝av高清盛宴| 国产成人午夜电影网| 日韩人妻一区二区三区蜜桃视频| 日本中文字幕视频一区| 色婷婷久久av| 一区二区三区免费观看视频| 国产精品第13页| 天堂视频免费看| 99视频精品全国免费| 国产日韩欧美视频在线| 日韩欧美小视频| 欧美妇女性影城| 精品国产视频在线观看| 国产一区二区伦理| www.在线观看av| 国产一级成人av| 欧美在线视频观看| 国产在线观看网站| 欧美亚洲综合久久| 女性裸体视频网站| 国产精品亚洲成人| 成人毛片一区二区| 国产欧美日韩精品一区二区免费 | 在线观看亚洲黄色| 国产精品伦一区二区三级视频| 中文字幕 日韩 欧美| 这里只有精品在线| 国产日韩欧美亚洲一区| 成人影院av| 色悠悠久久久久| 亚洲第一页视频| 黑人巨大精品欧美一区二区三区| 无码国产69精品久久久久同性| 奇米一区二区三区| 日韩中文字幕在线不卡| 免费看成人哺乳视频网站| 国产女人精品视频| 国产精品偷拍| 亚洲精品中文字幕女同| 亚洲熟妇av乱码在线观看| 亚洲黄一区二区三区| 国产精品九九视频| 日本不卡高清视频| 成人免费看片'免费看| 香蕉一区二区| 亚洲综合在线中文字幕| 免费一二一二在线视频| 精品激情国产视频| 色视频在线观看福利| 3751色影院一区二区三区| 亚洲国产成人精品激情在线| 中文字幕免费在线观看视频一区| 成人三级做爰av| 老司机免费视频久久| 国产三级中文字幕| 精品国产aⅴ| 国产麻豆乱码精品一区二区三区| 日韩av电影资源网| 97国产精品人人爽人人做| 欧美偷拍视频| 日韩欧美亚洲国产另类| 最近日韩免费视频| 天天色综合成人网| 日韩激情综合网| 久久精品亚洲一区二区三区浴池 | 亚洲中文字幕无码专区| 亚洲经典一区| 日韩黄色影视| 青青草原在线亚洲| 999在线观看免费大全电视剧| 免费观看亚洲| 欧美—级高清免费播放| 麻豆tv在线| 伊人av综合网| 日本aaa在线观看| 精品国产乱码久久久久久免费| 在线观看毛片视频| 色老汉一区二区三区| 日本三级免费看| 亚洲精品久久7777| 亚洲一区电影在线观看| 国产午夜精品一区二区| 中文字幕av观看| 成人动漫视频在线| 国模大尺度视频| 精品一区二区免费在线观看| 中文字幕在线观看第三页| 香蕉成人久久| 欧美大片在线播放| 在线观看日韩av电影| 免费日韩在线观看| 综合日韩在线| 亚洲国产精品女人| 亚洲91精品| 91社在线播放| 欧美成人自拍| 在线电影看在线一区二区三区| 精品久久电影| 亚洲午夜精品一区二区| 日韩情爱电影在线观看| 日韩视频在线播放| re久久精品视频| 亚洲一区二区三区午夜| 欧美大片aaaa| 欧美一级黄色录像片| 一区二区电影| 国产精品视频网站在线观看| 国产精品久久| 青青草国产精品视频| 亚洲少妇一区| 97公开免费视频| 久久精品久久综合| 日本高清免费在线视频| 国产白丝网站精品污在线入口| 中文字幕一区二区三区人妻在线视频| 国产精品 欧美精品| 亚洲av综合色区无码另类小说| 国产成人综合视频| a级片在线观看视频| www.99精品| 中文字幕第4页| 国产精品乱码妇女bbbb| 婷婷在线精品视频| 五月天久久比比资源色| 国产免费av一区| 欧美日韩一卡二卡| 精品人妻一区二区三区日产乱码| 欧美精品一区二| 你懂的在线播放| 北条麻妃在线一区二区| 日本无删减在线| 欧美一区二区视频97| 成人黄页网站视频| 91偷拍精品一区二区三区| 美国成人xxx| 亚洲精品久久久久久一区二区| 91精品国产自产在线观看永久∴ | 日韩在线卡一卡二| 国产无色aaa| 99r精品视频| 性少妇xx生活| 亚洲一级电影视频| 午夜一区二区三区四区| 91精品国产一区二区三区蜜臀| 黄色三级网站在线观看| 一本大道久久加勒比香蕉| 97caopor国产在线视频| 欧美在线视频观看免费网站| 亚洲成人高清| 黄色小网站91| 国产高清一区二区| 国产二区视频在线播放| 九一九一国产精品| 97人妻天天摸天天爽天天| 国产精品大尺度| 中文字幕精品三级久久久| 欧美精品久久天天躁| 欧美婷婷久久五月精品三区| 美女久久久久久久| 性欧美18一19sex性欧美| 99porn视频在线| 欧美日韩在线网站| 国产v片免费观看| 经典三级在线一区| 波多野结衣av在线观看| 亚洲一区日韩精品中文字幕| 中文字幕一区二区三区免费看| 亚洲国产成人久久综合一区| 日本三级视频在线观看| 欧亚精品在线观看| 一区二区精彩视频| 一区二区精品在线| 丝袜美腿一区二区三区| 欧美在线一级片| 亚洲伦在线观看| 中文字字幕在线中文乱码| 日韩精品在线免费观看| 日韩特级毛片| 91欧美视频网站| 日韩免费在线| 人人干人人视频| 91老司机福利 在线| 国产一级做a爰片在线看免费| 宅男噜噜噜66一区二区66| av二区在线| 日本一本a高清免费不卡| 麻豆国产欧美一区二区三区r| 亚洲精品天堂成人片av在线播放| 蜜臀久久99精品久久久久宅男 | 日韩av加勒比| 国产精品国产精品国产专区不蜜 | 丝袜美腿小色网| 欧美日韩三级视频| 电影av一区| 国产精品久久久久久超碰| 国产精品欧美三级在线观看| 日日摸日日碰夜夜爽av| 91性感美女视频| 欧美精品二区三区| 亚洲国模精品私拍| 绿色成人影院| 欧美精品一区二区三区在线看午夜 | 一区二区三区在线播放欧美| 日韩在线短视频| 日韩欧美一区二区视频在线播放| 石原莉奈一区二区三区在线观看| 亚洲av综合一区二区| 色综合亚洲欧洲| 国产永久免费高清在线观看视频| 日本亚洲欧洲色α| 大胆日韩av| 蜜臀一区二区三区精品免费视频 | 亚洲欧美精品一区| 韩国成人动漫| 天堂√在线观看一区二区| 秋霞电影网一区二区| 999久久久国产| 91精品一区二区三区在线观看| 国产成人l区| 成人羞羞视频免费| 国产亚洲精品v| 黄色av免费播放| 欧美精品电影在线播放| 欧美一卡二卡| 久久精精品视频| 日韩福利视频导航| 美国一级片在线观看| 日韩你懂的电影在线观看| 999精品网| 欧洲高清一区二区| 激情五月激情综合网| 久久国产精品波多野结衣| 日韩精品亚洲精品| 欧美日韩va| 国产无限制自拍| 欧美精彩视频一区二区三区| 国产精品久久久久精| 国模私拍视频一区| 国产欧美日韩精品一区二区三区 | 亚洲黄色小说网址| 欧美在线视频在线播放完整版免费观看| 欧美熟乱15p| 99riav国产精品视频| 一本一本大道香蕉久在线精品| 色网站在线看| 国产主播一区二区三区四区| 男女视频一区二区| 日本熟妇毛耸耸xxxxxx| 在线成人激情视频| 成人高潮视频| 亚洲这里只有精品| 偷窥少妇高潮呻吟av久久免费| av资源网在线观看| 国产日韩欧美二区| 国产一区二区三区四区五区入口 |