精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

長上下文能取代RAG嗎?

人工智能 新聞
LLM的上下文長度卷到了恐怖的1M,RAG還有存在的必要嗎?近日,來自英偉達(dá)的研究人員給出了新的答案。

曾幾何時,LLM還是憨憨的。

腦子里的知識比較混亂,同時上下文窗口長度也有限。

檢索增強(qiáng)生成(RAG)的出現(xiàn)在很大程度上提升了模型的性能。

圖片

然而,LLM很快變得強(qiáng)大,上下文窗口長度也迅速膨脹。

現(xiàn)役的主流大模型,比如GPT-4o、Claude-3.5、Llama3.1、Phi-3和 Mistral-Large2等,都支持128K長的上下文,Gemini-1.5-pro甚至達(dá)到了1M的長度。

圖片

于是人們不禁要問:在長上下文LLM時代,RAG還有存在的必要嗎?

這樣的疑問是有根據(jù)的,之前的一項研究就證明了,長上下文(LC)在答案質(zhì)量方面始終優(yōu)于RAG:

圖片

論文地址:https://www.arxiv.org/pdf/2407.16833

在這勃勃生機(jī)、萬物競發(fā)的春天里,RAG當(dāng)真要失寵了么?

近日,來自英偉達(dá)的研究人員重新審視了這個問題,他們發(fā)現(xiàn), LLM上下文中檢索塊的順序?qū)τ诖鸢纲|(zhì)量至關(guān)重要。

傳統(tǒng)的RAG會將檢索到的塊按照相關(guān)性降序排列,但這篇工作表明,保留原始文本中檢索塊的順序,能夠顯著提高RAG的答案質(zhì)量。

圖片

論文地址:https://arxiv.org/pdf/2409.01666

由此,研究人員提出了保序機(jī)制——Order-Preserve RAG(OP-RAG)。

在En.QA數(shù)據(jù)集上的實驗中,OP-RAG方法(Llama3.1-70B)僅使用16K檢索到的token,就實現(xiàn)了44.43的F1-score。

圖片

相比之下,沒有RAG的Llama3.1-70B,在充分利用128K上下文的情況下,只達(dá)到了34.32的F1-score。

而GPT-4o和Gemini-1.5-Pro則分別為32.36分和43.08分。

圖片

上圖顯示了每組實驗平均輸入的token數(shù)量,可以認(rèn)為OP-RAG以很少的資源量達(dá)到了超越長上下文的效果。

——這也再次證明了RAG的獨(dú)特價值。

Make RAG Great Again

RAG曾幫助早期的LLM克服了有限上下文的限制,通過訪問最新的信息,顯著減少LLM的幻覺,提高了事實準(zhǔn)確性。

盡管目前長上下文的研究逐漸獲得偏愛,但作者認(rèn)為超長的語境會導(dǎo)致LLM對相關(guān)信息的關(guān)注度降低,最終使答案質(zhì)量下降,而本文提出的OP-RAG則能夠用更少的token換來更高的答案質(zhì)量。

OP-RAG

首先通過以下方式表示長上下文:將長文本d切成N個連續(xù)且均勻的塊c,ci表示第i塊 。給定一個查詢q,可以得到ci塊的相關(guān)性得分(通過計算嵌入之間的余弦相似度):

圖片

檢索出相似度得分最高的前k個塊,但保留這些塊在原始長上下文d中的順序。

圖片

上圖直觀展示了普通RAG與OP-RAG之間的差異:一個長文檔被切分為13塊并計算了相似度分?jǐn)?shù)。

同樣是檢索相似度得分最高的前4個塊,Vanilla RAG按分?jǐn)?shù)降序重排了,而OP-RAG保留了塊之間的相對順序。

實驗設(shè)置

研究人員選擇了專為長上下文QA評估而設(shè)計的EN.QA和EN.MC數(shù)據(jù)集進(jìn)行實驗。

En.QA由351個人工注釋的問答對組成,數(shù)據(jù)集中的長上下文平均包含150,374個單詞,這里使用F1-score作為En.QA的評估指標(biāo)。

EN.MC由224個問答對組成,其注釋與En.QA類似,但每個問題提供四個答案供選擇。

En.MC中的長上下文平均包含142,622個單詞,這里使用準(zhǔn)確性作為En.QA評估的指標(biāo)。

所有數(shù)據(jù)集上的塊大小都設(shè)置為128個token,塊之間不重疊,使用BGE-large-en-v1.5的默認(rèn)設(shè)置來獲得查詢和塊的嵌入。

消融研究

上下文長度的影響

作者評估了上下文長度對OP-RAG性能的影響。實驗中每個塊包含128個token,生成答案時檢索塊數(shù)為128。

如下圖所示,隨著上下文長度的增加,性能最初會提高。這是因為更多的上下文可能有更大的機(jī)會覆蓋相關(guān)的塊。

然而,隨著上下文長度進(jìn)一步增加,答案質(zhì)量會下降,因為更多不相關(guān)的塊產(chǎn)生了干擾。

圖片

實驗中的Llama3.1-8B模型,在EN.QA數(shù)據(jù)集和EN.MC數(shù)據(jù)集上,上下文長度為16K時達(dá)到性能峰值,而Llama3.1-70B模型在EN.QA上的最佳性能點為16K,在EN.MC上為32K。

Llama3.1-70B的峰值點晚于Llama3.1-8B,可能是因為較大規(guī)模的模型具有更強(qiáng)的區(qū)分相關(guān)塊和不相關(guān)干擾的能力。

這里有兩方面的啟示,首先是需要在檢索更多上下文來提高召回率,和限制干擾來保持準(zhǔn)確性之間進(jìn)行權(quán)衡;

其次,引入過多的不相關(guān)信息會降低模型的性能,這也是當(dāng)前長上下文LLM所面臨的問題。

OP-RAG和檢索塊數(shù)

如下圖所示,當(dāng)檢索到的塊的數(shù)量較?。ū热?)時,本文提出的保留順序RAG相對于普通RAG的優(yōu)勢并不明顯。

而當(dāng)檢索到的塊數(shù)量很大時,OP-RAG的性能顯著優(yōu)于普通RAG。

圖片

在EN.QA數(shù)據(jù)集上,當(dāng)檢索到的塊數(shù)為128時, 普通RAG只能實現(xiàn)38.40的F1-score,而OP-RAG獲得了44.43分。

在EN.MC數(shù)據(jù)集上,檢索塊數(shù)為192時,普通RAG的Accuracy為81.22,而OP-RAG達(dá)到了88.65。

實驗結(jié)果

研究人員將OP-RAG與兩種類型的基線進(jìn)行比較。

第一類方法使用沒有RAG的長上下文LLM。如下表所示,在沒有RAG的情況下,LLM需要大量token作為輸入,效率低且成本高。

相比之下,本文的保序RAG不僅顯著減少了所需token數(shù)量,而且提高了答案質(zhì)量。

對于Llama3.1-70B模型,沒有RAG的方法在EN.QA數(shù)據(jù)集上,只能實現(xiàn)34.26的F1-score,且平均需要117K個token作為輸入。相比之下,OP-RAG以48K個token的輸入獲得了47.25的分?jǐn)?shù)。

圖片

第二類基線采用SELF-ROUTE機(jī)制 ,它根據(jù)模型自我反思將查詢路由到RAG或長上下文LLM 。如上表所示,OP-RAG方法明顯優(yōu)于在LLM的輸入中使用更少token的方法。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-10-20 09:06:00

2025-02-26 00:16:56

RAGAI服務(wù)

2025-10-31 01:00:00

2024-04-03 10:05:00

LLM性能基準(zhǔn)測試

2025-05-09 07:50:30

2024-09-05 08:24:09

2025-10-13 08:00:00

2024-01-29 08:49:36

RAG模型檢索

2024-06-06 08:42:01

2025-09-10 09:38:56

2025-10-11 04:22:00

人工海馬體網(wǎng)絡(luò)LV-Eval

2017-05-11 14:00:02

Flask請求上下文應(yīng)用上下文

2024-02-26 00:00:00

RAGGeminiLLM

2025-06-26 07:00:00

上下文工程AI智能體

2025-05-07 08:35:11

2025-10-13 01:22:00

2023-12-10 13:37:23

Python編程上下文管理

2012-12-31 10:01:34

SELinuxSELinux安全

2024-11-20 09:36:00

2025-10-31 10:13:19

點贊
收藏

51CTO技術(shù)棧公眾號

久久久久久久久国产| 亚洲成a人v欧美综合天堂| 国产精品18久久久久久首页狼| 911亚洲精选| 国产探花视频在线观看| 成人永久aaa| 2019中文字幕全在线观看| 精品夜夜澡人妻无码av| 欧美日韩成人影院| 亚洲日本在线视频观看| 粉嫩高清一区二区三区精品视频 | 亚洲精品一区二区三区蜜桃久| 国产成人综合欧美精品久久| 欧美一级淫片| 欧美一区二区三区色| 亚洲高潮无码久久| 国产尤物99| 国产高清999| 暖暖日本在线观看| 成人国产精品免费观看视频| 清纯唯美日韩制服另类| 黄色aaa视频| 日韩一级淫片| 欧美性猛交丰臀xxxxx网站| 五码日韩精品一区二区三区视频| 精品免费久久久| 久久福利毛片| 欧美不卡视频一区发布| 草草地址线路①屁屁影院成人| 中文.日本.精品| 亚洲午夜一区二区| 亚洲黄色成人久久久| 丰满熟妇乱又伦| 看国产成人h片视频| 97久久精品人搡人人玩| 成人自拍小视频| 神马影视一区二区| 欧美日本一区二区三区四区| 六月丁香激情网| 免费网站免费进入在线| 91香蕉视频mp4| 5566中文字幕一区二区| 性高潮视频在线观看| 99精品欧美| 欧美xxxx综合视频| 亚洲欧洲综合网| 你懂的在线观看一区二区| 777色狠狠一区二区三区| 国产精品亚洲a| 97超碰在线公开在线看免费| 久久精品一区二区三区四区| 国产aⅴ精品一区二区三区黄| 青青草免费观看视频| 午夜欧美视频| 久久综合88中文色鬼| 免费看裸体网站| 日韩影视高清在线观看| 日韩欧美一区二区久久婷婷| 网站一区二区三区| 香蕉视频亚洲一级| 狠狠做深爱婷婷久久综合一区| 日本大胆人体视频| av黄色在线| 亚洲视频一区在线观看| 亚洲午夜精品一区二区三区| 国产日本在线| 国产三级精品视频| 欧美一区二区高清在线观看| 十八禁一区二区三区| 国产成人精品免费网站| 3d动漫精品啪啪一区二区三区免费| 91麻豆视频在线观看| 蜜桃免费网站一区二区三区| 国产精品成人在线| 国产精品无码一区| 免费高清在线一区| 国产精品久久久久免费a∨大胸| 手机在线看片1024| 日日夜夜免费精品| 国产精品久久久久免费a∨| 伊人成年综合网| 免费观看成人鲁鲁鲁鲁鲁视频| 国产精品高精视频免费| 欧美国产一级片| 蜜臀久久99精品久久久久宅男| 国产精品夫妻激情| 最近中文字幕在线观看视频| 美女mm1313爽爽久久久蜜臀| 成人在线国产精品| 国产极品999| 岛国av在线一区| 国产成人精品福利一区二区三区| 亚洲AV无码精品国产| 成人美女在线观看| 欧美激情www| 91在线免费看| 日韩毛片在线免费观看| 欧美黄色免费网址| 成av人片在线观看www| 亚洲国产成人av好男人在线观看| 国产美女网站在线观看| 精品国产免费人成网站| 欧美日韩黄色一区二区| 国产老头和老头xxxx×| 欧美午夜寂寞| 中文日韩电影网站| 91日韩中文字幕| 在线亚洲精品| 国产精品你懂得| 国内精品国产成人国产三级| 91在线播放网址| 亚洲国产精品久久久久久女王| 黄色在线视频网站| 亚洲自拍另类综合| 欧美黑人又粗又大又爽免费| 91九色综合| 精品sm在线观看| 娇妻被老王脔到高潮失禁视频| 欧美精品国产| 国产精品白丝jk喷水视频一区| 亚洲精品第五页| 国产亚洲污的网站| 国产精品视频网站在线观看| 成人网ww555视频免费看| 欧美一区二区三区日韩视频| 一区二区精品免费| 国产在线日韩| 91精品久久久久久久久| 青青草视频在线观看| 亚洲激情网站免费观看| 国产熟人av一二三区| 57pao国产一区二区| 中文字幕v亚洲ⅴv天堂| 日本天堂在线视频| 国产自产2019最新不卡| 先锋影音一区二区三区| 啊啊啊久久久| 欧美人狂配大交3d怪物一区 | 成av人片在线观看www| 91精品国产一区二区三区香蕉| 插吧插吧综合网| 欧美成人一品| 国产视频福利一区| 欧美日韩影视| 亚洲国产综合色| 中文字幕第三区| 久久精品国产99久久| 国产精品第一页在线| 无码精品在线观看| 伊人性伊人情综合网| 91小视频在线播放| 成人av国产| 国产精品91在线观看| 色窝窝无码一区二区三区| 亚洲色图视频网| 久久国产精品国产精品| 精品国产日韩欧美| 日韩av第一页| 天堂av在线免费| 亚洲国产欧美一区二区三区丁香婷| 久久久久久综合网| 亚洲最新色图| 高清国语自产拍免费一区二区三区| 羞羞的视频在线观看| 精品国产乱码久久久久久闺蜜| 精品视频一区二区在线观看| va亚洲va日韩不卡在线观看| 日韩少妇内射免费播放18禁裸乳| 九九热爱视频精品视频| 国产精品1234| 成人黄色网址| 精品久久久久久久人人人人传媒 | 一区二区三区在线电影| 国产另类自拍| 男人皇宫亚洲男人2020| 日韩最新中文字幕电影免费看| 国产伦精品一区二区三区四区| 亚洲一区欧美一区| 狠狠人妻久久久久久综合蜜桃| 日韩综合在线视频| 中文字幕一区二区三区乱码| 视频二区欧美| 日本精品视频在线观看| av在线天堂播放| 日韩欧美国产三级电影视频| www日韩精品| 国产精品日日摸夜夜摸av| 丰满人妻一区二区三区53视频| 亚洲一区二区网站| 一区二区免费电影| 成人在线视频你懂的| 国产精品99久久久久久白浆小说| av网站在线看| 亚洲日本中文字幕| 亚洲成人一级片| 欧美影院精品一区| 国产真实夫妇交换视频| 国产欧美日韩精品a在线观看| 99999精品| 久久久久久自在自线| 男人天堂网站在线| 欧美日韩在线二区| 国产综合精品一区二区三区| 天堂久久一区| 欧美中文字幕在线观看| h片在线播放| 国产一区二区三区在线免费观看| 性欧美8khd高清极品| 精品1区2区3区| 国产69精品久久久久久久久久| 亚洲欧美综合色| 偷拍夫妻性生活| 99精品久久久久久| 少妇愉情理伦片bd| 青娱乐精品视频| 黄色动漫在线免费看| 亚洲视频高清| 色撸撸在线观看| 成人a'v在线播放| 欧美一区二区三区在线播放| 精品国产乱子伦一区二区| 亚洲a在线观看| 国产成人午夜性a一级毛片| 456国产精品| wwwww亚洲| 欧美成人午夜剧场免费观看| 日本成人网址| 色阁综合伊人av| 九色视频在线观看免费播放| 亚洲第一综合天堂另类专| 国产露脸无套对白在线播放| 91福利国产精品| 亚洲天堂一区在线观看| 亚洲国产成人porn| 精品一级少妇久久久久久久| 亚洲精品中文在线观看| 九九这里只有精品视频| 国产精品无人区| 永久免费av无码网站性色av| 久久综合一区二区| 在线观看日韩精品视频| 久久综合九色综合97婷婷女人| 精品夜夜澡人妻无码av| 91亚洲精品久久久蜜桃| 北岛玲一区二区| 99re在线精品| 自拍偷拍中文字幕| 久久久不卡网国产精品二区| 成人午夜福利一区二区| 国产日韩v精品一区二区| 在线观看国产免费视频| av欧美精品.com| 精品人妻一区二区免费视频| eeuss国产一区二区三区| aaaa黄色片| 久久久午夜电影| 91网站免费入口| 中文字幕的久久| 日本裸体美女视频| 亚洲精品国产视频| 亚洲精品在线观看av| 精品日韩中文字幕| 日日夜夜狠狠操| 欧美丝袜丝交足nylons图片| 97视频免费在线| 精品日韩欧美在线| 五月婷婷在线播放| 亚洲欧洲xxxx| 性开放的欧美大片| 欧美精品少妇videofree| gogo久久| 国产精品久久精品| 精品视频在线观看免费观看| 国产有色视频色综合| 国产探花一区| 色一情一乱一乱一区91| 99精品国产在热久久婷婷| 成人亚洲视频在线观看| 国产精品资源在线| 国产a级黄色片| 国产欧美精品一区二区三区四区 | 国产91九色视频| 亚洲久草在线| 国产精品成人观看视频免费| 性欧美lx╳lx╳| 手机成人av在线| 99在线|亚洲一区二区| 久久久精品麻豆| 国产成人精品一区二区三区四区| 欧美 日本 国产| 亚洲男人天堂一区| 久久久久久少妇| 6080国产精品一区二区| 天天操天天干天天舔| 在线观看国产欧美| 国产经典三级在线| 日本一区二区三区四区视频| 国产精品一区二区三区av| 欧美激情论坛| 欧美日韩在线大尺度| 国产精品久久久久9999小说| 成人美女视频在线观看| 国产精品一区二区亚洲| 天天av天天翘天天综合网色鬼国产| 糖心vlog精品一区二区| 日韩成人在线网站| 91中文在线| 国产精品美女免费| 日本妇女一区| 大胆欧美熟妇xx| 久久精品国产秦先生| 91视频免费观看网站| 亚洲国产精品综合小说图片区| 伊人免费在线观看| 日韩毛片在线观看| 国产探花视频在线观看| 91精品视频专区| 欧美日韩一区二区三区视频播放| 欧美 日韩 国产 高清| 国产精品77777竹菊影视小说| 一级黄色片网址| 欧美性猛交xxxx久久久| 色欲av永久无码精品无码蜜桃| 久久久久999| 成人在线观看免费播放| 欧美专区一二三| 国产精品久久777777毛茸茸| 国产伦理在线观看| 亚洲欧洲另类国产综合| 在线观看你懂的网站| 亚洲欧美第一页| 老司机2019福利精品视频导航 | 亚洲v天堂v手机在线| 国产精品成人久久电影| 国产99久久久久久免费看农村| 国产成人免费在线观看视频| 欧美性极品少妇| 成人不用播放器| 日本亚洲欧美三级| 免费不卡中文字幕在线| 国产成人亚洲精品无码h在线| 97久久精品人人做人人爽| 国产成人亚洲欧洲在线| 亚洲激情中文字幕| 久草免费在线视频| 久久精品日韩| 久久在线精品| 麻豆精品免费视频| 91黄色免费看| 国产精品久久久久久久龚玥菲| 国产精品91免费在线| 欧美综合另类| www.cao超碰| 亚洲人成影院在线观看| 国产成人精品一区二三区四区五区| 美女啪啪无遮挡免费久久网站| 亚洲精品一区国产| 日韩人妻无码精品久久久不卡| 成人avav在线| 中文字幕亚洲精品一区| 亚洲色图50p| 国产欧美自拍| 中文字幕色呦呦| av在线不卡电影| 狠狠狠狠狠狠狠| 视频在线观看一区二区| 亚洲伊人伊成久久人综合网| 男人日女人的bb| 91麻豆国产精品久久| 啪啪小视频网站| 久久艹在线视频| 粉嫩av一区二区| av无码精品一区二区三区| 日韩理论片一区二区| 韩国av在线免费观看| 日本免费一区二区三区视频观看| 日韩成人三级| 日本少妇一级片| 91久久免费观看| 91国内在线| 久久亚洲午夜电影| 精品午夜久久福利影院| 日本系列第一页| 国产亚洲xxx| 天堂av一区| 国产精品wwwww| 亚洲男同性恋视频| 黄色在线免费观看大全| 亚洲www视频| 午夜一区在线| 中文字幕手机在线观看| 国产视频亚洲精品| 97精品资源在线观看| 大j8黑人w巨大888a片| 国产精品家庭影院| 午夜在线观看视频18| 成人激情黄色网| 香蕉av777xxx色综合一区| 欧美黄片一区二区三区| 国产小视频国产精品|