精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

顛覆直覺:Top N 越大,RAG效果可能越差

發布于 2025-2-24 11:28
瀏覽
0收藏

一、RAG 系統的背景與挑戰

在自然語言處理(NLP)領域,大型語言模型(LLMs)如 GPT、BERT 等已經展現出了強大的文本生成、問答和摘要能力。然而,這些模型也存在一些顯著的局限性。

? 首先,LLMs 的知識是靜態的,這意味著它們無法及時更新以反映新信息,導致生成的回答可能過時。

? 其次,LLMs 有時會生成聽起來合理但事實上錯誤的回答,這種現象被稱為“幻覺”。

? 最后,LLMs 在涉及高級專業領域的知識時,往往缺乏足夠的深度。

為了應對這些挑戰,檢索增強生成(Retrieval-Augmented Generation, RAG)系統應運而生。RAG 系統通過引入檢索組件,使 LLMs 能夠動態地利用外部知識源,從而生成更準確、更及時的回答。

RAG 系統已經在多個行業中得到廣泛應用,尤其是在企業內部文檔查詢等場景中。然而,盡管 RAG 系統的應用日益廣泛,關于其最佳配置的研究卻相對缺乏,特別是在上下文大小、基礎 LLM 選擇以及檢索方法等方面。

二、試驗結果

RAG 系統通常由兩個主要組件構成:檢索器(Retriever)和生成器(Reader):

? 檢索器負責從外部知識庫中檢索相關的上下文片段,這些片段隨后被傳遞給生成器

? 生成器基于這些上下文生成最終的回答。

作者重點探討了這三個方面(檢索器、上下文、生成器)對系統整體性能的影響。

首先研究了上下文大小對生成器問答能力的影響。結果表明:隨著上下文片段數量的增加,系統的性能逐步提升,但當片段數量達到 10 到 15 個時,性能開始趨于穩定,甚至在某些情況下會出現下降。這一現象表明,過多的上下文片段可能會導致信息過載,反而影響生成器的表現。

2.1 黃金片段測試

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上圖展示了四個較大尺寸的大語言模型(LLMs)在使用黃金片段后的表現,四個模型分別是GPT3.5、GPT-4o、Llama 3 70B、Mixtral (8x7B)。

所有模型都呈現出相似的模式:

? 從較低的零樣本性能開始,僅使用一個上下文片段就能顯著提升性能。

? 大多數模型在所有三個評估指標上逐步且穩定地改進。

2.2 封閉式測試

使用了包含八千篇PubMed文章的小型知識庫,這些文章在BioASQ中被用作黃金證據。

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

實驗結果如上表所示,模型性能與之前有所下降。即使是表現最佳的Mixtral模型,其性能也平均下降。

盡管如此,隨著選擇的top k片段數量的增加,性能仍然逐步提升,表明更多的上下文信息能夠帶來更好的表現。

這一點在top-10設置中尤為明顯,因為選擇的證據片段越多,選中用于生成理想答案的黃金證據片段的概率就越高。

2.3 開放式測試

使用約1000萬篇PubMed文章作為檢索的知識庫。其目的是觀察:

(1)在開放式設置下,性能與使用黃金證據的封閉式設置相比有多大差異;

(2)不同檢索器對性能的影響。

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上表結果顯示:

? 開放式檢索顯然是最具挑戰性的設置,整體平均得分最低。

? 使用BM25檢索文檔的最終性能略優于語義搜索。

3. 結論

3.1 檢索技術

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

從上表可以看出,BM25在整體性能上表現更優。由于BM25基于關鍵詞匹配,這種檢索技術優化了搜索結果的精確度(precision)而非召回率(recall),從而確保檢索到的文檔更有可能討論問題中提到的相同概念(關鍵詞)。

優化精確度并將查詢關鍵詞與知識庫中的內容匹配,可以提升性能。特別是在生物醫學領域等關鍵應用中,優化精確度和生成穩健的答案可能比語義搜索提供的召回率更為重要

注:

? ROUGE-L 是一種基于最長公共子序列(LCS)的評估指標,主要用于衡量生成文本與參考文本之間的相似性。它關注生成文本中與參考文本匹配的最長連續子序列,側重于召回率(Recall),即生成文本中有多少內容與參考文本一致。

? BERTScore 是一種基于預訓練語言模型(如 BERT)的評估指標,通過計算生成文本與參考文本在語義空間中的相似性來評估質量。它使用 BERT 模型將文本編碼為向量,然后計算生成文本與參考文本之間的余弦相似度。相比 ROUGE 等基于詞匯重疊的指標,BERTScore 更能捕捉語義層面的相似性,適合評估生成文本的語義準確性。

? Ent.% 是基于自然語言推理(Natural Language Inference, NLI)模型的評估指標,用于衡量生成文本與參考文本之間的邏輯一致性(蘊含關系)。NLI 模型會判斷生成文本是否邏輯上蘊含(Entailment)參考文本的內容。

3.2 內部知識與外部知識的沖突

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上表中開放式檢索的一個有趣現象:GPT和Mixtral在零樣本答案(無上下文片段)中的得分高于提供多達10個上下文片段的答案。

這種現象的一個可能解釋是:盡管在語料庫中發現的片段可能與問題在語義上相似,但它們并不總是提供所有重要信息。

當僅使用普通提示時,LLM基于其“內部”知識生成答案:反映了LLM從大規模預訓練語料庫中積累的知識。

因此,LLM的內部知識答案可能比RAG設置中的答案更具信息量,因為在RAG設置中,LLM被指示僅使用提供的短片段來回答問題。隨著更多片段的加入,RAG答案的信息量開始超越LLM的內部知識。

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

以上表中的第一個示例為例,Mixtral基于內部知識生成的答案提到了純化和IgG,與黃金答案一致,而基于top-3片段生成的答案則是不完整的。

一般來說,瓶頸通常與錯誤的檢索有關——有時檢索到的片段根本沒有回答問題,尤其是對于BioASQ中復雜的生物醫學術語。

另一方面,普通設置下的LLM總是基于其最佳知識提供答案,因此在檢索不佳的情況下表現更好。在上表的第二個示例中顯而易見。

展示了LLM內部知識與傳遞給它們的上下文知識之間沖突的已知挑戰,也是一個有趣的未來研究方向。

3.3 上下文飽和

顛覆直覺:Top N 越大,RAG效果可能越差-AI.x社區圖片

上表中的另一個發現是,性能提升存在一定的上限。

隨著不斷增加上下文片段的數量,增加到20個時,性能趨于停滯,而在檢索到30個上下文片段時,性能略有下降。

當達到飽和點后,向提示中添加更多上下文只會導致回答中的噪音和混淆。

證實了文獻中的先前發現,即在長提示中,上下文可能會“迷失在中間”,并在LLM回答問題時被忽略。

注:本論文代碼和數據已開源:https://github.com/jvladika/ContextRAG

本文轉載自??大語言模型論文跟蹤??,作者:HuggingAGI 

已于2025-2-24 13:26:50修改
收藏
回復
舉報
回復
相關推薦
91免费在线视频网站| 欧美精品在线网站| 一起操在线视频| 中文字幕伦理免费在线视频| 成人av网站免费观看| 国产999精品视频| 国产精品嫩草影院俄罗斯| 岛国av一区| 欧美日韩亚洲综合在线| 丁香六月激情网| 黄色大片在线看| 国产精品99久久久久久似苏梦涵| 欧美一级黄色网| 国产日韩欧美在线观看视频| 五月综合久久| 日韩小视频在线观看专区| 黄色动漫在线免费看| 乱人伦中文视频在线| 91在线观看高清| 4444kk亚洲人成电影在线| 可以免费在线观看的av| 欧美一区影院| 综合国产在线观看| www.自拍偷拍| 国产精品zjzjzj在线观看| 欧美亚洲一区二区在线| 欧美 日韩 亚洲 一区| 黄色网页在线免费看| 国产午夜精品福利| 精品日本一区二区三区| 国产xxxx在线观看| 久草中文综合在线| 国产高清在线不卡| 亚洲免费在线观看av| 国产精品va| 久久综合伊人77777蜜臀| 久久亚洲无码视频| 国产亚洲电影| 亚洲精品一区久久久久久| 欧洲熟妇的性久久久久久| www久久久| 在线观看视频欧美| 不卡av免费在线| 四虎成人在线| 日本精品视频一区二区| 能在线观看的av| 忘忧草在线影院两性视频| 亚洲18女电影在线观看| 国产传媒久久久| 黄色成人在线网| 亚洲一区二区三区激情| 欧美久久在线观看| 俺来也官网欧美久久精品| 一区二区三区不卡视频在线观看| 国产av第一区| 草莓福利社区在线| 一区二区三区在线视频观看 | 国产精品美女www爽爽爽| 欧美精品一区二区三区四区五区| 午夜在线观看视频18| 91视频免费观看| 久久久免费看| 黄色av网站在线| 国产嫩草影院久久久久| 亚洲精美视频| 国内外激情在线| 夜夜爽夜夜爽精品视频| 91动漫在线看| 老司机2019福利精品视频导航| 欧美午夜精品在线| 欧美成人黑人猛交| 欧美成人一二区| 在线播放国产精品二区一二区四区| 欧美精品 - 色网| 一区二区三区在线资源| 亚洲精品久久久久| 美女又爽又黄视频毛茸茸| 中文字幕av一区二区三区人| 中文综合在线观看| 欧美日韩偷拍视频| 亚洲永久字幕| 成人久久18免费网站图片| 国产sm主人调教女m视频| 不卡的av网站| 亚洲午夜精品久久| 色av手机在线| 色网站国产精品| 日本国产一级片| 亲子伦视频一区二区三区| 亚洲小视频在线观看| 黄色香蕉视频在线观看| av不卡在线| 国产美女直播视频一区| 欧美 日韩 人妻 高清 中文| 国产亚洲精品资源在线26u| 在线观看欧美一区| 美女露胸视频在线观看| 欧美日韩免费在线视频| 喷水视频在线观看| 99久久婷婷| 57pao国产成人免费| 国产又粗又猛又爽又黄视频| 成人午夜在线视频| 亚洲 国产 欧美一区| 四季久久免费一区二区三区四区| 一本久久综合亚洲鲁鲁五月天| 日韩中文字幕a| 亚洲盗摄视频| 欧美日韩成人在线观看| 免费看污视频的网站| 国产jizzjizz一区二区| 视频在线精品一区| 国产剧情av在线播放| 91精品一区二区三区在线观看| 国产麻豆天美果冻无码视频 | 中文字幕一区二区三区四区欧美| 国内成+人亚洲+欧美+综合在线| 国模精品一区二区三区| 成人免费网址| 欧美日韩中文字幕一区| 国产在线观看无码免费视频| 欧美网站在线| 亚洲一区二区免费| av网站在线播放| 欧美性猛交xxxx| 中文字幕乱码一区| 激情久久婷婷| 97超碰在线播放| 蜜桃视频网站在线观看| 欧美在线观看视频一区二区| 熟妇人妻久久中文字幕| 午夜精品国产| 亚洲自拍偷拍一区| caoporn免费在线| 欧美日韩国产不卡| 国产传媒在线看| 免费观看在线综合色| 欧美另类网站| 不卡av影片| 亚洲精品一区av在线播放| 国产一区二区三区影院| 成人精品鲁一区一区二区| 国产一级片91| 亚洲无线观看| 久久久亚洲精选| 黄色成人一级片| 亚洲一区二区三区爽爽爽爽爽 | 在线观看中文字幕网站| 久久精品视频免费观看| 欧美女人性生活视频| 窝窝社区一区二区| 国产成人精品视频| av在线中文| 欧美日韩国产一级片| 激情无码人妻又粗又大| 久久精品久久精品| 亚洲成年人专区| 亚洲国产精品免费视频| 欧美激情精品久久久久久| 精品国产伦一区二区三| 夜夜精品浪潮av一区二区三区| 动漫美女无遮挡免费| 国产精品久久久久毛片大屁完整版| 精品国产乱码久久久久久蜜柚| 午夜影视一区二区三区| 国产一级揄自揄精品视频| 伊人22222| 亚洲精品一二三| 亚洲香蕉中文网| 久久激情婷婷| 亚洲在线色站| 一区二区视频| 欧美在线激情网| av电影在线网| 日韩免费高清av| 一级成人黄色片| 中文字幕在线一区二区三区| 国产精品91av| 日韩电影在线免费| 国产日韩欧美大片| 欧美黄色影院| 91久久国产婷婷一区二区| 久久香蕉av| 伊人一区二区三区久久精品| 国产情侣在线播放| 日韩欧美成人免费视频| 多男操一女视频| 91网站视频在线观看| 午夜免费福利视频在线观看| 在线成人亚洲| 亚洲一区二区在线观| a级日韩大片| 国产精品视频一| av电影在线免费| 中文字幕亚洲欧美| 色网站在线免费观看| 5月丁香婷婷综合| 在线免费黄色av| 一区二区三区毛片| 天天操天天摸天天舔| hitomi一区二区三区精品| 国内国产精品天干天干| 美女精品在线观看| 日韩亚洲欧美视频| 91tv精品福利国产在线观看| 欧美大香线蕉线伊人久久国产精品 | 日批免费在线观看| 777精品伊人久久久久大香线蕉| 好吊妞视频一区二区三区| 亚洲女人****多毛耸耸8| a级大片在线观看| 成人性视频免费网站| 五月婷婷之婷婷| 久久字幕精品一区| 黄色免费福利视频| 欧美日韩一卡| 尤物国产精品| 欧美在线电影| 欧美人与性禽动交精品| 精品网站aaa| 成人三级视频在线观看一区二区| 欧美a视频在线| 国产精品9999| 日韩影院在线| 午夜精品久久17c| 欧美videos另类精品| 久久人人爽亚洲精品天堂| av在线电影网| 亚洲偷熟乱区亚洲香蕉av| 欧洲免费在线视频| 日韩电影免费在线观看中文字幕 | 六月婷婷激情网| 国产精品久久久久久久久久10秀 | 懂色中文一区二区三区在线视频| 亚洲精品伦理| 国产一区视频在线| 精品亚洲a∨| 国产日韩一区在线| 久久精品xxxxx| 成人xxxxx| 国产精品日本一区二区不卡视频| 国产欧美精品va在线观看| 国产精品原创视频| 国产日韩在线免费| 国产aⅴ精品一区二区四区| 成人免费xxxxx在线观看| 四虎精品永久免费| 亚洲自拍偷拍视频| 在线精品视频一区| 九色91在线视频| 亚洲精品进入| 亚洲精品久久久久久一区二区| 精品成av人一区二区三区| 视频一区二区三区免费观看| 波多野结衣的一区二区三区 | 免费在线观看黄色| xxxxxxxxx欧美| a级网站在线播放| 久久久久女教师免费一区| 黄色在线观看视频网站| 国产91精品不卡视频| 欧美性xxx| 国产精品三级久久久久久电影| 久久夜夜久久| a级国产乱理论片在线观看99| 加勒比久久高清| 欧美美乳视频网站在线观看| 日韩精品免费一区二区三区| 国产精品av免费| 激情成人亚洲| 欧美亚洲日本在线观看| 精品一二线国产| 国产视频精品视频| 国产亚洲一区字幕| 放荡的美妇在线播放| 午夜精品福利一区二区蜜股av | 日本成人超碰在线观看| 中文字幕 欧美日韩| 成人性生交大片免费看中文网站| 青青草福利视频| 中文字幕中文字幕在线一区 | 欧美色欧美亚洲另类七区| 久久国产电影| aa视频在线播放| 日本91福利区| 色悠悠在线视频| 亚洲国产精品国自产拍av| 中文字幕av久久爽av| 色综合中文字幕国产| av手机免费看| 亚洲欧美日韩视频一区| 精精国产xxxx视频在线| 97视频在线观看免费高清完整版在线观看| 亚洲成人一区在线观看| 国产 高清 精品 在线 a| 欧美日韩国产在线观看网站| 日韩精品福利片午夜免费观看| 亚洲欧美清纯在线制服| 亚洲制服在线观看| 久久精品欧美日韩精品 | 麻豆视频免费在线观看| 亲子乱一区二区三区电影 | 国产真实乱偷精品视频| 欧美曰成人黄网| 熟妇人妻系列aⅴ无码专区友真希| 最近2019年日本中文免费字幕 | 国产精品日韩在线播放| 国产+成+人+亚洲欧洲在线| 日本免费在线视频观看| 久久精品人人做人人爽电影蜜月| 国产成人精品一区二区在线小狼| 国产欧美日韩精品一区| 在线观看精品国产| 日韩欧美一二三区| 老司机99精品99| 日韩精品中文字| 久久影视中文字幕| 欧美成人精品高清在线播放 | 日本综合久久| 国新精品乱码一区二区三区18| 色综合久久一区二区三区| www.浪潮av.com| 床上的激情91.| 欧美丰满熟妇bbbbbb| 欧美亚洲综合另类| 国产综合视频一区二区三区免费| 97国产精品视频| 第四色中文综合网| 777久久精品一区二区三区无码| 另类小说综合欧美亚洲| 人妻一区二区视频| 色偷偷久久人人79超碰人人澡| 婷婷色在线视频| 久久久噜噜噜久久| 成人h动漫精品一区二区器材| 美国av在线播放| 韩国av一区二区三区四区| 日韩一区二区三区四区视频| 欧美性高清videossexo| 国产精品久久一区二区三区不卡 | 日韩精品一区二区免费| 国产一区二区视频在线| 日韩精品123区| 91精品在线观看入口| 91麻豆免费在线视频| 不卡视频一区二区| 在线观看视频免费一区二区三区| 精品久久久久久无码人妻| 亚洲午夜一区二区| 天堂av一区二区三区| 91wwwcom在线观看| 九色精品国产蝌蚪| www.夜夜爽| 亚洲天堂精品在线观看| 99精品免费观看| 欧美激情视频一区二区| 大奶在线精品| 久久久久久久久久久福利| 国产亚洲欧洲997久久综合| 国产在线观看第一页| 中文字幕亚洲综合久久| 亚洲人成网站在线在线观看| 最新视频 - x88av| 成人丝袜高跟foot| 天堂网中文字幕| 中文字幕久热精品在线视频| 一区在线不卡| 国产 日韩 欧美在线| 久久婷婷综合激情| 在线视频1卡二卡三卡| 久久天天躁狠狠躁夜夜躁| 9l视频自拍蝌蚪9l视频成人| 欧美 日本 亚洲| 国产精品美女一区二区在线观看| 国产伦一区二区| 97免费中文视频在线观看| 久久93精品国产91久久综合| 最新国产黄色网址| 五月天丁香久久| 在线日本视频| 国产精品嫩草在线观看| 久久久亚洲人| 丰满少妇被猛烈进入一区二区| 亚洲成人精品av| 青青热久免费精品视频在线18| 可以免费看的黄色网址| av不卡一区二区三区| 在线观看国产一区二区三区| 欧美激情精品久久久久久黑人| 亚洲国产最新| 99久久综合网| 色狠狠一区二区| 青春草视频在线| 视频一区在线免费观看| 成人久久久精品乱码一区二区三区| 天天射天天干天天| 欧美激情精品久久久久久久变态 | 国产精品伦理在线| 日本精品一二区| 91久久精品国产91久久|