精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

又來一個RAG:RankRAG,英偉達RAG新思路

發布于 2024-7-16 09:30
瀏覽
0收藏

1. 背景

檢索增強生成無疑是當前最熱門的LLM研究領域了,但是傳統RAG存在一些局限性:

? 檢索器容量的限制。考慮到處理效率,現有的RAG一般采用稀疏檢索(比如BM25)或中等規模的嵌入模型(比如Bert)作為檢索器。

? 只選擇前K個文檔。盡管最新的大語言模型擴大了上下文長度的限制,能夠接受更多的上下文作為輸入,但是實際性能會隨著K的增加而迅速達到飽和。比如在長問答任務中,最佳的分塊上下文數量大約是10。雖然更大的K可以提高召回率,但是同時也引入了更多無關的內容,干擾大語言模型生成準確回答。

因此,作者設計了一個新的RAG:RankRAG,利用單一大語言模型來實現高召回率的上下文提取和高質量內容生成。通過對單一大語言模型進行指令調優,使其可以同時進行上下文排序和答案生成,進一步提升LLM在RAG檢索和生成階段排除不相關上下文的能力。

2. RankRAG

RankRAG整體包括兩個階段:指令調優階段、排名與生成綜合指令調優階段。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

2.1 第一階段:指令調優(SFT)階段

指令調優(或監督式微調)可以顯著提升大語言模型指令遵循的能力,從而提高下游任務的零樣本性能。所以,作者先對大語言模型進行指令調優。

總共準備了128K SFT樣本,確保樣本中沒有數據泄露,沒有與評估任務重的數據重疊,并采用多輪對話格式。

第一階段的指令調優數據集包括:公共對話數據集、長篇問答數據集、Chain of Thought數據集以及合成數據集。

2.2 排名與生成的綜合指令調優階段

第一階段的SFT目的是為大模型奠定指令遵循的基礎能力,但是在RAG任務上,這些模型仍然還有提升空間。為了提升這些模型在RAG任務上的性能,作者進行了第二階段的指令調優。第二階段的指令調優包括五個部分:

2.2.1 第一階段的SFT數據

這部分數據的納入是為了保持LLM遵循指令的能力。

2.2.2 富含上下文的QA數據

在數據集中加入多個富含上下文的QA任務數據來加強LLM利用上下文回答問題的能力。采用混合訓練數據集:

  • ? 標準的QA和閱讀理解數據集
  • ? 對話QA數據集

2.2.3 檢索增強問答數據

引入兩個新數據集,不僅包含標準答案的上下文,還包括通過BM25算法檢索出的最相關上下文。

增強LLM在生成回答時,對無關上下文的抗干擾能力也非常重要,所以作者特別考慮了SQuAD和WebQuestion兩個問答任務數據集。對于每個問題,作者將標準答案的上下文和BM25檢索出的上下文進行融合,確保每個問題都能至少關聯5個上下文。其中部分檢索出的上下文可能是不包含答案的,這些被稱為負樣本。

2.2.4 上下文排名數據

為了使模型具有LLM排名能力,作者采用了大家普遍認可的MS MARCO段落排名數據集。將標準查詢-段落對(q,d+)定義為正樣本,而通過BM25算法挖掘出的硬負樣本段落(q,d-)定義為負樣本。LLM需要根據給定的查詢-段落對生成“真”或“假”的回答,任務指令是“針對問題{question},請判斷該段落是否與問題相關。”

雖然MS MARCO覆蓋了眾多主題,但問題均為單輪簡短句子。然而,針對對話問答的排名數據極為稀缺。

為解決這一局限,將對話問答對重新設計,以生成偽相關對。鑒于每段對話僅關聯一個文檔,將每個文檔切割成150字的段落(d1,d2,...,dn)。計算每個段落di與標準答案間的4-gram召回率,將召回率超過0.5的段落判定為與對話相關,低于0.1的則判定為不相關。每個樣本包含一對問題-上下文,用于排名數據集。

合成后的數據加上開始的MS MARCO數據,一共約50K數據用于本階段的指令微調。

2.2.5 檢索增強型排名數據

為了使模型能夠針對一個問題評估多個上下文的相關性,采用了SQuAD和WebQuestions兩個問答數據集,通過BM25算法,將標準答案上下文與檢索出的最相關上下文相結合,確保每個問題關聯五個上下文。凡包含答案的上下文均被視為相關,訓練LLM識別與問題相關的所有上下文。

2.3 RankRAG 推理流程:檢索-重排-生成三部曲

融入額外的重排環節,RankRAG 的推理流程轉變為三步走策略:檢索-重排-生成,具體步驟如下:

(1) 檢索器 ? 率先在文本庫中篩選出 top-k 個相關上下文。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

(2) RankRAG 模型進而基于上表中的提示,評估問題與這些檢索到的上下文之間的相關性得分,以此作為生成正確答案的概率,隨后對上下文進行重排,精挑細選出 top-k(k'遠小于k)個最為貼切的上下文,作為下一步生成答案的依據。

(3) 精選出的 top-k' 個上下文與問題串聯,再次輸入 RankRAG 模型,以此生成最終的答復。

3. 效果對比

3.1 主要結果

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

上圖展示了RankRAG與基線在九個數據集上的比較結果。所有結果均在零樣本評估條件下得出(除非特別標注),未附加額外示例。

RankRAG在性能上超越了現有的RAG方法: 以8B模型規模來看,RankRAG持續領先于ChatQA-1.5 8B,后者是最近開源且在眾多RAG基準測試中表現卓越的模型。即使面對參數量多得多的基線模型,RankRAG 8B依然展現出強勁的競爭力。舉例來說,它顯著超越了參數量為其五倍的InstructRetro、參數量為其八倍的RA-DIT 65B,甚至在NQ和TriviaQA任務上超越了參數量為其八倍的Llama3-instruct 70B。參數量更多的RankRAG 70B不僅戰勝了強勁的ChatQA-1.5 70B模型,還大幅超越了以InstructGPT為基礎LLM的先前RAG基線。

RankRAG在更具挑戰性的數據集上取得了更顯著的進步: RankRAG在處理更具挑戰性的QA數據集時,性能提升更為顯著。比如,在長尾QA(PopQA)和多跳QA(2WikimQA)任務中,相較于ChatQA-1.5,實現了超過10%的性能提升。這些結果表明,在挑戰性的開放問答數據集中,當檢索器返回的頂部文檔與答案的相關性不高時,上下文排名能顯著增強性能。今天這篇論文專注于提升QA任務的單次檢索效果。如何有效地將多輪RAG流程與RankRAG結合,是未來研究值得探索的有趣方向。

5.3 組件效果分析

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

通過在九個廣泛領域的數據集上以Llama3 8B作為基礎模型,展示了對RankRAG進行的組件切除實驗。總體來看,發現所提出的各個組件均對提升最終性能起到了積極作用。

若去除上下文排名功能,將在所有任務中造成性能下降,這證實了其在篩選與目標問題最密切相關上下文中的關鍵作用。

同時,為指令微調特別設計的檢索增強問答(RQA)和檢索增強排名(RAR)通過輔助模型明確識別相關上下文,在大多數任務中帶來了性能提升。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

性能隨不同檢索器的變化。如上圖,對比了RankRAG和ChatQA-1.5在三個典型任務中搭配不同密集檢索器的表現,特別考慮了DPR與Contriever-MS MARCO這兩種檢索器變體。可以看到,即便初次檢索結果不盡人意,RankRAG在平均性能上依然超越了ChatQA-1.5,幅度超過10%。綜上,RankRAG對于檢索器的選擇展現出了良好的適應性和魯棒性。

5.4 領域特定RAG基準測試的實驗驗證

為驗證RankRAG對專業領域的適應能力,在生物醫學領域的最新RAG基準測試Mirage上進行了實驗。采用MedCPT(Jin等人,2023年)作為檢索器?,并以MedCorp2作為語料庫??。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

上圖展示了RankRAG與基線的實驗結果,即便未針對生物醫學領域進行微調,RankRAG在醫學問答任務上依然表現卓越。特別是RankRAG 8B在性能上超越了醫療領域領先的開源LLM Meditron 70B達6.3%。

此外,RankRAG 70B的性能更是達到了GPT-4的98%以上。充分證明了RankRAG具備快速適應新領域并無需額外訓練的能力。

5.5 細究排名模塊

RankRAG在數據使用上極為高效:

傳統RAG流程的上下文排名方法通常需要一個獨立的重排模型。作者評估了四款在完整MS MARCO段落排名數據集上經過微調的模型(BERT(Glass等人,2022年)/T5(Nogueira等人,2020年)/Llama3(Ma等人,2023年)),一個強大的現成重排模型BGE-ranker,以及兩款OpenAI的GPT系列模型。對于GPT系列,用‘True’標記的概率來代理相關性得分。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

如上表,RankRAG在多數情況下,即使在排名數據量僅為十分之一,也能實現比專用排名模型更好的召回率。此外,RankRAG在大多數任務上仍能超越經過超過100萬個排名對訓練的BGE-ranker。這一優勢可能源于我們模型訓練的適應性,排名數據與一般RAG微調數據高度相似。直接使用ChatQA-1.5進行段落排名會降低性能,這表明在指令微調中納入排名數據的必要性。

作者驗證了上下文排名數據量與最終性能之間的關聯。僅用5k排名數據(約MS MARCO數據集的1%),RankRAG便能取得非常出色的成果,而將排名數據量增加至50k,能帶來額外的顯著增益。這驗證了RankRAG的數據高效性——僅需少量排名數據即可達到高效性能,并在多樣的任務中維持其適應性。

RankRAG的性能與時間效率權衡:

擴大模型規模時需注意的一個細節是,延遲開銷的增加——模型需要對每個樣本進行排名,這會耗費更多時間。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區圖片

為了探究時間效率與性能之間的聯系,調整了重排名過程中使用的樣本數k,上圖展示了k值與最終準確性之間的關系。結果表明,即便k值設為20,RankRAG的性能依然超過了未進行重排名的基線模型。當k值從20增加至100,三個任務的完全匹配準確率提升了5.9%至9.1%,而所需時間僅增加了0.9至6.0倍,遠低于人們可能預期的20至100倍的增長。

又來一個RAG:RankRAG,英偉達RAG新思路-AI.x社區

本文轉載自 ??大語言模型論文跟蹤??,作者:HuggingAGI

已于2024-7-16 09:31:28修改
收藏
回復
舉報
回復
相關推薦
欧美一级性视频| 亚洲欧美小视频| 桃色一区二区| 国产精品欧美一级免费| 成人免费在线看片| 精品国产一区二区三区四| 欧美va久久久噜噜噜久久| 亚洲精品一区在线观看| 亚州精品一二三区| 日韩专区av| 久久精品一区八戒影视| 99九九电视剧免费观看| 日韩一级片中文字幕| 综合久久久久| 在线亚洲欧美视频| 视频免费在线观看| 二区三区精品| 在线精品视频一区二区| youjizz.com在线观看| 成人在线观看网站| 亚洲欧美另类一区| 大片免费在线看视频| 91亚洲午夜精品久久久久久| 国产一区二区香蕉| 日本免费在线观看视频| 亚洲手机在线| 另类美女黄大片| 日本人亚洲人jjzzjjz| 乱中年女人伦av一区二区| 91精品国产综合久久久蜜臀图片| 亚洲精品中文字幕无码蜜桃| av电影在线地址| 亚洲私人黄色宅男| 一级二级三级欧美| 好男人免费精品视频| 99久免费精品视频在线观看| 91在线观看免费网站| 伊人久久成人网| 久久久久国产精品午夜一区| 亚州av一区二区| 久久中文字幕无码| 91超碰国产精品| 日韩一区在线视频| 手机看片国产日韩| 日韩精品一区二区三区免费观看| 日韩av中文在线| 污污免费在线观看| 国内毛片久久| 亚洲高清久久久久久| 岛国av免费观看| 日韩一级淫片| 精品少妇一区二区三区 | 二区三区在线观看| 国产精品国产自产拍高清av王其| 亚洲毛片aa| 欧美激情黑人| 亚洲色欲色欲www| 99视频精品全部免费看| 成人直播在线| 亚洲一区二区黄色| www.射射射| 欧美办公室脚交xxxx| 欧美性生交xxxxxdddd| 国产性xxxx18免费观看视频| 成人教育av| 在线日韩av片| 亚洲天堂伊人网| 少妇精品在线| 日韩大陆毛片av| 无码国产69精品久久久久同性| jizzjizz欧美69巨大| 精品国产一区久久久| 99热这里只有精品4| 中文在线日韩| 91国产精品视频在线| 伊人中文字幕在线观看| 日韩黄色片在线观看| 成人精品一区二区三区电影黑人| 99精品国产99久久久久久97| youjizz久久| 日本一区二区三区视频在线观看| 欧美天天影院| 亚洲一区二区在线播放相泽| 无码aⅴ精品一区二区三区浪潮 | 欧美一区国产一区| 日本在线观看www| 一区二区三区国产豹纹内裤在线| 水蜜桃色314在线观看| 欧美gay视频| 欧美一区二区黄| 深爱五月激情网| 久久久国产精品| 国产91精品黑色丝袜高跟鞋| 亚洲一区二区色| 波多野结衣中文字幕一区二区三区| 欧美一级日本a级v片| av中文字幕在线播放| 欧美天堂在线观看| 一卡二卡三卡四卡五卡| 精品一区欧美| 欧美疯狂做受xxxx高潮| 中国黄色一级视频| 成人黄色小视频在线观看| 无码免费一区二区三区免费播放 | 999国产在线| 国产天堂素人系列在线视频| 夜夜嗨av一区二区三区网页| 在线视频日韩一区| 欧美日韩看看2015永久免费| 久久久av免费| 在线永久看片免费的视频| 国产91精品精华液一区二区三区| 欧美中文娱乐网| 国产盗摄——sm在线视频| 91麻豆精品国产91久久久久久久久 | 懂色av蜜臀av粉嫩av分享吧最新章节| 国产精品资源在线观看| 日韩欧美亚洲区| 午夜激情在线播放| 精品免费日韩av| 艳妇荡乳欲伦69影片| 日韩精品亚洲一区| 鲁丝一区二区三区免费| gogo高清午夜人体在线| 欧美一区二区三区四区五区| 欧美精品日韩在线| 新狼窝色av性久久久久久| 国产精品一区二区三区观看| av网站免费在线观看| 欧美精选在线播放| 欧美精品日韩在线| 免费观看成人av| 麻豆亚洲一区| 在线男人天堂| 精品一区电影国产| 国产专区第一页| 99精品一区二区| 日韩伦理在线免费观看| 北条麻妃一区二区三区在线观看| 中文字幕欧美日韩在线| 波多野结衣二区三区| 久久久噜噜噜久噜久久综合| 青青草原成人网| 西野翔中文久久精品国产| 性日韩欧美在线视频| 天堂av一区二区三区| 亚洲成年人影院| 日本wwwwwww| 日韩视频久久| 久久www免费人成精品| 美女高潮在线观看| 精品一区二区三区电影| 久久精品偷拍视频| 国产农村妇女精品| 一道本在线免费视频| 久久国产精品亚洲人一区二区三区| 国产精品视频26uuu| 欧美极品另类| 欧美大片在线观看一区二区| 国产一级特黄视频| 26uuu亚洲综合色| 久久精品一区二| 欧美影院三区| 亚洲综合大片69999| 91黄色在线| 亚洲精品一区二区三区蜜桃下载| 一区二区三区视频免费看| 91网上在线视频| 成人在线观看a| 久久久久国产| 国产乱码一区| 欧洲成人一区| 久久av.com| 国产精品国产高清国产| 91成人免费电影| 国产精品嫩草影院俄罗斯| 国产成人免费在线观看不卡| 我的公把我弄高潮了视频| 国产亚洲电影| 2022国产精品| 午夜不卡影院| 欧美成人高清视频| 五月激情婷婷综合| 欧美三级韩国三级日本三斤| 九九热精彩视频| 久久精品视频一区| 精产国品一二三区| 久久精选视频| 欧美这里只有精品| 欧美日韩在线播放视频| 3d动漫啪啪精品一区二区免费| 天堂а√在线最新版中文在线| 中文字幕在线成人| 天天综合网在线| 欧美精品丝袜中出| 天天插天天操天天干| 欧美高清一级片在线观看| 日本精品一二三| 美女视频免费一区| 阿v天堂2017| 久久精品青草| 欧美在线一区二区三区四区| jizz国产精品| 91精品久久久久久久| 超级碰碰久久| 欧美激情欧美激情| 国产黄大片在线观看画质优化| 亚洲人成电影在线播放| 亚洲奶汁xxxx哺乳期| 欧美精品乱码久久久久久按摩| 日韩熟女精品一区二区三区| 亚洲免费观看高清完整版在线观看熊| 37p粉嫩大胆色噜噜噜| 成人免费黄色在线| 男女视频在线观看网站| 奇米亚洲午夜久久精品| 亚洲中文字幕无码中文字| 国产精品激情电影| 吴梦梦av在线| 色综合天天爱| 亚洲国产精品毛片| 九一国产精品| 九九九九精品| 加勒比色老久久爱综合网| 亚洲自拍小视频| 91精品一区| 国产精品一区二区电影| 最新欧美色图| 欧美自拍视频在线| 松下纱荣子在线观看| 久久久免费精品| 黄页网站大全在线免费观看| 久久夜精品va视频免费观看| 国产在线观看av| 久久精品青青大伊人av| 欧美性天天影视| www.日本久久久久com.| 日本亚洲精品| 久久精品在线播放| 国产精品久久久久久福利| 日韩视频在线免费| 精品国产白色丝袜高跟鞋| 日韩专区中文字幕| 麻豆tv免费在线观看| 久久久国产精彩视频美女艺术照福利 | 成人黄色大片网站| 亚洲视屏一区| 国产91xxx| 国产精品人人爽人人做我的可爱 | 奇米精品一区二区三区在线观看| 毛片av免费在线观看| 青青草伊人久久| 极品粉嫩美女露脸啪啪| 国产一区二区毛片| 又黄又色的网站| 99亚偷拍自图区亚洲| 久久久精品人妻无码专区| 91网站在线观看视频| 精品人妻一区二区三区蜜桃视频| 国产欧美日韩一区二区三区在线观看| 婷婷色一区二区三区| 国产精品美日韩| 免费在线观看一级片| 亚洲一区二区3| 亚洲精品男人的天堂| 欧美在线免费观看亚洲| 国产又粗又猛又黄又爽无遮挡| 欧美一级日韩免费不卡| 欧美一区二区黄片| 亚洲色图色老头| 麻豆av在线免费看| 久久久久久亚洲精品中文字幕 | 欧美伊人影院| 少妇高潮毛片色欲ava片| 日韩高清在线观看| 色偷偷中文字幕| 99精品一区二区三区| 久久久久久国产免费a片| 亚洲天堂成人网| wwwxxx亚洲| 欧美精品乱码久久久久久按摩| 六月丁香色婷婷| 中文字幕av一区二区三区谷原希美| 韩国av网站在线| 欧美一级视频一区二区| 亚洲一区二区av| 精品乱码一区| 久久久久美女| 日本成年人网址| 国产精品99久久久久| 精品无码一区二区三区| 亚洲欧美激情视频在线观看一区二区三区 | 五月激情婷婷网| 久久中文字幕在线视频| 天堂资源在线| 91免费版黄色| 欧美视频网址| 蜜臀av无码一区二区三区| 美女www一区二区| 疯狂揉花蒂控制高潮h| 日韩美女视频一区| 无码人妻丰满熟妇精品| 91精品福利在线一区二区三区| 午夜性色福利视频| 欧美精品在线免费观看| 一二区成人影院电影网| 国产精品果冻传媒潘| 日韩国产一区| 国产成人a亚洲精v品无码| 国产福利一区在线观看| 国产福利在线导航| 韩曰欧美视频免费观看| 亚洲成人av综合| www.欧美精品| ww久久综合久中文字幕| 久久久久久久有限公司| 欧美激情麻豆| 激情在线观看视频| 国产精品色呦呦| 国产又大又黄又粗| 日韩免费性生活视频播放| 国产福利在线| 奇米四色中文综合久久| 精品在线网站观看| 高清欧美精品xxxxx| 国产激情91久久精品导航| 亚洲一级二级片| 欧美亚一区二区| 成人性爱视频在线观看| 国产91色在线|免| 日韩精选在线| 无码专区aaaaaa免费视频| 国产成人福利片| 麻豆国产尤物av尤物在线观看| 欧美精品第1页| 免费在线观看黄色网| 91精品久久久久久久久青青| 日韩高清欧美| 中文字幕久久av| 亚洲男人电影天堂| 精品久久久久成人码免费动漫| 久久精品成人动漫| 国产在线视频欧美一区| 在线国产精品网| 国产在线视频一区二区三区| 久久久久久视频| 日韩一区二区三免费高清| 色老头在线观看| 国产一区福利视频| 欧美视频一区| 黄色网址在线视频| 狠狠做深爱婷婷久久综合一区| 欧美日韩视频精品二区| 欧日韩在线观看| av在线不卡免费观看| 在线黄色免费看| 一区二区三区在线播放| 日韩一级免费视频| 欧美在线视频网站| 日韩免费在线| 制服下的诱惑暮生| 午夜精品久久久久久久99樱桃| 亚洲av片一区二区三区| 国产精品激情av电影在线观看| 日韩.com| 白丝校花扒腿让我c| 五月婷婷综合在线| 福利在线播放| 2019国产精品视频| 亚洲在线免费| 少妇的滋味中文字幕bd| 日韩色在线观看| 色偷偷色偷偷色偷偷在线视频| 人禽交欧美网站免费| 精品一区精品二区高清| 九九九国产视频| 一区国产精品视频| 榴莲视频成人app| 妞干网在线视频观看| 国产精品污污网站在线观看| 国产高清免费观看| 日韩av电影国产| 你懂的一区二区| 国精品无码人妻一区二区三区| 欧美女孩性生活视频| a√中文在线观看| 亚洲精品一区二区三区蜜桃久| 福利电影一区二区三区| 神马久久久久久久| 九色精品免费永久在线| 国产不卡av一区二区| av影片在线播放| 在线观看视频91| 91精品国产黑色瑜伽裤| 亚洲精品乱码视频| av成人免费在线观看| 国产尤物在线观看| 日韩av电影免费观看高清| 国产精品红桃| 久久人妻无码aⅴ毛片a片app|