精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路

發布于 2025-1-3 13:52
瀏覽
0收藏

1. 傳統RAG存在的問題

檢索增強生成(Retrieval-Augmented Generation ,RAG)能讓大型語言模型(LLMs)從非結構化文檔數據庫獲取信息,使得LLMs 就能處理未知事實,并借助額外的文本信息解決開放域問答(Open-Domain Question Answering,ODQA)問題。

圖檢索增強生成(Graph RAG,GRAG)從結構化知識庫中檢索信息,其中的文檔通過關系相互關聯。現有的 GRAG 方法主要集中在兩個方向:

? 從知識圖譜(Knowledge Graphs,KGs)中提取關系信息,并利用 LLMs 進行知識庫問答,以及在數據庫中的文檔間建立關系以提升 ODQA 性能。

? “混合”問答(Hybrid Question Answering,HQA):給定一個半結構化知識庫(Semi-structured Knowledge Base,SKB),通過結構化數據和文本數據共同完成一個問題的答案。SKB 由知識圖譜(也就是結構化數據庫)和非結構化文本文檔構成,其中文本文檔與 KG 的實體相關聯。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

但是,通過現有分析表明,現有的RAG或者GRAG都無法有效解決HQA問題:

? 其一,這兩種方法只專注于檢索文本或關系信息。

? 其二,在混合問題中,檢索不同類型信息所需的方面可能難以區分。如上圖,通過問題路由識別問題。但在不成功的路由中,文本方面“納米流體傳熱論文”和關系方面“由 John Smith 撰寫”之間的混淆會導致不正確的檢索。

2. 什么是HYB GRAG?

為解決 SKB 中的 HQA,我們提出 HYB GRAG(HYBrid Graph RAG)。HYB GRAG 利用檢索器庫處理混合問題,同時利用文本和關系信息??傮w上,HYB GRAG有以下特點:

? 智能體(Agentic):通過自我反思自動優化問題路由;

? 自適應(Adaptive):通過統一框架解決文本、關系和混合問題;

? 可解釋(Interpretable):通過直觀的優化路徑證明決策的合理性;

? 有效(Effective):在真實世界的 HQA 基準測試中優于所有基線。

2.1 HQA面臨的兩個問題:

2.1.1 C1: 混合來源問題(Hybrid-Sourcing Question)

作者通過一系列實驗,證明了HQA需要同時借助文本和關系信息來回答混合問題,表明文本文檔和知識圖譜(KG)包含有用但不重合的信息。

結果表明:

? 向量相似度搜索(Vector Similarity Search,VSS)作為僅使用文本信息的檢索器,通過在嵌入空間中對比問題與文檔來進行檢索和排序;

? 個性化 PageRank(PPR):作為僅使用關系信息的檢索器,從 LLM 識別出的實體出發進行隨機游走,并依據它們在 SKB 的 KG 中的連通性對相鄰實體進行排名。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

如上圖,文本和關系檢索器的性能不相上下。如果最優路由總是選擇能給出正確結果的檢索器,性能會大幅提升,這表明文本和圖形檢索器的優勢幾乎不存在重疊。表明通過協同這兩個檢索器來同時利用文本和關系信息的解決方案的重要性。

2.1.2 C2:需要改進的問題

KBQA 的成功往往依賴于這樣一個假設:目標實體處于從知識圖譜(KG)中抽取的子圖內。同樣,在 HQA 中回答問題需要從 SKB 里的 KG 抽取子圖。

由于混合問題兼具文本和關系兩方面,因此作者測試 LLM 能否從 KG 中抽取包含目標實體的子圖。

1. 通過提示詞識別問題中的關系層面,即實體和用于抽取子圖的有用關系。

2. 若目標實體不在子圖中,則利用一個通過提示詞進行帶有反饋的額外迭代。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

如上表:

? (第二行)若結果有誤,單純提示 LLM 重新抽取會獲得更高的命中率。

? (第三行)如果 LLM 收到指出抽取錯誤部分的反饋(比如,抽取的主題實體有誤),結果會顯著提升。這是因為在包含文本和關系方面的混合問題中,LLM 可能會誤將文本方面當作關系方面。

所以第二個挑戰:在 HQA 中,LLM 首次嘗試時難以區分問題的文本和關系方面,故而需要進一步完善。

2.2 針對C1提出的新的檢索庫架構

HYB GRAG的檢索模塊由多個檢索模塊和一個路由器構成的檢索器庫。

設計了兩個檢索模塊,分別是文本檢索模塊混合檢索模塊,用于從文本文檔和 SKB 中獲取信息。每個檢索模塊均包含一個檢索器和一個排序器,用來應對各類問題提供了靈活性。

?文本檢索模塊:通過針對給定問題 Q 的相似性搜索來檢索文檔,比如密集檢索,直接在文本文檔中找到答案。

?混合檢索模塊:將識別出的實體 E 和有用關系 R 作為輸入。使用圖形檢索器提取由 R 連接的 E 的自環圖中的實體。

?路由器:給定一個問題 Q,LLM 路由器執行問題路由來確定檢索模塊的選擇和使用。路由器首先依據實體類型和關系類型,借助少量示例識別關系方面,即實體 E 和有用關系 R 。然后路由器做出選擇,決定采用文本檢索模塊還是混合檢索模塊。

2.3 針對C2提出的評論模塊

給定一個混合問題 Q,路由器需執行問題路由,包括識別實體和有用關系 。但在首次迭代中它們可能會被錯誤識別。

為解決此問題,提出評論模塊,能提供反饋以助力路由器更好地執行問題路由。作者沒有直接采用單個 LLM 完成這一復雜任務,而是將其分為兩部分:

? 即 LLM 驗證器用于驗證檢索結果的正確性

? LLM 評論員用于在檢索有誤時提供反饋

這種分治策略,具有兩大關鍵優勢:

1.將難題分解為兩個較易處理的任務,能借助 LLM 來解決,同時保持良好性能。

  1. 由于驗證和評論的任務相互獨立,各自可有專屬上下文,避免包含無關信息及“Lost in the Middle”的現象。

2.3.1 驗證器 LLM

驗證器的目的是驗證檢索到的頂級參考文獻是否符合問題 Q 的要求,屬于二分類任務。為提高準確性,為驗證器提供額外的驗證上下文。將主題實體與提取的自我圖中實體間的推理路徑用作驗證上下文,用于檢驗輸出是否滿足問題中的某些要求。

2.3.2 評論員 LLM

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

評論員旨在提供反饋以協助路由器優化問題路由。為有效引導路由器,構建易于理解的糾正性反饋。會指出每個動作中的錯誤,如實體的錯誤識別(上表展示了識別錯誤的分類)。

與可能因使用的 LLM 而導致不確定性或不一致的自然語言反饋不同,糾正性反饋為如何優化問題路由提供了明確指引。此外,它借助上下文學習(ICL)提供精細的反饋。

3. 效果評估

3.1 HYB GRAG 在現實世界的 GRAG 基準測試中的表現怎樣?

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

如上表,HYB GRAG 在 STARK 的兩個數據集中均顯著優于所有基準方法。大多數基準方法是為處理 ODQA 和 KBQA 而設計的,結果表明它們無法有效處理 HQA。

混合檢索模塊表現位居第二,表明能同時運用文本和關系信息的協同檢索模塊的重要性。

HYB GRAG 的表現明顯優于混合檢索模塊,意味著在首次迭代中提取的實體和關系常常有誤。

通過分別利用HYB GRAG檢索器庫和評論模塊應對挑戰 1 和 2,HYB GRAG 的性能有了顯著提升。

3.2 消融研究:HYB GRAG 的所有設計選擇是否必要?

3.2.1 評論模塊

把 HYB GRAG 變體與沒有驗證上下文的驗證器、僅有五次示例的評論者的情況進行對比。

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

從上圖可以看出,在所有的設計選擇下,HYB GRAG 表現最佳,接近標準性能。 

3.2.2 自我反思

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

從上圖可以看出,隨著更多的自我反思迭代,HYB GRAG 的性能進一步提升。當迭代次數從 1 增加到 2 時,性能顯著提高,其中第 1 次迭代未進行自我反思。同時表明,幾次迭代就已足夠,因為隨著迭代次數增多,改進逐漸減小。 

3.3 可解釋性:HYB GRAG 如何依據反饋優化其問題路由?

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

上圖展示了 STARK-MAG 中檢索器庫的路由器與評論模塊相互作用的實例。

上圖左側的首輪迭代中,路由器誤將“電子電路中的光學 TALU 實現”認定為代表研究領域的主題實體(關系方面)。由于基于此實體提取的圖和基于“Netaji Subhash 工程學院”提取的圖無交集,評論模塊判定前一實體更可能是文本方面。于是,它向路由器反饋,路由器也相應地進行處理。HYBGRAG 的這種優化路徑類似 CoT,具有可解釋性,方便用戶理解。

3.4 端到端評估

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

上表中,HYB GRAG 在 CRAG 中的表現優于所有基線。

? 具有單個檢索模塊的 RAG 無法應對兩種類型的問題。

? 具有連接參考的 RAG 也會因長參考中的無關內容而分心。

? 即便提供了相同的檢索庫,自反思基線仍難以優化自身行動。

? 由于 ReAct 依賴于 LLM 的思考能力并提供自然語言反饋,它往往缺少改進行動的明確指引。

? 沒有經過微調的檢索評估器,Corrective RAG 無法有效識別參考的有用性。這體現了帶有糾正反饋的評論模塊的優越性。

3.5 模型成本分析

HybGRAG:Hit@1 的平均相對提升率達到 51%的新思路-AI.x社區圖片

上面兩個表分別匯總了 STARK 和 CRAG 中 HYB GRAG 迭代各步驟的 API 調用次數和令牌消耗。

盡管大部分令牌消耗源于用于 ICL 的示例,但提示本身所需令牌極少。而且,由于 HYB GRAG 把聊天 LLM 當作路由器,ICL 的示例僅需提供一次。

相較于 STARK 中的最先進基線 AVATAR,其訓練時至少需 500 次 API 調用,混合檢索模塊僅 2 次 API 調用,在 Hit@1 上就實現了 24%的相對提升,而 HYB GRAG 最多 14 次 API 調用就能達成 51%的提升,二者均無需訓練。

本文轉載自 ??大語言模型論文跟蹤??,作者:HuggingAGI


收藏
回復
舉報
回復
相關推薦
男人舔女人下面高潮视频| 欧美日韩国产成人高清视频| 黄色免费观看视频网站| 国产资源在线播放| 国产麻豆精品95视频| 精品中文字幕在线观看| 好吊日免费视频| zjzjzjzjzj亚洲女人| 国产精品一区二区免费视频| 黄色一区二区三区四区| 亚洲深夜福利视频| 日韩久久久久久久久久久| 2018av在线| av一区二区三区| 国产精品一区=区| 日韩特黄一级片| 亚洲精品电影| 亚洲视频电影图片偷拍一区| 国产人妖在线观看| 亚洲电影有码| 精品国产乱码久久久久久虫虫漫画| 亚洲人一区二区| 五月色婷婷综合| 国产一区高清在线| 国产成人拍精品视频午夜网站| 黄视频网站免费看| 精品国产一区二区三区久久久樱花| 日韩免费观看高清完整版在线观看| 免费日韩视频在线观看| 欧美高清另类hdvideosexjaⅴ | 日本在线播放一区二区| 欧美另类老肥妇| 亚洲一区在线免费观看| 一区二区三区四区五区精品 | 国产电影一区二区| 日韩欧美国产黄色| 青青草成人免费在线视频| 麻豆网站视频在线观看| 91香蕉一区二区三区在线观看| 伊人色在线视频| а√天堂资源官网在线资源| 伊人夜夜躁av伊人久久| 亚洲精品成人自拍| 国产美女视频一区二区三区| 91网站视频在线观看| 忘忧草精品久久久久久久高清| 亚洲精选视频免费看| 日本不卡一区| 青青草娱乐在线| 91亚洲男人天堂| 国产欧美一区二区三区不卡高清| www日本视频| 免费污视频在线| 中文字幕人妻精品一区| 国产一区福利| 精品乱码亚洲一区二区不卡| 国产精品一区在线播放| 国产日韩久久| 久久狠狠高潮亚洲精品| 欧美精品福利| 久久久久久久久亚洲| 亚洲xxxx在线| 日韩欧美123区| 天堂av免费在线观看| 精品国产亚洲一区二区在线观看| 日本亚洲一区二区| 国产香蕉精品视频一区二区三区| 天天躁日日躁aaaxxⅹ| 免费国产自久久久久三四区久久| 精品性高朝久久久久久久| 精品国产一二| 我的公把我弄高潮了视频| 国产鲁鲁视频在线观看免费| 国产亚洲短视频| 亚洲精品久久久久久一区二区| 高清av在线| 中文字幕五月欧美| 污污污污污污www网站免费| 黑人另类精品××××性爽| 欧美性猛交xxxx黑人| 国产一区一区三区| 色www永久免费视频首页在线 | 精品99久久久久久| 97人妻精品一区二区三区免| 欧美在线电影| 欧美另类老女人| 日本三级理论片| 视频在线观看91| 91亚洲永久免费精品| 欧美 日韩 国产 成人 在线| 国产视频一区在线播放| 艳母动漫在线观看| 黄色视屏在线免费观看| 精品视频在线看| 第一页在线视频| 国产精品自拍区| 欧美性极品xxxx娇小| 成人黄色短视频在线观看| 精品人妻一区二区三区三区四区 | 亚洲欧美日韩一区| 国产精品视频一二三四区| 天堂av中文在线观看| 欧美日本一区二区| 亚洲激情 欧美| 成人在线免费小视频| 欧美精品电影在线| 国产成人精品一区二区色戒| 国产成人综合精品三级| 日韩欧美一区二区在线观看| 日韩av毛片| 欧美色老头old∨ideo| 免费黄视频在线观看| 精品国产91乱码一区二区三区四区| 久久精品国产一区二区电影| 国产成人亚洲精品自产在线| 久久国产欧美日韩精品| 蜜桃999成人看片在线观看| a级片国产精品自在拍在线播放| 色综合久久中文综合久久97| 在线精品视频播放| 偷偷www综合久久久久久久| 日本a级片电影一区二区| www.麻豆av| 亚洲天堂精品在线观看| 国产成人手机视频| 国产suv精品一区| 欧美另类在线观看| 国产精品老熟女视频一区二区| 2019国产精品| 波多野结衣家庭教师在线| 国内不卡的一区二区三区中文字幕| 国产亚洲精品一区二区| 国产小视频在线免费观看| 国产91在线观看丝袜| 中文字幕一区二区三区四区五区人| 欧美aaa视频| 亚洲精品视频久久| 制服.丝袜.亚洲.中文.综合懂色| 国产不卡在线一区| 欧美日韩中文字幕在线播放| 精品视频一二| 久久伊人精品视频| av手机免费看| 亚洲综合成人在线视频| 国产精品igao网网址不卡| 婷婷综合亚洲| 91久久久一线二线三线品牌| 国产三区视频在线观看| 91精品国产黑色紧身裤美女| 人与动物性xxxx| 久久se精品一区精品二区| 亚洲精品一区二区三| 国产精品第一国产精品| 色噜噜亚洲精品中文字幕| 中文字幕人妻一区二区三区视频 | 亚洲国产精品va| 亚洲一区 视频| 不卡的av电影| 自慰无码一区二区三区| 日韩理论电影中文字幕| 欧美综合国产精品久久丁香| 国产中文在线观看| 欧美视频第二页| 日韩在线视频免费看| 国产在线播精品第三| 男人日女人的bb| 最新国产精品精品视频| 97国产一区二区精品久久呦| 五月婷婷狠狠干| 色婷婷综合激情| 毛片aaaaaa| 国产一区二区三区四区在线观看 | 日本三级韩国三级欧美三级| 精品成人一区二区三区| 国产精品久久久久久久久久久久久久久久久 | 九九热爱视频精品视频| 国产激情999| 国产理论在线观看| 亚洲国产欧美一区| 成人av网站在线播放| 国产精品久久久久9999吃药| 超碰中文字幕在线观看| 亚洲综合国产| 在线观看日韩片| 国产精品对白| 国产精品久久久久久久久久免费| 黄色视屏免费在线观看| 亚洲韩国青草视频| 在线观看国产精品视频| 亚洲国产色一区| 谁有免费的黄色网址| 国产最新精品免费| 国产成人无码精品久久久性色| 久久中文字幕av一区二区不卡| 草莓视频一区| 天堂久久午夜av| 欧美黑人极品猛少妇色xxxxx| 牛牛影视精品影视| 欧美一区二区在线免费播放| 亚洲精品男人天堂| 亚洲蜜臀av乱码久久精品| 国产精品嫩草av| 韩国三级中文字幕hd久久精品| 久艹视频在线免费观看| 久久精品国产99久久| 久久99精品久久久久久水蜜桃| 亚洲精品66| 日韩av免费看网站| 欧美理论片在线播放| 色婷婷**av毛片一区| 欧美 日韩 国产 成人 在线| 欧美日韩一区 二区 三区 久久精品| 国产乡下妇女做爰视频| 国产精品美女一区二区在线观看| 亚洲av成人无码一二三在线观看| 久热成人在线视频| 国产一区二区三区精彩视频 | 老牛精品亚洲成av人片| 国产在线精品一区免费香蕉 | 亚洲精品在线视频免费观看| 国产中文字幕精品| 亚洲免费一级视频| 男人的天堂亚洲在线| 青春草国产视频| 91精品福利| 亚洲精美视频| 精品国产一区二区三区香蕉沈先生| 国产精品久久久久久久免费大片| 伊人久久综合网另类网站| 国产精品一二三在线| 厕沟全景美女厕沟精品| 97在线看免费观看视频在线观看| 宅男在线观看免费高清网站| xxx欧美精品| 日本视频在线免费观看| 夜夜嗨av一区二区三区四区| 婷婷国产在线| 精品小视频在线| 日韩欧美电影在线观看| 亚洲激情 国产| 免费国产黄色片| 亚洲成人三级在线| 亚洲第一色网站| 欧美精品一区二区久久婷婷| 国产黄色一级大片| 精品对白一区国产伦| 亚洲国产精品无码久久| 精品国产乱码久久久久久老虎| av在线免费在线观看| 欧美一区二区免费| 国内毛片毛片毛片毛片| 日韩女同互慰一区二区| 亚洲av无码乱码国产精品| 欧美成人在线直播| 秋霞视频一区二区| 亚洲国产成人在线播放| 性感美女视频一二三| 亚洲美女av在线| 韩国三级av在线免费观看| 色999日韩欧美国产| 欧美日韩欧美| 欧美极品少妇与黑人| aaa在线播放视频| 日本一区二区三区在线播放| 99re久久| 亚洲一区二区三区毛片| 深夜激情久久| 激情小说综合网| 欧美人与拘性视交免费看| 性欧美精品一区二区三区在线播放| 日韩欧美一区二区三区在线视频| 一本—道久久a久久精品蜜桃| 一区二区中文| 黄色www网站| 蜜臀91精品一区二区三区| 91免费视频污| 久久人体大尺度| 亚洲欧美偷拍自拍| 国产欧美视频一区二区| 中文字幕视频一区二区在线有码| 亚洲综合第一| 久久国产精品二区| 久久久男人天堂| 日韩精品每日更新| 日韩一区二区三区视频| 香蕉久久夜色| 亚洲一区二区三区蜜桃| 亚洲宅男网av| 亚洲欧美日韩在线综合| 你懂的视频一区二区| 国产黄页在线观看| 蜜桃av噜噜一区二区三区小说| 肉丝美足丝袜一区二区三区四| 91在线观看污| 在线看的片片片免费| 精品久久久久久久久久久久| 一级成人免费视频| 亚洲国产精品热久久| 黄色免费在线看| 欧美亚洲免费电影| 久久一级大片| 色综合视频二区偷拍在线| 亚洲婷婷在线| 欧美大片久久久| 久久久久久麻豆| 久久中文字幕无码| 欧美无砖专区一中文字| 涩涩视频免费看| 久久av在线播放| 欧美日韩亚洲国产| 国产精品一区二区三区免费观看| 日韩精品dvd| 99久久久无码国产精品6| 国产成人av电影在线播放| 国产不卡在线观看视频| 精品欧美aⅴ在线网站| 国产福利小视频| 日韩有码在线视频| 欧洲一区二区三区精品| 国产精品日韩高清| 欧美.www| 五月天激情播播| 中文字幕精品三区| 亚洲AV无码成人精品区东京热| 亚洲大胆人体在线| 在线网址91| 成人亚洲欧美一区二区三区| av一区二区在线播放| av观看免费在线| 99国产精品久久久久久久久久| 91视频免费在线看| 欧美一区二区免费视频| 蜜桃视频在线观看www社区| 国产成人一区二区三区| 亚洲警察之高压线| 日本三级免费网站| 99在线视频精品| 成人精品在线看| 亚洲高清在线观看| av小说在线播放| 国产日韩久久| 国产美女一区| 成年人网站免费看| 疯狂做受xxxx高潮欧美日本| 亚洲av成人无码网天堂| 97精品久久久| 亚洲另类av| 任你操这里只有精品| 国产欧美日产一区| 欧美高清69hd| 久久精品视频播放| 久久久久久久久久久久电影| 日本xxx免费| 国产成人免费视频网站高清观看视频| 青青草成人免费| 亚洲国产成人久久| 成人片免费看| 性欧美.com| 国产一区二区精品在线观看| 91aaa在线观看| 亚洲国产美女久久久久 | 欧美精品一区二区三区国产精品| 视频91a欧美| 轻点好疼好大好爽视频| 99久久免费国产| 欧美brazzers| 久久精品99久久久久久久久| av中文字幕免费| 亚洲免费一区二区| 久久视频中文字幕| 亚洲性图自拍| 国产在线一区二区三区播放| 亚洲另类视频| 69精品无码成人久久久久久| 亚洲欧洲日本mm| 中文字幕avav| 欧美视频13p| 免费大片在线观看www| 91精品免费| 国产欧美一区二区色老头| 亚洲ⅴ国产v天堂a无码二区| 欧美精品精品一区| 内射后入在线观看一区| 国内成+人亚洲+欧美+综合在线| 国产精品999| 日日夜夜综合网| 国产在线精品免费| 久久久久成人精品免费播放动漫| 超碰在线国产| 一区二区三区**美女毛片| 中文字幕中文字幕在线中心一区| 午夜精品久久久久久久99热黄桃| 西西人体一区二区| 97中文字幕在线观看| 日韩人体视频一二区| 秋霞a级毛片在线看| 亚州欧美日韩中文视频| 国产精品69xx| 日本高清一区| 懂色av一区二区三区蜜臀 |