最新12種GraphRAG技術(shù)全面評測
GraphRAG 是一種擴展的 RAG 范式,通過構(gòu)建圖結(jié)構(gòu)來組織背景知識,其中節(jié)點代表實體、事件或主題,邊代表它們之間的邏輯、因果或關聯(lián)關系。它不僅檢索直接相關的節(jié)點,還會遍歷圖以捕獲相互連接的子圖,從而發(fā)現(xiàn)隱藏的模式。
GraphRAG vs RAG

GraphRAG 是否真的有效,以及在哪些場景下圖結(jié)構(gòu)能為 RAG 系統(tǒng)帶來可衡量的好處?
廈大和港理工提出的GraphRAG-Bench基準測試框架,旨在全面評估 GraphRAG 模型在分層知識檢索和深度上下文推理中的表現(xiàn):


實驗部分對 GraphRAG 和傳統(tǒng) RAG 進行了全面對比,得出以下結(jié)論:
- 生成準確性(Generation Accuracy):GraphRAG 在復雜推理、上下文總結(jié)和創(chuàng)造性生成任務中表現(xiàn)優(yōu)于 RAG,但在簡單事實檢索任務中,RAG 的表現(xiàn)更好或相當。

- 檢索性能(Retrieval Performance):GraphRAG 在復雜問題上顯示出優(yōu)勢,能夠連接分散在不同文本片段中的信息,這對于多跳推理和全面總結(jié)至關重要。

- 圖復雜性(Graph Complexity):不同的 GraphRAG 實現(xiàn)生成的索引圖在結(jié)構(gòu)上存在顯著差異,例如 HippoRAG2 生成的圖更為密集,節(jié)點和邊的數(shù)量遠超其他框架。

港理工和騰訊優(yōu)圖提出的GraphRAG-Bench更側(cè)重于評估 GraphRAG 在特定領域推理中的表現(xiàn)。該基準測試包含 1018 個涵蓋 16 個學科的大學水平問題,涉及多跳推理、復雜算法編程和數(shù)學計算等多種任務類型。


評估了九種最先進的 GraphRAG 方法,包括 RAPTOR、LightRAG、GraphRAG、G-Retriever、HippoRAG、GFM-RAG、DALK、KGP 和 ToG,得出關鍵結(jié)論:
- GraphRAG 的優(yōu)勢:在復雜推理和多跳任務中,GraphRAG 顯著優(yōu)于傳統(tǒng) RAG 方法,尤其是在需要深度上下文理解和邏輯推理的任務中。
- 任務類型的影響:GraphRAG 在不同任務類型中的表現(xiàn)存在差異。例如,在數(shù)學和倫理學領域,其表現(xiàn)不如在計算機科學領域。
- 推理能力的提升:GraphRAG 方法不僅提高了生成的準確性,還顯著提升了模型的推理能力,使其能夠生成更符合邏輯的解釋。



GraphRAG技術(shù)的圖構(gòu)建評估
- RAPTOR的圖構(gòu)建時間最長,但令牌消耗最少,因為它僅通過 LLM 生成總結(jié)。
- KGP的圖構(gòu)建時間較短,但令牌消耗較高。
- GraphRAG和LightRAG的圖構(gòu)建時間較長,且令牌消耗最多,因為它們生成了額外的描述信息。
- G-Retriever和HippoRAG的圖構(gòu)建時間最短,且非孤立節(jié)點比例最高(約 90%),表明它們在圖構(gòu)建質(zhì)量上表現(xiàn)最佳。

GraphRAG技術(shù)知識檢索評估
- GFM-RAG的索引時間最短,因為它不構(gòu)建傳統(tǒng)的向量數(shù)據(jù)庫。
- RAPTOR的平均檢索時間最快,因為其樹結(jié)構(gòu)能夠快速定位信息。
- HippoRAG和GFM-RAG的檢索時間較短,分別利用了 GNN 和 PageRank 算法。
- GraphRAG的檢索時間較長,因為它需要利用社區(qū)信息進行檢索


https://arxiv.org/pdf/2506.02404
GraphRAG-Bench: Challenging Domain-Specific Reasoning for Evaluating Graph Retrieval-Augmented Generation
https://arxiv.org/pdf/2506.05690
When to use Graphs in RAG: A Comprehensive Analysis for Graph Retrieval-Augmented Generation本文轉(zhuǎn)載自????PaperAgent??
贊
收藏
回復
分享
微博
QQ
微信
舉報
回復
相關推薦

















