Python+LangGraph+RAGAS構建一個復雜的、可用于生產的RAG系統

PyTorch研習社

發布于 2025-11-6 07:28

瀏覽

0收藏

構建一個可用于生產的 RAG 系統，需要一系列深思熟慮且迭代的步驟。

一切從清理和準備數據開始，接著測試不同的切分策略（邏輯切分與傳統切分），以找到最適合你業務場景的方法。

然后是匿名化，通過去除敏感或無關的細節來減少幻覺。

為了進一步提升檢索器的性能，可以構建子圖（Subgraph），讓檢索更聚焦于最相關的信息，同時過濾掉噪聲。

在檢索層之上，我們引入一個由 LLM 驅動的規劃與執行系統。它就像一個智能體（Agent），能夠從前面的步驟中學習，并決定下一步應該執行什么操作。

最后，當 RAG 系統生成回答后，我們會使用一系列指標對其性能進行評估。

在接下來的一系列文章中，我們將一步步演示如何構建這樣一個全棧 RAG 系統。

整個過程將基于LangChain、LangGraph 和 RAGAS（用于評估），一切從真實的企業需求出發，并展示開發者在構建生產級 RAG 系統時會遇到的實用解決方案。

在開始編碼之前，最好先從全局可視化角度理解我們的 RAG Pipeline 的整體結構。隨著后續的推進，我們會逐步可視化其中的每個組件。

Python+LangGraph+RAGAS構建一個復雜的、可用于生產的RAG系統-AI.x社區

我們最終版 RAG 流水線的高層概覽：

問題匿名化：先對用戶輸入的問題進行匿名化處理
規劃器（Planner）生成高層策略
去匿名化：重新引入上下文信息
計劃分解：將整體計劃拆解為更小的任務
任務處理：為每個任務選擇合適的工具
檢索工具執行：若工具為引語、切分塊或摘要檢索，則進行數據獲取
重新規劃（Replan）：基于新獲取的信息，系統可能會調整計劃
生成最終答案：如果系統確認可以回答問題，則輸出最終答案
流程結束

首先，我們調用 anonymize_question。它會將具體的人名（例如 “Harry Potter”、“Voldemort”）替換為占位符（如 Person X、Villain Y），以避免LLM 因預訓練知識而產生偏差。

接下來，planner 會生成一個高層策略。比如對于問題 “How did X defeat Y?”，它可能會規劃如下步驟：

識別 X 和 Y
定位他們的最終對抗場景
分析 X 的行為
起草答案

然后我們運行de_anonymize_plan，恢復原始名字，使計劃更加具體且可執行。更新后的計劃會傳遞給 break_down_plan，將每個高層步驟拆解為更具體的任務。

接著，task_handler 會為每個任務選擇合適的工具。可能的選項包括：

chosen_tool_is_retrieve_quotes：檢索具體的引言或對話
chosen_tool_is_retrieve_chunks：獲取一般信息與上下文
chosen_tool_is_retrieve_summaries：查詢總結整章內容
chosen_tool_is_answer：在已有足夠上下文時，直接生成答案

當使用某個檢索工具（如retrieve_book_quotes、retrieve_chunks 或retrieve_summaries）后，新的信息會被傳遞給 replan。

replan 會審查當前的進展、目標以及新輸入，判斷是否需要更新或擴展原有計劃。

整個循環task_handler → tool → replan 會持續進行，直到系統判定該問題 can_be_answered_already（已經可以回答）。此時，get_final_answer 會綜合所有信息，生成完整的回答。

最后，檢查答案的準確性和是否忠實于來源。如果通過檢查，流程會以 end 結束，交付一個經過驗證、推理合理的最終答案。

本文轉載自??PyTorch研習社??，作者：南七無名式

標簽

Python

LangGraph

RAGAS

已于2025-11-6 07:28:55修改

贊

回復

舉報

回復

相關推薦

不同數據集有不同的Scaling law？而你可用一個壓縮算法來預測它

輕薄滴假象 ? 3479瀏覽 ? 0回復
Gptpdf：一個簡單巧妙的復雜Pdf解析工具，提升RAG效果

Syrupup ? 8233瀏覽 ? 0回復
基于Prefect、Weave和RAGAS的RAG應用開發實戰

51CTO內容精選 ? 4058瀏覽 ? 0回復
Easy-RAG 一個適合學習、使用、自主擴展的檢索增強生成系統

AIGC觀察者 ? 5789瀏覽 ? 0回復
用于復雜RAG任務的先進可控Agent

PaperAgent ? 3937瀏覽 ? 0回復
RAGLAB：又來一個RAG框架，還是模塊化的

大語言模型論文跟蹤 ? 3890瀏覽 ? 0回復
一個開源、清晰、強大且可定制的RAG UI

PaperAgent ? 4653瀏覽 ? 0回復
xLAM: 一個賦能AI agent系統的動作大模型家族

sbf_2000 ? 4443瀏覽 ? 0回復
RAGChecker:顯著超越RAGAS，一個精細化評估和診斷 RAG 系統的創新框架

Syrupup ? 4444瀏覽 ? 0回復
PydanticAI：一個基于 Python 的新代理框架，用于構建生產級 LLM 支持的應用程序

Halo咯咯 ? 7058瀏覽 ? 0回復
RARE：通過檢索增強推理增強打造一個媲美GPT4的RAG系統

大語言模型論文跟蹤 ? 3729瀏覽 ? 0回復
構建一個完全本地的語音激活的實用RAG系統

51CTO內容精選 ? 2849瀏覽 ? 0回復
我們如何構建了一個LangGraph代理以確定GitOps漏洞的優先級？

51CTO內容精選 ? 3817瀏覽 ? 0回復
構建基于LangGraph的RAG多智能體研究工具

Halo咯咯 ? 4401瀏覽 ? 0回復
使用 LangChain、LangGraph 和 RAGAS 構建復雜的 RAG 系統

AI大模型觀察站 ? 2538瀏覽 ? 0回復
用LangGraph打造高可用生產級AI Agent

PyTorch研習社 ? 5457瀏覽 ? 0回復
Python+FAISS：五分鐘打造一個RAG系統

PyTorch研習社 ? 1356瀏覽 ? 0回復
構建可用于生產環境的 RAG 智能體：開發者完整指南

PyTorch研習社 ? 1387瀏覽 ? 0回復
構建具備深度思考能力的 Agentic RAG 流水線，用于解決復雜查詢

AI大模型觀察站 ? 384瀏覽 ? 0回復

PyTorch研習社

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

51CTO

51CTO博客

51CTO學堂

Python+LangGraph+RAGAS構建一個復雜的、可用于生產的RAG系統

目錄