12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術原創

玄姐聊AGI

發布于 2025-8-15 08:57

瀏覽

0收藏

本文通過 12 張動圖全面剖析 MCP、RAG、Agent、Cache、Fine-tuning、Prompt、GraphRAG 等 AI 大模型應用核心技術。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

下文我們詳細剖析之。

一、12張動圖全面剖析 AI 大模型應用核心技術

1、函數調用和 MCP 在 LLM 中的應用

在 MCP 流行之前，AI 大模型應用工作流程依賴于傳統的函數調用來訪問工具。

現在，MCP（模型上下文協議）正在改變開發者為 AI 智能體構建工具訪問和編排的方式。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

2、從頭開始訓練 LLM 的四個階段

這張圖涵蓋了從零開始構建 LLM 并將其應用于現實世界的四個階段。

這些階段包括：

預訓練
指令微調
偏好微調
推理微調

3、LLM 中的三種推理提示詞技巧

使 LLM 應用如此強大的不僅僅是它們準確預測下一個 token 的能力，還有它們通過推理得出答案的能力。

這張圖涵蓋了三種流行的提示詞技巧，幫助 LLM 在回答之前更清晰地思考。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

4、使用其他 LLM 訓練 LLM（蒸餾）

LLM 不僅從原始文本中學習；它們也相互學習：

Llama 4 Scout 和 Maverick 是使用 Llama 4 Behemoth 訓練的。
Gemma 2 和 3 是使用谷歌專有的 Gemini 訓練的。
蒸餾幫助我們做到這一點，下面的圖描繪了三種流行的技術。

5、LLM 中的監督與強化微調

RFT 讓我們可以將任何開源 LLM 轉變為推理強國，而無需任何標記數據。

這張圖涵蓋了監督微調和強化微調之間的區別。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

6、Transformer 與專家混合模型

專家混合模型（MoE）是一種流行的架構，它使用不同的“專家”來改進 Transformer 模型。

專家就像前饋網絡，但比傳統 Transformer 模型中的網絡小。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

7、傳統 RAG 與智能體 RAG

簡單的 RAG 檢索一次并生成一次，它不能動態搜索更多信息，也不能通過復雜查詢進行推理。

此外，適應性很小。LLM 無法根據手頭的問題修改其策略。

智能體 RAG 解決了這個問題。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

8、5 種 AI 智能體設計模式

AI 智能體行為允許 LLM 通過自我評估、規劃和協作來完善其輸出！

這張圖描繪了構建 AI 智能體時采用的 5 種最流行設計模式。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

9、AI 智能體系統的 5 個級別

AI 智能體系統不僅僅是生成文本；它們做出決策、調用函數，甚至運行自治工作流程。

這張圖解釋了 AI 智能體的 5 個級別——從簡單的響應者到完全自治的 AI 智能體。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

10、傳統 RAG 與 HyDE

傳統 RAG 系統的一個關鍵問題是，問題與答案在語義上不相似。因此，在檢索過程中，由于余弦相似度高于實際包含答案的文檔，會檢索到幾個不相關的塊。

HyDE （Hypothetical Document Embeddings）假設文檔嵌入技術通過首先生成一個假設性的回答來解決這個問題。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

11、RAG 與圖 RAG

回答需要全局上下文的問題對于傳統 RAG 來說很困難，因為它只檢索最相關的前 k 塊。

圖 RAG 通過圖結構使其更加健壯，這有助于它構建長距離依賴關系，而不是 RAG 中發生的局部文本分組。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

12、KV 緩存

KV 緩存是一種用于加速 LLM 推理的技術。

簡而言之，我們不是冗余地計算所有上下文 tokens 的 KV 向量，而是緩存它們。這在推理過程中節省了時間。

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術-AI.x社區

好了，這就是我今天想分享的內容。

本文轉載自??玄姐聊AGI?? 作者：玄姐

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

已于2025-8-15 08:57:19修改

贊

回復

舉報

1條回復

按時間正序

按時間倒序

wx663ee29dd69f6

文章寫的非常好，動圖用的什么軟件制作的？

回復

2025-8-19 13:56:32

回復

相關推薦

LLM基礎模型系列：Fine-Tuning總覽

魯班模錘1 ? 6756瀏覽 ? 0回復
LLM基礎模型系列：Prompt-Tuning

探索AGI ? 4532瀏覽 ? 0回復
大模型高效微調Prompt Tuning論文解讀

AIRoobt ? 7182瀏覽 ? 0回復
給 ?大模型初學者? 的 LLaMA 3 核心技術剖析

Baihai_IDP ? 4887瀏覽 ? 0回復
kotaemon核心GraphRAG、Agent、多模態代碼解讀！

PaperAgent ? 5161瀏覽 ? 0回復
RAG文檔解析器，核心技術剖析

小虎哦哦 ? 5439瀏覽 ? 0回復
全面系統解讀高效SAM變體：各種加速策略和核心技術展示

angel ? 7849瀏覽 ? 0回復
全面解讀高效Segment Anything模型變體：各種圖像分割加速策略和核心技術展示

angel ? 1.1w瀏覽 ? 0回復
一文搞懂AI大模型的四個核心技術

數智飛輪 ? 4681瀏覽 ? 0回復
一文帶你看懂開源大模型基石LLaMA核心技術點，DeepSeek/千問等LLM的模型結構基礎

海因斯DK ? 5279瀏覽 ? 0回復
多模態大模型Ovis核心技術點、訓練方法、數據細節

大模型自然語言處理 ? 3620瀏覽 ? 0回復
圖RAG統一框架來了，12種RAG方法一網打盡！

NLP前沿1 ? 4471瀏覽 ? 0回復
60張圖深度剖析LLM Agents，逼近通用人工智能

CourseAI ? 3247瀏覽 ? 0回復
12張圖清晰總結 MCP、RAG、Agent 架構設計間的關系

玄姐聊AGI ? 5411瀏覽 ? 0回復
12張圖清晰總結 MCP、RAG、Agent 架構設計間的關系

玄姐聊AGI ? 4990瀏覽 ? 0回復
11張圖全面總結 MCP、A2A、Function Calling 架構設計間關系

玄姐聊AGI ? 8059瀏覽 ? 0回復
看完這10張動圖，你會徹底理解 MCP 的架構原理！

玄姐聊AGI ? 6828瀏覽 ? 0回復
最新12種GraphRAG技術全面評測

PaperAgent ? 2645瀏覽 ? 0回復
64張圖全面剖析 AI 智能體的架構設計和關鍵技術

玄姐聊AGI ? 7121瀏覽 ? 0回復

玄姐聊AGI

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

51CTO

51CTO博客

51CTO學堂

12張動圖全面剖析 MCP/RAG/Agent/Cache/Fine-tuning/Prompt/GraphRAG 等核心技術原創