一篇大模型Agentic框架到應用最新綜述:一文讀懂LLM推理框架的前沿進展
圖片
最近,由北京交通大學、蘭卡斯特大學、馬克斯·普朗克信息學研究所和電子科技大學的研究人員共同完成的一項重要綜述研究《LLM-based Agentic Reasoning Frameworks: A Survey from Methods to Scenarios》為我們系統梳理了LLM領域的最新進展。
研究團隊觀察到,盡管LLM在各個領域展現出巨大潛力,但它們仍存在一些內在限制,如幻覺問題、知識過時以及高昂的訓練和推理成本。這些問題限制了LLM在醫療保健和軟件工程等關鍵領域的應用。為了克服這些障礙,學術界積極探索將LLM作為核心引擎,構建能夠執行復雜多步推理任務的LLM代理推理框架。
技術背景:從LLM到代理系統
大型語言模型憑借其強大的泛化能力和推理能力,正在迅速重塑從日常生活到特定領域研究的眾多方面。然而,傳統的LLM主要進行單步推理,難以處理需要多步驟、多角度思考的復雜任務。
代理系統(Agent Systems)的出現解決了這一限制。代理被定義為"通過傳感器感知環境并通過執行器對環境采取行動"的系統,能夠動態適應環境并采取相應行動。這種新興范式有機地集成了規劃、記憶和工具使用等關鍵模塊,將LLM重塑為能夠感知環境、動態適應并采取持續行動的任務執行者。
圖1 展示了從2020年到2025年LLM代理框架相關出版物數量的快速增長趨勢,表明該領域正受到越來越多的關注。研究團隊指出,這一趨勢不僅在學術界明顯,在工業界也得到了廣泛反映,科技巨頭正積極將代理工作流程整合到其核心業務中。
圖1 展示了從2020年到2025年LLM代理框架相關出版物數量的快速增長趨勢,表明該領域正受到越來越多的關注。研究團隊指出,這一趨勢不僅在學術界明顯,在工業界也得到了廣泛反映,科技巨頭正積極將代理工作流程整合到其核心業務中。
代理推理框架的系統化分類
該論文的核心貢獻是提出了一個系統化的分類法,將代理推理框架分為三個漸進層次:單代理方法、基于工具的方法和多代理方法。
圖片
為了清晰地描述這一復雜過程,研究團隊提出了一個通用推理算法(論文中的算法1)和一套符號表示系統(論文中的表1)。這些形式化描述為理解不同代理推理框架提供了統一的理論基礎。
一、單代理方法
單代理方法專注于增強單個代理的認知和決策能力。從外部指導和內部優化的角度,論文將單代理方法分為兩大類:提示工程和自我改進。
1.1 提示工程
提示工程通過豐富代理的初始上下文來增強其性能,對應于算法1中的上下文初始化步驟(第1行)。這一概念轉變可以表示為:

圖片
圖3詳細展示了提示工程的四種方法:
- 角色扮演:為代理分配特定角色,如"你是一位專業的數據科學家"或"扮演一位資深歷史學家"。這鼓勵代理利用與該角色相關的專業知識、認知框架和語言風格。通過采用角色,模型可以更好地激活特定領域知識,并以更專業的視角構建其推理過程。
- 環境模擬:通過描述代理操作的特定設置來上下文化代理。這提供了與任務相關的背景信息、規則和約束,使代理能夠做出與模擬世界更好地一致的決策。這些環境可以范圍從模擬現實世界場景(如股票市場或醫療診所)到完全虛擬設置(如視頻游戲世界)。
- 任務描述:清晰的任務描述概述了主要目標、約束和預期輸出格式,是幾乎每個代理系統的基石。結構良好的任務描述指導代理將復雜問題分解為一系列可管理的子任務。

1.2 自我改進
自我改進機制鼓勵代理通過內省和自主學習來增強其推理能力。
圖片
圖4總結了三種互補的范式:

二、基于工具的方法
雖然通用代理推理框架(算法1)通過單個實體概念化了工具使用,但這種抽象對于推理與特定環境能力深度交織的復雜場景來說是不夠的。論文將這一單個實體擴展為一個全面的工具集,其中每個代表代理可用的不同工具。
圖5研究團隊將基于工具的推理流程分解為三個基本階段:工具集成、工具選擇和工具利用。
圖5研究團隊將基于工具的推理流程分解為三個基本階段:工具集成、工具選擇和工具利用。
2.1 工具集成
在代理選擇和利用工具之前,工具首先必須在代理的操作環境中可訪問。這種架構集成定義了代理與工具之間的接口和通信協議。論文將這些集成模式分為三種主要模型:基于API的集成、基于插件的集成和基于中間件的集成。
- 基于API的集成:API(應用程序編程接口)為集成外部工具提供了標準。API提供了穩定、文檔齊全的合同,允許代理與工具(如網絡搜索引擎)交互,而無需理解其內部實現。代理只需學習根據API規范制定請求并解析返回的數據。
- 基于插件的集成:插件是直接在代理自身運行時環境中加載和執行的軟件組件。與外部API調用不同,插件以更低的延遲運行,并且對代理內部狀態有更深入的訪問權限。檢索增強生成(RAG)是基于插件集成的典型情況。向量數據庫直接集成到代理系統中,以工具調用的形式向代理引入特定領域知識,從而提高其答案的可信度。
- 基于中間件的集成:中間件是位于代理和工具之間的軟件層。這一層充當代理的通用適配器或"操作環境",抽象了直接工具交互的復雜性,使LLM免受環境復雜性的影響。中間件層可以管理API密鑰,標準化不同工具之間的數據格式,或為代理提供統一的文件系統和執行環境。
2.2 工具選擇

2.3 工具利用
在選擇了合適的工具后,如何有效利用這些工具成為關鍵。論文將工具利用分為三種模式:順序使用、并行使用和迭代使用。

三、多代理方法
雖然單代理框架展示了相當大的能力,但它們在面對需要多樣化專業知識或復雜問題分解的任務時本質上面臨限制。多代理系統(MAS)作為一種自然解決方案出現,利用多個代理的集體智能來應對這些挑戰。
如論文中的圖6(此處添加論文中的圖6)所示,研究團隊沿著兩個軸分析了多代理推理框架:組織架構和個體交互。組織架構包括集中式、分布式和分層形式,決定了系統的結構主干;而個體交互涉及合作、競爭和協商,管理代理在追求目標時的動態。

3.1 組織架構

3.2 個體交互
除了組織架構外,多代理系統中的個體交互方式也對其性能產生重要影響。論文將個體交互分為三種主要類型:合作、競爭和協商。
- 合作:在合作交互中,代理共同努力實現共同目標。代理共享信息、資源和專業知識,以增強系統的整體性能。合作交互特別適合需要集體智慧或分布式專業知識的任務,如科學研究或復雜問題解決。
- 競爭:在競爭交互中,代理追求相互沖突的目標,試圖在有限的資源或環境中勝過對方。競爭交互可以激發創新和效率提升,特別適合需要優化或資源分配的任務,如市場模擬或游戲理論場景。
- 協商:協商交互介于合作和競爭之間,代理通過談判和妥協來達成互利解決方案。協商交互特別適合需要平衡多方利益的任務,如資源分配、沖突解決或決策制定。
應用場景分析
論文不僅系統梳理了代理推理框架的方法學,還深入分析了這些框架在幾個關鍵應用場景中的應用。這些場景包括科學發現、醫療保健、軟件工程、社會模擬和經濟學。
1. 科學發現
在科學發現領域,代理推理框架被用于加速研究過程、生成假設、分析實驗數據甚至設計實驗。論文詳細分析了代理如何通過多步推理和工具使用來處理復雜的科學問題,如材料科學中的新材料發現、生物學中的蛋白質結構預測等。
2. 醫療保健
在醫療保健領域,代理推理框架被用于疾病診斷、治療方案推薦、藥物發現和醫療數據分析。論文討論了代理如何整合多源醫療數據、應用醫學知識并進行推理,以提供準確的醫療建議和支持臨床決策。
3. 軟件工程
在軟件工程領域,代理推理框架被用于代碼生成、調試、測試和軟件維護。論文分析了代理如何理解軟件需求、生成代碼、檢測和修復錯誤,以及優化軟件性能。
4. 社會模擬
在社會模擬領域,代理推理框架被用于模擬人類行為、社會動態和群體決策。論文探討了代理如何模擬個體和群體的行為模式,以及如何預測社會現象和趨勢。
5. 經濟學
在經濟學領域,代理推理框架被用于市場分析、經濟預測和政策評估。論文討論了代理如何模擬市場行為、分析經濟數據并預測經濟趨勢。
評估策略
為了全面評估不同代理推理框架的性能,論文總結了多種評估策略。這些策略包括:
- 任務完成度評估:衡量代理完成特定任務的能力和效果。
- 推理質量評估:評估代理推理過程的邏輯性、一致性和準確性。
- 效率評估:衡量代理完成任務所需的資源和時間。
- 魯棒性評估:測試代理在面對不確定性和變化時的適應能力。
- 可解釋性評估:評估代理決策過程的透明度和可理解性。
論文還討論了不同應用場景下的評估數據集和基準測試,為研究人員提供了評估代理推理框架的全面指導。
未來方向與結論
在論文的最后部分,研究團隊討論了代理推理框架的未來發展方向,包括:
- 更強大的推理能力:開發能夠進行更復雜、更抽象推理的代理。
- 更好的工具集成:改進代理與外部工具的集成方式,擴展代理的能力范圍。
- 更高效的多代理協作:優化多代理系統中的協作機制,提高集體智能的效率。
- 更安全的代理行為:確保代理行為的安全性、可靠性和道德性。
- 更廣泛的應用場景:將代理推理框架應用于更多領域和場景。




































