AI Agent 開發的坑（Function Call）

作者：demo123567 2025-07-08 09:03:32

人工智能

AI Agent是一個能夠感知環境、做出決策并執行行動的智能系統。它結合了大型語言模型（LLM）的推理能力和各種工具的實用功能，能夠完成復雜的任務。

引言

AI Agent（智能代理）是當前AI領域的熱門話題，它能夠理解用戶意圖、調用工具、執行任務并給出智能回答。本文將帶你從零開始，一步步構建一個功能完整的AI Agent，并分享開發過程中的關鍵問題和解決方案。

什么是AI Agent？

AI Agent是一個能夠感知環境、做出決策并執行行動的智能系統。它結合了大型語言模型（LLM）的推理能力和各種工具的實用功能，能夠完成復雜的任務。

項目架構設計

核心組件

我們的AI Agent包含以下核心組件：

語言模型：負責理解用戶意圖和生成回答
工具系統：提供具體的功能實現
工作流引擎：協調各個組件的工作
狀態管理：跟蹤執行過程

技術棧選擇

# 核心依賴
from langgraph.graph import StateGraph, END
from mcp.server import Server
from openai import OpenAI

開發過程與關鍵問題

問題1：LangGraph配置錯誤

錯誤信息：

ValueError: Checkpointer requires one or more of the following 'configurable' keys: thread_id, checkpoint_id

解決方案：

# 錯誤做法：在AgentState中包含保留字段
class AgentState(TypedDict):
    thread_id: str  # ? 這是LangGraph保留字段
    checkpoint_id: str  # ? 這是LangGraph保留字段

# 正確做法：避免使用保留字段名
class AgentState(TypedDict):
    messages: List[Dict[str, Any]]
    current_step: str
    tools_used: List[str]
    final_result: str

經驗總結：框架的保留字段名不能用作狀態字段，需要仔細閱讀文檔。

問題2：無限循環問題

錯誤信息：

GraphRecursionError: Recursion limit of 25 reached without hitting a stop condition

解決方案：

# 使用條件邊避免無限循環
workflow.add_conditional_edges(
    "agent",
    self._should_continue,  # 決策函數
    {
        "tools": "tools",   # 需要工具 → 調用工具
        "end": END          # 完成任務 → 結束
    }
)

def _should_continue(self, state: AgentState) -> str:
    if state["current_step"] == "tool_call":
        return"tools"
    else:
        return"end"

經驗總結：工作流設計必須考慮停止條件，避免無限循環。

問題3：工具調用格式問題

問題描述：模型不理解如何調用工具，直接回答問題而不使用工具。

解決方案：

# 明確的系統提示
system_prompt = """重要：當需要調用工具時，你必須使用以下格式：
TOOL_CALL: 工具名 參數JSON

例如：
- 用戶說"讀取當前目錄"，你應該回復：TOOL_CALL: list_directory {"directory_path": "."}
- 用戶說"讀取demo.py文件"，你應該回復：TOOL_CALL: read_file {"file_path": "demo.py"}

不要直接回答用戶的問題，而是調用相應的工具。"""

經驗總結：系統提示必須明確、具體，包含格式示例。

問題4：API格式沖突

錯誤信息：

messages with role "tool" must be a response to a preceeding message with "tool_calls"

解決方案：

# 錯誤做法：使用tool角色
conversation.append({"role": "tool", "content": f"工具結果: {tool_result}"})

# 正確做法：使用assistant角色
conversation.append({"role": "assistant", "content": f"我調用了工具 {tool_name}，結果是：{tool_result}"})

經驗總結：要遵循API規范，避免使用不支持的對話角色。

最終實現效果

經過修復后，我們的AI Agent能夠成功執行各種任務：

文件操作

用戶: 請幫我讀取當前目錄的內容
Agent: 當前目錄的內容包括以下文件和子目錄：
- `demo.py`
- `langgraph_demo.py`
- `__pycache__`（這是一個緩存目錄）

情感分析

用戶: 分析這句話的情感：'這個產品真的很棒，我非常喜歡！'
Agent: 根據分析結果，這句話的情感是積極的。表達了對產品的高度贊賞和喜愛。

數據處理

用戶: 計算這些數字的統計信息：[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Agent: 這些數字的統計信息如下：
- 總數: 10
- 總和: 55
- 平均值: 5.50
- 最小值: 1
- 最大值: 10

關鍵技術要點

1. 工具系統設計

class FileToolsServer:
    def __init__(self):
        self.server = Server("file-tools")
        
    @self.server.list_tools()
    async def list_tools() -> ListToolsResult:
        # 定義工具接口
        
    @self.server.call_tool()
    async def call_tool(name: str, arguments: dict) -> CallToolResult:
        # 實現工具邏輯

2. 狀態管理

class AgentState(TypedDict):
    messages: List[Dict[str, Any]]  # 對話歷史
    current_step: str               # 執行步驟
    tools_used: List[str]           # 工具使用記錄
    final_result: str               # 最終輸出

3. 錯誤處理

try:
    tool_result = self._call_tool(tool_name, tool_args)
except Exception as e:
    tool_result = f"工具調用失敗: {str(e)}"

開發建議

1. 漸進式開發

先實現簡單的工具調用
逐步添加復雜功能
每個階段都要充分測試

2. 調試技巧

添加詳細的日志輸出
使用print語句跟蹤執行流程
分步驟驗證每個組件

3. 代碼組織

分離工具定義和實現
使用統一的錯誤處理
保持代碼的可讀性和可維護性

擴展方向

增加更多工具：網絡請求、數據庫操作、圖像處理等
優化決策邏輯：使用更智能的工具選擇策略
添加記憶功能：記住用戶偏好和歷史交互
實現并行處理：同時執行多個工具任務
增加安全控制：限制工具使用權限

總結

AI Agent的開發是一個迭代的過程，需要不斷調試和優化。關鍵是要理解：

框架限制：了解使用的框架有哪些限制和保留字段
API規范：嚴格遵循API的使用規范
系統提示：提供明確、具體的指令給模型
錯誤處理：做好異常情況的處理

通過這個實戰項目，我們不僅學會了如何構建AI Agent，更重要的是掌握了解決實際開發問題的方法。這為未來的AI應用開發奠定了堅實的基礎。

責任編輯：武曉燕來源：海燕技術棧

AI Agent LLM