Anthropic發布Agent SDK,截胡 OpenAI
OpenAI 的 Agent Builder 消息先在網上傳開,TestingCatalog 爆料已經試用過這個可視化工作流工具。
就在大家都在等凌晨OpenAI Dev Day 正式發布時,Anthropic 突然宣布把 Claude Code SDK 改名為 Claude Agent SDK,搶先發布了完整的智能體開發框架。

這個時機選得很微妙,頗有點“截胡”的味道。Anthropic 顯然不想讓 OpenAI 獨占智能體平臺的話語權。
Agent feedback loop
Claude Agent SDK 的核心理念是"給 AI 一臺電腦"。整個工作流程遵循一個循環:收集上下文 → 執行操作 → 驗證結果 → 繼續迭代。
收集上下文的幾種方式:
文件系統成了上下文管理的核心。比如郵件智能體會把歷史對話存在 "Conversations" 文件夾,Claude 用 grep、tail 等 bash 命令搜索需要的信息。這比向量數據庫的語義搜索更透明、更精確。
圖片
子智能體(Subagents)設計很巧妙。可以并行處理多個任務,每個有獨立的上下文窗口,只返回相關結果給主智能體。比如搜索郵件時,可以同時啟動多個子智能體運行不同查詢。
SDK 還內置了上下文壓縮(Compaction)功能。當智能體長時間運行接近上下文限制時,會自動總結之前的消息,確保不會因為上下文溢出而中斷。
執行操作的工具箱:
自定義工具(Tools)是主要執行單元。SDK 建議把最頻繁的操作設計成工具,比如郵件智能體的 fetchInbox、searchEmails。工具在 Claude 的上下文中很顯眼,會優先考慮使用。
Bash 腳本提供了極大的靈活性。用戶郵件有 PDF 附件?Claude 能寫代碼下載、轉換成文本、搜索內容:
圖片
代碼生成是 SDK 的強項。Claude.AI 的文件創建功能就是靠 Python 腳本生成 Excel、PPT、Word 文檔。代碼的精確性和可復用性,讓復雜操作變得可靠。比如創建郵件規則:
圖片
MCP(Model Context Protocol)集成解決了外部服務連接問題。不用寫集成代碼或管理 OAuth,直接調用 search_slack_messages、get_asana_tasks 這樣的工具。
驗證工作的三種方法:
規則驗證最可靠。代碼 linting 是典型例子,TypeScript 比 JavaScript 好因為類型檢查提供額外反饋層。郵件地址驗證、發送歷史檢查都可以通過規則實現。
視覺反饋用于 UI 相關任務。生成 HTML 郵件后,可以截圖檢查布局、樣式、內容層級是否正確。配合 Playwright 這樣的 MCP 服務器,能自動化整個視覺驗證流程:
Claude provides visual feedback on the body of an email generated by an agent.
LLM 評判適合模糊規則場景,比如讓另一個模型評估郵件語氣是否合適。雖然不夠穩定且有延遲,但在某些場景下值得權衡。
SDK 能構建的智能體類型包括:金融智能體(處理復雜財務分析)、個人助理(管理日程、預訂行程)、客服智能體(處理工單、調用 API)、研究智能體(跨文檔分析綜合)等。
Anthropic 強調,這個 SDK 的定位已經遠超編程工具。在他們內部,它被用于深度研究、視頻創作、筆記整理等各種非編程任務。
來自一波人,但兩家公司的文化和路線卻迥然不同,帶來的產品也差異很大。對于agent開發,兩家又表現出了理念沖突,Anthropic 堅持面向技術人員,提供專業但門檻較高的 SDK。OpenAI 則要做可視化拖拽平臺,降低使用門檻,讓更多人能構建 AI 智能體。一個走專業路線,一個走大眾路線。兩個死對頭的較量,最終誰贏誰輸得慢慢看了。
來源:???https://www.anthropic.com/engineering/building-agents-with-the-claude-agent-sdk??
本文轉載自??AI工程化??,作者:ully

















