智能體邂逅數據庫：Agentic架構的未來

作者：岱軍 2025-08-06 01:00:00

模型上下文協議（MCP）[2] 由 Anthropic 公司最初開發，現已迅速普及，成為將工具和數據連接到智能體系統[3] 的標準化方法，為智能體與數據庫的互操作性提供了一種新途徑。但這也給 AI 開發者帶來了關鍵問題：涉及數據庫的智能體架構實際上是什么樣的？構建時應該考慮哪些因素？

文章探討了AI智能體與數據庫交互的兩種主要途徑：使用MCP服務器進行標準化集成和構建自定義集成。強調了準確性、安全性和性能在智能體架構中的重要性，并指出選擇合適的數據庫對于智能體的未來至關重要。

譯自：Agents Meet Databases: The Future of Agentic Architectures^[1]
作者：Thibaut Gourdel

NVIDIA 首席執行官 Jensen Huang 將 2025 年譽為“智能體的元年”，OpenAI 首席產品官 Kevin Weil 也表達了類似觀點，AI 智能體正日益受到各行業組織的關注。這些自主系統通常需要與數據庫交互，因為世界上大部分有價值的數據都存儲在數據庫中。

根據 IDC 的《Data Age 2025》報告，到 2025 年，企業將管理全球近 60% 的數據，其中大部分數據都以數據庫的形式組織。因此，數據庫將成為智能體架構的核心，智能體部署的成功將取決于它們與數據庫連接和交互的程度。

模型上下文協議（MCP）^[2] 由 Anthropic 公司最初開發，現已迅速普及，成為將工具和數據連接到智能體系統^[3] 的標準化方法，為智能體與數據庫的互操作性提供了一種新途徑。但這也給 AI 開發者帶來了關鍵問題：涉及數據庫的智能體架構實際上是什么樣的？構建時應該考慮哪些因素？

智能體快速概覽

智能體是基于大型語言模型（LLM）^[4] 的系統，可以訪問各種工具——這些工具是它們可以用來執行超出自身原生能力的任務的功能或資源。智能體的定義在于能夠自主決定何時以及如何使用這些工具，無論是獨立使用、在結構化工作流程中使用，還是在人工參與的情況下使用。^[5]

智能體的核心組件：感知、規劃、工具和記憶。

賦予智能體直接查詢和交互數據庫數據的能力，可以實現一系列強大的用例。例如，根據可用的集合和模式生成應用程序代碼，或檢索最新的客戶信息以解決支持問題。

這引入了幾個架構設計決策，以確保性能、可擴展性和安全性。特別是，數據庫查詢工具的公開方式起著至關重要的作用。在向 AI 智能體^[6] 提供數據庫查詢功能時，主要有兩種途徑：使用帶有 MCP 的標準化工具，或構建針對特定需求量身定制的自定義集成。

路徑 1：使用 MCP 服務器進行標準化集成

MCP 服務器提供了一種即插即用的方法，用于將智能體與數據庫集成。MongoDB MCP 服務器^[7] 例如，簡化了與 MongoDB 數據庫的連接，并通過 MCP 查詢數據，使各種基于智能體的助手（如 Cursor、Windsurf、Claude Desktop 或任何支持 MCP 的智能體系統）能夠輕松地與你的數據交互。

MCP 為智能體提供了一個用于數據庫交互的標準化接口。這些服務器可以在本地或遠程部署。遠程服務器允許多個客戶端訪問同一個實例，非常適合共享環境。在本地和遠程部署之間的選擇取決于你的性能、可擴展性和安全需求。特別是，遠程部署可能需要額外的考慮因素，例如身份驗證機制，以確保安全訪問。^[8]

架構圖，顯示了與 MongoDB MCP 服務器連接的智能體。

這種方法的優點是：

? 所有權轉移：使用官方支持的服務器意味著提供商負責持續的支持和更新，使智能體能夠訪問不斷改進的功能，而無需構建和部署這些智能體的團隊進行手動代碼更新。

? 類似插件的集成：開箱即用的解決方案是團隊原型設計或部署與數據庫交互的生產級智能體的最快方式，類似于插件系統。

? 適用于操作型數據庫使用：這種方法非常適合最常見的數據庫交互，例如基本的 CRUD 風格的查詢和數據庫管理操作。

使用預構建的 MCP 服務器的主要權衡是自定義的限制；與構建自定義集成相比，你對工具在底層的工作方式的精確控制較少。雖然 MCP 簡化了將預定義工具與智能體集成，但它仍然需要仔細考慮，因為 MCP 本身并不安全（稍后會詳細介紹）。

路徑 2：用于控制和靈活性的自定義集成

對于需要更精細地控制數據庫交互的團隊，構建自定義實現提供了一條更靈活的途徑。像 LangChain 這樣的框架簡化并加速了這個過程。例如，MongoDB-LangChain 集成包^[9] 提供了用于實現自然語言查詢^[10] 的工具，允許開發人員構建與 MongoDB 交互的 AI 應用程序和智能體。這為數據探索和自主智能體（如客戶支持助手）檢索數據提供了直觀的界面。

這個工具包是可定制和可擴展的。構建智能體的開發人員可以精確地定義哪些數據庫操作暴露給智能體，包括模式檢查、查詢生成、驗證或更復雜的場景，并專門設計如何調用這些工具。

這種方法的主要優點是：

? 完全控制和所有權：你可以完全控制工具的行為以及智能體可以執行的確切數據庫操作。

? 支持高級用例：這種方法允許支持標準預構建工具可能無法涵蓋的高級和特定領域的用例。

? 自定義優化：自定義實現可以與內部數據策略和特定業務邏輯緊密結合，因此可以針對你的需求進行優化。

然而，自定義開發通常會帶來一些權衡，比如更高的開發成本和對集成的完全所有權責任。這條路徑非常適合為獨特的工作流程量身定制智能體的團隊，智能體是核心產品，或者合規性、隱私或性能要求超過了標準解決方案可以支持的范圍。

準確性、安全性和性能注意事項

無論是通過 MCP 還是自定義工具，授予智能體直接數據庫訪問權限都會帶來重大的準確性、安全性和性能挑戰。隨著這些技術的發展，實施預防措施并遵守最佳實踐對于可靠且可擴展的智能體操作至關重要。

準確性：確保可靠的查詢生成

查詢準確性在很大程度上取決于 LLM 的能力和所提供的模式或數據樣本的質量。模糊或不完整的元數據不可避免地會導致不正確或次優的查詢。在實現智能體的文本到查詢系統時，務必強制執行輸入/輸出驗證，實施嚴格的測試，并為復雜、敏感的操作建立護欄或人工審查。

安全性：維護保護和護欄

AI 智能體直接訪問數據庫會帶來前所未有的隱私和數據治理挑戰。由于 LLM 的固有行為，MCP 帶來了新的安全威脅，例如提示注入和工具中毒。雖然 MCP 相關的威脅和風險緩解措施相對較新，但包括 Red Hat^[11] 和 Writer^[12] 在內的多個組織已經對其進行了研究和記錄。應強制執行嚴格的護欄，以降低惡意活動和敏感數據泄露的風險。

作為一般的最佳實踐，智能體必須在嚴格的最小權限原則下運行，使用僅授予其特定任務權限的角色和策略。

另一個關鍵問題是當智能體訪問數據時，與 LLM 提供商共享敏感信息。組織需要對哪些信息（例如，數據庫名稱、集合名稱、數據樣本）到達 LLM 進行架構控制，并能夠完全禁用它。

為了解決這些安全問題，分層訪問控制模型至關重要。

? 上游：精細的角色訪問控制確保智能體僅與授權的服務和數據交互，符合最小權限原則。

? 下游：可以應用額外的限制來限制功能或強制執行只讀訪問^[13]。這些控制降低了風險，并確保對智能體與數據庫的交互進行適當的治理。

性能：管理不可預測的智能體工作負載

LLM 的非確定性本質使得智能體工作負載模式本質上是不可預測的。智能體可以頻繁地與數據庫交互，這可能會嚴重影響性能，從而產生關鍵的操作挑戰。在這種情況下，選擇一個在保持其主要作用的同時允許智能體有效擴展的數據庫至關重要。

將智能體工作負載與其他數據庫操作隔離提供了兩個關鍵優勢：首先，它確保只有指定的實例處理智能體工作負載，從而在保持生產性能的同時實現靈活的智能體可擴展性。其次，它允許在這些實例上進行定制配置，例如將它們設置為只讀模式，以針對特定用例進行優化。

對于 MongoDB 而言，這轉化為使用副本集^[14]，它支持獨立擴展讀取和寫入操作。此外，自動擴展^[15] 以及專用、優化的搜索節點^[16] 進一步增強了智能體在搜索密集型任務中的性能。將工作負載隔離與自動擴展相結合對于部署可靠且可擴展的智能體至關重要。

智能體的未來取決于數據庫

隨著 AI 智能體不斷發展成為強大的自主系統，它們直接與企業數據交互的能力變得至關重要。由于數據庫存儲了世界上大部分信息，因此啟用訪問不再是可選的。MCP 提供了一種標準化的、快速的智能體與數據庫集成路徑，非常適合常見的用例。對于更深入的自定義，構建定制的集成提供了精細的控制和可擴展性。

無論選擇哪種路徑，開發人員都必須優先考慮準確性，強制執行嚴格的安全控制并確保可擴展性。在這個智能體的新時代，真正的競爭優勢在于選擇一個符合這些要求的現代且靈活的數據庫。

引用鏈接

[1] Agents Meet Databases: The Future of Agentic Architectures:https://thenewstack.io/agents-meet-databases-the-future-of-agentic-architectures/

[2]模型上下文協議（MCP）:https://thenewstack.io/model-context-protocol-a-primer-for-the-developers/

[3]智能體系統:https://thenewstack.io/agentic-ai-tools-for-building-and-managing-agentic-systems/

[4]大型語言模型（LLM）:https://thenewstack.io/what-is-a-large-language-model/

[5]![智能體的核心組件：感知、規劃、工具和記憶。](https://cdn.thenewstack.io/media/2025/08/dc7cc142-image1-1024x371.png):https://cdn.thenewstack.io/media/2025/08/dc7cc142-image1-1024x371.png

[6]AI 智能體:https://thenewstack.io/ai-agents-a-comprehensive-introduction-for-developers/

[7]MongoDB MCP 服務器:https://www.mongodb.com/company/blog/announcing-mongodb-mcp-server

[8]![架構圖，顯示了與 MongoDB MCP 服務器連接的智能體。](https://cdn.thenewstack.io/media/2025/08/a9215165-image2-1024x462.png):https://cdn.thenewstack.io/media/2025/08/a9215165-image2-1024x462.png

[9]MongoDB-LangChain 集成包:https://github.com/langchain-ai/langchain-mongodb

[10]自然語言查詢:https://www.mongodb.com/docs/manual/natural-language-to-mongodb/

[11]Red Hat:https://www.redhat.com/en/blog/model-context-protocol-mcp-understanding-security-risks-and-controls

[12]Writer:https://writer.com/engineering/mcp-security-considerations/

[13]強制執行只讀訪問:https://github.com/mongodb-js/mongodb-mcp-server?tab=readme-ov-file#configuration

[14]副本集:https://www.mongodb.com/docs/manual/core/workload-isolation/

[15]自動擴展:https://www.mongodb.com/docs/atlas/cluster-autoscaling/

[16]專用、優化的搜索節點:https://www.mongodb.com/company/blog/product-release-announcements/search-nodes-now-public-preview-performance-scale-dedicated-infrastructure

責任編輯：武曉燕來源：云云眾生s

Agentic 模型 MCP