AI Agent 協議:未來AI智能生態的基礎設施

大家好,我是肆〇柒。今天想跟大家深入聊聊 AI 智能體協議這個極具前瞻性的話題。關于智能體協議,我跟了一段時間,發現它就像是打開智能體協作大門的一把鑰匙,特別有意思,而且對未來的智能生態影響深遠。
如今,大型語言模型(LLM)就像一股不可阻擋的浪潮,正在席卷各個行業。從智能寫作到語言翻譯,從智能客服到數據挖掘,再到醫療輔助診斷,LLM 智能體的應用場景簡直多得數不過來。它們正無處不在地改變著我們的生活方式。比如,智能寫作工具能幫我們快速生成高質量的文章;智能客服能 24 小時不間斷為用戶提供一個大型的互聯網公司,每天要處理海量的數據和復雜的業務流程。以前,這些任務主要依賴人工或者簡單的自動化腳本來完成,但隨著業務的增長,這種方式在未來會面臨無法滿足需求的問題。
隨著不同供應商、不同架構的智能體大量涌現,智能體與外部工具或數據源之間的交互規則變得越來越復雜。就好比一堆不同國家、不同語言的人湊在一起,大家各自有自己的表達方式,卻找不到一種通用的語言來交流。這種缺乏標準化協議的局面,就像在智能體世界的交通要道上設置了重重關卡,會嚴重阻礙智能體的發展。智能體與資源的互操作性大打折扣。很多智能體面對外部工具和數據源時,常常因為接口不匹配、數據格式不一致等問題,無法順利獲取所需信息。
這就像是你伸手去拿東西,卻發現那只手和物體之間像是被一道無形的墻隔開,怎么也碰不到一塊去。而且,智能體網絡的可擴展性也受到極大限制。每新增一個智能體或工具,可能都要重新調整整個系統的交互邏輯,這無疑增加了系統的復雜性和維護成本。更關鍵的是,智能體解決復雜現實問題的能力也被削弱不少。在很多實際場景中,完成一個復雜任務往往需要多個智能體協同工作,但缺乏統一協議使得這種協作變得困難重重,智能體們各自為戰,難以形成強大的合力。

智能體互聯網生態系統的分層架構
所以,制定統一的智能體通信協議變得迫在眉睫。這就好比為智能體世界設立一套通用的交通規則和語言體系,讓所有智能體都能按照統一的標準來交流和協作。它不僅能解決當前的互操作性問題,讓智能體們不再為 “語言不通” 而發愁;更能構建一個智能體網絡,實現不同形式的智能流通與融合。如果未來智能體們可以自由組合、相互配合,共同完成復雜任務,催生出強大的集體智能,這會為我們帶來前所未有的創新與變革。
智能體協議的內涵與價值
定義與功能
智能體協議其實就是智能體世界的 “通用語言” 和 “行為準則”,它是一套標準化的框架,精心定義了智能體與智能體、智能體與外部系統之間結構化通信的規則、格式和程序。就好比我們人類社會的各種交通規則、社交禮儀,它讓智能體的交流變得有序、高效。
它的功能非常強大。
1.智能體協議能輕松實現智能體與外部資源的無縫互操作。這就像是給智能體配備了一把萬能鑰匙,讓它能夠在各種外部資源的寶庫中自由穿梭,隨時獲取所需信息。比如,一個智能體需要調用天氣預報 API 來完成任務,有了智能體協議,它就能輕松識別 API 的接口和數據格式,快速獲取天氣數據。
2.它確保交互過程的標準化。這就像是給智能體的交流戴上了一頂 “規范帽子”,讓所有的溝通都有章可循。不管是哪個供應商開發的智能體,不管是用于什么場景的智能體,只要遵循智能體協議,它們就能像訓練有素的士兵一樣,按照統一的隊形和步伐進行協作。
3.智能體協議簡化了智能體整合新功能的過程。它就像是智能體的 “能力擴展插件”,讓智能體能夠快速適應不斷變化的需求。當有新的工具或服務出現時,智能體不需要進行大規模改造,只需要按照協議稍作調整,就能輕松接入新功能。
4.它還提供嚴密的安全治理機制。這就像是給智能體的交流筑起一道堅固的城墻,抵御各種安全威脅。比如,通過加密技術、身份認證等手段,智能體協議能夠防止數據泄露、惡意攻擊等問題,為智能體的運行保駕護航。
5.智能體協議大幅降低智能體開發的復雜性。它就像是智能體開發者的 “貼心助手”,讓開發者能夠專注于核心功能的創新,而不必為復雜的交互邏輯煩惱。開發者可以基于統一的協議框架,快速開發出功能強大的智能體,大大提高了開發效率。
與傳統交互方式的優勢
我們對比一下智能體協議和傳統交互機制,就可以發現智能體協議的優勢非常明顯。傳統 API 雖然高效,但在靈活性和標準化方面稍顯遜色。它就像是一個只能在固定軌道上運行的列車,雖然速度快,但一旦遇到軌道變化或需要與其他系統進行復雜交互時,就會顯得無能為力。GUI 為用戶提供了直觀的界面,但在效率和 AI 兼容性上有所欠缺。它更像是一個為人類設計的精美操作手冊,雖然看起來很友好,但對于智能體來說,卻難以直接理解和操作。XML 則因效率低下和標準化不足而逐漸被邊緣化。它就像是一個古老的語言,雖然有一定表達能力,但在快節奏、高要求的智能體世界中,已經很難滿足需求。
而智能體協議則不同,它集高效率、廣泛的操作范圍、強大的標準化能力和與 AI 系統的完美兼容性于一身。它為智能體提供了靈活多樣的交互方式,無論是簡單的數據查詢,還是復雜的任務協作,都能輕松應對。而且,它還能與 AI 系統深度集成,讓智能體的交流更加自然、智能。在復雜的智能體生態系統交互中,智能體協議可以讓智能體們能夠真正實現高效、有序的協作。

智能體協議發展的概覽,此圖太寬,為了編譯瀏覽細節,我將它橫置,同時方便手機橫屏閱讀
智能體協議的分類
維度一:面向對象
智能體協議就像是一個大家庭,其成員根據面向對象的不同,可分為面向上下文和面向智能體交互兩大類。
面向上下文的協議,就像是智能體的 “百科全書”,專注于為智能體提供豐富的背景信息。它讓智能體能夠更好地理解任務和環境,就像我們人類在做決策時會參考各種背景知識一樣。例如,當智能體需要回答一個關于歷史事件的問題時,面向上下文的協議可以幫助它從海量的歷史數據中提取相關信息,為用戶提供實用指南。
面向智能體交互的協議,則更像是智能體社會的 “社交網絡”,側重于智能體之間的溝通與協作。它構建起智能體之間的交流渠道,讓智能體們能夠像朋友之間聊天一樣,分享信息、協調行動。比如,在一個復雜的任務中,多個智能體可以通過面向智能體交互的協議,共同商討任務分工、共享進度信息,最終合力完成任務。
維度二:應用場景
更細致地看,這個大家庭中的成員還可根據應用場景的不同,細分為通用型和特定領域型。
通用型協議就像是智能體世界的 “萬能鑰匙”,致力于為各種實體提供統一接口。它不局限于某個特定領域,而是試圖構建一個通用的交流平臺,讓不同背景的智能體都能在這個平臺上互動。這就像是一個大型的國際會議,來自不同國家、不同行業的代表都能在這個平臺上交流觀點、分享經驗。
特定領域型協議則更像是 “專業工匠”,針對特定領域的獨特需求進行優化。它為智能體在專業領域的深度應用提供精準支持。例如,在醫療領域,特定領域型協議可以讓醫療智能體與各種醫療設備、醫療數據庫進行高效交互,為醫生提供精準的診斷建議;在金融領域,它可以助力金融智能體快速分析市場數據,為投資者提供決策參考。這種針對性的設計,能夠滿足不同用戶和開發者在特定場景下的個性化需求,讓智能體在專業領域發揮更大的價值。

從兩個維度(面向對象和應用場景)對各種智能體協議進行分類
常見智能體協議詳解
面向上下文的通用型協議——MCP
Anthropic 提出的模型上下文協議(MCP)在智能體協議領域占據著舉足輕重的地位。它宛如智能體與外部資源之間的橋梁,通過標準化上下文獲取連接,讓智能體能夠輕松訪問外部數據、工具和服務。MCP 的核心優勢在于其獨特的解耦設計,巧妙地將工具調用和 LLM 響應分開,極大地增強了隱私和安全性。當智能體需要獲取特定信息時,它不再是直接執行函數調用,而是先明確所需資源和參數,這一過程由本地客戶端負責構建和執行實際的上下文請求,從而確保敏感信息得以離線存儲,有效避免數據泄露的風險。
MCP 的架構精妙而復雜,主要由主機、客戶端、服務器和資源四個部分構成。主機作為智能體的核心,負責與用戶交互、理解用戶需求、選擇合適的工具并發起上下文請求;客戶端連接主機和服務器,提供可用資源的描述,并根據主機指令發起具體的上下文請求;服務器則與資源相連,根據客戶端請求從資源中獲取所需上下文并返回;資源則是數據、工具或服務的提供者,可以是本地或遠程的。例如,當用戶詢問特定日期和地點的天氣時,主機利用 LLM 的理解和推理能力,判斷需要從天氣 API 獲取數據。多個客戶端連接到主機,提供可用資源的自然語言描述。主機根據這些信息,確定向哪個資源請求上下文,并向對應的客戶端發起戰略性的上下文請求。客戶端隨后向服務器發送執行上下文請求,包括數據查詢或工具調用等操作。服務器處理請求后,將獲得的上下文傳遞給客戶端,客戶端再轉交給主機。主機結合這些上下文,形成對用戶查詢的完整回答,完成一次 MCP 調用周期。
關于 MCP 我還發過另外三篇文章,如果有興趣可以閱讀,方便你對 MCP 有更全面的了解。(點擊??)《MCP:AI 與工具交互的“瑞士軍刀”》,《MCP協議的安全隱患:AI智能體的“隱形炸彈”》,《MCP 安全:守護 AI 系統的 “神經中樞”》
面向上下文的特定領域型協議——agents.json
WildCardAI 提出的 agents.json 規范,宛如傳統 API 與 AI 智能體之間的粘合劑,巧妙地在兩者之間架起了一座橋梁。它基于 OpenAPI 標準,以結構化的 JSON 文件形式,讓網站能夠清晰地聲明 AI 兼容接口、認證方案和多步驟工作流。與專為人類開發者設計的常規 OpenAPI 規范不同,agents.json 引入了流程和鏈接等新構造,流程是預定義的 API 調用序列,而鏈接則映射了動作間的數據依賴關系,這些特性使得大型語言模型(LLMs)能夠可靠地進行編排。通過提供清晰、標準化的智能體交互架構,agents.json 簡化了智能體與網站的集成過程,減少了提示工程的需求,同時顯著提升了 API 在智能體環境中的可發現性和可用性。
面向智能體交互的通用型協議
- ANP :開源技術社區開發的智能體網絡協議(ANP),承載著構建智能體協作網絡的偉大愿景。其核心原則涵蓋互聯互通、原生接口和高效協作?;ヂ摶ネㄖ铝τ诖蚱浦悄荏w之間的隔閡,實現無障礙通信,讓智能體能夠跨越數據孤島,獲取完整的上下文信息;原生接口讓智能體擺脫人類交互習慣的束縛,通過 API 和協議與數字世界進行優化交流;高效協作則借助自動組織和自動談判機制,助力智能體建立起成本更低、效率更高的協作網絡。ANP 的架構分為三個核心層,身份和加密通信層利用 W3C DID 標準建立去中心化身份認證機制,實現端到端加密通信;元協議層作為協議的協議,支持智能體使用自然語言自主協商和協調通信協議,如 Agora;應用協議層則定義標準化協議,規范智能體的發現、信息描述、能力展示和接口提供,以及用于完成特定領域任務的應用協議。例如,一個本地智能體首先通過標準化發現路徑檢索其他智能體列表,然后訪問列表中引用的智能體描述文件。根據描述文件中的信息,智能體利用所需接口發起交互,構建格式正確的請求,附加認證憑證,發送請求并處理相應的響應。
- A2A :谷歌提出的 Agent To Agent 協議(A2A)專注于企業環境中智能體的無縫協作。它遵循簡潔性原則,重用現有標準,如采用 HTTP(S)作為傳輸層,JSON-RPC 2.0 作為消息格式,Server-Sent Events(SSE)用于流式傳輸,這種輕量級協議設計有效降低了學習曲線和實現復雜性;企業級應用原則意味著協議內置了對認證、授權、安全、隱私、可追溯性和可觀測性的考量,確保智能體在生產環境中穩健、安全地運行;異步優先架構以任務為中心,支持長時間運行的異步工作流,包括多輪次的人工介入交互場景,涵蓋輪詢、基于 SSE 的更新和推送通知等多種異步模式,實現實時反饋、通知和任務狀態更新;多模態支持使 A2A 原生兼容文本、文件、表單、媒體格式(如音頻/視頻流和嵌入式框架)等,體現了智能體環境的多模態特性;不透明執行原則下,智能體交互無需共享思維、計劃或工具,聚焦于上下文、狀態、指令和數據,保護實現隱私和知識產權,但共享任務相關元數據,形成半透明協作,存在資源暴露風險。A2A 定義了智能體卡片、任務、工件、消息和組件等關鍵概念,共同構建起智能體及其協作工作流的描述框架。在工作流程中,遠程智能體通過 JSON 格式的 “智能體卡片” 展示能力,使客戶端智能體能夠識別出最適合執行任務的智能體。隨后,客戶端智能體借助 A2A 與遠程智能體通信以完成任務,任務對象可以立即完成或長期運行,最終由遠程智能體以工件形式輸出任務結果。
- AITP :NEAR 提出的智能體交互與交易協議(AITP)聚焦于不同組織或個人的智能體間的安全通信、談判和價值交換。在航班預訂場景中,個人助理智能體可借助 AITP 直接與航空公司預訂智能體交互,無需瀏覽航空公司網站,即可完成航班、乘客和支付信息的交換。AITP 的核心在于其明確關注跨信任邊界智能體交互,運用區塊鏈技術應對去中心化多智能體環境中的身份、安全和數據完整性挑戰,為智能體間的交互提供堅實保障。
- AConP :思科提出的智能體連接協議(AConP)精心定義了智能體調用和配置的標準接口,涵蓋智能體檢索、執行、中斷與恢復、線程管理和輸出流等五個關鍵方面的 API。這些 API 構成了與智能體交互的完整使用流程。智能體 ACP 描述符存儲了調用智能體所需的關鍵信息,包括智能體的唯一標識、能力描述以及能力消費方式。從嚴格意義上說,AConP 主要聚焦于定義連接和利用智能體的標準接口,而非直接促進智能體間的交互。然而,借助 ACP 描述符與 API 集成,智能體能夠實現互聯互通與協作。
- AComP :AI 和數據基金會提出的智能體通信協議(AComP)目的是標準化智能體間的通信方式,助力自動化實現、智能體協作、 UI 集成以及開發工具建設。AComP 并非急于制定嚴格規范,而是優先考慮實用、有價值的功能,隨后對經驗證具有價值的特性進行標準化,以此確保更廣泛的采納和長期兼容性。當前智能體系統因采用多樣化的通信標準而面臨復雜性、集成難題和供應商鎖定困境,AComP 通過適應智能體特定需求,努力簡化集成流程,推動智能體生態系統內有效協作。
- Agora :Agora 協議巧妙地借助大型語言模型(LLM)在自然語言理解、代碼生成和自主談判方面的能力,成功化解異構 LLM 智能體網絡通信中多功能性、效率和可移植性三難困境。它創新性地引入協議文檔(PDs),賦予智能體自主協商、實施、適應甚至創建新協議的能力,從而極大提升智能體通信的靈活性與適應性,使其能夠輕松應對各種復雜場景。
面向智能體交互的特定領域型協議
- 人 - 智能體交互協議(PXP 協議和 LOKA 協議) :PXP 協議宛如人類專家與機器智能體之間的翻譯官,在任務導向對話中搭建起雙向可理解的橋梁。它借助有限狀態機模型,引入 RATIFY、REFUTE、REVISE 和 REJECT 四種標簽,根據智能體間預測和解釋的契合度來確定交互方式,確保雙方能夠清晰理解彼此意圖。LOKA 協議則致力于為 AI 智能體生態系統構建堅實的去中心化身份、信任和道德協調基礎,引入通用智能體身份層(UAIL),為智能體賦予獨特、可驗證的身份標識,從而實現安全認證、責任追溯和互操作性。在此基礎上,該協議融入基于意圖的通信協議,實現不同智能體間的語義協調。其核心亮點是去中心化倫理共識協議(DECP),使智能體能夠基于共享的倫理基準做出契合上下文的決策。該協議以分散式標識符(DIDs)、可驗證憑證(VCs)和抗量子密碼學等新興標準為支撐,目的是為多智能體 AI 治理打造一個具備擴展性和未來適應性的藍圖,將身份、信任和倫理融入協議底層,為數字與物理領域的智能體生態系統奠定基礎。
- 機器人 - 智能體交互協議(CrowdES 和 SPPs) :CrowdES 協議為機器人環境中的真實人群動態模擬帶來了新的解決方案,它巧妙結合人群發射器和人群模擬器,利用擴散模型為個體賦予屬性,并借助馬爾可夫鏈狀態切換機制生成多樣化運動軌跡。SPPs 協議則專注于解決匿名機器人之間的分布式定位問題,通過創新的協議設計,使機器人能夠在任意初始位置和坐標系下達成統一坐標系共識。無論是自我穩定距離查詢協議,還是基于領導者的距離查詢協議和自我穩定向量查詢協議,都為機器人 - 智能體交互提供了強大的技術支持,助力機器人在復雜環境中實現高效協調、感知和空間推理。
- 系統 - 智能體交互協議(LMOS、Agent Protocol) :LMOS 協議作為構建智能體互聯網(IoA)基礎架構的基石,采用三層結構設計,包括應用協議層、傳輸協議層和身份與安全層。它提供去中心化智能體/工具描述、元數據傳播機制、群組管理協議和靈活的智能體通信接口等關鍵組件,為智能體的發現、交互和協作提供了全方位支持。Agent Protocol 則以框架無關的通信標準為定位,基于 OpenAPI v3 定義統一接口,精準執行智能體生命周期的核心操作,如啟動、停止和監控。它引入運行、線程和存儲等核心抽象概念,助力開發者高效編排異構智能體,推動多智能體環境的互操作性、可擴展性和操作透明性邁向新高度。
智能體協議的評估與比較
評估維度
評估智能體協議就像是對一個復雜機器進行多維度的精準測量,涉及眾多關鍵維度。
效率方面,重點關注吞吐量、延遲、資源利用率等指標。這就像是考察一個快遞系統的效率,吞吐量就像是快遞員一天能送多少包裹;延遲就像是包裹從發貨到收貨需要多長時間;資源利用率則像是快遞員在送包裹過程中對車輛、時間等資源的利用情況。在多智能體和智能體 - 工具交互中,這些指標直接決定了通信的速度和資源消耗。例如,在一個高頻交易場景中,智能體需要快速獲取市場數據并作出決策,高吞吐量和低延遲的協議能夠確保交易的及時性和準確性。
可擴展性涵蓋節點可擴展性、鏈接可擴展性和能力協商。這就像是考察一個城市的交通系統能否適應人口增長和車輛增加。節點可擴展性就像是看這個系統能否容納更多的車輛(智能體);鏈接可擴展性則是看道路上的車道(通信鏈接)能否隨著交通流量增加而擴展;能力協商就像是車輛之間能否根據路況實時調整行駛速度和路線。在智能體數量不斷增長、通信密度不斷增加的場景下,這些指標決定了系統能否平穩運行。
安全性維度則聚焦認證模式多樣性、角色 / ACL 顆粒度和上下文脫敏機制。這就像是考察一個保險箱的安全性,認證模式多樣性就像是保險箱有多種開鎖方式,確保只有授權人員能打開;角色 / ACL 顆粒度就像是保險箱內部對不同物品的訪問權限設置得非常細致,誰能看到、誰能拿走都一清二楚;上下文脫敏機制則是在信息傳遞過程中,對敏感信息進行遮蓋或替換,就像在寄送重要文件時,把上面的機密部分用黑筆涂掉,確保信息安全。
可靠性通過丟包重傳、流量和擁塞控制以及持久連接等機制來保障。這就像是在考察一個電力系統是否穩定,丟包重傳就像是電力系統在出現短暫故障后能自動恢復供電;流量和擁塞控制就像是電力系統能根據用電需求自動調節發電量,避免過載;持久連接則像是電力系統的持續供電能力,確保智能體之間的通信不會輕易中斷。
可擴展性強調向后兼容、靈活性與適應性以及定制與擴展能力。這就像是考察一個軟件是否能隨著用戶需求的變化而不斷升級,向后兼容就像是新版本的軟件還能支持舊版本的文件格式;靈活性與適應性則是看軟件能否適應不同的操作系統和硬件設備;定制與擴展能力則是看用戶能否根據自己的需求對軟件進行個性化設置。
可操作性涉及協議棧代碼量、部署與配置復雜性以及可觀測性。這就像是考察一個機器的操作難度,協議棧代碼量就像是機器的零部件數量,零部件越少,機器越容易操作;部署與配置復雜性則是看機器的說明書是否簡單易懂,安裝是否方便;可觀測性就像是機器自帶的監控系統,能實時顯示機器的運行狀態,方便用戶進行維護。
互操作性聚焦跨系統跨瀏覽器兼容性和跨網絡跨平臺適應性。這就像是考察一個移動應用是否能在不同品牌的手機、不同的操作系統上正常運行,跨系統跨瀏覽器兼容性就像是應用在安卓和蘋果手機上都能流暢使用;跨網絡跨平臺適應性則是看應用在 4G、5G、Wi-Fi 等不同網絡環境下,以及在手機、平板、電腦等不同平臺上都能穩定運行,確保智能體在不同環境下的無縫通信。
比較分析
在實際應用場景中,不同智能體協議展現出各自獨特的優勢與局限性。比如,在需要頻繁交互、對延遲敏感的場景下,像 MCP 這樣的協議憑借高效的通信機制脫穎而出。MCP 通過解耦工具調用和 LLM 響應,讓智能體在獲取外部資源時更加靈活高效。而且它的架構設計簡潔明了,主機、客戶端、服務器和資源各司其職,信息流動清晰有序,就像一個訓練有素的團隊,成員之間配合默契,能夠快速完成任務。
但在安全性要求極高的環境中,像 ANP 這樣的協議則更受青睞。ANP 引入去中心化身份認證機制,利用 W3C DID 標準為智能體賦予獨特的身份標識,這就像是給每個智能體都發放了一張獨一無二的身份證,只有經過嚴格驗證的智能體才能加入協作網絡。而且它通過端到端加密技術,確保智能體之間的通信內容不被竊取或篡改,為智能體的交互筑起一道堅不可摧的安全防線。
通過對這些協議在關鍵維度上的深入比較分析,我們能為智能體協議的選擇提供有力依據。就好比在挑選工具時,不同的工作需要不同的工具,我們只有了解每種工具的特點,才能找到最適合特定應用場景的那一個,充分發揮智能體協議的效能。
不同交互方式的特性比較。
交互方式 | API | GUI | XML | 智能體協議 |
場景 | 服務器間集成 | Computer /Mobile Use | Browser Use | 智能體交互 |
效率 | ?? | × | × | ?? |
操作范圍 | × | ? | ? | ?? |
標準化 | × | ? | × | ?? |
AI 親和性 | × | × | × | ?? |
流行智能體協議概覽。
實體 | 場景 | 協議 | 提出者 | 應用場景 | 關鍵技術 | 開發階段 |
Context-Oriented | General-Purpose | MCP | Anthropic (2024) | 連接智能體和資源 | RPC, OAuth | 事實標準 |
Domain-Specific | agents.json | WildCardAI (2025) | 為智能體提供網站信息 | 無 | 草稿 | |
Inter-Agent | General-Purpose | ANP | Chang (2024) | 智能體互聯網中的智能體間通信 | JSON-LD, DID | 已發布 |
A2A | Google (2025) | 企業內智能體間協作 | RPC, OAuth | 已發布 | ||
AITP | NEAR (2025) | 智能體間的通信和價值交換 | 區塊鏈, HTTP | 草稿 | ||
AComP | AI and Data (2025) | 多智能體系統通信 | OpenAPI | 草稿 | ||
Agora | Marro et al. (2024) | 智能體間的元協議 | 協議文檔 | 概念 | ||
Domain-Specific | LMOS | Eclipse (2025) | 物聯網和智能體 | WOT, DID | 已發布 | |
Agent Protocol | AI Engineer Foundation (2025) | 控制器 - 智能體交互 | RESTful API | 已發布 | ||
LOKA | Ranjan et al. (2025) | 去中心化智能體系統 | DECP | 概念 | ||
PXP | Srinivasan et al. (2024) | 人 - 智能體交互 | 無 | 概念 | ||
CrowdES | Bae et al. (2025) | 機器人 - 智能體交互 | 無 | 概念 | ||
SPPs | G?sieniec et al. (2024) | 機器人 - 智能體交互 | 無 | 概念 |
不同協議在實際場景中的應用
場景描述
以規劃從北京到紐約的五天行程為例。這個任務要求智能體協調航班、酒店、天氣等多方面信息,生成一份詳細的旅行計劃。在這個過程中,智能體需要與多個外部服務進行交互,包括航班查詢、酒店預訂和天氣信息獲取等。這就像是一個復雜的拼圖游戲,智能體需要把分散在不同地方的信息碎片拼湊起來,形成一幅完整的旅行藍圖。
協議應用分析
- MCP :采用 MCP 協議時,架構呈現出以單個智能體為核心的星型模式。MCP Travel Client 作為核心智能體,直接調用航班服務器、酒店服務器和天氣服務器,獲取所需信息并生成旅行計劃。這種架構的優勢在于簡單性和易于控制。就好比一個項目經理全權負責一個項目的各個環節,他可以直接指揮各個部門,快速整合資源,生成項目方案。但缺點是缺乏靈活性,核心智能體需要對所有服務及其接口了如指掌,這就像是項目經理必須對每個部門的工作流程和工具都非常熟悉,一旦有新的服務或接口發生變化,他就需要花費大量時間去學習和適應。而且所有通信都必須經過它,容易形成性能瓶頸,就像項目經理如果同時處理太多任務,可能會因為精力有限而影響整個項目的進度。
- A2A :在 A2A 協議下,智能體被組織成邏輯部門,如交通、住宿和活動。每個智能體都有明確的依賴關系,例如航班智能體和活動智能體依賴天氣智能體提供環境數據。智能體之間可以直接通信,無需中央協調器介入每一次交互。這就像是一個分工明確的團隊,每個成員都有自己的專長和職責,他們可以根據需要直接與其他成員溝通協作。比如,航班智能體如果需要天氣信息,它可以隨時向天氣智能體發送請求,而不需要通過團隊領導的批準。這種架構在企業環境中更為靈活,允許服務在需要時建立直接連接,減少不必要的通信開銷,支持更復雜的協作模式。就好比團隊成員之間建立了高效的溝通渠道,能夠快速響應各種突發情況,提高整個團隊的工作效率。
- ANP :ANP 協議跨越組織邊界,通過標準化的跨域交互實現智能體間的協作。航空公司的航班智能體、酒店智能體和天氣網站的天氣智能體分別位于不同的組織邊界內。跨域協作通過正式的協議請求和響應進行。這就像是不同公司之間的合作,每個公司都有自己的規則和流程,但通過簽訂合作協議,它們可以實現資源共享和優勢互補。例如,航班智能體跨域與天氣智能體協商,這就像是航空公司與氣象服務公司簽訂了一份數據共享協議,雙方按照協議的規定進行數據交換。這種協議適用于涉及多個組織的場景,每個實體遵循清晰的數據交換協議,特別適合跨組織協作,確保數據安全和業務利益。就好比在國際商業合作中,各方都遵循嚴格的合同條款,保障自己的權益的同時,也能實現合作共贏。
- Agora :Agora 協議從用戶角度出發,將自然語言請求轉化為標準化協議。首先對用戶請求進行自然語言理解,解析出起點、終點、持續時間、預算等結構化組件。這就像是一個翻譯官,把用戶的日常語言轉化為智能體能夠理解的精確指令。然后生成針對不同類型服務的正式協議,分發給專門的智能體(如航班、酒店、天氣、預算智能體)。每個智能體根據特定協議進行響應。這就像是把一個復雜的任務分解成多個子任務,分配給不同的專業人員處理。Agora 的三層流程(理解、生成、分發)創建了一個高度適應性的系統,將復雜的問題分解為特定領域的解決方案,使專門的智能體能夠專注于各自的核心任務。就好比在一個大型項目中,項目管理團隊先把項目分解成多個模塊,然后分配給不同的專業團隊負責,每個團隊只需專注于自己的模塊,從而提高整個項目的效率和質量。
如下圖是,四種協議在相同用戶指令“Plan a five-day trip from Beijing to New York.”下的用例分析





四種協議在相同用戶指令下的用例分析
智能體協議的學術展望
短期展望:從靜態到可演進
短期內,智能體協議的發展將聚焦于評估和基準測試。我們需要設計一套全面的評估框架,不僅考量任務的成功率,還將通信效率、環境變化適應性、可擴展性等因素納入評估體系。這就像是為智能體協議制定一套詳細的評分標準,從多個角度來衡量它的優劣。
同時,隱私保護協議將受到更多關注。研究如何在敏感領域實現安全、保密的通信,通過授權機制和類似聯邦學習的方法,讓智能體在保護隱私的前提下協作。這就像是為智能體的交流設立了一個 “隱私保護罩”,確保敏感信息不會泄露出去。
此外,智能體網格協議的概念應運而生,目的是應對智能體數量和復雜性的增加,提高智能體群體通信的效率和協調性。這就像是為智能體構建一個高效的交通網絡,讓它們能夠在復雜的環境中快速、有序地交流。
最后,可演進協議將成為研究熱點。這就像是把協議變成一個有生命的實體,讓它能夠根據任務需求動態調整,成為智能體動態、模塊化和可學習的組成部分。想象一下,智能體可以根據不同的任務場景,自動選擇最適合的協議模塊,就像我們人類根據不同的社交場合,選擇合適的語言和行為方式一樣。
中期展望:從規則到生態系統
中期來看,將協議內容和結構集成到大型語言模型的參數中具有重要意義。盡管這種方法在適應性方面存在局限性,但對模型提供商而言具有戰略意義。這就像是把交通規則直接寫進汽車的導航系統,讓汽車能夠自動按照規則行駛,無需駕駛員時刻提醒。
分層協議架構將成為發展趨勢。借鑒經典網絡協議設計思路,將低層傳輸和同步機制與高層語義和任務相關交互分離,提高異構智能體間的模塊化和可擴展性。這就像是把一座大樓的結構分成不同的層次,每一層都有自己的功能和職責,讓整個大樓更加穩固、靈活。
而且,分層協議架構為動態協議組合奠定基礎,使智能體能夠根據上下文協商或自動選擇適合的交互層。這就像是智能體在不同的社交場合,能夠根據情況自動調整自己的交流方式,適應混合人 - AI 環境中不斷變化的規范、偏好和目標。
同時,在高層集成倫理、法律和社會約束,使智能體行為與更廣泛的社會價值觀保持一致。這就像是給智能體的行為設立了一個道德和法律的框架,確保它們的行動不會違背人類社會的基本準則。
長期展望:從協議到智能基礎設施
長期而言,研究重點將轉向大規模、互聯智能體群體中集體智能的涌現。探索智能體和環境的規模法則,即群體規模、通信拓撲和協議配置如何共同塑造系統級行為、涌現特性和魯棒性。這就像是研究一個龐大的生態系統,看看其中的生物如何相互作用,形成穩定的生態系統。
同時,智能體數據網絡(ADN)有望成為現實,這是一種專為自主智能體通信和協調優化的基礎數據基礎設施。與傳統網絡相比,ADN 更側重于機器中心的數據表示,以滿足智能體的持續狀態同步、長期規劃和異步協作等需求。這就像是為智能體構建一個專屬的高速公路,讓它們能夠快速、高效地交流和協作,推動分布式、集體智能的新紀元,重塑智能共享、協調和放大的方式
下表是不同智能體間協議的比較。評估時間為 2025 年 4 月。
智能體間協議 | 核心問題 | 應用場景 | 關鍵技術 | 開發階段 |
ANP | 跨域智能體通信 | 智能體互聯網中的智能體間通信 | JSON-LD, DID | 已發布 |
A2A | 企業內復雜問題解決 | 企業內智能體協作 | RPC, OAuth | 已發布 |
AITP | 智能體間通信和價值交換 | 智能體安全交易和交互 | 區塊鏈, HTTP | 草稿 |
AConP | 標準化智能體接口調用和配置 | 本地網絡中的智能體 | OpenAPI, JSON | 草稿 |
AComP | 標準化實用、有價值的通信特性 | 本地網絡中的智能體 | OpenAPI | 草稿 |
下表是從不同維度對協議評估的概述。
維度 | 描述 | 關鍵指標 |
效率 | 快速、高效的通信。 | ? 延遲 |
可擴展性 | 隨著工具/智能體/網絡復雜性增加,性能保持穩定。 | ? 節點可擴展性 |
安全性 | 通過認證、訪問控制和數據保護,實現可信交互。 | ? 認證模式多樣性 |
可靠性 | 確保智能體間通信的穩定、準確和容錯。 | ? 丟包重傳 |
可擴展性 | 適應新功能和技術創新,無需破壞現有系統或兼容性。 | ? 向后兼容 |
可操作性 | 協議易于實施、管理和集成。 | ? 協議棧代碼量 |
互操作性 | 跨不同平臺、系統和網絡環境實現無縫通信和協作。 | ?跨系統和瀏覽器兼容性 |
總結與感受
本文深入剖析了現有 AI 智能體協議,涵蓋協議的分類、評估、應用場景等多個方面。從智能體協議的定義與價值,到各類協議的詳細解讀;從評估與比較的關鍵維度,到實際場景中的應用;再到未來發展的學術展望,我們全方位展示了智能體協議的豐富內涵與廣闊前景。
智能體協議的發展對于智能體技術的未來走向具有深遠意義。它將打破智能體與工具之間的隔閡,實現動態聯盟與知識共享,讓智能體能夠在共同進化中不斷提升能力。未來智能體通信標準有望開啟一個全新的分布式、集體智能時代,這不僅將極大地推動智能體技術的進步,還將為解決日益復雜的現實問題提供強大的技術支持,其影響力將滲透到社會的每一個角落,改變我們的生活方式與工作模式。
我相信,隨著智能體協議的不斷發展和完善,智能體將在更多領域發揮重要作用,為我們的生活帶來更多的便利和驚喜。




























