企業AI Agent如此困難的真正原因并不是人工智能

演示讓AIAgent看起來毫不費力。但真正的痛苦始于演示之后,當 AI 代理、工作流程、遺留系統和評估開始發揮作用時。
為什么現在這很重要
智能助理隨處可見。演示視頻充斥著各大流行媒體。供應商承諾推出“自動輔助駕駛”,讓你在喝拿鐵咖啡的同時就能管理你的整個部門。而且,說實話,這些原型相當不錯。
但如果你曾經嘗試過從幻燈片到實際生產,你就會知道:人工智能并非最難的部分。模型正在快速改進,調用 API 也并非火箭科學。真正的障礙來自更古老、更復雜、更深刻的人性。
當企業在代理上遇到阻礙時,他們會遇到以下困境:
- 到處都能看到AIAgent(這不該是AI的事)。
- 定義什么應該自動化(工作流程清晰)。
- 與現有系統(遺留系統和 API)集成。
- 證明其可靠運行(評估和監控)。
讓我們來分析一下。
真正困難的是什么
架構、框架、內存、多模態和實時性都很重要。這些都很重要!但與三大難題相比,這些都是可以解決的工程問題。
混亂源于人員、流程和老舊基礎設施的協調。這正是企業項目成敗的關鍵所在。
障礙#1 — 隨處可見的Agent(不該做的事)
首先,有一件事值得大聲說出來:你不需要到處都使用 Agentic 系統。事實上,許多企業問題可以用更簡單、更穩固的方法更好地解決:
- 經典代碼——如果流程重復且定義明確,則腳本或服務將比代理運行得更快、更便宜、更可靠。
- 傳統機器學習——當任務是關于結構化數據的預測時,回歸或分類器通常優于推理循環。
- 圖形界面和工作流引擎——有時真正需要的是清晰度和可用性;在 UI 中映射流程可以解決的不僅僅是增加自主性。
- 簡單的 LLM 調用——在很多情況下,幾個精心提示的 API 調用即可提供所需的所有“智能”,而無需編排開銷。
代理最適合處理那些復雜、多步驟、動態的工作流程,因為靈活性至關重要。對于其他所有情況,選擇合適的工具來完成任務可以避免額外的成本、脆弱性和集成難題。
障礙#2——工作流程定義(內容)
事實是:企業很少有清晰的工作流程。
流程存在于人們的頭腦中。異常會不斷累積。合規性會增加隱藏的步驟。當你問“客服人員到底應該處理什么?”時,你已經陷入了永無止境的會議、過時的規范以及諸如“哦,但對于客戶 X,我們的做法不同”之類的旁白之中。
這就是為什么工作流程現代化是首要的:
- 與企業坐在一起,繪制工作流程圖,詳細說明采取的每個行動、由誰執行以及手動程度如何。
- 闡明什么可以實現自動化、如何實現自動化,并非所有事物都需要 Agentic、什么仍保持人性化以及它們如何相互關聯。
- 記錄混亂的現實,展示工作流程并進行驗證。
如果沒有這些基礎工作,您的代理人將會:
- 把錯誤的事情自動化。
- 使一半的事情自動化并停滯。
- 或者被那些本應幫助的人悄悄忽視。
障礙#3 — 與現有系統的集成(方法)
一旦您知道要自動化什么,您就會面臨第三個障礙:集成到已經存在的系統。
- 更糟糕的是——大多數系統在設計時根本沒有考慮過代理。很多系統甚至在設計時都沒有考慮過 API。
- 需要脆弱連接器的傳統 ERP。
- 具有半記錄端點的CRM 或票務系統。
- 十年前用框架編寫的內部應用程序現在已無人再觸及。
- 身份驗證方案、基于角色的訪問、合規性限制。
- 后端系統的工作流程非常復雜,您需要 3 天的時間才能了解它的用途。
集成不僅僅是“連接到 API”。它還涉及數十年的技術債務、所有權孤島和脆弱的依賴關系。
這就是為什么一個在全新應用棧上順利運行的演示代理在現實世界中突然崩潰的原因。它必須與多年來不斷打補丁和定制的系統進行通信。
在企業現實中,集成等于:
- 查找遺留系統工作流程及其使用方法。
- 讓系統專家來幫助我們(他們沒有時間!)
- 在新舊數據格式之間進行轉換。
- 處理速率限制和可靠性問題。
- 與 IT/安全團隊協商訪問權限(有時是最困難的部分)。
直到越過這個障礙,代理才會停止,停留在原型循環中。
障礙#4 — 評估(證明)
即使您確定了工作流程并成功完成集成,您仍會遇到第四個問題:您如何知道它有效?
代理中的評估是出了名的不順利:
- 任務級指標:代理是否按照定義完成了工作流程?完成率是多少?誤報率是多少?
- 代理級指標:代理是否遵循工作流程并生成了正確的計劃?我們是否捕獲了所有流程中的錯誤并將其轉交給人工處理?
- 業務指標:它是否節省了時間、降低了成本或提高了準確性?
- 安全指標:它是否避免了幻覺、違反政策、違反合規性,并且基本上沒有做我們不希望它做的事情?
通常的機器學習技巧在基準數據集上提高準確率并不能解決問題。每個企業都有獨特的需求。
這里的實用模式包括:
- 評估數據集:精心挑選的輸入以及預期的代理規劃和輸出。
- 真正的代理評估:不僅評估結果,還評估代理計劃和授權。
- 影子模式:代理在完全控制人類之前與人類一起奔跑。
- 持續監控:跟蹤一段時間內的漂移、性能和回歸。
如果沒有嚴格評估,代理要么在演示中看起來很神奇,但在生產中卻悄無聲息地失敗,或者更糟的是,他們會在無人注意的情況下破壞一些關鍵的東西。
結論——為什么AI代理在企業中會失敗
讓我們回顧一下。
企業代理最難的部分不是人工智能本身,而是:
- 代理幻影(不該做的事):在沒有必要的地方隨處看到代理。
- 清晰度(什么):定義業務工作流程,在需要的地方進行現代化。
- 集成(方法):插入遺留系統、脆弱的 API 和數十年的技術債務。
- 評估(證明):不斷評估代理以建立信任。
忽略這些,你的“自主輔助駕駛”就會一直困在原型的煉獄里。擁抱這些,你就能把人工智能從光鮮亮麗的演示變成企業級資產。
教訓是什么?不要把代理的采用視為一個人工智能項目,而要將其視為一個工作流程+集成現代化項目,從第一天起就內置評估。
























