Manus蝴蝶效應與AI智能體泡沫 原創
Manus是蝴蝶效應公司(Butterfly Effect)推出的全球首款通用型AI智能體產品,其名稱源自拉丁語“Mens et Manus”(意為“手腦并用”),強調將思考轉化為實際行動的能力;近期,該公司因投資方壓力撤離中國,引發廣泛關注。
2025年AI Agent賽道涌現大量同類產品,但多數存在"Demo能飛、落地常摔"的現象。用戶試用一次即放棄的比例居高不下,市場存在過度炒作現象。例如,內測邀請碼曾被炒至數萬元高價,但團隊否認參與炒作。
Manus作為一款引起轟動效應的通用型AI智能體(AI Agent),定位為“數字員工”,旨在通過自主規劃、執行和驗證任務,替代人類完成復雜工作。Manus的多代理架構與Anthropic的"Computer Use"技術相似,其"自主規劃"功能可能僅基于現有大模型的調用(如GPT-4),而非底層技術突破。其核心功能包括:
- ?多任務處理能力?:理解復雜指令并跨領域協同,例如自動生成PPT、篩選簡歷、分析股票數據或規劃旅行行程,全程無需人工干預。?
- ?技術架構?:采用“規劃-執行-驗證”三模塊多智能體系統:
- 規劃代理:拆解任務步驟(如將“商業策劃”分解為市場調研、預算規劃等)。
- 執行代理:調用工具鏈(如瀏覽器、代碼編輯器)完成子任務。
- 驗證代理:交叉核驗結果準確性,確保交付完整成果。?
- ?性能表現?:在GAIA基準測試(評估通用AI助手解決真實世界問題能力)中創下新紀錄,復雜項目首次完成率達78%,遠超同類產品。?
第一階段:入門 - 智能體是什么?
這個階段的目標是建立對智能體的直觀認知,理解其核心組成部分。
1. 核心定義:超越簡單聊天機器人
- 簡單比喻:如果一個大型語言模型是一個擁有豐富知識和強大邏輯的大腦,那么一個智能體就是一個擁有這個大腦,并具備了感知、規劃、記憶和使用工具的完整機器人。
- 官方定義:AI智能體是一個能夠感知環境、進行推理、制定決策并執行行動以實現特定目標的自治系統。
2. 智能體的“靈魂”四要素:這是理解任何智能體的框架,缺一不可。
- 規劃:核心能力。智能體不是一步一步被指揮,而是能自主拆解復雜目標。例如,目標不是“回答這個問題”,而是“為公司寫一份季度市場報告”。智能體會自己規劃出:1. 搜集最新市場數據 2. 分析競爭對手動態 3. 總結用戶反饋 4. 撰寫報告草稿 5. 潤色格式。
- 工具使用:關鍵能力。智能體可以調用外部工具來擴展能力邊界。這包括:
a.搜索工具: 獲取實時信息。
b.代碼解釋器: 進行數學計算、數據分析。
c.API調用: 發送郵件、操作數據庫、控制智能家居。
- 記憶:智能體擁有短期記憶(當前任務的上下文)和長期記憶(存儲用戶偏好、歷史交互記錄、學到的知識),從而實現個性化的、連貫的持續服務。
- 行動:將規劃好的步驟,通過調用工具,一步步執行出來,并觀察結果,動態調整計劃。
3. 一個經典例子:
- 任務:“幫我預訂下周二從北京到上海的最便宜的非紅眼航班,并選一個靠窗的座位?!?/li>
- 簡單ChatGPT:可能會給你一些建議和航空公司網站鏈接。
- AI智能體:
- 規劃:分解為:查詢航班 -> 比價 -> 選擇航班 -> 模擬選座 -> 完成預訂。
- 工具使用:調用航班搜索API -> 調用航空公司選座API -> 調用支付系統(如果授權)。
- 記憶:記住你的偏好(“最便宜”、“非紅眼”、“靠窗”)。
- 行動:執行上述所有步驟,最后告訴你:“已為您預訂國航CA123,票價¥680,座位32A,靠窗?!?/li>
第二階段:進階 - 智能體的類型、技術棧與架構
這個階段的目標是了解智能體的不同形態和背后的技術原理。
1. 智能體的分類:
- 按反應程度分:
a.反射式智能體: 基于當前狀態直接做出反應(如IF-THEN規則),無長期規劃。
b.模型式智能體: 維護一個內部世界模型,能預測行動后果。
c.目標型智能體: 圍繞特定目標進行規劃和行動(當前主流)。
d.效用型智能體: 在多個目標中做出最優選擇,追求“滿意度”最大化。
- 按應用場景分:
a.單智能體: 獨立完成任務。
b.多智能體系統: 多個智能體協作(如一個負責設計,一個負責編碼,一個負責測試)或競爭,模擬社會行為。
c.模擬智能體: 在虛擬環境中扮演角色,用于游戲、社會科學仿真等。
2. 核心工作流與架構:一個典型的智能體工作流是一個循環(Reasoning Loop):感知 -> 規劃 -> 行動 -> 觀察 -> 再規劃...
- 規劃技術:
a.思維鏈: 讓模型一步步推理。
b.思維樹: 在關鍵決策點探索多種可能性路徑。
c.思維圖: 更復雜的,將想法、步驟和結果構建成圖,允許回溯和跳躍。
- 關鍵技術棧:
a.大腦: 強大的LLM(如GPT-4, Claude 3, Llama 3)。
b.框架: LangChain, LlamaIndex, AutoGen, CrewAI 等,它們提供了構建智能體的標準化工具和模塊。
c.工具: 函數調用,讓LLM能可靠地觸發外部代碼。
d.記憶: 向量數據庫,用于存儲和檢索長期記憶。
第三階段:精通 - 構建、優化與未來
這個階段面向開發者和深度愛好者,涉及如何親手構建和優化智能體,并洞察其未來。
1. 從0到1構建一個智能體:
- 第一步:定義目標。目標必須清晰、可衡量。例如:“一個能自動分析我Notion知識庫并撰寫周報的智能體”。
- 第二步:選擇工具。它需要哪些能力?讀取Notion API?搜索網絡?生成文本?
- 第三步:設計工作流。它是先搜索再總結,還是先總結再搜索驗證?
- 第四步:選擇技術棧。使用LangChain還是AutoGen?使用哪個LLM?記憶存儲在哪里?
- 第五步:實現與迭代。編寫代碼,進行大量測試,處理各種邊界情況(如工具調用失敗、網絡錯誤等)。
2. 核心挑戰與優化策略:
- 可靠性問題:智能體可能會“胡編亂造”工具的參數或結果。
對策: 嚴格的提示工程、為工具提供清晰的定義和示例、設置驗證步驟。
- 效率與成本:復雜的規劃需要多次調用LLM,成本高且速度慢。
對策: 使用更小、更專精的模型處理簡單任務,優化工作流,減少不必要的步驟。
- “無限循環”風險:智能體可能在某個步驟卡住,不斷重復失敗的操作。
對策: 設置最大重試次數和超時機制,引入人工監督點。
- 安全性:智能體被惡意引導或工具被濫用。
對策: 對工具權限進行嚴格管控,對用戶輸入進行安全過濾。
3. 未來展望與前沿趨勢:
- 自主智能體:能夠長期運行、自我學習和進化的智能體(如AutoGPT的愿景)。
- 具身智能:智能體與物理機器人結合,在真實世界中執行任務。
- 超級智能體:由多個專家智能體組成的“董事會”或“公司”,協同解決極其復雜的問題。
- Agent-as-a-Service:未來我們可能像調用API一樣,調用各種專業能力的智能體服務。
Manus的技術理念強調“更少的結構、更多的智能”(less structure more intelligence),主張通過優質數據、強大模型和靈活架構自然涌現能力,而非預設功能。Manus的發布推動AI智能體賽道爆發,同期涌現智譜AutoGLM、字節扣子空間等競品,并帶動A股AI概念股上漲。?
從將AI智能體理解為 “會使用工具的AI”(入門),到理解其架構、工作流和技術棧(進階),再到能夠親手構建并解決其核心挑戰(精通),這條路徑清晰地勾勒出了掌握這一變革性技術的全過程。
AI智能體指能夠理解復雜指令、使用工具(如操作瀏覽器、調用API)、執行多步驟任務以實現目標的AI系統。它是當前AI創業和投資最火熱的方向,這也導致了泡沫的形成。
- 資本狂熱:巨大的想象空間(“取代白領工作”、“自動駕駛公司”)吸引了海量投資。
- 門檻降低:GPT等模型的出現,讓構建一個“看起來”很智能的Demo變得異常簡單。
- 同質化競爭:無數創業公司都在做類似的“客服智能體”、“寫作智能體”、“數據分析智能體”,技術護城河不深。
- 落地難題:演示很酷,但達到穩定、可靠、能真正創造商業價值的“生產級”智能體非常困難。幻覺問題、成本問題、流程斷裂問題比比皆是。
這個“泡沫”會持續多久?
這是一個動態過程,我們可以將其分為幾個階段來看:
第一階段:狂熱膨脹期(現在 - 未來1-2年)
- 特征:我們現在正處在這個階段的頂峰或中后期。
a.資本持續涌入,故事一個比一個講得好。
b.新的AI智能體創業公司層出不窮,估值居高不下。
c.“Manus蝴蝶效應”頻繁發生,開發者們一邊抱怨,一邊不得不緊跟巨頭的步伐。
- 驅動力:技術突破帶來的無限遐想和FOMO(錯失恐懼癥)。
第二階段:擠壓與分化期(未來2-3年)
- 特征:泡沫開始被擠壓,這是最關鍵的時刻。
a.資本降溫:投資者開始要求看到真實的營收和用戶增長,而不僅僅是用戶數量。許多只會燒錢、無法盈利的項目將融不到下一輪資金。
b.大規模倒閉與并購:大量同質化、技術實力弱、產品找不到市場的初創公司會倒閉。巨頭和幸存下來的頭部公司會進行低價并購。
c.價值顯現:真正有技術壁壘(如在特定領域有精調模型、有獨特數據、有穩健工作流)、能解決實際痛點、并擁有清晰商業模式的公司會脫穎而出,價值變得更加堅實。
d.底層平臺開始穩定:為了建立更健康的生態,“Manus”們會開始提供更穩定、版本管理更清晰的API服務,因為它們的利益也依賴于一個繁榮的應用生態。
第三階段:理性發展與應用深化期(3年后及更遠)
- 特征:“泡沫”成分基本擠出,行業進入健康發展階段。
a.基礎設施化:AI智能體技術像今天的云計算、數據庫一樣,成為企業軟件的標配組件,而不再是一個吸引眼球的“概念”。
b.垂直領域深耕:通用的、萬金油式的智能體減少,在醫療、法律、金融、教育等特定領域深度集成、高度專業的智能體成為主流。
c.商業模式成熟:SaaS訂閱、按次收費、價值分成等模式變得清晰和可規?;?。
d.“蝴蝶效應”減弱:一方面底層模型迭代速度可能放緩;另一方面,應用層學會了通過抽象層、多模型策略等方式來規避單點依賴風險。
結論與展望
- “泡沫”不會瞬間破滅,而是會緩慢泄氣:它不會像2000年互聯網泡沫那樣以戲劇性的方式崩潰,因為AI技術確實有堅實的生產力和創造力價值基礎。更可能的過程是“擠泡沫”,即淘汰掉濫竽充數者,讓真正的強者生存。
- “蝴蝶效應”與“泡沫”是共生關系:底層模型快速迭代的“蝴蝶效應”既是泡沫的催化劑(提供了創新的土壤),也是泡沫的擠壓器(頻繁的變化淘汰了適應能力弱的玩家)。當泡沫被擠壓后,生態會找到共處的方式,“蝴蝶效應”的影響會相對減小。
- 持續時間預測:整個“擠泡沫”和行業分化的過程,大概需要2到4年時間。到2028年左右,我們可能會看到一個更加理性、穩固和強大的AI應用市場格局。屆時,AI智能體將不再是“泡沫”,而是像今天的移動互聯網應用一樣,是數字經濟中堅實的一部分。
AI智能體正將大語言模型從一個“百科全書式的大腦”轉變為一個可以進入數字世界和物理世界、并為我們實際干活的“數字員工”。這不僅是技術的演進,更是人機交互范式的一次根本性革命。我們正處在一次技術革命浪潮的早期狂熱階段?;靵y、依賴、泡沫都是這個階段的典型特征,它不會永久持續,但它的終結不是AI的終結,而是AI真正開始深度融入并改造各行各業的新起點。
本文轉載自??數智飛輪?? 作者:天涯咫尺TGH

















