國產MiroMind智能體框架,登頂全球預測未來大模型榜單
一個叫MiroMind的AI公司,在全球首個動態實時預測基準FutureX上拿了第一。

老板,是陳天橋。
就是那個創辦了盛大網絡,后來跑去做腦科學研究的陳天橋。從網游、到人腦、再到人工智能,這位大佬好像總在琢磨未來的事。
這“未來大考”是何方神圣?
真正的智能,不光要懂過去,還應該能看到未來。
于是,字節跳動SEED團隊,聯合了斯坦福大學、復旦大學和普林斯頓大學的一幫頂尖學者,搞了個叫FutureX的“考場”,專門考AI預測未來的能力。
可以說,Future-X是目前衡量AI預測能力最嚴格、最接近真實世界的一把尺子。連馬斯克(Elon Musk)都在他的社交平臺X上轉發了FutureX的榜單,還評論說,預測未來的能力,才是衡量智能的最佳標準。

陳天橋的AI,有何獨門絕技?
獲得如此成績,得益于MiroMind開源的高性能且經濟高效智能體框架MiroFlow v0.2。

作為MiroMind研究項目的關鍵組成部分,它能夠將任何大型語言模型升級至OpenAI深度研究級別的能力,專注于可靠完成復雜的工具使用任務,同時還具備開源可復現、高并發高可靠性以及部署成本低等優勢。
在 GAIA、HLE、xBench-DeepSearch 和 BrowserComp 等基準測試中,均取得了開源且可復現的頂尖成果。

不同于商業框架或部分開源的研究項目,該框架公布的每一項指標,都能通過公開代碼復現。
高并發與高可靠性是其重要亮點,框架采用強大的并發管理和容錯設計,能高效應對有速率限制的API以及不穩定的網絡環境,確保復雜任務軌跡的順暢收集與可靠執行。
成本效益顯著,依托開源的MiroThinker模型,僅用單塊RTX 4090顯卡就能運行研究智能體服務,且整個技術棧都基于免費開源工具。
MiroFlow v0.2分為前端和后端兩部分。前端是簡潔的 Gradio 界面,方便用戶操作與交互。后端則通過多工具協作(如網頁瀏覽器、Python 工具等)自動處理用戶查詢,完成多步驟網絡研究,全面分析大量在線資源,最終達成任務目標,具體流程包含五個關鍵環節。
首先是查詢增強,大型語言模型會對用戶輸入進行分析,明確用戶意圖并豐富查詢細節,從而更精準地理解用戶需求。其次是任務規劃,主智能體依據增強后的查詢內容制定詳細執行計劃,協調整個工作流程,涵蓋調用不同工具、為子智能體分配任務以及推動任務進展等。接著是子智能體委派,對于復雜或專業性強的任務,主智能體會將部分工作委派給具備相關專業知識的子智能體(如瀏覽智能體),這些子智能體可自主規劃和執行任務,并調用所需工具。然后是工具調用,當需要調用外部功能時,智能體會連接至 MCP(模型上下文協議)服務器,獲取并使用相應的專業工具。最后是結果合成,任務完成后,系統會整合多個信息來源的結果,保證輸出內容高質量,且符合用戶需求或預設格式。
FutureX上目前的榜單。

第一名是GPT-5,但別急,看后面的智能體框架,用的是MiroMind開發的MiroFlow Agent。
再看第四名。這個叫MiroThinker-72B-Preview的模型,同樣是MiroMind開發的。
MiroMind有能力駕馭全世界最頂尖的AI模型,并把它調教到極致。自己也有能力研發出世界一流的AI模型。
他們把自己奪冠用的“駕駛系統”——MiroFlow框架,以及自研的“發動機”——MiroThinker模型,都開源了。
AI世界出現了一個新的變量。
當大多數公司還在“生成”的賽道上內卷時,MiroMind已經悄悄地在“預測”這條更艱難、但可能也更有價值的賽道上跑出了身位。





























