微軟五大Agent聯(lián)手,這下厲害了!
近期,微軟推出了一款創(chuàng)新性的通用Multi-Agent框架——Magentic-One。這個開源項目致力于處理各類復雜的開放性任務,涵蓋范圍包括網(wǎng)絡瀏覽操作、本地文件管理、Python代碼編寫與執(zhí)行、市場研究分析以及學術(shù)論文撰寫等多個方面。
該框架由五個核心智能體構(gòu)成:總體協(xié)調(diào)的Orchestrator、負責網(wǎng)絡任務的WebSurfer、管理文件系統(tǒng)的FileSurfer、專注編程的Coder,以及處理終端操作的ComputerTerminal。在這個體系中,Orchestrator作為核心智能體,承擔著任務規(guī)劃、進度監(jiān)控和錯誤修正等重要職責。

從運作機制來看,Magentic-One采用了雙循環(huán)結(jié)構(gòu):外循環(huán)負責管理任務賬本,記錄事實、推測和計劃;內(nèi)循環(huán)則專注于進度賬本的維護,包括當前進度狀態(tài)和任務分配情況。

各智能體的具體職能如下:
- Orchestrator擔任總指揮角色,負責任務拆解、規(guī)劃和協(xié)調(diào)其他智能體
- WebSurfer專門處理基于Chromium的瀏覽器操作,能夠執(zhí)行網(wǎng)頁導航、交互和內(nèi)容解析
- FileSurfer主要負責Markdown格式的文件處理和目錄管理
- Coder著重于代碼編寫和信息分析
- ComputerTerminal提供控制臺訪問權(quán)限,支持程序執(zhí)行和庫安裝
在性能評測方面,Magentic-One在GAIA和AssistantBench等測試平臺上展現(xiàn)出與現(xiàn)有頂級方案相當?shù)谋憩F(xiàn),并在WebArena測試中取得了具有競爭力的成績。

- 官方博客:https://www.microsoft.com/en-us/research/articles/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/
- 項目地址:https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one
本文轉(zhuǎn)載自 ??探索AGI??,作者: 獼猴桃

















