讓大模型指哪打哪的Multi-Agent路由新范式

PaperAgent

發(fā)布于 2025-11-19 00:45

瀏覽

0收藏

隨著Model Context Protocol（MCP）生態(tài)的興起，一個(gè)Assistant背后可能掛著數(shù)百個(gè)工具/子Agent。

把全部工具描述塞進(jìn)Prompt？→ 4 600+ tokens起步，貴到肉痛。
先選Agent再選工具？→ 粗粒度描述經(jīng)常把“隱藏的寶藏工具”埋沒。
只拿單工具？→ 多步任務(wù)需要的一組工具被活生生拆散。

作者用一張圖點(diǎn)破痛點(diǎn)：

讓大模型指哪打哪的Multi-Agent路由新范式-AI.x社區(qū)

圖1：傳統(tǒng)“僅Agent”檢索（左）vs. Tool-to-Agent統(tǒng)一檢索（右）

核心思想：把“工具”和“Agent”拉進(jìn)同一個(gè)向量空間

Tool-to-Agent Retrieval（T2A） = 統(tǒng)一向量索引 + 元數(shù)據(jù)跳轉(zhuǎn)

建一張二分圖：Agent ? 擁有的工具
用同一套編碼器把Agent描述 & 工具描述都embed進(jìn)去
檢索時(shí)先拿Top-N（工具+Agent），再通過(guò)??owner(·)??映射回唯一Agent集合
最終返回Top-K Agent，即可單步完成“選工具 or 選Agent”決策

算法偽代碼一覽：

讓大模型指哪打哪的Multi-Agent路由新范式-AI.x社區(qū)

Algorithm 1：Combined Tool–Agent Top-K Retrieval

實(shí)驗(yàn)設(shè)計(jì)：8個(gè)編碼器 × 95條真實(shí)任務(wù) × 527個(gè)工具

數(shù)據(jù)集：LiveMCPBench

70個(gè)MCP Servers，527 tools，95條多輪用戶Query
每條Query人工標(biāo)注2.68步、2.82 tools、1.40 Agents

比較基線：

BM25
Q.Retrieval（dense）
ScaleMCP（2025 SOTA）
MCPZero（2025 SOTA）

評(píng)估指標(biāo)：Recall@K / mAP@K / nDCG@K，K∈{1,5,10}

結(jié)果速覽：指標(biāo)全面提升，最高+28%

讓大模型指哪打哪的Multi-Agent路由新范式-AI.x社區(qū)

Table 1：LiveMCPBench主指標(biāo)

再看8種embedding的穩(wěn)定性：

讓大模型指哪打哪的Multi-Agent路由新范式-AI.x社區(qū)

Table 2：逐模型對(duì)比（Recall@5）

Amazon Titan v2提升最猛：0.66 → 0.85（+28%）
即使是輕量All-MiniLM-L6也+13%，說(shuō)明改進(jìn)來(lái)自框架而非大模型

消融洞察：工具級(jí)信號(hào)到底帶來(lái)了什么？

在Top-5返回里，**39%直接命中Agent描述，34%**是通過(guò)工具→Agent映射召回→ 證明“工具細(xì)節(jié)”確實(shí)補(bǔ)足了Agent摘要遺漏的語(yǔ)義
Step-wise Querying（先分解再逐步檢索）比Direct Querying平均再+4–6 pts Recall
→ 復(fù)雜任務(wù)拆步檢索依舊有效

https://arxiv.org/pdf/2511.01854
Tool-to-Agent Retrieval: Bridging Tools and Agents for Scalable LLM Multi-Ag

本文轉(zhuǎn)載自??PaperAgent??

標(biāo)簽

Multi-Agent

大模型

LiveMCPBench

已于2025-11-19 10:42:58修改

贊

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

大模型微調(diào)新范式：當(dāng)LoRA遇見MoE

zhangyannni ? 5790瀏覽 ? 0回復(fù)
AI Agent：人類工作范式的顛覆者還是人機(jī)協(xié)作新范式？

Baihai_IDP ? 6657瀏覽 ? 0回復(fù)
多智能體（Multi-Agent）系統(tǒng)是怎么一回事？

探索AGI ? 5918瀏覽 ? 0回復(fù)
從工程師視角看 “Multi-Agent as a Service (MAaaS)”

Baihai_IDP ? 4058瀏覽 ? 0回復(fù)
Multi-Agent實(shí)現(xiàn)自動(dòng)爬蟲&生成圖譜報(bào)告

探索AGI ? 4728瀏覽 ? 0回復(fù)
超越CLIP，視覺大模型訓(xùn)練新范式？

kede96 ? 3641瀏覽 ? 0回復(fù)
NLP范式總結(jié) | 擁抱新范式

zhcs333 ? 3410瀏覽 ? 0回復(fù)
深入解析：ChatGPT與文心一言的異同，哪款A(yù)I助手更適合你？

風(fēng)云2002_1 ? 4150瀏覽 ? 0回復(fù)
WebWalker：通過(guò)Multi Agent提升RAG在開放域QA的性能

大語(yǔ)言模型論文跟蹤 ? 3476瀏覽 ? 0回復(fù)
推理模型+Multi-Agent，可能就是Deep Research的全貌！

探索AGI ? 4341瀏覽 ? 0回復(fù)
大模型通過(guò)Deep ReSearch駕馭Multi-Agent原理深度剖析

九歌AI大模型 ? 6384瀏覽 ? 0回復(fù)
三大AI智能體平臺(tái)深度對(duì)比：Dify、Coze、AWS AI Agent，哪款更適合你？

王吉偉自頻道 ? 1.4w瀏覽 ? 0回復(fù)
Search-R1：讓大模型學(xué)會(huì)“檢索+推理”的新范式

arnoldzhw ? 4164瀏覽 ? 0回復(fù)
“指哪改哪”！北交&美圖發(fā)布DCEdit：改圖不傷背景的終極方案

angel ? 2913瀏覽 ? 0回復(fù)
國(guó)內(nèi)首發(fā)：讓 Multi-Agent 開發(fā)效率飆升 10 倍的 LangGraph 模板來(lái)了

玄姐聊AGI ? 2837瀏覽 ? 0回復(fù)
從ReAct到Multi-Agent：LangGraph如何實(shí)現(xiàn)智能體間的無(wú)縫協(xié)作？

AI博物院 ? 3163瀏覽 ? 0回復(fù)
突破大模型訓(xùn)練瓶頸：騰訊團(tuán)隊(duì)提出RLPT新范式，讓模型從預(yù)訓(xùn)練數(shù)據(jù)中自我強(qiáng)化

柏企閱文 ? 2665瀏覽 ? 0回復(fù)
又有人來(lái)問(wèn)MOE和Dense模型到底差哪了？

熵減AI ? 1981瀏覽 ? 0回復(fù)
3 個(gè) Multi-Agent 系統(tǒng)，把 GPTBots 的多智能體協(xié)作玩明白了！

PaperAgent ? 315瀏覽 ? 0回復(fù)

PaperAgent

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

51CTO

51CTO博客

51CTO學(xué)堂

讓大模型指哪打哪的Multi-Agent路由新范式

核心思想：把“工具”和“Agent”拉進(jìn)同一個(gè)向量空間

實(shí)驗(yàn)設(shè)計(jì)：8個(gè)編碼器 × 95條真實(shí)任務(wù) × 527個(gè)工具

結(jié)果速覽：指標(biāo)全面提升，最高+28%

消融洞察：工具級(jí)信號(hào)到底帶來(lái)了什么？

目錄