精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

三個LLM頂一個OpenAI?2億條性能記錄加持,路由n個「小」模型逆襲

人工智能 新聞
路由LLM是指一種通過router動態分配請求到若干候選LLM的機制。論文提出且開源了針對router設計的全面RouterEval基準,通過整合8500+個LLM在12個主流Benchmark上的2億條性能記錄。

當前大模型研究面臨三大困境:算力壟斷(頂尖成果集中于大廠)、成本壁壘(單次訓練成本高,可能需要數千GPU小時)以及技術路徑單一化(過度依賴單一模型的規模擴展)。

為突破這些限制,路由LLM(Routing LLM)范式應運而生——通過智能調度實現多個開源小模型的協同增效,以「組合創新」替代「規模競賽」。

圖片

代碼:https://github.com/MilkThink-Lab/RouterEval

論文: https://arxiv.org/abs/2503.10657

論文合集:https://github.com/MilkThink-Lab/Awesome-Routing-LLMs

路由LLM實際上是model level的MoE(Mixture-of-Experts),傳統MoE通過在模型內部擴展專家網絡(如稀疏激活的FFN層)提升性能,而路由LLM將完整LLM視為獨立「專家」,通過預訓練Router動態分配任務輸入。

圖片

三個大模型=OpenAI

這種范式具有三重優勢:

  1. 異構兼容性:支持閉源模型(如GPT-4)、開源模型(如Llama系列)及專用微調模型的混合部署。
  2. 多目標優化:可根據場景需求,在性能、成本、風險控制等維度實現動態權衡
  3. 靈活部署:可根據實際需求動態調整候選模型池,針對特定場景(如代碼生成、醫療問答)快速定制專屬解決方案,而無需從頭訓練大模型

路由LLM范式的核心機制

圖片

路由LLM系統采用「輸入-路由-執行器」三級架構,其中路由層是系統的智能中樞,承擔著任務分配與資源調度的核心功能:

1.輸入層:接收多樣化的用戶請求,包括文本生成、文本摘要、代碼補全等任務

2.路由層:通過預訓練Router對輸入進行深度分析,基于多維度特征選擇最優LLM執行器

性能優先模式:識別任務領域特征,匹配性能最優的LLM(當前版本核心目標)

成本優化模式:平衡性能與計算開銷,選擇性價比最高的LLM(后續版本特性)

風險控制模式:通過多模型交叉驗證,降低單一模型的幻覺風險(后續版本特性)

3.執行層:由候選LLM池中被選定的模型完成實際推理,并將結果返回給用戶

與MoE(Mixture-of-Experts)相比,路由LLM實現了兩大突破:

協作粒度:在模型級實現專家協作,而非傳統MoE的層間專家擴展

系統開放性:支持跨架構、跨訓練階段的LLM協同,包括閉源模型、開源模型及專用微調模型的混合部署

這種架構使得路由LLM既能繼承MoE的動態優勢,又突破了其封閉性限制,為構建開放、靈活的大模型協作系統奠定了基礎。

RouterEval解決了什么問題?

研究人員系統性收集、整理并開源了涵蓋8567個不同LLM在12個主流評測基準(包括MMLU、GSM8K等)下的2億條性能記錄,基于這些數據構建了面向 router的基準測試平臺RouterEval,創新性體現在:

  1. 數據完備性:覆蓋從7B到數百B參數規模的LLM,涵蓋通用能力、領域專長等多維度的 Benchmark,為router設計提供了全面的訓練與驗證數據
  2. 研究低門檻化:所有性能記錄均已預處理完成,研究者只需訓練一個分類器(即router)即可開展實驗,支持在單卡GPU甚至筆記本電腦上運行,極大降低了參與門檻
  3. 問題范式轉化:將復雜的路由LLM問題轉化為標準的分類任務,使研究者可復用成熟的機器學習方法(如few-shot learning、對比學習等)快速切入

圖片

8000+模型的參數量分布

基于RouterEval的海量數據,研究團隊首次揭示了Model-level Scaling Up現象:在具備一定能力的router調度下,路由LLM系統的性能可隨候選LLM池的擴大而快速提升。這一現象在以往研究中難以被觀察到,主要受限于候選模型數量不足(通常<20個)。

RouterEval的發現

Model level scaling up現象

利用RouterEval基準中的2億條性能記錄,研究團隊構建了理論性能上限——Oracle Router(r_o)。Oracle Router是一種理想化的路由器,它能夠始終為每個輸入選擇性能最佳的LLM,因此代表了路由LLM系統的性能上限。

圖片

為了系統研究router性能對系統整體表現的影響,研究人員定義了router性能的連續譜系r_o(p):

  • 當p→1時,r_o(p)趨近于Oracle Router,代表分類性能接近理論上限
  • 當p→0時,r_o(p)退化為隨機router,即隨機選擇候選LLM
  • 中間狀態r_o(p)(0<p<1)模擬了不同能力水平的 router

實驗結果表明:

  • 強router的scaling up效應:當p>0.3時,系統性能隨候選LLM數量呈明顯快速上升
  • 弱router的性能瓶頸:隨機router(p=0)幾乎未表現出scaling up現象
  • 超越參考模型:一般候選LLM數量在3~10且p在0.5~0.7時,系統性能可以接近甚至超過參考模型(參考模型一般是GPT-4)

圖片

候選模型數量m = 5

弱模型逆襲效應

通過智能路由調度,多個性能一般的LLM可以協同實現超越頂級單體模型的性能表現。例如,當使用Oracle Router(r_o)調度5個在MMLU基準上單獨表現僅為0.2-0.3的弱模型時,系統整體性能可躍升至0.95,顯著超越GPT-4(0.86)。

這一發現為資源有限的研究者提供了新的技術路徑:無需追求單一超大模型,而是通過多個中小模型的智能組合實現性能突破。

候選池規模閾值

從Model-level Scaling Up現象示意圖可以看到3-10個LLM候選的時候已經可以達到非常不錯的性能。而且此時的部署成本并不高,具有很高的性價比。

實驗數據表明,路由LLM系統的性能提升存在明顯的規模經濟拐點:

  • 3-5個候選LLM:可覆蓋大部分常見任務需求,部署成本相比單一頂級模型低。
  • 5-10個候選LLM:性能進入穩定提升期,在多數基準上可超越GPT-4等頂級單體模型
  • 多于10個候選LLM:性能增益存在邊際效應,每增加1個模型帶來的性能提升并不大

這一發現為實際部署提供了重要指導:在大多數應用場景下,維護一個5-10個模型的候選池即可實現性能與成本的最佳平衡。

例如,在智能客服系統中,組合使用GPT-4(復雜問題)、Llama-3-8B(常規問題)和Phi-3(意圖識別)三個模型,即可在保證服務質量的同時將運營成本顯著降低。

圖片

主要挑戰

數據壁壘

要訓練出高性能的router,當前可用的性能記錄數據仍然遠遠不足。由于大多數LLM的性能數據掌握在少數科技公司手中且未開源,這需要整個研究社區的共同努力來構建更全面的數據集。目前,可以通過遷移學習、數據增強等算法技術在一定程度上緩解數據不足的問題;

多候選分類挑戰

隨著候選LLM數量的增加,router需要處理的分類任務復雜度顯著上升。這不僅增加了模型訓練的難度,也對router的泛化能力提出了更高要求。如何在保證分類精度的同時控制計算開銷,是未來研究的重點方向之一;

多目標權衡局限

雖然路由LLM理論上可以同時優化性能、計算成本和幻覺風險等多個目標,但RouterEval目前僅聚焦于性能優化。這是因為當前router的性能水平尚未達到理想狀態,過早引入多目標優化可能會分散研究重點。此外,計算成本和幻覺風險等指標的數據采集難度較大,需要社區共同推動相關數據集的構建;

部署復雜度

即使獲得了高性能的router,實際部署仍面臨諸多挑戰。多個LLM的協同運行需要解決計算負載均衡、資源動態分配、模型高效激活等系統級問題。幸運的是,實驗表明僅需部署3-10個LLM即可獲得優異性能,這大大降低了實際應用的復雜度。未來研究可借鑒分布式計算領域的技術成果,進一步優化部署方案。

責任編輯:張燕妮 來源: 新智元
相關推薦

2017-04-18 14:25:54

Excel實戰數據

2020-05-27 14:07:56

HTTPServer編譯器

2022-09-19 16:24:33

數據可視化Matplotlib工具

2018-11-23 09:43:26

2020-06-11 09:00:27

SDN網絡架構網絡

2011-06-14 10:35:15

性能優化

2021-03-17 08:11:29

SpringBoot項目數據庫

2019-04-25 05:35:30

ping網絡命令

2011-12-27 09:49:50

AndroidiOSFlurry

2023-04-26 11:14:11

IT領導者遠程工作

2010-07-12 14:36:18

OSPF動態路由協議

2024-08-08 08:09:38

2013-12-09 10:20:03

DHCP故障技巧

2021-01-25 13:45:14

模型人工智能深度學習

2020-06-16 14:52:41

面試官模型遞歸

2025-06-05 03:22:00

生命周期策略CDP

2009-09-22 11:33:54

Java內存模型

2024-04-24 12:50:46

云端LLMs語言模型

2025-05-15 14:37:17

AI生成模型
點贊
收藏

51CTO技術棧公眾號

中文字幕久久精品| 成人免费看黄yyy456| 欧美va亚洲va在线观看蝴蝶网| 佐佐木明希av| www.麻豆av| 欧美三区视频| 日韩av网址在线观看| 屁屁影院ccyy国产第一页| 人妻与黑人一区二区三区| 亚洲一级在线| 伊人精品在线观看| 天天综合成人网| 最新av在线播放| 99久久免费视频.com| 日本乱人伦a精品| 国产视频不卡在线| 在线精品国产亚洲| 欧美午夜丰满在线18影院| 欧美一区1区三区3区公司| 一级aaaa毛片| 精品二区久久| 尤物精品国产第一福利三区 | 亚洲精品a级片| 精品国产99国产精品| 精品久久久久久久免费人妻| 亚洲精品承认| 国产一区二区三区精品视频| 欧美激情奇米色| 日韩精品电影一区二区三区| 亚洲成人精品女人久久久| 中文字幕一区二区三三| 亚洲国产日韩欧美在线图片| 四季av一区二区| 亚洲无线看天堂av| 久久久久久夜精品精品免费| 99se婷婷在线视频观看| 欧美激情黑白配| 一个色综合网| 亚洲欧洲午夜一线一品| 杨幂一区二区国产精品| 中文字幕av一区二区三区佐山爱| 亚洲天堂福利av| 欧美精品二区三区四区免费看视频| 97在线公开视频| 在线亚洲国产精品网站| 欧美成人亚洲成人| 99久久99久久精品免费看小说.| 亚洲国产欧美在线观看| 欧美日韩精品一二三区| 精品国产免费av| 性欧美ⅴideo另类hd| 中文字幕乱码亚洲精品一区| 亚洲综合在线中文字幕| 中文在线字幕免费观| 亚洲精一区二区三区| 久久精品夜夜夜夜夜久久| 永久免费av无码网站性色av| 日韩精品亚洲aⅴ在线影院| 91精品久久久久久久99蜜桃| 日本www.色| www成人免费观看| 亚洲午夜精品在线| wwwjizzjizzcom| 日本暖暖在线视频| 中文字幕成人av| 欧美日韩一区在线播放| 欧美激情a∨在线视频播放| 亚洲小视频在线播放| yiren22综合网成人| 久久久精品免费观看| 精品国产综合久久| 少妇一区二区三区四区| av在线这里只有精品| 国产精品久久久久久久电影| 日韩欧美a级片| 在线观看日韩av电影| 欧美激情欧美激情| 日韩黄色三级视频| 99热精品在线观看| 国模私拍视频一区| 中文字幕在线观看免费视频| 亚洲激情自拍| 91tv亚洲精品香蕉国产一区7ujn| 日韩欧美亚洲视频| 欧美午夜国产| 88国产精品欧美一区二区三区| 日本在线视频免费| 9色国产精品| 欧美风情在线观看| 日本一级淫片色费放| 欧美一级久久| 国产精品高清在线| 亚洲一卡二卡在线观看| 麻豆成人av在线| 亚洲一区中文字幕| 好吊色一区二区| 337p粉嫩大胆噜噜噜噜噜91av| 欧美另类高清视频在线| www.亚洲资源| 亚洲乱码国产乱码精品精98午夜| 屁屁影院ccyy国产第一页| 中文av资源在线| 福利二区91精品bt7086| 精品少妇人妻av免费久久洗澡| 深夜在线视频| 欧美色欧美亚洲另类二区| 不卡中文字幕在线观看| 国产精品45p| 亚洲欧美国产精品专区久久| 国产成人免费观看网站| 你懂的国产精品| 57pao国产精品一区| 亚洲欧美一二三区| 波多野结衣视频在线观看| 自拍偷拍一区| 日韩在线观看免费网站| 国产一级免费av| 久久久777| 亚洲最大成人在线| 丝袜视频国产在线播放| 中文字幕日韩一区| www..com日韩| 国产美女久久| 欧美精品一区二区三区蜜桃视频| 男人舔女人下部高潮全视频 | 久久久久久99| 日本三级在线播放完整版| 亚洲成人一二三| 天天操,天天操| 加勒比色老久久爱综合网| 中文字幕9999| 欧美黑人一区二区| 国产老妇另类xxxxx| 欧美在线激情| 欧美v亚洲v| 欧美日韩亚洲不卡| 毛茸茸多毛bbb毛多视频| 亚洲人metart人体| 日韩av免费在线| 蜜臀av在线观看| 亚洲国产成人在线| www一区二区www免费| 91在线一区| 美女av一区二区| 亚洲一区二区影视| 国产欧美日韩麻豆91| www.69av| 伊人久久一区| 揄拍成人国产精品视频| 国产精品自拍99| 国产高清不卡一区二区| 一区一区视频| 国产经典一区| 亚洲欧洲在线播放| 欧美一二三区视频| 东方aⅴ免费观看久久av| 精品一区二区成人免费视频| 激情都市亚洲| 日韩精品在线视频| 日韩精品在线不卡| www.亚洲在线| 亚洲人成无码网站久久99热国产 | 亚洲精品www.| 欧美一级本道电影免费专区| 欧洲成人在线视频| 亚洲人午夜射精精品日韩| 香蕉久久一区二区不卡无毒影院 | 阿v天堂2014| 老司机午夜精品视频| 欧美第一黄网| a一区二区三区| 亚洲精品一区av在线播放| 亚洲一区欧美在线| 91在线观看下载| 又粗又黑又大的吊av| 欧美美女啪啪| 欧美在线一区二区视频| 日韩一区免费视频| 欧美日韩人人澡狠狠躁视频| 中文字字幕码一二三区| 黄色av日韩| 国产不卡一区二区三区在线观看| 蜜臀av在线播放| 精品处破学生在线二十三| 日韩激情一区二区三区| 91一区二区在线观看| 久久久久久香蕉| av亚洲在线观看| 国产综合视频在线观看| 97超碰在线公开在线看免费| 欧美一区二区三区爱爱| 久久久久久天堂| 99精品久久99久久久久| 精品人妻一区二区三区四区在线| 欧美男男gaytwinkfreevideos| 国产精品www| 国产成人在线视频免费观看| 精品乱码亚洲一区二区不卡| 国产视频91在线| 久久欧美一区二区| 污污网站免费观看| 伊人狠狠色j香婷婷综合| 国产专区一区二区| 日韩影片中文字幕| 不卡毛片在线看| 日本高清视频网站| 欧美色图天堂网| 国产无码精品在线观看| 国产三级一区二区| 精品国产午夜福利在线观看| 亚洲一区自拍| 在线成人av电影| 日韩精品视频中文字幕| 青草成人免费视频| 国产三区在线观看| 亚洲欧美国产制服动漫| 国产女人18毛片水真多| 精品毛片网大全| 日韩在线视频免费看| eeuss国产一区二区三区| 九一精品在线观看| 欧美精品一区二区三区久久久竹菊| 精品一卡二卡三卡四卡日本乱码| 日本在线一区二区| 午夜精品一区二区三区视频免费看 | 91麻豆成人精品国产免费网站| 亚洲1区2区3区视频| 永久免费毛片在线观看| 国产精品影音先锋| 欧美精品成人网| 亚洲国产专区| 中文字幕免费高| 国产欧美日韩| 精品综合久久久| 精品国产一区二| 国产精品日韩在线播放| av激情成人网| 国产精品久久久| 色婷婷综合久久久中字幕精品久久| 911国产网站尤物在线观看| 怡红院在线观看| 免费99精品国产自在在线| 久久日韩视频| 久久精品国产清自在天天线 | 中文字幕一区二区视频| 男人的天堂官网| 国产人伦精品一区二区| 亚洲精品国产精品国自产网站| 久久久亚洲午夜电影| 欧美特级黄色录像| 久久久91精品国产一区二区精品| 五月婷婷综合在线观看| 久久婷婷色综合| 久久国产柳州莫菁门| 日本一区二区三区dvd视频在线| 日本激情小视频| 中文字幕第一区综合| 极品色av影院| 亚洲在线免费播放| 日本五十路女优| 色婷婷亚洲精品| 亚洲天堂免费av| 欧美一级电影网站| 日本激情一区二区| 亚洲精品自拍第一页| 国产在线观看精品一区| 色偷偷偷综合中文字幕;dd| 国产视频在线播放| 欧美极品少妇xxxxⅹ免费视频| aa国产成人| 国产精品99久久久久久久久| 亚州精品国产| 国产精品一区二区欧美黑人喷潮水| 国产乱人伦精品一区| 欧美日韩电影一区二区| 99久久久久| 野外做受又硬又粗又大视频√| 亚洲一区二区网站| 999在线观看| 成人午夜碰碰视频| 蜜乳av中文字幕| 一区二区在线观看视频在线观看| 国产视频91在线| 欧美日韩国产乱码电影| 欧美综合视频在线| 一区二区三区黄色| 1769免费视频在线观看| 日韩美女视频中文字幕| 国产激情一区| 欧美精品亚洲精品| 一区二区三区四区电影| 成人在线观看黄| 国产风韵犹存在线视精品| 国产精品揄拍100视频| 亚洲日本丝袜连裤袜办公室| 西西44rtwww国产精品| 欧美精品在线一区二区| 少妇人妻一区二区| 久久亚洲综合国产精品99麻豆精品福利 | 欧美国产欧美亚洲国产日韩mv天天看完整| 川上优av中文字幕一区二区| 91精品国产综合久久久久久久久| 国产精品自在| 黄黄视频在线观看| 日韩国产欧美三级| 青青草视频网站| 亚洲日本在线天堂| 国产免费a视频| 亚洲国产精品一区二区久| 超碰在线免费播放| 国产精品1区2区在线观看| 国产精伦一区二区三区| 亚洲免费av网| 日本sm残虐另类| 麻豆国产精品一区| 亚洲综合久久久| 国产伦精品一区二区三区免.费 | 乱人伦中文视频在线| 日韩av电影在线网| 精品亚洲精品| 国产高清精品软男同| 日韩国产欧美视频| 波多野结衣福利| 亚洲va国产va欧美va观看| 国产叼嘿视频在线观看| 中文字幕日韩综合av| 樱桃视频成人在线观看| 精品一区二区三区视频日产| 欧美精品综合| 午夜福利123| 自拍偷拍亚洲激情| 一二三四区视频| 日韩一二三在线视频播| 国产91亚洲精品久久久| 涩涩日韩在线| 久久在线91| 干b视频在线观看| 一本色道久久综合亚洲aⅴ蜜桃| 四虎国产精品永远| 欧美一区二区三区图| 秋霞影视一区二区三区| 给我免费播放片在线观看| 成人免费电影视频| 精品无码久久久久久久久| 精品免费日韩av| 好看的中文字幕在线播放| 风间由美久久久| 黄色工厂这里只有精品| 亚洲最大视频网| 亚洲国产精品久久久久婷婷884 | 国产小视频国产精品| 国产成人免费9x9x人网站视频 | 免费国产在线视频| 欧美中文字幕在线观看| 国产乱码精品一区二区亚洲 | 国产一区二区三区四| 成人免费视频网站入口::| 日韩视频一区二区| 欧美色图天堂| 国产a一区二区| 亚洲永久免费精品| 丰满的亚洲女人毛茸茸| 欧美丰满少妇xxxxx高潮对白| av网站导航在线观看免费| 国产精品久久7| 国产精品美女| 91视频免费在观看| 欧美一卡二卡三卡| 成人免费网站观看| 欧美国产视频在线观看| 美女看a上一区| 久久成人在线观看| 国产视频精品xxxx| 欧美性生活一级| 4444亚洲人成无码网在线观看| caoporn国产一区二区| 波多野结衣一区二区三区四区| 北条麻妃一区二区三区中文字幕 | 九色综合狠狠综合久久| 精品国产乱码久久久久久鸭王1| 亚洲第一中文字幕| 四虎影视4hu4虎成人| 男女啪啪免费观看| 久久久另类综合| 国产伦精品一区二区三区四区| 欧美激情精品久久久久| 精品在线手机视频| 女教师高潮黄又色视频| 欧美性猛交xxxx黑人猛交| 免费在线看a| 久热这里只精品99re8久| 精品一区二区三区久久久| 日本在线播放视频| 久久在线免费视频| 欧美人与牛zoz0性行为| 日本成人在线免费| 欧美三级电影网| 日本不卡网站| 中文字幕欧美人与畜| 91网站黄www|