精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

真·MoE?路由LLM最全面探索:一種筆記本也能玩的大模型Scaling Up研究

人工智能 新聞
來自中山大學和普渡大學的研究人員在基于上述海量的記錄做了一番探索之后,發現了一個現象,叫做Model-level Scaling Up。

事關路由LLM(Routing LLM),一項截至目前最全面的研究,來了——

共計收集和整理了涉及8500+個LLM,在12個Benchmark上的共2億條性能記錄!

圖片

先來簡單科普一下路由LLM。

這種方法主要是把像ChatGPT、Qwen、DeepSeek這些成型的LLM當作 “專家” ,當給一個輸入的時候,有分類能力的Router(路由器)就會把這個輸入分配給合適的LLM處理。

如此一來,就能實現高性能、低計算消耗、低幻覺等目標。

而來自中山大學普渡大學的研究人員在基于上述海量的記錄做了一番探索之后,發現了一個現象,叫做Model-level Scaling Up。

一言蔽之,就是一個好的Router,可以讓路由LLM范式的性能隨著LLM候選數量的增加迅速變強。

隨后,他們通過這些數據構建了針對Router設計的評測RouterEval。

值得注意的是,其他研究人員,也可以通過RouterEval在很少的計算資源下(如筆記本、單卡GPU上)就能參與到該路由LLM的研究當中。

2億條記錄中發現的新現象

當大多數研究人員和開發者第一次聽到Mixture-of-Expert (MoE) 的時候,可能第一反應不是現在常見的對結構中的FFN層進行擴展,以FFN層作為”expert”。

而是直接將每一個成型的LLM,比如ChatGPT、Qwen、DeepSeek等直接看做是”expert”。

實際上,這種范式也稱為路由LLM(Routing LLMs)。

圖片

簡單地說,就是給定一個輸入input,一個具有一定分類能力的Router (路由器)會將input分配給指定的LLM進行處理,以達到高性能、低計算消耗或者是低幻覺等各種各樣的目標,或組合目標。

這類問題可以被認為是分類問題、推薦系統問題、Agent規劃甚至是檢索問題(注意,不是檢索數據for LLM,而是檢索LLM for 數據)。

一些典型的例子有:

  1. 人機客服切換:機器人客服無法解決問題的時候自動切換到更高級的客服,比如更智能的機器人,甚至人類;
  2. 強弱LLM切換:比如困難問題給GPT4解決(費用貴),簡單問題給GPT3解決(費用低)
圖片
△路由LLM (Routing LLMs)示意圖

路由LLM具有很高的應用潛力和兼容性,不同LLM都可以被添加到LLM候選Pool中參與routing(包括異構LLM,各種tuning/pretraining方法下得到的LLM,等等),而且可以發揮很強的性能。

比如最近UCB提出的Prompt-to-Leaderboard以很低的訓練成本,以路由LLM的范式下實現和需要數十萬個GPU訓練得到的Grok3相當的性能,并登上Arena排行榜第一。

然而當前路由LLM領域仍然存在一些挑戰影響了Router的發展:

  1. 缺乏統一的benchmark。各個研究都在小范圍的構建各種的benchmark進行研究;
  2. 當前benchmark不夠全面:當前的工作一般只涉及少量的LLM、evaluations,而且大多數是閉源不公開。

于是,研究團隊收集并整理且開源了涉及8567個不同LLMs在12個evaluations下2億條性能記錄,并通過這些記錄發現:

  1. Model-level Scaling Up現象:有一定能力的Router,可以使得routing llm范式下的性能隨著llm pool的擴大而迅速上升。過去的研究由于涉及的不同LLM較少,不容易觀察到這個現象。
  2. 通過這些數據,我們構建了全面的針對Router設計的評測RouterEval。其全面性可以大大幫助Router設計的探索。鑒于該測評已經整理良好且很簡潔,可以被看做是傳統的分類問題,所有研究者都可以以很少的計算消耗(甚至單卡或筆記本電腦)參與該大模型的研究當中。
圖片
△Model-level Scaling Up現象示意圖

利用2億條性能記錄,可以構建完美Router,即oracle Router ro

圖片

接著,根據上式可以構建不同性能的Router ro(p),其中wm為隨機Router,當p→1時,Router ro(p)越解決上界分類性能,當p→0時,ro(p)越接近隨機Router。

從上圖結果來看,隨著LLM候選的數量增加,不同的evaluation在具有一定能力的Router下呈現了Scaling Up現象。

而性能一般的Router,比如隨機Router則幾乎沒有Scaling Up現象。

且快速超過參考模型Ref. LLM的性能(參考模型一般是GPT4)。

另外團隊還可以發現兩個有趣的現象:

圖片

RouterEval涉及的LLM的參數分布

  1. 弱LLM也能組合出非常強的性能。上圖給出了RouterEval中涉及的LLM的參數分布,LLM的參數為7B或以下的情況占優。文章發現,即使較弱的LLM也可以組合出不錯的性能,比如5個性能在少于0.3的情況下,ro可以讓他們互補優勢在MMLU上達到0.95(超越GPT4)的性能。
  2. 少量的LLM候選已經足夠。從Model-level Scaling Up現象示意圖可以看到3-10個LLM候選的時候已經可以達到非常不錯的性能。而且此時的部署成本并不高,具有很高的性價比。

當前Router的結果

通過測試當前的已有的Routers的性能,可以發現現在Router仍然有很大的提升空間。

不過幸運的是,RouterEval進行的Router設計的實驗不需要大量的計算資源,且可以融入不同的已有技術,包括few-show learning,數據增強、推薦系統、正則化方法、預訓練模型、額外數據等等.

因此Router將有希望快速得到實質性改進。

圖片

以及,和當前一些其他范式的區別和關系如下:

圖片

  1. 推薦系統:Routing LLM其實是特殊的推薦系統,LLM的input是推薦系統中的user信息,LLM候選是推薦系統中的商品item,而性能記錄則是推薦系統中的歷史用戶書記記錄;
  2. LLM集成:一般LLM集成是post-decision,即讓多個LLM完成推理后再合并。而Routing LLM是pre-decision,即在LLM推理前就要決定是哪個LLM來處理;
  3. LLM Fusion:LLM融合主要針對是同質的LLM的“合作”,而Routing LLM可以讓“異質”(包括不開源)的LLM進行“合作”
  4. Mixture-of-Experts (MoE): Routing LLM是model-level的MoE

當然,研究團隊也提出一些未來的挑戰。

首先就是缺乏數據。

要獲得足夠好的Router,當然的數據仍然遠遠不夠,因為這些性能記錄的數據一般不開源,且掌握在大公司手中,這需要全社區的共同努力。目前也可以通過算法一定程度緩解數據缺乏的問題。

其次是如何保持在多LLM候選情況下的Router性能的問題。

當LLM候選越多的時候,意味著Router要進行更多類的分類,這對于Router的訓練來說具有很高的挑戰性;

除此之外,還包括RouterEval目前只關注在性能。

盡管routing llm可以考慮計算消耗、幻覺等其他目標。但是目前性能的水平還遠遠不夠,如果現在就過度關注其他目標的話,可能言辭尚早。另外,計算消耗和幻覺等目標的數據不容易搜集,可能采集不到足夠多的LLM的記錄數據,仍然需要全社區的努力。

最后,就是部署的難度。

即使足夠強的Router可以獲得,但是此時LLM候選的部署可能是新的瓶頸,這在計算機系統等領域中也有很多的研究角度,如計算負載,高效分配、動態模型激活等。幸運的是,從論文的觀察來看,3-10個LLM已經能得到出色的結果。

GitHub和論文等地址放下面了,感興趣的小伙伴可以深入研究一下哦~

代碼地址:https://github.com/MilkThink-Lab/RouterEval

論文地址:https://arxiv.org/abs/2503.10657

論文合集:https://github.com/MilkThink-Lab/Awesome-Routing-LLMs

責任編輯:張燕妮 來源: 量子位
相關推薦

2012-05-18 11:40:40

神舟筆記本

2025-05-22 04:00:00

PARSCALE大型語言模型LLM

2011-04-29 10:05:57

主板硬盤

2011-10-26 09:49:38

平板筆記本銷量

2011-08-03 16:30:25

2012-04-13 11:24:46

蘋果筆記本

2024-08-27 00:00:01

AI應用框架

2024-09-02 14:30:00

數據訓練

2025-02-21 13:20:00

2024-04-10 09:29:16

LLM開源大模型

2024-01-18 15:38:17

語言模型大型語言模型

2012-10-24 18:11:40

聯想IdeaPad Yog

2017-08-08 11:15:29

筆記本Titan XpQuadro

2009-03-27 09:19:11

微軟Windows 7操作系統

2020-09-01 14:09:39

筆記本SSD存儲

2024-02-06 10:38:10

昆侖萬維大模型

2024-05-06 07:58:23

MoE模型系統

2011-04-29 10:21:33

筆記本

2017-09-19 10:34:55

無邊框筆記本全面屏

2009-04-16 10:37:34

聯想3G
點贊
收藏

51CTO技術棧公眾號

狠狠色丁香久久婷婷综合丁香| 亚洲成av人片在线观看www| 精品一级毛片| 欧美日韩一区三区四区| 午夜在线视频免费观看| 蜜桃视频久久一区免费观看入口| 午夜在线播放视频欧美| 中文字幕一区电影| 国产婷婷在线观看| 欧美成人一二区| 婷婷综合在线观看| 亚洲午夜激情| 销魂美女一区二区| 欧美日韩另类图片| 亚洲国产va精品久久久不卡综合| 欧美在线播放一区| 亚洲第一色网站| 日韩高清不卡一区二区| 久久人人爽人人爽人人片av高请| 综合 欧美 亚洲日本| 国产精品高潮呻吟久久久久| 欧美日韩视频在线第一区 | 第三区美女视频在线| 国产剧情av麻豆香蕉精品| 国产精品 欧美在线| 国产精品第56页| 66久久国产| 自拍偷拍亚洲一区| 新91视频在线观看| 中文字幕资源网在线观看免费| 粉嫩aⅴ一区二区三区四区| 国产精品老女人视频| 日本亚洲欧美在线| 欧美1区2区视频| 最新国产精品拍自在线播放| 国产一级做a爰片久久| 欧美草逼视频| 亚洲情趣在线观看| 一卡二卡3卡四卡高清精品视频| 天堂v视频永久在线播放| 国产99久久久精品| 91pron在线| 亚洲天堂2021av| 久久亚洲欧洲| 日韩美女在线观看一区| 国产三级av片| 国产欧美精品| 97激碰免费视频| 日韩精品一区二区av| 黄色欧美日韩| 午夜免费日韩视频| 国产一级一片免费播放放a| 国产精品v欧美精品v日本精品动漫| 北条麻妃在线一区二区| 夫妻性生活毛片| 999久久久国产精品| 欧美一区二区在线看| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 国产麻豆成人传媒免费观看| 成人激情视频在线播放| 国产精品无码AV| 国产麻豆精品视频| 超碰97人人在线| 欧美一区二区三区黄片| 成人黄色国产精品网站大全在线免费观看| 666精品在线| 性一交一乱一透一a级| 国产999精品久久| 国产欧美综合精品一区二区| 日本激情一区二区| 久久先锋影音av| 日韩欧美在线电影| 黄色片网站在线| 亚洲在线中文字幕| 欧美二区在线视频| 欧美国产日韩电影| 亚洲国产视频直播| 亚洲国产日韩综合一区| 日本最新在线视频| 一区二区三区日韩| 日韩国产欧美亚洲| 成人看片在线观看| 日韩一区二区视频在线观看| 挪威xxxx性hd极品| 国产精品一区二区av日韩在线 | 男人的天堂在线视频免费观看| 中文字幕av一区二区三区高| 福利视频久久| 欧美日韩伦理片| 国产精品一区二区视频| 国产精品有限公司| 国产一区电影| 一区二区三区美女| 农村妇女精品一二区| 久久人体av| 亚洲国产精品人久久电影| 国产高清一区二区三区四区| 中文字幕一区二区精品区| 91国在线精品国内播放| 制服丝袜在线一区| 国产一区二区高清| 国产精品久久久久久久久影视| 国产精品日韩无码| 久久综合狠狠综合| 国产免费xxx| 久久人体大尺度| 日韩欧美一区二区久久婷婷| 91国模少妇一区二区三区| 在线观看国产精品入口| 人妖精品videosex性欧美| 日韩欧美三级在线观看| 日本在线不卡视频| 激情一区二区三区| 好吊色一区二区三区| 国产日产欧美一区二区视频| 欧美这里只有精品| 欧美高清免费| 亚洲欧美日韩中文在线制服| 国产乱了高清露脸对白| 天天综合网网欲色| 日韩亚洲欧美中文高清在线| 成年人午夜视频| 国产麻豆精品一区二区| 一区二区精品免费视频| 国产精欧美一区二区三区蓝颜男同| 日韩亚洲电影在线| 国产小视频你懂的| 日本中文字幕不卡| 日本精品一区二区三区不卡无字幕| 国产美女情趣调教h一区二区| 亚洲综合自拍偷拍| 日韩一区二区三区不卡视频| 综合国产视频| 91精品国产99| 你懂的网站在线| 伊人一区二区三区| 涩涩网站在线看| 北条麻妃国产九九九精品小说| 2023亚洲男人天堂| 黄色美女一级片| 亚洲一区二区在线观看视频| 91视频福利网| 亚洲欧美色图| 亚洲a中文字幕| 91一区二区三区在线| 欧美理论电影在线| 欧美xxxooo| 狠狠网亚洲精品| 中文字幕免费在线不卡| 久久久免费人体| 日韩在线不卡视频| 国产三级自拍视频| 亚洲精品v日韩精品| 黄色片子免费看| 欧美日本不卡| 粉嫩av一区二区三区免费观看| av免费看在线| 精品国产成人系列| 日本在线观看中文字幕| 99精品在线观看视频| 欧美一级爱爱| 三级成人在线| 视频直播国产精品| 国产美女裸体无遮挡免费视频| 亚洲素人一区二区| 少妇伦子伦精品无吗| 99在线观看免费视频精品观看| 韩国成人av| 三上悠亚亚洲一区| 日韩最新中文字幕电影免费看| 一卡二卡在线观看| 一区二区在线观看不卡| 日韩精品视频一区二区| 免播放器亚洲| 亚洲一区综合| eeuss鲁片一区二区三区| 欧美亚洲一区在线| 在线免费观看黄色av| 欧美一区国产二区| 日本熟妇乱子伦xxxx| 国产视频一区不卡| 肉色超薄丝袜脚交| 中文国产一区| 亚洲精品一区二区三区樱花| 精品国产一区二| 欧美亚洲一级片| 成人无遮挡免费网站视频在线观看| 欧美性jizz18性欧美| 一级特黄曰皮片视频| 国产精品一级在线| 欧美日韩国产精品激情在线播放| 日本精品黄色| 国产一区精品视频| 国产精品99久久久久久董美香| 久久91亚洲精品中文字幕| 免费在线看v| 欧美一级黄色大片| 无码人妻精品一区二区| 亚洲精品成人悠悠色影视| 欧美一区二区三区成人精品| 国产自产2019最新不卡| 中文字幕一区综合| youjizz亚洲| 国产伊人精品在线| 中国日本在线视频中文字幕| 亚洲成人av中文字幕| 中文字幕一二三四| 五月婷婷综合在线| 老司机成人免费视频| 国产亚洲一区二区三区在线观看| wwwww在线观看| 奇米在线7777在线精品| 日本a视频在线观看| 91超碰成人| 日韩欧美在线电影| 曰本一区二区三区视频| 国产偷久久久精品专区| 国产精品高清一区二区| 国产精品久久久久久久天堂| 久久男人天堂| 亚洲欧美一区二区激情| 性生交大片免费看女人按摩| 欧美日韩一区二区电影| 国产黄色免费视频| 精品久久久一区| 久久午夜鲁丝片午夜精品| 亚洲日本欧美天堂| 美女网站视频色| 国产亚洲一区字幕| 永久免费看mv网站入口78| 99久久亚洲一区二区三区青草| 国产伦理在线观看| 国产美女娇喘av呻吟久久| 色播五月激情五月| 免费观看一级特黄欧美大片| 一区二区三区在线视频111| 中文字幕精品影院| 欧美精品一区二区三区在线四季| 波多野结衣在线一区二区| av一区观看| 亚洲精品一二三**| 亚洲最大av网站| 久久免费精品| 成人欧美一区二区三区视频| 欧洲精品99毛片免费高清观看 | 国产婷婷色一区二区三区四区| 特级西西人体4444xxxx| 97超碰欧美中文字幕| 国产精品一区二区人妻喷水| 不卡在线观看av| 日本黄色录像片| 91美女蜜桃在线| a在线观看免费视频| 日韩电影免费一区| 亚洲福利精品视频| 久久国产综合精品| 久久免费一级片| 牛牛国产精品| 欧妇女乱妇女乱视频| 黄色亚洲精品| 女性女同性aⅴ免费观女性恋| 国产毛片久久| 亚洲成熟丰满熟妇高潮xxxxx| 日本亚洲免费观看| 免费av不卡在线| 国产黄色91视频| 亚洲中文字幕一区| 国产三级精品在线| 波多野结衣久久久久| 亚洲激情在线激情| 亚洲黄色三级视频| 欧美亚洲国产一区在线观看网站| 在线观看国产一区二区三区| 91麻豆精品国产91久久久久久| 国产三级精品在线观看| 亚洲国产精品小视频| 国产青青草在线| 久久精品免费播放| caoprom在线| 国产不卡av在线| 久久精品一级| 免费av在线一区二区| 欧美电影一区| 你真棒插曲来救救我在线观看| 视频在线观看91| 国产xxxxhd| 久久一日本道色综合| 午夜精品久久久久99蜜桃最新版| 一卡二卡欧美日韩| 波多野结衣二区三区| 日韩一卡二卡三卡四卡| 欧美3p视频在线观看| 久久不射电影网| 日本在线观看免费| 久久久久久噜噜噜久久久精品| 日韩毛片免费观看| www久久99| 精品一区二区三区在线| 成人在线视频一区二区三区| 日韩中文字幕亚洲一区二区va在线 | 精品国产_亚洲人成在线| 日韩欧美中文| 久色视频在线播放| 精东粉嫩av免费一区二区三区| 中文字幕精品视频在线| 中文字幕中文字幕在线一区 | 国产精品日本一区二区| 精品美女久久久| 欧美久久久久久久久久久久久| 久久超碰97人人做人人爱| 欧美做受喷浆在线观看| 一区二区久久久| 91av久久久| 亚洲系列中文字幕| 免费在线国产| 欧美国产第一页| 国产aa精品| 一本一生久久a久久精品综合蜜| 亚洲精一区二区三区| 色哟哟免费视频| 中文字幕一区二区日韩精品绯色| 亚洲精品男人的天堂| 精品对白一区国产伦| 韩国中文字幕在线| 国产精品一区二区三区久久| 亚洲精品推荐| 日韩在线一级片| 成a人片国产精品| 四虎成人精品永久免费av| 日韩一区二区影院| av在线导航| 96国产粉嫩美女| 婷婷成人基地| 亚洲va在线va天堂va偷拍| 中文字幕免费不卡在线| 欧美男人天堂网| 亚洲性生活视频在线观看| 成人国产二区| 欧美亚洲免费高清在线观看| 国产欧美日本| 大又大又粗又硬又爽少妇毛片 | 久久精品美女视频网站| 免费视频成人| 在线一区高清| 国产精品中文字幕一区二区三区| 国产免费无码一区二区视频| 亚洲国产精品久久久久秋霞影院 | 亚洲福利视频二区| 欧美一卡二卡| 成人午夜电影在线播放| 国产精品hd| 亚洲av成人无码一二三在线观看| 亚洲一区二区三区四区五区黄 | 成人国产在线看| 国产v综合v亚洲欧| 国产第一页在线播放| 亚洲国产精品中文| 成人福利视频| 亚洲一区二区三区精品动漫| 久久99久久精品欧美| 国产午夜精品理论片| 欧美成人国产一区二区| 波多野结衣在线高清| 久久久久久久免费| 丝袜亚洲另类欧美| av最新在线观看| 日韩精品一区二区三区蜜臀| 91福利在线免费| 免费一区二区三区在在线视频| 久久在线精品| 亚洲一区电影在线观看| 欧美va天堂va视频va在线| 免费成人在线电影| 亚洲国产一区二区精品视频| 久久99国产精品久久99果冻传媒| 久热这里有精品| 亚洲国产精品悠悠久久琪琪| 精品日韩视频| 日韩a级黄色片| 国产亚洲制服色| www.精品视频| 国产精品久久久久久超碰| 亚洲电影影音先锋| 国产精品无码永久免费不卡| 精品视频999| 99re6在线精品视频免费播放| 日本黑人久久| 成人性生交大片免费| 一区二区三区影视| 亚洲激情小视频| 欧美黄页免费| 久久视频这里有精品| 国产精品麻豆视频| 少妇精品视频一区二区| 国产精品久久久久999| 精品动漫3d一区二区三区免费版| 小早川怜子久久精品中文字幕| 欧美一区二区三区人| 日韩电影免费观| 99久久免费观看|