精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta超級(jí)智能實(shí)驗(yàn)室又發(fā)論文,模型混一混,性能直接SOTA

人工智能 新聞
本文中,來(lái)自 Meta、倫敦大學(xué)學(xué)院機(jī)構(gòu)的研究者提出類專家 Soup(Soup Of Category Experts, SoCE),這是一種基于模型 Souping 的系統(tǒng)化方法,它利用基準(zhǔn)測(cè)試的類別構(gòu)成來(lái)挑選最優(yōu)模型候選,并通過(guò)非均勻加權(quán)平均來(lái)最大化整體性能。

大語(yǔ)言模型(LLM)在眾多領(lǐng)域展現(xiàn)出卓越的能力,但它們的訓(xùn)練依然高度依賴算力和時(shí)間,需要龐大的計(jì)算資源以及精細(xì)的訓(xùn)練流程設(shè)計(jì)。

模型 Souping(Model Souping) ,即對(duì)同一架構(gòu)的多個(gè)模型進(jìn)行權(quán)重平均,形成一個(gè)新的、更強(qiáng)的模型。相比訓(xùn)練一個(gè)龐大的統(tǒng)一模型,souping 更輕量、成本更低,同時(shí)能夠融合模型的互補(bǔ)能力。

然而,傳統(tǒng)的模型 souping 方式通常采用簡(jiǎn)單的均勻平均,即把所有候選模型的參數(shù)直接做等權(quán)融合。

本文中,來(lái)自 Meta、倫敦大學(xué)學(xué)院機(jī)構(gòu)的研究者提出類專家 Soup(Soup Of Category Experts, SoCE),這是一種基于模型 Souping 的系統(tǒng)化方法,它利用基準(zhǔn)測(cè)試的類別構(gòu)成來(lái)挑選最優(yōu)模型候選,并通過(guò)非均勻加權(quán)平均來(lái)最大化整體性能。

與以往均勻平均方法不同,本文基于一個(gè)關(guān)鍵觀察:不同基準(zhǔn)類別之間的模型性能往往呈現(xiàn)弱相關(guān)性。因此,SoCE 能夠?yàn)槊總€(gè)弱相關(guān)的類別簇挑選對(duì)應(yīng)的專家模型,并通過(guò)優(yōu)化的加權(quán)方式(而非統(tǒng)一權(quán)重)將它們組合起來(lái)。

實(shí)驗(yàn)結(jié)果表明,SoCE 大大提升了模型效果與穩(wěn)健性,包括在多語(yǔ)言能力、工具調(diào)用、數(shù)學(xué)推理等任務(wù)上,并在 Berkeley Function Calling 排行榜上取得了 SOTA 成績(jī)。

  • 論文地址:https://arxiv.org/pdf/2511.13254
  • 項(xiàng)目地址:https://github.com/facebookresearch/llm_souping?tab=readme-ov-file
  • 論文標(biāo)題:Souper-Model: How Simple Arithmetic Unlocks State-of-the-Art LLM Performance

方法介紹

SoCE 基于這樣一個(gè)洞見(jiàn):基準(zhǔn)測(cè)試中不同類別的模型表現(xiàn)往往呈現(xiàn)高度異質(zhì)的相關(guān)結(jié)構(gòu)。不同模型在不同類別上展現(xiàn)出各自的專長(zhǎng),一些類別之間強(qiáng)相關(guān),而另一些類別之間相關(guān)性較弱,甚至可能呈負(fù)相關(guān)。

研究者為了說(shuō)明這一現(xiàn)象,他們選擇分析 Berkeley Function Calling Leaderboard(BFCL)。BFCL 包含多種不同類型的函數(shù)調(diào)用任務(wù),例如:多輪函數(shù)調(diào)用。這些任務(wù)分別測(cè)試模型不同方面的能力,因此非常適合用來(lái)觀察類別間的能力相關(guān)性。

他們制作了一張相關(guān)性熱力圖(correlation heatmap),顏色越深代表相關(guān)性越強(qiáng)。

強(qiáng)相關(guān)(深綠色區(qū)域):多輪任務(wù)之間的相關(guān)性極高,介于 0.96 到 0.98 之間。這意味著一個(gè)模型如果在某個(gè)多輪任務(wù)上表現(xiàn)優(yōu)秀,它通常在所有多輪相關(guān)場(chǎng)景中都能保持同樣的優(yōu)勢(shì)。

弱相關(guān)甚至負(fù)相關(guān)(淺綠色區(qū)域):二者之間的相關(guān)性僅 0.07。這幾乎意味著它們是兩個(gè)完全不同的能力維度。一個(gè)模型即便在結(jié)構(gòu)化的多輪場(chǎng)景中表現(xiàn)良好,也并不保證在真實(shí)用戶采集的開(kāi)放式函數(shù)調(diào)用任務(wù)中表現(xiàn)可靠。

SoCE 利用上述相關(guān)性模式,來(lái)有策略地選擇并加權(quán)模型進(jìn)行 souping(參數(shù)融合)。其核心思想是:為每個(gè)弱相關(guān)類別簇找到最擅長(zhǎng)該類別的專家模型,并通過(guò)優(yōu)化后的加權(quán)平均將它們?nèi)诤希瑥亩Y(jié)合模型間互補(bǔ)的能力。

算法 1 對(duì)整個(gè)流程進(jìn)行了形式化描述,包含四個(gè)關(guān)鍵步驟:

  • 相關(guān)性分析:識(shí)別類別之間的弱相關(guān)(或不相關(guān))類別對(duì);
  • 專家模型選擇:根據(jù)性能排名,為每個(gè)類別挑選表現(xiàn)最好的專家模型;
  • 權(quán)重優(yōu)化:尋找能最大化整體性能的加權(quán)方案;
  • 加權(quán)模型 souping:根據(jù)優(yōu)化后的權(quán)重對(duì)模型進(jìn)行加權(quán)融合,得到最終模型。

權(quán)重優(yōu)化階段,在一組統(tǒng)一的權(quán)重范圍內(nèi)進(jìn)行搜索。具體而言,對(duì)每個(gè)模型的權(quán)重從 0.1 到 0.9,以 0.1 為步長(zhǎng),遍歷所有可能的權(quán)重組合。

實(shí)驗(yàn)

作者進(jìn)行了大量實(shí)驗(yàn),以評(píng)估 SoCE 在多個(gè)維度上的有效性。

作者在 BFCL 基準(zhǔn)上對(duì)兩組模型進(jìn)行了對(duì)比,分別是 700 億參數(shù)和 80 億參數(shù)的密集模型。

對(duì)于 70B 模型,他們從官方排行榜中篩選出 4 個(gè)候選模型,并在這些模型上應(yīng)用了 SoCE 方法。結(jié)果顯示,SoCE 在 BFCL 上取得了 80.68% 的準(zhǔn)確率,創(chuàng)造了新的 SOTA,相比此前表現(xiàn)最佳的單模型 xLAM-2-70b-fc-r(78.56%)提升了 2.7%。

最佳模型配置由 xLAM-2-70b-fc-r、CoALM-70B 和 watt-tool-70B 組成,它們的最優(yōu)權(quán)重分別為 0.5、0.2 和 0.3。

對(duì)于 8B 模型,SoCE 達(dá)到了 76.50% 的準(zhǔn)確率,超越了此前 8B 模型 xLAM-2-8b-fc-r,相對(duì)提升達(dá) 5.7%。其最優(yōu)權(quán)重配置為:

  • xLAM-2-8b-fc-r:0.7
  • ToolACE-2-8B:0.2
  • watt-tool-8B:0.1

作者還進(jìn)行了消融研究,結(jié)果都顯示,無(wú)論是 70B 還是 8B,SoCE 的模型選擇步驟都帶來(lái)了性能提升。

表 2a 展示了模型在 MGSM(Multilingual Grade School Math)基準(zhǔn)上的實(shí)驗(yàn)結(jié)果。SoCE 的表現(xiàn)優(yōu)于所有候選模型以及平均 souping。

隨后,作者在 MGSM、BFCL、FLORES-36 等多個(gè)基準(zhǔn)上,對(duì)大量候選模型的 checkpoint 進(jìn)行了系統(tǒng)的 model souping 實(shí)驗(yàn)與評(píng)估,并據(jù)此得出以下關(guān)鍵結(jié)論:

類別間線性相關(guān)性在模型 Souping 之后顯著提升:如圖 2 所示。

各類別整體性能穩(wěn)定提升:例如,對(duì)于在 Llama-70B 基礎(chǔ)上微調(diào)的 checkpoint,在 37 項(xiàng)模型 Souping 實(shí)驗(yàn)中的 35 項(xiàng)中,Soup 后的候選模型在 36 個(gè)類別中有超過(guò) 20 個(gè)類別的指標(biāo)得分更高,并且在所有類別上的凈性能增益均為正(見(jiàn)圖 5)。

圖 3a 和 3b 所示,SoCE 能夠找到不同類別的專長(zhǎng)模型,從而帶來(lái)顯著性能提升。

了解更多內(nèi)容,請(qǐng)參考原論文。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-09-08 23:19:25

2025-09-12 09:11:54

Meta語(yǔ)言模型LSP

2025-09-22 10:41:42

2025-07-01 09:04:00

2025-08-20 09:10:00

2025-09-26 08:59:36

2023-10-17 12:33:27

AI模型

2025-10-23 10:17:20

2025-07-02 01:40:00

OpenAI人工智能扎克伯格

2021-08-04 09:48:05

數(shù)字化

2025-08-20 12:41:10

2018-02-07 16:49:20

浦發(fā)銀行

2025-10-11 18:05:23

智能論文AI

2015-02-06 09:23:52

賽可達(dá)實(shí)驗(yàn)室網(wǎng)絡(luò)安全

2015-10-10 11:23:49

2011-05-25 17:51:40

2017-10-12 15:51:14

AI人工智能

2025-10-17 09:20:49

2025-07-29 09:06:00

2009-09-21 11:45:36

CCIE實(shí)驗(yàn)室考試
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

91精品一区二区三区在线观看| 久久精品视频免费| 欧美高清第一页| 男女一区二区三区| 欧美大片1688| 亚洲日本欧美天堂| 久久国产精品-国产精品| 黄色网址中文字幕| 欧美成人久久| 亚洲人av在线影院| 人妻体体内射精一区二区| 亚洲美女炮图| 亚洲啪啪综合av一区二区三区| 精品国产中文字幕| 一级久久久久久久| 国产精品亚洲产品| 日韩在线播放av| 国产夫妻性爱视频| 国产精品久一| 91精品1区2区| 精品久久久无码人妻字幂| 韩国精品视频| 国产成人午夜电影网| 国产99在线|中文| 久久久久久久久久综合 | 亚洲久久一区二区| 中文字幕日韩欧美在线视频| 国产婷婷在线观看| 国产乱码精品一区二区三区亚洲人| 欧美日韩国产专区| 一级性生活视频| 免费黄色网页在线观看| 久久久国产精品不卡| 国产欧美日韩综合一区在线观看| 国产伦理吴梦梦伦理| 老鸭窝91久久精品色噜噜导演| 欧美成人在线影院| 日韩一区二区三区四区视频| 久久爱www成人| 亚洲黄色av女优在线观看| 99精品视频免费版的特色功能| 成人免费视频观看| 精品久久久久久久久久久久久| 免费日韩在线观看| 国产理论在线观看| 国产精品二区一区二区aⅴ污介绍| 六月婷婷久久| 午夜在线观看视频18| 成人av资源在线| yellow视频在线观看一区二区| 91亚洲国产成人久久精品麻豆| 久久精品人人| 青青草原成人在线视频| 国产成人免费看| 亚洲欧美伊人| 欧美丰满少妇xxxxx做受| 免费国产羞羞网站美图| 亚洲国产一成人久久精品| 日韩在线观看你懂的| 亚洲色图100p| 亚洲国产成人精品女人| 欧美成人一区二区三区电影| 国产小视频在线看| 亚洲精品三级| 欧美综合在线第二页| 免费看污视频的网站| 蜜臀av性久久久久av蜜臀妖精| 国产精品久久国产精品99gif| а中文在线天堂| 久久精品国产网站| 91久久久国产精品| 亚洲卡一卡二卡三| 99久久综合国产精品| 麻豆成人在线播放| 成人在线观看黄色| 中文字幕在线不卡| 成人免费看片视频在线观看| 欧美hdxxxxx| 午夜精品久久久久久久久| www.亚洲天堂网| 日韩av一级| 日韩欧美一卡二卡| 国产精品久久无码| 清纯唯美综合亚洲| 久久99视频精品| 久久国产视频精品| 美女www一区二区| 99re视频在线| 加勒比一区二区三区在线| 综合中文字幕亚洲| 男女视频网站在线观看| 高清成人在线| 欧美一区二区三区视频在线| 特大黑人巨人吊xxxx| 国产真实有声精品录音| 久久影院资源网| 日本视频在线观看免费| 激情国产一区二区| 麻豆av一区二区三区久久| 免费网站免费进入在线| 亚洲高清一区二区三区| 手机视频在线观看| 精品福利一区| www.xxxx欧美| 老熟妇仑乱一区二区av| 国产一区在线精品| 久久综合一区| 美女精品导航| 欧美另类高清zo欧美| 粉嫩av懂色av蜜臀av分享| 日韩精品欧美| 国产成人精品在线播放| 亚洲国产中文字幕在线| 日本一区二区三区在线不卡 | 欧美性生给视频| 99精品视频免费| 91精品天堂| 日本在线www| 色一情一乱一乱一91av| 中文字幕永久免费| 久久国产成人精品| 日韩av高清不卡| 可以免费观看的毛片| 中文字幕亚洲一区二区va在线| 日本a级片免费观看| 一区二区三区免费在线看| 日韩在线资源网| 成年人晚上看的视频| 97se亚洲国产综合自在线 | 国产亚洲精品久久久久婷婷瑜伽| 91在线色戒在线| 色影视在线观看| 91福利国产精品| 美国黄色一级毛片| 亚洲激情亚洲| 国产精华一区二区三区| 91香蕉在线观看| 欧美乱熟臀69xxxxxx| 国产视频三区四区| 日韩高清在线不卡| 欧美久久久久久久| 偷拍中文亚洲欧美动漫| 精品视频久久久久久| 日本一区二区三区四区五区| 成人性生交大片| 福利在线一区二区| 涩爱av色老久久精品偷偷鲁| 欧美精品在线第一页| 国产精品视频一区二区三区,| 国产精品久久久久影视| 久久久精品麻豆| 日韩电影一区| 国产在线观看精品| 日本www在线| 666欧美在线视频| www.色小姐com| 国产一二精品视频| 日本精品福利视频| 波多野结衣在线一区二区| 久久久亚洲福利精品午夜| 国产www视频| 亚洲午夜免费视频| 久久人人妻人人人人妻性色av| 99精品视频免费| 欧美日韩国产免费一区二区三区| 日日夜夜天天综合| 最近2019年中文视频免费在线观看| 中文字幕人成人乱码亚洲电影| 国产精品毛片a∨一区二区三区| 色婷婷.com| 欧美另类女人| 久久精品女人的天堂av| 日韩精品三区| 久久精品在线视频| 成人乱码一区二区三区| 色综合中文综合网| 久久一级免费视频| 国产成人综合网| 日韩人妻精品无码一区二区三区| 国产一区网站| 99视频在线免费观看| 麻豆mv在线看| 亚洲性av网站| 亚洲国产www| 91福利在线免费观看| 九九精品视频免费| yourporn久久国产精品| 国产免费999| 欧美三级第一页| 秋霞在线观看一区二区三区| 9999精品免费视频| 97精品伊人久久久大香线蕉| 国产黄色片在线播放| 91精品国产综合久久福利软件| 日韩av黄色片| 国产精品家庭影院| www.日本高清| 精品综合久久久久久8888| 日韩av在线播放不卡| 日本一区二区三区视频| 国产精品毛片一区视频| 国产一区一一区高清不卡| 久99九色视频在线观看| 国产视频精选在线| 欧美精品一区男女天堂| 亚洲天堂男人网| 亚洲v中文字幕| 国产wwwwxxxx| 久久久久久影视| 国产成人av片| 国产一区二区三区在线观看免费| 黄色片一级视频| 欧美午夜一区| 亚洲午夜精品久久久中文影院av| 精品三级在线观看视频| 91热福利电影| 日本黄色成人| 国产精品福利在线观看网址| av中文字幕在线观看第一页| 乱亲女秽乱长久久久| 国产系列在线观看| 亚洲精品久久久久中文字幕二区| 国产视频在线免费观看| 欧美这里有精品| 天堂中文在线网| 亚洲成人资源在线| 成人免费视频网站入口::| 欧美激情综合在线| 久久国产精品影院| 波多野结衣在线一区| 日本成人在线免费| 国产精品资源站在线| 欧美日韩中文不卡| 七七婷婷婷婷精品国产| 日韩欧美精品在线观看视频| 国产毛片一区| 5月婷婷6月丁香| 亚洲经典自拍| www..com日韩| 欧美女激情福利| 国产精品av免费观看| 久久久久久影院| 国产高清免费在线| 亚洲精品99| 蜜臀av性久久久久蜜臀av| 五月久久久综合一区二区小说| 亚洲精品高清视频| 久久综合av| 久久久国产精华液999999| 99久久九九| 午夜探花在线观看| 亚洲欧美文学| 亚洲国产精品无码av| av不卡在线看| 国产精品wwwww| 奇米影视7777精品一区二区| 男人插女人下面免费视频| 日韩精品电影在线观看| 九色91popny| 激情综合亚洲精品| 少妇性l交大片7724com| 成人性生交大片| 性欧美13一14内谢| 国产女主播一区| 国产wwwwxxxx| 亚洲国产精品一区二区久久恐怖片| 久久高清免费视频| 色老汉一区二区三区| 中文字字幕在线观看| 日韩一区和二区| 日日夜夜精品免费| 亚洲美女精品成人在线视频| yourporn在线观看中文站| 日韩中文字幕在线播放| 羞羞的视频在线看| 992tv在线成人免费观看| 国产免费不卡| 91色精品视频在线| 一区二区三区国产好| 欧美日韩精品免费在线观看视频| 成人影视亚洲图片在线| 国产免费内射又粗又爽密桃视频| 亚洲巨乳在线| 国产成年人视频网站| 成人精品小蝌蚪| 黄色av免费播放| 亚洲激情自拍偷拍| 久久久久久久久久久影院 | 天堂中文在线看| 中文在线不卡视频| 国产蜜臀在线| 国产精品久久久亚洲| silk一区二区三区精品视频| 欧美日韩精品中文字幕一区二区| 亚洲区综合中文字幕日日| 欧美在线观看www| 韩国av一区二区三区四区| 污污内射在线观看一区二区少妇 | 日韩免费观看一区二区| 欧美在线高清视频| 亚洲精品视频91| 最近免费中文字幕视频2019| av中文字幕在线看| 成人黄色午夜影院| 亚洲色图美女| 欧美日韩视频免费| 奇米在线7777在线精品| 漂亮人妻被黑人久久精品| |精品福利一区二区三区| 中文字幕视频网| 欧美大片在线观看一区二区| www.亚洲视频| 1769国内精品视频在线播放| 蜜桃精品一区二区三区| 欧美在线视频二区| 99精品视频免费观看视频| 91蝌蚪视频在线| 国产精品乱码妇女bbbb| 亚洲GV成人无码久久精品 | 91久久精品久久国产性色也91| 久久99久久人婷婷精品综合 | 免费精品视频在线| 中国av免费看| 一区二区三区在线观看网站| 亚洲最大成人在线视频| 亚洲图片欧美午夜| 澳门成人av网| 久久综合给合久久狠狠色| 国产精品大片| 超碰人人cao| 亚洲欧美日韩一区二区| 亚洲天堂中文字幕在线| 国产一区二区三区在线播放免费观看| 国产免费拔擦拔擦8x高清在线人| 亚洲一区二区三区sesese| 99久久99热这里只有精品| 亚洲精品一二三四五区| 国产亚洲精品7777| 欧美黑人一区二区| 亚洲精品国产精品自产a区红杏吧| www欧美xxxx| 国产精品伊人日日| 在线不卡欧美| 小毛片在线观看| 偷偷要91色婷婷| 四虎精品成人影院观看地址| 午夜精品久久久久久久久久久久| 操欧美女人视频| 免费国产黄色网址| aaa国产一区| 免费看一级视频| 亚洲系列中文字幕| 国产精品诱惑| 中文字幕久精品免| 国产麻豆精品久久一二三| 中文字幕在线有码| 日韩精品在线看片z| eeuss鲁一区二区三区| 国产在线一区二区三区四区| 国产精品女主播一区二区三区| 国产又黄又粗又猛又爽的视频 | 欧美日韩国产第一页| 成人春色在线观看免费网站| 妞干网视频在线观看| 91视频在线看| 日韩不卡高清视频| 久久九九全国免费精品观看| 一区二区精彩视频| 男人添女荫道口图片| 国产亚洲污的网站| 一级做a爱片性色毛片| 另类专区欧美制服同性| 久久99国产精品久久99大师| 国产男女激情视频| 中文字幕在线观看一区二区| 亚洲精品一区二区口爆| 日韩免费av一区二区| 国产精品成人a在线观看| 制服下的诱惑暮生| 精品久久久久久久久久久| 91精品大全| 韩日午夜在线资源一区二区| 日韩va亚洲va欧美va久久| 激情小说中文字幕| 亚洲男人av电影| 国产精品视频首页| 少妇无码av无码专区在线观看 | 一二三四中文字幕| 91在线视频官网| 亚洲综合网av| 97在线视频免费看| 日韩系列欧美系列| 国产成人精品无码片区在线| 欧美日韩精品一区二区三区蜜桃 | 国产三区视频在线观看| 久久综合一区二区三区| 国产一区二区三区在线观看免费| 久久精品无码av| 久久99亚洲精品| 日韩精品久久久久久久电影99爱|