精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

只需一次指令微調,大模型變身全能專家天團,8B模型性能反超全微調基線 | ACL25 Oral

人工智能
當前預訓練語言大模型(LLM)雖具備通用能力,但適應專業領域需高昂的指令微調成本;稀疏混合專家(SMoE)架構作為可擴展的性能-效率平衡框架,雖能提升推理效率并靈活擴展模型容量,但其從頭訓練消耗巨大資源,因此復用密集大模型參數的升級改造(LLM Upcycling)成為更具成本效益的替代方案。

只需一次指令微調,即可讓普通大模型變身“全能專家天團”?

  • 改造位置自動定位
  • 專家協作動態平衡
  • 8B模型性能反超全微調基線1.6%,安全指標暴漲10%,推理內存直降30%!

圖片圖片

當前預訓練語言大模型(LLM)雖具備通用能力,但適應專業領域需高昂的指令微調成本;稀疏混合專家(SMoE)架構作為可擴展的性能-效率平衡框架,雖能提升推理效率并靈活擴展模型容量,但其從頭訓練消耗巨大資源,因此復用密集大模型參數的升級改造(LLM Upcycling)成為更具成本效益的替代方案。

圖片圖片

然而現有升級方法存在兩大局限:一是依賴人工經驗選擇可擴展的專家位置(如固定替換FFN層),忽視模型層間動態差異與任務特性;二是缺乏系統機制平衡專家專業化與協作,導致冗余或知識碎片化。

為此,來自浙江大學與Thomson Reuters的研究團隊提出全新解決方案稀疏插值混合專家(SIMoE),只需單階段指令微調,即可將普通大模型自動升級為高性能稀疏專家模型。SIMoE通過結構化稀疏優化自動發現神經元級專家參數子集,創新性地結合專家共享增量參數與掩碼正交懲罰在多項基準測試中實現性能、效率的雙重突破

目前相關研究論文已被ICML 2024、ACL 2025 Oral接收,代碼及項目網址也已在GitHub上公開。

圖片圖片

△ICML2024接收

圖片圖片

△ACL 2025 Oral接收

傳統改造為何失靈?

當前大模型升級改造方法用于大模型專業領域適配面臨雙重困境:

局限性一:升級改造位置依賴經驗性設計,缺乏自適應機制。

現有方法在決定大模型參數中”何處升級”(where-to-upcycle)時,普遍采用啟發式規則,例如固定選擇FFN層或Attention模塊進行升級,擴展成為SMoE模組。這種靜態升級策略忽視了兩個關鍵因素:

1、模型特異性:同一預訓練大模型中不同層/參數對模型整體功能的重要性存在顯著差異;2、領域適配需求:不同領域任務會要求特定最優升級位置。

這種算法-模型-數據的脫節導致升級策略僵化,無法自適應特定任務場景,最終導致領域適配性差。如下表所示,傳統經驗性固定升級策略(i.e.,Learnable Upcycling)—例如升級所有FFN層—對比SIMoE的動態升級策略,其ROUGE-L分數低于SIMoE 1.6–2.5%。

圖片圖片

局限性二:專家專業化與協作機制缺失

現有方法缺乏系統化機制平衡專家專業化與協同合作:

1、專業化不足:為促進知識共享,傳統SMoE框架常采用固定共享專家強制協作機制。然而,此類設計會抑制領域專家的專業化能力,極端情況下甚至引發模型崩潰(model collapse)——表現為專家間參數趨同。

2、協作低效:為促進專家專業化,部分升級方法[1]采用獨立微調策略——先針對不同領域數據訓練多個領域專家,再通過額外訓練階段將其合并為統一SMoE模型。然而,獨立訓練阻礙了知識遷移,導致專家參數冗余。

專業化與協作失衡導致泛化性能次優及資源浪費。如圖表所示,當前升級方法[1]相較于SIMoE存在性能與參數效率上的雙重差距。

圖片圖片

圖片

全新升級改造框架:稀疏插值專家

圖片圖片

稀疏插值專家(SIMoE)在概念上類似于MoE原理,通過軟合并來路由和組合特定專家參數,但在實現上與傳統MoE架構不同。SIMoE將每個「插值專家」定義為共享網絡中稀疏參數的特定子集

具體而言,SIMoE包括可訓練的共享的專家參數集θδ(shared expert parameters)和M個可訓練的獨立專家掩碼集圖片(expert masks)。在前向計算中,SIMoE(1)通過由路由網絡hζ生成的加權系數α合并專家,(2)然后與凍結的預訓練大型語言模型參數θpre結合。(3)在指令微調階段,同步施加化稀疏約束(sparsity constraint)與正交懲罰(orthogonality)于可訓練掩碼,在優化標準NLL損失的同時自動化確定升級位置(where-to-upcycle),促進專家專業化與協同合作。

創新1:結構化稀疏升級——將專家定位轉化為可學習的稀疏優化問題

面對傳統LLM升級中人工選擇升級層位的局限,提出一種根本性解法:將”何處升級”轉化為結構化稀疏優化問題。通過在基座模型的每個線性層引入可學習二進制掩碼圖片,構建SIMoE參數更新機制:

圖片

這一設計可帶來三重優勢:

首先,神經元級升級定位實現全局優化。通過引入L0稀疏約束構建可控優化目標:

圖片

其中圖片表示掩碼的期望稀疏度,τ為目標稀疏度。該拉格朗日對偶優化框架通過動態調整λ值,驅使掩碼稀疏度收斂至目標值τ,從而自動篩選基座模型中(1-τ)比例的參數進行升級改造。

其次,結構化稀疏設計攻克硬件瓶頸。當傳統專家參數量級掩碼圖片導致模型所需訓練參數暴漲M倍時,提出將掩碼維度壓縮至輸入神經元數圖片。這種硬件友好型稀疏產生連續內存塊,直接匹配GPU存取模式,使訓練峰值內存降低30%,同時維持神經元級控制粒度——這是實現8B基座模型可擴展性的關鍵。

最終,凍結基座與稀疏增量協同守護知識完整性。式中θpre的凍結設計確保預訓練知識不受擾動,避免指令微調時的災難性遺忘。配合75%稀疏約束τ=0.75,推理時自動剪枝零值神經元級專家,最終模型尺寸較BTX [1] 縮減66%(10.4B vs 30.58B)。

實驗發現

  • LayerNorm層改造強度超30% - 傳統方法忽視的關鍵區域
  • 注意力門控層僅需不到10%改造 - 顛覆”注意力層最重要”的固有認知
  • 多種類別層參與學習的改造方案 - 實現最佳性能,告別手動改造次優解

圖片圖片

創新2:專家團隊內的”防內卷協議”-協作,獨立的完美平衡

區別于傳統SMoE,通過參數共享降低冗余正交約束保證專家專業化的協同的平衡,其數學本質是鼓勵學習一組正交掩碼圖片對共享參數進行結構化調制,使各專家在共享知識基座θδ上形成互補的專業化能力圖片

  • 參數高效:僅需存儲一份θδ,避免參數冗余,大大節約訓練開銷
  • 知識遷移:梯度更新圖片聚合所有專家信號,促進跨任務泛化
  • 專家專業化:每個專家獨享可學習的神經元二進制掩碼→通過對掩碼的正交懲罰 → 自動篩選適領域特定專業化參數

應用場景多適配:

小樣本視覺任務:給定少量任務樣本→動態訓練特定任務的教師模型→通過知識蒸餾引導「插值專家」模型的組合泛化能力,訓練效率提升43%

零樣本指令遵循:通過對「插值專家」二進制掩碼的正交約束→鼓勵「插值專家」參數專業化→通過訓練,達到知識共享于領域專業化的黃金平衡

圖片圖片

實驗驗證

視覺基座模型驗證:Meta-Dataset大規模視覺小樣本學習基準測試。

圖片圖片

SMAT(SIMoE的視覺版本)在零樣本和小樣本遷移場景中全面超越基線模型,OOD任務表現尤為驚艷:在零樣本設置下,SMAT平均準確率達67.65%,較最佳基線提升2.8%;在小樣本場景(few-shot, with gradient-based fine-tuning)中,SMAT以75.02%的準確率刷新SOTA紀錄。

自然語言基座模型驗證:SuperNaturalInstruction跨任務泛化能力基準測試。

圖片圖片

SIMoE在跨任務泛化能力上展現統治級表現。在12類未見任務中,SIMoE在9類任務上顯著領先:3B模型較全微調基線提升2.5%,8B模型提升1.6%。

自然語言基座模型驗證:Tulu-v3 SFT Mixture多領域泛化能力基準測。

圖片圖片

SIMoE在大規模場景仍保持性能統治力。面對8B參數基座模型和百萬級指令數據,SIMoE在MMLU、GSM8K等12項核心基準平均得分61.1%,以0.6%優勢超越當前SOTA模型Tülu-v3-8B-SFT,在指令遵循(IFEval +1.3%)和安全測試(Safety +1.7%)等任務中展現明顯優勢。

引用文獻:

[1] Sainbayar Sukhbaatar, et al. “Branch-train-mix: Mixing expert LLMs into a mixture-of-experts LLM”. In First Conference on Language Modeling.

論文鏈接:

ICML 2024:https://arxiv.org/abs/2403.08477

ACL 2025:https://arxiv.org/pdf/2506.12597

項目鏈接:

https://szc12153.github.io/sparse_meta_tuning/

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-06-07 08:22:59

LLM微調技術

2024-09-26 10:42:20

2024-05-27 09:16:37

2023-09-23 12:35:19

模型參數

2025-04-10 07:59:51

2024-09-09 07:46:16

2023-12-18 13:37:44

天翼云天池大語言模型

2025-10-14 09:00:00

2025-09-03 09:13:18

2023-08-14 13:29:37

2024-12-30 00:01:00

多模態大模型Python

2025-02-28 10:25:09

2025-02-17 12:30:00

2025-05-13 05:11:00

推理模型微調

2024-05-07 08:00:00

自然語言處理機器學習

2024-03-25 08:00:00

2024-04-15 12:50:00

大型語言模型ReFT

2025-05-28 11:42:14

模型框架AI

2024-07-22 08:17:00

模型性能

2024-01-18 15:38:17

語言模型大型語言模型
點贊
收藏

51CTO技術棧公眾號

欧美性猛交xxxx乱大交蜜桃| 一本一道人人妻人人妻αv| 国产成a人亚洲精v品无码| 精品国产导航| 精品在线观看视频| 日韩精品中文字幕久久臀| 91精品国产一区| 在线观看亚洲色图| 亚洲欧美综合在线观看| 亚洲综合小说| 欧美日本免费一区二区三区| 欧美日韩精品一区| 日韩aaaaaa| 天堂久久av| 亚洲天天做日日做天天谢日日欢 | 91久久精品美女高潮| 美女又爽又黄视频毛茸茸| 亚洲七七久久综合桃花剧情介绍| 欧美三级三级| 在线观看网站黄不卡| 久久久综合亚洲91久久98| 久久精品美女视频| 国产一级成人av| 亚洲大片在线观看| 国产美女在线精品免费观看| 精品一区二区三区四| 精品一区二区三区中文字幕| 国产精品久久久久久久久动漫| 国产v综合ⅴ日韩v欧美大片 | 国产91精品入| 4438亚洲最大| 超碰97在线看| 午夜精品一二三区| 国内成人在线| 日韩三级在线观看| 亚洲理论电影在线观看| 欧美视频在线观看一区二区三区| 亚洲午夜av| 日韩中文字幕欧美| 日本一二三区在线| 天堂8中文在线| 国产精品色眯眯| 成人写真视频福利网| 国产精品久久久精品四季影院| 国产人与zoxxxx另类91| 一区二区国产盗摄色噜噜| 国产二区一区| 少妇高潮av久久久久久| 成人动漫免费在线观看| 日韩激情av在线免费观看| 日韩精品一区二区三区色欲av| av黄色在线观看| 国产久卡久卡久卡久卡视频精品| 欧美国产日韩二区| 亚洲一区二区三区蜜桃| 日本精品久久| 亚洲国产精品一区二区www| 裸体大乳女做爰69| 天天操天天干天天爱| 久久在线精品| 九九久久久久99精品| 在线观看国产网站| 日韩成人一区| 欧美欧美欧美欧美| 女人天堂av手机在线| jzzjzzjzz亚洲成熟少妇| 国产精品羞羞答答xxdd| 亚洲一区二区三区四区视频| 欧美a∨亚洲欧美亚洲| 久久影视一区| 日韩精品免费在线视频| 艳妇乳肉亭妇荡乳av| 欧美顶级毛片在线播放| 欧美喷潮久久久xxxxx| 日本三级黄色网址| 视频欧美精品| 欧美大胆人体bbbb| 一路向西2在线观看| 免费一二一二在线视频| 亚洲三级在线播放| 激情六月天婷婷| 98在线视频| 亚洲欧洲www| 欧美日韩国产免费一区二区三区| 久草视频在线看| 国产成人aaa| 91精品国产综合久久久久久久久| 国内免费精品视频| 午夜天堂精品久久久久| 中文字幕亚洲欧美一区二区三区| 精品影片一区二区入口| 久久的色偷偷| 亚洲精品久久久久中文字幕欢迎你| 欧洲美女亚洲激情| 国产一区丝袜| 自拍偷拍亚洲一区| 久久久久亚洲天堂| 日韩二区在线观看| 欧美在线视频一区| 黄色片视频网站| 日韩精品免费专区| 成人3d动漫一区二区三区91| 国产精品亚洲欧美在线播放| 乱人伦精品视频在线观看| 久久久久久999| 久久久久久国产精品免费播放| 国产视频亚洲| 欧美在线视频免费播放| 国产精品嫩草影院精东| 99久久精品国产一区| 国产精品播放| 在线视频二区| 精品国产乱码久久久久久婷婷| 久无码久无码av无码| 国产第一精品| 欧美高清dvd| 91精品国产自产| 国精品一区二区三区| 国产女同一区二区| 国产精品国产三级国产aⅴ| 9久草视频在线视频精品| 精品无人乱码一区二区三区的优势| 欧美一级淫片免费视频魅影视频| 中文字幕av资源一区| 中文字幕一区二区三区精彩视频 | 欧美成人一二三| 亚洲最大的黄色网址| 性欧美长视频| 国产精品久久久999| 一区二区三区精| 国产乱国产乱300精品| 性欧美videosex高清少妇| 天天综合视频在线观看| 亚洲三级在线播放| 无需播放器的av| 国产一区二区三区91| 中文字幕九色91在线| 三级黄色在线视频| 成人综合激情网| 欧美精品在线一区| www欧美xxxx| 日本道色综合久久| caoporm在线视频| 91国内精品白嫩初高生| 日韩成人性视频| jizz国产免费| 成人午夜视频在线观看| 老司机激情视频| 日韩三级网址| 久99九色视频在线观看| av免费在线不卡| 亚洲激情网站免费观看| 国产av麻豆mag剧集| 九九九伊在线综合永久| 日韩女优av电影在线观看| 午夜精品一区二区三区视频| 极品尤物av久久免费看| 国外成人在线视频网站| 俄罗斯一级**毛片在线播放| 精品国产一区a| 亚洲理论片在线观看| 在线观看国产精品入口| 91影视免费在线观看| gogogogo高清视频在线| 欧美性xxxxxxxxx| 人妻体内射精一区二区| 三级一区在线视频先锋 | 一区福利视频| 国产精品视频色| 日本高清视频www| 婷婷久久综合九色综合绿巨人| 北岛玲一区二区| 久久久久国产精品午夜一区| 日韩理论片在线观看| 岛国在线视频网站| 69久久夜色精品国产69蝌蚪网| 亚洲一区电影在线观看| 先锋亚洲精品| 四虎永久国产精品| 国产精品一区二区三区www| 欧美日本精品在线| 无码国产精品一区二区色情男同| 精品免费在线观看| mm1313亚洲国产精品无码试看| 成人爽a毛片免费啪啪红桃视频| 日韩中文字幕视频在线| 精品国产九九九| 欧美日韩裸体免费视频| 精品丰满少妇一区二区三区| 国产精品综合| 一区二区三区四区视频在线观看| 中文在线а√天堂| 亚洲成人免费网站| 久久高清无码视频| 国产一区二区精品在线观看| 亚洲成人自拍视频| 久久99久久99精品免观看软件| 日韩av有码在线| 一卡二卡在线观看| 精品久久久久久久久国产字幕| 五月婷婷婷婷婷| 成人午夜av电影| 日本免费色视频| 天天色天天射综合网| 国产精品日韩在线播放| 丰满诱人av在线播放| 最近的2019中文字幕免费一页| 成人免费毛片视频| 久久精品日产第一区二区三区高清版 | 精品产国自在拍| 日韩av电影中文字幕| 日本视频在线观看一区二区三区| 亚洲不卡在线观看| 国产黄色三级网站| 国产精品夜夜嗨| 日韩av在线中文| 久久久久网站| 老太脱裤子让老头玩xxxxx| 国产精品99一区二区三区| 麻豆91av| 电影在线观看一区二区| 午夜精品在线视频| 欧美3p视频在线观看| 在线观看一区日韩| 国产一级特黄aaa大片| 亚洲手机成人高清视频| www色com| 国产福利一区在线| 91九色丨porny丨国产jk| 久久久久高潮毛片免费全部播放| 成人黄色av网| 精品福利在线| 久久999免费视频| 瑟瑟视频在线| 中文字幕欧美日韩精品| 日本亚洲欧美| 精品视频在线观看日韩| 亚洲狼人综合网| 日韩欧美极品在线观看| 国产一级一片免费播放| 一区二区三区免费观看| 亚洲天堂黄色片| 亚洲日本乱码在线观看| 九九这里只有精品视频| 国产精品久久久久久久久快鸭| 国产精品久久免费观看| 国产精品一区三区| 亚洲成人手机在线观看| 国产综合久久久久影院| 激情在线观看视频| 国产美女在线精品| 在线观看你懂的视频| 久久国产精品毛片| 日本成年人网址| 亚洲蜜桃视频| 操bbb操bbb| 欧美成人69| 国产免费一区二区视频| 亚洲精品激情| 中文字幕精品在线播放| 亚洲精品a级片| 蜜桃成人在线| 国产欧美日韩| 一区二区精品视频| 亚洲天堂免费| 久久久亚洲国产精品| 午夜在线播放视频欧美| 人人干人人视频| 黄网站免费久久| 日本一区二区在线观看视频| 美女看a上一区| 国产性xxxx18免费观看视频| 麻豆9191精品国产| 性猛交ⅹ×××乱大交| 国产精品一区二区男女羞羞无遮挡 | 国产69精品久久99不卡| 亚洲天堂资源在线| 中文字幕免费不卡在线| 日韩三级久久久| 久久久久久久久久久99999| 亚洲一区二区三区三州| 麻豆精品一区二区av白丝在线| 少妇高潮喷水在线观看| 久久激情网站| 在线免费观看av网| 不卡一区二区中文字幕| 欧美熟妇另类久久久久久多毛| 成人福利视频网站| 国产7777777| 亚洲国产日韩精品| 中文字幕一区二区三区波野结| 欧美性猛交xxxx乱大交| 国产精品自拍电影| 日韩成人激情视频| jizz性欧美| 日韩免费在线观看视频| 国产高清亚洲| 欧美一区二区三区四区五区六区 | 欧美片第1页| 2020久久国产精品| 理论片午夜视频在线观看| 国产精品精品久久久| 成人影院中文字幕| 亚洲一区高清| 久久人人97超碰国产公开结果| 久久久九九九热| 国产三级精品三级在线专区| 国产一级二级三级| 欧美日产国产精品| 激情综合闲人网| 97视频国产在线| 亚洲超碰在线观看| 中文字幕一区二区三区有限公司 | 1pondo在线播放免费| 91成人福利在线| 亚洲福利合集| 最新国产精品久久| 青青草原综合久久大伊人精品优势 | 91av在线免费| 一区二区在线看| 国产精品无码AV| 在线播放国产一区二区三区| 大乳在线免费观看| 91精品国产高清| 第一区第二区在线| 精品嫩模一区二区三区| 免费在线看一区| 精品无码国产污污污免费网站| 午夜伊人狠狠久久| 午夜精品久久久久久久第一页按摩| 日韩在线观看免费网站 | 97免费资源站| 精品国产导航| 野外做受又硬又粗又大视频√| 国产一区二区调教| 美国一级片在线观看| 精品视频在线视频| 精品人妻无码一区二区| 日韩视频在线免费| 国产精品99| 亚洲在线观看一区| 美洲天堂一区二卡三卡四卡视频| wwwwww日本| 综合分类小说区另类春色亚洲小说欧美 | 日本韩国一区二区| 国产午夜在线观看| 久久不射热爱视频精品| 国产亚洲成av人片在线观看| 国产高清精品一区二区三区| 国产精品观看| 亚洲图片综合网| 日韩欧美在线免费| 国产日韩精品在线看| 国产精品亚洲自拍| 亚洲91精品| 白丝校花扒腿让我c| 国产清纯美女被跳蛋高潮一区二区久久w| 在线观看日本中文字幕| 色综合久久中文综合久久97 | 91成人在线| 亚洲一区二区在| 国产美女精品一区二区三区| 日本天堂中文字幕| 欧洲一区二区三区在线| gogogo高清在线观看免费完整版| 国产精品女视频| 91高清一区| 亚洲自拍偷拍精品| 色综合天天综合狠狠| 在线观看黄色av| 91福利视频导航| 国产欧美丝祙| 中文字幕黄色网址| 欧美一区二区国产| 91成人高清| 亚洲自拍小视频免费观看| 亚洲区国产区| 五月婷婷婷婷婷| 精品国产免费视频| 成人日韩精品| 大陆极品少妇内射aaaaaa| 99久久精品免费精品国产| 亚洲乱码国产乱码精品| 久久久国产精品免费| 亚洲播播91| a级网站在线观看| 99精品桃花视频在线观看| 特级西西444www高清大视频| 亚洲精品一区二区网址| 国产日本久久| 老太脱裤子让老头玩xxxxx| 国产精品午夜电影| 好吊色在线观看| 欧美国产中文字幕| 九九久久婷婷| 亚洲精品中文字幕无码蜜桃| 亚洲免费高清视频在线| 国产又粗又猛又色又| 97精品视频在线播放| 欧美aaaa视频|