精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

人民大學&字節Seed:利用μP實現Diffusion Transformers高效擴展

人工智能 新聞
人大高瓴李崇軒團隊和字節跳動Seed團隊的研究員引入了大語言模型訓練中的μP理論,并將其擴展到diffusion Transformers的訓練中。

本文由中國人民大學高瓴人工智能學院李崇軒團隊和字節跳動Seed團隊共同完成。第一作者鄭晨宇是中國人民大學高瓴人工智能學院二年級博士生,主要研究方向為基礎模型的優化、泛化和可擴展性理論,導師為李崇軒副教授,論文為其在字節跳動Seed實習期間完成。第二作者張新雨是字節跳動研究員,主要研究方向為視覺生成模型。李崇軒副教授為唯一通訊作者。

近年來,diffusion Transformers已經成為了現代視覺生成模型的主干網絡。隨著數據量和任務復雜度的進一步增加,diffusion Transformers的規模也在快速增長。然而在模型進一步擴大的過程中,如何調得較好的超參(如學習率)已經成為了一個巨大的問題,阻礙了大規模diffusion Transformers釋放其全部的潛能。

為此,人大高瓴李崇軒團隊和字節跳動Seed團隊的研究員引入了大語言模型訓練中的μP理論,并將其擴展到diffusion Transformers的訓練中。μP通過調整網絡不同模塊的初始化和學習率,實現不同大小diffusion Transformers共享最優的超參,使得小模型上搜到的超參可以直接遷移到最終大模型上進行訓練,從而極大地減小了超參搜索的耗費。

團隊在DiT,PixArt和MMDiT(Stable Diffusion的基座)上進行了系統的大規模實驗驗證。在MMDiT的實驗中,0.18B小模型上搜得的超參成功被用在18B大模型的訓練中,并擊敗了人工專家的手調基線。其中,小模型超參搜索的計算量(FLOPs)僅是專家手調的3%左右。

團隊已在近期開放在線論文,并開源代碼。

圖片

  • 論文鏈接:https://arxiv.org/abs/2505.15270
  • 代碼倉庫:https://github.com/ML-GSAI/Scaling-Diffusion-Transformers-muP

μP的背景和問題

μP全稱為最大更新參數化(Maximal Update Parametrization),是Tensor Program無窮寬網絡理論系列中的里程碑之作,相關結果已被理論證明適用于標準的Transformer架構。μP的算法實現簡潔,對于應用最為廣泛的AdamW優化器而言,μP只需要調整隱藏層權重的學習率,和輸出層權重的系數以及初始化。μP在實際中被廣泛發現能夠實現不同大小的標準Transformer共享最優的超參,使得小模型上搜到的超參可以直接遷移到大模型,極大地減小了超參搜索的耗費。由于μP帶來了穩定的超參遷移性質,它近年來已經被成功使用在大語言模型(標準Transformer)的預訓練中。

然而,diffusion Transformers和標準Transformer存在較大的差異。從架構上來看,diffusion Transformers引入了額外的模塊來處理并整合文本信息,如DiT中的adaLN block。從任務目標上來看,diffusion Transformers處理的是視覺的擴散學習任務,而標準Transformer主要處理的是語言的自回歸學習任務。這兩點差異意味著已有的μP形式及其超參遷移律在視覺diffusion Transformers中不一定成立。針對這一問題,團隊從理論和實踐上進行了系統的研究。

Diffusion Transformers的μP形式

團隊首先從理論上研究了主流diffusion Transformers的μP形式,包括DiT,U-ViT,PixArt-α和MMDiT。Tensor Program理論系列中的結果表明,如果網絡架構能夠被Tensor Program中定義的算子表示,那么現有的μP形式就能成立。基于這個理論技術,我們證明了:即使主流diffusion Transformers的結構不同于標準Transformer,它們也能夠被Tensor Program表示,因此現有的μP理論和相關實踐可以被無痛遷移到這些主流diffusion Transformers上。我們的證明技術也可以被遷移到其它的diffusion Transformers做類似的分析。

總之,diffusion Transformers的μP方法論可以由下圖總結。我們首先基于μP理論,調節不同權重的系數、初始化和學習率。然后,我們在一系列小模型上搜索得到最優的超參。最后,我們將最優的超參直接遷移到大模型的訓練。

圖片

基于μP擴展Diffusion Transformers:初探

首先,我們使用DiT網絡在ImageNet數據集上系統地驗證了:當網絡寬度,數據批量大小和訓練步數足夠大時(如寬度達到144,批量大小達到256),超參便可以較為穩定地沿著不同的網絡寬度,數據批量大小和訓練步數進行遷移。這意味著我們能在網絡寬度,數據批量大小和訓練步數都更小的代理任務上搜索超參,然后遷移到最終大網絡大數據的訓練。

圖片

然后,為了驗證μP超參遷移的有效性,我們將最優的超參(學習率2^-10)直接遷移到DiT-XL-2的訓練中,我們發現,當模型訓練到2.4M步時,FID-50K就已經超過了原論文7M步最終的FID-50K結果,DiT-XL-2-μP的收斂速度是原論文的2.9倍。這向我們展現了利用μP遷移超參做擴展的良好前景。

圖片

基于μP擴展Diffusion Transformers:大規模驗證

圖片

我們進一步在大規模的文生圖任務上驗證了μP擴展diffusion Transformers的有效性。我們首先考慮了流行的開源文生圖模型PixArt-α,我們在0.04B的代理模型上搜索學習率,并遷移到最終0.61B大小PixArt-α的訓練。其中,小模型搜索超參的計算量總和(FLOPs)僅為一次訓練的5.5%。利用搜索得到的學習率,PixArt-α-μP在訓練的過程中穩定地取得了比基線更好的效果。

圖片

最后,我們考慮了SD3的基座模型MMDiT,并將驗證的規模提高到了18B的量級。為了能夠給社區帶來更多的可信的實踐經驗,我們在 4個超參(學習率,梯度裁剪值,REPA loss的權重以及warmup的步數)上進行了多達80次的隨機搜索,總搜索計算量(FLOPs)約是人工手調的3%。在0.18B模型上的超參搜索結果表明,我們學習率,梯度裁剪值,REPA loss都對結果有影響,其中學習率的影響仍是最為關鍵的。而warmup的步數則對結果影響不大。

圖片

我們將0.18B模型上搜索的超參應用在了18B模型的訓練上,不論從訓練loss的變化還是從人工評測的結果,MMDiT-μP都穩定地超過了人工專家手調的基線,而μP的超參搜索FLOPs僅是人工手調的3%!

圖片

經過這一系列系統的實驗探索,我們證明了μP是科學擴展diffusion Transformers的有效手段,我們也相信μP會是未來基礎模型擴展的必備利器。通過本工作的大量努力,我們希望讓社區了解μP理論,擁抱μP實踐,思考理論上最優的智能擴展范式(模型大小,數據量,推理時間)。我們也相信,放眼人工智能的長遠未來,類似μP的底層理論的發展仍然是必不可少的,也必將會在未來的大規模實踐中有著不可或缺的一席之地。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-06-26 10:25:45

人民大學服務器癱瘓流量

2015-03-12 10:53:56

SSL VPN深信服

2022-04-08 14:52:31

模型谷歌方法

2025-08-12 15:19:32

字節跳動生成模型工具鏈

2025-08-05 09:02:00

2020-11-26 17:04:02

騰訊實驗室系統

2015-03-25 13:49:10

無線網絡Aruba

2017-08-15 16:29:05

商學院

2023-04-03 10:21:05

模型技術

2018-01-11 10:15:14

速途網

2025-04-29 09:10:00

2025-01-23 17:07:07

2021-04-08 10:06:38

數字人民幣數字貨幣區塊鏈

2025-01-21 09:15:00

2025-06-18 08:47:00

2011-03-28 17:07:14

海量數據庫

2025-07-04 08:47:00

大模型AI信息

2010-03-21 19:05:19

微軟MSF

2023-11-20 15:26:18

人工智能GenAI模型

2025-10-30 09:31:10

點贊
收藏

51CTO技術棧公眾號

国产精品白嫩美女在线观看| 日韩欧美另类在线| 一本一道久久a久久精品综合| 国产又黄又大又粗的视频| 国精品一区二区| 亚洲激情久久久| 亚洲激情在线观看视频| 免费网站在线观看人| 久久免费午夜影院| 99爱精品视频| 欧美男人亚洲天堂| 一本一道久久a久久精品蜜桃| 日韩不卡在线观看| 国产一级免费大片| 久久青青视频| 亚洲一区在线观看免费观看电影高清| 欧美亚洲另类久久综合| 精品人妻伦一区二区三区久久 | 懂色av中文一区二区三区| 8050国产精品久久久久久| 久草福利资源在线| 丝袜美腿一区二区三区动态图| 欧美人与z0zoxxxx视频| 黄在线观看网站| 国产盗摄一区二区| 亚洲欧洲精品一区二区三区不卡| 噜噜噜噜噜久久久久久91| 99久久亚洲精品日本无码| 男人的天堂亚洲在线| 色综合91久久精品中文字幕 | 国产精品视频久久| 亚洲天堂男人av| 99精品国产在热久久下载| 蜜月aⅴ免费一区二区三区| 影音先锋男人在线| 久久99国内| 日韩成人av一区| www.啪啪.com| 中文字幕区一区二区三| 欧美一区二区三区精品| 亚洲网中文字幕| 精品国产美女a久久9999| 色偷偷一区二区三区| 六月丁香激情网| 1234区中文字幕在线观看| 夜夜精品视频一区二区| 激情五月婷婷六月| 伦理av在线| 亚洲午夜免费电影| 久久av高潮av| 欧美高清另类hdvideosexjaⅴ| 最新不卡av在线| 亚洲综合视频一区| 欧美私人网站| 亚洲免费观看高清完整版在线| 在线观看成人av| 快射av在线播放一区| 亚洲日穴在线视频| 国产又大又长又粗又黄| 米奇777四色精品人人爽| 中文字幕在线一区二区三区| 欧美日韩一级在线 | 久久久噜噜噜久久| 国产性一乱一性一伧一色| 国产综合久久| 97久久国产精品| 久久精品国产亚洲av麻豆色欲 | 亚洲精品18p| 成人久久18免费网站麻豆| 国产免费一区| 欧洲天堂在线观看| 国产精品色哟哟| av影院在线播放| 成入视频在线观看| 色视频欧美一区二区三区| 中文字幕在线综合| 蜜桃精品一区二区三区| 日韩成人小视频| www久久久久久久| 欧美精品国产一区| 97色伦亚洲国产| 中文字幕乱伦视频| 国产精品自产自拍| 欧美久久在线| 黄色av电影在线观看| 亚洲第一成年网| 成人黄色片视频| 成人亚洲精品| 日韩av在线网| 欧美色视频一区二区三区在线观看| 91精品在线观看国产| 97热精品视频官网| 在线免费av网| 盗摄精品av一区二区三区| 日韩久久精品一区二区三区| 成人ww免费完整版在线观看| 欧美色欧美亚洲高清在线视频| 久久国产精品国产精品| 精品国产导航| 日韩网站在线观看| 久草视频在线观| 精品一区二区综合| 久久久综合香蕉尹人综合网| 国产在线69| 色综合久久88色综合天天6| 99999精品| 国产精品视频一区二区三区四蜜臂| 美女啪啪无遮挡免费久久网站| 午夜精品一区二| 国产成人综合在线观看| 亚洲电影网站| 伊人久久综合一区二区| 91精品国产综合久久久久久久 | 亚洲三级小视频| 久草综合在线观看| 国产一区丝袜| 欧美不卡视频一区发布| 欧美一级黄视频| 91美女片黄在线| 亚洲色欲久久久综合网东京热| 免费一区二区三区四区| 亚洲欧美日韩国产成人| 精品深夜av无码一区二区老年| 老色鬼精品视频在线观看播放| 久久精品成人一区二区三区蜜臀 | 日本一二三区在线视频| 亚洲午夜免费视频| 亚洲精品久久久久久| 日韩理论电影院| 国产精品678| 视频一区二区三区在线看免费看| 亚洲国产精品久久人人爱蜜臀| 日本黄色一级网站| 97精品国产福利一区二区三区| 日本免费久久高清视频| 欧美色18zzzzxxxxx| 黄色成人av在线| 香港三日本8a三级少妇三级99| 在线精品国产| 91久久精品一区二区别| 午夜成年人在线免费视频| 欧美日免费三级在线| 最新中文字幕av| 日韩黄色免费网站| 日本最新一区二区三区视频观看| 亚洲妇女成熟| 亚洲日本中文字幕免费在线不卡| 天天干天天干天天干天天| eeuss鲁片一区二区三区在线观看| 国产亚洲黄色片| 狼人精品一区二区三区在线 | 免费cad大片在线观看| avtt久久| 久久高清视频免费| 亚洲成人一二三区| 亚洲高清在线视频| 日韩精品人妻中文字幕有码| 亚洲人成高清| 裸模一区二区三区免费| 日日av拍夜夜添久久免费| 国产一区二区三区在线免费观看| 在线免费观看av片| 亚洲欧美另类久久久精品| 在线观看欧美一区二区| av不卡在线看| 日韩中文字幕一区| **精品中文字幕一区二区三区| 久久五月天综合| 黄色av网址在线| 欧美日韩国产综合新一区 | 亚洲女与黑人做爰| 亚洲欧美综合视频| 国产欧美日本| 视频一区视频二区视频三区视频四区国产 | 色婷婷综合久久久久中文一区二区| 在哪里可以看毛片| 久久精品999| 国产一区二区四区| 国产伦一区二区三区| 国产综合香蕉五月婷在线| 污影院在线观看| 日韩精品在线影院| 一本色道久久综合精品婷婷| 亚洲一区二区三区中文字幕在线| 国产精品久久不卡| 国内一区二区视频| 亚洲午夜精品久久久久久人妖| 日韩中文在线电影| 国产精品一区在线播放| 三级成人在线| 久久久久久久999| www亚洲人| 欧美精品一区二区三| 中日韩在线观看视频| 亚洲一区视频在线观看视频| 成人黄色免费网址| 大胆亚洲人体视频| 日本三级黄色网址| 亚洲免费大片| 国产精品啪啪啪视频| 久久99久久人婷婷精品综合| 99久久精品久久久久久ai换脸| 偷拍精品精品一区二区三区| 欧美猛交免费看| 77导航福利在线| 精品视频在线播放色网色视频| 国产日韩免费视频| 在线观看国产一区二区| 日韩免费视频网站| 亚洲色图在线看| 亚洲成人日韩在线| 成人丝袜视频网| 午夜不卡福利视频| 免费高清在线视频一区·| 黄网站欧美内射| 亚洲精品2区| 亚洲欧洲久久| 欧美精美视频| 精品一区二区三区日本| baoyu135国产精品免费| 亚洲free嫩bbb| 亚洲精品大片| 国产精品久久久久99| 卡通欧美亚洲| 欧美中文在线观看| 97人人在线视频| 欧美日韩国产91| 在线免费av导航| 久久精品国产亚洲精品| 1024视频在线| 在线亚洲欧美视频| 国产小视频福利在线| 日韩精品视频观看| 午夜福利理论片在线观看| 精品国产电影一区二区| 亚洲精品字幕在线| 欧美zozo另类异族| 性一交一乱一色一视频麻豆| 欧美一级日韩不卡播放免费| 中文字幕在线天堂| 欧美自拍丝袜亚洲| 这里只有久久精品视频| 欧美在线一区二区三区| 中文字幕人妻精品一区| 在线中文字幕一区二区| 无码日韩精品一区二区| 91国产免费看| 中文字幕乱码中文字幕| 欧美日韩三级在线| 888奇米影视| 91精品国产91久久久久久一区二区 | 一本一道久久综合狠狠老精东影业| 欧美午夜性视频| av成人天堂| 国产精品视频一区二区三区四区五区| 亚洲综合99| 免费在线观看的毛片| 免费人成精品欧美精品| www.亚洲自拍| 国产sm精品调教视频网站| av黄色一级片| 久久精品一区二区三区四区| 亚洲综合第一区| 亚洲色图在线视频| 欧美成人aaaaⅴ片在线看| 天天做天天摸天天爽国产一区| 日韩综合在线观看| 欧美男生操女生| 亚洲av少妇一区二区在线观看| 亚洲第一网站免费视频| 日本午夜在线| 日日狠狠久久偷偷四色综合免费| 亚洲性图自拍| 欧美一级电影在线| 久久天天久久| 成人看片视频| 精品在线观看入口| 热这里只有精品| 国产精品永久| 热久久久久久久久| av日韩在线网站| 国产综合精品久久久久成人av| 亚洲欧美另类久久久精品| 国产精品免费av一区二区| 欧美日韩一区二区三区不卡| 亚洲精品成人区在线观看| 日韩精品在线观看一区二区| 黄色小网站在线观看| 欧美性视频精品| 99精品视频在线免费播放| 精品国产乱码久久久久久108| 不卡中文字幕| 久久99久久99精品| 久久99久久久久| 97香蕉碰碰人妻国产欧美| 中文字幕在线不卡视频| 亚洲日本视频在线观看| 日韩一区二区电影网| 精品美女视频在线观看免费软件| 欧美精品亚州精品| 浪潮色综合久久天堂| 99视频国产精品免费观看| 欧美理论视频| 91成人在线观看喷潮教学| 久久狠狠亚洲综合| 中文字幕一二三四区| 亚洲一区二区偷拍精品| 91久久精品无码一区二区| 精品国产1区2区3区| 91欧美在线视频| 国产91精品久久久久久久| 欧美一级片网址| 性欧美大战久久久久久久免费观看| 伊人激情综合| 极品人妻一区二区| 国产精品久久久久久妇女6080| 欧美性猛交bbbbb精品| 精品欧美乱码久久久久久1区2区| 日韩大片在线永久免费观看网站| 欧洲成人在线观看| 成人av资源网址| 男女激烈动态图| 国产资源精品在线观看| 欧美性受xxxx黑人| 色综合久久中文综合久久97| 五月婷婷免费视频| 久久久久久久国产精品| 国产精品一区二区三区av| 亚洲精品免费在线看| 日本一不卡视频| 精品人妻一区二区三区蜜桃视频| 欧美色播在线播放| 日韩在线无毛| 91精品国产一区| 色婷婷综合久久久久久| 精品视频在线观看一区| 99久久综合精品| 国产又爽又黄的视频| 日韩精品中文字幕久久臀| 欧美gv在线| 欧美精品尤物在线| 久久中文精品| 高潮毛片无遮挡| 91高清视频在线| 在线免费观看黄色| 成人国产精品久久久| 国产精品88久久久久久| 天天色天天综合网| 夜夜嗨av一区二区三区网页| 亚洲乱色熟女一区二区三区| 欧美激情乱人伦一区| 九色丨蝌蚪丨成人| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 久久午夜免费电影| 波多野结衣激情视频| 中文字幕亚洲欧美日韩在线不卡| 成人h在线观看| 中文字幕不卡每日更新1区2区| 国产综合色精品一区二区三区| 加勒比婷婷色综合久久| 亚洲国产成人av在线| 92国产精品| 亚洲激情一区二区三区| 国产精品系列在线观看| 国产午夜在线播放| 亚洲人成五月天| 免费成人毛片| 黄色网在线视频| 91一区二区在线| 中日韩在线观看视频| 欧美精品在线免费观看| 日韩影视高清在线观看| 色播五月综合网| 亚洲国产精品天堂| 久久电影中文字幕| 成人午夜高潮视频| 在线看片欧美| 超薄肉色丝袜一二三| 日韩美女一区二区三区四区| 日韩激情电影免费看| 在线视频福利一区| 成人av动漫在线| 樱花视频在线免费观看| 超碰97人人做人人爱少妇| 日韩av系列| 天天干天天av| 欧美丝袜一区二区| 激情影院在线观看| 好吊色欧美一区二区三区视频| 蜜臀久久99精品久久久久宅男| 国产亚洲成人av| 丝袜亚洲欧美日韩综合| 国产乱人伦丫前精品视频| 五月天亚洲视频| 午夜精品福利一区二区蜜股av| av大片在线看| 九九99玖玖| 国产精品88888| 中文字幕精品一区二| 高清欧美一区二区三区|