精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型

發布于 2024-8-12 13:59
瀏覽
0收藏

訓練一個擴散模型要多少錢?


之前最便宜的方法(Wuerstchen)用了28400美元,而像Stable Diffusion這樣的模型還要再貴一個數量級。


大模型時代,一般人根本玩不起。想要各種文生小姐姐,還得靠廠商們負重前行

為了降低這龐大的開銷,研究者們嘗試了各種方案。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

比如,原始的擴散模型從噪聲到圖像大約需要1000步,目前已經被減少到20步左右,甚至更少。


當擴散模型中的基礎模塊逐漸由Unet(CNN)替換為DiT(Transformer)之后,一些根據Transformer特性來做的優化也跟了上來。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

比如量化,比如跳過Attention中的一些冗余計算,比如pipeline。


而近日,來自加州大學爾灣分校等機構的研究人員,把「省錢」這個目標直接向前推進了一大步:

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

論文地址:https://arxiv.org/abs/2407.15811


——從頭開始訓練一個11.6億參數的擴散模型,只需要1890美元!


對比SOTA有了一個數量級的提升,讓普通人也看到了能摸一摸預訓練的希望。


更重要的是,降低成本的技術并沒有影響模型的性能,11.6億個參數給出了下面這樣非常不錯的效果。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

除了觀感,模型的數據指標也很優秀,比如下表給出的FID分數,非常接近Stable Diffusion 1.5和DALL·E 2。


相比之下,Wuerstchen的降成本方案則導致自己的考試分數不甚理想。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

省錢的秘訣

抱著「Stretching Each Dollar」的目標,研究人員從擴散模型的基礎模塊DiT入手。

首先,序列長度是Transformer計算成本的大敵,需要除掉。


對于圖像來說,就需要在不影響性能的情況下,盡量減少參加計算的patch數量(同時也減少了內存開銷)。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

減少圖像切塊數可以有兩種方式,一是增大每塊的尺寸,二是干掉一部分patch(mask)。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

因為前者會顯著降低模型性能,所以我們考慮進行mask的方式。


最樸素的mask(Naive token masking)類似于卷積UNet中隨機裁剪的訓練,但允許對圖像的非連續區域進行訓練。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

而之前最先進的方法(MaskDiT),在輸出之前增加了一個恢復重建的結構,通過額外的損失函數來訓練,希望通過學習彌補丟掉的信息。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

這兩種mask都為了降低計算成本,在一開始就丟棄了大部分patch,信息的損失顯著降低了Transformer的整體性能,即使MaskDiT試圖彌補,也只是獲得了不太多的改進。


——丟掉信息不可取,那么怎樣才能減小輸入又不丟信息呢?

延遲掩蔽

本文提出了一種延遲掩蔽策略(deferred masking strategy),在mask之前使用混合器(patch-mixer)進行預處理,把被丟棄patch的信息嵌入到幸存的patch中,從而顯著減少高mask帶來的性能下降。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

在本架構中,patch-mixer是通過注意力層和前饋層的組合來實現的,使用二進制掩碼進行mask,整個模型的損失函數為:

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

與MaskDiT相比,這里不需要額外的損失函數,整體設計和訓練更加簡單。

而混合器本身是個非常輕量的結構,符合省錢的標準。

微調

由于非常高的掩蔽比(masking ratio)會顯著降低擴散模型學習圖像中全局結構的能力,并引入訓練到測試的分布偏移,所以作者在預訓練(mask)后進行了小幅度的微調(unmask)。


另外,微調還可以減輕由于使用mask而產生的任何不良生成偽影。

MoE和分層擴展

MoE能夠增加模型的參數和表達能力,而不會顯著增加訓練成本。


作者使用基于專家選擇路由的簡化MoE層,每個專家確定路由到它的token,而不需要任何額外的輔助損失函數來平衡專家之間的負載。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

此外,作者還考慮了分層縮放方法,線性增加Transformer塊的寬度(即注意力層和前饋層中的隱藏層尺寸)。


由于視覺模型中的更深層傾向于學習更復雜的特征,因此在更深層中使用更多的參數將帶來更好的性能。

實驗設置

作者使用兩種DiT的變體:DiT-Tiny/2和DiT-Xl/2,patch大小為2。

使用具有余弦學習率衰減和高權重衰減的AdamW優化器訓練所有模型。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

模型前端使用Stable-Diffusion-XL模型中的四通道變分自動編碼器(VAE)來提取圖像特征,另外還測試了最新的16通道VAE在大規模訓練(省錢版)中的性能。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

作者使用EDM框架作為所有擴散模型的統一訓練設置,使用FID以及CLIP分數來衡量圖像生成模型的性能。


文本編碼器選擇了最常用的CLIP模型,盡管T5-xxl這種較大的模型在文本合成等具有挑戰性的任務上表現更好,但為了省錢的目標,這里沒有采用。

訓練數據集

使用三個真實圖像數據集(Conceptual Captions、Segment Anything、TextCaps),包含2200萬個圖像文本對。


由于SA1B不提供真實的字幕,這里使用LLaVA模型生成的合成字幕。作者還在大規模訓練中添加了兩個包含1500萬個圖像文本對的合成圖像數據集:JourneyDB和DiffusionDB。


對于小規模消融,研究人員通過從較大的COYO-700M數據集中對10個CIFAR-10類的圖像進行二次采樣,構建了一個名為cifar-captions的文本到圖像數據集。

評估

使用DiT-Tiny/2模型和cifar-captions數據集(256×256分辨率)進行所有評估實驗。

對每個模型進行60K優化步驟的訓練,并使用AdamW優化器和指數移動平均值(最后10K步平滑系數為0.995)。

延遲掩蔽

實驗的基線選擇我們上面提到的Naive masking,而本文的延遲掩蔽則加入一個輕量的patch-mixer,參數量小于主干網絡的10%。


一般來說,丟掉的patch越多(高masking ratio),模型的性能會越差,比如MaskDiT在超過50%后表現大幅下降。

這里的對比實驗采用默認的超參數(學習率1.6×10e-4、0.01的權重衰減和余弦學習率)來訓練兩個模型。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

上圖的結果顯示了延遲屏蔽方法在FID、Clip-FID和Clip score三個指標上都獲得了提升。

并且,與基線的性能差距隨著掩蔽率的增加而擴大。在掩蔽率為75%的情況下,樸素掩蔽會將FID分數降低至 16.5,而本文的方法則達到5.03,更接近于無掩蔽時的FID分數(3.79)。

超參數

沿著訓練LLM的一般思路,這里比較兩個任務的超參數選擇。


首先,在前饋層中,SwiGLU激活函數優于GELU。其次,較高的權重衰減會帶來更好的圖像生成性能。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

另外,與LLM訓練不同的是,當對AdamW二階矩 (β) 使用更高的運行平均系數時,本文的擴散模型可以達到更好的性能。


最后,作者發現使用少量的訓練步驟,而將學習率增加到最大可能值(直到訓練不穩定)也顯著提高了圖像生成性能。

混合器的設計

大力出奇跡一般都是對的,作者也觀察到使用更大的patch-mixer后,模型性能得到持續改善。


然而,本著省錢的目的,這里還是選擇使用小型的混合器。


作者將噪聲分布修改為 (?0.6, 1.2),這改善了字幕和生成圖像之間的對齊。


如下圖所示,在75% masking ratio下,作者還研究了采用不同patch大小所帶來的影響。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

當連續區域變多(patch變大)時,模型的性能會下降,因此保留隨機屏蔽每個patch的原始策略。

分層縮放

這個實驗訓練了DiT-Tiny架構的兩種變體,一種具有恒定寬度,另一種采用分層縮放的結構。

兩種方法都使用Naive masking,并調整Transformer的尺寸,保證兩種情況下的模型算力相同,同時執行相同的訓練步驟和訓練時間。

比Stable Diffusion便宜118倍!1890美元訓出11.6億參數高質量文生圖模型-AI.x社區

由上表結果可知發現,在所有三個性能指標上,分層縮放方法都優于基線的恒定寬度方法,這表明分層縮放方法更適合DiT的掩蔽訓練。


本文轉自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/Y01EkGV7veurruqNxFFrEw??

收藏
回復
舉報
回復
相關推薦
祥仔av免费一区二区三区四区| 亚洲网站在线免费观看| 粉嫩的18在线观看极品精品| 精品美女久久久久久免费| 精品伦精品一区二区三区视频| 亚洲午夜18毛片在线看| 欧美成免费一区二区视频| 日韩精品综合一本久道在线视频| 国产视频九色蝌蚪| 999在线视频| 国产成人在线网站| 国产成人精品日本亚洲专区61| 911国产在线| 老司机aⅴ在线精品导航| 欧美日韩一区二区三区高清| 免费网站在线观看视频| 成年人在线观看| 国产精品996| 国产精品精品一区二区三区午夜版| tube国产麻豆| 欧洲三级视频| 亚洲精品99999| 99视频在线观看视频| 蜜桃麻豆影像在线观看| 亚洲女女做受ⅹxx高潮| 视频一区二区三| 人妻视频一区二区三区| 韩国欧美国产1区| 国产91久久婷婷一区二区| 欧美精品乱码视频一二专区| 日韩av免费大片| 亚洲欧美国产精品va在线观看| 中文字幕欧美视频| 国产精品久久久久久久久久齐齐 | 人人爽香蕉精品| 欧美极品美女电影一区| 国产一区二区三区视频播放| 亚洲视频分类| 亚洲精品电影网站| 韩国av中国字幕| 日韩在线电影| 欧美三级中文字| 国产一区二区视频免费在线观看| 超碰中文在线| 亚洲一线二线三线视频| 在线视频亚洲自拍| 在线观看免费网站黄| 国产欧美精品日韩区二区麻豆天美| 国产精品区一区二区三在线播放| av男人天堂av| 国产精品自拍在线| 91在线视频导航| 国产精品一区二区黑人巨大 | 国产欧美在线观看| 久久久999久久久| 日韩激情视频在线观看| 国产91免费观看| 性色av一区二区三区四区| 天堂一区二区在线| 国产精品日韩在线一区| 亚洲av无码乱码国产精品fc2| 久久一区中文字幕| 国产精品成人品| 中文字幕福利视频| 久久国产乱子精品免费女| 国产伦精品免费视频| 一区二区精品视频在线观看| 久久se精品一区二区| 91精品视频在线免费观看| 97免费观看视频| 国产乱码精品一区二区三| av一区二区三区四区电影| 高清毛片aaaaaaaaa片| 99re亚洲国产精品| 日本午夜精品一区二区三区| 瑟瑟视频在线| 一区二区三区在线不卡| 妞干网在线视频观看| 国产精品专区免费| 欧美日韩国产片| 中文字幕人妻熟女人妻a片| 精品午夜电影| 亚洲香蕉成人av网站在线观看| 久久视频精品在线观看| 久久久精品久久久久久96| 欧美激情视频一区| 丰满少妇xoxoxo视频| 老司机精品视频导航| 豆国产97在线| 国产香蕉视频在线看| 中文字幕视频一区二区三区久| av磁力番号网| 涩涩涩视频在线观看| 欧美日韩一卡二卡| 日本道中文字幕| 久久一区91| 国内免费精品永久在线视频| 欧美 亚洲 另类 激情 另类| 国产精品小仙女| 欧美深深色噜噜狠狠yyy| 97caopor国产在线视频| 色综合久久久久网| 三级黄色片免费看| 亚洲区小说区| 久久久久久成人精品| 中文文字幕一区二区三三| 国产成a人无v码亚洲福利| 日本一区二区三区四区在线观看| 最新黄网在线观看| 色94色欧美sute亚洲线路二 | 中文在线资源天堂| 成人手机在线视频| 亚洲精品久久久久久一区二区| 国产盗摄精品一区二区酒店| 精品视频在线免费| 三级黄色片网站| 影视亚洲一区二区三区| 国产精品91久久久久久| 日本精品久久久久久| 国产精品久久久久久久蜜臀| 成年人视频观看| 国产一区二区三区免费观看在线| 亚洲图片制服诱惑| 粉嫩aⅴ一区二区三区| 国产麻豆欧美日韩一区| 亚洲国产一区二区三区在线播| 国产不卡123| 日韩一区二区三区av| 亚洲色图27p| 日韩成人免费看| 麻豆91av| 松下纱荣子在线观看| 精品国产成人在线影院 | 亚洲一区二区三区视频| yiren22亚洲综合伊人22| 富二代精品短视频| 潘金莲一级淫片aaaaaaa| 国产精品传媒精东影业在线| 国产精品久久久久久久电影 | 国产色综合久久| 水蜜桃色314在线观看| 丁香一区二区| 午夜精品福利在线观看| 免费av网站观看| 亚洲一区二区美女| 好吊操视频这里只有精品| 亚洲女同另类| 亚洲最大成人免费视频| 18av在线视频| 欧美成人性战久久| 久一视频在线观看| 成人av网站免费| 和岳每晚弄的高潮嗷嗷叫视频| 欧美三级一区| 欧美激情一区二区三区高清视频| 国产黄色片网站| 亚洲制服丝袜在线| 人妻换人妻a片爽麻豆| 亚洲第一伊人| 久久久久久久久久久一区 | 色婷婷av一区二区| 人妻少妇无码精品视频区| 鲁大师成人一区二区三区| 青青成人在线| 日韩久久一区| 欧美美最猛性xxxxxx| 男人的天堂a在线| 性做久久久久久久久| 天堂久久久久久| 久久精品免费| 一级二级三级欧美| 精品久久国产一区| 97免费视频在线| 国产露出视频在线观看| 欧美日韩在线播放三区四区| 亚洲波多野结衣| 成人免费视频一区| 日本三区在线观看| 91精品国产自产在线观看永久∴| 99热在线国产| 亚洲天堂av在线| 最近2019中文字幕第三页视频| 国产孕妇孕交大片孕| 亚洲综合一区在线| 成人性生交大免费看| 久久91精品久久久久久秒播| 小泽玛利亚av在线| 欧美高清视频看片在线观看| 国产精品免费网站| 欧美人与牲禽动交com | 国产欧美日本在线| 波多视频一区| 久久综合伊人77777蜜臀| 色婷婷综合视频| 欧美日韩在线播放三区| 日产电影一区二区三区| 中文字幕av不卡| 在线观看免费视频黄| 蜜桃久久久久久| 韩日视频在线观看| 久久精品国产99久久| 国产一区二区精品免费| 日韩三级成人| 欧美一级片免费在线| 成人video亚洲精品| 亚洲男子天堂网| 丰满少妇高潮在线观看| 欧美欧美欧美欧美首页| 日韩精品一区二区不卡| 中文字幕在线不卡国产视频| 国产夫妻性爱视频| 国产精品一二一区| 91国产精品视频在线观看| 亚洲精品1234| 国产av第一区| 久久在线免费| 欧美一区激情视频在线观看| 国产成人aa在线观看网站站| 成人精品一区二区三区电影黑人| 成人美女大片| 高清在线视频日韩欧美| 91精品国产91久久久久久青草| 亚洲午夜av久久乱码| 色婷婷av一区二区三| 日韩一区二区视频在线观看| 亚洲一区二区三区网站| 色婷婷综合久久久久中文一区二区| 午夜写真片福利电影网| 中文字幕在线不卡一区| 林心如三级全黄裸体| 久久久久久久综合色一本| 日本少妇xxxx| 成人午夜av电影| 欧美一级大片免费看| 精品一区二区三区香蕉蜜桃| 天堂社区在线视频| 乱码第一页成人| 男人操女人免费| 亚洲一卡久久| 成人在线免费在线观看| 国产精品久久久久毛片大屁完整版| 成人小视频在线观看免费| 91超碰成人| 大桥未久一区二区| 久久精品国内一区二区三区水蜜桃| 亚洲免费久久| 欧美疯狂party性派对| 一区二区三区国| 99re66热这里只有精品8| 在线丝袜欧美日韩制服| 欧美成人激情| 懂色av一区二区三区四区五区| 91精品久久久久久久蜜月| 男女激烈动态图| 正在播放日韩欧美一页| 成人午夜视频免费观看| 在线欧美不卡| 国产免费毛卡片| 视频在线观看91| 污污动漫在线观看| 久久精品国产成人一区二区三区 | 成人精品一区二区三区中文字幕| 午夜视频在线免费看| 福利电影一区二区| fc2成人免费视频| 2020国产成人综合网| 一级黄色性视频| 国产精品白丝在线| 免费人成在线观看| 岛国av一区二区| 中文字幕av第一页| 欧美男生操女生| 风流老熟女一区二区三区| 亚洲男人的天堂在线播放| 成人在线观看网站| 毛片精品免费在线观看| 91制片在线观看| 日韩美女在线播放| 国产精品3区| 精品在线一区| 99视频精品全部免费在线视频| 老司机激情视频| 亚洲欧美日韩视频二区| 自拍偷拍一区二区三区四区| 国产精品88av| 久久精品国产亚洲av久| 亚洲精品日韩一| 福利网址在线观看| 欧美一区二区三区在线视频| 爽爽视频在线观看| 中文国产亚洲喷潮| av丝袜在线| 国产欧美韩国高清| 欧美理论电影在线精品| 一区精品在线| 国产午夜久久| 亚洲精品国产一区二区三区| 99精品视频在线播放观看| 黄色国产在线播放| 亚洲成人免费av| 一区二区精品视频在线观看| 亚洲国产成人一区| 欧美r级在线| 欧美一级bbbbb性bbbb喷潮片| 亚洲青青久久| 日韩欧美亚洲精品| 国产精品v日韩精品v欧美精品网站| aaaaaa亚洲| 成人国产精品免费观看| 国产极品美女在线| 在线观看一区二区视频| 人妻无码中文字幕| 久久91亚洲人成电影网站 | 国产精品免费一区二区| 日韩片欧美片| www.亚洲天堂网| 成人黄色在线看| 成人自拍小视频| 色噜噜久久综合| 午夜18视频在线观看| 久久97精品久久久久久久不卡| 日本一区免费网站| 免费成人在线观看av| 亚洲激情国产| 99免费观看视频| 亚洲精品视频一区| 国产精品一区二区人人爽| 有码中文亚洲精品| 美女18一级毛片一品久道久久综合| 国产精品区一区二区三在线播放| 亚洲欧美在线专区| 色戒在线免费观看| 国产亚洲成av人在线观看导航 | 欧美中文字幕一区| 黄色影院在线播放| 亲子乱一区二区三区电影| 久久国产精品免费精品3p| 蜜臀精品一区二区| 国产成人精品影院| 国产免费美女视频| 欧美精品一二三区| 欧美激情视频在线播放| 国产在线观看91精品一区| 日韩国产在线| 欧美第一页浮力影院| 国产精品视频看| 亚洲综合精品视频| 精品国产欧美一区二区五十路| 免费日韩成人| 超碰免费在线公开| 国产河南妇女毛片精品久久久| 内射一区二区三区| 日韩一区二区电影网| 91网在线看| 国产欧美日韩一区| 国产精品一卡| 一区二区三区伦理片| 欧美三级乱人伦电影| av在线二区| 亚洲一区二区久久久久久久| 欧美1区3d| 成年女人免费视频| 欧美日韩国产一区中文午夜| 免费在线黄色影片| 国产精品国产三级国产aⅴ9色| 欧美日韩在线观看视频小说| 日本中文字幕观看| 玉足女爽爽91| 天天综合永久入口| 国产成人精品一区二区三区| 色爱综合网欧美| 初高中福利视频网站| 亚洲第一搞黄网站| 黄色av免费在线观看| 国产欧美精品xxxx另类| 中文字幕午夜精品一区二区三区| 少妇极品熟妇人妻无码| 精品日韩美女的视频高清 | 另类专区欧美制服同性| 超碰97久久| 亚洲五月天综合| 亚洲人成网站在线| 天堂网在线资源| 国产精品啪视频| 在线 亚洲欧美在线综合一区| 巨胸大乳www视频免费观看| 欧美日韩一区中文字幕| 欧美精品videosex| 日本不卡二区高清三区| 国产麻豆9l精品三级站| 天天操天天操天天操天天| www.久久撸.com| 美女一区2区| 日本美女视频一区| 午夜精品福利在线| 毛片av在线| 你懂的网址一区二区三区| 国产美女在线观看一区| www.国产com| 欧美疯狂做受xxxx高潮|