精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO) 精華

發(fā)布于 2024-4-23 10:20
瀏覽
0收藏

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

文章鏈接:??https://arxiv.org/pdf/2404.11098??


在AIGC時(shí)代,對(duì)低成本甚至設(shè)備端應(yīng)用擴(kuò)散模型的需求日益增加。在壓縮Stable Diffusion模型(SDM)方面,提出了幾種方法,其中大多數(shù)利用手工設(shè)計(jì)的層移除方法來(lái)獲得更小的U-Net,同時(shí)利用知識(shí)蒸餾來(lái)恢復(fù)網(wǎng)絡(luò)性能。然而,這種手工設(shè)計(jì)的層移除方式效率低下,缺乏可擴(kuò)展性和泛化性,并且在重新訓(xùn)練階段使用的特征蒸餾面臨著不平衡問(wèn)題,即一些數(shù)值顯著的特征損失項(xiàng)在整個(gè)重新訓(xùn)練過(guò)程中占主導(dǎo)地位。


為此,本文提出了用于壓縮擴(kuò)散模型(LAPTOP-Diff)的層剪枝和歸一化蒸餾方法。

  • 引入了層剪枝方法來(lái)自動(dòng)壓縮SDM的U-Net,并提出了一個(gè)有效的一次性剪枝準(zhǔn)則,其一次性性能由其良好的可加性特性保證,超越了其他層剪枝和手工設(shè)計(jì)的層移除方法;
  • 提出了歸一化特征蒸餾用于重新訓(xùn)練,緩解了不平衡問(wèn)題。
    利用所提出的LAPTOP-Diff,壓縮了SDXL和SDM-v1.5的U-Net,以獲得最先進(jìn)的性能,即使在剪枝比率為50%時(shí),PickScore僅下降了最小的4.0%,而比較方法的最小PickScore下降為8.2%。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

引言

在最近幾年,文本到圖像(T2I)合成的生成建模經(jīng)歷了快速進(jìn)展。特別是,擴(kuò)散模型以其生成高分辨率、照片逼真且多樣化的圖像的能力而出現(xiàn)。在所有擴(kuò)散模型中,Stable Diffusion模型(SDM)是最具影響力的一個(gè),在AIGC社區(qū)中扮演著至關(guān)重要的角色,作為一個(gè)開(kāi)源框架,為廣泛的下游應(yīng)用提供了基礎(chǔ)。


然而,SDM卓越的性能伴隨著其相當(dāng)大的內(nèi)存消耗和延遲,使其在個(gè)人計(jì)算機(jī)甚至移動(dòng)設(shè)備上的部署受到嚴(yán)重限制。此外,最近版本的SDM系列,如SDXL,往往會(huì)增加更多的參數(shù),導(dǎo)致內(nèi)存消耗和延遲進(jìn)一步增加。


為了減少SDM的推理預(yù)算,提出了幾種方法,即降噪步驟的減少、高效的架構(gòu)設(shè)計(jì)、結(jié)構(gòu)剪枝、量化和硬件優(yōu)化。這些方法通常是相互正交的。


在這些方法中,高效的架構(gòu)設(shè)計(jì)和結(jié)構(gòu)剪枝是被低估的。一方面,先前的高效架構(gòu)設(shè)計(jì)方法通常通過(guò)大量的經(jīng)驗(yàn)研究來(lái)識(shí)別SDM的U-Net中不重要的層,然后移除它們以獲得更小更快的網(wǎng)絡(luò)。這種手工設(shè)計(jì)的方式通常無(wú)法達(dá)到最佳性能,并且缺乏可擴(kuò)展性和泛化性。

注意到,這些手工設(shè)計(jì)的層移除方法可以被自動(dòng)方案中的層剪枝方法所替代,以獲得更好的可擴(kuò)展性和性能。另一方面,先前的SDM結(jié)構(gòu)剪枝方法側(cè)重于精細(xì)的剪枝,即剪枝參數(shù)矩陣的行和列。然而,有研究表明,與更細(xì)粒度的結(jié)構(gòu)剪枝相比,粗粒度的層剪枝通常在減少模型延遲方面效率更低,并且有趣的是,層剪枝有可能達(dá)到與更細(xì)粒度的結(jié)構(gòu)剪枝甚至更好的性能?;谝陨蟽牲c(diǎn),層剪枝方法值得研究。


在層移除或剪枝之后,SDMs通常無(wú)法直接生成清晰的圖像。先前的方法利用知識(shí)蒸餾來(lái)重新訓(xùn)練被剪枝的網(wǎng)絡(luò)以恢復(fù)其性能。先前的方法通常利用三種類型的目標(biāo),即常規(guī)訓(xùn)練目標(biāo)、對(duì)數(shù)蒸餾(輸出蒸餾)目標(biāo)和特征蒸餾目標(biāo)。在這三個(gè)部分中,特征蒸餾是關(guān)鍵部分。然而,進(jìn)一步的檢查發(fā)現(xiàn),先前基于蒸餾的重新訓(xùn)練方法存在一個(gè)不平衡問(wèn)題,即一些特征損失項(xiàng)在整個(gè)重新訓(xùn)練過(guò)程中占主導(dǎo)地位,導(dǎo)致性能下降。


本文提出了用于壓縮擴(kuò)散模型的層剪枝和歸一化蒸餾方法(LAPTOP-Diff),將SDM的高效架構(gòu)設(shè)計(jì)和結(jié)構(gòu)剪枝推向自動(dòng)化、可擴(kuò)展性和更大性能的領(lǐng)域。從組合優(yōu)化問(wèn)題的高角度來(lái)闡述層剪枝問(wèn)題,并以簡(jiǎn)單而有效的一次性方式解決它。


受益于這種視角,我們探索了幾種其他可能的剪枝標(biāo)準(zhǔn),并通過(guò)消融研究,發(fā)現(xiàn)一次性層剪枝標(biāo)準(zhǔn)的有效性來(lái)自其良好的可加性屬性。此外,確定了先前基于蒸餾的重新訓(xùn)練方法存在一個(gè)不平衡問(wèn)題,即一些特征損失項(xiàng)在整個(gè)重新訓(xùn)練過(guò)程中占主導(dǎo)地位,通過(guò)提出的歸一化特征蒸餾來(lái)緩解這個(gè)問(wèn)題。貢獻(xiàn)總結(jié)如下:


  • 探索了層剪枝在SDMs上的一個(gè)被低估的結(jié)構(gòu)剪枝方法,并提出了一個(gè)有效的一次性剪枝標(biāo)準(zhǔn),其一次性性能由其良好的可加性屬性保證,超越了其他層剪枝和手工設(shè)計(jì)的層移除方法,將先前基于層移除的高效架構(gòu)設(shè)計(jì)方法推向自動(dòng)化、可擴(kuò)展性和更大性能。
  • 通過(guò)提出的歸一化特征蒸餾方法緩解了先前基于蒸餾的重新訓(xùn)練存在的不平衡問(wèn)題。
  • 提出的LAPTOP-Diff在不同SDMs和剪枝比率下大大超越了基于層移除的高效架構(gòu)設(shè)計(jì)方法,在不同SDMs和剪枝比率下具有更好的網(wǎng)絡(luò)性能。

相關(guān)工作

擴(kuò)散模型

擴(kuò)散模型是一種利用迭代去噪過(guò)程來(lái)合成數(shù)據(jù)的生成模型。在文本到圖像(T2I)合成領(lǐng)域,諸如DALL·E、Imagen、Deepfloyd IF和Stable Diffusion等擴(kuò)散模型展示了它們生成高分辨率、照片逼真且多樣化圖像的顯著能力。在各種擴(kuò)散模型中,Stable Diffusion在學(xué)術(shù)界和工業(yè)界都是最具影響力的一個(gè)。Stable Diffusion模型(SDM)是一種在低維潛在空間執(zhí)行迭代去噪過(guò)程,然后通過(guò)VAE解碼器將潛在表示轉(zhuǎn)換為像素空間圖像的潛在擴(kuò)散模型。SDM系列還有一個(gè)更新版本,即SDXL,在更高分辨率的1024×1024下展示出卓越的圖像生成質(zhì)量。


然而,擴(kuò)散模型令人印象深刻的性能伴隨著相當(dāng)大的內(nèi)存消耗和延遲。為了減少SDM的模型預(yù)算,已經(jīng)探索了幾種方法,例如,減少去噪步驟、量化、硬件優(yōu)化、高效的架構(gòu)設(shè)計(jì)和結(jié)構(gòu)剪枝。

SDM的高效架構(gòu)設(shè)計(jì)

與許多其他減少SDM模型預(yù)算的方法正交,高效的架構(gòu)設(shè)計(jì)主要旨在設(shè)計(jì)原始SDM U-Net的有效子結(jié)構(gòu),因?yàn)榇蟛糠諷DM的內(nèi)存消耗和延遲來(lái)自其U-Net。這種類型的先前方法通常通過(guò)大量的經(jīng)驗(yàn)研究來(lái)識(shí)別SDM U-Net中不重要的層,并移除它們以獲得更小更快的網(wǎng)絡(luò)。


例如,BK-SDM通過(guò)層移除為SDM-v1或SDM-v2手工設(shè)計(jì)了3個(gè)不同大小的高效U-Net,部分遵循了對(duì)BERT模型進(jìn)行壓縮的經(jīng)驗(yàn)結(jié)論。SSD-1B和Segmind-Vega(在本文的其余部分將它們簡(jiǎn)稱為SSD和Vega)通過(guò)人類評(píng)估識(shí)別不重要的層,然后施加層移除,為SDXL手工設(shè)計(jì)了2個(gè)不同大小的高效U-Net。KOALA是從BK-SDM衍生出來(lái)的,也通過(guò)層移除為SDXL手工設(shè)計(jì)了2個(gè)不同大小的高效U-Net。


這種手工設(shè)計(jì)的方式通常無(wú)法達(dá)到最佳性能,并且缺乏可擴(kuò)展性和泛化性。我們注意到這些基于層移除的方法可以歸類為手工設(shè)計(jì)的層剪枝。因此,我們提出這些手工設(shè)計(jì)的層移除方法可以被層剪枝方法在自動(dòng)方案中替代,以獲得更好的可擴(kuò)展性和性能。

層剪枝

層剪枝,也稱為深度剪枝,是一種旨在自動(dòng)評(píng)估和移除不重要層的結(jié)構(gòu)剪枝方法。與其他結(jié)構(gòu)剪枝方法不同,由于其粗粒度的特性,層剪枝受到的關(guān)注較少。相比于那些細(xì)粒度的結(jié)構(gòu)剪枝方法,層剪枝通常被認(rèn)為效果較差。然而,有研究表明,與細(xì)粒度的結(jié)構(gòu)剪枝方法相比,粗粒度的層剪枝通常更有效地減少模型的延遲,并且有可能實(shí)現(xiàn)相同甚至更好的性能。


雖然已經(jīng)提出了幾種層剪枝方法,但是沒(méi)有一種方法是從組合優(yōu)化問(wèn)題的角度來(lái)看待層剪枝。基于幅度和基于泰勒展開(kāi)的剪枝是常見(jiàn)的基準(zhǔn)線。基于幅度的層剪枝使用層中參數(shù)的幅度總和作為層重要性標(biāo)準(zhǔn),基于泰勒展開(kāi)的層剪枝使用損失函數(shù)的一階泰勒展開(kāi)作為層重要性標(biāo)準(zhǔn)。在通過(guò)不同的重要性標(biāo)準(zhǔn)評(píng)估每個(gè)層的重要性后,先前的層剪枝方法選擇修剪最不重要的層。


本文從更高的角度將層剪枝問(wèn)題描述為組合優(yōu)化問(wèn)題,并以簡(jiǎn)單而有效的一次性方式解決了它,形成了一個(gè)有效的一次性剪枝標(biāo)準(zhǔn),超越了其他層剪枝和手工設(shè)計(jì)的層移除方法。此外,通過(guò)這樣的視角,能夠確定一次性層剪枝標(biāo)準(zhǔn)的有效性來(lái)自于其良好的可加性屬性。

基于蒸餾的重新訓(xùn)練

在層移除或剪枝之后,SDMs通常無(wú)法直接生成清晰的圖像。先前的方法通過(guò)利用知識(shí)蒸餾來(lái)重新訓(xùn)練被剪枝的SDMs以恢復(fù)其性能。在重新訓(xùn)練階段使用的知識(shí)蒸餾通常包括三部分,即常規(guī)訓(xùn)練目標(biāo)、對(duì)數(shù)蒸餾(輸出蒸餾)目標(biāo)和特征蒸餾目標(biāo)。在這三個(gè)部分中,特征蒸餾是最有效的。然而,在實(shí)踐中,發(fā)現(xiàn)了基于蒸餾的重新訓(xùn)練過(guò)程中存在一個(gè)不平衡問(wèn)題。為此提出了一種簡(jiǎn)單而有效的重新加權(quán)策略來(lái)緩解這個(gè)問(wèn)題。

方法論

初步

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

先前的方法重新訓(xùn)練剪枝的SDM U-Net使用了三個(gè)目標(biāo),即任務(wù)損失、對(duì)數(shù)蒸餾(輸出蒸餾)損失和特征蒸餾損失:

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

一次性層剪枝

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)


目標(biāo)(2)的上界。根據(jù)三角不等式,我們得到了目標(biāo)(2)的上界。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

因此,我們?yōu)槟繕?biāo)(2)找到了一個(gè)替代目標(biāo)。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

最終,借助假設(shè)(5),我們可以通過(guò)優(yōu)化其近似的目標(biāo)來(lái)優(yōu)化目標(biāo)(4)。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

使用目標(biāo)(6)來(lái)代替原始目標(biāo)(2)意味著一種有趣的屬性,稱為可加性,即網(wǎng)絡(luò)受到多個(gè)擾動(dòng)引起的輸出失真大約等于每個(gè)單一擾動(dòng)引起的輸出失真之和。在第4.3節(jié)中進(jìn)行的進(jìn)一步實(shí)驗(yàn)驗(yàn)證了我們方法在SDMs上的可加性屬性,顯示出最終的目標(biāo)(6)是對(duì)原始目標(biāo)(2)的良好近似,同時(shí),假設(shè)(5)也得到了很好的支持。


為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)


實(shí)驗(yàn)和消融研究表明,我們的輸出損失剪枝標(biāo)準(zhǔn)顯著滿足可加性屬性,并在不同SDM模型上實(shí)現(xiàn)了最佳性能。此外,對(duì)于我們構(gòu)建的三個(gè)剪枝標(biāo)準(zhǔn),即輸出損失、Δ任務(wù)損失和ΔCLIP分?jǐn)?shù),對(duì)于每個(gè)模型,具有更強(qiáng)可加性屬性的標(biāo)準(zhǔn)實(shí)現(xiàn)了更好的剪枝性能。這個(gè)觀察是合理的,因?yàn)橐淮涡詫蛹糁χ苯觾?yōu)化了替代目標(biāo),如(6),而不是原始目標(biāo),如(2),優(yōu)化那些更好地近似原始目標(biāo)的替代目標(biāo)通常可以實(shí)現(xiàn)更好的剪枝性能。基于以上觀察和討論,我們可以得出結(jié)論,我們的輸出損失標(biāo)準(zhǔn)的有效性來(lái)自其良好的可加性屬性。

規(guī)范化特征蒸餾

在實(shí)踐中,我們發(fā)現(xiàn)重新訓(xùn)練的關(guān)鍵目標(biāo)是特征損失LFeatKD。然而,進(jìn)一步的檢查揭示了前面在重新訓(xùn)練階段采用的特征蒸餾方法存在不平衡問(wèn)題。如下圖3所示,不同階段末端的特征圖的L2-范數(shù)和不同特征損失項(xiàng)的值變化顯著。在圖3中顯示的相同現(xiàn)象在使用我們的層剪枝或手工層刪除的不同剪枝設(shè)置下,無(wú)論是在SDXL還是SDM-v1.5上都觀察到。在整個(gè)蒸餾過(guò)程中,最高的特征損失項(xiàng)約比最低的特征損失項(xiàng)大10000倍,并產(chǎn)生大約1000倍更大的梯度,稀釋了數(shù)值上不顯著的特征損失項(xiàng)的梯度。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

由于具有更大 L2-范數(shù)的特征圖自然傾向于產(chǎn)生更大的特征損失項(xiàng),不同特征損失項(xiàng)的顯著幅度差異歸因于兩個(gè)因素,即在不同階段末端,教師和學(xué)生之間特征圖的固有差異不同,以及特征圖的 L2-范數(shù)不同。第二個(gè)因素在很大程度上加劇了不平衡問(wèn)題。


基于以上觀察,簡(jiǎn)單地將所有特征損失項(xiàng)相加將導(dǎo)致少數(shù)特征損失項(xiàng)嚴(yán)重占優(yōu),阻礙數(shù)值上不顯著的特征損失項(xiàng)的減少,導(dǎo)致性能下降。為此,我們提出了一種簡(jiǎn)單而有效的特征蒸餾重新加權(quán)策略,以消除第二個(gè)因素對(duì)不平衡問(wèn)題的影響。我們選擇利用教師特征圖的 L2-范數(shù)重新加權(quán)特征損失項(xiàng),并將特征蒸餾適應(yīng)于我們的剪枝方案。規(guī)范化特征損失的制定如下:

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

其中,?? 是剪枝后仍保留有殘差層或transformer層的階段集合,|?? | 是集合 ?? 的大小。因此,整體重新訓(xùn)練目標(biāo)是:

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

實(shí)驗(yàn)

實(shí)現(xiàn)

在本小節(jié)中,主要詳細(xì)闡述了基本的實(shí)現(xiàn)設(shè)置。更多細(xì)節(jié)請(qǐng)參見(jiàn)補(bǔ)充材料。


模型選擇。在后面實(shí)驗(yàn)中,采用 512×512 分辨率以進(jìn)行快速驗(yàn)證,對(duì) SDXL 模型使用 ProtoVisionXL-v6.2.0,因?yàn)楣俜桨l(fā)布的 SDXL-Base-1.0在 512×512 分辨率附近生成的圖像異常,而對(duì)于 SDM-v1.5 模型,我們使用了官方發(fā)布的 stable-diffusion-v1-5。實(shí)驗(yàn),我們使用了每種比較方法的相同教師模型。


數(shù)據(jù)集。對(duì)于用于剪枝的校準(zhǔn)數(shù)據(jù)集,使用 LAION-2B的隨機(jī)抽樣的 1K 子集。在消融研究中,使用了 LAION-2B的隨機(jī)抽樣的 0.34M 子集。為了與其他方法進(jìn)行比較,使用了相同的數(shù)據(jù)集或選擇了質(zhì)量和數(shù)量較低的數(shù)據(jù)集,如果其他方法報(bào)告的數(shù)據(jù)集難以復(fù)現(xiàn),會(huì)選擇質(zhì)量和數(shù)量較低的數(shù)據(jù)集。數(shù)據(jù)集的選擇詳見(jiàn)補(bǔ)充材料。


評(píng)估指標(biāo)。盡管評(píng)估生成式 T2I 模型常用的指標(biāo)是 FID和 CLIP 分?jǐn)?shù),但最近的研究表明這兩個(gè)指標(biāo)與視覺(jué)美學(xué)和人類偏好之間的相關(guān)性較低。因此,

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

采用了 3 個(gè)高級(jí)指標(biāo)來(lái)評(píng)估模型的綜合性能。使用 HPS v2、PickScore和 ImageReward來(lái)評(píng)估生成圖像的視覺(jué)質(zhì)量和文本-圖像一致性。在它們各自的基準(zhǔn)數(shù)據(jù)集上計(jì)算這 3 個(gè)指標(biāo),即 HPS v2 在其 3.2K 基準(zhǔn)數(shù)據(jù)集上計(jì)算,ImageReward 在 ImageRewardDB的隨機(jī)抽樣的 3K 子集上計(jì)算,而 PickScore 在 Pick-a-Pic v1的隨機(jī)抽樣的 3K 子集上計(jì)算。

與其他方法的比較

到目前為止,對(duì)于 SDM 模型有三種手工制作的層移除方法。KOALA、SSD 和 Vega適用于 SDXL,而 BK-SDM可應(yīng)用于 SDM-v1 或 SDM-v2。將 LAPTOP-Diff 與這三種方法在相應(yīng)的模型上進(jìn)行比較。使用 SDXL-Base-1.0與 KOALA 1.16B 和 782M 進(jìn)行比較,使用 RealisticVision-v4.0與更先進(jìn)的 BK-SDM實(shí)現(xiàn)(由 Segmind)進(jìn)行比較,即 579M small-sd和 323M tiny-sd。對(duì)于與 1.3B SSD和 745M Vega進(jìn)行比較,僅使用它們?cè)诙嘟處熣麴s策略中使用的三個(gè)教師模型之一,即 ZavychromaXL-v1.0。對(duì)于所有比較方法的評(píng)估,我們使用它們發(fā)布的模型權(quán)重。


表1 顯示了與最先進(jìn)的壓縮 SDM 模型的比較結(jié)果。提出的 LAPTOP-Diff 實(shí)現(xiàn)了最先進(jìn)的性能。與 SSD和 Vega的視覺(jué)比較如圖5 所示,其他方法的更多視覺(jué)比較見(jiàn)補(bǔ)充材料??梢杂^察到,與其他方法相比,我們的方法在不同提示下實(shí)現(xiàn)了更好的視覺(jué)效果。值得注意的是,我們的大約 50% 壓縮的 SDXL 模型幾乎可以達(dá)到原始模型的相同視覺(jué)質(zhì)量。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

添加性質(zhì)的驗(yàn)證

由于最終的替代目標(biāo) (6) 是原始目標(biāo) (2) 的上界的近似,有必要檢驗(yàn)近似的精度。通過(guò)選擇不同的 ?? 和 Rm,覆蓋從 0% 到 90% 的剪枝比率,模擬了近似準(zhǔn)則 (6) 和真實(shí)準(zhǔn)則 (2) 的值。我們還對(duì)剪枝準(zhǔn)則 Δtask loss 和 ΔCLIP score 進(jìn)行了相同的實(shí)驗(yàn)。如圖6 所示,我們的輸出損失準(zhǔn)則在不同模型下顯著滿足添加性質(zhì),即使在極端的剪枝比率下也是如此,幾乎所有觀察點(diǎn)都位于恒等線附近。因此,我們最終的替代目標(biāo) (6) 是原始目標(biāo) (2) 的出色近似。另一方面,其他準(zhǔn)則未能始終滿足添加性質(zhì)。雖然我們的輸出損失準(zhǔn)則在不同模型之間具有最強(qiáng)的添加性質(zhì),但 ΔCLIP score 在 SDXL 上具有第二強(qiáng)的添加性質(zhì),而 Δtask loss 在 SDM-v1.5 上具有第二強(qiáng)的添加性質(zhì)。

剪枝準(zhǔn)則消融實(shí)驗(yàn)

實(shí)驗(yàn)表明,我們的輸出損失準(zhǔn)則在不同模型上顯著并一致地滿足添加性質(zhì),而其他準(zhǔn)則未能達(dá)到這一點(diǎn)。此外,我們?cè)u(píng)估了使用不同剪枝準(zhǔn)則的剪枝性能,包括我們構(gòu)建的剪枝準(zhǔn)則和兩個(gè)基線剪枝準(zhǔn)則,即幅度度量和損失函數(shù)的一階泰勒展開(kāi)。我們首先使用不同的層剪枝準(zhǔn)則對(duì) SDXL 和 SDM-v1.5 進(jìn)行剪枝,然后通過(guò)普通蒸餾對(duì)修剪后的網(wǎng)絡(luò)進(jìn)行相同次數(shù)的重新訓(xùn)練。如表2 所示,在不同模型上,輸出損失準(zhǔn)則在剪枝準(zhǔn)則中取得了最高的剪枝性能。


除了不同的剪枝準(zhǔn)則,還將層剪枝方法與手工制作的層移除方法進(jìn)行了比較。對(duì)于 SDXL 和 SDM-v1.5 的實(shí)驗(yàn),分別使用 SSD和 BK-SDM的相同手工制作層移除設(shè)置。表2 中的結(jié)果顯示,除了基于幅度的層剪枝被 SDXL 上的手工制作方法 SSD 打敗外,幾乎所有的層剪枝方法通常都優(yōu)于手工制作方法。


值得注意的是,在我們構(gòu)建的三種剪枝準(zhǔn)則中,即輸出損失、Δtask loss 和 ΔCLIP score,雖然輸出損失在不同模型上取得了最佳性能,但 ΔCLIP score 在 SDXL 上取得了第二好的性能,而 Δtask loss 在 SDM-v1.5 上取得了第二好的性能,與它們添加性質(zhì)的排名相一致。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

知識(shí)蒸餾消融實(shí)驗(yàn)

通過(guò)消融研究驗(yàn)證了我們的歸一化特征蒸餾的有效性。使用我們的一次性層剪枝方法對(duì) SDXL 和 SDM-v1.5 進(jìn)行剪枝,然后使用普通蒸餾或我們的歸一化蒸餾對(duì)修剪后的網(wǎng)絡(luò)進(jìn)行相同次數(shù)的重新訓(xùn)練。如表3 所示,我們的方法在 SDXL 和 SDM-v1.5 上都取得了很好的性能改進(jìn)。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

剪枝分析

以剪枝比例為 50% 的 SDXL 的 U-Net 和剪枝比例為 33% 的 SDM-v1.5 的 U-Net 為例進(jìn)行了剪枝架構(gòu)的分析。如表4 所示,對(duì)于 SDXL 和 SDM-v1.5,許多位于中間階段及其附近的層被認(rèn)為不太重要,因此被剪枝了。這一觀察結(jié)果與先前的手工制作層移除方法一致。然而,我們觀察到的是,與之前的手工制作層移除方法不同,更多的層在 Dn 階段被剪枝,而不是在 Up 階段。對(duì)于 SDXL,我們觀察到在 Dn 階段有 30 層中有 18 層被剪枝,而在 Up 階段只有 10 層中有 10 層被剪枝。同樣的現(xiàn)象也在 SDM-v1.5 上觀察到,在 Dn 階段有 14 層中有 4 層被剪枝,而在 Up 階段只有 21 層中有 1 層被剪枝。這一觀察結(jié)果與其他研究一致,即 Dn 階段,即 U-Net 的編碼器,不如 U-Net 的其他部分重要。

為Stable Diffusion模型瘦身并達(dá)到SOTA!LAPTOP-Diff:剪枝蒸餾新高度(哈工大&OPPO)-AI.x社區(qū)

結(jié)論

本項(xiàng)工作提出了用于壓縮擴(kuò)散模型的層剪枝和歸一化蒸餾(LAPTOP-Diff)。引入了層剪枝方法來(lái)實(shí)現(xiàn)自動(dòng)化、可擴(kuò)展性和更好的性能,并提出了一種有效的一次性剪枝準(zhǔn)則,即輸出損失準(zhǔn)則,其有效性是通過(guò)其良好的添加性質(zhì)來(lái)保證的。進(jìn)一步通過(guò)提出的歸一化特征蒸餾來(lái)緩解先前基于蒸餾的重訓(xùn)練中的不平衡問(wèn)題。使用提出的 LAPTOP-Diff,為 SDMs 實(shí)現(xiàn)了最先進(jìn)的性能壓縮。


本文轉(zhuǎn)自 AI生成未來(lái) ,作者:Dingkun Zhang等


原文鏈接:??https://mp.weixin.qq.com/s/fs-m7J3LZjUKCKup6yNyzA??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
久久久亚洲网站| 激情小说一区| 成人在线综合网| 2019中文在线观看| 日本精品久久久久中文| 国产精品日本一区二区三区在线 | 9久re热视频在线精品| 亚洲欧美日韩天堂| 男人午夜视频在线观看| 麻豆免费在线| 亚洲欧美韩国综合色| 精选一区二区三区四区五区| 在线视频 91| 国产人成精品一区二区三| 日韩一中文字幕| 在线视频 日韩| 99久久这里有精品| 欧美性猛交xxxx久久久| 黄色免费高清视频| 久青青在线观看视频国产| 国产一区二区看久久| 国产成人精品综合久久久| 久久久久久久中文字幕| 欧美3p在线观看| 日韩av中文字幕在线免费观看| 午夜剧场高清版免费观看| 在线毛片观看| 亚洲午夜电影网| 亚洲最新免费视频| 国产鲁鲁视频在线观看免费| 99在线精品免费| 99超碰麻豆| 国产又粗又猛又色又| 天使萌一区二区三区免费观看| 久久人人97超碰精品888| 精品国产视频在线观看| 欧美xxav| 日韩天堂在线视频| youjizz亚洲女人| 欧美人与拘性视交免费看| 亚洲电影在线看| 911亚洲精选| 中文字幕区一区二区三| 67194成人在线观看| 天天干天天av| 国产一区高清| 欧美精品一二三四| 奇米视频7777| 精品999日本久久久影院| 欧美日韩精品综合在线| 午夜国产一区二区三区| a∨色狠狠一区二区三区| 欧美综合亚洲图片综合区| 黑鬼大战白妞高潮喷白浆| 五月天av在线| 日本韩国欧美在线| 九九热在线免费| 成人在线视频免费| 欧美日韩国产综合一区二区三区| 中文久久久久久| 老司机精品视频网| 欧美日本乱大交xxxxx| 九九精品久久久| 伊人久久精品| 日韩精品一区二区三区在线 | 国产成人福利av| 亚洲国产欧美一区二区丝袜黑人| 国产人妻黑人一区二区三区| 麻豆国产欧美一区二区三区r| 亚洲激情在线观看| 女~淫辱の触手3d动漫| 免费av一区| 中文字幕免费精品一区高清| 女性裸体视频网站| 欧美激情视频一区二区三区在线播放 | 国产精品亚洲综合| 四虎精品在线| 亚洲国产激情av| 日韩不卡一二区| 图片区小说区亚洲| 亚洲福利视频导航| 少妇黄色一级片| 粉嫩av国产一区二区三区| 精品国产乱码久久久久久夜甘婷婷| 男女性杂交内射妇女bbwxz| 日韩一级电影| 久久精品成人一区二区三区| 久久精品视频日本| 日韩精品1区2区3区| 91牛牛免费视频| 手机福利小视频在线播放| 欧美韩国日本不卡| 91免费国产精品| 欧美理论影院| 日韩午夜在线影院| 疯狂揉花蒂控制高潮h| 欧美xxxxx视频| 97视频在线观看亚洲| 天天天天天天天干| 丁香亚洲综合激情啪啪综合| 日韩久久久久久久久久久久久| 成人黄色网址| 色欧美88888久久久久久影院| 中文字幕在线视频一区二区| 校花撩起jk露出白色内裤国产精品| 最近日韩中文字幕中文| 久久久精品国产sm调教| 日本在线播放一区二区三区| 国产精品二区在线观看| 成人18在线| 五月婷婷综合激情| 99中文字幕在线| 欧美亚洲高清| 91av在线网站| 亚洲国产成人一区二区| 欧美国产激情一区二区三区蜜月| 日韩精品在线中文字幕| 色狠狠一区二区三区| 亚洲人成电影网| 国产系列精品av| 国产一区二区三区四| 日韩精品第一页| 麻豆视频在线看| 精品久久久久久无| 黄色一级大片在线免费观看| 日韩和欧美的一区| 免费看成人午夜电影| 2018av在线| 日韩欧美激情一区| 三上悠亚作品在线观看| 美女一区二区三区在线观看| 热舞福利精品大尺度视频| 国产一二在线播放| 精品日韩成人av| 黄色在线观看免费| 国产真实精品久久二三区| 亚洲一区二区三区精品视频| 高清成人在线| 国产小视频91| 亚洲大片免费观看| 久久精品视频在线免费观看| 免费黄色福利视频| 日韩av影院| 茄子视频成人在线| 日本一卡二卡四卡精品| 午夜精品福利一区二区三区av | 一区二区传媒有限公司| 国产美女撒尿一区二区| 国内成人精品视频| 色婷婷在线视频| 午夜伊人狠狠久久| 8050国产精品久久久久久| 亚洲第一男人天堂| 精品国产31久久久久久| 不卡高清视频专区| 亚洲午夜一二三区视频| 国产精品国产亚洲精品看不卡| 51精品国产| 欧美精品久久久久久久久| 国产三级小视频| 亚洲激情一二三区| 中文字幕三级电影| 亚洲深夜av| 欧美日韩一区在线播放| av亚洲一区二区三区| 伊人久久久久久久久久久| 伊人影院中文字幕| 成人欧美一区二区三区白人 | 91九色在线看| 日韩精品中文字幕有码专区| 无码任你躁久久久久久久| 欧美极品aⅴ影院| 婷婷中文字幕在线观看| 欧美成人高清| 久久香蕉综合色| 日本一区二区电影| 欧美超级乱淫片喷水| 性欧美18一19性猛交| 精品久久久久国产| 阿v天堂2014| 国产激情视频一区二区在线观看 | 免费成人深夜夜行网站| 国产成人午夜精品影院观看视频 | 久久艹精品视频| 久久亚洲免费视频| 五月花丁香婷婷| 亚洲福利免费| 亚洲一区二区三区免费看| 深夜激情久久| 国产第一区电影| 日本欧美电影在线观看| 日韩精品在线视频| 91激情在线观看| 欧美日韩国产影院| 日韩精品一区二区三区在线视频| 不卡的电视剧免费网站有什么| 浓精h攵女乱爱av| 亚洲福利免费| 在线视频一区观看| 亚洲品质自拍| 51成人做爰www免费看网站| 成人va天堂| 欧美疯狂做受xxxx高潮| 高清av在线| 亚洲国产精品嫩草影院久久| 国产精品毛片久久久久久久av| 同产精品九九九| 欧美性x x x| 久久久久国产免费免费 | 国产美女裸体无遮挡免费视频| 五月综合激情婷婷六月色窝| 国产97免费视频| 国产欧美精品国产国产专区| 艳妇乳肉亭妇荡乳av| 久久99国内精品| 欧美黄色一级片视频| 亚洲图片在线| 在线观看18视频网站| 国产探花在线精品| 国产综合色一区二区三区| 国产精品视频一区二区三区综合| 国产成人综合精品在线| 在线成人av观看| 国内免费久久久久久久久久久| 国产精品实拍| www.xxxx精品| 99reav在线| 国产一区二区三区网站| 三级在线观看| 亚洲精品国精品久久99热 | jlzzjlzz国产精品久久| 中文字幕在线视频一区二区| 美女任你摸久久 | 国产成人福利片| 欧美激情第一区| 精品在线免费视频| 日本超碰在线观看| 免费在线观看精品| 北条麻妃av高潮尖叫在线观看| 国产欧美日韩亚洲一区二区三区| 妞干网在线播放| 欧美午夜免费影院| 日本wwwcom| 国模吧视频一区| 欧美精品卡一卡二| 亚洲精选久久| heyzo亚洲| 性色av一区二区怡红| 92看片淫黄大片一级| 午夜亚洲激情| 久草综合在线观看| 久久激情综合网| 国产一级免费大片| 国产精品一区二区三区乱码| 在线观看视频在线观看| 国产成人综合亚洲91猫咪| 国产精久久久久| 99视频热这里只有精品免费| 老鸭窝一区二区| 欧美韩国一区二区| 成人自拍小视频| 亚洲一二三区不卡| 欧美成人精品欧美一级乱黄| 欧美午夜丰满在线18影院| 青草视频在线观看免费| 在线看日本不卡| 国产精品久久久久久久久久久久久久久久久久 | 日韩av电影在线播放| 在线国产成人影院| 成人免费淫片视频软件| 日韩免费高清视频网站| 国产一区二区三区四区hd| 免费成人结看片| 亚洲一卡二卡三卡四卡无卡网站在线看| 亚洲精品成人| 91好吊色国产欧美日韩在线| 日韩成人av影视| 91精品国产三级| jiyouzz国产精品久久| 日韩福利在线视频| 一区二区三区视频在线看| 国产成人免费看| 在线播放日韩导航| 殴美一级特黄aaaaaa| 夜夜嗨av一区二区三区免费区| 黄色网页在线免费观看| 午夜精品福利视频| 国产香蕉久久| 国产精品视频免费一区| 日本成人小视频| 国产曰肥老太婆无遮挡| 青青草原综合久久大伊人精品优势 | 日韩国产欧美区| 毛片网站在线免费观看| 91av在线视频观看| 久久精品免视看国产成人| 欧美二区在线看| 欧美激情1区| 在线免费视频a| av高清不卡在线| 中文字幕观看av| 色婷婷精品久久二区二区蜜臂av| av中文字幕第一页| 亚洲欧美在线磁力| 国产亚av手机在线观看| 国产欧美va欧美va香蕉在线| 亚洲精品456| 欧美极品少妇无套实战| 久久99精品网久久| 少妇特黄一区二区三区| 亚洲综合一区二区精品导航| 亚洲视频一区二区三区四区| 亚洲精品美女视频| 人人超在线公开视频| 国产日韩在线看| 国模精品一区| 黄色av网址在线播放| 成人午夜看片网址| 中文字幕电影av| 欧美裸体一区二区三区| 国产美女性感在线观看懂色av | 中文字幕视频网| 亚洲国内精品在线| 在线观看电影av| 成人国产在线视频| 全球成人免费直播| 国产精品无码av无码| 91网站在线观看视频| 久久国产在线观看| 欧美成人精品1314www| a免费在线观看| 成人一区二区电影| 香蕉久久网站| 亚洲精品乱码久久久久久动漫| 日本一区二区三区久久久久久久久不 | 免费看精品久久片| 国产视频三区四区| 在线观看区一区二| 国产精品一区二区婷婷| 国产z一区二区三区| 九九热爱视频精品视频| 黄色免费观看视频网站| 97精品国产97久久久久久久久久久久| 日本少妇bbwbbw精品| 亚洲第一男人天堂| 在线黄色的网站 | 午夜久久美女| 在线观看视频你懂得| 亚洲免费观看在线视频| 99久久精品国产成人一区二区 | 日本一区视频在线| 日本中文在线一区| 欧美肥妇bbwbbw| 欧美一区二区人人喊爽| 伦理av在线| 久久99精品久久久久久秒播放器| 裸体一区二区| 亚洲一二三四视频| 欧美一级国产精品| 国产探花在线观看| 久99久在线| 日韩精品1区2区3区| 亚洲xxxx3d动漫| 精品久久久久久久久久久久久久久| 韩国日本一区| 欧美精品欧美精品| 美国十次了思思久久精品导航| 国产真实乱在线更新| 亚洲第一男人av| 国产另类xxxxhd高清| 中文字幕欧美人与畜| 国产精品自在欧美一区| 日韩欧美a级片| 亚洲天天在线日亚洲洲精| 亚洲影视资源| 无码粉嫩虎白一线天在线观看| 久久综合成人精品亚洲另类欧美| 最新国产中文字幕| 久久国产精品久久久| 网友自拍一区| 天天干天天色天天干| 亚洲国产精品精华液网站| 国产精品视频一区二区久久| 91精品视频大全| 亚洲永久在线| 日日噜噜夜夜狠狠久久波多野| 亚洲精品美女久久| 日日夜夜精品| 日韩中文字幕三区| 中文字幕五月欧美| 免费观看成年在线视频网站| 91视频免费在线| 天堂va蜜桃一区二区三区| 免费网站观看www在线观| 亚洲新声在线观看| 超碰一区二区三区| 岛国av免费在线| 欧美性生交xxxxxdddd| av香蕉成人| 神马影院一区二区|