精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

無VAE擴散模型! 清華&可靈團隊「撞車」謝賽寧團隊「RAE」

人工智能 新聞
本篇文章通過直接結(jié)合預(yù)訓(xùn)練視覺特征編碼器(如 DINO、SigLIP、MAE)結(jié)合殘差信息學(xué)習(xí)預(yù)訓(xùn)練視覺特征編碼器丟失的圖片重建信息與專門訓(xùn)練的解碼器,有效替代了傳統(tǒng) VAE,提升了表示質(zhì)量與效率。

長期以來,擴散模型的訓(xùn)練通常依賴由變分自編碼器(VAE)構(gòu)建的低維潛空間表示。然而,VAE 的潛空間表征能力有限,難以有效支撐感知理解等核心視覺任務(wù),同時「VAE + Diffusion」的范式在訓(xùn)練與推理效率上也存在顯著瓶頸。

清華大學(xué)智能視覺團隊和快手可靈團隊聯(lián)合推出《Latent Diffusion Model without Variational Autoencoder》與近期爆火的謝賽寧團隊 RAE 工作不謀而合,但在總體設(shè)計思路與研究重點上有所差異。

本篇文章通過直接結(jié)合預(yù)訓(xùn)練視覺特征編碼器(如 DINO、SigLIP、MAE)結(jié)合殘差信息學(xué)習(xí)預(yù)訓(xùn)練視覺特征編碼器丟失的圖片重建信息與專門訓(xùn)練的解碼器,有效替代了傳統(tǒng) VAE,提升了表示質(zhì)量與效率。

本文提出的系統(tǒng)性框架稱為 SVG(Self-supervised representation for Visual Generation)。

  • 論文標(biāo)題:Latent Diffusion Model without Variational Autoencoder
  • 論文鏈接:https://arxiv.org/abs/2510.15301
  • 項目鏈接:https://howlin-wang.github.io/svg/
  • 代碼地址:https://github.com/shiml20/SVG

該論文同樣對傳統(tǒng) VAE + Diffusion 的局限性進行了分析,發(fā)現(xiàn)其關(guān)鍵問題在于 VAE 空間存在非常明顯的語義糾纏現(xiàn)象。VAE 的 latent 空間缺乏清晰語義結(jié)構(gòu),不同類別特征高度混合(論文通過 t-SNE 可視化驗證,普通 VAE latent 中不同語義類別的特征點嚴重重疊),導(dǎo)致擴散模型需花費大量步數(shù)學(xué)習(xí)數(shù)據(jù)分布。

不同特征空間中不同語義類別的 t-SNE 可視化圖

這種語義糾纏現(xiàn)象直接導(dǎo)致了兩個關(guān)鍵問題:

  • 訓(xùn)練推理效率雙低: 如下圖中例子所示,如果語義糾纏程度高,那么即使給定了不同的語義條件,平均速度仍是難以區(qū)分的,模型在訓(xùn)練時就得花更多力氣「理清」語義糾纏的特征。并且如果語義區(qū)分度較高,在空間中不同位置的速度方向也將更趨于一致,從而有助于減少采樣過程的離散誤差,支持少步數(shù)采樣。

特征空間語義糾纏會對生成模型訓(xùn)練推理帶來消極影響

  • 通用性差: VAE 依賴于重建損失進行訓(xùn)練,只適合生成任務(wù),在感知理解這些視覺核心任務(wù)中的效果遠不如專門的特征提取器。

考慮到各類視覺基礎(chǔ)模型(如 DINO、SigLIP)已經(jīng)構(gòu)建出了具有優(yōu)良語義結(jié)構(gòu)的空間,研究者認為這類預(yù)訓(xùn)練視覺特征空間可能更適合生成模型的訓(xùn)練,同時也具有更強的可通用性。其中 DINO 特征在各種視覺下游任務(wù)中已經(jīng)展現(xiàn)出了良好的性能,并且保留了基礎(chǔ)的圖像結(jié)構(gòu)信息,具備比較高的重建潛力。

SVG 破局:

靠 DINO 搭地基,殘差分支補細節(jié)

SVG 自編碼器結(jié)構(gòu)示意圖

SVG 的核心思路很簡單:用更強的語義結(jié)構(gòu)解鎖模型生成潛力,基于自監(jiān)督特征構(gòu)建統(tǒng)一特征空間。 

SVG 自編碼器由「凍結(jié)的 DINOv3 編碼器」、「輕量殘差編碼器」、「解碼器」三部分組成,核心是通過多組件協(xié)作同時實現(xiàn)強判別性的語義結(jié)構(gòu)與圖像細節(jié)補充。

  • 凍結(jié) DINOv3 編碼器: 作為語義骨架,提供強判別性特征。DINOv3 通過自監(jiān)督訓(xùn)練(對比學(xué)習(xí) + 掩碼建模),天然具備清晰的語義類別邊界,同時,DINOv3 的特征已在多種視覺任務(wù)中驗證有效性,為 SVG 的通用性奠定基礎(chǔ);
  • 輕量殘差編碼器: 彌補色差,補充細粒度細節(jié)。DINOv3 雖能捕捉全局語義,但會丟失部分細節(jié)(如色彩、紋理),導(dǎo)致重建質(zhì)量差。SVG 設(shè)計了基于 ViT 的輕量殘差分支,專門學(xué)習(xí) DINOv3 未覆蓋的高頻細節(jié),并通過「通道級拼接」與 DINO 特征融合;
  • 分布對齊機制:避免細節(jié)干擾語義。為防止殘差特征破壞 DINO 的語義結(jié)構(gòu),SVG 將殘差輸出歸一化后再根據(jù) DINO 特征的均值和方差進行縮放,使其匹配 DINO 特征的分布,確保拼接后的 latent 空間既具備高保真重建能力,又有利于生成模型訓(xùn)練(消融實驗顯示,無對齊時生成 FID 從 6.12 升至 9.03,對齊后恢復(fù)至 6.11);
  • SVG 解碼器: 參考傳統(tǒng) LDM 的 VAE 解碼器結(jié)構(gòu),將融合后的 latent 特征映射回像素空間,確保生成圖像的分辨率與細節(jié)還原度。

二者結(jié)合,構(gòu)成了一個既有良好語義可區(qū)分性,又具有強重建能力的潛在空間。

重建效果展示圖:殘差編碼器修復(fù)了圖像色差問題,補充了高頻細節(jié)

SVG 擴散訓(xùn)練:

直接在高維 SVG 特征空間學(xué)習(xí)

與傳統(tǒng) LDM 在 VAE 的低維(如 16×16×4)latent 空間訓(xùn)練不同,SVG 擴散模型直接在高維特征空間(16×16×392)訓(xùn)練。研究者指出,盡管之前的觀點大多認為高維空間訓(xùn)練易導(dǎo)致生成模型收斂不穩(wěn)定,但實驗證明 SVG 空間良好的性質(zhì)使得在這種高維度情況下,模型訓(xùn)練依舊穩(wěn)定,甚至效率更高。

論文在 ImageNet 256×256 數(shù)據(jù)集上進行了全面實驗,對比 SiT、DiT、MaskDiT 等主流 LDM,從生成性能、效率、多任務(wù)適配性三個維度驗證 SVG 的優(yōu)勢,核心結(jié)果如下:

  • 生成質(zhì)量:性能顯著優(yōu)于基線

在訓(xùn)練 80 個 epoch,25 步采樣條件下,SVG-XL(675M 參數(shù))的生成性能全面超越同規(guī)模基線:

無分類器引導(dǎo)(w/o CFG)時,SVG-XL 的 gFID 為 6.57,而 SiT-XL(SD-VAE)為 22.58、SiT-XL(VA-VAE)為 7.29;

有分類器引導(dǎo)(w/ CFG)時,SVG-XL 的 gFID 降至 3.54,SiT-XL(VA-VAE)為 4.13。

若延長訓(xùn)練至 1400 個 epoch,SVG-XL 的 gFID 可進一步降至 1.92(w/ CFG),接近當(dāng)前生成模型 SOTA 水平。

  • 訓(xùn)練與推理效率:大幅降低資源消耗

訓(xùn)練效率: 在 w/o CFG 設(shè)定下,SVG-XL 僅需 80 個 epoch 即可達到 SiT-XL 1400 個 epoch 的生成質(zhì)量(gFID 6.57 vs 9.35);

推理效率: 消融實驗中,5 步采樣時,SVG-XL 的 gFID 為 12.26(w/o CFG),而 SiT-XL(SD-VAE)為 69.38、SiT-XL(VA-VAE)為 74.46,展現(xiàn)了良好的少步數(shù)推理性能。


  • 多任務(wù)通用性:統(tǒng)一特征空間適配多視覺任務(wù)

SVG 的 latent 空間繼承了 DINOv3 的良好性質(zhì),可直接用于分類、分割、深度估計等任務(wù),無需額外微調(diào)編碼器:

消融實驗結(jié)果證明 SVG 編碼器完全保持了 DINOv3 編碼器的性能。這一結(jié)果驗證了 SVG 作為統(tǒng)一表征空間的可行性。

  • 定性分析:插值平滑性與可編輯性

研究者發(fā)現(xiàn) SVG 空間中的隨機噪聲在直接線性插值與球面線性插值下均能生成平滑過渡的圖像;而傳統(tǒng) VAE 空間中直接線性插值可能產(chǎn)生較差的中間結(jié)果。這證明了 SVG 空間的魯棒性。

研究者還對 SVG 進行了零樣本編輯實驗,證明基于 SVG 空間的生成模型依然具備 VAE + Diffusion 模型所具備的可編輯性。

總結(jié)

SVG 的核心價值并非單純「棄用 VAE」,而是通過「自監(jiān)督特征 + 殘差細節(jié)」的組合,證明了「生成、理解與感知共享統(tǒng)一 latent 空間」的可行性。這一思路不僅解決了傳統(tǒng) LDM 的效率與通用性痛點,更為后續(xù)通用視覺模型的研發(fā)提供了新的思路。

在總體思路上,該論文關(guān)鍵思路與謝賽寧團隊的 RAE 高度相似,都驗證了在生成模型訓(xùn)練中用預(yù)訓(xùn)練視覺特征編碼器替代 VAE 的可行性。RAE 工作更多側(cè)重于如何優(yōu)化改善擴散模型在這種高維度特征空間的訓(xùn)練,而本文解決了單純依賴預(yù)訓(xùn)練視覺特征編碼器帶來的重建效果差的問題,從而也為該方法用于統(tǒng)一生成編輯模型初步驗證了可行性。

更多細節(jié)請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-10-29 09:05:04

2025-10-15 08:50:01

2025-01-20 08:35:00

模型生成AI

2024-10-14 13:20:00

2025-07-04 08:52:00

3D圖像生成AI

2025-11-14 09:21:45

2025-11-12 08:42:00

2022-12-23 10:15:44

模型AI

2025-06-13 08:53:00

2025-08-01 09:12:00

2023-12-23 23:08:21

語音數(shù)據(jù)

2025-05-16 11:03:48

2025-07-08 09:18:12

AI模型論文

2025-06-19 09:04:00

2025-05-20 09:08:59

2025-11-19 08:59:15

2023-03-13 15:56:00

模型框架

2024-10-23 15:05:29

2025-05-14 09:15:00

2024-02-26 08:25:00

模型訓(xùn)練
點贊
收藏

51CTO技術(shù)棧公眾號

中文乱码字幕高清一区二区| 亚洲午夜无码av毛片久久| 又骚又黄的视频| 性欧美欧美巨大69| 亚洲丁香久久久| 国内外免费激情视频| 国产精品剧情| 99热精品国产| 国产欧美久久久久久| 精品在线视频观看| 欧美日韩高清| 精品国产免费一区二区三区四区| 国产三区在线视频| 欧美卡一卡二| 国产精品全国免费观看高清 | 午夜69成人做爰视频| 精品在线网站观看| 欧美精品在线观看播放| 黄色成人在线看| 米奇777四色精品人人爽| 99精品热视频| 999视频在线观看| 亚洲精品国产无码| 亚洲免费黄色| 不卡中文字幕av| 日本少妇xxxxx| 卡通动漫国产精品| 日韩视频一区二区三区在线播放| 激情内射人妻1区2区3区| 3344国产永久在线观看视频| 亚洲天堂久久久久久久| 四虎影院一区二区三区 | 99精品欧美一区二区三区小说 | 午夜精品久久17c| 任我爽在线视频| 精品日韩欧美一区| 精品视频在线播放| 中文字幕三级电影| 我要色综合中文字幕| 欧美喷潮久久久xxxxx| 免费在线激情视频| yellow在线观看网址| 亚洲精品美腿丝袜| 日韩人妻精品一区二区三区| 欧美精品电影| 中文字幕中文字幕中文字幕亚洲无线| 久久一区二区三区av| 午夜av免费观看| 国产成人欧美日韩在线电影| 亚洲free嫩bbb| 国产剧情久久久| 精品在线播放午夜| 成人在线视频网站| 国产精品无码AV| 韩国av一区二区| 91亚洲永久免费精品| 国产一区二区三区成人| 极品少妇xxxx偷拍精品少妇| 国产热re99久久6国产精品| 中文字幕日韩国产| 蜜臀精品一区二区三区在线观看| 国产精品久久国产精品99gif| 超碰在线观看91| 日本欧美一区二区| 国产综合在线观看视频| 国产美女免费看| 粉嫩绯色av一区二区在线观看| 高清日韩一区| 青春草在线观看| 欧美—级在线免费片| 在线观看成人一级片| 黄色免费在线看| 亚洲国产综合色| 国产深夜男女无套内射| 成人软件在线观看| 欧美日韩一区二区电影| 人妻换人妻仑乱| 国产乱论精品| 亚洲性线免费观看视频成熟| 激情高潮到大叫狂喷水| 亚洲欧美综合| 欧美综合在线观看| 国产又黄又猛又爽| 成人av网站大全| 欧美一区二区三区四区五区六区| 午夜看片在线免费| 亚洲香蕉伊在人在线观| 国产97色在线 | 日韩| 欧美高清你懂的| 欧美videossexotv100| 插吧插吧综合网| 欧美xxxx中国| 欧美性做爰毛片| 91成品人影院| 99视频精品免费视频| 一本一本a久久| 好看的中文字幕在线播放| 日韩欧美在线网址| 男插女视频网站| 激情婷婷综合| 欧美精品电影免费在线观看| 中文字幕777| www.欧美.com| 992tv快乐视频| 香蕉成人av| 亚洲国产精品小视频| 国产精品18在线| 国产精品日韩久久久| 成人在线播放av| 国产一级免费在线观看| 亚洲一区在线电影| 一级做a免费视频| 亚洲三级网页| 欧美黑人又粗大| 伊人网站在线观看| 久久人人超碰精品| 国产九色porny| 亚洲伦理网站| 影音先锋日韩有码| 国产在线观看黄色| 成人免费观看av| www国产无套内射com| 国产成人a视频高清在线观看| 亚洲国产精品中文| 麻豆一区产品精品蜜桃的特点| 麻豆成人久久精品二区三区小说| 久久99久久精品国产| 黄色污污视频在线观看| 日韩网站在线看片你懂的| 人人妻人人澡人人爽| 亚洲一区二区三区免费在线观看| 国产精品v欧美精品v日韩| 成人影院www在线观看| 欧美三区在线视频| 一级片黄色录像| 视频一区在线播放| 欧美日韩精品不卡| 亚洲欧美小说色综合小说一区| 亚洲精品一区二区三区四区高清| 欧美精品一区二区蜜桃| 国产另类ts人妖一区二区| 亚洲在线观看一区| 国产精品蜜月aⅴ在线| 亚洲欧美日韩网| 欧美日韩一二三四区| 91毛片在线观看| 免费看黄在线看| 秋霞蜜臀av久久电影网免费| 97久久精品人人澡人人爽缅北| 亚洲黄色小说网| 亚洲一级电影视频| 亚洲 欧美 日韩在线| 影音先锋中文字幕一区二区| 国产伦理久久久| 松下纱荣子在线观看| 亚洲开心激情网| 天天爱天天做天天爽| 国产欧美精品一区| 日韩一级免费片| 希岛爱理一区二区三区| 91欧美激情另类亚洲| 色爱综合区网| 日韩av最新在线观看| 懂色av蜜臀av粉嫩av分享吧最新章节| 国产日产欧美一区| 中文字幕日韩综合| 欧美福利在线| 精品日韩电影| 亚洲成人不卡| 久久精品中文字幕免费mv| 国产欧美一级片| 亚洲国产日韩av| 亚洲成人日韩在线| 日本亚洲一区二区| 一级特黄妇女高潮| 欧美亚洲大陆| 国产欧美精品日韩精品| 污视频网站在线免费| 日韩高清中文字幕| 中文字幕在线观看欧美| 一区二区三区中文字幕| 四虎永久免费影院| 国产麻豆精品视频| 欧美牲交a欧美牲交aⅴ免费真| 99精品视频在线观看播放| 99国产超薄肉色丝袜交足的后果| 日韩精品极品| 精品精品国产国产自在线| 婷婷在线免费观看| 欧美日韩精品一区二区三区四区| 久久久久无码国产精品| 久久久久久久一区| 熟女人妻一区二区三区免费看| 免费在线亚洲| 91大学生片黄在线观看| 国产91久久精品一区二区| 亚洲va男人天堂| 三级成人在线| 国内精久久久久久久久久人| 97超碰人人在线| 亚洲国产精久久久久久久| 在线免费看毛片| 日韩欧美国产视频| 国产亚洲色婷婷久久99精品| 欧美激情在线免费观看| 中国极品少妇xxxx| 紧缚奴在线一区二区三区| 国产又黄又猛视频| 激情av一区| 影音先锋欧美在线| 蜜桃tv一区二区三区| av在线亚洲男人的天堂| 久久福利在线| 日本不卡视频在线播放| 丰满诱人av在线播放| 久久久国产一区二区| 九色视频在线观看免费播放| 亚洲成人精品久久| 99产精品成人啪免费网站| 欧美丝袜丝nylons| 国产午夜精品久久久久| 午夜欧美在线一二页| 91日韩中文字幕| 中文字幕中文字幕一区| 国产毛片久久久久久久| 91欧美一区二区| 大尺度做爰床戏呻吟舒畅| 国产精品一区二区不卡| 超碰超碰在线观看| 蜜臀久久久久久久| 特级丰满少妇一级| 美女诱惑一区| 欧美 日韩 国产一区| 国产精品主播| 人人干视频在线| 亚洲高清二区| av免费看网址| 亚洲每日更新| 成人免费观看cn| 一本久道久久久| 国产av麻豆mag剧集| 亚洲欧洲综合| 国产午夜福利100集发布| 亚洲人成毛片在线播放女女| 欧美精品在欧美一区二区| 亚洲五月综合| 波多野结衣与黑人| 红桃视频国产一区| 欧美精品卡一卡二| 亚洲精品社区| 国产日产欧美视频| 秋霞午夜鲁丝一区二区老狼| www.日本xxxx| 久久精品国产第一区二区三区| 国产成年人视频网站| 国产精品中文字幕欧美| 91精品国产高清91久久久久久 | 99久久免费看精品国产一区| 成人性色生活片| a天堂视频在线观看| 久久婷婷国产综合国色天香| 国产精成人品免费观看| 亚洲天堂中文字幕| 福利一区二区三区四区| 色综合一区二区三区| 中文字幕观看视频| 欧美一区二区三区系列电影| 亚洲经典一区二区| 日韩精品小视频| 91精品大全| 欧美激情第99页| 美女视频在线免费| 国产精品黄色影片导航在线观看| 99视频有精品高清视频| 国产精品免费观看高清| 国产探花在线精品一区二区| 中文字幕人成一区| 激情久久一区| 欧美婷婷精品激情| 国产麻豆精品一区二区| 欧美图片一区二区| 亚洲欧美日本在线| 国产精品国产三级国产专区52| 欧美日韩在线一区二区| 丰满人妻一区二区三区免费| 日韩精品在线播放| 国产精品久久麻豆| 日本欧美精品在线| 在线观看亚洲精品福利片| 国产精品一区二区a| 亚洲影院天堂中文av色| 中文字幕一区二区三区在线乱码 | 三级精品视频| 中文字幕日韩精品久久| 亚洲中字在线| 小日子的在线观看免费第8集| 91丨九色丨尤物| 天天看片中文字幕| 色播五月激情综合网| 亚洲高清精品视频| 在线成人中文字幕| 9999在线视频| 国产在线精品播放| 久久99性xxx老妇胖精品| 精品久久久无码人妻字幂| 丝袜诱惑制服诱惑色一区在线观看| 男女污污视频网站| 久久久久99精品国产片| 国产一级二级三级视频| 精品视频在线免费| 日本韩国一区| 欧美精品videossex性护士| av在线亚洲一区| 色女人综合av| 欧美专区一区二区三区| 日本精品一二三| 亚洲丝袜另类动漫二区| 凹凸精品一区二区三区| 亚洲精品xxx| 欧美人与性动交α欧美精品图片| 国产精品视频不卡| 国产成人1区| 一区二区传媒有限公司| 国产91精品免费| 国产波霸爆乳一区二区| 制服丝袜在线91| 91涩漫在线观看| 日本中文字幕久久看| 欧美久久精品| 国产 日韩 亚洲 欧美| 国产福利一区二区三区在线视频| www.com.av| 欧美妇女性影城| 日本中文字幕视频在线| 国产精品稀缺呦系列在线| 国产99精品一区| 免费看a级黄色片| 国产人久久人人人人爽| 国产成人一级片| 亚洲伦理中文字幕| 欧美激情20| 美国av一区二区三区| 国产精品日韩欧美一区| 捆绑凌虐一区二区三区| 亚洲福利视频一区| 色噜噜在线播放| 欧美一区二区三区图| 亚洲电影一级片| 激情综合网婷婷| 国产色产综合产在线视频| 国产午夜麻豆影院在线观看| 国产香蕉97碰碰久久人人| 福利精品在线| 日韩第一页在线观看| 国产一区二区三区国产| 麻豆亚洲av成人无码久久精品| 精品国产一区二区三区久久久蜜月| 免费在线看污片| 久久精品日韩精品| 久久精品女人| 一二三四在线观看视频| 91精品国产综合久久婷婷香蕉 | av女名字大全列表| 欧美最顶级丰满的aⅴ艳星| 国产99精品| www.色就是色.com| 一区二区三区在线观看视频| 亚洲色图另类小说| 国产精品久久久久免费a∨| 99re6这里只有精品| 国产无套精品一区二区三区| 精品久久久久久久久久久久久| 国产三级在线| 成人午夜在线观看| 亚洲欧洲午夜| 一级片久久久久| 日韩免费福利电影在线观看| 91吃瓜在线观看| 日日夜夜精品网站| 国产精品一区二区久久精品爱涩 | 国产一级二级三级精品| 日日夜夜一区二区| 欧美日韩成人免费观看| 亚洲欧美视频在线| 国产精品一区二区精品视频观看| 欧美一级视频在线播放| 欧美激情一区二区三区四区| av中文字幕免费| 热99精品里视频精品| 1024精品久久久久久久久| 在线免费观看污视频| 欧美日韩亚洲综合| 大桥未久在线视频| 在线精品日韩| 91麻豆蜜桃一区二区三区| 国产毛片一区二区三区va在线| 青青青国产精品一区二区| 中文在线播放一区二区| 无码人妻精品一区二区三应用大全| 欧美一区二区三区男人的天堂|