精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!

發布于 2025-11-19 09:41
瀏覽
0收藏

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

文章鏈接:https://arxiv.org/pdf/2511.13720 

亮點直擊

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

解決的問題

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

提出的方案

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

達到的效果

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

  • 優秀的可擴展性: JiT模型展現了卓越的伸縮性。
  • 分辨率擴展: 通過成比例地增大patch大小,JiT-B模型可以輕松地從256x256擴展到512x512甚至1024x1024分辨率,而模型參數量和計算量幾乎保持不變,FID分數也保持在很低的水平。這證明該方法不受觀測維度急劇增加的影響。
  • 模型規模擴展: 從JiT-B(Base)到JiT-G(Giant)模型,性能隨著模型尺寸的增大而持續穩定提升,在200-epoch和600-epoch的訓練設置下都展示了清晰的擴展趨勢,在512x512分辨率上取得了低至1.78的FID分數。

擴散模型的預測輸出

擴散模型可以在 x、? 或 v 空間中建立。空間的選擇不僅決定了損失的定義,還決定了網絡的預測結果。重要的是,損失空間和網絡輸出空間不必相同。這一選擇會產生關鍵性的差異。

背景:擴散模型與流模型

擴散模型可以從常微分方程(ODE)的角度進行公式化。我們從基于流的框架出發進行建模,即首先在 v 空間中展開,作為更簡單的起點,然后再討論其他空間。

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

預測空間與損失空間

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

玩具實驗

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

圖 1.流形假設假設自然圖像位于高維流形中的低維流形上。 圖像位于高維像素空間內的低維流形上。 維像素空間內的低維流形上。干凈的圖像 x 可以建模為 在流形上,而噪聲 ? 或流速 v(例如,v = x - ?)則完全不在流形上。 此時為非褶皺狀態。訓練神經網絡來預測干凈的 即 x 預測)與訓練神經網絡預測噪聲或有噪點圖像有著本質區別。 訓練神經網絡來預測噪聲或噪聲量(即 ?/v 預測)有著本質的區別

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

圖 2.玩具實驗:D 維(d = 2)底層 數據 "埋藏 "在 D 維空間中,由一個固定的隨機 列正交投影矩陣。在 D 維空間中,我們訓練一個簡單的生成模型(5 層 ReLU MLP,帶 256 維的 隱藏單元)。投影矩陣對模型來說是未知的。 我們僅將其用于可視化輸出。在這個玩具實驗中、 隨著觀測維度 D 的增加,只有 x 預測能產生合理的結果。

JiT: Just image Transformers (純粹的圖像Transformer)

基于流形假設的啟發,本文提倡使用 x-prediction。將介紹一個用于像素空間擴散的、概念上簡單的方法,稱之為JiT

架構

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

圖 3.圖像Transformer"(JiT)架構: 在像素斑塊上簡單地使用普通 ViT [13] 進行x-prediction


JiT的骨干網絡是一個標準的Vision Transformer (ViT) 。網絡接收一個帶噪圖像Zt作為輸入,將其劃分為不重疊的圖像塊(patches)。每個圖像塊被一個線性層獨立地嵌入。這些嵌入后的向量,連同一個從時間步t派生的嵌入向量,共同形成一個序列,輸入到Transformer編碼器中。在經過Transformer編碼器處理后,輸出序列中的圖像塊 token 會被另一個線性層獨立地投影回原始像素空間,以重構出預測的清晰圖像。


在ViT中,一個核心設計是使用大尺寸的圖像塊。例如,在256×256分辨率下使用16×16的patch大小,每個patch是768維(16×16×3)的向量。這是一種非常高的維度,為驗證我們的假設提供了一個很好的平臺。

主要實驗

本文在ImageNet 256×256上進行了主要實驗,使用JiT-B/16(ViT-Base架構,patch大小為16)。表2(a)展示了所有九種損失空間和預測空間組合的結果。

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

這個證據表明,網絡設計可以在很大程度上與觀測維度解耦,這與許多其他神經網絡應用中的情況一致。增加隱藏單元的數量可能是有益的(正如在深度學習中廣泛觀察到的那樣),但它不是決定性因素。

瓶頸結構可能是有益的。更令人驚訝的是,本文發現,反過來,在網絡中引入一個降低維度的瓶頸結構可能是有益的。

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

從表示學習的更廣闊視角來看,這一觀察并非完全出乎意料。引入瓶頸設計的目的通常是為了鼓勵學習內在的低維表示,如文獻[64, 48, 41, 2]。

本文算法

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

“Just Advanced” Transformers (純粹的先進Transformer)

通用Transformer的強大之處部分在于,當其設計與特定任務解耦時,它可以從其他應用中發展出來的架構進步中受益。這一特性支撐了用任務無關的Transformer來構建擴散模型的優勢。


遵循 [73]的做法,本文整合了流行的通用改進措施:SwiGLU、RMSNorm 、RoPE、qk-norm,所有這些最初都是為語言模型開發的。本文還探索了上下文類別條件化(in-context class conditioning):但與原始ViT [13] 在序列后附加一個類別token不同,本文附加了多個此類token(默認為32個;見附錄),這一做法遵循了[35]。表4報告了這些組件的效果。

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

對比

高分辨率像素生成。在表5中,進一步報告了基礎尺寸模型(JiT-B)在ImageNet上512甚至1024分辨率的結果。使用的patch大小與圖像大小成正比,因此不同分辨率下的序列長度保持不變。每個patch的維度可以高達3072或12288,沒有任何一個常見模型會有足夠多的隱藏單元來匹配。

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

表5顯示,本文的模型在不同分辨率下都表現得相當不錯。所有模型的參數數量和計算成本都相似,僅在輸入/輸出的patch嵌入層有所不同。本文的方法沒有受到觀測維度災難的影響。


可擴展性。將Transformer設計與任務解耦的一個核心目標是利用其可擴展的潛力。表6提供了四種模型尺寸在ImageNet 256和512分辨率下的結果(請注意,在512分辨率下,這些模型沒有一個的隱藏單元數比patch維度更多)。模型尺寸和浮點運算次數(FLOPs)顯示在表7和表8中:本文的模型在256分辨率下的成本與其在512分辨率下的對應模型相似。

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

表 7.ImageNet 256×256 的參考結果。對 50K 個樣本的 FID 和 IS 的 50K 個樣本進行了評估。預訓練 "列 列列出了獲得結果所需的外部模型(注意 感知損失使用的是預先訓練好的 VGG 分類器)。參數包括 參數包括生成器和標記解碼器(在推理時使用 推理時使用),但不包括其他預訓練組件。參數 Giga-flops 是針對單個前向傳遞(不計 標記符),與訓練和推理過程中一次迭代的計算成本大致成正比。 在訓練和推理過程中的迭代成本成正比(對于 多尺度方法,我們測量的是最精細的層次)。

返璞歸真!MIT何愷明再次顛覆生成模型:拋棄“去噪”,Diffusion模型直接預測干凈圖像!-AI.x社區

本文的方法受益于模型規模的擴展。有趣的是,隨著模型變大,256和512分辨率之間的FID差距變小了。對于JiT-G模型,512分辨率下的FID甚至更低。對于ImageNet上的超大型模型,FID性能在很大程度上取決于過擬合,而512分辨率下的去噪任務更具挑戰性,使其不易受到過擬合的影響。

結論

本文通過回歸擴散模型中“去噪”的核心理念,展示了一個在原始像素上操作的、簡單而強大的“Diffusion + Transformer”范式是可行的。研究表明,直接預測清晰數據(即 x-prediction),而不是噪聲或一個帶噪的量,是成功的關鍵。這一選擇源于一個基礎的機器學習原則——流形假設——該假設認為自然數據位于一個低維流形上。本文的JiT模型,一個純粹的圖像Transformer,在ImageNet上取得了強大的結果,并且可以優雅地擴展到1024分辨率,而無需依賴分詞器、預訓練或輔助損失。這項工作朝著在原生數據上實現一個自包含的“Diffusion + Transformer”哲學邁出了一步,并有望在其他難以設計分詞器的科學領域找到更廣泛的應用。


本文轉自AI生成未來 ,作者:AI生成未來


原文鏈接:??https://mp.weixin.qq.com/s/o7rQp-6nEP0GWoGhWNDG0Q??

收藏
回復
舉報
回復
相關推薦
朝桐光av在线| 黄色一级片播放| 精品国产av一区二区三区| 午夜国产欧美理论在线播放 | 欧美日韩另类图片| 日本高清不卡aⅴ免费网站| 亚洲欧美在线网| 蜜臀久久精品久久久久| 久久亚洲色图| 美日韩在线视频| a级在线观看视频| 99久热在线精品视频观看| 亚洲蜜臀av乱码久久精品| 久久精品magnetxturnbtih| 一区二区三区www污污污网站| 国产精品av一区二区| 亚洲欧洲日本专区| 麻豆传媒在线看| 日产精品一区| 亚洲第一久久影院| 自拍另类欧美| 你懂的视频在线免费| 国内一区二区在线| 国产成人一区三区| 国产成人亚洲欧洲在线| 国产精品福利在线观看播放| 精品中文视频在线| 国产精九九网站漫画| 久久天天久久| 色婷婷综合在线| 一二三四视频社区在线| 二区三区在线观看| 中文字幕不卡在线观看| 精品国产一二| 欧美一区二区黄片| 国产乱妇无码大片在线观看| 国产精品久久久久久av下载红粉 | 免费观看一级一片| 精品国产亚洲一区二区三区大结局 | 成人国产精品视频| 91色琪琪电影亚洲精品久久| 国产精品成人无码| 久久青草久久| 日本sm极度另类视频| 日本一二三区视频| 伊人天天综合| 欧美国产乱视频| 校园春色 亚洲| 最新国产精品| 久久亚洲精品国产亚洲老地址| 美女被到爽高潮视频| 亚洲动漫在线观看| 日韩精品在线免费观看| 亚洲一级av无码毛片精品| 97视频一区| 亚洲精品一区二区三区精华液| 久久久久无码精品| 日本一区二区三区播放| 日韩欧美www| 在线中文字日产幕| 红杏aⅴ成人免费视频| 亚洲精品一区二区三区四区高清| 亚洲一级Av无码毛片久久精品| 精品国产亚洲日本| 精品国产乱码久久久久久浪潮 | 2024国产精品| 欧美欧美一区二区| 可以免费看污视频的网站在线| 91美女在线观看| 欧美一区二区高清在线观看| 国产高清一级毛片在线不卡| 欧美国产一区在线| 国产又黄又爽免费视频| 日韩精品卡一| 欧美日韩在线影院| 免费看污污网站| 国产激情一区| 欧美精品一区二区久久婷婷| 中国av免费看| 欧美丝袜一区| 欧美精品一二区| 亚洲欧美综合自拍| 久久成人免费网| 成人动漫视频在线观看完整版| 视频二区在线观看| 欧美激情中文字幕一区二区| 一级二级三级欧美| 国产亚av手机在线观看| 日韩欧美精品网址| 羞羞的视频在线| 国产精伦一区二区三区| 亚洲性线免费观看视频成熟| 国产老头老太做爰视频| 日韩午夜一区| 国产免费久久av| 欧洲精品久久一区二区| 欧美激情一区二区在线| 大陆极品少妇内射aaaaaa| 在线免费看h| 日韩欧美亚洲国产另类| 国产精品无码午夜福利| 国产精品久久观看| 91福利视频网| 国产偷拍一区二区| 久久精品夜夜夜夜久久| 777久久精品一区二区三区无码| 日韩精品av| 日韩美女在线视频| 久久中文字幕精品| 国产视频一区免费看| 成人免费高清完整版在线观看| 五月婷婷六月丁香| 亚洲免费av观看| 一区二区xxx| 亚洲系列另类av| 欧美日韩aaaa| 国产精品嫩草影院桃色| 国产亚洲精品超碰| 日本韩国欧美在线观看| 午夜免费欧美电影| www欧美日韩| 无码人妻一区二区三区线| 成人自拍视频在线观看| 久久精品国产精品亚洲精品色| av有声小说一区二区三区| 亚洲精品720p| 久久国产精品波多野结衣| 国模少妇一区二区三区| 日本一区二区三区免费观看| 国模私拍一区二区国模曼安| 欧美成人bangbros| 国产精品白嫩白嫩大学美女| 另类中文字幕网| 日日噜噜噜噜夜夜爽亚洲精品| 高清电影在线观看免费| 日韩一区二区免费在线电影| 精品一区二区在线观看视频| 日韩vs国产vs欧美| 日本一区免费观看| 高清不卡av| 亚洲老头同性xxxxx| 国产手机在线视频| 国产69精品久久久久毛片| 日韩 欧美 自拍| 国产高清亚洲| 久久艳片www.17c.com| 国产又爽又黄免费软件| 国产精品国产三级国产有无不卡| 粉色视频免费看| 93在线视频精品免费观看| 国产美女精品免费电影| 欧美成人xxx| 69堂精品视频| 久久精品黄色片| 国产成人免费网站| www.国产在线视频| 久久精品福利| 琪琪第一精品导航| 成年人在线视频| 欧美日韩aaaaa| 无码黑人精品一区二区| 高清日韩电视剧大全免费| 又大又硬又爽免费视频| 色婷婷精品视频| 国产精品第1页| 日本韩国在线视频爽| 91精品国产综合久久久久久| 免费在线观看h片| 高清不卡一区二区| 久久国产乱子伦免费精品| 精品国产乱码久久久久久蜜坠欲下 | 亚洲欧洲美洲av| 夜夜嗨av一区二区三区免费区| 久久久久精彩视频| 综合久久久久久| 日韩av无码一区二区三区不卡| 亚洲精品四区| 四虎永久国产精品| 欧美经典影片视频网站| 97在线视频国产| 国产女人在线视频| 日韩一级在线观看| 全部毛片永久免费看| 国产午夜精品福利| 日韩高清在线一区二区| 国产情侣一区| 在线免费观看成人网| 最新精品在线| 国产大片精品免费永久看nba| 免费av毛片在线看| 欧美videos中文字幕| 日韩中文字幕高清| 一区二区视频在线看| 成人h动漫精品一区| 精品一区二区三区免费播放| 夜夜添无码一区二区三区| 精品视频日韩| 鬼打鬼之黄金道士1992林正英| 欧美aa视频| 欧美日韩国产成人高清视频| 久青草国产在线| 精品嫩草影院久久| 亚洲综合一区中| 狠狠色狠狠色综合日日五| 亚洲熟女毛茸茸| 91麻豆国产香蕉久久精品| 激情文学亚洲色图| 日韩精品欧美成人高清一区二区| 国产成人一二三区| 成人直播大秀| 欧美三级电影在线播放| 综合中文字幕| 成人网在线观看| 成人看片在线观看| 91精品国产成人| 91精品久久久| 色婷婷综合久久久久| 五月色婷婷综合| 日韩午夜激情视频| 91精品国产乱码久久| 日韩欧美精品在线观看| 亚欧洲精品在线视频| 亚洲欧美电影院| 中文字幕精品亚洲| 国产午夜精品美女毛片视频| 免费成人蒂法网站| 成人av网站在线| 日本wwwwwww| 国产毛片精品视频| 国产美女18xxxx免费视频| 日韩精品成人一区二区在线| 91视频最新入口| 一本色道久久综合| 国产美女网站在线观看| 在线精品在线| 日本一本中文字幕| 亚洲欧美伊人| 大片在线观看网站免费收看| 久久久精品久久久久久96| 亚洲一区二区高清视频| 欧美肉体xxxx裸体137大胆| 欧美日韩一区二区三| 亚洲激情77| 欧美乱偷一区二区三区在线| 精品一区毛片| 日本黑人久久| 操欧美老女人| 亚洲一区综合| 99久久婷婷| 黄黄视频在线观看| 午夜精品剧场| 搞av.com| 免费在线亚洲欧美| 大肉大捧一进一出好爽动态图| 国产麻豆综合| 激情五月亚洲色图| 男人操女人的视频在线观看欧美| 三级a在线观看| 久久精品国产亚洲高清剧情介绍| 日韩av在线中文| 国产一区美女在线| 国内自拍偷拍视频| 99久久久久久| 国产熟女一区二区| 国产精品的网站| 欧美日韩免费做爰视频| 亚洲国产aⅴ成人精品无吗| 精品成人免费视频| 色婷婷综合激情| 一本色道久久综合无码人妻| 91精品国产综合久久久久久久 | 久久视频在线观看免费| 怡红院在线播放| 91精品国产免费久久久久久 | 制服丝袜在线91| 午夜精品久久久久久久91蜜桃| 精品国产一区二区三区久久久蜜月| 六月婷婷综合网| 亚洲美女动态图120秒| 天天综合视频在线观看| 欧美极品在线播放| 天天免费亚洲黑人免费| 国产在线久久久| 久久国产精品色av免费看| 日本午夜精品电影 | 久久久精品在线视频| 日本欧美一区二区三区| 亚洲av无码久久精品色欲| 91在线云播放| 欧洲美女女同性互添| 亚洲一区成人在线| 国产一级片免费视频| 精品动漫一区二区三区在线观看| 九色在线播放| 欧美国产乱视频| 六九午夜精品视频| 国产视频精品网| 久久久久久久久国产一区| 欧美 日韩 激情| 国产sm精品调教视频网站| 精品人妻无码一区二区三区换脸| 一区二区三区免费看视频| 一二三区免费视频| 亚洲国产免费av| 91精品人妻一区二区三区| 成人性生活av| 国产精品69精品一区二区三区| 久久三级中文| 亚洲欧美综合一区| 久久国产精品99国产| 色综合久久久无码中文字幕波多| 国产亚洲欧美色| 日韩欧美亚洲一区二区三区| 欧美一区二区三区白人| www.亚洲资源| 2019国产精品自在线拍国产不卡| 国产精品**亚洲精品| 日韩成人av网站| 中文高清一区| 少妇熟女视频一区二区三区| 亚洲天堂精品在线观看| 中文字幕日本视频| 亚洲欧美激情四射在线日| av电影在线免费| 成人动漫在线观看视频| 中文字幕一区二区三三| 天天干天天综合| 国产日韩在线不卡| 波多野结衣视频网站| 亚洲国产精品一区二区久| 日韩少妇视频| 不卡视频一区二区| 午夜欧美视频| 伊人av在线播放| 一区二区三区欧美日韩| 国产xxxx在线观看| 久久久精品免费| 日韩一级特黄| 在线一区日本视频| 久久66热re国产| 黑鬼狂亚洲人videos| 9191精品国产综合久久久久久| av在线免费观看网| 国产啪精品视频网站| 日韩国产在线| 亚洲精品20p| 综合久久久久久久| 精品国产伦一区二区三区| 欧美国产日韩在线| 精品久久对白| 一本大道熟女人妻中文字幕在线| 97久久超碰国产精品| 国产精品久免费的黄网站| 亚洲男人天堂九九视频| 日韩免费小视频| 亚洲免费不卡| 国产一区二区三区黄视频| 国产又粗又硬又长又爽| 日韩一级欧美一级| 17videosex性欧美| 久久久久久久久一区二区| 日韩在线卡一卡二| 国产探花视频在线| 欧美一区二区性放荡片| 俺来也官网欧美久久精品| 精品免费国产| 欧美aa在线视频| 国产高潮国产高潮久久久91 | 亚洲欧美丝袜中文综合| 热re99久久精品国产66热| 日韩理论片av| 一级全黄裸体片| 欧美午夜宅男影院在线观看| 国产露出视频在线观看| 91久久精品www人人做人人爽| 亚洲每日在线| 精品手机在线视频| 欧美v亚洲v综合ⅴ国产v| 国产精品专区免费| 黄色高清视频网站| 99久久婷婷国产| 综合久久中文字幕| 欧美高清在线视频观看不卡| 国产精品嫩模av在线| 亚洲区 欧美区| 色吊一区二区三区| av电影免费在线观看| 久久精品日韩| 国内精品久久久久影院色| 91美女免费看| 久久亚洲精品成人| 国产伦精品一区二区三区千人斩| gai在线观看免费高清| 亚欧色一区w666天堂| 秋霞午夜在线观看| 久久亚洲午夜电影| 国产成人在线视频网址| 一级片免费在线播放| 欧美激情免费观看| 成人久久一区|