精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

rebuttal真的有用!這篇ICLR論文,所有審稿人都加了2分,直接躍升排名第9

人工智能 新聞
這篇論文提出的 Sana 是一種高效且經濟地訓練和合成高質量圖像的工作流程,并且支持 1024×1024 到 4096×4096 的分辨率。

最近,正處于評議階段的 ICLR 2025 論文真是看點連連,比如前些天爆出的 ICLR 低分論文作者硬剛審稿人的事件以及今天我們要介紹的這個通過 rebuttal(反駁)硬是將自己的平均分拉高 2 分,直接晉升第 9 名的論文。

圖片

圖片

ICLR 2025 論文評分分布圖,圖源:https://papercopilot.com/statistics/iclr-statistics/iclr-2025-statistics/

順帶一提,不知道是不是因為 ICLR 2025 審稿過程狀況連連,官方此前還決定將論文討論過程延長 6 天。

圖片

下面我們就來看看這篇「咸魚翻身」的論文究竟研究了什么以及它的評審和反駁之路。

圖片

  • 論文標題:SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformers
  • 論文地址:https://arxiv.org/abs/2410.10629
  • OpenReview:https://openreview.net/forum?id=N8Oj1XhtYZ
  • 項目地址:https://nvlabs.github.io/Sana/
  • 代碼地址:https://github.com/NVlabs/Sana

論文主要內容

這篇論文提出的 Sana 是一種高效且經濟地訓練和合成高質量圖像的工作流程,并且支持 1024×1024 到 4096×4096 的分辨率。下圖展示了 Sana 生成的一些圖像樣本及其推理延遲情況。

圖片

作者表示:「據我們所知,除了 PixArt-Σ 之外,還沒有直接探索 4K 分辨率圖像生成的已發表研究成果。然而,PixArt-Σ 僅能生成接近 4K 分辨率(3840×2160)的圖像,并且生成這種高分辨率圖像的速度相對較慢。」

那么,這個來自英偉達、MIT 和清華大學的研究團隊是如何做到這一點的呢?

具體來說,他們提出了多項核心設計。

深度壓縮自動編碼器

該團隊提出了一種新的自動編碼器(AE),可將縮放因子(scaling factor)大幅提升至 32!

過去,主流的 AE 僅能將圖像的長度和寬度壓縮 8 倍(AE-F8)。與 AE-F8 相比,新提出的 AE-F32 輸出的潛在 token 量可減少 16 倍。這對高效訓練和生成超高分辨率圖像(例如 4K 分辨率)至關重要。

下表 1 展示了不同 AE 的重建能力。

圖片

圖 3 則展示了對新提出的深度壓縮自動編碼器進行消融實驗的結果。該結果證明了新 AE 各項設計的重要性。

圖片

高效的線性 DiT

圖片

該團隊還提出使用一種新型的線性 DiT 來替代原生的二次注意力模塊,如上右圖所示。

原始 DiT 的自注意力的計算復雜度為 O (N2)—— 在處理高分辨率圖像時,這個復雜度會二次級增長。該團隊將原生注意力替換成線性注意力后,計算復雜度便從 O (N2) 降至 O (N)。

圖片

該團隊表示:「我們認為,通過適當的設計,線性注意力可以實現與原生注意力相當的結果,并且還能更高效地生成高分辨率圖像(例如,在 4K 時加速 1.7 倍)。

同時,他們還提出了 Mix-FFN,其作用是將 3×3 深度卷積集成到 MLP 中以聚合 token 的局部信息。

Mix-FFN 的直接好處是不再需要位置編碼(NoPE)。該團隊表示:「我們首次刪除了 DiT 中的位置嵌入,并且沒有發現質量損失。」

使用僅解碼器小 LLM 來作為文本編碼器

為了提升對用戶提示詞的理解和推理能力,該團隊使用了最新版的 Gemma 作為文本編碼器。

盡管這些年來文生圖模型進步很大,但大多數現有模型仍然依賴 CLIP 或 T5 進行文本編碼,而這些模型通常缺乏強大的文本理解和指令遵從能力。僅解碼器 LLM(例如 Gemma)表現出的文本理解和推理能力很強大,還能有效遵從人類指令。

下表比較了不同文本編碼器的效果。

圖片

通過直接采用 LLM 作為文本解碼器,訓練不穩定的問題得到了解決。

另外,他們還設計了復雜人類指令(CHI),以充分理解 LLM 那強大的指令遵從、上下文學習和推理能力,進而更好地對齊圖像與文本。從下圖可以看到,有無 CHI 的輸出結果差異非常明顯。

圖片

高效的訓練和推理策略

為了提升文本和圖像的一致性,該團隊提出了一套自動標注和訓練策略。

首先,對于每張圖像,使用多個 VLM 來重新生成描述。雖然這些 VLM 的能力各不相同,但它們的互補優勢可提高描述的多樣性。

他們還提出了一種基于 Clip Score 的訓練策略,即對于一張圖像的多個描述,根據概率動態選擇具有高 Clip Score 的描述。實驗表明,這種方法可以提高訓練收斂性和文本圖像對齊程度。下表比較了訓練期間不同的圖像 - 文本對采樣策略的效果。

圖片

此外,他們也提出了一種 Flow-DPM-Solver,相比于廣泛使用的 Flow-Euler-Solver,這種新的求解器可將推理采樣步驟從 28-50 步減少到 14-20 步,同時還能實現更好的結果。見下圖。

圖片

實驗結果

總體實驗下來,該團隊的新模型 Sana-0.6B 表現可謂極佳。在生成 4K 圖像時,速度比當前最佳(SOTA)的 FLUX 方法快 100 多倍(見下圖 2)。在生成 1K 分辨率圖像時,也快 40 倍(見下圖 4)。同時,Sana-0.6B 的效果在許多基準上都能與 FLUX 比肩!

圖片

圖片

不僅如此,他們還訓練了一個參數量更大的 Sana-1.6B 模型。下表更詳細地展示了這兩個模型的性能表現,可以看到,對于 512 × 512 分辨率,Sana-0.6 的吞吐量比大小相近的 PixArt-Σ 快 5 倍,并且在 FID、Clip Score、GenEval 和 DPG-Bench 方面表現明顯優于后者。對于 1024 × 1024 分辨率,Sana 比大多數模型強得多。這些結果說明 Sana 確實實現了低延遲、高性能的圖像生成。

圖片

此外,他們還為 Sana 打造量化版本,并將其部署到了邊緣設備上。

在單臺消費級 4090 GPU 上,該模型生成 1024×1024 分辨率圖像只需 0.37 秒,是一個非常強大的實時圖像生成模型。

圖片

下面展示了 Sana-1.6B 模型的一些輸出結果以及部署量化版模型的筆記本電腦。

圖片

rebuttal 真的有用?

很多時候,在審稿人的第一印象已經確定的情況下,rebuttal 能夠改變的不多。

正如知名長文《審稿 CVPR 而致的傷痕文學(續):關于 Rebuttal 的形而上學》所說,從審稿人的角度來看,收到 rebuttal 時,可能早就已經忘了當時為什么會給這個審稿意見,對這篇文章的唯一記憶就是「我要拒掉它」。

圖片

引自 https://zhuanlan.zhihu.com/p/679556511 作者 @Minogame

那么,SANA 到底拿出了一份怎樣的 rebuttal,四個審稿人看過后不再「已讀不回」,反倒不約而同地加了 2 分呢?

第一位審稿人和第三位審稿人的意見比較相似,他們認為 SANA 的原創性有些不足。具體來說,第一位審稿人在缺點部分寫道:

  • SANA 的三個主要組件在文獻中已有探討:深度自編碼器在 [1] 中有涉及,線性 DiT 在 [2] 中已有研究,[3, 4] 中已經使用了 LLM 作為文本編碼器。將這些組件結合起來并不構成一個真正具有創新性的想法。
  • 作者沒有充分解釋他們的 CHI 流程是否與 [5] 中的相同。如果相似,那么這甚至會進一步削弱該工作的創新性。

圖片

第三位審稿人則希望作者們補一些消融實驗,逐個組件分析,明確 SANA 相較于 PixArt-Σ 和 Playground v3 等類似的模型有什么創新之處。

圖片

SANA 的研究團隊首先詳細地說明了站巨人的肩膀上創新和做學術裁縫的區別。

比如,LinFusion 中的線性注意力是蒸餾策略的一部分,而作者們把 SANA 作為一個基礎生成模型,從頭開始設計、訓練。為了讓線性注意力在所有層中代替原來的自注意力,他們做出了 Mix-FFN 解碼器。

這樣,相比其他方法將所有 token 映射到一個低秩的 NxN 狀態中,SANA 更接近于直接的 O (N) 注意力計算,這是以前的研究未能有效解決的問題。

對比同樣提交給 ICLR 2025 的「DC-AE」,SANA 解決了未涉及的獨特問題,比如簡單地在潛在空間中增大通道(F8C4→F32C32)會使得訓練收斂速度大大減慢,他們設計了線性注意力 + Mix-FFN 塊加速收斂。

而此前 LLM 作為文本編碼器的方法,更多只是簡單地用 LLM 替代了 T5/Clip,并未像 SANA 一樣深入研究了如何激發 LLM 的推理能力。

針對審稿人的問題,作者補充了一系列消融實驗,比較了 LiDiT 和 SANA 的 CHI 效果,并逐個組件地展示了 SANA 在 PixArt-Σ 基礎上的進展。

圖片

這兩位審稿人也是給出了一個提分的大動作:

圖片

圖片

第二位審稿人更在意技術細節,他覺得 SANA 如何搭建的線性注意力模塊還可以說得更清楚。

具體來說,需要明確一下,他們是如何實現線性注意力能全局替代傳統自注意力,同時保持足夠的上下文信息和依賴關系建模的,還要補 4096*4096 分辨率的圖像與其他方法的實驗對比。

圖片

在一通極其詳細的解釋之下,這位(可能不清楚目前沒有 4K 版本 InceptionNet 的)審稿人也把分數也提了 2 分。

圖片

第四位審稿人則給出了 10 分的最高分評價。

圖片

一開始,該審稿人指出了這篇論文的一些缺點,包括表 9 中的 Gemma2-2B-IT 模型需要解釋、需要進一步比較 Gemma2 和 T5-XXL 以及缺乏對 UltraPixel 等引用等等。

然后,作者對該審稿人的四個問題逐一進行了詳細解答,并為論文內容做了進一步的補充。此后,又是關于 ClipScore 的幾個來回討論。

圖片

最后,審稿人被作者說服,表示:「我再也看不到這篇論文中任何明顯的缺點了。因此,我提高了我的評分。這項工作確實應該作為會議的亮點!很出色的工作!」

圖片

從這些審稿人與作者的互動可以看到,建設性的討論和修正確實可以幫助改善審稿人對一篇論文的看法。

在多次交流中,審稿人對論文中不清晰或薄弱的部分提出了具體改進建議,而作者也根據反饋進行了細致的修改。這種積極的互動不僅使論文的質量得到了提升,也促進了審稿人與作者之間的理解與信任。最終,審稿人對論文的評審意見變得更加正面,并愿意為作者提供更多的指導。

對此,你有什么看法?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-04-21 19:18:38

論文

2022-11-25 17:33:15

論文技巧

2023-10-07 13:16:20

GPT-4NatureICLR

2025-11-21 09:04:18

2024-12-02 09:00:00

2024-10-17 13:09:14

2025-08-27 15:39:58

LLM模型AI

2025-11-14 09:11:48

2009-04-20 08:42:01

美國IT企業惠普

2025-02-27 12:30:00

2015-07-24 09:48:19

IT內容管理硬件奪冠深信服

2021-03-22 10:14:10

技術研發論文

2021-05-28 10:10:22

AI 數據人工智能

2021-07-19 15:02:48

機器人人工智能算法

2024-11-29 14:00:07

2024-12-09 10:50:00

2020-12-07 09:22:50

量子計算機芯片超算

2019-05-29 14:48:43

2024-08-13 14:40:00

AI科學家

2018-03-20 09:51:32

程序員開發工具
點贊
收藏

51CTO技術棧公眾號

成人久久视频在线观看| 99a精品视频在线观看| 国产欧美va欧美不卡在线| 国产精品扒开腿做| 日本二区三区视频| 亚洲成人影音| 在线视频欧美精品| 777久久精品一区二区三区无码| 三级网站免费观看| 久久精品国产在热久久| 久久久影视精品| 波多野结衣家庭教师在线观看 | 少妇熟女视频一区二区三区| 妞干网免费在线视频| 国产精品久久久久久户外露出| 福利精品视频| 久久国产精品久久国产精品| 波多野结衣与黑人| 欧美香蕉爽爽人人爽| 精品一区二区三区视频在线观看| 午夜精品一区二区三区在线 | 136国产福利精品导航| 精品国产免费一区二区三区 | 亚洲精品av在线| 成人综合久久网| 伊人久久视频| 亚洲高清免费视频| 最近中文字幕免费mv| 黄色片免费在线| 成人一区二区三区视频在线观看 | 霍思燕三级露全乳照| 老司机免费在线视频| 久久综合狠狠综合久久综合88| 亚洲一区免费网站| 一级黄色片在线播放| 亚洲免费影院| 久久久综合免费视频| 91在线播放观看| 日韩中文在线电影| 亚洲欧洲激情在线| 又黄又爽的网站| 中文在线免费一区三区| 91精品久久久久久久久99蜜臂| 青青青在线视频免费观看| 2022成人影院| 欧美特黄级在线| 国产xxxxx在线观看| 欧美调教sm| 精品久久久久久久久久久| 妺妺窝人体色www看人体| caopeng在线| 亚洲欧美区自拍先锋| 一级黄色录像免费看| 黄色av网站在线播放| 亚洲天堂网中文字| 中文精品一区二区三区| 日本在线观看网站| 国产精品超碰97尤物18| 国产精品亚洲天堂| 动漫一区在线| 亚洲一区二区在线播放相泽| 岛国大片在线播放| 妞干网免费在线视频| 日韩欧美aaa| 日韩有码免费视频| 国产极品久久久久久久久波多结野| 91久久线看在观草草青青| 男女av免费观看| 午夜日韩成人影院| 欧美三级日韩三级| 热久久久久久久久| 亚洲精品一区二区三区中文字幕 | 极品白浆推特女神在线观看| 久久久电影一区二区三区| 视频一区不卡| 精品176二区| 亚洲图片欧美色图| 国产免费黄色av| 日韩色淫视频| 日韩欧美国产1| 国产ts丝袜人妖系列视频| 国产一区二区区别| 久久国产一区二区三区| 精品99久久久久成人网站免费| 亚洲精品日本| 国产精品揄拍500视频| av中文字幕在线免费观看| 成人动漫av在线| 欧洲久久久久久| www.在线视频| 欧美色道久久88综合亚洲精品| 久久九九国产视频| 日韩精品视频一区二区三区| 亚洲精品一区久久久久久| 91香蕉视频污在线观看| 亚洲高清资源| 国产精品视频一区二区三区四| 亚洲第一视频在线| 国产亚洲一区二区三区四区| 300部国产真实乱| 欧美成人性网| 欧美精品一区视频| 天堂av免费在线| 亚洲裸体俱乐部裸体舞表演av| 国产精品视频免费在线观看| 天天色天天操天天射| 国产精品久久久久久久久久免费看| 久久在线中文字幕| 伊人久久大香线蕉综合影院首页| 亚洲精品国产综合区久久久久久久| 久久精品日韩无码| 久久成人亚洲| 91情侣在线视频| 午夜激情视频在线| 色综合久久综合网欧美综合网 | 99久久99久久精品国产片果冻| 一区二区在线高清视频| 暖暖成人免费视频| 亚洲第一区第一页| 乱h高h女3p含苞待放| 日韩精品1区2区3区| 国内精品久久国产| av片在线观看免费| 在线播放91灌醉迷j高跟美女 | 成人久久久精品乱码一区二区三区| 欧美日韩国产成人在线| 中文字幕久久久久| 久久色视频免费观看| 国产曰肥老太婆无遮挡| 国产在线一区不卡| 日韩一区二区欧美| 中文字幕欧美人妻精品| 久久丝袜美腿综合| 黑人糟蹋人妻hd中文字幕| 哺乳一区二区三区中文视频 | av免费在线观| 欧美情侣在线播放| 欧美极品jizzhd欧美18| 日韩精品免费视频人成| 美乳视频一区二区| 亚洲天堂av在线| 亚洲精品一区av在线播放| 日韩av在线天堂| 成人久久18免费网站麻豆| a级免费在线观看| 成人性生交大片免费看96| 欧美精品video| 亚洲老妇色熟女老太| 亚洲精品国产a久久久久久| 在线视频一二区| 伊人久久大香线蕉综合四虎小说| 成人黄色片在线| av网址在线免费观看| 91精品国产高清一区二区三区| 91视频青青草| 国产成人免费在线| 日韩黄色短视频| 六月丁香久久丫| 青青a在线精品免费观看| 青青草视频在线免费观看| 日韩欧美在线观看| 全黄一级裸体片| 日韩电影免费在线看| 亚洲精品高清视频| 麻豆精品久久| 国内揄拍国内精品| 日韩精品视频在线观看一区二区三区| 欧美性xxxxx极品娇小| jizz中文字幕| 国内精品伊人久久久久影院对白| 桥本有菜av在线| youjizzjizz亚洲| 欧洲成人免费aa| 91电影在线播放| 日韩一区二区三区在线视频| 日本在线小视频| 国产亚洲精品aa午夜观看| 一个色综合久久| 亚洲国产第一| 亚洲精品高清视频| 综合激情五月婷婷| 日本精品视频在线| 黄色网页在线免费看| 精品成a人在线观看| 国产精品乱码一区二区视频| 亚洲丝袜精品丝袜在线| 中国av免费看| 精品亚洲国内自在自线福利| 农民人伦一区二区三区| 欧美熟乱15p| 国产高清自拍一区| 另类中文字幕国产精品| 久久99热精品| 国产黄在线看| 欧美成人在线直播| 国产成人麻豆免费观看| 一级日本不卡的影视| 国产又黄又粗视频| av成人免费在线观看| 欧美第一页浮力影院| 亚洲每日更新| 9l视频自拍9l视频自拍| 国产麻豆一区二区三区精品视频| 亚洲资源在线看| jizzyou欧美16| 97在线看免费观看视频在线观看| 国产原创在线观看| 亚洲人成自拍网站| 国产成人久久精品77777综合| 在线国产电影不卡| 国产情侣在线视频| 亚洲欧美乱综合| 美女网站视频色| 久久无码av三级| 亚洲自拍偷拍精品| 国产在线不卡视频| 91制片厂毛片| 日韩中文字幕一区二区三区| 成人毛片一区二区| 欧美视频一区| 黄色一级视频播放| 色综合天天爱| 日本在线观看一区| 欧美日韩一本| 国产一区二区三区黄| 日韩成人视屏| 亚洲aa中文字幕| 亚洲国产一区二区久久| 国产精品国产三级国产专播精品人 | 国产毛片毛片毛片毛片毛片| 欧美视频一区在线| 日韩三级一区二区| 日韩欧美亚洲成人| 国产 欧美 日韩 在线| 亚洲线精品一区二区三区| 91嫩草丨国产丨精品| 最新不卡av在线| 天天做夜夜爱爱爱| 中文字幕一区视频| fc2ppv在线播放| 亚洲欧洲制服丝袜| 午夜精品一区二区三区视频| 亚洲欧美另类在线| 人妻少妇精品一区二区三区| 亚洲欧美另类久久久精品| 九九热最新地址| 一区二区三区成人| 欧美人妻一区二区| 亚洲在线视频网站| 国产福利久久久| 天天色图综合网| 丁香六月婷婷综合| 91国在线观看| 中文字幕 欧美激情| 欧美日韩美少妇| 国产强伦人妻毛片| 日韩你懂的在线观看| 日韩中文字幕综合| 日韩不卡在线观看| 久草在线网址| 最好看的2019年中文视频| 色视频在线免费观看| 欧美成aaa人片在线观看蜜臀| 新版中文在线官网| 97精品视频在线观看| 免费成人美女女| 成人福利网站在线观看11| 精品欧美视频| 精品麻豆av| sdde在线播放一区二区| 在线丝袜欧美日韩制服| 国产精品jizz在线观看美国| 免费看国产曰批40分钟| 日韩av在线免费观看不卡| 日韩欧美国产片| 成人爽a毛片一区二区免费| 法国伦理少妇愉情| 国产精品高清亚洲| 久久亚洲AV无码| 色激情天天射综合网| 99精品国产99久久久久久97| 亚洲激情视频网站| 99re在线视频| 国语自产精品视频在线看| 神马电影网我不卡| 亚洲字幕在线观看| 在线成人动漫av| 中文字幕日韩精品无码内射| 亚洲深夜av| 亚洲天堂一区二区在线观看| 99久久精品一区| 天堂网avav| 日韩欧美黄色动漫| 国产亲伦免费视频播放| 日韩麻豆第一页| 欧美家庭影院| 国产精品美女av| 精品丝袜久久| 亚洲成人动漫在线| 日韩主播视频在线| 国产熟女高潮一区二区三区 | 国产精品国产三级国产专区52| 欧美日韩视频在线第一区 | 国产精品久久国产| 日本成人超碰在线观看| 中文字幕在线永久| 国产精品久久久久久久久动漫 | 国产农村妇女毛片精品久久莱园子| 亚洲va在线va天堂va偷拍| 99久久综合精品| 黄页网站免费观看| 欧美人体做爰大胆视频| 免费在线稳定资源站| 欧美激情小视频| 免费观看性欧美大片无片| 亚洲激情啪啪| 久色成人在线| 91av在线免费| 亚洲高清三级视频| www久久久久久| 日韩视频一区在线| 欧美色999| 久久影视中文粉嫩av| 亚洲激情成人| 激情综合激情五月| 一区二区三区在线影院| 一级全黄裸体免费视频| 国产一区二区三区丝袜| 亚洲天堂av影院| 久久99精品久久久久久久青青日本| 中文字幕乱码亚洲无线精品一区| jizz大全欧美jizzcom| 中文字幕成人在线观看| 日本丰满少妇做爰爽爽| 国产午夜精品理论片a级探花| 岛国av免费在线观看| 国产伦精品一区二区三区免费视频 | 日韩在线视频线视频免费网站| 色综合一本到久久亚洲91| 欧美极品一区| 日日夜夜精品视频免费| www.自拍偷拍| 一本一道综合狠狠老| 欧美老女人性开放| 热99在线视频| 精品国产一级毛片| 亚洲少妇久久久| 中文字幕在线不卡一区二区三区| 91精品国产综合久| 色哟哟亚洲精品一区二区| 欧美国产视频| 欧美性受黑人性爽| 国产盗摄精品一区二区三区在线| 欧美色图一区二区| 欧美不卡激情三级在线观看| 1234区中文字幕在线观看| 精品乱色一区二区中文字幕| 久久午夜av| 四季av中文字幕| 91精品国产综合久久久久| 最新黄网在线观看| 成人情视频高清免费观看电影| 亚洲人www| 免费污网站在线观看| 欧美性大战久久久久久久| 午夜视频在线观看免费视频| 亚洲综合成人婷婷小说| 亚洲国产高清视频| 久久美女免费视频| 欧美日韩高清一区二区| 羞羞视频在线免费国产| 国产精品香蕉视屏| 日韩精品午夜视频| www日韩在线| 亚洲精品mp4| 成人免费毛片嘿嘿连载视频…| 黄频视频在线观看| 成人黄色一级视频| 神马久久久久久久| 久久综合伊人77777尤物| 99精品国产高清一区二区麻豆| 人妻精品无码一区二区三区 | 少妇高潮av久久久久久| 中文字幕成人精品久久不卡| 日本精品视频| aa免费在线观看| 亚洲三级在线看| 三级黄视频在线观看| 国产日韩精品视频| 亚洲人成高清| 久久久久久视频| 亚洲人成网站777色婷婷| 精品国产一级| 久久久久久久激情| 亚洲精品视频自拍| 成人动漫在线播放| 国产精华一区| 激情欧美日韩一区二区| 欧美不卡视频在线观看| 久久在线观看视频|