精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICCV2025 | 多視圖生成新范式-利用自回歸模型探索多視圖生成

人工智能 新聞
本文介紹并開發了一種自回歸生成多視圖圖像的方法 MVAR 。其目的是確保在生成當前視圖的過程中,模型能夠從所有先前的視圖中提取有效的引導信息,從而增強多視圖的一致性。

本文第一作者包括北京大學博士生胡珈魁與清華大學碩士生楊羽霄;通訊作者為北京大學助理教授盧閆曄與(前)百度視覺技術部劉家倫。

本文介紹并開發了一種自回歸生成多視圖圖像的方法 MVAR 。其目的是確保在生成當前視圖的過程中,模型能夠從所有先前的視圖中提取有效的引導信息,從而增強多視圖的一致性。

MVAR 拉近了純自回歸方法與最先進的基于擴散的多視圖圖像生成方法的生成圖像質量,并成為能夠處理同時多模態條件的多視圖圖像生成模型。

圖片

  • 論文地址:https://arxiv.org/pdf/2506.18527
  • 代碼地址:https://github.com/MILab-PKU/MVAR/

推理代碼、權重、渲染的 GSO 及其配套的 Prompt 已全部開源。

背景與動機

根據人工指令生成多視圖圖像對于 3D 內容創作至關重要。主要挑戰在于如何在多視圖之間保持一致性,以及如何在不同條件下有效地合成形狀和紋理。此前的工作主要使用 Diffusion 模型中自帶的多視角一致性先驗,促進多視角一致圖像生成。但是 Diffusion 模型存在一些先天劣勢:

  • 絕大多數 Diffusion 模型同時多個視角;
  • 單一 Diffusion 模型難以接受多模態控制條件;

圖片

  如上圖左所示,當使用 Diffusion 模型從相隔較遠的視角合成圖像時,參考圖像和目標圖像之間的重疊度會顯著降低,從而削弱了參考引導的有效性。

在極端情況下,例如從前視角生成后視角圖像,由于重疊紋理極少,視覺參考信息幾乎可以忽略不計。這種有限的參考信息可能會導致模型生成的多視角圖像不夠一致。

為了解決這一局限性,我們提出采用自回歸 (AutoRegressive, AR) 生成方法進行多視圖圖像生成。

如上圖右所示,在基于 AR 的生成中,模型利用前 n-1 個視圖的信息作為生成第 n 個視圖的條件,從而允許模型利用先前生成的視圖的信息。在從前視圖參考生成后視圖的場景中,AR 生成模型會從先前的視圖中提取足夠且相關的參考。

值得注意的是,AR 生成過程與人類觀察 3D 物體的方式高度一致。人類也是按照一個特定且連續的路徑觀察物體的多個視角,而非如 Diffusion 一樣同時觀察多個視角。

受此概念的啟發,我們提出了多視圖自回歸 (MVAR) 模型。

MVAR

MVAR 的主要目的是探究 AR  形式(此處的 AR 是狹義上的 AR 模型,僅僅指代 next token prediction 這一范式)的生成方法在多視角生成問題中的優勢、劣勢(及其對應的解決方案)。

我們將首先簡單介紹什么是基于自回歸的圖像生成。

前置知識:什么是 AR 生成?

給定一個長度為 T 的序列 x,AR 模型試圖根據以下公式推導其分布:

圖片

其中, x_i 表示序列 x 中的第 i 個數據點,圖片表示索引小于 t 的向量。訓練 AR 模型 p_θ 意味著該模型將在大規模圖像序列上學習如何優化圖片

在一般的圖像生成任務中,x 來源于視角編碼器 ε(?) ,如:VQGAN、量化器 Q 、及其碼本 Z 。從圖像 I 到序列 x 的公式如下:

圖片

其中, lookup (Z,v) 表示從碼本 Z 中檢索第 v 個向量。 x 的上標 (i-1)*w+j 表示 x 被展平,即原本位于二維坐標 (i,j) 的數據被變換到其一維對應位置 (i-1)*w+j 。

多視角圖像生成中的AR

多視角情況下,由于存在多張圖象,其相對于一般的 2D 圖像多出了一個維度,這一維度可以被簡單的理解成「時間」維度。

與視頻不同,視頻的不同幀之間有固定的時序關系,多視角圖像之間并沒有固定的時序關系,我們可以從很多條不同的時序軌跡去合成多視角圖像。這一問題我們將在后續討論。

于是,我們可將上式進行簡單的擴展,使得 AR 能夠適配多視角圖像生成:

圖片

其中, n 代表第 n 個視角。

AR模型生成多視角圖像有何問題

多視圖生成的多條件控制、有限的訓練數據,為 AR 在多視角圖像任務的應用帶來了許多阻礙。本博文簡要介紹了其中兩點:

  • 多模態條件控制。生成多視圖圖像的任務需要模型能夠熟練地從各種條件中提取特征,并生成與給定條件保持一致的多視圖圖像。AR 模型中條件注入的方法尚未得到廣泛研究,如:相機姿態、參考圖像和幾何形狀。
  • 有限的高質量數據。經驗表明,AR 模型需要大量高質量數據(例如數十億條文本)才能實現飽和的模型訓練。然而,3D 物體與高質量多視圖圖像的樣本匱乏,嚴重阻礙了 MVAR 模型訓練的充分性。

MVAR給出的解決方案

我們分別針對這些問題給出了特定的解決方案。

多模態條件嵌入網絡架構:文本、相機位姿、圖像、幾何。

圖片

我們通過一些架構設計解決多模態條件嵌入,并試圖避免簡單的 in-context 條件注入形式可能帶來的多模態塌縮問題。MVAR 的具體的網絡架構如上圖所示,其基礎模型架構參考了 LLaMa;對于不同的模態,我們使用的條件注入方法整理如下:

  • 文本:分離式自注意力機制 (SSA);
  • 相機位姿:位置編碼(將相機位姿進行普朗克編碼后);
  • 參考圖像:圖像變換與逐 token 加法;
  • 幾何:in-context.

以上條件注入結構設計遵從以下核心原則:

  1. 與輸出能大致逐像素匹配的(如:普朗克編碼后的相機位姿、參考圖像、深度圖),使用逐像素加法進行條件注入;
  2. 完全不能逐像素匹配的(如:文本、幾何),使用 in-context 條件注入。

具體來說,對于文本和幾何,我們主要基于 in-context 條件注入形式,并引入了條件與內容分離的自注意力形式,公式如下:

圖片

其中圖片是文本特征,圖片 是圖像特征。 Concat(?) 在 token 維度上連接特征,而 Chunk(?) 是 Concat(?) 的逆運算。SSA 的宗旨是在引入條件的同時,不改變條件在 token 維度的分布。

對于相機位姿和參考圖像,我們主要基于逐像素加法這一條件注入形式。

對于參考圖像,其特征圖片在傳入 MVAR 前,需要與相機位姿 圖片 進行交叉注意力,從而將第 n 個視角的參考圖像特征圖初步變換到第 m 個視角。

值得注意的是,相機位姿與參考圖像的條件在 token 維度存在錯位:

  • 相機位姿用于提示 MVAR ,下一 token 應當生成何種視角下哪一 patch 的圖像內容,所以其相對于生成的 token 需要進行錯位。(類似 RAR 一文中的 target-aware position embedding)
  • 參考圖像用于告知 MVAR ,當前 token 的生成應當與給定的條件特征逐像素的對應,所以其與生成 token 并無錯位。

數據增強

我們主要提出了適配自回歸式生成的 Shuffle View (ShufV) 數據增強策略,他的動機在于通過使用不同 order 的相機路徑作為訓練從而增廣有限的高質量數據。其公式如下:

圖片

其中 S 表示隨機序列。圖片表示第 n 個視圖的圖像現在被用作訓練序列 x 中的第 圖片 個視圖。

由于 self attention 和 FFN 都具有置換等變性。因此,輸入序列順序的變化將導致模型中間特征序列順序的相應變化。為了確保輔助條件(例如相機姿態和參考圖像)能夠有效地引導模型按照預定順序生成圖像,必須重新排列這些條件。這種重新排序將確保條件序列與輸入序列的序列對齊。

我們認為 ShufV 在增廣有限的高質量數據問題的同時,有助于緩解多模態條件控制中的部分問題:

AR 模型難以利用連續視圖和當前視圖之間的重疊條件。

使用 ShufV 進行數據增強時,視圖的順序不是固定的。假設輸入序列 x 中存在兩個視圖 A 和 B。ShufV 使 MVAR 能夠在訓練階段獲得從視圖 A 到視圖 B 以及 視圖 B 到視圖 A 的轉換。這允許模型利用當前視圖和其他視圖之間的重疊條件并有效地使用它們。

漸進式學習

最后,我們使用漸進式學習,將模型從僅接受文本條件的 text to multi-view image (t2mv) 模型泛化到 any to multi-view image (x2mv) 模型。

在 x2mv 模型的訓練過程中,文本條件會被隨機丟棄,而其他條件則會隨機組合。當文本提示被丟棄時,它會被替換為與目標圖像無關的語句。例如,可以使用諸如 「Generate multi-view images of the following <img>」 之類的 prompt 。在這種情況下,「<img>」 表示將在文本之后組合參考圖像。如果后續元素是幾何形狀,則將 「<img>」 替換為 「<shape>」。這種漸進式學習使模型能夠受到訓練期間引入的新條件的影響,同時保持對文本提示的一定程度的遵循。

實驗結果

MVAR 拉近了基于 AR 的多視角生成模型與現有的 Diffusion 模型的差距,并展示出更強的指令遵從與多視角一致性。

圖片

圖生多視角圖像

與一些先進的基于 Diffusion 的方法的數值指標比較如下:

圖片

其中,紅色表示最優、藍色表示次優。

MVAR 的表現上有著最高的PSNR、次優的SSIM,但在LPIPS這一感知指標上仍有些遜色。更高的PSNR意味著生成的視角與對應的GT能更好的進行顏色、形狀、物體位置上的對齊;略低的 LPIPS 意味著 MVAR 在實際圖像質量上可能相對于Diffusion略遜一籌。

我認為 MVAR 生成的圖像感知質量較差的原因是因為 MVAR 使用的基礎模型 LLamaGen 相比 Diffusion-based 方法使用的基礎模型 SD 系列要差一些。不過隨著現有基于 AR 的圖像生成基礎模型的發展,我相信基于 AR 的多視角生成的感知質量將會很快追上并超過已有 Diffusion-based 方法。

圖片

文生多視角圖像

圖片

文+幾何生多視角圖像(紋理生成)

更多結果歡迎大家在 arxiv 查看,或在 github 上下載代碼與權重自行生成。

未來工作

  • 更優的標記器。本文未使用 3D VAE 的原因是:其編碼過程中視圖之間會進行信息交換,這與我們研究的核心動機相悖。我們將在未來專注于通過使用連續的因果 3D VAE 對多視圖圖像進行分詞來提升性能。
  • 統一生成和理解。本研究使用增強現實 (AR) 模型來完成多視圖圖像生成任務。在未來的工作中,我們希望利用自回歸模型的通用學習能力來統一多視圖生成和理解任務,尤其是在難以獲得高精度 3D 數據的場景理解生成任務上。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-02 09:21:30

2025-06-13 14:13:26

3D場景生成模型

2023-09-27 10:13:09

3D模型

2025-08-27 09:08:00

AI視覺模型

2025-08-29 08:54:47

2025-06-13 08:45:00

數據模型可視化

2025-01-07 08:40:00

視頻生成AI

2025-11-04 08:43:00

智能體數據推理

2009-08-28 17:51:40

iPhone多視圖開發

2025-07-18 11:37:52

2024-04-17 13:22:55

人工智能

2025-04-21 08:20:00

視覺模型訓練

2025-08-18 17:27:35

AI模型開源

2025-07-01 13:52:19

2025-05-20 09:08:59

2025-11-11 08:45:00

2023-12-04 09:33:00

自動駕駛視覺

2023-06-09 07:29:03

模型文本document

2025-09-16 10:28:57

2025-08-22 15:06:52

點贊
收藏

51CTO技術棧公眾號

天堂蜜桃一区二区三区| 久久97久久97精品免视看秋霞| 中文在线一区二区| 国产主播欧美精品| 国产一二三四在线| 神马影视一区二区| 91精品国产综合久久香蕉麻豆| 精品免费久久久久久久| 日韩a在线观看| 精品夜夜嗨av一区二区三区| 久久久久久国产精品| 天天插天天射天天干| 日韩毛片免费看| 午夜av电影一区| 一本一本a久久| 天天综合天天色| 久久综合综合久久综合| 午夜精品久久久久久久99黑人| 99久久免费看精品国产一区| 四虎国产精品永久在线国在线| 欧美日韩美女视频| 日韩中文在线字幕| 国产福利免费在线观看| 成人少妇影院yyyy| 成人福利视频网| 丰满人妻老熟妇伦人精品| 色婷婷亚洲mv天堂mv在影片| 亚洲国内精品在线| 黄色片免费网址| 日韩av超清在线观看| 午夜精品123| 99re99热| 日本不卡视频| 国产欧美日韩在线看| 国模精品一区二区三区| www.激情五月.com| 国内精品视频666| 国产精品你懂得| 亚洲第一网站在线观看| 在线国产欧美| 欧美日韩国产第一页| 精品伦精品一区二区三区视频密桃| 久久男人av| 精品久久人人做人人爽| 992tv人人草| 97精品国产综合久久久动漫日韩| 欧美日韩国产精品一区| 国产一线二线三线女| 国产黄色在线网站| 日韩一区中文字幕| 在线无限看免费粉色视频| h视频网站在线观看| 久久免费午夜影院| 欧美日韩亚洲一区二区三区在线观看| 天天综合网天天综合| 成人午夜免费av| 国产精品国产一区二区 | 在线亚洲精品| 欧美极品欧美精品欧美视频| 成年人二级毛片| 欧美激情理论| 久久久av网站| 蜜臀久久精品久久久用户群体| 888久久久| 欧美成人精品在线播放| 青娱乐国产盛宴| 狠狠入ady亚洲精品经典电影| 欧美俄罗斯乱妇| 精品无码黑人又粗又大又长| 亚洲欧洲日本mm| 欧美最近摘花xxxx摘花| 337p粉嫩色噜噜噜大肥臀| 老牛影视一区二区三区| 国产精品丝袜高跟| a在线观看视频| 成人教育av在线| 欧美日韩国产精品一卡| 爱爱爱免费视频在线观看| 国产精品亲子乱子伦xxxx裸| 手机在线视频你懂的| 污污的网站在线看| 福利微拍一区二区| 色婷婷成人在线| 麻豆久久一区| 日韩成人中文电影| 欧美日韩中文字幕视频| 亚洲一区二区日韩| 97高清免费视频| 最新中文字幕在线观看视频| 国内一区二区在线| 精品欧美一区二区三区久久久| 国产在线观看网站| 一区二区三区在线免费观看| 免费一级特黄特色毛片久久看| 欧美黑人疯狂性受xxxxx野外| 欧美日韩国产另类一区| 亚洲黄色小说在线观看| 国产一区二区观看| 欧美成人精品xxx| 69视频免费在线观看| 精品中文字幕一区二区小辣椒| 国产精品区免费视频| 成人精品一区二区三区校园激情| 一区二区三区欧美| 中文字幕第21页| 国产精品一区二区三区美女| 中文字幕国产日韩| 国产午夜在线播放| 精品一区二区综合| 欧美精品久久久| 黄网av在线| 欧美视频日韩视频| 男生裸体视频网站| 牛牛国产精品| 国产精品视频不卡| 完全免费av在线播放| 九九精品在线播放| 波多野结衣毛片| av高清不卡在线| 狠狠干视频网站| 日韩电影精品| 亚洲男子天堂网| 久久久久久天堂| 国产麻豆精品一区二区| 性欧美.com| 超级碰碰久久| 亚洲第一偷拍网| 免费在线观看国产精品| 久草中文综合在线| 亚洲欧美日韩在线综合 | 999视频在线观看| chinese偷拍一区二区三区| 欧美色xxxx| 免费黄色三级网站| 黑丝一区二区| 97久久天天综合色天天综合色hd| 在线观看黄色av| 91久久精品午夜一区二区| 精品国产一区在线| 亚洲经典自拍| 韩国精品一区二区三区六区色诱| 日本在线观看高清完整版| 7777女厕盗摄久久久| 黄色av片三级三级三级免费看| 日韩福利电影在线| 日韩欧美一区二区三区久久婷婷| 中文字幕在线高清| 日韩精品免费在线观看| 亚洲 欧美 视频| 97精品超碰一区二区三区| 国产毛片视频网站| 欧美变态挠脚心| 97婷婷涩涩精品一区| 人人妻人人玩人人澡人人爽| 亚洲成va人在线观看| 超碰caoprom| av不卡在线| 欧美极品视频一区二区三区| 欧美大片免费| 最近2019好看的中文字幕免费| 中文文字幕一区二区三三| 中文字幕不卡一区| 红桃视频 国产| 欧美在线视屏| 九九九九精品九九九九| 英国三级经典在线观看| 亚洲人成啪啪网站| 中文字幕人妻色偷偷久久| 中文字幕一区二区视频| 国内精品国产三级国产aⅴ久| 欧美日韩亚洲国产精品| 国内精品**久久毛片app| sis001欧美| 爽爽爽爽爽爽爽成人免费观看| 国产日韩欧美视频在线观看| 亚洲成人自拍一区| 亚洲AV无码国产成人久久| 麻豆91在线播放免费| 伊人再见免费在线观看高清版| 成人在线视频中文字幕| 欧美一性一乱一交一视频| 99视频在线观看地址| 日韩一卡二卡三卡| 欧美精品二区三区| 国产精品久久久久久亚洲伦| 国产精品91av| 日韩经典中文字幕一区| 天天成人综合网| 欧美人与动xxxxz0oz| 国产精品情侣自拍| 牛牛电影国产一区二区| 亚洲九九九在线观看| 国产女人高潮时对白| 午夜久久久久久久久久一区二区| 西西444www无码大胆| 国产精品综合视频| 青青草av网站| 欧美日韩国产在线一区| 日韩高清三级| 国产成人高清精品免费5388| 国产精品草莓在线免费观看| 2020国产在线视频| 国产一区二区三区高清在线观看| 999av视频| 91福利社在线观看| 日韩三级视频在线| 最近日韩中文字幕| 蜜臀久久99精品久久久久久| 国产成人啪免费观看软件| 三年中国国语在线播放免费| 亚洲黄色三级| 国产免费xxx| 日韩av自拍| 免费久久久一本精品久久区| 中文字幕一区二区三区中文字幕| 国产精品9999| 日本在线高清| 欧美激情在线观看视频| 国产二区三区在线| 中文一区二区视频| 天堂网www中文在线| 欧美α欧美αv大片| 91成年人视频| 欧美图区在线视频| jizz国产在线观看| 欧美日韩国产区| 精品无码黑人又粗又大又长| 自拍av一区二区三区| 免费看的黄色网| 久久综合色播五月| 一级欧美一级日韩片| 国产成人免费高清| 一区二区三区人妻| 久久99精品久久久久久动态图| 玩弄japan白嫩少妇hd| 亚洲一区二区三区高清| 日韩五码在线观看| 影音先锋久久久| 日韩精品在线中文字幕| 亚洲香蕉网站| 国产成人生活片| 欧美私人啪啪vps| 免费看日本黄色| 狠色狠色综合久久| 久久成人福利视频| 亚洲欧洲日本mm| 18禁免费观看网站| 国产精品美女久久久| 凹凸国产熟女精品视频| 性感少妇一区| 久久久久久香蕉| 日韩一区欧美二区| 在线视频日韩一区| 久久精品国产在热久久| 国产精品久久久毛片| 久久精品国产99| 99九九精品视频| 国产精品18久久久久久久网站| 91性高潮久久久久久久| 国产激情一区二区三区四区| 扒开伸进免费视频| 91在线看国产| 国产午夜福利一区| 亚洲天堂2014| 久久香蕉精品视频| 欧美日韩美女在线观看| 中文字幕一区二区三区四区免费看| 色香蕉久久蜜桃| 亚洲永久精品视频| 欧美成人三级电影在线| 日本一二三区在线视频| 中文字幕精品网| 在线观看免费视频你懂的| 国内外成人免费激情在线视频| 欧美私密网站| 国产精品香蕉av| 97久久精品| 欧美日韩一区综合| 久久精品国内一区二区三区水蜜桃 | 国产亚洲视频一区| 国产激情91久久精品导航| 99久久免费看精品国产一区| 欧美国产欧美综合| 久久久久久av无码免费网站| 狠狠综合久久av一区二区小说| 中文字幕人妻互换av久久| 精品久久久网站| lutube成人福利在线观看| 欧美激情亚洲国产| 色天使综合视频| 国产精品12| 欧美电影免费播放| 欧美国产亚洲一区| 激情小说亚洲一区| 中文字幕av网址| 亚洲免费观看高清完整| 激情视频网站在线观看| 日韩欧美区一区二| 都市激情一区| 久久全球大尺度高清视频| 久久99国产精品二区高清软件| 国产精品青青草| 91精品蜜臀一区二区三区在线| 一本大道熟女人妻中文字幕在线| 国产一区二区伦理| 中文字幕在线1| 亚洲成人自拍偷拍| 精品人妻少妇嫩草av无码专区| 亚洲视频精品在线| a级片在线免费观看| 成人天堂噜噜噜| 国模吧精品视频| 丝袜老师办公室里做好紧好爽| 国产精品12区| 欧美风情第一页| 欧美亚洲综合色| 四虎影视在线播放| 午夜欧美大片免费观看| 欧美经典影片视频网站| 亚洲午夜精品久久久中文影院av| 亚洲综合99| 亚洲色图14p| 亚洲成人av免费| 六月丁香综合网| 欧美多人乱p欧美4p久久| 韩国一区二区三区视频| 在线日韩av永久免费观看| 日韩高清不卡一区二区三区| 中文字幕在线看高清电影| 婷婷开心激情综合| 欧美自拍偷拍第一页| 欧美另类暴力丝袜| 一区二区三区在线资源| 国风产精品一区二区| 国产一区二区电影| 国产人妻精品一区二区三区不卡| 欧美色精品在线视频| 国产粉嫩一区二区三区在线观看 | 91蜜桃在线免费视频| 国产成人亚洲欧洲在线| 精品人伦一区二区色婷婷| 中文字幕伦理免费在线视频 | www.97av.com| 欧美精品在线免费| 最新国产一区二区| 可以看毛片的网址| 99在线视频精品| 天天爽夜夜爽夜夜爽精品| 精品亚洲永久免费精品| 午夜久久中文| 日本一区二区三区视频在线观看| 老司机久久99久久精品播放免费| 一区二区三区伦理片| 在线一区二区三区四区五区 | 中日韩免视频上线全都免费| 国模吧无码一区二区三区| 26uuu色噜噜精品一区| 国产视频1区2区| 日韩在线资源网| 日韩最新av| 欧美二区在线视频| 久久精品视频一区二区三区| 伊人久久中文字幕| www国产亚洲精品久久网站| 国产欧美视频在线| 免费在线黄网站| 91丨九色丨国产丨porny| www.久久网| 九色91av视频| 亚洲都市激情| 最新av免费在线观看| 一区二区三区蜜桃网| 日韩av地址| 成人网在线免费看| 亚洲激情婷婷| 亚洲欧美va天堂人熟伦| 日韩一区二区在线看| 日韩脚交footjobhd| 亚洲国产成人不卡| 丁香六月久久综合狠狠色| 日韩三级视频在线播放| 在线亚洲午夜片av大片| 日韩中文字幕无砖| 欧美亚洲日本在线观看| 亚洲欧美日韩国产中文在线| 少妇喷水在线观看| 成人精品在线视频| 久久不射网站| 国产精品久久久精品四季影院| 日韩av在线资源| 高清不卡一区| av天堂永久资源网| 亚洲乱码国产乱码精品精的特点| 天天操天天干天天干| 国产日韩欧美日韩大片| 国产欧美一级| 91视频综合网| 国产一区二区三区丝袜| 国产一区二区在线视频你懂的| 色婷婷狠狠18|