精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在圖像、視頻生成上,語(yǔ)言模型首次擊敗擴(kuò)散模型,tokenizer是關(guān)鍵

人工智能 新聞
為什么語(yǔ)言模型在視覺生成方面落后于擴(kuò)散模型?來(lái)自谷歌、CMU 的研究表明,tokenizer 是關(guān)鍵。

大型語(yǔ)言模型(LLM 或 LM)一開始是用來(lái)生成語(yǔ)言的,但隨著時(shí)間的推移,它們已經(jīng)能夠生成多種模態(tài)的內(nèi)容,并在音頻、語(yǔ)音、代碼生成、醫(yī)療應(yīng)用、機(jī)器人學(xué)等領(lǐng)域開始占據(jù)主導(dǎo)地位。

當(dāng)然,LM 也能生成圖像和視頻。在此過(guò)程中,圖像像素會(huì)被視覺 tokenizer 映射為一系列離散的 token。然后,這些 token 被送入 LM transformer,就像詞匯一樣被用于生成建模。盡管 LM 在視覺生成方面取得了顯著進(jìn)步,但 LM 的表現(xiàn)仍然不如擴(kuò)散模型。例如,在圖像生成的金標(biāo)基準(zhǔn) —ImageNet 數(shù)據(jù)集上進(jìn)行評(píng)估時(shí),最佳語(yǔ)言模型的表現(xiàn)比擴(kuò)散模型差了 48% 之多(以 256?256 分辨率生成圖像時(shí),F(xiàn)ID 為 3.41 對(duì) 1.79)。

為什么語(yǔ)言模型在視覺生成方面落后于擴(kuò)散模型?來(lái)自谷歌、CMU 的研究者認(rèn)為,主要原因是缺乏一個(gè)良好的視覺表示,類似于我們的自然語(yǔ)言系統(tǒng),以有效地建模視覺世界。為了證實(shí)這一假設(shè),他們進(jìn)行了一項(xiàng)研究。

論文鏈接:https://arxiv.org/pdf/2310.05737.pdf

這項(xiàng)研究表明,在相同的訓(xùn)練數(shù)據(jù)、可比模型大小和訓(xùn)練預(yù)算條件下,利用良好的視覺 tokenizer,掩碼語(yǔ)言模型在圖像和視頻基準(zhǔn)的生成保真度和效率方面都超過(guò)了 SOTA 擴(kuò)散模型。這是語(yǔ)言模型在標(biāo)志性的 ImageNet 基準(zhǔn)上擊敗擴(kuò)散模型的首個(gè)證據(jù)。

需要強(qiáng)調(diào)的是,研究者的目的不是斷言語(yǔ)言模型是否優(yōu)于其他模型,而是促進(jìn) LLM 視覺 tokenization 方法的探索。LLM 與其他模型(如擴(kuò)散模型)的根本區(qū)別在于,LLM 使用離散的潛在格式,即從可視化 tokenizer 獲得的 token。這項(xiàng)研究表明,這些離散的視覺 token 的價(jià)值不應(yīng)該被忽視,因?yàn)樗鼈兇嬖谝韵聝?yōu)勢(shì): 

1、與 LLM 的兼容性。token 表示的主要優(yōu)點(diǎn)是它與語(yǔ)言 token 共享相同的形式,從而可以直接利用社區(qū)多年來(lái)為開發(fā) LLM 所做的優(yōu)化,包括更快的訓(xùn)練和推理速度、模型基礎(chǔ)設(shè)施的進(jìn)步、擴(kuò)展模型的方法以及 GPU/TPU 優(yōu)化等創(chuàng)新。通過(guò)相同的 token 空間統(tǒng)一視覺和語(yǔ)言可以為真正的多模態(tài) LLM 奠定基礎(chǔ),后者可以在我們的視覺環(huán)境中理解、生成和推理。

2、壓縮表示。離散 token 可以為視頻壓縮提供一個(gè)新的視角。可視化 token 可以作為一種新的視頻壓縮格式,以減少數(shù)據(jù)在互聯(lián)網(wǎng)傳輸過(guò)程中占用的磁盤存儲(chǔ)和帶寬。與壓縮的 RGB 像素不同,這些 token 可以直接輸入生成模型,繞過(guò)傳統(tǒng)的解壓縮和潛在編碼步驟。這可以加快生成視頻應(yīng)用的處理速度,在邊緣計(jì)算情況下尤其有益。

3、視覺理解優(yōu)勢(shì)。先前的研究表明,離散 token 在自監(jiān)督表示學(xué)習(xí)中作為預(yù)訓(xùn)練目標(biāo)是有價(jià)值的,如 BEiT 和 BEVT 中所討論的那樣。此外,研究發(fā)現(xiàn),使用 token 作為模型輸入提高了魯棒性和泛化性。

在這篇論文中,研究者提出了一個(gè)名為 MAGVIT-v2 的視頻 tokenizer,旨在將視頻(和圖像)映射為緊湊的離散 token。

該模型建立在 VQ-VAE 框架內(nèi)的 SOTA 視頻 tokenizer——MAGVIT 基礎(chǔ)上。基于此,研究者提出了兩種新技術(shù):1)一種新穎的無(wú)查找(lookup-free)量化方法,使得大量詞匯的學(xué)習(xí)成為可能,以提高語(yǔ)言模型的生成質(zhì)量;2)通過(guò)廣泛的實(shí)證分析,他們確定了對(duì) MAGVIT 的修改方案,不僅提高了生成質(zhì)量,而且還允許使用共享詞匯表對(duì)圖像和視頻進(jìn)行 token 化。

實(shí)驗(yàn)結(jié)果表明,新模型在三個(gè)關(guān)鍵領(lǐng)域優(yōu)于先前表現(xiàn)最好的視頻 tokenizer——MAGVIT。首先,新模型顯著提高了 MAGVIT 的生成質(zhì)量,在常見的圖像和視頻基準(zhǔn)上刷新了 SOTA。其次,用戶研究表明,其壓縮質(zhì)量超過(guò)了 MAGVIT 和當(dāng)前的視頻壓縮標(biāo)準(zhǔn) HEVC。此外,它與下一代視頻編解碼器 VVC 相當(dāng)。最后,研究者表明,與 MAGVIT 相比,他們的新 token 在兩個(gè)設(shè)置和三個(gè)數(shù)據(jù)集的視頻理解任務(wù)中表現(xiàn)更強(qiáng)。

方法介紹

本文引入了一種新的視頻 tokenizer,旨在將視覺場(chǎng)景中的時(shí)間 - 空間動(dòng)態(tài)映射為適合語(yǔ)言模型的緊湊離散 token。此外,該方法建立在 MAGVIT 的基礎(chǔ)上。

隨后,該研究重點(diǎn)介紹了兩種新穎的設(shè)計(jì):無(wú)查找量化(Lookup-Free Quantization ,LFQ)和 tokenizer 模型的增強(qiáng)功能。

無(wú)查找量化

最近一段時(shí)間,VQ-VAE 模型取得巨大進(jìn)展,但該方法存在一個(gè)缺點(diǎn),即重建質(zhì)量的改進(jìn)與后續(xù)生成質(zhì)量之間的關(guān)系不明確。很多人誤以為改進(jìn)重建就等于改進(jìn)語(yǔ)言模型的生成,例如,擴(kuò)大詞匯量可以提高重建質(zhì)量。然而,這種改進(jìn)僅適用于詞匯量較小時(shí)的生成,而詞匯量非常大時(shí)會(huì)損害語(yǔ)言模型的性能。

本文將 VQ-VAE codebook 嵌入維度縮減到 0 ,即 Codebook 圖片被替換為一個(gè)整數(shù)集圖片,其中圖片

與 VQ-VAE 模型不同的是,這種新設(shè)計(jì)完全消除了對(duì)嵌入查找的需要,因此將其稱為 LFQ。本文發(fā)現(xiàn) LFQ 可以通過(guò)增加詞匯量,提高語(yǔ)言模型的生成質(zhì)量。如圖 1 中的藍(lán)色曲線所示,隨著詞匯量的增加,重建和生成都不斷改進(jìn) —— 這是當(dāng)前 VQ-VAE 方法中未觀察到的特性。

到目前為止,可用的 LFQ 方法很多,但本文討論了一種簡(jiǎn)單的變體。具體來(lái)說(shuō),LFQ 的潛在空間被分解為單維變量的笛卡爾積,即 圖片。假定給定一個(gè)特征向量圖片,量化表示  q (z) 的每個(gè)維度從以下獲得:

圖片

對(duì)于 LFQ ,q (z) 的 token 索引為:

圖片

除此以外,本文在訓(xùn)練過(guò)程中還增加了熵懲罰:

視覺 tokenizer 模型的改進(jìn)

聯(lián)合圖像 - 視頻 tokenization。為了構(gòu)建聯(lián)合圖像 - 視頻 tokenizer,需要一種新的設(shè)計(jì)。本文發(fā)現(xiàn) 3D CNN 的性能比空間 transformer 更好。

本文探索了兩種可行的設(shè)計(jì)方案,如圖 2b 將 C-ViViT 與 MAGVIT 進(jìn)行結(jié)合;圖 2c 使用時(shí)間因果 3D 卷積來(lái)代替常規(guī) 3D CNN。 

表 5a 對(duì)圖 2 中的設(shè)計(jì)進(jìn)行了經(jīng)驗(yàn)比較,發(fā)現(xiàn)因果 3D CNN 表現(xiàn)最好。

除了使用因果 3D CNN 層之外,本文還進(jìn)行了其他架構(gòu)的修改,以提高 MAGVIT 性能,比如本文將編碼器下采樣器從平均池化更改為跨步卷積;又比如在解碼器中每個(gè)分辨率的殘差塊之前添加一個(gè)自適應(yīng)組歸一化層等。

實(shí)驗(yàn)結(jié)果

實(shí)驗(yàn)從三個(gè)部分驗(yàn)證了本文提出的 tokenizer 的性能:視頻和圖像生成、視頻壓縮,動(dòng)作識(shí)別。圖 3 直觀地比較了 tokenizer 與先前研究的結(jié)果對(duì)比。

視頻生成。表 1 顯示了本文模型在兩個(gè)基準(zhǔn)測(cè)試中都超越了所有現(xiàn)有技術(shù),證明了良好的視覺 tokenizer 在使 LM 生成高質(zhì)量視頻方面發(fā)揮著重要作用。

圖片

圖 4 顯示了模型的定性樣本。

圖片

圖像生成。本文在標(biāo)準(zhǔn) ImageNet 類條件設(shè)置下對(duì) MAGVIT-v2 的圖像生成結(jié)果進(jìn)行了評(píng)估。結(jié)果表明本文模型在采樣質(zhì)量(ID 和 IS)和推理時(shí)間效率(采樣步驟)方面都超過(guò)了表現(xiàn)最好的擴(kuò)散模型。

圖片

圖 5 為可視化結(jié)果。

圖片

視頻壓縮。結(jié)果如表 3 所示,本文模型在所有指標(biāo)上都優(yōu)于 MAGVIT,并且在 LPIPS 上優(yōu)于所有方法。

視頻理解。如表 4 所示,MAGVIT-v2 在這些評(píng)估中優(yōu)于之前最好的 MAGVIT。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2023-10-16 12:31:17

人工智能數(shù)據(jù)

2025-05-16 13:18:37

2025-07-21 09:03:00

模型AI訓(xùn)練

2022-10-19 14:17:32

圖像模型

2024-09-24 15:51:02

2024-12-26 11:48:27

2025-07-14 08:51:00

2025-08-07 07:56:52

2024-03-20 00:00:00

StabilityAI開源人工智能

2024-05-10 07:58:03

2025-11-17 09:22:09

2025-04-09 13:11:27

2023-12-20 14:54:29

谷歌Gen-2視頻

2024-12-04 11:07:09

2024-09-10 11:21:30

2024-11-25 08:20:00

2023-04-03 10:04:44

開源模型

2025-04-22 09:17:00

模型生成開源

2025-04-16 09:20:00

虛擬模型數(shù)字
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产精品亚洲一区二区在线观看| 国产精品久久久久一区二区国产| 国产综合欧美| 亚洲精品www久久久| 日日摸天天爽天天爽视频| √天堂资源地址在线官网| 国产精品乡下勾搭老头1| 18久久久久久| 黄色录像二级片| 日韩三级毛片| 欧美一区二区三区啪啪| 国产黄色特级片| 超碰在线最新| 国产欧美精品一区二区三区四区 | 免费日韩在线视频| 妖精视频一区二区三区免费观看| 欧美一区二区三区爱爱| 午夜精品久久久内射近拍高清| 免费不卡视频| 久久久亚洲午夜电影| 1卡2卡3卡精品视频| 无码视频在线观看| 亚洲黄色一区| 美女视频久久黄| 影音先锋男人在线| 欧美亚洲tv| 日韩欧美一卡二卡| 中文字幕永久有效| 丝袜诱惑一区二区| 亚洲一二三区在线观看| 精品久久免费观看| www.在线视频.com| 国产视频不卡一区| 免费在线成人av电影| 亚洲精品视频91| 精品影视av免费| 国产精品观看在线亚洲人成网| 日干夜干天天干| 欧美日韩国产一区精品一区| 精品国产区一区二区三区在线观看| 中文字幕免费高清| 色天天色综合| 日韩精品在线免费| 成人在线视频免费播放| 伊人久久大香线蕉av超碰| 欧美一区二区在线免费播放| 99精品999| 日韩一级特黄| 在线电影国产精品| 亚洲免费999| 一区二区三区| 欧美精品视频www在线观看 | 久久亚洲精品爱爱| 日韩欧美在线视频| 久久精品.com| 日韩成人亚洲| 欧美在线观看视频在线| 一区二区三区国产免费| 五月激情久久| 欧美撒尿777hd撒尿| 蜜臀一区二区三区精品免费视频| 日韩国产一二三区| 欧美久久一区二区| 亚洲高清在线不卡| 9l亚洲国产成人精品一区二三 | 日批视频免费看| 福利电影一区| 国产视频精品xxxx| 欧美黄色一级生活片| 欧美1级片网站| 欧美成人黑人xx视频免费观看| 男女性高潮免费网站| 欧美午夜一区| 88国产精品欧美一区二区三区| 日韩特级黄色片| 日韩电影免费在线看| 国产精品美女久久久免费| 一区二区视频网| 国产一区视频导航| 国产精品二区在线| 天堂中文在线观看视频| 久久精品在这里| 在线综合视频网站| 白白色在线观看| 在线免费观看日本一区| 久久成年人网站| 国产日韩三级| 一区二区三区美女xx视频| 暗呦丨小u女国产精品| 伊人影院久久| 国产成人精品在线| 国产肥老妇视频| 91论坛在线播放| 老汉色影院首页| 水蜜桃在线视频| 91精品国产综合久久福利软件 | 欧美 日韩 国产 激情| www久久久| 精品亚洲国产成av人片传媒| 黄色精品视频在线观看| 日韩亚洲国产精品| 成人高清视频观看www| 天堂8在线视频| 中文字幕一区二区三区在线不卡| av无码久久久久久不卡网站| 国产原创一区| 精品成人一区二区三区| 激情五月深爱五月| 一区二区日本视频| 亚洲最大福利网站| 国产69久久| 午夜婷婷国产麻豆精品| av中文字幕网址| 一区二区美女| 久久久亚洲影院你懂的| 国产一区二区三区中文字幕 | 日韩欧美在线网站| av网站免费在线看| 亚洲黄页一区| 成人网欧美在线视频| 国产午夜视频在线观看| 黄色一区二区在线观看| 中文字幕av一区二区三区人妻少妇| 一本久久青青| 国产91成人在在线播放| 成人小说亚洲一区二区三区| 亚洲人精品午夜| 男人添女人下面免费视频| 精品一区在线| 57pao国产精品一区| 人人妻人人澡人人爽人人欧美一区 | 在线观看日韩一区| 国产伦精品一区二区三区妓女 | 中国丰满人妻videoshd| 成人自拍在线| 九九九久久国产免费| 一本色道久久综合熟妇| 国产精品视频你懂的| 日本一本二本在线观看| 婷婷综合电影| 欧美在线视频a| 视频在线观看你懂的| 亚洲成a人v欧美综合天堂下载| 日本一级大毛片a一| 欧美精品入口| 国产精品一区在线播放| 久久亚洲资源| 亚洲国产精品电影| 日产电影一区二区三区| 成人av在线播放网址| 男人天堂a在线| 99精品国产高清一区二区麻豆| 九九久久久久久久久激情| www.xxxx国产| 亚洲电影激情视频网站| 800av在线播放| 国产日韩欧美高清免费| 激情视频一区二区| 午夜伦理福利在线| 日韩精品免费在线| 天天射天天干天天| 欧美国产日本韩| 中文字幕22页| 狠狠入ady亚洲精品| 精选一区二区三区四区五区| 超碰一区二区| 综合久久五月天| 99国产揄拍国产精品| 亚洲午夜视频在线| 人妻精品久久久久中文字幕| 青青草成人在线观看| 三年中文高清在线观看第6集| 久久久久久爱| 欧美一级淫片aaaaaaa视频| 国产精品二线| 日韩欧美色综合网站| 91久久国产视频| 国产女人aaa级久久久级| 中文字幕 欧美日韩| 亚洲日本成人| 亚洲精品成人自拍| 亚洲一级大片| 国产91精品网站| 在线视频中文字幕第一页| 日韩av综合网站| 亚洲图片小说视频| 亚洲成人你懂的| 天堂资源在线视频| 成人免费视频一区| 国产精品少妇在线视频| 亚洲成人三区| 美脚丝袜一区二区三区在线观看| 精品乱码一区二区三区四区| 久久久久久网址| 啊v在线视频| 亚洲成人激情在线| 在线观看国产黄| 性久久久久久久| 亚洲一二三四五六区| av高清久久久| 黄色aaaaaa| 久久中文欧美| 久草视频这里只有精品| 欧美一区二区三区高清视频| 国产精品10p综合二区| 不卡亚洲精品| 欧美诱惑福利视频| 欧美精品videossex少妇| 中文字幕欧美国内| 天堂网www中文在线| 日韩久久久精品| 中文字幕日产av| 色综合天天综合狠狠| 国产精品白浆一区二小说| 国产精品超碰97尤物18| 精品无码人妻一区| 国产成a人亚洲| 一级黄色录像在线观看| 日韩精品每日更新| 毛片在线视频播放| 欧美日韩a区| 在线观看三级网站| 91欧美国产| 日韩成人在线资源| 妖精视频一区二区三区免费观看 | 欧美日韩精品一区二区视频| 国产精品v欧美精品∨日韩| 美女精品久久| 国产欧亚日韩视频| 欧美韩国日本| 国产精品久久久久免费a∨| 天堂av中文在线观看| 午夜精品一区二区三区在线播放| 91高清在线观看视频| 久久中文久久字幕| 麻豆tv免费在线观看| 少妇高潮 亚洲精品| 国产高清一级毛片在线不卡| 亚洲开心激情网| 日本五码在线| 国产视频精品久久久| 青青操视频在线| 日韩成人在线视频观看| 先锋av资源站| 亚洲精品一区二区精华| 日本人妻丰满熟妇久久久久久| 精品国产成人系列| 欧美综合视频在线| 日韩精品视频在线免费观看| 香蕉国产在线视频| 亚洲欧美制服另类日韩| 国产污视频在线| 色99之美女主播在线视频| 调教视频免费在线观看| 久久艹在线视频| 性xxxxfjsxxxxx欧美| 久久久久国产精品www| а√天堂中文在线资源8| 欧美又大又粗又长| 福利精品在线| 51成人做爰www免费看网站| silk一区二区三区精品视频 | 欧洲专线二区三区| 天天爽天天狠久久久| 欧美r级电影| 亚洲啊啊啊啊啊| 狠狠入ady亚洲精品| 男人亚洲天堂网| 日本欧美一区二区| 永久看看免费大片| 99久久免费视频.com| 久久午夜精品视频| ㊣最新国产の精品bt伙计久久| 欧美久久久久久久久久久久| 狠狠久久五月精品中文字幕| 欧美性猛交xxxx乱大交hd | 日本精品视频在线播放| jizzyou欧美16| 亚洲影院高清在线| 日本欧美高清| 亚洲综合欧美日韩| 亚洲视频一二| 91香蕉视频污版| 国产成人免费视频精品含羞草妖精| 精品无码在线视频| 最好看的中文字幕久久| 日韩熟女精品一区二区三区| 欧美视频在线一区二区三区 | 青青草视频在线观看免费| 3d成人h动漫网站入口| 欧美 日韩 中文字幕| 丝袜一区二区三区| а√天堂中文在线资源8| 国产在线观看精品| 日韩极品在线| 欧美性受xxxx黑人猛交88| 亚洲欧美日韩国产| 91av免费观看| 日本一区二区不卡视频| 国产精品23p| 69av一区二区三区| 东热在线免费视频| 668精品在线视频| 国产精品一区二区三区av| 欧美高清一区二区| 国模大胆一区二区三区| jizz18女人| 国产视频不卡一区| 91精品国产乱码久久久张津瑜| 欧美精品日韩综合在线| 国产玉足榨精视频在线观看| 欧美极品xxxx| 国内精品视频| 亚洲欧洲日韩综合二区| 欧美亚洲免费| 黄色av网址在线观看| 亚洲一区精品在线| 国产精品伦理一区| 在线精品视频视频中文字幕| www.日韩| 美媛馆国产精品一区二区| 一区在线视频观看| 99国产精品免费视频| 中文字幕一区二区5566日韩| 亚洲国产成人精品女人久久| 亚洲精品久久久久久久久| 欧美日韩经典丝袜| 91久久久久久久久| 天天操夜夜操国产精品| 精品少妇无遮挡毛片| 国产无人区一区二区三区| 国产一级免费视频| 日韩麻豆第一页| 青青青免费在线视频| 国产一区二区免费电影| 亚洲国产免费| 亚洲综合自拍网| 精品久久久久久电影| 手机看片1024国产| 国内精品在线一区| 国产精品香蕉| 性欧美大战久久久久久久| av亚洲精华国产精华精| 国产精品.www| 精品香蕉一区二区三区| 精品91久久| 日韩国产欧美一区| 蜜桃视频在线观看一区| 婷婷国产成人精品视频| 337p亚洲精品色噜噜狠狠| 成人免费视屏| 99国产超薄丝袜足j在线观看 | 中文字幕欧美日本乱码一线二线| 欧美日韩 一区二区三区| 在线不卡国产精品| 日韩一级特黄| 草草草视频在线观看| 成人黄色小视频在线观看| 国产成人在线视频观看| 亚洲日本中文字幕免费在线不卡| 91精品影视| 一区二区三区久久网| 国产精品一色哟哟哟| 日本午夜精品理论片a级app发布| 亚洲美女性视频| 色综合天天色| 欧美美女黄色网| 99精品桃花视频在线观看| 黄色av网站免费| 精品国产依人香蕉在线精品| 亚洲欧洲国产精品一区| 99福利在线观看| 中文字幕亚洲欧美在线不卡| 亚洲AV无码一区二区三区少妇| 欧美自拍大量在线观看| 日韩在线观看| 国产成人精品一区二区三区在线观看 | 日韩经典第一页| 在线国产成人影院| 国产高清不卡无码视频| 久久综合九色综合欧美亚洲| 91福利免费视频| 亚洲91av视频| 日韩精品四区| 久久久久国产精品无码免费看| 欧美日韩一区二区三区四区| 国内高清免费在线视频| 日本成人黄色| 国产成人综合视频| 老熟妇一区二区三区| 美日韩精品免费视频| 亚洲国产欧美日韩在线观看第一区| 国产无遮挡猛进猛出免费软件| 亚洲国产一区二区视频| 国产黄在线播放| 国产精品久久亚洲7777| 奇米精品一区二区三区在线观看 | heyzo在线| 资源网第一页久久久| 92精品国产成人观看免费|