精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ETT:打破原生多模態(tài)學習視覺瓶頸,重塑視覺tokenizer優(yōu)化范式

人工智能 新聞
我們提出了 ETT(End-to-End Vision Tokenizer Tuning),一種全新的端到端視覺 tokenizer 調(diào)優(yōu)方法。

本文由北京智源研究院多模態(tài)大模型研究中心(團隊負責人王鑫龍,團隊代表作 EMU 系列、EVA 系列、Painter & SegGPT)、中科院自動化所和大連理工大學聯(lián)合完成。 

在多模態(tài)學習蓬勃發(fā)展的當下,視覺 tokenizer 作為連接視覺信息與下游任務的關鍵橋梁,其性能優(yōu)劣直接決定了多模態(tài)模型的表現(xiàn)。然而,傳統(tǒng)的視覺 tokenization 方法存在一個致命缺陷:視覺 tokenizer 的優(yōu)化與下游任務的訓練是相互割裂的。

這種分離式的訓練范式假設視覺 tokens 能夠在不同任務間無縫通用,但現(xiàn)實情況是,為低級重建任務優(yōu)化的視覺 tokenizer 往往難以滿足諸如圖像生成、視覺問答等需要豐富語義表示的下游任務需求,導致下游任務的性能受限。

針對這一亟待解決的問題,我們提出了 ETT(End-to-End Vision Tokenizer Tuning),一種全新的端到端視覺 tokenizer 調(diào)優(yōu)方法。

圖片

  • 論文標題:End-to-End Vision Tokenizer Tuning
  • arXiv 鏈接:https://arxiv.org/abs/2505.10562

ETT 創(chuàng)新性地實現(xiàn)了視覺 tokenization 與目標自回歸任務的聯(lián)合優(yōu)化,打破了傳統(tǒng)方法中視覺 tokenizer 一旦訓練完成便固定的常規(guī),充分釋放了視覺 tokenizer 在多模態(tài)學習中的潛力,為多模態(tài)任務帶來了顯著的性能提升。

傳統(tǒng)方法的局限與 ETT 的突破

在現(xiàn)有的多模態(tài)預訓練框架中,如 Emu3 等工作,雖然通過將圖像、文本等多模態(tài)數(shù)據(jù)編碼為離散 tokens 實現(xiàn)了統(tǒng)一的序列建模,但在實際操作中,這些方法僅僅利用了凍結(jié)的視覺 tokenizer 的離散索引,這不僅極大地浪費了視覺 tokenizer 的豐富特征表示能力,還阻礙了端到端訓練的實現(xiàn),使得視覺 tokenizer 無法根據(jù)下游任務的具體需求進行針對性優(yōu)化。

ETT 的出現(xiàn)徹底改變了這一局面。我們巧妙地引入視覺 tokenizer 的碼本嵌入,取代了以往僅使用離散索引的方式,并結(jié)合 token 級別的字幕損失函數(shù),對視覺 tokenizer 和下游任務進行聯(lián)合優(yōu)化。這樣一來,ETT 不僅能夠充分利用視覺 tokenizer 內(nèi)部的豐富特征表示,還能讓視覺 tokenizer 根據(jù)下游任務的反饋不斷調(diào)整自身參數(shù),從而更好地適應多模態(tài)理解與生成任務的需求。

圖片

ETT 的核心架構(gòu)與訓練策略

ETT 的核心架構(gòu)基于改進的 IBQ 框架。我們通過精心調(diào)整碼本大小至 131,072 并將特征維度設置為 256,成功構(gòu)建了一個高效的視覺 tokenizer。

在訓練初期,我們利用編碼器將輸入圖像映射到特征空間,經(jīng)量化器將特征映射到離散碼本后,再由解碼器重建圖像,這一過程奠定了視覺 tokenizer 的基礎重構(gòu)能力。我們還引入了多層感知機作為投影層,將視覺嵌入與預訓練大型語言模型的隱藏層維度相匹配,從而實現(xiàn)視覺信息到語言模型的有效映射。

ETT 的訓練策略層次分明且重點突出。前期對齊學習階段,我們在保持預訓練的大型語言模型和視覺 tokenizer 參數(shù)凍結(jié)的狀態(tài)下,僅訓練視覺投影層,利用圖像到文本的 caption 損失函數(shù),使語言模型能夠從視覺 tokenizer 中直接獲取視覺概念和實體,從而建立起視覺與語言模態(tài)之間的初步聯(lián)系。

緊接著,在語義學習階段,我們解凍大型語言模型、投影層以及視覺 tokenizer 的權(quán)重,通過聯(lián)合優(yōu)化 caption 損失函數(shù)和重建損失函數(shù),對它們進行端到端的訓練,使視覺 tokenizer 能夠在保持圖像重建能力的同時,學習到更強大的感知能力,以支持多模態(tài)理解和重建任務。

第二階段是 ETT 方法的核心創(chuàng)新,讓視覺 tokenizer 得以根據(jù)下游任務需求深度調(diào)優(yōu),大幅提升其感知和表征能力。最后是后訓練階段,我們進一步對兩個專業(yè)模型進行微調(diào),以增強其在特定多模態(tài)任務中的表現(xiàn)。

圖片

ETT 的卓越性能表現(xiàn)

多模態(tài)理解

ETT 在多模態(tài)理解任務中展現(xiàn)出了卓越的性能。在 GQA、TextVQA 等特定任務評估,以及 POPE、MME、MMBench、SEED-Bench、MMVet 等廣泛基準測試中均取得了優(yōu)異成績,與現(xiàn)有最先進的視覺語言模型相比,在模型參數(shù)和數(shù)據(jù)規(guī)模更小的情況下,依然能夠取得更好的或具有競爭力的結(jié)果。

例如,在 MMBench 多模態(tài)理解基準測試中,ETT 的性能表現(xiàn)與連續(xù)編碼器基礎的視覺語言模型相當,甚至在某些子任務上更勝一籌,而無需額外的復雜視覺編碼器。這表明 ETT 通過端到端的視覺 tokenization 訓練方法,在減少計算開銷的同時,簡化了模型架構(gòu),并有效提升了多模態(tài)理解能力。

圖片

多模態(tài)生成

在視覺生成任務中,ETT 同樣表現(xiàn)出色。在 GenEval 和 T2I-CompBench 等廣泛使用的文本到圖像生成基準數(shù)據(jù)集上,ETT 實現(xiàn)了與其他最先進的基于擴散模型和自回歸模型的方法相媲美的性能,同時在模型參數(shù)和訓練數(shù)據(jù)規(guī)模上更具優(yōu)勢。特別是在 T2I-CompBench 數(shù)據(jù)集的顏色、形狀和紋理模式等子任務上,ETT 取得了令人滿意的成績,充分證明了其在文本到圖像生成任務中的強大能力。

圖片

此外,ETT 在定性結(jié)果方面也展現(xiàn)出了其優(yōu)勢。通過生成的圖像樣本可以看出,ETT 能夠準確地遵循文本提示,生成風格多樣、細節(jié)豐富的視覺內(nèi)容,涵蓋了不同的藝術(shù)風格、主題和背景,并能夠適應不同的構(gòu)圖結(jié)構(gòu)和審美偏好。

圖片

視覺重構(gòu)

ETT 在視覺重構(gòu)任務中的表現(xiàn)同樣令人矚目。通過對比引入 ETT 前后的視覺重構(gòu)結(jié)果,我們可以看到,ETT 不僅保留了原始視覺 tokenizer 的豐富低級細節(jié)表示,還有效提升了高級語義表示能力。

圖片

如上圖所示,經(jīng)過 ETT 調(diào)優(yōu)后的視覺 tokenizer 在保留原始視覺細節(jié)的同時,顯著提升了特定方面的表現(xiàn),例如文本渲染效果更好。這表明 ETT 能夠在保持圖像重建質(zhì)量的同時,增強視覺 tokenizer 的語義表達能力,為進一步的多模態(tài)任務提供更優(yōu)質(zhì)的視覺表示。

ETT 的潛在局限與未來發(fā)展

盡管 ETT 在多模態(tài)任務中取得了顯著的性能提升,但我們也意識到當前方法存在一定的局限性。

首先,ETT 的端到端微調(diào)所使用的數(shù)據(jù)規(guī)模和模型容量仍有進一步擴大的潛力,以進一步提升視覺表示質(zhì)量和下游任務性能。其次,ETT 主要側(cè)重于利用大型語言模型的語義能力優(yōu)化現(xiàn)有視覺 tokenizer 的視覺特征,而非從頭開始設計一個同時適用于理解和生成的視覺 tokenizer。

未來,我們計劃探索從頭開始端到端訓練視覺 tokenizer,以創(chuàng)建一個更全面、更適應多模態(tài)任務的表示方法。此外,將 ETT 的方法擴展到圖像和文本之外的其他模態(tài),如視頻和音頻,也是一個令人興奮的研究方向。

總的來說,ETT 作為一種簡單而有效的端到端視覺 tokenizer 調(diào)優(yōu)方法,易于實現(xiàn)和集成,為原生多模態(tài)學習領域帶來了新的突破。通過優(yōu)化視覺 tokenizer 的特征表示,ETT 為提升多模態(tài)模型的性能提供了新的思路和方法,有望推動多模態(tài)基礎模型在更廣泛的領域的應用和發(fā)展。我們期待 ETT 的出現(xiàn)能夠激發(fā)更多關于視覺 tokenization 和多模態(tài)學習的研究,共同探索這一充滿潛力的領域。

作者介紹

王文軒,中科院自動化所-北京智源研究院聯(lián)培博士,研究方向為視覺語言模型、多模態(tài)理解生成等,在 ICLR、CVPR、ECCV、ACL 等頂級會議上發(fā)表過多篇論文; 

張帆、崔玉峰,智源研究院研究員,研究方向為原生多模態(tài)模型、視覺生成等,Emu 系列工作核心作者; 

刁海文,大連理工大學博士,研究方向包括大模型高效遷移、多模態(tài)基座大模型等,在 NeurIPS、ICLR、CVPR、ECCV 等頂級會議上發(fā)表過多篇論文; 

羅卓彥,清華大學碩士,研究方向為視覺生成等,在 NeurIPS、CVPR 等頂級會議上發(fā)表過論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-27 09:08:00

AI視覺模型

2024-11-13 09:39:13

2025-02-26 13:00:00

2024-10-22 13:33:48

2024-07-16 13:18:36

2024-03-01 12:19:00

接口性能優(yōu)化

2025-08-05 15:10:25

機器人視覺訓練

2024-07-23 10:34:57

2024-10-06 10:00:00

3D模型

2025-07-07 13:49:38

模型AI視覺

2024-12-13 14:30:00

AI模型數(shù)據(jù)

2024-08-08 13:04:28

2025-04-07 04:30:00

2025-06-26 09:13:22

2025-03-10 08:47:00

模型AI訓練

2024-12-18 14:50:00

AI訓練數(shù)據(jù)

2025-07-15 09:00:00

2025-10-16 09:00:00

2025-07-04 08:43:00

2025-02-27 09:51:04

點贊
收藏

51CTO技術(shù)棧公眾號

精品成人在线视频| 国产一区二区美女| 亚洲天堂日韩电影| 亚洲欧美自拍另类日韩| а√天堂在线官网| bt7086福利一区国产| 热门国产精品亚洲第一区在线| 亚洲性猛交xxxx乱大交| 日韩三级一区| 亚洲一卡二卡三卡四卡无卡久久| 精品亚洲第一| 亚洲精品国产欧美在线观看| 在线中文一区| 亚洲人成亚洲人成在线观看| 熟妇无码乱子成人精品| 偷拍自拍在线看| 亚洲三级在线免费观看| 精品不卡一区二区三区| 国产精品欧美激情在线| 亚洲欧美日本国产专区一区| 久久久99久久精品女同性| 国产伦精品一区二区免费| aaaa欧美| 欧美日韩另类视频| 一本色道久久88亚洲精品综合| 头脑特工队2在线播放| 极品美女销魂一区二区三区免费| 7m第一福利500精品视频| 91麻豆精品成人一区二区| 一本色道久久综合亚洲精品酒店 | 国产嫩bbwbbw高潮| 影音先锋成人在线电影| 亚洲一区av在线播放| 中文字幕第九页| 亚洲精品一区av| 一本久久精品一区二区| 欧美精品久久久久久久自慰| 黄色在线免费看| 欧美国产综合一区二区| 麻豆精品传媒视频| 日韩在线观看视频一区| 国产不卡视频一区| 亚洲aaaaaa| 国产又粗又猛又黄又爽| 日本视频在线一区| 国产精品99免视看9| 五月婷婷色丁香| 亚洲看片一区| 久久免费福利视频| 国产一级片视频| 国产一区日韩一区| 免费av一区二区| 五月天av网站| 中文字幕亚洲综合久久五月天色无吗''| 曰本色欧美视频在线| 中文字幕第4页| 久久97视频| 亚洲欧美成人精品| 成人免费毛片糖心| 欧美男男gaytwinkfreevideos| 亚洲欧美国产精品专区久久| 偷拍女澡堂一区二区三区| 日韩美女毛片| 亚洲欧美中文字幕在线一区| 在哪里可以看毛片| 精品在线播放| 永久免费看mv网站入口亚洲| 亚洲欧美综合7777色婷婷| 久久神马影院| 久热精品视频在线观看| 欧美黑人精品一区二区不卡| 激情婷婷欧美| 欧美一区二区影院| 国产裸体美女永久免费无遮挡| 日韩国产欧美视频| 国产剧情久久久久久| 国产三级精品在线观看| 国产91精品露脸国语对白| 国产伦精品一区二区三区高清| 天堂成人在线视频| 久久蜜桃一区二区| 亚洲精品成人a8198a| 欧美精品电影| 亚洲综合视频网| 男人用嘴添女人下身免费视频| 成人性生活视频| 欧美日韩一区精品| 日本在线视频播放| 亚洲人亚洲人色久| www国产精品视频| 国产真实的和子乱拍在线观看| 国产欧美短视频| 国产精品一区电影| 亚洲国产成人一区二区 | 国产精品一区二区三区在线| 婷婷亚洲一区二区三区| 国产精品人人做人人爽人人添| 色哺乳xxxxhd奶水米仓惠香| 华人av在线| 欧美日韩欧美一区二区| 一级全黄裸体片| 久久最新网址| 九九热精品视频| 黄色av一级片| 国产精品69久久久久水密桃| 欧美极品日韩| 色呦呦网站在线观看| 91国偷自产一区二区开放时间| 99中文字幕在线| 丝袜连裤袜欧美激情日韩| 久久久久99精品久久久久| 日本一级片免费看| 国产在线视频精品一区| 蜜桃麻豆91| 欧美一卡二卡| 欧美性一二三区| 青青草视频网站| 91精品婷婷色在线观看| 日韩免费av一区二区| 亚洲成人久久精品| 中文字幕在线一区免费| 中文字幕乱码人妻综合二区三区 | 91精品久久香蕉国产线看观看| 牛牛热在线视频| 亚洲综合免费观看高清在线观看| 国产精品人人爽人人爽| 久久超级碰碰| 欧美黑人xxxⅹ高潮交| 一级黄色大片免费| 久久久亚洲高清| 日本人体一区二区| 欧美黄色一级| xvideos亚洲人网站| 波多野结衣一区二区三区在线 | 一区二区伦理片| 136国产福利精品导航网址| 91在线观看免费高清完整版在线观看| 黄色在线视频观看网站| 天天综合网天天综合色 | 91蜜桃视频在线| 欧美黄色免费网址| 国产精品一区三区在线观看| 色一情一乱一区二区| 99re国产在线| 久久免费看少妇高潮| 中国丰满人妻videoshd| 亚洲精品国产动漫| 97久久久久久| 天堂av资源网| 精品久久在线播放| 黄色性生活一级片| 亚洲欧美成人| 秋霞久久久久久一区二区| 在线观看v片| 亚洲精品视频在线观看视频| 天堂网一区二区三区| 99re这里只有精品6| 免费一级特黄毛片| 欧美sss在线视频| 2019国产精品自在线拍国产不卡| 神马午夜电影一区二区三区在线观看| 亚洲国产精品久久艾草纯爱| 国产精品手机在线观看| 香蕉亚洲视频| 日韩三级电影| 日韩综合久久| 欧美激情三级免费| 天天干天天摸天天操| 欧美日韩亚洲一区二区| 少妇久久久久久久久久| 日韩**一区毛片| 亚洲精品自在在线观看| 九色精品蝌蚪| 97精品久久久中文字幕免费| 神马精品久久| 欧美日韩精品一区二区三区蜜桃| 伊人久久久久久久久久久久久久| 国产又黄又大久久| 国产欧美日韩小视频| 私拍精品福利视频在线一区| 国产成+人+综合+亚洲欧美丁香花| 99视频在线观看地址| 91麻豆精品国产91久久久资源速度| 午夜69成人做爰视频| 99久久伊人精品| 午夜dv内射一区二区| 婷婷久久国产对白刺激五月99| 高清不卡一区二区三区| 欧美gay视频| 久久天天躁狠狠躁夜夜爽蜜月| 俄罗斯嫩小性bbwbbw| 欧美性精品220| 波多野结衣在线网址| 成人黄色av网站在线| 国产成人a亚洲精v品无码| 色135综合网| 国产精品免费在线播放| 欧洲一区二区三区精品| 另类少妇人与禽zozz0性伦| 午夜视频福利在线观看| 在线播放欧美女士性生活| 日韩精品视频播放| 国产精品久久久久一区| 亚洲天堂资源在线| 精久久久久久久久久久| 成年人视频网站免费观看| 亚洲美女视频| 色涩成人影视在线播放| 中文无码日韩欧| 国产精品高清免费在线观看| 日本在线视频中文有码| 中文字幕国产精品久久| 日韩在线观看视频一区| 6080yy午夜一二三区久久| 91精品国产高清一区二区三密臀| 一区二区三区在线观看欧美| 手机看片日韩av| 91蜜桃在线观看| 91九色蝌蚪porny| 黑人精品欧美一区二区蜜桃| 国产成人久久婷婷精品流白浆| 欧美精品首页| 亚洲一区二区精品在线观看| 九九视频精品全部免费播放| 国产一区二区三区av在线| 白嫩亚洲一区二区三区| 国产精品高潮呻吟视频| 韩国精品一区| 久久久久一本一区二区青青蜜月| 午夜在线观看视频| 亚洲性日韩精品一区二区| 色婷婷综合视频| 日韩精品中文字幕一区二区三区 | 欧美成人欧美edvon| 91麻豆国产在线| 在线观看成人免费视频| caoporn国产| 天天亚洲美女在线视频| 欧美日韩大片在线观看| 玉足女爽爽91| 欧美卡一卡二卡三| 一区二区三区精品在线观看| 91精品免费看| 国产成人精品综合久久久久99| 日韩高清不卡一区二区三区| 欧美日韩性生活片| 黄色成人在线网址| 97在线免费视频观看| 在线精品视频在线观看高清| 欧美性受黑人性爽| 一本到12不卡视频在线dvd| 亚洲一区bb| 99久久99视频只有精品| 91手机视频在线| 欧美独立站高清久久| 正在播放国产精品| 婷婷综合视频| 警花观音坐莲激情销魂小说| 一区二区日韩欧美| 国产午夜精品视频一区二区三区| 你懂的一区二区| av日韩在线看| 日韩视频在线一区二区三区| 日本一道本久久| 丝袜美腿亚洲色图| 在线观看国产中文字幕| 精品一区二区三区在线观看国产 | 日韩av有码在线| 欧美zozo| 日韩视频―中文字幕| 最新av在线播放| 韩国视频理论视频久久| 免费观看亚洲| 国产免费一区二区三区在线观看| 91成人福利社区| 国产精品香蕉视屏| 亚洲调教一区| 中文字幕免费在线不卡| 欧美日韩国产亚洲一区| 浮妇高潮喷白浆视频| 奇米一区二区三区av| 人人爽人人爽av| 成人黄色av网站在线| 国产熟女一区二区| 亚洲男人的天堂在线观看| 五月天综合在线| 欧亚一区二区三区| 国产福利资源在线| 精品视频偷偷看在线观看| 97超碰国产一区二区三区| 欧美区二区三区| 天天免费亚洲黑人免费| 亚洲最大激情中文字幕| 一道在线中文一区二区三区| 国产成年人在线观看| 国产精品视频| 欧洲在线免费视频| 久久久久久久久久久99999| 岛国毛片在线观看| 91福利精品第一导航| 精品国产无码一区二区| 亚洲欧洲免费视频| 午夜av在线免费观看| 国产精品久久久久久久久久东京 | 裸模一区二区三区免费| 婷婷综合久久| 少妇性l交大片| 国产99精品在线观看| 国产精品酒店视频| 欧美日韩黄色大片| www.黄色小说.com| 最近2019年手机中文字幕| 国产乱码精品一区二三赶尸艳谈| 国产精品一香蕉国产线看观看 | 精品福利一区二区三区免费视频| av午夜在线| 51精品国产黑色丝袜高跟鞋| 精品视频在线观看免费观看| 日韩av电影免费播放| 亚洲毛片视频| wwwww在线观看| 亚洲欧洲在线观看av| 无码人妻久久一区二区三区| 精品国产123| 日本精品600av| 成人美女免费网站视频| 精品国产a一区二区三区v免费| 成人一对一视频| 成人一区在线看| 永久av免费网站| 欧美日韩一卡二卡| 男人天堂资源在线| 69**夜色精品国产69乱| 91蝌蚪精品视频| 三上悠亚免费在线观看| 久99久精品视频免费观看| 天天干天天操天天拍| 在线一区二区三区四区| 日本大片在线观看| 午夜精品久久久久久久99热浪潮 | 久久久久se| 一区二区久久| 国产毛片毛片毛片毛片毛片毛片| 亚洲国产乱码最新视频| 亚洲精品国产一区二| 欧美福利视频网站| 亚洲精品一区国产| 国产一区二区片| 成人av在线网站| 日韩黄色a级片| 日韩av中文在线| 男人av在线播放| 美女黄毛**国产精品啪啪| 亚洲综合日韩| 免费看黄色av| 欧美人与禽zozo性伦| 乱人伦中文视频在线| 亚洲www在线| 国产一区二区三区四区三区四 | 国产婷婷一区二区| 中文文字幕一区二区三三| 这里只有精品在线观看| 欧美一区二区三区婷婷| 强开小嫩苞一区二区三区网站| 国产美女娇喘av呻吟久久| 久久免费视频播放| 日韩精品免费在线视频| 日韩一区精品| 中文字幕精品一区日韩| 国产成人精品1024| 中文字幕亚洲高清| 在线a欧美视频| 欧美1区2区3| 俄罗斯av网站| 国产嫩草影院久久久久| 国产乱码精品一区二三区蜜臂| 欧美丰满片xxx777| 亚洲最大在线| 中文av字幕在线观看| 亚洲一级二级三级在线免费观看| 十八禁一区二区三区| 日本欧美在线视频| 忘忧草精品久久久久久久高清| 少妇熟女视频一区二区三区 | 日韩亚洲国产中文字幕| 婷婷视频一区二区三区| 97国产在线播放| 国产精品久久久久久久久免费相片 | 成人h猎奇视频网站| 欧美福利一区| 一级性生活大片| 欧美一区二区三区在线观看| 国产高清中文字幕在线| 伊人久久大香线蕉成人综合网 | 欧美性受xxxx黑人xyx性爽| av网站大全在线| 欧美一区二区三区在线播放| 国产一区美女在线| 日本免费在线观看视频| 欧美巨猛xxxx猛交黑人97人|