精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

國產(chǎn)SOTA新模型精準(zhǔn)get“畫(3+6)條命的動物” | 開源

人工智能 新聞
清華大學(xué)、騰訊ARC Lab、香港中文大學(xué)和香港大學(xué)聯(lián)手提出了一個新大模型——MindOmni,顯著增強了AI的“推理生成能力”。

生成圖像這件事,會推理的AI才是好AI。

舉個例子,以往要是給AI一句這樣的Prompt:

(3+6)條命的動物。

我們?nèi)祟惪隙ㄒ谎劬椭朗秦堖洌獳I的思考過程卻是這樣的:

圖片

△雖然生成了貓,但思考過程不對

思考的過程還是把“(3+6)”里的數(shù)字分開來處理,并沒有真正get到其背后“九條命的動物=貓”的本意。

以及像ChatGPT,還是執(zhí)著于在圖片里面展示數(shù)字:

圖片

究其原因,是因為當(dāng)前主流的基于文本進行圖像生成的方法往往依賴固定的文本編碼器,僅能處理“純文本”輸入,難以自然接入圖像、音頻等模態(tài)的信息。

同時,這類系統(tǒng)在應(yīng)對“復(fù)雜世界知識”和“多步驟邏輯推理”方面表現(xiàn)乏力。

但就在最近,清華大學(xué)、騰訊ARC Lab、香港中文大學(xué)和香港大學(xué)聯(lián)手提出了一個新大模型——MindOmni,顯著增強了AI的“推理生成能力”

圖片

它不僅能理解復(fù)雜指令,還能基于圖文內(nèi)容展開連貫而可信的“思維鏈”(Chain-of-Thought, CoT),生成具備邏輯性與語義一致性的圖像或文本輸出:

圖片
△推理圖像生成可視化結(jié)果對比
圖片

△對基于多模態(tài)用戶輸入的推理感知圖像生成可視化結(jié)果對比

那么MindOmni又是如何做到的呢?

深挖MindOmni模型架構(gòu)

MindOmni的架構(gòu)設(shè)計的目的比較清晰,就是為了高效融合視覺理解和生成能力。

其大模型部分基于Qwen2.5-VL構(gòu)建,這是一個先進的視覺語言模型,能夠處理圖像和文本輸入。

它通過預(yù)訓(xùn)練的ViT(Vision Transformer)提取圖像特征,并將文本編碼為離散的標(biāo)記序列。這種設(shè)計使得模型能夠理解圖像內(nèi)容并生成與之相關(guān)的文本描述。

擴散解碼器是MindOmni生成圖像的核心模塊。

它基于OmniGen構(gòu)建,通過去噪過程將潛在的噪聲信號逐步轉(zhuǎn)化為真實的圖像。與傳統(tǒng)的生成模型相比,OmniGen具有更高的靈活性和生成質(zhì)量。

在生成過程中,模型會將視覺和文本特征與噪聲標(biāo)記在序列維度進行合并,并通過多次去噪循環(huán)生成最終的圖像。

為了將視覺語言模型與生成模塊有效連接,MindOmni使用一個包含兩個標(biāo)準(zhǔn)Transformer層的連接器來連接兩個模塊,并用于對齊VLM輸出的特征與生成模塊的輸入維度。

圖片

△推理框架概述:MindOmni在統(tǒng)一的大型模型中完成視覺理解、多模態(tài)推理生成和視覺編輯任務(wù)

三階段訓(xùn)練流程:從理解到生成的飛躍

MindOmni采用了三階段訓(xùn)練策略,以逐步提升模型的性能和推理生成能力。

第一階段:基礎(chǔ)預(yù)訓(xùn)練

在預(yù)訓(xùn)練階段,MindOmni主要利用開源圖像-文本對和X2I數(shù)據(jù)對來訓(xùn)練連接器。這一階段的目標(biāo)是讓模型初步具備基本的文本到圖像生成能力。

通過擴散損失和基于KL散度的蒸餾損失作為優(yōu)化目標(biāo),模型能夠?qū)W習(xí)到圖像和文本之間的語義對齊關(guān)系。

具體來說,模型會通過采樣噪聲數(shù)據(jù)并計算擴散損失來優(yōu)化生成過程,同時利用KL散度來保持與教師模型的一致性。

圖片圖片

第二階段:CoT監(jiān)督微調(diào)

在第二階段,研究人員收集了不同粒度的描述性文本,構(gòu)建了推理生成指令數(shù)據(jù)。

這些數(shù)據(jù)包括粗粒度的描述作為答案內(nèi)容,以及細粒度的描述作為推理內(nèi)容。

通過監(jiān)督微調(diào),模型能夠?qū)W習(xí)到如何根據(jù)指令生成具有邏輯推理的文本內(nèi)容。

這一階段的訓(xùn)練數(shù)據(jù)還包括通過高性能文生圖模型生成的高質(zhì)量圖像,以提升模型的生成質(zhì)量。

第三階段:推理生成策略優(yōu)化(RGPO)

在第三階段,MindOmni引入了推理生成策略優(yōu)化(RGPO)算法。

這一算法的核心思想是通過強化學(xué)習(xí),讓模型能夠顯式地生成邏輯推理鏈。研究人員構(gòu)建了一個包含用戶指令、目標(biāo)提示和對應(yīng)解釋的純文本訓(xùn)練數(shù)據(jù)集,并設(shè)計了一個推理生成導(dǎo)向的系統(tǒng)提示,引導(dǎo)模型生成推理內(nèi)容。

RGPO強化學(xué)習(xí)算法

受DeepSeek-R1啟發(fā),研究人員提出了RGPO強化學(xué)習(xí)算法,通過明確生成邏輯思路鏈來增強模型的推理生成能力。

在部署過程中,策略模型 πΘ首先為每個請求q采樣G組結(jié)果{oi}Gi=1 ,每組結(jié)果包含一個推理鏈oiT和一個對應(yīng)的圖像oiI

為了提高生成推理過程的質(zhì)量,研究者引入了兩種獎勵函數(shù)來引導(dǎo)策略模型生成連貫有效的輸出:

  1. 格式獎勵評估思路鏈?zhǔn)欠穹项A(yù)期結(jié)構(gòu),如果內(nèi)容包含在對應(yīng)標(biāo)簽中,則返回1,否則返回0。
  2. 一致性獎勵使用來自CLIP圖像和文本編碼器的余弦相似度來衡量生成圖像與參考真實提示之間的語義對齊情況。然后,通過所有獎勵值計算第i個輸出的優(yōu)勢Ai,公式如下:

△訓(xùn)練流程概述:研究者提出了一個三階段訓(xùn)練框架,包括預(yù)訓(xùn)練、基于指令的監(jiān)督微調(diào)和基于RGPO的強化學(xué)習(xí)

在強化學(xué)習(xí)過程中,研究者引入了兩種基于KL散度的蒸餾策略:DTKL用于文本生成,DIKL用于圖像生成,以懲罰參考模型 πref與先前策略之間的較大偏差,從而促進更平滑的策略過渡,并降低遺忘先前學(xué)習(xí)知識的風(fēng)險。

研究人員計算了oi的兩個蒸餾函數(shù),如下所示:

最后,通過最小化目標(biāo)函數(shù) 來優(yōu)化策略模型,如下所示:

△RGPO中不同Metric的曲線:“Completion Length”表示策略模型在部署過程中的輸出長度;研究人員發(fā)現(xiàn)CoT長度和最終性能并不呈現(xiàn)正相關(guān)性

實驗結(jié)果: 各大基準(zhǔn)測試全面領(lǐng)先

視覺理解和生成任務(wù)

通過廣泛的實驗,MindOmni在多個多模態(tài)理解和生成基準(zhǔn)測試中表現(xiàn)出色。

在圖像理解方面,MindOmni在MMMU、MMBench和RealworldQA等基準(zhǔn)測試中取得了優(yōu)異成績。

與之前的統(tǒng)一模型相比,MindOmni在MMMU上比Janus-Pro提升了10.6%,在MMBench上比MetaMorph提升了9.8%。

這些結(jié)果表明,MindOmni在理解圖像內(nèi)容方面具有顯著優(yōu)勢。

在文本到圖像生成方面,MindOmni在GenEval基準(zhǔn)測試中取得了83%的總體分數(shù),超越了其他統(tǒng)一模型。

此外,在DPG-Bench測試中,MindOmni也表現(xiàn)出色,證明了其在生成任務(wù)中的強大能力。

△視覺理解基準(zhǔn)測試的性能比較:“Und.”和“Gen.”分別表示“理解”和“生成”

△在 GenEval 和 DPG-Bench 上的性能比較

推理生成能力

MindOmni在推理生成任務(wù)中的表現(xiàn)尤為突出。

在WISE基準(zhǔn)測試中,MindOmni在文化知識、時空推理和自然科學(xué)等多個子類別中均超越了現(xiàn)有方法,取得了0.71的總體分數(shù)。

與生成型模型(如FLUX和PixArt)以及統(tǒng)一模型(如MetaQuery-XL)相比,MindOmni在推理生成任務(wù)中展現(xiàn)了顯著的優(yōu)勢。這主要得益于其聯(lián)合理解-生成訓(xùn)練和基于CoT引導(dǎo)的強化學(xué)習(xí)。

△與WISE基準(zhǔn)上的最新模型進行比較

定性結(jié)果

研究人員通過可視化不同模型的結(jié)果來展現(xiàn)MindOmni在推理生成方面的性能。

例如,在生成“具有(3 + 6)條命的動物”圖像時,MindOmni能夠正確理解數(shù)學(xué)表達式,并生成與之相關(guān)的貓的圖像,體現(xiàn)了其推理生成能力。

此外,在生成“悉尼歌劇院在紐約中午時的場景”圖像時,MindOmni能夠考慮到悉尼和紐約的時差,并生成符合場景描述的圖像。

同時MindOmni在圖文多模態(tài)輸入場景下也表現(xiàn)出色。更多可視化結(jié)果請參考論文及附錄。

消融研究

為了驗證訓(xùn)練策略的有效性,研究人員進行了廣泛的消融實驗。

實驗結(jié)果表明,每個訓(xùn)練階段對模型的性能有重要貢獻。

例如,第一階段的預(yù)訓(xùn)練為模型提供了基本的生成能力;第二階段的監(jiān)督微調(diào)顯著提升了模型在WISE基準(zhǔn)測試中的表現(xiàn);而第三階段的RGPO算法則進一步優(yōu)化了模型的推理生成能力。

此外,消融實驗還驗證了不同連接器、KL系數(shù)、組數(shù)和獎勵策略對模型性能的影響。詳細結(jié)果請參考研究論文。

論文鏈接:

https://arxiv.org/pdf/2505.13031

代碼鏈接:
https://github.com/TencentARC/MindOmni

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-06-04 14:09:00

2025-11-06 09:03:00

2024-08-19 08:45:00

開源模型

2025-06-17 09:07:24

2025-08-05 09:02:00

2025-03-04 09:00:00

2025-02-10 08:30:00

2024-03-27 10:20:31

模型場景

2025-08-25 08:45:00

模型代碼開源

2025-01-26 11:00:00

2024-03-25 12:40:19

訓(xùn)練模型

2025-03-03 10:17:00

模型數(shù)據(jù)生成

2023-12-29 13:18:23

模型NeRFTICD

2023-05-17 10:05:56

2025-06-17 17:14:01

DeepSeekSOTA開源

2023-06-09 16:50:21

Tigerbo

2022-12-06 14:11:32

開源模型

2024-10-15 13:07:38

2015-12-15 15:07:06

2025-03-31 08:25:00

AI模型數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

懂色av噜噜一区二区三区av| 中文字幕一区二区三区乱码图片 | 3d玉蒲团在线观看| 国产精品白丝av| 欧美在线视频播放| 欧美成人另类视频| 国产午夜精品一区在线观看| 亚洲一区二区av电影| 免费在线国产精品| 国产精品女同一区二区| 亚洲国产黄色| www.欧美三级电影.com| 亚洲一区二区三区四区五区六区 | 色吊一区二区三区| 自拍视频一区二区三区| 三级小视频在线观看| 麻豆极品一区二区三区| 欧美精品激情视频| 91社区视频在线观看| 97一区二区国产好的精华液| 欧美性大战久久| 日本中文字幕在线视频观看 | 久久影院模特热| 国产精品一区二区入口九绯色| 欧美性aaa| 色综合久久久久综合| 九九久久九九久久| 成人h小游戏| 91在线视频18| 亚洲一区二区久久久久久| 国产综合精品视频| 伊人久久综合| 欧美成人午夜激情视频| 天堂av网手机版| 亚洲人成网站77777在线观看| 日韩一区国产二区欧美三区| 校园春色 亚洲色图| 松下纱荣子在线观看| 亚洲一区自拍偷拍| 亚洲小说欧美另类激情| аⅴ资源新版在线天堂| www国产亚洲精品久久麻豆| 97av影视网在线观看| 最近中文字幕免费观看| 另类天堂av| 97久久精品人搡人人玩| 久久久久久久久精| 亚洲一区色图| 麻豆国产va免费精品高清在线| 神马久久久久久久久久久| 亚洲va久久久噜噜噜久久| 亚洲福利视频免费观看| 国产一级二级av| 国产精品久久久久久av公交车| 欧美美女一区二区三区| 国产探花在线看| 日韩黄色三级在线观看| 欧美妇女性影城| 中文字幕在线观看日| 精品久久毛片| 4438x亚洲最大成人网| 中文字幕视频三区| 91精品国产自产观看在线 | 欧美激情精品久久久久久久变态 | 日韩视频一区| 国内精品久久久久影院优| 国产在线观看免费视频今夜| 欧美日韩mv| 欧美乱大交做爰xxxⅹ性3| 免费在线观看黄视频| 国产综合网站| 欧美在线激情网| 中文人妻av久久人妻18| 青青草成人在线观看| 成人a在线视频| 国产高清免费av| 成人免费毛片片v| 久久久久资源| h网站在线免费观看| 最新日韩av在线| 亚洲中文字幕无码一区二区三区| 国模私拍视频在线播放| 欧美天堂在线观看| av污在线观看| 欧美一区一区| 日韩高清欧美高清| 免费看的黄色网| 欧美国产三级| 琪琪第一精品导航| 国产精品成人无码| 国产精品66部| 欧美精品亚洲精品| 成人在线免费看片| 狠狠躁夜夜躁久久躁别揉| 99久久国产宗和精品1上映| 国产成人精品一区二区三区视频| 欧美一级夜夜爽| 欧美狂猛xxxxx乱大交3| 午夜精品毛片| 欧美重口另类videos人妖| 亚洲资源在线播放| 成人激情综合网站| 色一情一乱一伦一区二区三区丨| 青春草免费在线视频| 色噜噜久久综合| 国产精品久久久久野外| 国产精品一在线观看| 久久成人免费视频| 免费观看日批视频| 国产91丝袜在线18| 午夜一区二区三区| 日韩欧美一中文字暮专区| 欧美高清一级片在线| 新91视频在线观看| 亚洲午夜激情在线| 国产精品一久久香蕉国产线看观看| 日本黄视频在线观看| 自拍偷拍亚洲综合| 日韩av一二三四| 风间由美一区二区av101| 中文字幕精品久久| 欧美特黄aaaaaa| 成人在线视频一区| 亚洲第一综合网站| 精品国产美女a久久9999| 精品亚洲一区二区三区在线播放| 免费在线黄色片| 久久国产尿小便嘘嘘| 欧美精品欧美精品| 国产乱码精品一区二三赶尸艳谈| 日韩一级片在线播放| 黄色av免费播放| 久久午夜视频| 噜噜噜噜噜久久久久久91| 欧美人与牲禽动交com| 777午夜精品免费视频| 97人妻人人揉人人躁人人| 午夜一区二区三区不卡视频| 国产精品传媒毛片三区| 97超碰在线公开在线看免费| 欧美日韩精品一区二区三区蜜桃 | 亚洲综合无码一区二区| 欧洲在线免费视频| 久久亚洲影视| 国产精品视频成人| 成年人视频在线观看免费| 一本久道中文字幕精品亚洲嫩| v天堂中文在线| 亚洲精品综合| 精品中文字幕人| 深夜av在线| 亚洲精品一二区| 狠狠人妻久久久久久综合| 91毛片在线观看| 北条麻妃69av| 国产在线观看91一区二区三区| 日本午夜人人精品| 黄色大片在线免费观看| 色婷婷av一区二区三区大白胸 | 欧美劲爆第一页| 亚洲成人黄色片| 亚洲电影在线免费观看| caopor在线| 国产亚洲一区在线| 蜜桃久久影院| 91成人抖音| 久久精品视频中文字幕| 精品人妻一区二区三区蜜桃| 亚洲国产欧美一区二区三区丁香婷| 亚洲中文字幕无码一区| 亚洲男女自偷自拍| 日韩欧美亚洲在线| 免费视频观看成人| 欧美wwwxxxx| 天堂av2024| 在线免费观看日韩欧美| 男人晚上看的视频| 粉嫩av一区二区三区在线播放 | 美女免费视频一区| 一本二本三本亚洲码| 91精品国产自产精品男人的天堂 | 成人精品视频网站| 久久婷婷五月综合色国产香蕉| 国产一区二区三区四区二区| 国产欧美精品在线| 手机av在线播放| 日韩精品免费在线观看| 怡春院在线视频| 亚洲国产一区二区在线播放| av黄色免费网站| 国产最新精品精品你懂的| 成年人午夜视频在线观看| 波多野结衣在线观看一区二区三区| 成人女保姆的销魂服务| 国产伦理精品| 久久精品99国产精品酒店日本| 欧洲成人一区二区三区| 欧美日韩一区小说| 日韩精品一区二区在线播放 | 国产精品16p| 欧美激情一区二区| 国产精品扒开腿做爽爽爽a片唱戏| 日韩中文字幕区一区有砖一区| 热久久最新地址| 欧美久久综合网| 国产精品一区二区欧美黑人喷潮水| 88xx成人免费观看视频库| 欧美日韩国产二区| 91这里只有精品| 亚洲国产中文字幕久久网| 一区二区三区免费观看视频| 午夜精品福利一区二区三区av | 国产网站无遮挡| 国产一区二区中文字幕| 少妇高潮喷水久久久久久久久久| 围产精品久久久久久久| 欧美激情一区二区三区在线视频 | 九色porny自拍视频在线观看| 久久精彩免费视频| 粉嫩av在线播放| 日韩精品久久久久久福利| 精品久久久久久亚洲综合网站| 欧美在线短视频| 中文字幕国产在线观看| 亚洲va天堂va国产va久| 欧美一区免费观看| 中文字幕电影一区| 国产精品无码久久久久一区二区| 国产精品1区二区.| 色婷婷一区二区三区av免费看| 久久精品人人| 干日本少妇首页| 夜夜嗨一区二区| 无码av天堂一区二区三区| 欧美激情91| 国产一二三四五| 天天影视欧美综合在线观看| 午夜精品亚洲一区二区三区嫩草| 国产精品免费99久久久| 鲁片一区二区三区| 性人久久久久| 欧美xxxx黑人又粗又长精品| 欧美jizz19性欧美| 精品国产乱码久久久久久郑州公司 | 国产欧美久久久久久| 国产成人亚洲一区二区三区| 国产精品久久久一区| 日韩成人亚洲| 国产精品视频99| 高清在线一区| 91老司机精品视频| 精品国产乱码一区二区三区| 91美女福利视频高清| 国产激情一区| 亚洲综合精品伊人久久| 天堂av一区| 国产手机精品在线| 日韩欧美在线精品| 欧美一区1区三区3区公司| 国产一区二区三区91| 神马影院午夜我不卡影院| 欧美成人激情| 特级西西444| 99精品欧美| 成人亚洲视频在线观看| 老司机免费视频一区二区| 国产福利精品一区二区三区| 国产成人精品免费看| 污污免费在线观看| 久久综合久久久久88| 日本高清黄色片| 亚洲美女区一区| 国产又爽又黄的视频| 在线看日韩精品电影| 国产永久免费视频| 日韩精品一区二区三区蜜臀| 天天干,天天操,天天射| 亚洲新中文字幕| www国产在线观看| 91a在线视频| 国产69精品久久| 粉嫩av一区二区三区免费观看| 亚洲毛片免费看| 国产91av视频在线观看| 亚洲国产1区| 亚洲一区二区蜜桃| 国产一区二区三区不卡在线观看| 国产大学生视频| 亚洲国产经典视频| 国产在线一区视频| 在线免费观看一区| 黄色三级网站在线观看| 一区二区三区动漫| 香蕉成人app免费看片| 日本一区二区三区在线播放| 亚洲欧美在线人成swag| 好吊色欧美一区二区三区视频 | 色婷婷综合成人| cao在线视频| 成人国内精品久久久久一区| 欧美久久香蕉| 久久久久亚洲av无码专区喷水| 亚洲免费网站| 亚洲黄色小说在线观看| 亚洲国产高清不卡| 日韩在线视频免费播放| 欧美一级xxx| 色综合久久影院| 全亚洲最色的网站在线观看| 人人爱人人干婷婷丁香亚洲| 日韩免费电影一区二区| 在线精品观看| 91精品视频国产| 日本一区二区不卡视频| 日韩欧美不卡视频| 91精品国产入口| √天堂资源地址在线官网| 2019中文字幕在线免费观看| 日韩一区二区三区在线看| 亚洲午夜久久久影院伊人| 久久动漫亚洲| 免费成人深夜夜行p站| 亚洲一区二区偷拍精品| 国产chinasex对白videos麻豆| 中文字幕9999| free欧美| 欧美日韩一区二区三区免费| 亚洲福利电影| 理论片大全免费理伦片| 一区二区三区日韩欧美| 92久久精品一区二区| 中文字幕亚洲色图| 亚洲成人一区在线观看| 欧美日韩在线精品一区二区三区| 99精品热视频只有精品10| 看全色黄大色黄女片18| 一区二区三区资源| 国产麻豆精品一区| 久久精品视频播放| 国产精品亚洲一区二区在线观看| 一区二区免费电影| 九九**精品视频免费播放| 国产欧美小视频| 欧美三级电影精品| 91福利在线视频| 国产视频观看一区| 欧美aaaa视频| 91小视频在线播放| 最新国产精品久久精品| 国产精品爽爽久久久久久| 久久中国妇女中文字幕| 欧美三级一区| 蜜臀av无码一区二区三区| 99久久精品国产观看| 狠狠人妻久久久久久| 国产一区二区三区四区福利| 成人av色网站| 免费观看中文字幕| 国产精品18久久久久久vr| 国产一级免费观看| 亚洲精品福利在线| 日韩成人亚洲| 男人的天堂成人| 高潮精品一区videoshd| 日韩av片在线播放| 亚洲四色影视在线观看| 国产精品久久久久77777丨| 在线观看欧美一区| 国产成人av在线影院| 福利一区二区三区四区| 亚洲精品一二区| 国产亚洲精品久久久久久无几年桃| 久久视频在线| 99精品国产99久久久久久白柏| 欧美黑人又粗又大又爽免费| 国产精品丝袜91| 国产手机视频在线| 欧美激情视频在线免费观看 欧美视频免费一 | 中文在线一区二区| 99久久久久久久| 97视频在线观看亚洲| 国内精品久久久久久久影视简单| 天天色综合天天色| 亚洲精品视频一区| 天堂av中文在线资源库| 国产精品视频99| 狠狠久久婷婷| 免费观看a级片| 日韩欧美电影一区| 免费观看一级欧美片| 91手机视频在线| 97精品国产露脸对白| 少妇又紧又色又爽又刺激视频 | 极品魔鬼身材女神啪啪精品| 亚洲国产另类久久精品| 欧美日韩尤物久久| 欧美激情亚洲天堂| 国产欧美日韩激情| 国产成人手机在线| 国产日韩在线看片|