精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!

發(fā)布于 2024-5-28 11:49
瀏覽
0收藏

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

文章鏈接:https://arxiv.org/pdf/2405.11190

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

基于指令的圖像編輯專注于使生成模型能夠遵循人類書寫的編輯圖像指令。當(dāng)前的方法通常能夠理解明確且具體的指令。然而,它們往往在執(zhí)行所需的主動推理能力上表現(xiàn)不足,無法很好地理解隱含或定義不足的指令。為了增強(qiáng)主動推理能力并賦予編輯模型智能性,本文引入了ReasonPix2Pix,一個綜合性的推理注意指令編輯數(shù)據(jù)集。


該數(shù)據(jù)集的特點(diǎn)是:

  • 包含推理指令
  • 來自細(xì)粒度類別的更真實(shí)的圖像
  • 輸入和編輯圖像之間的更大差異


在監(jiān)督條件下使用該數(shù)據(jù)集進(jìn)行微調(diào)時,該模型在指令編輯任務(wù)中表現(xiàn)出優(yōu)越的性能,無論這些任務(wù)是否需要推理。

介紹

基于指令的圖像編輯旨在使生成模型具備遵循人類書寫的編輯圖像指令的能力,這對于促進(jìn)AI生成內(nèi)容(AIGC)系統(tǒng)理解人類意圖至關(guān)重要。


現(xiàn)有的基于指令的圖像編輯框架通常能夠理解明確且具體的指令,例如“將水果換成蛋糕”。不幸的是,這些模型在主動推理能力上表現(xiàn)不足,即理解指令的含義而不僅僅是從中提取詞語。如下圖2所示,一個典型的基于指令的圖像編輯框架InstructPix2Pix未能實(shí)現(xiàn)“她更喜歡口罩而不是太陽鏡”,卻給女人添加了太陽鏡,這是不合理的。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

同時,該模型缺乏理解給定圖像的能力。例如,對于一個簡單明確的指令“讓它變成50年后”,對于各種給定的圖像,編輯結(jié)果應(yīng)該是不同的。但是在下圖3中,以前的方法只是簡單地將人變老,甚至未能編輯圖像,這是完全不正確的。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

另一方面,這些方法也缺乏理解隱含或定義不足的指令的能力。這需要人工干預(yù),將隱含指令變?yōu)槊鞔_指令,或?qū)⒅噶罘纸鉃槎鄠€明確、具體的指令,以符合這些模型的能力。

例如,指令“讓房間整潔”需要手動分解為各種步驟,如“將散落的衣物整齊折疊”,“移除地上的垃圾”,以及“整理床單”等。同樣,隱含指令“她是這場表演的明星”需要人為干預(yù),將其明確為“在圖像中添加一些閃光和聚光燈效果”。因此,增強(qiáng)自我推理能力不僅對用戶更友好,而且是下一代智能AIGC系統(tǒng)發(fā)展的關(guān)鍵。


借助多模態(tài)大模型(MLLM)的生成模型在推理感知指令編輯方面的潛力是巨大的。然而,現(xiàn)有的用于指令編輯的數(shù)據(jù)集未能充分發(fā)揮和利用模型的內(nèi)在推理能力。


因此,本文研究者們開發(fā)了一個綜合性的推理注意指令編輯數(shù)據(jù)集ReasonPix2Pix,該數(shù)據(jù)集包含圖像對及其相應(yīng)的推理指令。ReasonPix2Pix的特點(diǎn)包括:


  • 隱含指令以進(jìn)一步增強(qiáng)模型的推理能力
  • 來自細(xì)粒度類別的大量真實(shí)圖像
  • 輸入圖像和編輯后圖像之間在幾何層面上的顯著差異。


在下表1中與之前的數(shù)據(jù)集進(jìn)行了比較。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

此外,將多模態(tài)大模型(MLLM)引入圖像編輯模型,并在數(shù)據(jù)集上進(jìn)行微調(diào),從而增強(qiáng)圖像編輯的推理能力,并顯著提升指令編輯的質(zhì)量。


貢獻(xiàn)可以總結(jié)如下:

  • 提出了基于指令推理的圖像編輯任務(wù),這是一項(xiàng)有趣的任務(wù),旨在增強(qiáng)模型理解人類意圖的智能。
  • 開發(fā)了一個綜合性的推理注意指令編輯數(shù)據(jù)集ReasonPix2Pix,該數(shù)據(jù)集包含圖像對及其相應(yīng)的推理指令。
  • 在數(shù)據(jù)集上微調(diào)了一個簡單的框架。即使在沒有繁雜操作的情況下,該模型不僅在不需要推理的指令編輯任務(wù)中表現(xiàn)出色,而且在需要推理的任務(wù)中也表現(xiàn)良好。

相關(guān)工作

圖像編輯 圖像編輯是一個基礎(chǔ)的計(jì)算機(jī)視覺任務(wù),也可以看作是圖像到圖像的轉(zhuǎn)換。在生成對抗網(wǎng)絡(luò)(GAN)提出后,許多工作[13, 14, 19, 29, 35]被發(fā)明來解決這一任務(wù)。一類方法[1–3, 7, 10, 41, 50]將原始圖像插入潛在空間,然后進(jìn)行操作。這些方法被證明在轉(zhuǎn)換圖像風(fēng)格、添加和移動圖像中的對象方面是有效的。


最近,隨著多模態(tài)學(xué)習(xí)的爆炸性發(fā)展,文本信息可以通過諸如CLIP之類的模型嵌入,然后作為圖像編輯的指導(dǎo)。這些方法使模型能夠根據(jù)給定的文本編輯圖像。


擴(kuò)散模型 擴(kuò)散模型是最受歡迎的生成模型之一,在圖像合成方面表現(xiàn)出色。通過擴(kuò)散過程學(xué)習(xí)給定數(shù)據(jù)集的概率分布。最近,文本到圖像的擴(kuò)散模型,如Stable Diffusion,在將文本轉(zhuǎn)換為高質(zhì)量圖像方面取得了巨大成功。


圖像編輯的擴(kuò)散模型一些擴(kuò)散模型天生具備編輯圖像的能力。然而,在實(shí)際應(yīng)用中,這些模型顯示出穩(wěn)定性較差的問題(即在給定類似文本時生成類似的圖像)。通過Prompt-to-Prompt在模型上施加約束,這個問題得到了緩解。與以往處理生成圖像的方法不同,SDEdit通過加噪和去噪過程編輯真實(shí)圖像。


圖像修復(fù)可以看作是更精細(xì)的圖像編輯。它通過從一小組訓(xùn)練樣本中學(xué)習(xí),將文本輸入和用戶繪制的masks轉(zhuǎn)換為特定類別或風(fēng)格的圖像。InstructPix2Pix簡化了生成過程,僅需要一個輸入圖像和一個指令來編輯圖像,而不需要任何訓(xùn)練。它提出了一個大規(guī)模數(shù)據(jù)集,包含配對的圖像和相應(yīng)的指令。然而,它僅包含簡單明了的指令,限制了其在復(fù)雜的現(xiàn)實(shí)場景中的應(yīng)用。因此,本文構(gòu)建了一個指令推理數(shù)據(jù)集,以改善圖像編輯。


多模態(tài)大語言模型隨著大語言模型(LLM)的快速發(fā)展,它們被擴(kuò)展到更多的模態(tài)(如視覺),形成多模態(tài)大語言模型。BLIP-2和mPLUG-OWL引入了視覺編碼器來嵌入圖像,然后將它們與文本embeddings結(jié)合起來。Instruct-tuning被廣泛采用,將LLM的能力轉(zhuǎn)移到視覺領(lǐng)域。另一類工作使用提示工程,犧牲了端到端訓(xùn)練。多模態(tài)大語言模型在視覺任務(wù)中的應(yīng)用被證明在基于視覺的任務(wù)和目標(biāo)檢測方面是有效的。

方法

本文的目標(biāo)是根據(jù)人類指令進(jìn)行圖像編輯,特別強(qiáng)調(diào)推理指令。給定一個輸入圖像和一個人類指令,模型旨在理解人類的顯性或隱性意圖,并隨后生成與提供的指令一致的輸出圖像。為了實(shí)現(xiàn)這一目標(biāo),本文引入了ReasonPix2Pix,一個專門針對基于指令的圖像編輯并關(guān)注推理能力的數(shù)據(jù)集。以該數(shù)據(jù)集為基礎(chǔ)訓(xùn)練數(shù)據(jù),微調(diào)了一個包含多模態(tài)大語言模型與擴(kuò)散模型的簡單框架。

預(yù)備知識

InstructPix2Pix數(shù)據(jù)集 InstructPix2Pix生成了一個重要的大規(guī)模配對數(shù)據(jù)集,以實(shí)現(xiàn)基于指令的圖像編輯。具體地,如下圖4所示

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

它包含:

  • 輸入圖像t和輸入標(biāo)題
  • 編輯后的圖像和編輯后的標(biāo)題
  • 文本指令。

V3Det數(shù)據(jù)集 V3Det是一個龐大的檢測數(shù)據(jù)集,包含13,204個類別,超過240,000張圖像。圖像看起來真實(shí)且復(fù)雜,開發(fā)了一個更通用的視覺感知系統(tǒng)。

ReasonPix2Pix

為了將推理能力注入圖像編輯模型,研究者們構(gòu)建了一個綜合性的推理注意指令編輯數(shù)據(jù)集。根據(jù)生成過程,生成數(shù)據(jù)集可以分為三個部分。如表2所示:

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

  • Part I:使用InstructPix2Pix中的原始圖像對,并生成指令以實(shí)現(xiàn)指令推理。
  • Part II:從InstructPix2Pix的輸入圖像開始,生成自己的編輯圖像和指令。
  • Part III:從V3Det中獲取更真實(shí)的圖像,生成編輯后的圖像和指令。

?

數(shù)據(jù)過濾盡管在基于指令的圖像編輯中取得了巨大成功,InstructPix2Pix模型仍存在各種失敗案例。一個典型的失敗案例是模型傾向于輸出原始圖像,即不進(jìn)行任何編輯。深入研究數(shù)據(jù)集,發(fā)現(xiàn)部分編輯后的圖像與輸入圖像非常相似。因此,需要首先過濾這部分?jǐn)?shù)據(jù),通過以下方法區(qū)分它們:

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

如下圖5所示,將InstructPix2Pix數(shù)據(jù)集中的輸入標(biāo)題、編輯標(biāo)題和原始指令輸入GPT-3.5,并要求GPT-3.5生成候選指令。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

然后,再次要求GPT-3.5從中區(qū)分出最佳指令。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

Part II & III:圖像編輯和推理指令生成為了進(jìn)一步提高模型的能力,研究者們擴(kuò)展了數(shù)據(jù)集,加入了其他兩部分?jǐn)?shù)據(jù)。這些數(shù)據(jù)不僅增強(qiáng)了模型的推理能力,還旨在提升模型處理更真實(shí)的細(xì)粒度類別圖像和輸入與編輯圖像之間更大差異的能力。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

標(biāo)題傳遞給Spacy模型S,這是一個先進(jìn)的自然語言處理(NLP)模型,用于識別句子中的實(shí)體。在這里利用它來提取候選類別。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

Spacy模型提取了i個候選類別。例如,在上面圖6中,Spacy提取了i = 2個類別,即蝴蝶和花朵。


通過這些類別,可以使用Grounding DINO在圖像中定位相應(yīng)的物體。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

然后將標(biāo)題和候選類別注入到GPT-3.5中。在這里,設(shè)計(jì)了另一個提示,要求GPT-3.5輸出

  1. 一個被選中的類別
  2. 需要用其替換的目標(biāo)類別
  3. 推理指令。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

在這里展示了數(shù)據(jù)集的一些樣本。從下圖7可以看出,數(shù)據(jù)集具有復(fù)雜的推理指令(例如,“一家公司計(jì)劃在清潔能源上開展新項(xiàng)目”),輸入和編輯圖像之間的變化更多,特別是在幾何水平上,而且圖像更加真實(shí)。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

數(shù)據(jù)集利用

利用廣泛模型來增強(qiáng)編輯模型的主動推理能力。具體來說,設(shè)計(jì)了一個簡單的框架,將一個多模態(tài)大語言模型(MLLM)整合到擴(kuò)散模型中,如下圖8所示。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

與以往僅通過文本理解人類意圖的方法不同,MLLM通過結(jié)合指令和輸入圖像來增強(qiáng)理解能力。形式上,具有人類意圖的指令特征h可以被公式化為

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

其中,F(xiàn)是MLLM。h是F的輸出,包含了我們指令的多模態(tài)理解。


然后,可以無縫地將h注入到編輯模型中。圖像生成模型可以在h的監(jiān)督下編輯輸入圖像。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

考慮到LLM中的大量參數(shù),在對模型進(jìn)行微調(diào)時將其固定。利用ReasonPix2Pix數(shù)據(jù)集,模型進(jìn)行端到端的微調(diào)。

實(shí)驗(yàn)

實(shí)施細(xì)節(jié)

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

利用V3Det的測試數(shù)據(jù)構(gòu)建了一個基準(zhǔn)測試集,具體流程見前面圖6,共有1000張圖像。同時,記錄了所選類別和目標(biāo)新類別,因此可以通過多種模板制定簡單的指令,例如“將A轉(zhuǎn)換為B”。


因此,測試數(shù)據(jù)包括輸入圖像及其標(biāo)題、真實(shí)編輯后的圖像及其標(biāo)題,以及直觀指令和推理指令。分別在這些數(shù)據(jù)上評估了ReasonPix2Pix以及之前的方法。

定性結(jié)果

圖像質(zhì)量 這里將本文的方法與之前的方法在簡單指令下的表現(xiàn)進(jìn)行了比較。如下圖9所示,InstructPix2Pix未能將圖像中的刺猬變成兔子。而ReasonPix2Pix能夠轉(zhuǎn)換這些復(fù)雜的類別,生成更生動的結(jié)果。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

推理能力 為了比較推理能力,首先我們從相對簡單的指令開始。如下圖10所示,當(dāng)指令是“去除顏色”時。之前的方法在一定程度上能夠理解指令,但生成的結(jié)果不準(zhǔn)確。

InstructPix2Pix遵循指令將圖像轉(zhuǎn)換為黑白,但也移除了背景。相反,ReasonPix2Pix理解了指令并給出了充分的結(jié)果。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

然后我們轉(zhuǎn)移到更復(fù)雜的指令。如下圖11所示,對于間接指令“他有一個正式會議要參加”,之前的InstructPix2Pix無法處理,輸出了原始圖像而沒有進(jìn)行任何編輯。ReasonPix2Pix能夠理解指令,并讓他穿著正式服裝參加會議。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

定量結(jié)果

除了上述的定性結(jié)果之外,還將定量指標(biāo)與之前的方法進(jìn)行了比較,如下表3所示,分別使用直接指令和推理指令。我們報(bào)告了生成圖像與真實(shí)圖像之間的L1和L2距離,以及它們的CLIP和DINO嵌入之間的余弦距離。此外,還報(bào)告了CLIP-T,即目標(biāo)標(biāo)題的CLIP特征與生成圖像之間的余弦相似度。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

在傳統(tǒng)的直接指令下,ReasonPix2Pix在之前的方法中取得了競爭性的表現(xiàn),證明了生成的圖像的質(zhì)量。當(dāng)涉及需要理解的推理指令時,之前的方法表現(xiàn)下降,但ReasonPix2Pix的結(jié)果遠(yuǎn)遠(yuǎn)高于其他方法。


同時,研究者們還進(jìn)行了用戶研究,以比較ReasonPix2Pix與之前的方法。分別隨機(jī)抽取了由不同模型生成的100個樣本,并請5名工作者對它們進(jìn)行評估(每人20個)。工作者被要求在4個候選項(xiàng)中選擇最佳圖像。從下表4中可以看出,在直接指令下,ReasonPix2Pix略優(yōu)于之前的方法。當(dāng)指令變?yōu)橥评碇噶顣r,ReasonPix2Pix與之前的方法之間的差距變得更大。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

分析

定性結(jié)果評估了數(shù)據(jù)集的三個部分的有效性。下圖12展示了當(dāng)僅使用Part I、Part I和Part II、以及整個數(shù)據(jù)集進(jìn)行訓(xùn)練時的結(jié)果。可以觀察到,當(dāng)面對需要推理的指令時,之前的方法如InstructPix2Pix往往會編輯為空或產(chǎn)生不合理的編輯結(jié)果。使用Part I數(shù)據(jù)時,模型似乎理解了指令,但仍然很難提供編輯后的圖像。這與本文提出的觀點(diǎn)一致,即僅使用InstructPix2Pix數(shù)據(jù)集中的圖像時,模型的編輯能力仍然有限。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

另一方面,當(dāng)逐步引入Part II和Part III數(shù)據(jù)時,編輯結(jié)果變得越來越好。有了數(shù)據(jù)集中的所有數(shù)據(jù),模型能夠理解指令并產(chǎn)生相應(yīng)的結(jié)果。


在我們的簡單框架中,將多模態(tài)大語言模型集成到圖像編輯模型中,它自然具有推理能力。在這里,比較了InstructPix2Pix的結(jié)果,添加了未經(jīng)微調(diào)的MLLM,以及在ReasonPix2Pix上進(jìn)行了微調(diào)的我們的模型。下圖13顯示,未經(jīng)微調(diào)時,圖像編輯模型很難接受MLLM的輸出。當(dāng)在我們的數(shù)據(jù)集上進(jìn)行微調(diào)時,模型能夠理解和編輯。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

定量結(jié)果在下圖15a中,比較了定量結(jié)果。當(dāng)添加Part I、II和III數(shù)據(jù)時,CLIP-I上升。因此,數(shù)據(jù)集的三個部分都是必不可少的。同時,如下圖15b所示,MLLM帶來了輕微的改進(jìn),而數(shù)據(jù)集顯然提升了模型的性能。定量結(jié)果與定性結(jié)果一致。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

綜合理解最后,讓我們回到前面的案例,“使其晚50年”。以前的方法無法處理一些情況,例如水果。同時,理解指令不是一個單一模態(tài)的問題,一個男人的雕像在50年后不會變成老人。通過我們的框架和數(shù)據(jù)集,模型考慮了圖像和指令。因此,它根據(jù)不同的輸入提供了合理的結(jié)果。50年后,一個年輕美麗的女人變成了一個老女人,蘋果變成了腐爛的,雕像變成了一個帶著塵土的破碎的雕像。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)

限制

由于 API 成本的限制,數(shù)據(jù)集大小仍然有限。本文已經(jīng)制定了一個清晰的數(shù)據(jù)生成流程。如果需要,研究人員可以將數(shù)據(jù)集擴(kuò)展到超過 400,000 個樣本。

結(jié)論

本文旨在增強(qiáng)編輯模型的推理能力,使其更加智能化。具體地,引入了 ReasonPix2Pix,一個專門用于注入推理能力到圖像編輯中的推理指令編輯數(shù)據(jù)集。在提出的數(shù)據(jù)集上微調(diào)了一個簡單的框架。廣泛的實(shí)驗(yàn)結(jié)果證明,ReasonPix2Pix在不管指令是否需要推理的情況下都取得了競爭性的結(jié)果。

林達(dá)華團(tuán)隊(duì)最新發(fā)布ReasonPix2Pix:讓基于指令的高級圖像編輯效果飛升!-AI.x社區(qū)


本文轉(zhuǎn)自 AI生成未來 ,作者:Ying Jin等


原文鏈接:??https://mp.weixin.qq.com/s/kf3cRjJDxukpG_xH0IvRdg??

標(biāo)簽
已于2024-5-28 11:49:36修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
国产一区二区在线视频聊天 | 不卡一区中文字幕| 午夜欧美不卡精品aaaaa| 噜噜噜在线视频| 国产美女久久| 黄色一区二区在线| 一区二区三区久久网| 亚洲成人精品女人久久久| 午夜亚洲影视| 欧美成人激情视频免费观看| 日韩人妻一区二区三区| 免费看一区二区三区| 欧美日韩一区二区三区| 法国空姐在线观看免费| 日韩一区av| 国产福利一区二区三区视频| 国产精品v片在线观看不卡| 欧美成欧美va| 色135综合网| 国产视频精品xxxx| 国产sm在线观看| 国产亚洲人成a在线v网站 | 久久精品视频中文字幕| a视频免费观看| 日本免费一区二区三区视频| 欧美日韩在线免费视频| 国产中文字幕免费观看| 污片在线免费观看| 国产精品毛片无遮挡高清| 久久青青草综合| 性做久久久久久久| 国内成+人亚洲+欧美+综合在线| 国产99久久久欧美黑人| 日韩成年人视频| 激情久久久久| 久久99久久99精品中文字幕| 韩国一级黄色录像| 日韩黄色大片| 国产亚洲欧美日韩精品| 无码人妻精品一区二区三应用大全| 视频在线亚洲| 日韩欧美综合在线| 一区二区久久精品| 一区二区三区日本视频| 9191久久久久久久久久久| 一区二区在线免费看| 992tv国产精品成人影院| 色偷偷久久人人79超碰人人澡| 日本十八禁视频无遮挡| 第一中文字幕在线| 亚洲午夜精品17c| 日本wwwcom| 激情图片在线观看高清国产| 伊人性伊人情综合网| 4444在线观看| 午夜激情在线| 亚洲成人第一页| 国内精品在线观看视频| 理论不卡电影大全神| 丁香五六月婷婷久久激情| 热99这里只有精品| 久久uomeier| 欧美午夜精品理论片a级按摩| 乌克兰美女av| 免费看日产一区二区三区| 日韩免费高清视频| 亚洲av永久无码精品| 亚洲第一论坛sis| 国产亚洲一区二区在线| 欧美性猛交xxxx乱大交少妇| 午夜精品一区二区三区国产 | 精品亚洲一区二区三区在线观看| 免费成人蒂法网站| 国产乱码精品一区二区亚洲 | xxxcom在线观看| 欧美色视频日本高清在线观看| 已婚少妇美妙人妻系列| 青青久久精品| 精品电影一区二区| 精品少妇人妻一区二区黑料社区| 欧美亚洲国产激情| 久久成年人视频| 精品91久久久| 美女网站在线免费欧美精品| 亚洲综合在线做性| 无码国产精品一区二区免费16| 久久久亚洲精品石原莉奈| 亚洲不卡1区| 黄色网在线播放| 午夜国产精品一区| 日本中文字幕二区| 极品国产人妖chinesets亚洲人妖 激情亚洲另类图片区小说区 | 91国产精品视频在线| 中文字幕69页| 国产精品一区二区x88av| 精品无人区一区二区三区| 91xxx在线观看| 亚洲成a人v欧美综合天堂下载| 日日碰狠狠躁久久躁婷婷| 国产一区二区在线观| 日韩www在线| 日韩一级片大全| 巨乳诱惑日韩免费av| 91在线免费视频| 国产一区二区三区不卡在线| 一区二区三区在线高清| 日本www.色| 久久香蕉网站| 欧美大奶子在线| 最近中文字幕在线观看视频| 成人三级伦理片| 一区二区三视频| 国产日韩电影| 亚洲国产第一页| 国产日韩精品中文字无码| 在线综合欧美| 官网99热精品| www免费视频观看在线| 91国产免费观看| 国产精品成人99一区无码| 97精品97| 国产精品日韩在线一区| 日本成人一区二区三区| 亚洲高清一区二区三区| 欧美国产在线一区| 欧美大片aaaa| 国产精品都在这里| 青青色在线视频| 婷婷综合在线观看| 捆绑凌虐一区二区三区| 国产精品vip| 成人精品视频99在线观看免费 | 欧美精品一本久久男人的天堂| 日韩欧美国产另类| 2020国产成人综合网| 成人毛片一区二区| 青青一区二区| 8x海外华人永久免费日韩内陆视频| 国内老熟妇对白hdxxxx| 国产精品高清亚洲| 五月天婷婷影视| 香蕉精品视频在线观看| 成人情趣片在线观看免费| 日本视频在线播放| 在线播放中文字幕一区| av黄色免费在线观看| 美女在线观看视频一区二区| 亚洲欧美精品在线观看| 日韩三区四区| 美乳少妇欧美精品| 国产av无码专区亚洲av| 一区二区三区欧美久久| 被黑人猛躁10次高潮视频| 在线成人激情| 国产福利久久精品| 麻豆视频在线观看免费网站黄| 亚洲成人av片在线观看| 日韩不卡在线播放| 国产日产欧产精品推荐色| 91激情视频在线| 色135综合网| 91久久国产综合久久蜜月精品| 欧美人与性动交α欧美精品济南到| 精品蜜桃在线看| 亚洲熟女综合色一区二区三区| 久久中文字幕电影| 91福利免费观看| 欧美久久视频| 裸模一区二区三区免费| 国模视频一区| 久久久久北条麻妃免费看| 亚洲精品成av人片天堂无码 | 国产欧美日韩视频一区二区 | 9i在线看片成人免费| 无码人妻丰满熟妇区毛片| 亚洲理论电影片| 国产一区红桃视频| 懂色av一区| 在线亚洲欧美视频| 亚洲老妇色熟女老太| 狠狠色狠色综合曰曰| 任我爽在线视频| 成人动漫一区二区三区| 午夜免费福利在线| 亚洲私人影院| 午夜老司机精品| 91在线一区| 国产精品一区二区三区成人| 2024短剧网剧在线观看| 亚洲人成免费电影| 国产成人三级在线播放| 色综合久久综合网欧美综合网| 欧美风情第一页| 91在线一区二区| 交换做爰国语对白| 久久国产毛片| 久久久久久av无码免费网站下载| 久久av中文| http;//www.99re视频| 你懂得影院夜精品a| 欧美激情伊人电影| 欧美猛烈性xbxbxbxb| 日韩精品久久久久| 国产精品久久免费| 色丁香久综合在线久综合在线观看| 一级黄色录像视频| 国产欧美一区二区精品婷婷| 国产免费一区二区三区最新6| 男女性色大片免费观看一区二区 | 日韩精品免费观看视频| 欧美精品999| 99福利在线| 最新的欧美黄色| 日韩美女一级视频| 精品国产一区二区精华| 在线视频 91| 色偷偷一区二区三区| 国产成人在线播放视频| 亚洲精品视频一区二区| 国产视频不卡在线| 久久久亚洲精品石原莉奈| 中文视频在线观看| 成人妖精视频yjsp地址| 亚洲欧美激情一区二区三区| 精品一区二区三区免费观看| 男女无套免费视频网站动漫| 国产精品日本欧美一区二区三区| 国产成人亚洲综合无码| 欧美在线精品一区| 男插女免费视频| 欧美gayvideo| 一个色的综合| 色婷婷亚洲mv天堂mv在影片| 日韩国产一区久久| 欧美猛男男男激情videos| 欧美高清性xxxxhdvideosex| 日韩美女毛片| 久久精品美女| 天天躁日日躁狠狠躁欧美| 久久国产精品久久精品国产| 欧美天堂影院| 久久久久久99| 狠狠操综合网| 一本一本a久久| 亚洲成av人电影| 男女h黄动漫啪啪无遮挡软件| 欧美残忍xxxx极端| 日本a级片在线观看| 亚洲激情久久| 丁香色欲久久久久久综合网| 狠久久av成人天堂| 成年人午夜免费视频| 免费看黄裸体一级大秀欧美| 91九色在线观看视频| 国产精品一二| 国产精品人人妻人人爽人人牛| 丝袜脚交一区二区| www.精品在线| 国产精品一区二区视频| 佐佐木明希电影| 91在线观看地址| 99久久久无码国产精品衣服| 国产精品乱码妇女bbbb| 久久免费看少妇高潮v片特黄| 亚洲精品乱码久久久久久| 日本中文字幕免费观看| 欧美日韩亚洲一区二| 中文字幕无码乱码人妻日韩精品| 欧美亚洲国产一卡| 精品人妻无码一区二区| 亚洲国产精品久久久久| 国产福利片在线| 欧美放荡办公室videos4k| 91精品产国品一二三产区| 国产精品嫩草影院久久久| 精品国产亚洲一区二区三区大结局| 鬼打鬼之黄金道士1992林正英| 免费视频国产一区| 在线观看国产一区| 亚洲麻豆一区| 久久国产精品国产精品| 成人免费观看男女羞羞视频| 国产成人无码精品久久二区三| 亚洲视频 欧洲视频| 国产成人精品片| 欧美精品亚洲二区| 午夜在线视频免费| 久久精品国产69国产精品亚洲| 草美女在线观看| 国产精品一区二区三区在线播放 | 国产99久久久久| 欧美另类z0zx974| 亚洲一区自拍偷拍| 中文字幕人妻精品一区| 亚洲成色777777在线观看影院| p色视频免费在线观看| 久久久久久久久久av| 国产精品成人国产| 麻豆av一区| 欧美日韩亚洲一区在线观看| 中文字幕有码在线观看| 欧美高清视频一二三区| 天堂av一区二区三区| 中文字幕av日韩| 黄色视屏在线免费观看| 91久久久久久久一区二区| 亚洲黄色录像| 国产青草视频在线观看| 美女在线观看视频一区二区| 97人妻天天摸天天爽天天| 亚洲美女少妇撒尿| 国产亚洲久一区二区| 日韩高清免费观看| 在线播放蜜桃麻豆| 成人免费看黄网站| 欧美理论电影大全| 欧美 日韩 国产在线观看| 国产激情视频一区二区在线观看| 国产18无套直看片| 一本久道中文字幕精品亚洲嫩| 后入内射欧美99二区视频| 久久精品视频中文字幕| 久久久国产精品网站| 欧美日韩在线高清| 99日韩精品| 先锋资源av在线| 一区二区成人在线视频| 精品人妻伦一区二区三区久久| 日韩在线资源网| 狠狠久久综合| 亚洲国内在线| 麻豆中文一区二区| 日本黄色激情视频| 欧美日韩精品一二三区| 午夜激情视频在线观看| 国产精品亚洲视频在线观看| 精品一区av| 亚洲最大成人在线观看| 国产三级精品视频| 免费黄色一级大片| 国产一区二区三区网站| 欧美色网在线| 日韩精品一区二区三区色偷偷| 葵司免费一区二区三区四区五区| 久久精品综合视频| 色噜噜夜夜夜综合网| 成人在线视频成人| 国产精品视频播放| 99久久九九| 亚洲国产午夜精品| 亚洲一区二区在线播放相泽| 亚洲第一大网站| 午夜精品三级视频福利| 亚洲精品小区久久久久久| 欧美一级黄色片视频| 欧美极品美女视频| 国产尤物视频在线观看| 另类色图亚洲色图| 91精品日本| 久久无码高潮喷水| 日本一区二区免费在线| 国产精品羞羞答答在线| 欧美激情一区二区三区成人| 色天下一区二区三区| 在线观看av日韩| 亚洲免费伊人电影| 日韩一卡二卡在线| 国产精品久久久精品| 亚洲激情中文在线| 国产真实乱人偷精品| 欧美影院一区二区三区| 日本在线免费网| 国产精品裸体一区二区三区| 亚洲女同同性videoxma| 少妇一级黄色片| 欧美刺激午夜性久久久久久久| 九色porny视频在线观看| 日本中文不卡| 国产精品综合在线视频| 日韩久久中文字幕| 精品国产一区二区三区久久久| av成人资源| 九九视频精品在线观看| 亚洲精品高清在线观看| 日本成人一区二区三区| 91久久久在线| 麻豆精品网站| 午夜精品福利在线视频| 精品伊人久久97| 久久国产精品美女| 精品www久久久久奶水| 1024成人网| 看电影就来5566av视频在线播放| 91久久国产精品| 久久久久网站| 国产稀缺真实呦乱在线| 日韩有码视频在线| 久久99久久人婷婷精品综合| 国产av一区二区三区传媒| 欧美日韩在线免费视频|