精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成! 精華

發布于 2024-7-31 10:02
瀏覽
0收藏

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

文章鏈接:https://arxiv.org/pdf/2407.08683
github鏈接:https://github.com/TencentARC/SEED-Story

亮點直擊

  • SEED-Story,一種利用多模態大語言模型(MLLM)生成具有豐富敘述性文本和上下文相關圖像的多模態故事的新方法。
  • 提出了多模態注意力匯聚機制,以高效生成長度大于訓練時使用的序列長度的長故事。
  • 引入了StoryStream,這是一個專門為訓練和基準測試多模態故事生成而設計的大規模數據集。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

隨著圖像生成和開放形式文本生成的顯著進步,生成交織圖像-文本內容的領域變得越來越引人入勝。多模態故事生成,即生成敘述性文本和生動圖像交織在一起的內容,已成為一個具有廣泛應用的寶貴且實用的任務。然而,這一任務帶來了重大挑戰,因為它需要理解文本和圖像之間復雜的相互作用,并具備生成長序列連貫、上下文相關的文本和視覺效果的能力。


本文提出了SEED-Story,一種利用多模態大語言模型(MLLM)的新方法來生成擴展的多模態故事。本文的模型建立在MLLM強大的理解能力之上,預測文本tokens和視覺tokens,后者隨后通過改編的視覺去分詞器處理,以生成具有一致角色和風格的圖像。進一步提出多模態注意力匯聚機制,以在高度高效的自回歸方式下生成最多25個序列(訓練時僅10個序列)的故事。此外,本文還提出了一個名為StoryStream的大規模高分辨率數據集,用于訓練本文的模型并在各個方面定量評估多模態故事生成任務。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

方法

使用多模態大語言模型進行故事生成

視覺Tokenization和De-tokenization 本文的方法概述如下圖2所示。為了有效擴展視覺故事,本文的模型必須理解并生成圖像和文本。借鑒最近在統一圖像理解和生成的生成性多模態大語言模型(MLLM)方面的進展,研究者們開發了一種多模態故事生成模型。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

本文的模型使用預訓練的Vision Transformer(ViT)作為視覺分詞器,并使用預訓練的擴散模型作為視覺去分詞器,通過使用ViT的特征作為輸入來解碼圖像。具體而言,來自ViT分詞器的視覺embeddings被輸入到一個可學習模塊中,然后作為預訓練的SD-XL的U-Net的輸入。這個過程用視覺embeddings替代了原始的文本特征。在這一階段,參數使用開放世界的文本-圖像對數據以及故事數據進行優化,以增強模型的編碼-解碼能力。在這一訓練階段之后,期望視覺分詞器和去分詞器模塊能夠在特征空間中盡可能多地保留圖像信息。


故事指令調優 在故事生成指令調優過程中,每次迭代隨機抽取一個故事數據點的隨機長度子集。模型的任務是預測故事文本的下一張圖片和下一句句子。在MLLM中,所有圖像都使用預訓練的ViT分詞器轉換為圖像特征。對于目標文本tokens,進行下一個token預測,并使用交叉熵損失來訓練這個離散目標。對于目標圖像特征,模型使用一系列可學習的查詢作為輸入,并連續輸出一系列潛在embeddings。然后,計算MLLM輸出與目標圖像特征之間的余弦相似度損失。在這一階段,使用LoRA模塊微調SEED-Story模型。


去分詞器適應 在指令調優之后,SEED-Story MLLM有效地生成了語義正確的故事圖像,但缺乏風格一致性和細節。將這個問題歸因于MLLM輸出的潛在空間與圖像特征之間的不對齊。為了解決這個問題,對去分詞器進行了風格和紋理對齊的適應。在這個階段,僅訓練SD-XL圖像去分詞器。在MLLM輸出embeddings的條件下,期望SD-XL生成與真實圖像在像素級別對齊的圖像。去分詞器的單獨訓練有兩個主要優勢。首先,它避免了LLM與去分詞器之間的優化沖突。其次,它節省了內存,使得這一過程可以在內存有限的GPU上執行。

使用多模態注意力匯聚生成長故事

生成長篇視覺故事在教育和娛樂等各種應用中具有巨大的潛力。然而,用多模態大語言模型(MLLM)創建這些故事面臨重大挑戰。延長、交織故事的數據集不僅稀缺,而且由于其復雜性會阻礙訓練過程。為了解決這個問題,采用了“短期訓練,長期測試”的方法,在較短的敘事上訓練模型,并在推理過程中擴展到較長的生成。


此外,在推理過程中,生成比訓練數據顯著更長的故事常常導致模型退化,產生質量較低的圖像,如下圖10第一行所示。這個過程還需要大量的tokens使用來確保連續性和連貫性,這反過來增加了內存和計算需求。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

一個簡單的解決方案是使用滑動窗口技術,如下圖3右(b)所示。然而,這種方法會破壞Key-Value(KV)緩存中的tokens關系,導致生成結果不理想,如StreamingLLM所示。為了克服這一問題,StreamingLLM引入了一種注意力匯聚機制,可以保留初始tokens,從而在不損害質量的情況下高效處理長生成。雖然這種方法在語言模型中有效,但在多模態上下文中的效果減弱,如圖3右(c)所示。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

為了增強多模態長生成,重新審視了MLLM的注意力圖。在對各種模型和案例進行了大量實驗后,分析了不同層和頭部的注意力圖。分析表明,大多數查詢主要集中在四種類型的tokens上:

  • 起始tokens
  • 標點符號tokens
  • 圖像開始(BoI)tokens
  • 圖像結束(EoI)tokens

與僅限語言的模型不同,MLLM對特定的圖像tokens,尤其是BoI和EoI附近的圖像tokens給予了大量關注,如上圖3左所示。


基于這些見解,本文提出了一種新的MLLM擴展生成機制,稱為多模態注意力匯聚。在生成過程中,始終保留起始tokens和BoI及EoI相鄰的圖像tokens。盡管標點符號tokens接收到高關注值,但它們的潛在值規范最小,對最終輸出貢獻不大,因此不保留它們,如[13]所指出。本文提出的機制使本文的模型能夠在保持較低計算負擔的同時生成高質量的圖像。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

實驗

故事可視化

以往的故事生成方法主要利用擴散模型,側重于故事圖像的可視化。這些模型以前一張圖像和文本作為輸入,然后根據當前的文本提示生成下一張圖像。為了公平比較,研究者們將本文的模型調整為僅可視化格式。對于StoryGen,也對其進行訓練,使其使用前面的圖像和文本生成圖像。對于LDM,僅提供文本-圖像對。視覺結果如下圖5所示。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

與baseline相比,SEED-Story模型顯示了更好的風格和角色一致性以及更高的質量。下表2中進行了定量評估,以展示有效性。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

多模態故事生成

為了進行比較分析,現有的多模態故事生成方法相對較少。為了建立比較基準,在數據集上微調了最近開發的MM-interleaved模型。下圖6中詳細介紹了比較結果。使用FID評估生成圖像的視覺質量。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

此外,GPT-4V在多個維度上比較并選擇MM-interleaved和SEED-Story生成結果中的優選項:風格一致性,評估不同圖像之間的風格一致性;故事吸引力,衡量敘述吸引和保持觀眾興趣的能力;以及圖像-文本一致性,評估圖像與其伴隨文本之間的對齊和相關性。


為了進行定性展示,展示了SEED-Story如何有效地幫助用戶控制故事情節。下圖7顯示,使用相同的起始圖像但不同的初始文本,敘述分支成兩個不同的故事情節。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

下圖8和圖9中提供了更多案例,以證明本文多模態長故事生成的能力。SEED-Story可以生成帶有引人入勝的情節和生動圖像的長序列。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

長故事生成

為了驗證在長故事生成方面的有效性,本文進行了一項實驗,使用SEED-Story模型可視化一個長故事,但采用不同的注意力機制。將數據分成長度為10的故事,以考慮訓練效率。將窗口大小設置為與訓練長度相同。下圖10中的定性結果顯示,當推理長度超過訓練長度時,窗口注意力迅速崩潰。盡管密集注意力和注意力匯聚方法表現更好,但隨著推理序列的加長,仍未能生成有意義的圖像。相比之下,多模態注意力匯聚始終生成高質量的圖像。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

在效率方面,多模態注意力匯聚相較于密集注意力表現出顯著的改進,與窗口注意力和普通注意力匯聚相比,僅有適度的時間和內存成本增加。這些額外的成本來自在KV緩存中保留額外的圖像tokens。下表3中的定量結果證實了上述結論。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

結論

本文介紹了SEED-Story,這是一種利用多模態大語言模型生成具有豐富敘述文本和上下文相關圖像的多模態長故事的開創性方法。提出了一種多模態注意力匯聚機制,使本文的模型能夠高效地生成長序列。此外,還提出了一個名為StoryStream的高質量數據集,用于有效地訓練和基準測試多模態故事生成任務。

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

連環畫創作源泉!港科大、騰訊等開源SEED-Story:開創性多模態長故事生成!-AI.x社區

本文轉自 AI生成未來 ,作者:Shuai Yang等


原文鏈接:??https://mp.weixin.qq.com/s/cmsXLXRx_5_D-VWuAl7-Hg??

收藏
回復
舉報
回復
相關推薦
久久国产乱子精品免费女| 国产午夜一区| 亚洲国产精品一区二区www在线| 国产高清一区视频| 日本视频免费观看| 久久久久久美女精品| 欧美精品一区二区高清在线观看| 欧美日韩在线不卡视频| 三区四区电影在线观看| 国产99久久久国产精品免费看| 2021久久精品国产99国产精品| 美国黄色特级片| 超碰成人97| 91成人国产精品| 日韩免费在线观看av| 青青久草在线| 国产精品白丝jk黑袜喷水| 欧美亚洲另类制服自拍| 成年人一级黄色片| 国产亚洲一区| 亚洲电影免费观看| 日韩在线一区视频| 澳门av一区二区三区| 亚洲一区二区成人在线观看| 日韩精品一线二线三线| 人妻一区二区三区四区| 久久9热精品视频| 欧美怡春院一区二区三区| 欧美三根一起进三p| 欧美手机视频| 亚洲电影免费观看高清完整版在线| 日本一极黄色片| 91桃色在线| 亚洲人xxxx| 先锋影音欧美| 久蕉依人在线视频| 97久久精品人人做人人爽50路| 91免费观看网站| 免费观看日批视频| 亚洲一区久久| 国内精品久久影院| 午夜少妇久久久久久久久| 日韩国产在线| 亚洲图片欧美午夜| 亚洲久久久久久久| 免费一区二区三区视频导航| 亚洲国产精品一区二区三区| 韩国三级与黑人| 中文字幕系列一区| 91久久一区二区| 女人另类性混交zo| 范冰冰一级做a爰片久久毛片| 性做久久久久久免费观看 | 亚洲人视频在线| 久久夜夜操妹子| 色综合久久久久综合体| 成人久久久久久久久| 国产在线看片免费视频在线观看| 亚洲一区二区三区在线播放| 欧美a级免费视频| 国产探花视频在线观看| 亚洲一区精品在线| 东北少妇不带套对白| 超碰在线cao| 精品久久久精品| 欧美a在线视频| 亚洲承认视频| 欧美日韩中文一区| 亚洲天堂av一区二区| 欧美不卡在线观看| 欧美mv和日韩mv国产网站| 四虎永久免费观看| 四虎884aa成人精品最新| 亚洲美女av黄| www亚洲色图| 香蕉精品视频在线观看| 久久高清视频免费| 日本系列第一页| 久久亚洲风情| 成人黄色在线观看| 亚洲精品久久久蜜桃动漫| av午夜一区麻豆| 免费在线一区二区| 欧美日本高清| 天天av天天翘天天综合网| 国产精品99久久免费黑人人妻| 欧美91在线|欧美| 日韩欧美三级在线| 黄色工厂在线观看| 99精品网站| 国内精品久久久久久| 成人免费毛片视频| 国产成人自拍高清视频在线免费播放| 精品视频一区二区三区四区| 国产精品一区二区三区四区色| 亚洲男人电影天堂| 黄色动漫网站入口| 99视频有精品高清视频| 亚洲国产精品久久久久久| 国产人妻大战黑人20p| 欧美.www| 国产精品高清在线| 成人午夜免费在线观看| 国产欧美精品一区| 男女日批视频在线观看| 国产福利亚洲| 日韩理论片久久| 欧美色图亚洲视频| 日韩中文字幕一区二区三区| 粉嫩av四季av绯色av第一区| 成人动漫在线播放| 五月开心婷婷久久| 91视频福利网| blacked蜜桃精品一区| 久久久噜噜噜久久久| 亚洲一区二区天堂| 久久综合久久综合亚洲| 日韩免费在线观看av| 国产精品第一国产精品| 日韩精品免费视频| 久久综合综合久久| 九九国产精品视频| 日韩av大全| 欧美男男tv网站在线播放| 日韩视频一区在线观看| 性色国产成人久久久精品| 久久aⅴ乱码一区二区三区| 97操在线视频| а√天堂官网中文在线| 欧美日韩欧美一区二区| 欧美多人猛交狂配| 国产情侣久久| 国产精品麻豆免费版| free性欧美hd另类精品| 制服丝袜av成人在线看| 蜜桃传媒一区二区亚洲| 国产亚洲毛片| 精品国产区在线| 大桥未久在线播放| 日韩女优视频免费观看| 国产成人综合在线视频| 久久精品国产第一区二区三区| 欧美日韩亚洲一区二区三区四区| caoporn视频在线观看| 日韩免费视频一区| 妺妺窝人体色www婷婷| 国产一区二区三区久久悠悠色av| 一区二区不卡在线| 久久亚洲人体| 精品国产一区av| 亚洲综合精品国产一区二区三区 | 亚洲自拍三区| 欧美高清影院| 精品国产欧美一区二区三区成人| 在线免费看av的网站| 国产精品视频一二三区| 超碰在线人人爱| 日韩视频在线观看| 国产综合久久久久| 在线网址91| 精品国产乱码久久久久久蜜臀 | 91久久精品国产91性色tv| 欧美图片第一页| 另类天堂av| 亚洲国产一区二区精品视频 | 久久久一本精品99久久精品| 涩涩视频在线免费看| 亚洲欧美成人精品| 波多野结衣绝顶大高潮| 国产精品成人在线观看| 日本r级电影在线观看| 国产精品九九| 美女视频久久| 国产成人免费精品| 精品自拍视频在线观看| 神马久久久久久久久久| 日韩欧美精品网址| 青青青视频在线播放| 国产麻豆欧美日韩一区| 全黄性性激高免费视频| 免费短视频成人日韩| 国产精品视频xxxx| av理论在线观看| 亚洲精品久久久久久久久| 婷婷激情五月综合| 亚洲色图清纯唯美| 岛国精品资源网站| 免费看欧美女人艹b| 91免费版看片| 久久av中文| 999国产在线| 裤袜国产欧美精品一区| 日日狠狠久久偷偷四色综合免费| 精品欧美在线观看| 欧洲一区二区三区在线| 国产精品九九九九九九| 久久免费偷拍视频| 欧美熟妇另类久久久久久多毛| 国产一区二区高清| 国产欧美综合一区| 天天操综合520| 91在线免费视频| xx欧美xxx| 久久6免费高清热精品| 男人久久精品| 精品国产凹凸成av人导航| 超碰在线免费97| 激情成人中文字幕| 欧美在线视频第一页| 久久女同互慰一区二区三区| 国产chinesehd精品露脸| 巨乳诱惑日韩免费av| 免费看欧美一级片| 久久国产综合| 欧美精品在线一区| 国产成人福利av| 亚洲永久在线观看| 国产精品伦一区二区| 456亚洲影院| 黄色小说在线播放| 按摩亚洲人久久| 成年人在线观看视频| 亚洲激情视频在线| 亚洲精品久久久久久动漫器材一区| 欧美色爱综合网| 国产精品视频一区在线观看| 伊人性伊人情综合网| 手机在线中文字幕| 国产欧美日韩另类视频免费观看| 朝桐光av一区二区三区| 国产91精品在线观看| 亚洲精品国产久| 九九在线精品视频| 精品久久久99| 美女视频一区二区| 美女黄色片视频| 久久久噜噜噜久久狠狠50岁| 精品国产一区三区| 亚洲日本久久| 国产精品又粗又长| 亚洲视频狠狠| 男人天堂av片| 很黄很黄激情成人| 欧美精品卡一卡二| 亚洲国产二区| 免费观看国产精品视频| 亚洲国产日本| 国产精品专区在线| 国产亚洲一级| 欧美污视频网站| 日韩精品视频网站| 亚洲少妇久久久| 美日韩一区二区三区| 亚洲欧美日韩三级| 国内精品在线播放| a级大片免费看| 国产999精品久久| 精品中文字幕在线播放| 91小视频在线观看| 中文字幕一区二区三区人妻电影| 久久久www免费人成精品| 精品人妻一区二区三区蜜桃视频| 欧美国产精品中文字幕| 欧美一级特黄高清视频| 亚洲女爱视频在线| 国产成人精品a视频一区| 欧美日韩在线免费| 欧美视频xxxx| 这里只有精品免费| 国产自产一区二区| 亚洲性夜色噜噜噜7777| 美女羞羞视频在线观看| 欧美日韩成人免费| 三级在线看中文字幕完整版| 国产精品久久久久国产a级| 日韩欧美三区| 国产精品区二区三区日本| 亚洲桃色综合影院| 一本色道久久99精品综合| 欧美精品1区| 能在线观看的av| 精品一区二区影视| 四虎成人免费视频| 国产日韩欧美精品在线| 手机av在线看| 黑丝美女久久久| 91麻豆视频在线观看| 精品乱人伦小说| 国产爆初菊在线观看免费视频网站 | 日本欧美不卡| 国产又爽又黄的激情精品视频 | 91丝袜脚交足在线播放| 美女网站色精品尤物极品姐弟| 色综合电影网| 亚洲国产mv| 欧美国产日韩另类| 久久综合九色综合97婷婷| 亚洲一级二级片| 欧美色播在线播放| 精品国产99久久久久久宅男i | 婷婷激情在线| 2021久久精品国产99国产精品| 超碰国产精品一区二页| 久久综合九色99| 欧美激情1区2区| 国产 porn| 91丨porny丨中文| 日本高清不卡免费| 欧美性视频一区二区三区| 视频一区 中文字幕| 久热精品视频在线| 欧美日韩亚洲国产| 加勒比在线一区二区三区观看| 久久精品免费一区二区三区| 国产精品亚洲a| 成人精品视频一区| 99鲁鲁精品一区二区三区| 色婷婷av一区| 日韩三级电影网| 久久久久久久一区二区| 国内精品视频| 亚洲欧美日韩在线综合 | 国产成一区二区| 久久影视三级福利片| 国内自拍中文字幕| 精品一区二区三区久久| 公肉吊粗大爽色翁浪妇视频| 五月婷婷久久丁香| 国模人体一区二区| 色综合久久天天综线观看| 成人51免费| 伊人久久av导航| 免费人成在线不卡| 极品久久久久久久| 欧洲视频一区二区| 免费播放片a高清在线观看| 97视频在线看| 美国成人xxx| 亚洲国产成人精品无码区99| 国产91精品一区二区麻豆亚洲| 欧美极品视频在线观看| 欧美一级高清片在线观看| 成人短视频在线观看| 亚洲一区二区在线| 中文字幕亚洲精品乱码| 亚洲av毛片在线观看| 亚洲精品国产a久久久久久| 99er热精品视频| 欧美成人精品在线| 中文字幕一区日韩精品 | 综合 欧美 亚洲日本| 欧美日韩高清影院| 欧美性猛交xxx乱大交3蜜桃| 国产日韩在线免费| 91精品国产乱码久久久久久| caoporm在线视频| 亚洲精品日韩一| 性网爆门事件集合av| 久久久久久久久久久亚洲| 澳门成人av| a在线视频观看| 国产视频911| 国产美女免费看| 欧美伦理91i| 日韩最新在线| 三级视频中文字幕| 日韩美女啊v在线免费观看| www.久久久久久| 97成人超碰免| 欧美精品一区二区久久| 日韩va在线观看| 亚洲一区二区三区四区中文字幕| 天天摸夜夜添狠狠添婷婷| 国产91热爆ts人妖在线| 小说区亚洲自拍另类图片专区| 免费黄色在线播放| 色婷婷综合中文久久一本| 日本高清视频在线观看| 99热99热| 视频一区二区三区中文字幕| 欧美xxxooo| 亚洲国产精品久久精品怡红院| 精品123区| 亚洲 欧美 综合 另类 中字| 久久久精品免费观看| 国产剧情精品在线| 51精品国产黑色丝袜高跟鞋 | 久久先锋资源网| 91久久久久久久久久久久| 久久久久国产精品一区| 欧美日韩国产免费观看视频| 中文字幕第10页| 91电影在线观看| 久久青青色综合| 亚洲欧美国产精品桃花| 成年人午夜久久久| 一级片在线观看视频| 午夜精品福利在线观看| 国产二区精品| ass精品国模裸体欣赏pics|