精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

即插即用、無需訓練:劍橋大學、騰訊AI Lab等提出免訓練跨模態文本生成框架

人工智能 新聞
來自劍橋大學、騰訊 AI Lab 等機構的研究者提出了一個全新的框架 MAGIC (iMAge-guided text GeneratIon with CLIP),MAGIC 通過直接插入可控圖文匹配模型分數的方式,使得語言模型在解碼過程中選擇更接近圖片信息的生成結果。

1. 導讀

本文提出了一個全新的 MAGIC (iMAge-guided text GeneratIon with CLIP)框架。該框架可以使用圖片模態的信息指導預訓練語言模型完成一系列跨模態生成任務,例如 image captioning 和 visually grounded story generation。與其他方法不同的是,MAGIC 框架無需多模態訓練數據,只需利用現成的語言模型(例如 GPT-2)和圖文匹配模型(例如 CLIP)就能夠以 zero-shot 的方式高質量地完成多模態生成任務。此外,不同于使用梯度更新生成模型 cache 的傳統方法,MAGIC 框架無需梯度更新,因而具備更高效的推理效率。


  • 論文:https://arxiv.org/abs/2205.02655
  • 代碼:https://github.com/yxuansu/MAGIC

2. 研究背景以及目的

借助日益強大的預訓練語言模型,我們已經可以根據文本前綴生成一段流利文本。當前,絕大多數工作的主要研究方向集中于利用文本模態的前綴來生成后續文本的方法。然而,如何有效利用其他模態的信息(例如圖片)來指導預訓練語言模型生成高質量的文本,仍然是一個待解決的難題。目前,針對此類問題最常見的解決思路是在收集好的高質量多模態平行數據的基礎上,訓練多模態的模型來完成特定的跨模態任務。例如,我們可以在圖文匹配的標注數據集上,通過監督學習的方法訓練 image captioning 模型,從而根據輸入圖片生成對應的文本描述。

但是,該方法存在標注數據獲取困難的弊端,并不適合所有應用場景。為了解決這一難題,許多研究者提出了一系列弱監督的方法。而這類方法也有其弊端,它們會受到不同多模態任務的特定限制。例如,在 image captioning 任務中,弱監督的方法需要使用特定的目標檢測器,來收集圖片內可識別目標的標簽信息。然而,當圖片中包含目標檢測器無法識別的物體 (out-of-domain object) 時,弱監督方法的有效性就會大打折扣。

為了擺脫對目標檢測器的依賴從而真正實現 zero-shot 跨模態文本生成,ZeroCap[1]提出在推理階段通過梯度更新的方式修正生成語言模型內部的隱狀態,從而使生成的文本描述和圖片內容盡可能接近。但是,這一方法也有其弊端,通過多次迭代梯度更新來調整模型的內部隱狀態,在當前預訓練語言模型參數量越來越大的趨勢下,其運行效率會變得越來越低,嚴重限制了該方法在實際場景中的應用。

本文提出了一個全新的 MAGIC 框架。MAGIC 通過直接插入可控的圖文匹配模型分數的方式,使得語言模型在解碼過程中選擇更接近圖片信息的生成結果。這樣,語言模型可以在不經過任何跨模態訓練的情況下,高質量地解決跨模態生成任務,得到明顯優于弱監督模型的文本生成質量。同時,與 ZeroCap 相比,MAGIC 還擁有接近 27 倍的推理速度提升。

3. 研究方法

3.1 無監督語言建模

為了適應特定跨模態任務的文本領域,該研究預先使用了跨模態訓練數據集中的文本數據,采取無監督的方式更新語言模型的參數(僅需在 1 塊 NVIDIA 1080Ti 上運行不到兩個小時),從而使得語言模型更加熟悉該領域的文本分布。具體而言,本文使用 MLE 損失函數訓練語言模型的參數:

此外,SimCTG[2]的最新工作證明了通過引入對比損失來校準模型的語義空間,能夠獲得質量更高的語言模型。因此,本文也同時優化如下的對比損失:

其中 是用來校準生成模型表示空間的 margin 參數,來計算 token 表示之間的余弦相似度。最終,本文將兩個損失函數合并,以此來優化文本模態的 GPT-2 語言模型:

3.2 MAGIC Search

本文提出了 MAGIC Search 解碼算法。MAGIC 使用視覺信息指導預訓練語言模型的生成過程。具體而言,給定文本前綴和圖片,第 t 步的 token 選擇公式如下:


其中表示按照語言模型概率分布選擇的 top-k 個候選 token。同時,該研究借鑒了 SimCTG 中 contrastive search 的思路,在 token 選擇指標中引入了 model confidence 和 degeneration penalty 項來使得模型選擇更合適的 token。上述公式中最重要的一項是將視覺控制信息引入到模型解碼過程中的 magic score:

其中是 CLIP 的 image encoder 產生的圖片表示,是 CLIP 的 text encoder 產生的文本表示。參數用來調節視覺信息的控制力度。當其值為 0 時,語言模型的生成過程不再被視覺信息所影響,從而 magic search 退化為傳統的 contrastive search。

4. 實驗結論

4.1 Zero-shot Image Captioning

4.1.1 實驗設置

本文在 MS-COCO 和 Flickr30k 數據集上進行了大量的實驗,并選用以下的無監督 baseline 進行對比:

1.top-k sampling:不基于圖片信息,用 top-k 解碼方法使用語言模型來生成 caption

2.nucleus sampling:不基于圖片信息,用 nucleus 解碼方法使用語言模型生成 caption

3.contrastive search:不基于圖片信息,用 contrastive search 解碼方法使用語言模型來生成 caption

4.CLIPRe:使用 CLIP 模型從 MS-COCO 或 Flickr30k 的訓練數據中檢索文本數據

5.ZeroCap:在解碼過程中,使用 CLIP 信息來指導語言模型梯度更新的方法

值得注意的是 top-k sampling, nucleus sampling 和 contrastive search 解碼方法因為不基于圖片信息,所以可看作是文本生成模型在跨模態任務上的性能下界。此外,本文還選取了一批監督和弱監督的方法來進行對比。

對于評價方法,本文采用 image captioning 中經典的評價指標:BLEU-1, BLEU-4,  METEOR, ROUGE-L, CIDEr 和 SPICE,同時也測試了不同模型的相對解碼速率。4.1.2 MS-COCO 和 Flickr30k 實驗結果

如上圖所示,本文發現當忽視 captions 的信息,只使用語言模型進行生成時效果并不好(Top-k, Nucleus, Contrastive),這說明沒有對應的圖片信息,只依靠語言模型很難完成這個跨模態的任務。CLIPRe 方法效果雖然顯著好于 Top-k 等純文本解碼方法,但仍然弱于當前 SOTA 無監督方法,ZeroCap,這是由 training set 和 test set 之間的數據差異所造成。這也證明了檢索模型在該任務上效果弱于生成模型。

本文 MAGIC 的生成結果顯著優于 ZeroCap,展示了 MAGIC 框架的有效性。并且因為 MAGIC 完全不依賴于梯度更新,其解碼速度比 ZeroCap 快接近 27 倍。

4.1.3. 跨領域實驗結果

此外,本文還進行了跨領域實驗以進一步測試 MAGIC 的泛化能力。具體而言,本文使用在源領域(例如 MS-COCO)上得到的無監督語言模型,在目標領域(例如 Flickr30k)的測試集上進行實驗。本文在該實驗中對比無監督解碼方法和 CLIPRe。其中 CLIPRe 的檢索數據集僅來自于源領域的訓練集,實驗結果如下:

從表格中結果可以發現,MAGIC 遠好于純文本解碼方法和 CLIPRe 強 baseline。

4.1.4. Case Study

該研究通過一些例子來定性的對比 baseline 和本文方法:

這幾個例子顯示出 MAGIC 不僅能夠生成非常流利的文本,同時其生成文本中的信息和圖片模態的關聯性也更強。例如圖 (a) 中,MAGIC 可以準確的生成 “building”,但是 ZeroCap 卻生成了“school bus” 這個無關的結果。此外,圖 (d) 中,雖然 ZeroCap 生成了 “boatboard” 這一相關詞匯,但其語句流利度低,并且存在語法錯誤。相比之下,MAGIC 生成的文本在通順流暢的同時,也與圖片顯示的內容一致。

4.2 基于視覺的故事生成

除了 image captioning 任務之外,該研究還將 MAGIC 框架拓展到了其他基于視覺的文本生成任務,例如基于視覺的故事生成(visually grounded story generation)。在該任務中,給一個圖片和故事標題,模型的任務是生成一個流利有趣并且與圖片內容及故事標題一致的故事。

4.2.1 實驗設置

本文在 ROCStories 數據集上進行了實驗,并選取以下的文本解碼方式作為該研究的 baseline:(1) Greedy search;(2)Beam search;(3)Top-K sampling;(4)Nucleus sampling;(5)Typical sampling;和(6)Contrastive search。

為了達到給 ROCStories 數據集中每一個測試樣例提供一個圖片信息的目的,本文使用 CLIP 模型從公開的 ConceptCaption 數據集中檢索和故事標題最相關的圖片。

為了有效評價模型的效果,本文采用了以下幾種評價指標:

1. 自動評價指標:本文采用之前文本生成研究中的一系列評價指標a.n-gram 重復率 (rep-n)b. 生成文本多樣性 (div.)c. 語義一致性(coh.):生成的故事和標題是否語義一致d. 圖文匹配相關性 (CLIPScore)e.MAUVE 分數

2. 人工評價指標:為了更精準的反映生成故事的質量,五個專業的標注員從以下幾個角度對生成故事的質量進行打分(1-5 分,1 分最差,5 分最好)a. 相關性:生成的故事是否和標題有關b. 流利度:生成的故事是否流利易懂c. 信息量:生成的故事是否多樣且有趣d. 故事圖片相關性:生成的故事是否和通過標題檢索得到的圖片語義一致

4.2.2 實驗結果


如上圖所示,MAGIC 在大多數的指標上都達到了最佳的效果,明顯優于其他方法。其中 rep-n, diversity 和 MAUVE 的最佳結果說明 MAGIC 生成的故事和人類文本更加接近。并且 MAGIC 在 coherence 和圖文匹配一致性分數上顯著優于其他的方法,說明 MAGIC 在綜合利用了圖片和文本標題的信息之后可以生成和標題信息更加相關的故事內容。人工評價的效果也顯示 MAGIC 生成的故事在各個角度上均達到了最好的效果。

4.2.3 Case Study

如上圖所示,MAGIC 可以有效的生成和圖片有關的信息。在第一個例子中,MAGIC 生成的故事包含了詳細的冰淇凌的種類和味道,除了 orange 的結果稍有差異,其他的文本都完美符合圖片中的描述。在第二個例子中,contrastive search 生成的結果和故事標題間相關度較差。與之相反,MAGIC 生成的內容和圖片中的信息及主題高度相關,例如:(1)和朋友們在沙灘;(2)打沙灘排球;(3)比賽持續了兩個小時;(4)朋友贏下了比賽。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-12-26 00:51:38

2024-12-26 07:20:00

2023-06-05 10:09:03

研究人工智能

2025-09-23 12:48:36

AGI模型框架

2022-03-31 10:51:20

算法訓練研究

2025-03-12 12:10:13

2025-05-27 15:28:11

模型訓練AI

2025-02-10 08:40:00

訓練數據模型

2025-01-22 09:48:07

2013-03-22 10:07:33

劍橋大學大數據

2025-01-02 13:50:35

2025-02-10 14:05:00

訓練模型AI

2021-11-15 10:00:22

模型人工智能NLP

2025-05-30 15:52:05

訓練代碼推理

2025-06-30 08:42:00

模型訓練AI

2025-11-20 08:45:00

2024-11-11 09:00:00

2025-10-16 09:00:00

2024-11-08 09:30:00

2023-11-27 13:48:00

模型數據
點贊
收藏

51CTO技術棧公眾號

999国内精品视频在线| 亚洲欧洲激情在线| 成人av在线不卡| 人妻一区二区三区免费| 先锋影音久久| 色天天综合狠狠色| 少妇熟女视频一区二区三区| 在线中文字幕播放| 成人欧美一区二区三区视频网页| 成人xxxxx色| 一级片免费在线播放| 国产精品成人av| 亚洲国产毛片完整版| 亚洲这里只有精品| 1区2区3区在线| 亚洲国产成人午夜在线一区| 风间由美一区二区三区| 中文字幕精品无码一区二区| 中文无码久久精品| 亚洲视频999| 亚洲最大视频网| 国产三级一区| 欧美日韩在线视频一区二区| 成年人三级视频| 国产在线一二三| 成人精品视频一区二区三区| 国产在线播放不卡| 狠狠人妻久久久久久综合| 欧美成人有码| xxxxx成人.com| 欧美图片第一页| aaa国产精品| 欧美电影一区二区三区| 欧在线一二三四区| 国产伦子伦对白在线播放观看| 中文字幕在线一区二区三区| 欧美日韩在线不卡一区| 日批视频在线播放| 国产99一区视频免费| 91精品视频网站| 中文字幕一区二区免费| 亚洲尤物精选| 91po在线观看91精品国产性色| 五月婷婷一区二区| 999精品视频| 伊人精品在线观看| 六月婷婷七月丁香| 日本午夜精品久久久| 精品久久一区二区| 波多野结衣三级视频| 福利一区三区| 911精品国产一区二区在线| 999在线免费视频| 伊人色综合一区二区三区影院视频| 亚洲国产精品久久久久婷婷884 | 欧美黄色性视频| 日本一级片免费| 欧美大片aaaa| www.久久撸.com| 日本免费网站视频| 9999国产精品| 不卡毛片在线看| 日韩高清dvd碟片| 欧美伊人久久| 久久久久国产视频| 久久精品免费av| 亚洲高清免费| 亲子乱一区二区三区电影| 亚洲另类在线观看| 视频一区中文字幕国产| 国产精品久久久久久一区二区 | mm1313亚洲国产精品美女| 亚洲天堂中文字幕| 99视频精品全部免费看| 在线中文字幕电影| 亚洲一区二区四区蜜桃| 天堂…中文在线最新版在线| 在线观看v片| 91福利区一区二区三区| 三上悠亚在线一区| 亚洲精品影片| 亚洲韩国青草视频| 国产一二三四五区| 一区二区电影| 午夜精品久久久久久99热软件| 欧美日韩综合一区二区三区| 青青青伊人色综合久久| 91精品免费视频| 懂色av蜜臀av粉嫩av分享吧| 91麻豆高清视频| 亚洲蜜桃在线| 国产经典三级在线| 色视频成人在线观看免| www.日本久久| 日韩激情网站| 色婷婷**av毛片一区| 国产在线综合网| 日本不卡高清视频| 国产精品二区在线观看| 国产三级电影在线| 亚洲最大成人网4388xx| 亚洲人成无码www久久久| 亚洲精品66| 日韩精品免费综合视频在线播放 | 中文字幕在线观看日| 7777精品| 色一区av在线| 中文字幕在线观看免费视频| 麻豆成人免费电影| 久久国产精品免费一区| 黄色免费网站在线| 日韩欧美精品中文字幕| 亚洲丝袜在线观看| 日韩精品二区| 2019中文字幕在线免费观看| 国产又粗又猛又爽又黄的视频一| 久久久一区二区三区捆绑**| 成人午夜视频免费观看| 小明成人免费视频一区| 亚洲国产成人久久综合| 99成人在线观看| 久久精品男女| 国产精品久久国产三级国电话系列 | 精品一区二区三区视频在线观看 | 精品日韩免费| 97精品国产97久久久久久免费| 7777久久亚洲中文字幕| 久久精品视频在线看| 久艹视频在线免费观看| 国产aⅴ精品一区二区四区| 亚洲欧洲偷拍精品| 九九热在线视频播放| 国产精品91xxx| 在线观看一区二区三区三州| 外国成人直播| 日韩二区三区在线| 日韩人妻无码一区二区三区99| 国产91丝袜在线18| 可以在线看黄的网站| 成人豆花视频| 久久影视免费观看| 中文字幕在线网址| 国产欧美一区二区三区沐欲 | 欧美aaaaaa午夜精品| 免费电影一区| 色在线中文字幕| 日韩电影免费在线观看中文字幕| 亚洲一区 视频| 成人午夜电影久久影院| 日本中文字幕在线视频观看| xvideos.蜜桃一区二区| 欧美激情视频给我| 亚洲精品一区二区三区区别| 亚洲一区视频在线| 91精品啪在线观看国产| 在线成人欧美| 精品日韩电影| 中文av在线全新| 亚洲乱码国产乱码精品精天堂| 国产中文字幕视频| 国产欧美日韩久久| 亚洲36d大奶网| 999久久久精品国产| 成人啪啪免费看| 亚洲卡一卡二| 亚洲黄页视频免费观看| 丁香六月婷婷综合| 国产三级精品视频| 久久久久国产一区| 亚洲国产一区二区在线观看 | 欧美乱大交xxxxx| www日本在线| 天天av天天翘天天综合网色鬼国产| 强迫凌虐淫辱の牝奴在线观看| 久久成人精品| 一本一本a久久| 精品视频一区二区三区在线观看| 久久久久久久一区二区| 欧美日本韩国一区二区| 欧美午夜视频网站| 天天干中文字幕| 成人福利视频在线看| 午夜欧美福利视频| 亚洲精品小说| 精品无人区一区二区三区竹菊| 欧美成人app| 欧美精品videosex牲欧美| 日本国产在线| 91麻豆精品国产91久久久 | 亚洲国产一区二区三区在线播放| 国产精品免费视频一区二区| 欧洲一区二区三区精品| 操人视频在线观看欧美| 亚洲AV第二区国产精品| 在线播放欧美女士性生活| 日本中文字幕免费观看| 国产精品伦理一区二区| 国产a级黄色片| 久久精品国产亚洲高清剧情介绍 | 国产精品免费一区二区三区| 黄色激情在线播放| 日韩一区二区精品视频| 熟妇高潮一区二区三区| 欧美色欧美亚洲另类二区| 国产精品30p| 中文字幕一区二区三区不卡| 成人精品在线观看视频| 国产一区不卡视频| 青青在线视频免费| 狠狠综合久久av一区二区老牛| 新呦u视频一区二区| 老司机精品在线| 91亚洲午夜在线| 日本高清不卡一区二区三区视频| 欧美高清激情视频| 日本三级视频在线观看| 亚洲欧美日韩高清| 日本高清视频在线| 欧美一三区三区四区免费在线看 | av网址在线| 神马国产精品影院av| 日本私人网站在线观看| 精品欧美久久久| 国产精品玖玖玖| 在线看国产日韩| 亚洲精品国产精品乱码| 一区二区三区四区不卡视频| 国产亚洲精品久久久久久豆腐| 久久综合久久鬼色中文字| 在线中文字日产幕| 国产精品一卡二| 午夜一区二区视频| 蜜臀av性久久久久蜜臀aⅴ四虎| 茄子视频成人免费观看| 亚洲三级毛片| 老子影院午夜伦不卡大全| 欧美在线三区| 欧美另类videos| 一区二区影视| 国产成人三级视频| 亚洲电影在线一区二区三区| 免费成人进口网站| 亚洲激情中文| 台湾无码一区二区| 午夜精品久久99蜜桃的功能介绍| 国产大尺度在线观看| 亚洲va在线| 永久免费网站视频在线观看| 亚洲人metart人体| 日韩视频在线观看视频| 天天综合一区| 黄色一级片网址| 综合激情婷婷| www.日本在线视频| 亚洲欧洲另类| av7777777| 香蕉久久夜色精品| 成人精品小视频| 蜜臀av一区二区在线观看| 色噜噜狠狠一区二区| 久久99在线观看| 亚洲制服在线观看| 国产成人av福利| 久草视频福利在线| 久久久亚洲午夜电影| 少妇太紧太爽又黄又硬又爽小说| 国产精品毛片久久久久久久| 99久久婷婷国产综合| 亚洲一区二区三区四区在线| 日韩手机在线观看| 色悠悠久久综合| 中文字幕在线播放不卡| 欧美日韩国产天堂| www.亚洲黄色| 日韩禁在线播放| 超碰国产在线| 欧美乱妇40p| 亚洲人体视频| 国产一区二区丝袜| 91精品啪在线观看国产爱臀| 久久免费一区| 亚洲电影在线一区二区三区| 人妻无码久久一区二区三区免费| 噜噜噜躁狠狠躁狠狠精品视频| 一区二区三区视频在线观看免费| 韩国欧美一区二区| 喷水视频在线观看| 中文字幕欧美日韩一区| 久久久久久免费观看| 一本色道久久综合亚洲aⅴ蜜桃| 一级淫片免费看| 亚洲电影免费观看高清| 一级日本在线| 18久久久久久| 国产午夜亚洲精品一级在线| 蜜桃导航-精品导航| 五月激情综合| 成人免费观看毛片| 国产精品18久久久久久vr| 少妇大叫太粗太大爽一区二区| 成人免费一区二区三区在线观看| 天海翼一区二区| 91麻豆精品国产91久久久久| 九色在线免费| 久久全国免费视频| avtt久久| 日韩片电影在线免费观看| 国内在线观看一区二区三区| 亚洲性生活网站| 99麻豆久久久国产精品免费| 中日韩一级黄色片| 在线视频你懂得一区| 黑人乱码一区二区三区av| 日韩视频―中文字幕| 亚洲性色av| 国产综合动作在线观看| 久久久久久久久久久久久久久久久久| 国内外成人免费激情视频| 国产激情一区二区三区桃花岛亚洲| 中文字幕在线观看免费高清| 黄色一区二区三区| 丰满人妻一区二区三区四区53| 日韩视频在线免费观看| 小明成人免费视频一区| 欧美精品亚洲| 亚洲精选成人| 911亚洲精选| 亚洲伦在线观看| 一区二区视频网站| 亚洲天堂av在线免费观看| 欧美私密网站| 国产日韩欧美精品| 国产精品porn| 亚洲综合伊人久久| 中文字幕欧美一| 亚洲中文无码av在线| 亚洲欧美另类国产| 日韩新的三级电影| 青青草成人激情在线| 久久久久一区| 扒开jk护士狂揉免费| 婷婷夜色潮精品综合在线| 黄色小视频免费观看| 欧美激情videos| 亚洲综合影院| 国产女主播自拍| 福利一区二区在线| 久久免费视频6| 精品国产欧美一区二区| 岛国av在线播放| 久久精品国产美女| 久久国产毛片| 国产又粗又猛又爽视频| 欧美羞羞免费网站| 调教视频免费在线观看| 国产综合在线观看视频| 婷婷综合视频| 欧美xxxx日本和非洲| 亚洲成人av在线电影| 日韩毛片在线一区二区毛片| 日本久久久久久| 成人在线免费观看91| 成人性生交免费看| 亚洲欧美日韩系列| www.四虎在线观看| 午夜精品www| 精品国产一区探花在线观看| www.久久久精品| 亚洲美腿欧美偷拍| 污污视频在线免费看| 日本精品一区二区三区在线| 成人激情在线| 又黄又爽又色的视频| 黄网站色欧美视频| av午夜在线| 成人三级视频在线观看一区二区| 亚洲看片免费| 亚洲最大成人综合网| 制服.丝袜.亚洲.另类.中文| 不卡av免费观看| 日韩欧美视频一区二区| 国产精品影视在线| 99精品视频99| 深夜福利国产精品| 中文在线免费一区三区| 99re在线视频免费观看| 中文字幕一区二区不卡| 亚洲精品视频91| 国产精品久久久久久超碰| 欧美 日韩 国产一区二区在线视频| 800av在线播放| 欧美日高清视频| 中文字幕在线看片| 最新视频 - x88av| 26uuu亚洲综合色| 一区二区日韩在线观看| 性色av一区二区咪爱| 色88久久久久高潮综合影院| 国产婷婷在线观看| 欧美精品久久99|