精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

不做文盲畫家!谷歌魔改「文本編碼器」:一個小操作讓圖像生成模型學會「拼寫」

人工智能 新聞
圖像生成模型終于學會了拼寫單詞,秘訣竟是字符特征?

過去的一年里,隨著DALL-E 2,Stable Diffusion等圖像生成模型的發布,text-to-image模型生成的圖像在分辨率、質量、文本忠實度等方面都得到了飛躍性提升,極大促進了下游應用場景的開發,人人都成了AI畫家。

但相關研究表明,目前的生成模型技術仍然存在一個重大缺陷:無法在圖像中呈現出可靠的視覺文本。

有研究結果表明,DALL-E 2在圖片中生成連貫文本字符上非常不穩定,而最新發布的Stable Diffusion模型則是直接將「無法呈現可讀的文本」列為已知的限制。

圖片

字符拼寫錯誤:(1) California: All Dreams Welcome, (2) Canada: For Glowing Hearts, (3) Colorado: It’s Our Nature, (4) St. Louis: All Within Reach.

最近Google Research發布了一篇新論文,試圖了解并提高圖像生成模型渲染高質量視覺文本的能力。

圖片

論文鏈接:https://arxiv.org/abs/2212.10562

研究人員認為當下的text-to-image生成模型模型存在文本渲染缺陷的主要原因是缺乏字符級的輸入特征。

為了量化該輸入特征在模型生成中的影響,文章中設計了一系列控制實驗對是否包含文本輸入特征的文本編碼器(character-aware和character-blind)進行對比。

研究人員發現,在純文本領域,character-aware模型在一個新的拼寫任務(WikiSpell)上獲得了很大的性能收益。

將該經驗遷移到視覺領域后,研究人員訓練了一套圖像生成模型。實驗結果表明character-aware模型在一系列新的文本渲染任務(DrawText基準)中比character-blind更勝一籌。

并且character-aware模型在視覺拼寫方面達到了更高的技術水平,盡管訓練的樣例數量少得多,其在不常見的單詞上的準確率仍然比競爭模型高出30多個百分點。

Character-Aware模型

語言模型可分為直接訪問構成其文本輸入字符的character-aware模型和無法訪問的character-blind模型。

許多早期的神經語言模型直接在字符上進行操作,而不使用多字符的token作為標記。

后來的模型逐漸轉向基于詞匯表的tokenization,其中一些模型如ELMo仍然保留了character-aware,但其他模型如BERT則放棄了字符特征以支持更有效的預訓練。

目前,大多數廣泛使用的語言模型是character-blind的,依靠數據驅動的子詞(subword)分割算法,如字節對編碼(BPE)來生成子詞pieces作為詞匯表。

雖然這些方法對于不常見的序列可以退回到字符級表示,但它們在設計上仍然會將常見的字符序列壓縮成不可分割的單元。

這篇論文的主要目的是試圖了解并提高圖像生成模型渲染高質量視覺文本的能力。

為此,研究人員首先孤立地研究了當下文本編碼器的拼寫能力,從實驗結果可以發現,盡管character-blind文本編碼器很受歡迎,但它們沒有收到關于其輸入的字符級構成的直接信號,導致其拼寫能力有限。

圖片

研究人員還測試了不同規模、架構、輸入表示、語言和調整方法的文本編碼器的拼寫能力。

這篇論文首次記錄了character-blind模型通過網絡預訓練誘導出強大的拼寫知識(準確率>99%)的神奇能力,但實驗結果表明這項能力在英語之外的語言中并沒有得到很好的泛化,而且只有在超過100B參數的規模下才能實現,所以對于大多數應用場景是不可行的。

另一方面,character-aware的文本編碼器能夠在更小的尺度上實現強大的拼寫能力。

在將這些發現應用于圖像生成場景時,研究人員訓練了一系列character-aware的文本到圖像的模型,并證明它們在現有的和新的文本渲染的評估中明顯優于字符盲目的模型。

但對于純字符級模型來說,雖然文本渲染的性能提升了,但對于不涉及視覺文本的prompt,圖像-文本對齊度則會下降。

為了緩解這一問題,研究人員建議將字符級和token級的輸入表征結合起來,從而可以實現最佳的性能。

WikiSpell基準

由于文本到圖像的生成模型依賴于文本編碼器來產生用于解碼的表征,研究人員首先從Wiktionary中采樣一些單詞創建了WikiSpell基準,然后基于此數據集在一個純文本的拼寫評估任務來探索文本編碼器的能力。


圖片

對于WikiSpell中的每個樣例,模型的輸入是一個單詞,預期的輸出是它的具體拼寫(通過在每個Unicode字符之間插入空格來生成)。

圖片

由于該文章僅對研究一個詞的頻率和模型的拼寫能力之間的關系感興趣,所以研究人員根據單詞在mC4語料庫中出現的頻率,將Wiktionary中的詞分成五個互不重疊的桶:最頻繁的前1%的詞,最頻繁的1-10%的詞,10-20%的詞,20-30%的詞,以及最低的50%的詞(包括在語料庫中從未出現過的詞)。

然后從每個桶中均勻地抽取1000個詞來創建一個測試集(以及一個類似的開發集)。

最后通過結合兩部分建立了一個由10,000個詞組成的訓練集:5,000個從最底層的50%桶(最不常見的詞)中統一取樣,另外5,000個根據它們在mC4中的頻率按比例取樣(從而使這一半的訓練集偏向頻繁的詞)。

研究人員將任何被選入開發集或測試集的詞排除在訓練集之外,因此評估結果總是針對被排除的詞。

除了英語外,研究人員還對其他六種語言(阿拉伯語、漢語、芬蘭語、韓語、俄語、泰語)進行評估,選擇這些語言是為了涵蓋影響模型學習拼寫能力的各種特性,對每一種語言的評估都重復上述數據集構建過程。

文本生成實驗

研究人員使用WikiSpell基準來評估多種預訓練的純文本模型在不同規模上的表現,包括T5(一個在英語數據上預訓練的character-blind編碼解碼器模型);mT5(與T5類似,但在超過100種語言上預訓練);ByT5(mT5的character-aware版本,直接在UTF-8字節序列上操作);以及PaLM(一個規模更大的解碼模型,主要是在英語上預訓練的)。

圖片

在純英語和多語言的實驗結果中,可以發現character-blind模型T5和mT5在包含Top-1%最頻繁詞匯的桶上的表現要差很多。

這個結果似乎是反直覺的,因為模型通常在數據中頻繁出現的例子上表現最好,但是由于subword詞匯的訓練方式,頻繁出現的詞通常被表示為一個單一的原子標記(或少量的標記),事實上也是如此:在英語前1%的桶中,87%的詞被T5的詞匯表示為一個子詞標記。

因此,較低的拼寫準確性分數表明,T5的編碼器沒有保留足夠的關于其詞匯中subword的拼寫信息。

其次,對于character-blind模型,規模是影響拼寫能力的一個重要因素。T5和mT5都隨著規模的增加而逐漸變好,但即使在XXL規模下,這些模型也沒有表現出特別強的拼寫能力。

只有當character-blind模型達到PaLM的規模時,才開始看到近乎完美的拼寫能力:540B參數的PaLM模型在英語的所有頻率桶中都達到了>99%的準確率,盡管它在提示中只看到20個例子(而T5顯示的是1000個微調例子)。

圖片

然而,PaLM在其他語言上的表現較差,可能是由于這些語言的預訓練數據少得多。

對ByT5的實驗表明,character-aware模型表現出更強大的拼寫能力。ByT5在Base和Large尺寸下的表現僅略微落后于XL和XXL(盡管仍然至少在90%的范圍內),而且一個詞的頻率似乎對ByT5的拼寫能力沒有太大影響。

ByT5的拼寫性能遠遠超過了(m)T5的結果,甚至與參數多于100倍的PaLM的英語表現相當,并且超過了PaLM在其他語言上的表現。

從而可知ByT5編碼器保留了相當多的字符級信息,而且這些信息可以根據解碼任務的需要從這些凍結的參數中檢索出來。

DrawText基準

從2014年發布的COCO數據集到2022年的DrawBench基準,從FID, CLIP得分到人類偏好等指標,如何評估text-to-image模型一直是一個重要的研究課題。

但目前在文本渲染和拼寫評估方面一直缺乏相關工作。

為此,研究人員提出了一個新的基準DrawText,旨在全面衡量文本到圖像模型的文本渲染質量。

DrawText基準由兩部分組成,分別測量模型能力的不同維度:

1)DrawText Spell,通過大量的英語單詞集合的普通單詞渲染進行評估;

研究人員從英語WikiSpell頻率桶中各抽取100個單詞,并將它們插入一個標準模板中,總共構建了500個提示。

對于每個prompt,從候選模型中抽取4張圖片,并使用人類評分和基于光學字符識別(OCR)的指標對其進行評估。

2)DrawText Creative,通過視覺效果的文本渲染進行評估。

視覺文本并不局限于像街道標志那樣的常見場景,文字可以以多種形式出現,如潦草的、繪畫的、雕刻的、雕塑的,等等。

如果圖像生成模型支持靈活而準確的文本渲染,這將使設計師能夠使用這些模型來開發創造性的字體、標志、布局等等。

為了測試圖像生成模型支持這些用例的能力,研究人員與一位專業的圖形設計師合作,構建了175個不同的提示,要求在一系列創造性的風格和設置中渲染文本。

圖片

許多提示超出了當前模型的能力,最先進的模型會表現出拼寫錯誤、丟棄或重復的單詞。

圖像生成實驗

實驗結果顯示,用于對比的9個圖像生成模型中在DrawText Spell基準上的準確率中,character-aware模型(ByT5和Concat)無論模型尺寸大小都優于其他模型,特別是在不常見單詞上。

圖片

Imagen-AR顯示了避免cropping的好處,盡管訓練時間長了6.6倍,其仍然比字character-aware模型表現差。

模型之間的另一個明顯的區別在于它們是否在多個樣本中持續地拼錯一個給定的單詞。

圖片

在實驗結果中可以看出,無論抽取多少個樣本,T5模型都有很多單詞拼錯,研究人員認為這表明文本編碼器中缺少字符知識。

相比之下,ByT5模型基本只會出現零星的錯誤。

圖片

通過測量模型在所有四個圖像樣本中持續正確(4/4)或持續錯誤(0/4)的比率可以量化這一觀察結果。

圖片

可以看到一個鮮明的對比,特別是在常見的詞上(前1%),即ByT5模型從未持續錯誤,而T5模型在10%或更多的詞上持續錯誤。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-04-10 06:30:00

2021-12-17 10:09:47

編碼器語言模型DeepMind

2017-11-10 12:45:16

TensorFlowPython神經網絡

2025-04-07 03:30:00

2023-04-25 21:36:07

火山引擎

2012-06-11 16:43:46

jQuery

2025-07-11 09:02:00

2024-06-03 10:56:53

2022-07-28 12:18:40

視覺語言模型

2025-04-08 04:20:00

2024-10-16 10:41:36

2021-12-13 17:53:19

谷歌Transformer技術

2025-04-11 00:16:00

模態編碼器MAECLIP

2022-03-07 09:47:28

信息檢索編碼器

2021-03-22 10:52:13

人工智能深度學習自編碼器

2021-03-29 11:37:50

人工智能深度學習

2021-11-02 20:44:47

數字化

2025-10-13 08:14:48

2023-01-05 13:11:20

模型
點贊
收藏

51CTO技術棧公眾號

91色视频在线| 亚洲一区在线| 精品视频在线免费看| 亚洲一区二区在| 亚洲精品视频专区| 久久伊人亚洲| 欧美精品免费在线| www.超碰97| 91精品一区| 日韩欧美在线观看| 国产经典久久久| 成在在线免费视频| 大白屁股一区二区视频| 国产成人综合av| 欧美精品99久久久| 凹凸成人精品亚洲精品密奴| 日韩欧美高清dvd碟片| 无码人妻h动漫| 亚洲奶水xxxx哺乳期| 久久日韩粉嫩一区二区三区| 国产精品视频自拍| wwwwww国产| 91精品蜜臀一区二区三区在线| 亚洲精品国产综合区久久久久久久 | 欧美韩国日本在线| 青春草免费在线视频| 国产欧美精品一区aⅴ影院| 国产精品国产亚洲精品看不卡15 | 日韩不卡一二三区| 久久久久久久久网站| 国产3级在线观看| 国产探花一区| 精品中文字幕久久久久久| 中文字幕1区2区| 国内精品视频| 欧美精品v国产精品v日韩精品| 人妻有码中文字幕| а√天堂8资源中文在线| 亚洲激情成人在线| 五月天av影院| 蜜桃视频网站在线观看| 国产日韩欧美精品综合| 久久资源亚洲| 瑟瑟在线观看| 91免费观看在线| 国产一区自拍视频| 色呦呦中文字幕| 不卡av在线免费观看| 97久久精品午夜一区二区| 国产又粗又大又爽| 男人的j进女人的j一区| 国产精品jizz在线观看麻豆| 久久精品视频7| 久久精品动漫| 国产高清视频一区三区| 欧美一区二区三区久久久| 亚洲欧美久久久| 日韩av电影手机在线| 无码人妻黑人中文字幕| 日韩中文字幕麻豆| 国产精品视频内| 一级黄色大毛片| 国产麻豆91精品| 国产精品v欧美精品v日韩| 国产精品久久婷婷| 国产激情视频一区二区三区欧美 | 青青久久av北条麻妃海外网| 久久人妻免费视频| 日韩电影网1区2区| 国产精品亚发布| 国产农村妇女毛片精品| 国产一区二区三区在线观看免费视频| 51精品国产人成在线观看| 国产高清不卡视频| zzijzzij亚洲日本少妇熟睡| 精品午夜一区二区| 成年人在线观看| 日韩一区欧美一区| 久艹在线免费观看| 正在播放日韩精品| 欧美日韩一区二区三区视频| 中文字幕 欧美日韩| 日韩三级网址| 亚洲精品有码在线| 少妇太紧太爽又黄又硬又爽小说 | 久久品道一品道久久精品| 婷婷四月色综合| 中文字幕资源网在线观看| 偷窥国产亚洲免费视频| www.xxx亚洲| 日韩一区免费| 曰本色欧美视频在线| 久久成人国产精品入口| 天堂蜜桃一区二区三区| 亚洲伊人成综合成人网| 四虎在线观看| 亚洲免费看黄网站| 国产免费成人在线| 天堂va欧美ⅴa亚洲va一国产| 亚洲精品丝袜日韩| 在线免费观看亚洲视频| 亚洲激情不卡| 91精品视频专区| 免费福利在线观看| 洋洋成人永久网站入口| 亚洲欧美激情网| 动漫视频在线一区| 日韩专区在线播放| 五月天婷婷久久| 国产精品亚洲第一| 视频一区二区三区在线观看| 影音先锋男人在线资源| 在线观看一区二区精品视频| 色哟哟无码精品一区二区三区| 欧美综合在线视频观看| 性欧美xxxx交| www.日日夜夜| 中文字幕视频一区| 欧在线一二三四区| 国内精品偷拍| 欧美高清在线视频观看不卡| 97超视频在线观看| 国产丝袜欧美中文另类| 男人的天堂狠狠干| 免费观看性欧美大片无片| 亚洲欧美一区二区精品久久久| 久久久久97国产| 精品一区二区三区香蕉蜜桃| 日本一区二区在线视频| 免费h在线看| 亚洲成色999久久网站| 青花影视在线观看免费高清| 麻豆一区二区99久久久久| 欧美日韩三区四区| 狼人综合视频| 亚洲成av人片在线观看香蕉| 免费一级肉体全黄毛片| 国产中文字幕一区| 在线免费观看成人| 超碰这里只有精品| 一区二区三区四区在线观看视频| 国产成人无码精品亚洲| 成人小视频免费在线观看| 永久免费网站视频在线观看| 97精品资源在线观看| 久久精品国产欧美激情| 91影院在线播放| 中文字幕制服丝袜成人av| 日本特黄a级片| 日韩中文首页| 成人激情春色网| 免费超碰在线| 91精品国产全国免费观看| 污软件在线观看| 国产一区二区在线看| 成人国产一区二区三区| 中文无码日韩欧| 久久男人av资源网站| 日日夜夜精品免费| 欧美性高潮在线| 91资源在线播放| 久久成人羞羞网站| 国产免费内射又粗又爽密桃视频| jazzjazz国产精品麻豆| 97久久伊人激情网| 免费在线观看一级毛片| 欧美三级乱人伦电影| www.av成人| 成人综合在线网站| av观看免费在线| 日本黄色精品| 91亚洲一区精品| yellow在线观看网址| 亚洲美女精品成人在线视频| 国产情侣免费视频| 亚洲精品成人少妇| 妖精视频一区二区| 日韩专区中文字幕一区二区| 国产三级中文字幕| 久久香蕉网站| 国产精品一区二区三区免费视频| fc2ppv国产精品久久| 亚洲第一色在线| 夜夜躁日日躁狠狠久久av| 亚洲精品亚洲人成人网| 欧美 变态 另类 人妖| 麻豆免费看一区二区三区| 国产精品视频网站在线观看| 一道在线中文一区二区三区| 91精品视频网站| 综合久久2023| 久久国产天堂福利天堂| 青青青手机在线视频观看| 精品视频999| 日韩黄色精品视频| 国产精品久久久久久久久久免费看| 日韩精品aaa| 视频一区在线播放| 欧美在线观看视频免费| 狠狠做六月爱婷婷综合aⅴ| av一区二区三区四区电影| 欧美日韩视频免费观看| 国产+成+人+亚洲欧洲| 欧美人xxx| 亚洲国产中文字幕久久网| 国产免费叼嘿网站免费| 色伊人久久综合中文字幕| 久久久久久久极品内射| 国产精品色一区二区三区| 艳妇乳肉亭妇荡乳av| 国产一区二区女| 亚洲免费一级视频| 午夜在线视频观看日韩17c| 四虎永久免费网站| 青青草国产免费一区二区下载| 国产精品国产亚洲精品看不卡15| 亚洲ww精品| 日本中文字幕成人| 91福利在线免费| 久热精品视频在线观看一区| h视频网站在线观看| 日韩电影中文字幕在线| 国产不卡av在线播放| 欧美日韩激情一区二区| 三级网站在线播放| 婷婷综合五月天| 久久国产精品波多野结衣| 国产精品国产三级国产普通话蜜臀| 中文字幕一二三四区| 成人成人成人在线视频| 日韩精品――色哟哟| 精品综合免费视频观看| 蜜桃免费在线视频| 日韩中文字幕亚洲一区二区va在线| 尤物av无码色av无码| 亚洲人成人一区二区三区| 黄黄视频在线观看| 综合激情婷婷| 99亚洲国产精品| 欧美在线精品一区| 超薄肉色丝袜足j调教99| 久久久久国产精品| 亚洲天堂av免费在线观看| 欧美高清视频在线观看mv| 三区精品视频观看| 欧美性感美女一区二区| 神马影院一区二区三区| 亚洲精品国产动漫| 日本午夜精品一区二区三区| 九一国产精品| 五月天婷亚洲天综合网鲁鲁鲁| 国产剧情在线观看一区| 午夜精品一区二区三区四区| 精品日韩在线| 在线观看国产一区| 久久久人成影片免费观看| youjizz.com亚洲| 一区二区三区四区日韩| 亚洲一区 在线播放| 在线看片一区| 精品人妻一区二区三区四区在线| 丝袜诱惑制服诱惑色一区在线观看 | 日韩美女一区二区三区| 丰满少妇被猛烈进入| 欧美videos大乳护士334| 日本美女一级片| 亚洲欧美福利视频| 波多野结衣在线网站| 久久精品99久久久久久久久| 99在线播放| 欧美性做爰毛片| 草民电影神马电影一区二区| 91久久久久久久久久久久久| 99精品中文字幕在线不卡| 狠狠色综合网站久久久久久久| 九热爱视频精品视频| 久久免费看毛片| 亚洲国产日本| 麻豆三级在线观看| 国产麻豆午夜三级精品| 日本黄色片在线播放| 欧美韩日一区二区三区| 印度午夜性春猛xxx交| 香蕉成人伊视频在线观看| 日本视频www色| 精品久久久久久久久久久院品网| 日韩电影网址| 久热精品在线视频| 在线中文字幕播放| 91香蕉电影院| 要久久爱电视剧全集完整观看| 一区二区三区国| 一本色道久久综合一区| 不卡的在线视频| 99re66热这里只有精品3直播| 久久久久久成人网| 午夜精品在线看| 一本一道精品欧美中文字幕| 日韩国产精品视频| 久cao在线| 国产成人av网址| 在线播放一区二区精品视频| 亚洲第一综合| 国产亚洲一级| 国内自拍偷拍视频| 中文久久乱码一区二区| 亚洲男人的天堂在线视频| 欧美精品在线视频| 国产专区在线| 97国产在线观看| 秋霞一区二区三区| 亚欧洲精品在线视频免费观看| 亚洲激情不卡| 可以看的av网址| 中文字幕一区二区三区在线播放| 91av在线免费视频| 欧美一区二区精美| 在线免费av电影| 青草青草久热精品视频在线网站 | 激情综合婷婷| 先锋影音网一区| 久久久久国内| 特级西西人体wwwww| 亚洲成人免费av| www.久久成人| 欧美成人一二三| 亚洲伊人伊成久久人综合网| 日本一区二区三区视频在线观看 | 欧美wwwww| 麻豆三级在线观看| 国产精品污www在线观看| 日本免费在线观看视频| 日韩国产精品视频| jizzjizz中国精品麻豆| 国产激情一区二区三区在线观看 | 亚洲大尺度网站| 欧美日本啪啪无遮挡网站| 亚洲精品乱码日韩| 亚洲精品无人区| 蜜桃视频在线一区| 成人一级片免费看| 欧美三级韩国三级日本一级| 川上优的av在线一区二区| 国产精品青青在线观看爽香蕉| 亚洲免费福利一区| 黄色a级片免费| 久久久蜜臀国产一区二区| 4438国产精品一区二区| 亚洲乱码av中文一区二区| 中文字幕在线官网| 欧美深深色噜噜狠狠yyy| 狂野欧美一区| 国产精品视频在| 欧美疯狂性受xxxxx喷水图片| 国产日产一区二区| 亚洲自拍偷拍福利| 国精品一区二区| 亚洲精品女人久久久| 色婷婷精品久久二区二区蜜臀av| 国产一级片在线播放| 国产精品自拍偷拍视频| 亚洲天天综合| 秘密基地免费观看完整版中文 | 亚洲婷婷综合久久一本伊一区| 国产精品爽爽久久| 精品自拍视频在线观看| 北条麻妃一区二区三区在线观看| 免费看国产曰批40分钟| 久久久99精品免费观看不卡| 中文字幕网址在线| 美日韩在线视频| 久久夜色电影| 久久综合伊人77777麻豆最新章节| 国产精品久久久久久亚洲伦| 精品人妻一区二区三区三区四区 | 九九热这里有精品| 日本丰满少妇黄大片在线观看| 成人午夜又粗又硬又大| 一级片在线观看免费| 久久精品国产69国产精品亚洲| 超碰cao国产精品一区二区| 久久国产色av免费观看| 国产精品嫩草久久久久| 性生活三级视频| 国产成人激情小视频| 一区二区在线影院| 欧美丰满少妇人妻精品| 欧美日韩成人综合天天影院 | 国产91在线播放| 亚欧美无遮挡hd高清在线视频| 亚洲天堂av网站| 精品视频999| 国产无遮挡裸体视频在线观看| 亚洲一区bb| 91丨九色丨蝌蚪富婆spa| 国产精品丝袜黑色高跟鞋| …久久精品99久久香蕉国产| 国产精品久久久久久影院8一贰佰| 在线天堂www在线国语对白| 欧美日韩国产123区|