精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」

發(fā)布于 2024-6-3 10:03
瀏覽
0收藏

最近的一系列研究表明,純解碼器生成模型可以通過訓(xùn)練利用下一個 token 預(yù)測生成有用的表征,從而成功地生成多種模態(tài)(如音頻、圖像或狀態(tài) - 動作序列)的新序列,從文本、蛋白質(zhì)、音頻到圖像,甚至是狀態(tài)序列。


能夠同時生成多種模態(tài)輸出的多模態(tài)模型一般是通過某種形式的詞匯擴展(將多模態(tài)表征轉(zhuǎn)換為離散 token 并添加到模型的基本詞匯表中)來實現(xiàn)的,即在預(yù)訓(xùn)練階段或在后期微調(diào)階段進行跨模態(tài)對齊。


多模態(tài)預(yù)訓(xùn)練方法具有很強的性能優(yōu)勢(例如,一個模型可以原生理解多種模態(tài)),但也有缺點。例如,無法解決如何在預(yù)訓(xùn)練后添加新模態(tài)的問題,也缺乏靈活性,因為添加另一種模態(tài)需要從頭開始訓(xùn)練一個新的模型,并進行超參數(shù)搜索,以獲得模態(tài)之間的最佳訓(xùn)練數(shù)據(jù)混合比。因此,這種解決方案不適合小眾模態(tài),特別是 IMU、蛋白質(zhì)序列等。


或者,將詞匯擴展到另一種模態(tài)可以在一個從未見過該模態(tài)的模型上進行預(yù)訓(xùn)練后進行。只在文本模態(tài)下訓(xùn)練的解碼器模型可以在上下文中遵循指令并從樣本中學習,通常是通過微調(diào)將另一種模態(tài)(如音頻或圖像功能)嫁接到現(xiàn)有的強大文本骨干上,以利用文本模態(tài)的可表達性和人類用戶的可控性。這樣做的缺點是骨干網(wǎng)絡(luò)的文本到文本功能會被破壞,由此產(chǎn)生的模型只能執(zhí)行其經(jīng)過微調(diào)的跨模態(tài)任務(wù)。


總體來說,無論是預(yù)訓(xùn)練還是微調(diào),都需要大量對齊的跨模態(tài)數(shù)據(jù),因此這兩種方法都不適用于沒有足夠數(shù)量以對齊多模態(tài)數(shù)據(jù)的模態(tài)。


Google DeepMind 近期提出了模塊化設(shè)計的新型架構(gòu) Zipper,它由多個單模態(tài)預(yù)訓(xùn)練解碼器模型組成。利用豐富的無監(jiān)督單模態(tài)數(shù)據(jù),Zipper 可以在單一模態(tài)中預(yù)訓(xùn)練強大的純解碼器模型,然后利用交叉注意力將多個這樣的預(yù)訓(xùn)練解碼器「壓縮」在一起,并利用有限的跨模態(tài)數(shù)據(jù)進行微調(diào),實現(xiàn)多模態(tài)生成能力。預(yù)訓(xùn)練的純解碼器模型可以在新的多模態(tài)組合中靈活地重復(fù)使用和再利用。


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

  • 論文標題:Zipper: A Multi-Tower Decoder Architecture for Fusing Modalities
  • 論文鏈接:https://arxiv.org/pdf/2405.18669


這是第一項研究靈活組合模態(tài)的工作,通過組合單獨預(yù)訓(xùn)練的單模態(tài)解碼器來實現(xiàn)多模態(tài)生成能力。


雖然 Zipper 架構(gòu)可在多種模態(tài)和兩種以上模態(tài)的骨干上通用,但這項工作的重點放在了僅融合兩種骨干(語音和文本)的實驗設(shè)置上。論文展示了 Zipper 在同時跨模態(tài)生成文本(自動語音識別(ASR)任務(wù))和語音(文本到語音任務(wù)(TTS))方面的強大能力。


僅使用部分文本 - 語音對齊數(shù)據(jù)(低至原始數(shù)據(jù)的 1%)進行的實驗表明,首先在無標記數(shù)據(jù)上對骨干進行單模態(tài)預(yù)訓(xùn)練,與使用詞匯擴展方法進行微調(diào)相比,Zipper 可以依賴更少的對齊數(shù)據(jù),這為使用解碼器 - 解碼器架構(gòu)融合模態(tài)提供了可能性,對于成對數(shù)據(jù)量有限的生成任務(wù)非常有用。


接下來,讓我們看看論文細節(jié)。


模型


Zipper 架構(gòu)由兩個自回歸解碼器 tower(或主干)組成,它們通過門控交叉注意力層「壓縮」在一起。每個骨干使用下一個 token 預(yù)測功能分別對單個模態(tài)進行訓(xùn)練。


圖 1 顯示了 Zipper 架構(gòu)的概覽。與 CALM 類似,在解碼器骨干之間的每 i 層都插入了交叉注意力層。在這些有規(guī)律交錯的層中,一種模態(tài)的表征被交叉注意力到另一種模態(tài)中。這與 Flamingo [4] 編碼器 - 解碼器設(shè)置不同,后者只在一個 tower(編碼器)的最后一層定期交叉注意力到另一個 tower(解碼器)的各層。


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

在交叉注意力過程中,投影層被插入模態(tài)之間。從功能上講,這可以均衡骨干之間的嵌入維度大小差異。從語義上講,它還能實現(xiàn)從一種模態(tài)到另一種模態(tài)的表征轉(zhuǎn)換,尤其是當一個或兩個骨干被凍結(jié)時。此外,在每個骨干網(wǎng)的輸入嵌入之后,還直接加入了一個非線性輸入投影層,以便更好地調(diào)整輸入的單模態(tài)表征,用于多模態(tài)任務(wù)。


在第一個 Transformer 塊之前(嵌入層之后),插入兩個可學習的多層感知器(MLP)投影,然后對每個骨干進行 ReLU 轉(zhuǎn)換:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

這樣做是為了讓單模態(tài)表征更好地適應(yīng)多模態(tài)設(shè)置。


讓 i_A 和 i_B 分別代表 A 層交叉到 B 層和 B 層交叉到 A 層的間隔。將 k 層單模解碼器 A 的隱藏表征法稱為 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

,其中 d_A 是 transformer A 的隱藏維度;同樣,將 l 層單模解碼器 B 的隱藏表征法稱為 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

,其中 d_B 是 transformer B 的相應(yīng)隱藏維度。設(shè) fcross (Q, K, V ) 是來自 [4] 的門控交叉注意力層,其后是前饋層,Q、K、V 分別是查詢、鍵和值。讓 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

和 

多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

分別代表 tower A 和 tower B 的線性前饋投影和全連接投影。


解碼器 A 中第 k 層的新表征多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)


具體如下:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

同樣,解碼器 B 第 l 層的新表征多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)為:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

最后,每個 tower 以一個 softmax 層(與同 tower 嵌入層共享)結(jié)束,以便利用下一個 token 預(yù)測任務(wù)將隱藏表征投射到(特定模態(tài) /tower)token 詞匯的概率分布中。


研究者將交叉注意力機制用于交錯序列的自動回歸訓(xùn)練,具體做法是只交叉關(guān)注原始線性序列中當前位置之前的另一種模態(tài)的數(shù)據(jù)。


在解碼過程中,輸出模態(tài)的序列是指定的(例如,[語音]、[文本]、[文本、語音])。模型以序列中的第一種模態(tài)生成輸出,直到遇到特殊的句末 token,這時才會切換到序列中的下一種模態(tài)。該過程一直持續(xù)到序列中的所有模態(tài)都被解碼為止。雖然可以擴展模型自動選擇輸出生成的模態(tài),但這一設(shè)置的通用化還需要后續(xù)的工作。


實驗


雖然 Zipper 可以擴展到任意數(shù)量的模態(tài),研究者率先評估了語音到文本生成和文本到語音(TTS)生成的自動語音識別(ASR)。


值得注意的是,雖然對 TTS 系統(tǒng)(合成語音)的標準評估依賴于人類反饋(平均意見分數(shù)),可以捕捉到語音的許多整體方面(如文本保真度和聲音質(zhì)量等),但這里的 TTS 評估只希望捕捉到架構(gòu)選擇對語義 token 建模和預(yù)測能力的影響。


表 1 列出了 ASR 任務(wù)的測試結(jié)果:


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

將 Zipper 與擴展詞匯量的單解碼器基線進行比較時,可以發(fā)現(xiàn) Zipper 在 test-clean 子集上的性能略好,而在噪音較高的語音 test-other 子集上的性能則略有下降,總體性能相當接近。


表 2 列出了在 LibriTTS 數(shù)據(jù)集的 test-clean 分割上進行 TTS 任務(wù)的結(jié)果。


多模態(tài)大模型不夠靈活,谷歌DeepMind創(chuàng)新架構(gòu)Zipper:分開訓(xùn)練再「壓縮」-AI.x社區(qū)

可以看出,Zipper 模型明顯優(yōu)于單解碼器模型,Zipper S/128M unfrozen model 模型提高了 13 個 WER 點(相對誤差減少 40%),Zipper L/1B unfrozen model 模型提高了 12 個 WER 點(相對誤差減少 38%)。


研究者還觀察到,與使用凍結(jié)骨干網(wǎng)絡(luò)相比,在訓(xùn)練過程中解凍語音骨干網(wǎng)絡(luò)可持續(xù)改善所有尺寸 Zipper 模型的性能,這驗證了直覺 —— 微調(diào)語音骨干網(wǎng)絡(luò)的參數(shù)比僅依賴交叉注意力產(chǎn)生的模態(tài)對齊效果更好。


更多研究細節(jié),可參考原論文。


本文轉(zhuǎn)自 機器之心 ,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/F8wstkJyYiNJCbSqYq3Pbw??

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
午夜影院在线看| 国产一区二区三区中文| 国产精品v欧美精品∨日韩| 小嫩苞一区二区三区| 欧美影院在线| 亚洲另类在线制服丝袜| 成人a免费视频| 国产网址在线观看| 成人vr资源| 欧美夫妻性生活| 国产精品无码av在线播放| 福利在线观看| 久久亚洲美女| 欧美裸体男粗大视频在线观看 | 国内精品伊人久久久久av一坑| 精品国产一区二区三区久久狼黑人| 亚洲性生活网站| 性欧美猛交videos| 久久尤物电影视频在线观看| 日韩国产综合| 亚洲人被黑人高潮完整版| 精品视频第一区| 日韩不卡高清视频| 在线日韩中文| 久久国产精品久久精品| 性欧美13一14内谢| 国产精品一区二区三区www| 精品久久久国产精品999| 麻豆蜜桃91| 国产成人av免费看| 国产精品毛片| 久久精品成人动漫| 无码人妻一区二区三区一| 97精品国产综合久久久动漫日韩| 亚洲欧美视频在线观看| 日韩欧美一区二区三区四区| 国产三级小视频| 美女脱光内衣内裤视频久久网站| 国产91精品黑色丝袜高跟鞋 | 亚洲国产综合人成综合网站| 茄子视频成人在线观看 | 在线播放国产一区中文字幕剧情欧美 | 亚洲最新在线观看| 免费看av软件| 日本成人网址| 91老师片黄在线观看| 国产精品亚洲综合| 国产欧美日韩成人| 免费成人av在线| 国产精品日韩一区| 曰批又黄又爽免费视频| 美女视频网站黄色亚洲| 国产精品日日做人人爱| 9i精品福利一区二区三区| 亚洲在线电影| 麻豆专区一区二区三区四区五区| 欧美老女人第四色| 色悠悠久久综合网| 国产一区二区三区四区五区3d| 在线观看免费成人| 亚洲36d大奶网| 亚洲天堂网站| 日韩一二三四区| 中文字幕久久av| 欧美电影在线观看一区| 欧美一区二区三区色| 第四色婷婷基地| 精品一区二区三区亚洲| 日韩免费一区二区| 欧美成人三级伦在线观看| 成人涩涩网站| 亚洲国产欧美在线成人app | 中文日韩在线| 两个人的视频www国产精品| 成人18视频免费69| 2023国产精品久久久精品双| 久久久精品久久| 国产一区二区精彩视频| 欧美成人日韩| 九九久久国产精品| 成人性视频免费看| 久久社区一区| 久久久久久久久91| 国产成人精品一区二三区| 另类av一区二区| 国产精品免费在线免费| 亚洲av综合一区| 日本美女一区二区三区| 国产主播喷水一区二区| 成人av一区二区三区在线观看| 久久精品国产精品亚洲精品| 欧美在线欧美在线| 岳乳丰满一区二区三区| 国产91精品免费| 99精彩视频在线观看免费| 性欧美xxxx视频在线观看| 午夜不卡久久精品无码免费| 欧美深夜视频| 在线日韩精品视频| 激情高潮到大叫狂喷水| 欧美视频在线观看| 性欧美暴力猛交69hd| 精品视频久久久久| 日韩视频在线一区二区三区| 97在线免费视频| 一级特黄免费视频| 国产一区二区美女诱惑| 久久免费99精品久久久久久| av在线电影免费观看| 亚洲精品免费电影| 精品这里只有精品| 欧美一区二区三区婷婷| 日韩精品中文字幕一区二区三区 | 成人高清dvd| 日本精品600av| 高跟丝袜一区二区三区| 天天色天天综合网| 欧美深夜视频| 欧美人交a欧美精品| 免费黄色一级大片| 国产成人av电影在线| 欧美日韩国产综合在线| 在线观看a视频| 午夜欧美在线一二页| 亚洲一区精品视频在线观看| 国内精品国产成人国产三级粉色| 中文字幕日韩欧美在线视频| 九九九在线观看| 国产麻豆成人传媒免费观看| 免费看成人片| 爱情岛论坛亚洲品质自拍视频网站| 婷婷久久综合九色综合绿巨人| 一本一道久久a久久综合蜜桃| 视频福利一区| 久久久久免费精品国产| 中文字幕视频二区| 久久精品亚洲精品国产欧美kt∨| 日韩精品一区二区在线视频 | 大桥未久恸哭の女教师| 日韩欧美一区免费| 日av在线播放中文不卡| 在线亚洲欧美日韩| 久久久综合视频| 国产美女主播在线| 久久久人成影片一区二区三区在哪下载 | 日韩免费高清一区二区| 欧美a级在线观看| 欧美一区二区视频免费观看| 亚洲av网址在线| 综合一区在线| 成人h视频在线观看播放| 麻豆导航在线观看| 国产精品国产三级国产aⅴ无密码| 国产二级片在线观看| 日韩欧国产精品一区综合无码| 精品丝袜一区二区三区| 国产小视频在线看| 麻豆精品新av中文字幕| 日韩精品欧美专区| 澳门av一区二区三区| 亚洲视频国产视频| 久久夜色精品国产噜噜亚洲av| 99久久夜色精品国产网站| 波多野结衣 作品| 91麻豆精品国产综合久久久 | 中文国产在线观看| 欧美亚洲激情| 91在线小视频| 亚洲一区二区三区四区视频| 国产精品国产高清国产| 午夜激情久久久| 四虎精品一区二区| 99精品视频免费观看| 精品毛片久久久久久| 182在线视频观看| 欧美不卡一区二区三区四区| 成人午夜视频在线播放| 久久综合色鬼综合色| 一级黄色香蕉视频| 国产成人一区二区三区影院| 国产精品久久久久久久久久ktv| 成年人在线免费观看| 欧美日本在线播放| 超碰97av在线| 日韩在线卡一卡二| 亚洲精品成人a8198a| 粉嫩一区二区三区在线观看| 欧美日韩成人精品| 香港三日本三级少妇66| 91国在线观看| 亚洲一级理论片| 国产aⅴ综合色| av免费观看网| 日韩电影免费在线观看| 91蜜桃网站免费观看| 992kp快乐看片永久免费网址| 国产成人精品一区二区三区视频 | av在线免费网址| 亚洲成人av片| 青青国产在线视频| 亚洲精品视频在线观看网站| 日韩精品视频一区二区| 99av国产精品欲麻豆| 色一情一区二区三区四区| 久久精品九色| 91精品国产91久久久久久| 日本视频在线播放| 日韩欧美一区中文| 丰满少妇xoxoxo视频| 国产精品久久久久久久午夜片| 久久人人爽人人片| 免费亚洲网站| 欧美精品在欧美一区二区| 亚洲人成精品久久久| 国产精品日韩在线| 黑人精品一区| 欧美国产日产韩国视频| 日本黄色一区二区三区| 欧美日韩精品一二三区| 国产精品老女人| 亚洲国产精品精华液2区45| 色偷偷噜噜噜亚洲男人| 五月婷婷视频在线| 亚洲色图清纯唯美| 人妻少妇一区二区| 国产成人精品一区二区三区四区 | 全网免费在线播放视频入口| 国产精品1区2区| 免费国产成人av| 中文字幕一区二区三三| 性欧美videosex高清少妇| 成年永久一区二区三区免费视频| 欧美一级大片在线免费观看| 18av在线视频| 日韩国产在线看| 成人午夜视频一区二区播放| 欧美综合色免费| 日本中文字幕在线| 亚洲一区二区在线视频| www.黄色在线| www久久精品| 怡红院一区二区| 久久99国产精品免费| 粉嫩av一区二区三区天美传媒| 99国产精品一区二区| 欧美精品在线一区| 欧美一性一交| 亚洲tv在线观看| 在线免费成人| 成人久久一区二区| 欧洲亚洲精品| 国产精品扒开腿做爽爽爽男男| 中文字幕21页在线看| 97在线视频精品| 国产福利在线免费观看| 欧美另类在线播放| 免费看电影在线| 欧美激情性做爰免费视频| 欧美三级黄网| 色综合视频网站| 大片免费在线观看| 久久夜色精品国产欧美乱| 免费国产精品视频| 亚洲国产美女久久久久| 肉丝一区二区| 日韩av有码在线| 久久国产免费视频| 国产伦一区二区三区| 国产伦精品一区二区三区免| 6080亚洲理论片在线观看| 成人国产1314www色视频| 91亚洲精品视频在线观看| 91中文字幕在线观看| 国产精品一站二站| 国产精品.com| 视频福利一区| 日韩免费av一区二区三区| 国产一区网站| 免费看av软件| 亚洲成人在线| 国产极品在线视频| 久久天堂精品| www亚洲成人| 韩国毛片一区二区三区| 少妇欧美激情一区二区三区| 成人高清视频在线观看| 日本黄色特级片| 亚洲国产高清在线观看视频| 美女伦理水蜜桃4| 97se亚洲国产综合自在线观| 日本少妇xxxxx| 亚洲欧美在线高清| 欧美日韩国产精品一区二区三区| 欧美日韩一区二区在线 | 伊人免费在线| 欧美成人免费网| 神马午夜伦理不卡| 国产精品成人久久久久| 麻豆国产精品| 蜜桃视频日韩| 婷婷综合亚洲| 男人日女人下面视频| 蜜臀av一区二区三区| 国产a√精品区二区三区四区| 久久色视频免费观看| 操她视频在线观看| 亚洲欧美成aⅴ人在线观看| 久久免费激情视频| 欧美一区二区三区色| 色天堂在线视频| 亚洲男人天堂2023| 国产在线观看a| 91福利视频网| 国产美女精品视频免费播放软件| 国产厕所精品在线观看| 91成人超碰| 成人在线免费观看视频网站| 影音先锋久久资源网| 一区二区三区视频网| 97久久久精品综合88久久| 日本 欧美 国产| 欧美私模裸体表演在线观看| 99国产精品99| 国产一区二区三区四区五区入口 | 岛国一区二区在线观看| 欲求不满的岳中文字幕| 久久久精品黄色| 国产精品久久久免费观看| 亚洲人精品午夜| 天堂网视频在线| 精品成人免费观看| 麻豆传媒视频在线观看免费| 5566日本婷婷色中文字幕97| 日韩黄色av| 99re99热| 欧美一级久久| 又黄又色的网站| 91啪九色porn原创视频在线观看| 97在线观看免费高| 在线观看www91| 色欲av永久无码精品无码蜜桃 | 亚洲欧美综合一区二区| 日韩专区中文字幕| 狂野欧美性猛交xxxx| 欧美精品v日韩精品v国产精品| 好看的日韩av电影| 伊人精品视频在线观看| www.色精品| 欧美成人片在线观看| 日本高清无吗v一区| 日日躁夜夜躁白天躁晚上躁91| 日韩视频免费观看| 亚洲优女在线| 精品久久久久久乱码天堂| 国产字幕视频一区二区| 久久精品影视大全| 国产精品欧美久久久久一区二区| 狠狠躁夜夜躁人人爽天天高潮| 日韩欧美国产小视频| h视频在线免费观看| 92看片淫黄大片欧美看国产片| 久久在线电影| 久久无码人妻一区二区三区| 亚洲人妖av一区二区| 精品国产av一区二区| 九九热这里只有精品6| 韩国三级大全久久网站| 一区二区三区国| 国产精品系列在线观看| 好吊日在线视频| 这里只有精品免费| 中文字幕中文字幕在线中高清免费版 | 91精品国产自产在线观看永久∴| 日本xxxxxxx免费视频| av在线这里只有精品| 日本a在线免费观看| 疯狂欧洲av久久成人av电影| 亚洲国产激情一区二区三区| 久久99国产精品久久99| 久久97人妻无码一区二区三区| 国产午夜精品久久久久久久| 潘金莲一级淫片aaaaaa播放| 在线精品国产欧美| 亚洲综合伊人| 男人天堂手机在线视频| 久久亚洲二区三区| 国产精品国产三级国产专区52 | 国产精品久久久久久久龚玥菲 | 香蕉大人久久国产成人av| 国产午夜福利100集发布| 国产在线精品不卡| 3d动漫精品啪啪一区二区下载| 色天使色偷偷av一区二区| 成人高清免费在线播放| 亚洲一区二区三区在线免费观看| 一区二区亚洲| 视频二区在线播放| 欧美日韩精品在线视频| av在线首页| 国产福利成人在线|