精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型 精華

發布于 2024-12-12 14:46
瀏覽
0收藏

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

論文鏈接:https://arxiv.org/pdf/2412.01064
github鏈接:https://deepbrainai-research.github.io/float/

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

亮點直擊

  • FLOAT,這是一種基于流匹配的音頻驅動說話者頭像生成模型,利用了學習的運動隱空間,比基于像素的隱空間更高效和有效。
  • 引入了一種簡單而有效的基于Transformer的流向量場預測器,用于時間一致的運動隱空間采樣,這也使得語音驅動的情感控制成為可能。
  • 大量實驗表明,與基于擴散和非擴散的方法相比,FLOAT達到了最先進的性能。

總結速覽

解決的問題

  • 在基于擴散的生成模型中,迭代采樣導致時間一致的視頻生成困難。
  • 如何實現快速采樣以提高生成效率。
  • 如何在音頻驅動的頭像圖像動畫中自然地融入情感和表現力豐富的動作。

提出的方案

  • 將生成建模從基于像素的隱空間轉移到學習的運動隱空間,以實現更高效的時間一致運動設計。
  • 引入基于Transformer的向量場預測器,具有簡單而有效的逐幀條件機制。

應用的技術

  • 流匹配生成模型,用于優化運動隱空間的學習。
  • Transformer模型,用于預測流向量場,實現時間一致的運動采樣。
  • 逐幀條件機制,確保時間一致性并支持語音驅動的情感控制。

達到的效果

  • 在視覺質量上,生成的頭像更加逼真,表現力更豐富。
  • 在運動保真度上,動作更加自然流暢。
  • 在效率上,相較于基于擴散和非擴散的方法,FLOAT具有更高的采樣速度和生成效率。
  • 支持語音驅動的情感增強,能夠自然地融入表現力豐富的動作。

方法:音頻驅動的說話頭像的流程匹配

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

運動隱空間自動編碼器

近期的說話頭像方法利用了Stable Diffusion (SD) 的VAE,因為其具有豐富的基于像素的語義隱空間。然而,當應用于視頻生成任務時,這些方法常常難以生成時間一致的幀 [8, 29, 76, 89, 101]。因此,第一個目標是為逼真的說話頭像獲得良好的運動隱空間,能夠捕捉全局(例如頭部運動)和細粒度局部(例如面部表情、嘴部運動、瞳孔運動)動態。為此,我們采用隱空間圖像動畫器 (LIA) 作為我們的運動自動編碼器,而不是使用SD的VAE。關鍵區別在于訓練目標:LIA被訓練為從同一視頻片段中采樣的源圖像重建驅動圖像,這要求隱空間編碼包含能夠捕捉時間上相鄰和遠離的運動的隱式運動。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

運動隱空間中的流匹配

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

語音驅動的情感標簽。 如何使說話動作更具表現力和自然性?在說話過程中,人類通過聲音自然地反映出他們的情感,而這些情感會影響說話的動作。例如,一個悲傷說話的人可能更傾向于搖頭并避免眼神接觸。這種由情感引發的非語言動作對說話者頭像的自然性有著重要影響。


現有的工作 [30, 81, 90] 使用圖像-情感配對數據或圖像驅動的情感預測器 [63] 來生成情感感知的動作。相比之下,我們結合了語音驅動的情感,這是一種更直觀的音頻驅動說話者頭像的情感控制方式。具體來說,我們利用一個預訓練的語音情感預測器,它輸出七種不同情感的 softmax 概率:憤怒、厭惡、恐懼、快樂、中性、悲傷和驚訝,然后我們將其輸入到 FMT 中。


然而,由于人們在說話時并不總是表現出單一、明確的情感,僅憑音頻來判斷情感往往是模糊的。簡單地引入語音驅動的情感可能會使情感感知的動作生成更加困難。為了解決這個問題,我們在訓練階段將情感與其他驅動條件一起注入,并在推理階段對其進行修改。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

我們擴展了 CFV 到增量 CFV,以便分別調整音頻和情感,靈感來自 [3]:

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

采樣后,ODE 求解器接收估計的向量場,通過數值積分計算運動隱空間變量。我們通過實驗發現,FLOAT 可以在大約 10 次函數評估(NFE)內生成合理的運動。

最后,我們將源身份隱空間變量添加到生成的運動隱空間變量中,并使用運動隱空間變量解碼器將其解碼為視頻幀。

實驗

數據集和預處理

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

經過預處理后,對于 HDTF,我們使用了總計 11.3 小時的 240 個視頻,這些視頻包含 230 個不同的身份用于訓練,并使用 78 個不同身份的視頻進行測試,每個視頻長 15 秒。對于 RAVDESS,我們使用 22 個身份的視頻進行訓練,剩余 2 個身份的視頻用于測試,每個視頻長 3-4 秒,代表 14 種情感強度。請注意,兩個數據集中訓練和測試的身份是不重疊的。

實現細節

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

評估

指標和基線。 為了評估圖像和視頻生成的質量,我們測量了Fréchet Inception Distance (FID) 和16幀的Fréchet Video Distance (FVD)。對于面部身份、表情和頭部運動,我們分別測量了身份embedding的余弦相似度 (CSIM)、表情FID (E-FID) 和姿態FID (P-FID)。最后,我們測量了音頻與視覺對齊的唇同步誤差距離和置信度 (LSE-D 和 LSE-C)。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

我們將我們的方法與當前最先進的語音驅動說話者頭像方法進行比較,這些方法的官方實現是公開可用的。對于非擴散方法,我們與SadTalker和EDTalk進行比較。對于擴散方法,我們與AniTalker、Hallo和EchoMimic進行比較。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

比較結果。在上表1和上圖4中,我們分別展示了定量和定性的比較結果。FLOAT在大多數指標和視覺質量上都優于兩個數據集中的其他方法。

消融研究

關于FMT和流匹配的消融研究。 我們將使用逐幀AdaLN(和門控)并通過掩碼自注意力將條件分離與注意力分開的FMT,與同時執行條件和注意力的基于交叉注意力的Transformer進行比較。如下表2所示,這兩種方法都在圖像和視頻質量上表現出競爭力,而FMT在表情生成和唇同步方面表現更佳。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

對NFE的消融研究。 一般來說,增加函數評估次數(NFE)可以減少ODE的解誤差。如下表3所示,即使在NFE=2較小的情況下,FLOAT也能實現有競爭力的圖像質量(FID)和唇同步(LSE-D)。然而,它在捕捉一致且富有表現力的動作(FVD和E-FID)方面表現不佳,導致頭部動作不穩和表情靜態。這是因為FLOAT在隱空間中生成動作,而圖像保真度由自動編碼器決定。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

進一步的研究

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

值得注意的是,引入姿態參數顯著改善了圖像和視頻指標。這是因為驅動的頭部姿態有助于捕捉目標分布的頭部姿態。此外,語音驅動的情感和圖像驅動的情感都一致地提高了在情感密集數據集中生成的動作質量,其中圖像驅動的情感取得了略好一些的指標。這是因為與語音驅動的方法相比,圖像驅動的方法稍微不那么模糊。


重定向語音驅動的情感。 由于 FLOAT 是在情感密集型視頻數據集上訓練的,我們可以通過手動將預測的情感標簽重定向為另一種(例如,一個獨熱標簽),在推理時將生成的情感感知說話動作更改為不同的情感。如下圖7所示,當從語音預測的情感復雜或模糊時,這可以實現手動重定向。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

用戶研究。 在下表 6 中,我們進行了一項基于平均意見得分(MOS)的用戶研究,以比較每種方法的感知質量(例如,牙齒清晰度和情感自然性)。我們使用基線和 FLOAT 生成了 6 個視頻,并請 15 名參與者根據五個評估因素對每個生成的視頻進行 1 到 5 的評分。如下表 6 所示,FLOAT 優于基線。

擊敗擴散和非擴散奪得SOTA!FLOAT:基于流匹配的音頻驅動說話者頭像生成模型-AI.x社區

結論

FLOAT,這是一種基于流匹配的音頻驅動說話者頭像生成模型,利用了學習到的運動隱空間。引入了一個基于transformer的矢量場預測器,實現了時間上一致的運動生成。此外,將語音驅動的情感標簽納入運動采樣過程,以提高音頻驅動說話動作的自然性。FLOAT 通過流匹配減少采樣時間,同時實現了卓越的樣本質量,解決了當前基于擴散的方法在生成說話者頭像視頻時的核心限制。大量實驗驗證了 FLOAT 在視覺質量、運動逼真度和效率方面達到了最新的性能。


本文轉自AI生成未來 ,作者:AI生成未來


原文鏈接:??https://mp.weixin.qq.com/s/i0ysU0vnEcG0ZKiiCrjOBA??

標簽
收藏
回復
舉報
回復
相關推薦
国产精品免费一区| 日韩欧美高清一区| 在线播放豆国产99亚洲| 亚洲爱爱综合网| 香蕉成人久久| 久久精品国产亚洲| 久久久久久久久久久国产精品| 激情久久一区二区| 五月婷婷色综合| 亚洲日本无吗高清不卡| 天天射,天天干| 精品午夜久久福利影院| 88国产精品欧美一区二区三区| 久久久久久成人网| 国产精品18hdxxxⅹ在线| 欧美色xxxx| 97超碰在线视| h视频在线观看免费| 丁香婷婷综合色啪| 国产免费亚洲高清| 亚洲影院在线播放| 国产精品大片免费观看| 日韩在线免费视频| 欧美图片一区二区| 精品国产午夜肉伦伦影院| 6080日韩午夜伦伦午夜伦| 国产福利视频在线播放| 牛牛精品在线视频| 亚洲人成网站在线| 天天综合狠狠精品| 你懂的免费在线观看视频网站| 国产成人精品在线看| 国产免费亚洲高清| 自拍偷拍福利视频| 久久三级视频| 91国产视频在线播放| 国产精品我不卡| 午夜免费一级片| 欧美特大特白屁股xxxx| 欧美日韩国产黄| 欧美精品自拍视频| 波多野结衣在线播放| 亚洲欧美日韩一区二区| 中文字幕精品一区日韩| 国产在线播放av| 久久久亚洲高清| 久久综合入口| 男操女在线观看| 久久久三级国产网站| 精品午夜一区二区| 十八禁一区二区三区| 成人小视频在线| 国产乱码精品一区二区三区日韩精品| www.色呦呦| 粉嫩在线一区二区三区视频| yy111111少妇影院日韩夜片| 亚洲精品视频网| 岛国精品在线播放| 极品尤物一区二区三区| 婷婷色在线观看| 97久久精品人人澡人人爽| 精品综合久久| 日韩欧美电影在线观看| 国产人成亚洲第一网站在线播放| 日本在线观看不卡| 日本中文字幕伦在线观看| 国产精品高清亚洲| 中文字幕在线亚洲三区| 91最新在线视频| 亚洲一区免费在线观看| 黄色一级在线视频| 日韩伦理三区| 欧美嫩在线观看| 免费黄视频在线观看| 91成人午夜| 精品亚洲国产视频| 日韩一区二区三区四区视频| 香蕉综合视频| 国内精品小视频在线观看| 91美女免费看| 久久精品av麻豆的观看方式| 波多野结衣精品久久| 日本在线一二三| 国产精品美女一区二区三区 | 久久在线观看视频| 精品在线免费观看视频| 丝袜诱惑亚洲看片| 亚洲综合一区二区不卡| 午夜18视频在线观看| 中文字幕免费不卡在线| 97超碰在线视| 欧洲成人一区| 亚洲第一国产精品| 国产18无套直看片| 亚洲三级视频| 国产精品主播视频| 日韩在线观看视频一区| 中文字幕国产一区二区| 国产精品久久久久9999爆乳| av高清一区| 精品久久久久久久人人人人传媒| 91网站免费视频| 亚洲小说欧美另类社区| 国产精品都在这里| 污视频在线免费| 亚洲蜜臀av乱码久久精品| 日韩黄色片视频| 亚洲视频一起| 日韩中文字幕av| 九一国产在线观看| 国产成人午夜99999| 日韩一二三区不卡在线视频| 国产嫩草在线视频| 欧美蜜桃一区二区三区| 国精产品一区一区三区免费视频| 欧美日韩亚洲一区三区| 国产精品日韩欧美大师| 色综合888| 亚洲国产综合在线| 天天久久综合网| 日本女优一区| 国产成人在线亚洲欧美| 国产精品国产高清国产| 亚洲一区在线观看网站| 性鲍视频在线观看| 97国产成人高清在线观看| 国产97在线观看| 青青草视频在线观看| 性做久久久久久久免费看| 日韩不卡的av| 欧美1区2区3区| 91久久精品在线| 91.xxx.高清在线| 色婷婷精品久久二区二区蜜臀av| 9191在线视频| 欧美日韩亚洲一区在线观看| 97人人模人人爽视频一区二区| 女女色综合影院| 欧美嫩在线观看| 一区二区三区影视| 国产最新精品精品你懂的| 亚洲一区3d动漫同人无遮挡| 成人免费视频观看| 中文字幕在线日韩| 又骚又黄的视频| 一区精品在线播放| 99re6在线观看| 外国成人免费视频| 成人羞羞国产免费| av片在线观看免费| 精品国产一区二区三区久久久蜜月| 久草视频手机在线| 国产精品一级在线| 国产精品69久久久| 免费日韩一区二区三区| 136fldh精品导航福利| 婷婷五月综合激情| 91官网在线免费观看| 欧美巨胸大乳hitomi| 免费观看成人av| 男女啪啪的视频| 精品视频在线观看网站| 欧美肥婆姓交大片| 人妻妺妺窝人体色www聚色窝 | 最新中文字幕免费| 国产精品日日摸夜夜摸av| 手机在线国产视频| 欧美体内she精视频在线观看| 国产精选在线观看91| 欧美在线极品| 少妇高潮久久77777| 国产片高清在线观看| 亚洲午夜久久久久| 极品人妻videosss人妻| 国内一区二区视频| 尤物av无码色av无码| 黑丝美女一区二区| 91色视频在线观看| 国产乱码精品一区二三赶尸艳谈| 国产偷亚洲偷欧美偷精品| 亚洲天堂aaa| 亚洲已满18点击进入久久| 成年人在线观看av| 久久99最新地址| 日本手机在线视频| 精品久久网站| 999日本视频| 欧美aa视频| 色综合导航网站| 国产视频精选在线| 日韩欧美国产1| 最新国产中文字幕| 亚洲成va人在线观看| www.日本高清视频| av在线播放不卡| 日韩av.com| 国产精品久久久久9999高清| 亚洲美女搞黄| 亚洲v天堂v手机在线| 91精品国产综合久久久久久丝袜| sis001欧美| 欧美激情啊啊啊| 91精品国产综合久久久久久豆腐| 精品久久久影院| 一区二区三区www污污污网站| 婷婷综合另类小说色区| 国模无码国产精品视频| 中文字幕精品在线不卡| 久久午夜夜伦鲁鲁片| 国内成+人亚洲+欧美+综合在线| heyzo国产| 国产精品av一区二区| 亚洲无玛一区| 九色精品91| 国外成人在线视频网站| 伊人久久大香伊蕉在人线观看热v| 97视频在线观看网址| 性爱视频在线播放| 日韩中文视频免费在线观看| 精品视频一二三| 日韩电影大全免费观看2023年上| 99久久国产免费| 精品视频1区2区3区| 69亚洲精品久久久蜜桃小说| 五月婷婷激情综合| 久久久久久久久久一区二区三区| 中文字幕一区二区三| 五月天精品在线| 国产日韩av一区二区| 极品粉嫩小仙女高潮喷水久久| 国产aⅴ综合色| 人妻换人妻仑乱| 国产一区二区三区四区五区美女| 亚洲综合欧美激情| 日本不卡中文字幕| 99久久国产宗和精品1上映| 国产精品一二| 国产精品va无码一区二区| 亚洲黄色毛片| 少妇av一区二区三区无码| 激情文学一区| 国产毛片视频网站| 亚洲第一在线| 欧美黑人经典片免费观看| 99热在线精品观看| 国产无限制自拍| 亚洲免费成人| 欧洲av无码放荡人妇网站| 亚洲欧美成人| 午夜免费精品视频| 奇米综合一区二区三区精品视频| 亚洲精品视频导航| 日本一区中文字幕 | 日韩毛片网站| 成人免费视频a| 欧美h版在线观看| yellow视频在线观看一区二区| 激情小说一区| 久久综合九色综合网站| 欧美亚洲国产精品久久| 一区二区精品视频| 国产综合网站| 91视频 -- 69xx| 日日摸夜夜添夜夜添国产精品 | 欧美美女黄色网| 国产精品v一区二区三区 | 久久国产精品99久久人人澡| 国产又黄又猛的视频| 粉嫩久久99精品久久久久久夜| 国产白袜脚足j棉袜在线观看 | 美女三级黄色片| 亚洲综合图片区| av网站中文字幕| 欧美日韩国产影片| 亚洲国产剧情在线观看| 日韩经典中文字幕| aiai在线| 久久免费在线观看| 88xx成人永久免费观看| 成人午夜激情网| 亚洲+小说+欧美+激情+另类| 在线视频不卡国产| 日韩一区二区免费看| 国产三级三级三级看三级| 国产精品一区二区在线观看不卡| 在线观看国产三级| 国产精品久久久爽爽爽麻豆色哟哟| 一区二区三区四区五区| 疯狂蹂躏欧美一区二区精品| 国产精品久久久久久久免费| 亚洲国产毛片完整版| 日本高清中文字幕在线| 97色在线观看| 北岛玲精品视频在线观看| 久久婷婷国产综合尤物精品| 国产精品99视频| 免费日韩视频在线观看| 国产乱码精品一区二区三| 亚洲精品国产91| 亚洲一区二区三区影院| 在线视频1卡二卡三卡| 亚洲第一网站免费视频| 日本三级在线视频| 国产成人免费av电影| 99re6热只有精品免费观看| 亚洲高清视频一区二区| 国产精品三上| 国产黄色一区二区三区| 中文字幕不卡在线播放| 国产精品人人人人| 精品奇米国产一区二区三区| 免费网站黄在线观看| 国产精品69久久| 日韩欧美ww| 精品国偷自产一区二区三区| 精品影院一区二区久久久| 伊人网在线视频观看| 黄色成人av在线| 高h调教冰块play男男双性文| 国产亚洲欧美视频| 男人最爱成人网| 久久精品国产第一区二区三区最新章节| 欧美二区不卡| www,av在线| 国产精品国产自产拍在线| 日日夜夜狠狠操| 亚洲欧美日韩高清| 老牛影视精品| 黑人中文字幕一区二区三区| 亚洲天堂男人| 在线播放第一页| 一区二区三区视频在线看| 91欧美日韩麻豆精品| 中文字幕在线看视频国产欧美在线看完整| 中文在线аv在线| 久久av一区二区三区亚洲| 亚洲精品九九| youjizz.com国产| 亚洲成av人影院在线观看网| 亚洲精品国产一区二| 色综合久久88色综合天天看泰| 国产精品亚洲四区在线观看| 精品久久免费观看| 狠狠色伊人亚洲综合成人| 永久av免费网站| 欧美福利电影网| 中文在线手机av| 91在线观看网站| 亚洲视频一二| 国产激情视频网站| 福利视频一区二区| 成人jjav| 成人www视频在线观看| 一区二区三区四区电影| 日本美女久久久| 午夜精品福利久久久| 日韩a在线观看| 国产精品丝袜久久久久久高清| 99久久婷婷国产综合精品电影√| 日韩成人av免费| 亚洲综合男人的天堂| 神马久久久久久久久久| 国产91精品在线播放| 色偷偷综合网| 国产在线观看免费播放| 五月天中文字幕一区二区| 黄色免费在线播放| 91九色国产社区在线观看| 好吊日精品视频| av网站免费在线播放| 欧美一a一片一级一片| 韩国av网站在线| 黄色99视频| 看片的网站亚洲| 国产精品日日夜夜| 亚洲人成网7777777国产| 亚洲资源在线| 国产视频九色蝌蚪| 日本一区二区成人| av老司机久久| 欧美与黑人午夜性猛交久久久| 日韩欧美三级| 91黄色免费视频| 欧美日韩在线播放| xxx.xxx欧美| 亚洲激情一区二区| 99视频一区二区三区| 在线视频免费观看一区| 高清视频欧美一级| 成人免费在线播放| 女性生殖扒开酷刑vk| 媚黑女一区二区| 欧美做受xxxxxⅹ性视频| 91精品国产欧美一区二区18| 国产美女精品写真福利视频| 亚洲欧洲精品在线观看| 99久久免费视频.com| 国产一区二区在线不卡| 1769国内精品视频在线播放| 亚洲人体av|