精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

首個可保留情感的音頻LLM!Meta重磅開源7B-Spirit LM,一網打盡「音頻+文本」多模態任務

人工智能 新聞
Meta最近開源了一個7B尺寸的Spirit LM的多模態語言模型,能夠理解和生成語音及文本,可以非常自然地在兩種模式間轉換,不僅能處理基本的語音轉文本和文本轉語音任務,還能捕捉和再現語音中的情感和風格。

在純文本大模型取得進展的同時,其他模態數據,如語音與文本結合的語言模型(SpeechLMs)也成為了一個熱門的研究領域,但現有的模型要么在僅包含語音的數據上進行訓練,要么是關注特定任務,如文本轉語音(TTS)、自動語音識別(ASR)或翻譯,在其他模態數據和任務上的泛化能力十分有限。

在大型語言模型(LLM)性能不斷提升的情況下,一個常用的方法是先用ASR模型將語音轉錄成文本,然后用文本模型來生成新的文本,最后再用TTS模型將文本轉換成語音,這種流程的一個顯著缺陷就是語音表達性不佳,語言模型無法建模并生成富有表現力的語音數據。

最近,Meta開源了一個基礎多模態語言模型Spirit LM,基于一個70億參數的預訓練文本語言模型,交錯使用文本和語音數據進行訓練,使模型能夠自由地混合文本和語音,在任一模態中生成語言內容。

圖片

項目主頁:https://speechbot.github.io/spiritlm/

論文鏈接:https://arxiv.org/pdf/2402.05755

代碼鏈接:https://github.com/facebookresearch/spiritlm

開源鏈接:https://huggingface.co/spirit-lm/Meta-spirit-lm

將語音和文本序列拼接成一條token流,并使用一個小型的、自動整理(automatically-curated)的語音-文本平行語料庫,采用逐詞交錯的方法進行訓練。

Spirit LM有兩個版本:基礎版(Base)使用語音音素單元(HuBERT),表達版(Expressive)還額外使用音高和風格單元來模擬表達性,以增強模型在生成語音時的表現力,也就是說模型不僅能夠理解和生成基本的語音和文本,還能在表達情感和風格方面表現得更加豐富和自然。

對于兩個版本的模型,文本都使用子詞BPE標記進行編碼,最終得到的模型既展現了文本模型的語義能力,也具備語音模型的表達能力;模型還能夠在少量樣本的情況下跨模態學習新任務(例如自動語音識別、文本轉語音、語音分類)。

不過需要注意的是,和其他預訓練模型一樣,Sprit LM也可能會生成一些不安全的內容,所有基于該技術的應用都需要進行額外的安全測試和調整。

Spirit LM

圖片

模型的架構比較簡單,訓練過程就是基本的「預測下一個詞」,不過「詞」是通過編碼器從語音或文本中提取的,然后通過解碼器以原來的模態進行重新呈現;訓練數據包括三種:僅包含文本的序列、僅包含語音的序列以及交錯的語音-文本序列的混合數據。

基礎版

語音編碼器

使用的HuBERT模型,該模型在多個數據集的混合上進行訓練,包括多語言的LibriSpeech、Vox Populi、Common Voice、Spotify以及Fisher,最后得到一個包含501個音素語音token的詞匯表。

語音和文本分詞器

使用LLaMA默認的分詞器來處理文本,使用前述的HuBERT分詞器來處理語音;為了提高模型的質量,對HuBERT的token進行了去重處理;對于單模態數據集(僅文本和僅語音),在分詞后的數據前加上相應的模態標記。

文本數據:[TEXT]這是一個文本句子

音頻數據:[SPEECH][Hu262][Hu208][Hu499][Hu105]

交錯語音和文本(Interleaving Speech and Text)

對于對齊的語音+文本數據集,通過在單詞級別交錯語音和文本來混合:[TEXT]the cat [SPEECH][Hu3][Hu7]..[Hu200][TEXT]the mat

研究人員認為,交錯訓練可以幫助模型學習語音和文本之間的對應關系,從而實現更好的文本到語音的轉換;在每個訓練步驟中,句子中的語音和文本部分是隨機采樣的。

語音解碼器

在從語音token進行語音合成方面,研究人員在Expresso數據集上訓練了一個HifiGAN聲碼器,其依賴于HuBERT語音token和Expresso特定說話人的嵌入向量。

在訓練期間,HifiGAN模型會輸入重復的token,但同時也會訓練一個時長預測模塊,可以更準確地知道每個語音token在實際語音中應該持續多久,最終生成一個語音波形。

表達版

HuBERT能夠從語音中捕獲良好的音素信息,但在表達性方面表現不佳。

研究人員的目標是在不依賴生物特征識別的情況下,模型依然能夠理解和保留輸入語音中的情感,所以需要用額外的音高token和風格token來補充HuBERT的音素語音token,并將其包含在語言模型訓練中,以便訓練后的Spirit LM Expressive模型能夠捕獲并生成更具表現力的語音。

pitch(音高) token

在語音合成和處理中,音高是一個關鍵因素,決定了聲音的高低,對人類理解語句的情感和語氣來說非常關鍵。音高token可以用來捕捉音高變化。當我們說話時,聲音的高低起伏不僅可以表達不同的情感,比如興奮時聲音高亢,悲傷時聲音低沉,還可以幫助我們在口語交流中區分不同的詞語和句子的意圖。

研究人員在Expresso數據集上訓練了一個VQ-VAE模型,碼本大小為64,下采樣率為128,即每秒可以產生12.5個音高token;在訓練音高量化器時,使用pyaapt8提取基頻(F0);使用FCPE9,一個基于Transformer的快速音高估計器,來提高推理速度。

style(風格) token

研究人員提取了語音風格特征來捕捉輸入語音的表達風,在輸入片段上進行平均池化處理,每秒生成一個特征,然后在Expresso數據集上微調特征來預測表達風格,從而進一步從語音風格特征中去除說話人信息,最后在Expresso數據集的規范化特征上訓練了一個有100個單元的k均值聚類。

表達性語音分詞器(Expressive Speech Tokenization)

圖片

將三種類型的標記(每秒25次的HuBERT標記、每秒12.5次的音高標記和每秒1次的風格標記)按照對應的時間戳進行排序,混合成一個單一的token序列。

與Spirit LM基礎版相同,表達版同樣對HuBERT的token和音高token進行去重,最后輸入序列類似于:[SPEECH][St10][Pi0][Hu28][Hu22][Pi14][Hu15][Pi32][Hu78][Hu234][Hu468]

表達性語音解碼器(Expressive Speech Decoder)

研究人員訓練了一個HifiGAN模型,依賴于HuBERT token、音高token、風格token以及來自Expresso聲音的1-hot說話人嵌入向量。同時還訓練了一個時長預測器來預測HuBERT token持續時間。在推理過程中,將每個HuBERT token與相應的音高token和風格標記token,并根據需要進行重復。

實驗結果

Spirit LM能夠在接收語音token或文本token的提示時,生成語義和表達上一致的內容,將通過定量評估一系列需要生成文本或語音token的基準測試,特別評估Spirit LM在單模態和跨模態場景中的語義能力。

圖片

自動語音識別(ASR)和文本轉語音(TTS)

與文本語言模型類似,SPIRIT語言智能體可以通過少量樣本提示來執行特定任務。

圖片

可以看到,Spirit LM使用10個樣本的提示能夠獲得最佳性能,最佳模型在Librispeech清潔數據上的詞錯誤率為21.9,文本轉語音的字符錯誤率為45.5

圖片

在訓練中加入平行的ASR和TTS樣本可以極大提高性能,但加入ASR和TTS數據對其他任務的影響非常有限。

在執行語音意圖分類(IC)任務時可以發現,隨著樣本數量的增加,準確率也提高了,模型準確率達到了79%

跨模態對齊

為了更好地理解模型在僅在交錯數據和原始語音和文本上訓練的情況下,如何實現良好的跨模態性能的隱藏機制,研究人員查看了模型特征的token級相似性,其中特征來自于HuBERT token的輸入序列和相應的BPE token,計算了從不同層提取的語音和文本特征的相同單詞的最大相似性。

結果發現,模型內部口語和書面序列之間的相似性從第2層和第20層開始增加,并且在早期到中間層中,在用單詞級轉錄訓練的模型中效果較差,表明模態混合可以對齊語音和文本,使模型能夠將語音序列與相應的文本序列映射起來。

表達性建模

當不給智能體任何先前的樣本,直接根據語音或文本提示生成內容(零樣本)時,可以發現帶有額外音高和風格token的表達版模型在大多數情況下都比基礎版模型的表現更好,只是在文本內容生成(文本到文本)方面兩者表現差不多。

圖片

當給模型少量樣本來學習時,可以發現這種方法對于除了語音內容生成(語音到語音)之外的所有情況都有幫助。無論是零樣本還是少量樣本,保持情感的連續性在相同類型的數據(比如文本到文本或語音到語音)中比在不同類型的數據(比如語音到文本)中做得更好;在所有測試中,語音到文本的方向得分最低。

此外,研究人員還直接評估了模型對輸入提示的處理能力,結果發現,無論是哪種提示,模型都能得到很高的評分,表明還有很大的空間來進一步提高模型在保持情感表達方面的能力,也意味著,智能體在理解和生成情感豐富的內容方面還有很大的潛力可以挖掘。

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-04-26 00:25:52

Rust語法生命周期

2021-08-05 06:54:05

流程控制default

2024-02-27 10:11:36

前端CSS@規則

2021-10-11 07:55:42

瀏覽器語法Webpack

2011-12-02 09:22:23

網絡管理NetQos

2010-08-25 01:59:00

2013-08-02 10:52:10

Android UI控件

2024-06-12 00:00:05

2024-04-07 08:41:34

2024-08-26 10:01:50

2016-09-20 12:28:52

2025-09-08 08:20:00

AI大模型系統

2025-09-10 18:03:16

AI智能體開源

2013-10-16 14:18:02

工具圖像處理

2023-04-06 09:08:41

BPM流程引擎

2019-07-24 15:30:00

SQL注入數據庫

2020-02-21 08:45:45

PythonWeb開發框架

2023-04-03 08:30:54

項目源碼操作流程

2009-04-02 10:17:00

交換機產品選購

2020-10-19 06:43:53

Redis腳本原子
點贊
收藏

51CTO技術棧公眾號

国产精品25p| 亚洲老妇色熟女老太| 欧美oldwomenvideos| 欧美群妇大交群中文字幕| 免费极品av一视觉盛宴| 天堂在线免费av| 日本不卡视频在线| 欧美日韩高清区| www.狠狠爱| 亚洲高清在线一区| 色天天综合久久久久综合片| 国产精品夜夜夜爽张柏芝| 天天干视频在线| 日本在线不卡一区| 高清视频欧美一级| 国精产品久拍自产在线网站| 欧美一级三级| 制服丝袜亚洲网站| 国产视频一区二区三区在线播放 | 香蕉影院在线观看| 羞羞答答成人影院www| 精品视频久久久久久久| 精品国产乱码久久久久久1区二区| 丝袜老师在线| 一区二区三区四区在线| 日韩欧美在线观看强乱免费| 国产精品无码专区av免费播放| 一本色道久久综合| 欧美黑人巨大精品一区二区| 999精品久久久| 亚洲永久精品唐人导航网址| 亚洲电影成人av99爱色| 中文字幕55页| 久久99久久久精品欧美| 色综合网色综合| 免费看日本毛片| 丰满诱人av在线播放| 亚洲日本成人在线观看| 午夜久久资源| 国产在线一二| 久久综合999| 久久精品成人一区二区三区蜜臀| 99国产精品久久久久99打野战| 日本欧美在线看| 国产91热爆ts人妖在线| 久久久久99精品成人片我成大片 | 97国产在线观看| 欧产日产国产v| 中出一区二区| 久久福利视频网| 男女做暖暖视频| 亚洲欧美综合久久久| 日韩中文字幕免费看| 天天摸日日摸狠狠添| 日韩久久久久| 精品国产自在精品国产浪潮| 亚洲一区电影在线观看| 天天影视综合| 免费91在线视频| 激情综合网五月天| 亚洲美女啪啪| 国产suv精品一区二区| 亚洲欧美一二三区| 热久久国产精品| 国产精品老牛影院在线观看| 中文字幕无线码一区| 日本女人一区二区三区| 国产精品一区电影| 99国产精品久久久久久久成人| 国产精品中文字幕日韩精品| 国产成人精品免费视频大全最热 | 成人av网站在线观看| 国产一区免费在线| 欧美亚洲日本| 国产精品三级电影| 波多野结衣 作品| yellow在线观看网址| 色综合久久精品| 亚洲一级免费在线观看| 无人区乱码一区二区三区| 亚洲国产精品字幕| 黄色激情小视频| 中文字幕一区二区三区欧美日韩| 97热在线精品视频在线观看| 亚洲av无码不卡| 韩国理伦片一区二区三区在线播放| 91福利视频导航| 日韩欧美电影在线观看| 国产精品麻豆一区二区 | 日韩电影免费观看| 欧美日韩国产精品一区二区三区四区 | 伊人色综合久久天天五月婷| 在线网址91| 一本久道中文字幕精品亚洲嫩| 亚洲怡红院在线| 精品国产一区二区三区成人影院| 国产亚洲欧洲黄色| 久久国产在线观看| 日本sm残虐另类| 国产激情一区二区三区在线观看 | 国产欧美一区视频| www.成年人视频| 日本中文字幕一区二区| 精品日产卡一卡二卡麻豆| 东方伊人免费在线观看| 亚洲高清av| 成人激情av在线| 天堂成人在线| 亚洲最大的成人av| 蜜臀一区二区三区精品免费视频| 精品久久ai电影| 久久天天躁狠狠躁夜夜爽蜜月| 成人免费a视频| 国产91精品免费| 亚洲精品一区二区三区樱花| 少妇视频一区| 精品国产污网站| 肉色超薄丝袜脚交69xx图片| 久久久久久一区二区| 国产精品区一区二区三含羞草| 日韩大片在线永久免费观看网站| 狠狠色香婷婷久久亚洲精品| 中文字幕1区2区| 99久久精品国产亚洲精品| 亚洲天堂网中文字| 91免费观看网站| 国产区视频在线播放| 午夜精品一区二区三区电影天堂 | 在线观看视频二区| 91在线视频播放地址| 黄色片免费在线观看视频| 日韩成人免费av| 在线亚洲午夜片av大片| 国产精品男女视频| 成人免费毛片高清视频| 国产奶头好大揉着好爽视频| 欧美日一区二区三区| 亚洲欧美国产一本综合首页| 亚洲精品视频在线观看免费视频| 国产福利一区二区三区在线视频| 中文字幕久久综合| 黄色日韩网站| 色妞久久福利网| 久久久久精彩视频| 国产午夜精品久久久久久免费视| 大陆极品少妇内射aaaaa| 国产精品xxxav免费视频| 欧美老女人性视频| 囯产精品一品二区三区| 亚洲激情av在线| 美女日批在线观看| 国产精品mm| 国产精品视频入口| 蜜桃麻豆影像在线观看| 精品一区电影国产| 无码人妻一区二区三区免费| 国产免费成人在线视频| 丝袜制服一区二区三区| 成人久久电影| 成人av番号网| 欧美黑人xx片| 亚洲精品福利免费在线观看| 亚洲不卡视频在线观看| 久久精品在这里| 波多野结衣xxxx| 国产精品99在线观看| 亚洲bt天天射| √最新版天堂资源网在线| 日韩精品小视频| 亚洲视屏在线观看| 亚洲美女视频在线| www.男人天堂| 日韩电影在线免费| 青青视频免费在线观看| а√中文在线天堂精品| 55夜色66夜色国产精品视频| 成人在线观看一区| 91精品国产综合久久久久久久| 美女的奶胸大爽爽大片| 不卡一区二区三区四区| 农村妇女精品一二区| 天天揉久久久久亚洲精品| 国产精品乱子乱xxxx| 久久夜夜操妹子| 久久精品国产99国产精品澳门 | 亚洲精品日韩久久久| 亚洲午夜无码久久久久| 亚洲精品国产视频| 无码熟妇人妻av| 国产一区二三区| 欧美三级一级片| 93在线视频精品免费观看| 高清免费日韩| 高清欧美日韩| 91sa在线看| 99在线播放| 国产成人精品综合在线观看| 91精品国产91久久久| 内射无码专区久久亚洲| 欧美在线观看视频一区二区三区| 成年人av电影| 中文字幕va一区二区三区| 无码国产精品一区二区免费式直播 | 久久众筹精品私拍模特| 欧美大片久久久| 性娇小13――14欧美| 欧美h视频在线观看| 在线观看欧美理论a影院| 亚洲一区二区在线| 秋霞国产精品| 欧美一区二区色| 欧美xxxx免费虐| 日日噜噜噜夜夜爽亚洲精品| 男人天堂综合| 欧美变态tickling挠脚心| 亚洲天堂网视频| 色婷婷国产精品久久包臀| 国产精品成人免费观看| 国产精品国产自产拍高清av王其| 亚洲国产欧美视频| 成人av先锋影音| 不卡的一区二区| 国产在线一区观看| 天天操狠狠操夜夜操| 老妇喷水一区二区三区| 久久久久久www| 国产精品扒开腿做爽爽爽软件| 在线看无码的免费网站| 国产精品美女久久久久久不卡| 精品乱子伦一区二区三区| 91精品久久久久久综合五月天| 91九色在线视频| 亚洲aⅴ网站| 成人福利在线视频| 亚洲成人精品综合在线| 国产日韩在线看片| 日本国产亚洲| 国产精品亚洲片夜色在线| 日本精品裸体写真集在线观看| 欧美一区深夜视频| 26uuu亚洲电影| 91av在线看| 欧美巨大丰满猛性社交| 欧美在线一区二区视频| 中文在线免费二区三区| 97视频免费在线看| 欧美裸体视频| 日韩美女在线观看| 国精产品一区一区三区四川| 国产精品久久9| 精品视频一区二区三区四区五区| 国产成人自拍视频在线观看| 怡红院成人在线| 国产精品免费久久久| 视频91a欧美| 亚洲一区二区三区视频播放| 亚洲欧洲国产精品一区| 国产在线精品二区| 妖精视频一区二区三区免费观看| 久久精品一区二区三区不卡免费视频| 思热99re视热频这里只精品| 日本一区二区三区四区高清视频| 欧美精选一区二区三区| 亚洲精品一区二区三区樱花| 91精品国偷自产在线电影| 日韩一级片一区二区| 亚洲国内欧美| 日本www高清视频| 美国毛片一区二区三区| 三级黄色片免费看| jlzzjlzz亚洲日本少妇| 受虐m奴xxx在线观看| 国产精品久久毛片av大全日韩| 三级影片在线看| 狠狠做深爱婷婷久久综合一区| 日韩不卡高清视频| 5858s免费视频成人| 亚洲av无码片一区二区三区| 日韩激情在线视频| 在线日本中文字幕| 久久久久久久一区二区三区| 成人午夜精品| 999国产在线| 猛男gaygay欧美视频| 可以免费看的黄色网址| 中文一区在线| 人人爽人人爽av| 99久久精品免费| 久久嫩草捆绑紧缚| 亚洲成精国产精品女| 国产情侣免费视频| 欧美tk丨vk视频| 国产免费永久在线观看| 欧美国产乱视频| 精品三区视频| 国产日韩一区二区| 99久久亚洲精品| av免费播放网址| 国产精品一区二区三区99| 国产又粗又猛又爽视频| 一区二区三区中文字幕精品精品| 一二三区免费视频| 精品国产精品一区二区夜夜嗨| 3p在线观看| 国产91精品久久久久| av在线播放一区二区| 欧美一区国产一区| 亚洲国产三级| 色婷婷一区二区三区在线观看| 久久久美女毛片| 日韩av在线电影| 欧美一区二区观看视频| 国产特黄在线| 奇米4444一区二区三区| 国产美女撒尿一区二区| 欧美少妇一级片| 青青草视频一区| 中文字幕av日韩精品| av日韩中文| 成人在线中文字幕| 精品一区二区三| 中文字幕日本最新乱码视频| 国产成人亚洲综合a∨婷婷图片| 欧美88888| 欧亚一区二区三区| 日本在线丨区| 777777777亚洲妇女| 91精品入口| 69精品丰满人妻无码视频a片| 久久精品久久综合| 五月天免费网站| 欧美亚州韩日在线看免费版国语版| 亚洲 欧美 精品| 97色在线观看免费视频| 久9re热视频这里只有精品| youjizz.com在线观看| 国产成人免费视频精品含羞草妖精| 麻豆明星ai换脸视频| 欧美日韩精品综合在线| 婷婷在线视频| 成人国产亚洲精品a区天堂华泰| 日韩亚洲一区在线| 国产免费又粗又猛又爽| 中文幕一区二区三区久久蜜桃| 超碰在线观看91| 亚洲最新av在线| 成人av集中营| 亚洲第一页在线视频| 韩国午夜理伦三级不卡影院| 国产精品视频一区二区三| 欧美一区二区三区男人的天堂| 免费av网站在线观看| 91沈先生作品| 午夜日韩在线| 精品人妻伦一二三区久| 亚洲高清免费视频| 熟妇高潮一区二区高潮| 奇米四色中文综合久久| 精品国精品国产自在久国产应用| 国产主播中文字幕| 中文字幕一区二区三区蜜月| 国产免费黄色片| 欧美高清性猛交| 日韩精品a在线观看91| 老司机午夜av| 亚洲欧美日韩综合aⅴ视频| 丁香六月天婷婷| 欧美亚洲视频在线观看| 精品视频免费在线观看| 成人日韩在线视频| 亚洲国产精品久久不卡毛片 | 99在线热播精品免费| 国产一级一级国产| 日韩在线观看av| 大陆精大陆国产国语精品| 每日在线更新av| 国产精品久久久久天堂| 亚洲欧美黄色片| 国产99久久精品一区二区永久免费| 欧美电影免费观看高清| 国产情侣久久久久aⅴ免费| 色综合夜色一区| 菠萝菠萝蜜在线视频免费观看| 国产日韩一区二区三区| 秋霞午夜鲁丝一区二区老狼| 成人免费毛片东京热| 亚洲女同性videos| 国产激情综合| 欧美日韩在线视频一区二区三区| 国产精品护士白丝一区av| 人妻少妇精品无码专区久久| 国产精品 欧美在线| 国产在线欧美| 免费一级黄色录像| 亚洲二区中文字幕| 69堂免费精品视频在线播放| 日本香蕉视频在线观看| 国产精品久久久久久福利一牛影视| 人妻一区二区三区免费| 91精品视频在线|