精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Prompt解鎖語音語言模型生成能力,SpeechGen實現語音翻譯、修補多項任務

人工智能 新聞
本文提出了一個名為 SpeechGen 的統一框架,該框架可用于任意的 speech LM 及各類語音生成任務,具有很好的潛力。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2306.02207.pdf
  • Demo 頁面:https://ga642381.github.io/SpeechPrompt/speechgen.html
  • Code: https://github.com/ga642381/SpeechGen

引言與動機

大型語言模型(LLMs)在人工智能生成內容(AIGC)方面引起了相當大的關注,特別是隨著 ChatGPT 的出現。

然而,如何用大型語言模型處理連續語音仍然是一個未解決的挑戰,這一挑戰阻礙了大型語言模型在語音生成方面的應用。因為語音信號包含豐富的信息,如說話者和情感,超越了純文本數據,基于語音的語言模型 (speech language model (speech LM)) 不斷涌現。

雖然與基于文本的語言模型相比,語音語言模型仍處于早期階段,但由于語音數據中蘊含著比文本更豐富的信息,它們具備巨大的潛力,令人充滿期待。

研究人員正積極探索提示 (prompt) 范式的潛力,以發揮預訓練語言模型的能力。這種提示通過微調少量參數,引導預訓練語言模型做特定的下游任務。這種技術因其高效和有效而在 NLP 領域備受青睞。在語音處理領域,SpeechPrompt 展示出了在參數效率方面的顯著改進,并在各種語音分類任務中取得了競爭性的表現。

然而,提示能否幫助語音語言模型完成生成任務仍是未解之謎。在本文中,我們提出一個創新的統一框架:SpeechGen,旨在激發語音語言模型進行生成任務的潛力。如下圖所示,將一段語音、一個特定的提示 (prompt) 喂給 speech LM 作為輸入,speech LM 就能做特定的任務。比如將紅色的 prompt 當作輸入,speech LM 就能做 speech translation 的任務。

圖片

我們提出的框架具有以下優點:

1. 無文本 (Textless):我們的框架以及其所依賴的語音語言模型獨立于文字數據,擁有無可估量的價值。畢竟,獲取標記文本與語音配對的過程耗時繁瑣,而且在某些語言中甚至無法找到合適的文本。無需文字的特性使得我們的強大語音生成能力得以覆蓋各種語言需求,讓全人類受益匪淺。

2. 多功能性 (Versatility):我們開發的框架通用性極高,能應用于各種各樣的語音生成任務。論文中實驗使用語音翻譯、語音修復、語音連續當作例子。  

3. 簡易性 (Easy to follow):我們提出的框架為各類語音生成任務提供了通用解決方案,讓設計下游模型和損失函數變得輕而易舉。

4. 可遷移性 (Transferability):我們的框架不僅容易適應未來更先進的語音語言模型,還蘊藏著巨大的潛力,讓效率和效果得到進一步提升。尤其令人振奮的是,隨著先進語音語言模型即將問世,我們的框架將迎來更為強大的發展。  

5. 經濟性 (Affordability):我們的框架經過精心的設計,只需訓練少量參數,而不是整個龐大的語言模型。這極大地減輕了計算負擔,并允許在 GTX 2080 GPU 上執行訓練過程。大學的實驗室也能負擔得起這樣的運算開銷。

SpeechGen介紹


圖片

我們的研究方法在于構建一個全新的框架 SpeechGen,該框架主要利用語音語言模型(Spoken Language Models, SLMs)進行各種下游語音生成任務的微調。在訓練過程中,SLMs 的參數保持不變,我們的方法側重于學習任務特定的提示(Prompt)向量。SLMs 通過同時對提示向量和輸入單元進行條件設置,有效地生成特定語音生成任務所需的輸出。然后,這些離散單元輸出被輸入到基于單元的語音合成器中,生成對應的波形。

我們的 SpeechGen 框架由三個元素組成:語音編碼器、SLM 和語音解碼器(Speech Decoder)。

首先,語音編碼器將波形作為輸入,并將其轉換為由有限詞匯表導出的單位序列。為了縮短序列長度,會移除重復的連續單位以生成壓縮的單位序列。然后,SLM 作為單位序列的語言模型,通過預測前一單位和單位序列的后續單位來優化可能性。我們對 SLM 進行提示調整,以引導其根據任務生成適當的單位。最后,SLM 生成的標記由語音解碼器處理,將其轉換回波形。在我們的提示調整策略中,提示向量會在輸入序列的開始處插入,這將引導 SLMs 在生成過程中的方向。具體插入的提示數量,則取決于 SLMs 的架構。在序列到序列的模型中,編碼器輸入和解碼器輸入都會加入提示,但在只有編碼器或只有解碼器的架構中,只會在輸入序列前面添加一個提示。

在序列到序列的 SLMs(如 mBART)中,我們采用了自我監督學習模型(如 HuBERT)來處理輸入和目標語音。這樣做可以為輸入生成離散單元,并為目標生成對應的離散單元。我們在編碼器和解碼器輸入的前面都添加了提示向量,以構造輸入序列。此外,我們還通過替換注意力機制中的關鍵值對,以進一步增強提示的指導能力。

在模型訓練中,我們以交叉熵損失作為所有生成任務的目標函數,通過比較模型的預測結果和目標離散單元標簽來計算損失。在這個過程中,提示向量是模型中唯一需要訓練的參數,而 SLMs 的參數在訓練過程中保持不變,這確保了模型行為的一致性。我們通過插入提示向量,引導 SLMs 從輸入中提取任務特定信息,并提高產生符合特定語音生成任務的輸出的可能性。這種方法允許我們微調并調整 SLMs 的行為,而無需修改其基礎參數。

總的來說,我們的研究方法基于一種全新的框架 SpeechGen,通過訓練提示向量,引導模型的生成過程,并使其能有效地產生符合特定語音生成任務的輸出。

實驗

我們的框架可以用于任意的 speech LM 及各類生成任務,具有很好的潛力。在我們的實驗中,由于 VALL-E 和 AudioLM 不是開源的,我們選擇使用 Unit mBART 作為 speech LM 進行案例研究。我們用語音翻譯 (speech translation)、語音修復 (speech inpainting)、語音連續 (speech continuation) 當作例子,來展示我們框架的能力。這三個任務的示意圖如下圖所示。所有的任務都是語音輸入,語音輸出,無需文本幫助。

圖片

語音翻譯

我們在訓練語音翻譯 (speech translation) 時,用的是西班牙文轉英文的任務。我們給模型輸入西班牙語的語音,希望模型產生英文的語音,整個過程無需文本幫助。以下是幾個語音翻譯的例子,我們會展示正確答案 (ground truth) 與模型的預測 (model prediction)。這些演示示例表明模型的預測捕捉到了正確答案的核心含義。

圖片

語音修補

在我們進行語音修補 (speech inpainting) 的實驗中,我們特別選取超過 2.5 秒的音頻片段作為后續處理的目標語音,并通過隨機選擇過程挑選出一段時長介于 0.8 至 1.2 秒的語音片段。然后我們對選出的片段進行掩碼,模擬語音修補任務中缺失或受損的部分。我們使用詞錯誤率 (WER) 和字符錯誤率 (CER) 作為評估受損片段修復程度的指標。

對 SpeechGen 生成的輸出與受損語音進行比較分析,我們的模型可以顯著重建口語詞匯,將 WER 從 41.68% 降低到 28.61%,將 CER 從 25.10% 降低到 10.75%,如下表所示。這意味著我們提出的方法能夠顯著提高語音重建的能力,最終促進語音輸出的準確性和可理解性。

圖片

下圖是一個展示樣例,上面的子圖是受損的語音,下面的子圖是 SpeechGen 產生的語音,可以看到,SpeechGen 很好地修復了受損的語音。

圖片

語音連續

我們將通過 LJSpeech 展示語音連續任務的實際應用。在訓練提示(prompt)期間,我們的策略是讓模型只看到片段的 seed segment,這個 seed segment 占據了語音總長度的部分比例,我們將其稱為條件比率(condition ratio, r),并讓模型繼續生成后續的語音。

以下是一些實例,黑色的文字代表種子片段(seed segment),紅色的文字則是 SpeechGen 生成的句子(這里的文字首先經過語音識別得到結果。在訓練和推理過程中,模型完全進行的是語音到語音的任務,且完全不接收任何文字信息)。不同的條件比率使 SpeechGen 能夠生成不同長度的語句以實現連貫性,并完成一句完整的話。從質量角度看,生成的句子與種子片段在語法上基本一致,并且語義相關。雖然,生成的語音仍然無法完美地傳達一個完整的意思。我們預期這個問題將在未來更強大的語音模型中得到解決。

不足與未來方向

語音語言模型和語音生成正處于蓬勃發展的階段,而我們的框架則提供了一種巧妙地利用強大語言模型進行語音生成的可能性。然而,這個框架仍有一些尚待完善之處,也有許多值得我們深入研究的問題。

1. 與基于文本的語言模型相比,語音語言模型目前還處于發展的初級階段。雖然我們提出的提示框架能激發語音語言模型做語音生成任務,但并不能達到卓越的性能。不過,隨著語音語言模型的不斷進步,比如從 GSLM 到 Unit mBART 的大轉身,提示的表現有了明顯的提升。特別是以前對 GSLM 具有挑戰性的任務,現在在 Unit mBART 下表現出更好的性能。我們預計未來會出現更多先進的語音語言模型嶄露頭角。

2. 超越內容信息:當前的語音語言模型并不能完全捕捉到說話者和情感信息,這給當前的語音提示框架在有效處理這些信息方面帶來了挑戰。為了克服這個限制,我們引入即插即用模塊,專門為框架注入說話者和情感信息。展望未來,我們預計未來的語音語言模型將整合和利用這些內容之外的信息,以提高性能并更好地處理語音生成任務中的說話者和情感相關方面。

3. 提示生成的可能性:對于提示生成,我們有著靈活多變的選擇,可以集成各種類型的指示,包括文本和圖像指示。想象一下,我們可以訓練一個神經網絡,讓它用圖像或文本作為輸入,而不是像本文中那樣使用訓練好的 embedding 當作提示。這個訓練好的網絡將成為提示生成器,為框架增添了多樣性。這樣的方式會讓提示生成變得更加有趣、更加豐富多彩。

結論

本文我們探索了使用提示來解鎖語音語言模型在各種生成任務中的性能。我們提出了一個名為 SpeechGen 的統一框架,該框架僅有約 10M 的可訓練參數。我們所提出的框架具有幾大特性,包括無需文本、多功能性、高效性、可轉移性和可負擔性。為了展示 SpeechGen 框架的能力,我們以 Unit mBART 為案例進行研究,并在三個不同的語音生成任務上進行實驗:語音翻譯、語音修復和語音延續。 

當這篇論文提交到 arXiv 時,Google 提出了一種更先進的語音語言模型 ——SPECTRON,它為我們展示了語音語言模型在建模說話人和情感等信息的可能性。這無疑是一個令人興奮的消息,隨著先進語音語言模型的不斷提出,我們的統一框架具有巨大的潛力。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-19 13:30:09

語音AI

2021-12-24 10:34:11

鴻蒙HarmonyOS應用

2025-07-02 09:46:30

2023-08-29 13:54:00

AI技術

2024-05-17 16:02:00

2012-07-25 13:23:32

ibmdw

2017-09-14 14:43:07

NLP入門模型

2013-10-31 11:19:09

微軟語音翻譯手語翻譯

2011-05-31 16:38:47

Android 實現語音

2022-10-21 09:29:37

2023-07-18 09:00:00

ChatGPT文本轉語音

2023-05-25 16:24:13

2017-03-20 10:14:03

語音識別匹配算法模型

2022-11-14 21:34:17

2023-08-22 14:18:49

點贊
收藏

51CTO技術棧公眾號

日本特黄久久久高潮| 精品中国亚洲| 一区二区成人在线| 国产九区一区在线| 日韩黄色一级视频| 久久精品免费一区二区三区| 欧美精品一区二区在线播放| 99久久激情视频| 日韩成人影视| 99re视频这里只有精品| 国产欧美一区二区三区久久| 国产精品16p| 日韩免费特黄一二三区| 精品国产免费一区二区三区四区 | 在线播放亚洲一区| 国产网站免费在线观看| 国产在线看片| 国产女同互慰高潮91漫画| 国产精品国产精品国产专区不卡| 最近中文字幕免费观看| 99伊人成综合| 久久91精品国产| 国产三级短视频| 日韩伦理一区二区三区| 日韩午夜在线观看| 天天影视色综合| 春暖花开亚洲一区二区三区| 一区二区三区在线高清| 一区二区三区四区欧美| 国产精品毛片一区二区三区四区| 成人久久久精品乱码一区二区三区| 国产精品香蕉av| 一级片免费在线播放| 日韩一区二区久久| 欧美激情精品久久久久| 欧洲猛交xxxx乱大交3| 成人区精品一区二区婷婷| 日韩精品中文字幕在线播放| 亚洲一区和二区| 999久久久国产999久久久| 欧美在线看片a免费观看| 女人天堂av手机在线| 国产中文在线播放| 午夜精品一区二区三区免费视频| 欧美 国产 精品| 老司机在线看片网av| 国产精品天美传媒沈樵| 日韩欧美国产二区| 成人jjav| 日本一区二区三区dvd视频在线| 久久综合九色欧美狠狠| 婷婷色在线观看| 99久久久国产精品| 久久精品日韩精品| 四虎影院在线播放| 久久综合久久久久88| 久久本道综合色狠狠五月| 少妇精品高潮欲妇又嫩中文字幕| 成人在线一区二区三区| 国产精品一区二区三区免费| 五月天婷婷视频| 久久免费美女视频| 日韩精品国内| 麻豆免费在线观看| 亚洲精品乱码久久久久久| 免费日韩在线观看| 成入视频在线观看| 欧美性生交xxxxx久久久| 成人性做爰aaa片免费看不忠| 色8久久影院午夜场| 欧美日韩一级二级三级| √天堂资源在线| 久久99成人| 亚洲精品在线观看视频| 亚洲一区二区三区综合| jizzjizz欧美69巨大| 日韩视频欧美视频| 欧美日韩午夜视频| 亚洲网站啪啪| 国产成人激情小视频| 国产精品一区二区av白丝下载| 国产麻豆91精品| 国产麻豆日韩| youjizz在线播放| 亚洲色图视频免费播放| av免费观看国产| 少妇一区视频| 日韩欧美国产不卡| 四虎永久免费影院| 亚洲欧美偷拍自拍| 日本乱人伦a精品| 国产露脸国语对白在线| 成a人片国产精品| 亚洲欧洲一区二区福利| 高清电影在线免费观看| 欧美影视一区在线| 在线播放第一页| 成人中文在线| 国内精品久久久久久久| 在线免费看av片| 99久久婷婷国产综合精品| 伊人久久大香线蕉av一区| 538在线观看| 欧美麻豆精品久久久久久| 漂亮人妻被黑人久久精品| 欧美国产偷国产精品三区| 国模吧一区二区三区| 亚洲天天综合网| 不卡的av电影| 色婷婷777777仙踪林| 日韩电影免费观| 精品国产一区二区三区不卡 | 欧洲毛片在线| 亚洲黄色免费电影| 992kp快乐看片永久免费网址| 91国内精品| 久久久999精品视频| 国产精品suv一区| 国产91高潮流白浆在线麻豆| 亚洲激情图片| 色香欲www7777综合网| 日韩电影中文字幕一区| 69av.com| 国内精品国产成人| 亚洲午夜精品久久| 韩国成人在线| 亚洲欧美日韩成人| 制服.丝袜.亚洲.中文.综合懂色| 国产成人免费高清| 黄色录像特级片| 亚洲综合伊人| 日韩在线一区二区三区免费视频| 探花视频在线观看| 97久久精品人人做人人爽50路| 日韩成人三级视频| 日韩精品中文字幕吗一区二区| 日韩中文字幕视频| 中文字幕+乱码+中文字幕明步| 久久毛片高清国产| 中文字幕日本最新乱码视频| 免费日韩一区二区三区| 国模精品系列视频| 欧美性受xxxx狂喷水| 亚洲影院免费观看| 四虎精品一区二区| 伊人久久大香线蕉综合热线 | 欧美综合激情网| 三级做a全过程在线观看| 午夜日韩在线电影| 好吊一区二区三区视频| 国产精品视频| 欧美一区免费视频| 日本成人福利| 日韩中文字幕在线观看| 国产精品久久久久久久一区二区 | www国产精品av| 日韩网址在线观看| 欧州一区二区| 国产免费一区视频观看免费| 麻豆tv在线| 欧美大片国产精品| 日本一级片免费看| 久久久久国色av免费看影院| 国产精品一区二区羞羞答答| 日韩精品一区二区久久| 国产精品日韩欧美大师| 黄色精品免费看| 精品三级在线观看| 国产精品一区二区三区四| 久久蜜桃av一区二区天堂| 在线观看国产中文字幕| 欧美成人69| 久久草.com| 色综合一区二区日本韩国亚洲| 欧美大尺度在线观看| 香蕉久久国产av一区二区| 日本精品免费观看高清观看| 我要看黄色一级片| 99久久er热在这里只有精品15 | 秋霞影院一区| 性日韩欧美在线视频| 九色在线观看视频| 日韩一区二区视频在线观看| 五月天婷婷网站| 日本一区二区三区dvd视频在线| aaaaaaaa毛片| 久久精品午夜| 2022中文字幕| 国内精品伊人久久久| 91亚洲精品久久久| 在线精品亚洲欧美日韩国产| 久久精品视频在线观看| 特黄视频在线观看| 欧美人与禽zozo性伦| 日本三级中文字幕| 中文字幕亚洲精品在线观看| 日批在线观看视频| 久久成人av少妇免费| 日韩av三级在线| 国产精品成人一区二区不卡| 久久av一区二区| 日韩视频一区二区三区四区| 国产成人精彩在线视频九色| 影音先锋在线视频| 伊人男人综合视频网| 丰满肉肉bbwwbbww| 欧美丝袜自拍制服另类| 天堂网一区二区三区| 亚洲视频免费看| 天天舔天天操天天干| av成人老司机| 中文字幕乱妇无码av在线| 日韩高清在线电影| 日韩在线综合网| 欧美黄色精品| 综合视频在线观看| 成人影院天天5g天天爽无毒影院| 国产在线一区二区三区播放| 欧美成年网站| 成人女保姆的销魂服务| 午夜激情成人网| 欧美一区视频在线| 波多野结衣在线高清| 欧美乱人伦中文字幕在线| 日韩美女网站| 日韩在线视频国产| 在线观看完整版免费| 国产亚洲福利一区| 欧美成人片在线| 日韩久久午夜影院| 手机福利在线| 亚洲精品久久久久中文字幕欢迎你| 精品国产无码AV| 欧美一区二区日韩| 国产手机精品视频| 91精品国产色综合久久ai换脸 | 欧美第一视频| 日韩美女毛茸茸| 成人性生交大片免费观看网站| 久久久中精品2020中文| 高h视频在线播放| 性金发美女69hd大尺寸| 小早川怜子影音先锋在线观看| 国模极品一区二区三区| 超碰资源在线| 欧美中文字幕在线| 成人激情综合| 国产精品视频久久久久| 四虎精品在线观看| 亚洲最大福利视频网站| 日韩免费高清视频网站| 成人在线视频网址| 成人自拍在线| 久久99精品久久久水蜜桃| 亚洲第一福利专区| 日韩精品大片| 欧美黄色录像片| 青青草综合视频| 亚洲人成高清| 免费日韩视频在线观看| 蜜桃视频在线观看一区| 亚洲欧美手机在线| 国产白丝精品91爽爽久久| 娇妻高潮浓精白浆xxⅹ| 久久午夜老司机| 青青操在线播放| 夜夜亚洲天天久久| 二区视频在线观看| 欧美日韩国产另类一区| 亚洲国产www| 亚洲美女久久久| 免费观看久久久久| 欧美黄色片视频| 澳门成人av网| 91亚洲国产成人久久精品网站| 成人福利一区| 日本一区二区三区四区高清视频| 欧美高清视频手机在在线| 日本大胆人体视频| 丝袜脚交一区二区| 日本中文字幕有码| 国产无人区一区二区三区| 国产精品精品软件男同| 亚洲成人福利片| 中文字幕在线观看免费| 精品国产一区二区三区四区四| 国产视频在线看| 色综合老司机第九色激情| 在线最新版中文在线| 91沈先生在线观看| 九一成人免费视频| av动漫在线播放| 毛片av一区二区三区| 这里只有精品在线观看视频| 国产精品福利av| www.国产成人| 91精品国产全国免费观看| 日韩porn| 欧美福利在线观看| 国产精品伦一区二区| 精品一区二区日本| 中文字幕亚洲综合久久五月天色无吗'' | 国产在线观看精品一区| 欧美激情亚洲一区| 24小时成人在线视频| 欧洲高清一区二区| 亚洲美女视频在线免费观看| 国产精品区在线| 久久精品一区蜜桃臀影院| 18精品爽视频在线观看| 欧美日韩成人综合天天影院 | 国产丝袜欧美中文另类| 国产精彩视频在线| 91麻豆精品国产91| www 日韩| 国产成人精品a视频一区www| 九九热hot精品视频在线播放| 成年人黄色在线观看| 日韩高清中文字幕一区| 女尊高h男高潮呻吟| 亚洲1区2区3区4区| 丰满人妻一区二区| 免费成人高清视频| 24小时成人在线视频| 亚洲精品永久www嫩草| 久久久999| 日韩中文字幕电影| 天天综合色天天综合| 国产18精品乱码免费看| 久久精品视频在线观看| 亚洲网站免费| 伊人色综合久久天天五月婷| 奇米影视一区二区三区小说| 扒开jk护士狂揉免费| 日韩欧美在线观看| 你懂得在线网址| 欧洲午夜精品久久久| 日韩高清电影免费| 免费黄色福利视频| 91社区在线播放| 伦av综合一区| 亚洲人成人99网站| 另类中文字幕国产精品| 日产精品久久久一区二区| 久久尤物视频| 精品成人无码一区二区三区| 色哟哟国产精品免费观看| 黄上黄在线观看| 国产精品美女久久| 日韩成人三级| 亚洲色图偷拍视频| 亚洲免费三区一区二区| 亚洲a视频在线观看| 欧美精品激情在线观看| 久久综合社区| 黄色片视频在线播放| 日本一区免费视频| 一区二区日韩视频| 欧美激情视频网| 日韩欧美中文字幕电影| www日韩在线观看| 国产精品麻豆视频| 999av视频| 97人人做人人爱| 国产尤物久久久| 在线视频观看一区二区| 亚洲大片免费看| 黄色片免费在线| 国产日本欧美一区二区三区在线| 中文字幕乱码亚洲无线精品一区 | 免费看日本一区二区| 天天操天天爽天天射| 中文字幕一区二区三区不卡在线| 精品国产一级片| 欧美中文在线字幕| 国产精品久久久久一区二区三区厕所 | 激情开心成人网| 国风产精品一区二区| 91亚洲精华国产精华精华液| 亚洲中文无码av在线| 久久综合电影一区| 丝袜连裤袜欧美激情日韩| www.com黄色片| 亚洲国产精品一区二区www在线| 免费国产在线观看| 99re视频在线| 天堂午夜影视日韩欧美一区二区| 欧美视频www| 亚洲免费视频观看| 麻豆国产一区| 日本成人在线免费视频| 伊人开心综合网| 国产youjizz在线| 成人av中文| 免费成人美女在线观看.| 日本熟妇乱子伦xxxx| 久久韩剧网电视剧| 色棕色天天综合网| 亚洲少妇一区二区| 欧美日韩日日摸|