精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

規模性能雙殺OpenAI,Meta語音達LLaMA級里程碑!開源MMS模型可識別1100+語言

人工智能 新聞
Meta的大規模多語言語音 (MMS) 項目將徹底改變語音技術,使用wav2vec 2.0的自監督學習,MMS將語音技術擴展到1100到4000種語言。

在語音方面,Meta又達到了另一個LLaMA級的里程碑。

今天,Meta推出了一個名為MMS的大規模多語言語音項目,它將徹底改變語音技術。

MMS支持1000多種語言,用圣經訓練,錯誤率僅為Whisper數據集的一半。

只憑一個模型,Meta就建起了一座巴別塔。

并且,Meta選擇將所有模型和代碼開源,希望為保護世界語種的多樣性做出貢獻。

圖片

在此之前的模型可以覆蓋大約100種語言,而這次,MMS直接把這個數字增加了10-40倍!

具體來說,Meta開放了1100多種語言的多語種語音識別/合成模型,以及4000多種語言的語音識別模型。

與OpenAI Whisper相比,多語言ASR模型支持11倍以上的語言,但在54種語言上的平均錯誤率還不到FLEURS的一半。

而且,將ASR擴展到如此多語言之后,只造成了非常小的性能下降。

論文地址:https://research.facebook.com/publications/scaling-speech-technology-to-1000-languages/

保護消失語種,MMS把語音識別增加40倍

讓機器具備識別和產生語音的能力,可以讓更多人獲得信息。

然而,為這些任務生成高質量的機器學習模型,就需要大量的標記數據,比如數千小時的音頻以及轉錄——對于大多數語言來說,這種數據根本就不存在。

現有的語音識別模型,只涵蓋了大約100種語言,在地球上的7000多種已知語言中,這只占很小一部分。令人擔憂的是,在我們有生之年,這些語言中有一半都面臨著消失的危險。

在Massively Multilingual Speech(MMS)項目中,研究者通過結合wav2vec 2.0(Meta在自監督學習方面的開創性工作)和一個新的數據集來克服了一些挑戰。

這個數據集提供了超過1100種語言的標記數據,和近4000種語言的未標記數據。

圖片

通過跨語言訓練,wav2vec 2.0學習了多種語言中使用的語音單元

其中一些語言,如Tatuyo語,只有幾百個使用者,而數據集中的大多數語言,以前根本就不存在語音技術。

而結果顯示,MMS模型的性能優于現有的模型,覆蓋語言的數量是現有模型的10倍。

Meta一向專注于多語言工作:在文本上,Meta的NLLB項目將多語言翻譯擴展到了200種語言,而MMS項目,則將語音技術擴展到更多語言。

圣經解決語音數據集難題

收集數千種語言的音頻數據并不是一件簡單的事情,這也是Meta的研究人員面臨的第一個挑戰。

要知道,現有的最大語音數據集最多也只涵蓋了100種語言。為了克服這個問題,研究人員轉向了宗教文本,如《圣經》。

這類文本已經被翻譯成許多不同的語言,被用于廣泛的研究,還有各種公開的錄音。

為此,Meta的研究者專門創建了一個超過1100種語言的《新約》閱讀數據集,平均每種語言提供32小時的數據。

再加上其他各種宗教讀物的無標簽錄音,研究者將可用的語言數量增加到了4000多種。

圖片

在MMS數據上訓練的自動語音識別模型,在FLEURS基準測試中,對男性和女性說話者具有相似的錯誤率

這些數據通常是由男性朗讀的,但模型對男性和女性的聲音表現得同樣好。

并且,雖然錄音的內容是宗教性的,但這并沒有使模型過度偏向于產生更多的宗教語言。

研究人員分析認為,這是因為他們使用了連接主義時間分類方法,與用于語音識別的大語言模型或序列對序列模型相比,它的約束性要大得多。

模型越大,越能打?

研究人員首先對數據進行了預處理,以提高數據的質量,并使其能被機器學習算法所利用。

為此,研究人員在100多種語言的現有數據上訓練了一個對齊模型,并將這個模型與一個高效的強制對齊算法一起使用,而該算法可以處理大約20分鐘或更長時間的錄音。

研究人員多次重復了這個過程,并根據模型的準確性進行了最后的交叉驗證過濾步驟,為的是去除潛在的錯誤對齊數據。

為了使其他研究人員能夠創建新的語音數據集,研究人員將對齊算法添加到了PyTorch中并發布了對齊模型。

目前,每種語言都有32小時的數據,但這并不足以訓練傳統的監督式語音識別模型。

這也就是為什么研究人員在wav2vec 2.0上訓練模型,這樣可以大大減少訓練一個模型所需的標注數據量。

具體來說,研究人員在超過1400種語言的約50萬小時的語音數據上訓練了自監督模型——這個量比過去多了近5倍。

然后針對特定的語音任務,如多語言語音識別或語言識別,研究人員再對模型進行微調即可。

為了更好地了解在大規模多語言語音數據上訓練的模型的表現,研究人員在現有的基準數據集上對它們進行了評估。

研究人員使用一個1B參數的wav2vec 2.0模型對超過1100種語言進行多語言語音識別模型的訓練。

隨著語言數量的增加,性能確實有所下降,但這種下降比較輕微——從61種語言到1107種語言,字符錯誤率只增加了約0.4%,但語言覆蓋率卻增加了18倍以上。

圖片

將每個系統支持的語言數量從61增加到1,107 時,使用MMS數據訓練的多語言識別系統的61種FLEURS語言的錯誤率。錯誤率越高表示性能越低

在與OpenAI的Whisper進行同類比較時,研究人員發現,在Massively Multilingual Speech數據上訓練的模型有將近一半的單詞錯誤率,但Massively Multilingual Speech涵蓋的語言是Whisper的11倍。

從數據中我們可以看出,與目前最好的語音模型相比,Meta的模型表現的真的非常不錯。

圖片

OpenAI Whisper與Massively Multilingual Speech在54種FLEURS語言上的單詞錯誤率對比

接下來,研究人員使用自己的以及現有的數據集,如FLEURS和CommonVoice,為超過4000種語言訓練了一個語言識別(LID)模型,并在FLEURS LID任務上對其進行了評估。

事實證明,哪怕支持了將近40倍的語言數量,性能依然很能打。

圖片

在現有工作的VoxLingua-107基準上的語言識別準確性,支持的語言剛剛超過100種,而MMS則支持超過4000種語言。

研究人員還為超過1100種語言建立了文本轉語音的系統。

大規模多語種語音數據有一個局限性,那就是對于許多語言來說,它包含的不同說話者數量相對較少,通常只有一個說話者。

然而,這個特點對于建立文本到語音系統來說是一個優勢,因此研究人員為超過1100種語言訓練了類似系統。

結果表明,這些系統產生的語音質量還算不錯。

未來屬于單一模型

Meta的研究人員對這個結果感到很滿意,但與所有新興的AI技術一樣,Meta目前的模型并不算完美。

比方說,語音到文本模型可能會誤寫選定的單詞或短語,可能會導致冒犯性的或者不準確的輸出結果。

同時,Meta認為,AI巨頭的合作對于負責任的AI技術的發展至關重要。

世界上的許多語言都有消失的危險,而目前語音識別和語音生成技術的局限性只會加速這一趨勢。

研究人員設想一個技術產生相反效果的世界,鼓勵人們保持其語言的活力,因為他們可以通過說自己喜歡的語言來獲取信息和使用技術。

大規模多語言語音項目是朝著這個方向邁出的重要一步。

在未來,研究人員希望進一步增加語言的覆蓋面,支持更多的語言,甚至還會想辦法搞定方言。要知道,方言對現有的語音技術來說可不簡單。

Meta的最終目標是讓人們能更容易地用自己喜歡的語言獲取信息、使用設備。

最后,Meta的研究人員還設想了這樣一個未來場景——靠一個單一的模型就可以解決所有語言的幾個語音任務。

目前雖然Meta為語音識別、語音合成和語言識別訓練了單獨的模型,但研究人員相信,在未來,只需一個模型就能完成所有這些任務,甚至不止。

責任編輯:張燕妮 來源: 新智元
相關推薦

2011-09-10 19:23:22

2011-09-09 13:42:16

2016-09-29 09:46:41

JavascriptWeb前端

2020-10-21 15:38:32

Facebook翻譯語言

2021-02-04 14:31:30

RISC-V架構GPU

2013-01-18 10:09:10

互聯網網絡發展撥號上網

2022-05-19 15:51:57

技術信息AI

2020-11-12 12:54:41

Linux基金會項目

2024-01-02 12:50:12

數據模型

2018-03-15 21:51:46

微軟翻譯機器

2017-08-01 10:15:56

數據分析大數據

2015-07-28 11:29:59

電商亞馬遜沃爾瑪

2015-12-21 16:12:06

紅帽CloudForms混合云

2023-06-23 14:15:09

Rust編程

2010-04-09 15:24:55

2013-10-09 13:25:40

Google

2013-10-10 12:28:56

Google開源代碼

2025-02-20 11:29:21

2016-09-01 08:07:02

Linux MinixUbuntu

2011-05-25 10:19:17

點贊
收藏

51CTO技術棧公眾號

亚洲伊人婷婷| 日韩欧美国产一区二区| 91精品国产综合久久久久久蜜臀 | 色先锋资源久久综合5566| 国产三级三级三级看三级| 毛片免费不卡| 成人黄色在线网站| 中文字幕欧美精品在线| 网站在线你懂的| 成年男女免费视频网站不卡| 国产精品久久久爽爽爽麻豆色哟哟| 亚洲va电影大全| 黄色在线免费观看| 亚洲一区欧美| 欧美日韩一区二区三区不卡| 久久草视频在线看| 国产尤物视频在线观看| 9色精品在线| 久久天天躁日日躁| 亚洲午夜激情影院| mm视频在线视频| 中文字幕一区二区在线观看| 精品国产区在线| 国产精品天天操| 天堂av在线一区| 久久久久久欧美| 深夜视频在线观看| 欧美xnxx| 欧美日韩国产在线看| av动漫在线免费观看| 二区在线观看| 91蜜桃在线免费视频| 91精品国产一区二区三区动漫 | 国产综合精品久久久久成人av| 午夜电影一区| 欧美一区二区三区四区在线观看| 无人在线观看的免费高清视频 | 亚洲国产你懂的| 成人短视频在线看| aⅴ在线视频男人的天堂 | 国产精品你懂的在线| 国产三级精品在线不卡| 99热这里只有精品5| 美女脱光内衣内裤视频久久网站| 一区二区三区天堂av| 亚洲高清在线免费观看| 91在线观看| wwww国产精品欧美| 国产一级特黄a大片99| 99热这里只有精品99| 久久国产人妖系列| 国产区亚洲区欧美区| 中文字幕免费视频观看| 久久久久久久波多野高潮日日| 亚洲视频国产视频| 久久国产精品无码一级毛片| 国产一区二区三区亚洲| 色综合天天综合给合国产| www.日本少妇| 91桃色在线| 精品久久中文字幕| 日本十八禁视频无遮挡| 国产在线观看www| 精品福利一区二区| 69堂免费视频| 成人美女大片| 欧美午夜理伦三级在线观看| 五月婷婷六月合| 亚洲成人1区| 91精品国产全国免费观看| 三级黄色片免费观看| 国产精品—色呦呦| 亚洲电影中文字幕在线观看| 男女视频网站在线观看| 伊人久久精品一区二区三区| 91高清视频在线| 老司机午夜性大片| 日韩免费一级| 日韩精品中文字| 国产探花视频在线播放| 欧美a级在线| 羞羞色国产精品| 天天干天天干天天操| 日本网站在线观看一区二区三区| 国产精品尤物福利片在线观看| 国产美女免费看| 国产ts人妖一区二区| 久精品国产欧美| www.久久热.com| 一区二区三区四区在线| 天天综合色天天综合色hd| www.色视频| 91丨九色丨蝌蚪丨老版| 亚洲一区二区三区乱码| 蜜桃传媒在线观看免费进入| 婷婷中文字幕综合| www.久久久精品| 国产高清不卡| 91精品综合久久久久久| 西西大胆午夜视频| 久久蜜桃av| 91超碰中文字幕久久精品| 中文字幕+乱码+中文| 亚洲一区图片| 91日韩在线播放| 天天射天天操天天干| 中文天堂在线一区| 人妻av中文系列| 日韩免费在线电影| 日韩成人在线观看| 欧美丰满熟妇bbb久久久| 美日韩中文字幕| 久久97久久97精品免视看| 无码人妻精品一区二| 国产高清一区日本| 小说区图片区图片区另类灬| 丁香花在线高清完整版视频| 欧美日韩精品免费| 欧美自拍小视频| 9l亚洲国产成人精品一区二三| 尤物yw午夜国产精品视频明星| 国产一级特黄视频| 伊人久久大香线蕉av超碰演员| 国产精品成人在线| 天天射天天操天天干| 亚洲精品视频免费观看| 欧美三级理论片| 色狼人综合干| 97视频在线观看成人| 国产av无码专区亚洲a∨毛片| 久久九九99视频| 老太脱裤让老头玩ⅹxxxx| 精品一区二区三区免费看| 中文字幕av一区中文字幕天堂| 日韩熟女精品一区二区三区| 粉嫩aⅴ一区二区三区四区| 中文字幕剧情在线观看一区| 黄瓜视频成人app免费| 日韩av一区二区在线| 国产精品16p| 粉嫩在线一区二区三区视频| ijzzijzzij亚洲大全| 69堂精品视频在线播放| 亚洲精品视频久久| 久久久久久久久久影院| 成人91在线观看| 农民人伦一区二区三区| 国产欧美三级电影| 国内精品模特av私拍在线观看| 午夜精品一区二区三| 亚洲激情六月丁香| 国产成人av免费观看| 午夜久久久久| 高清视频一区| 99久久精品免费看国产小宝寻花 | 亚洲一区二区视频在线观看| 乱码一区二区三区| 亚洲午夜精品久久久久久app| caoporn国产精品免费公开| 五月婷婷视频在线观看| 欧美本精品男人aⅴ天堂| 国产亚洲小视频| 99视频在线观看一区三区| 国内外成人免费激情视频| 欧美日韩爱爱| 国产精品欧美日韩| 日本激情在线观看| 一区二区国产盗摄色噜噜| 国产性猛交96| 国产精品日韩久久久| 欧洲精品国产| 国产成人免费精品| 久久成人在线视频| 狠狠躁夜夜躁av无码中文幕| 国产精品污网站| 国产又黄又猛的视频| 午夜精品影院| 麻豆传媒一区二区| 欧美一级做一级爱a做片性| 不用播放器成人网| 污视频网站免费观看| 色av一区二区| 四虎免费在线视频| www.欧美.com| 国产又大又黄又粗又爽| 欧美日韩国产在线一区| 久久偷看各类wc女厕嘘嘘偷窃 | 777亚洲妇女| 福利一区二区三区四区| 国产无一区二区| 欧美污在线观看| 亚洲欧美日韩国产一区| 一区二区三区国| 欧美日韩一区二区三区在线电影| 国产精品精品视频| 欧美卡一卡二| 在线成人中文字幕| 精品人妻一区二区三区含羞草| 欧美日韩亚洲国产一区| 日本福利片在线观看| 99精品在线免费| 久久精品国产露脸对白| 亚洲一区区二区| 奇米777四色影视在线看| 国产aⅴ精品一区二区三区久久| 亚洲999一在线观看www| 樱桃视频成人在线观看| 欧美精品一区三区| 国产无套粉嫩白浆在线2022年| 日韩三区在线观看| 销魂美女一区二区| 亚洲国产aⅴ天堂久久| 5566中文字幕| 久久久久久久精| 中国男女全黄大片| 久久精品免费观看| 国产1区2区在线| 一本色道久久综合亚洲精品不卡| 一区二区视频在线播放| 久久91精品| 好看的日韩精品视频在线| 国产精品2区| 色偷偷av亚洲男人的天堂| 天天综合在线视频| 日韩一二三区视频| 夜夜狠狠擅视频| 色综合天天综合| 少妇一级淫片免费放中国| 亚洲综合图片区| 秋霞欧美一区二区三区视频免费| 精品一区二区三区久久| 日本熟妇人妻xxxxx| 亚洲激情专区| 免费中文日韩| 粉嫩一区二区三区四区公司1| 亚洲自拍av在线| 久久久加勒比| 国产成人精品免高潮费视频| 国产高清自产拍av在线| 欧美激情亚洲精品| 羞羞的视频在线看| 美女福利精品视频| 久久77777| 久久精品电影网| 超碰在线caoporn| 欧美老女人性生活| 国产激情视频在线观看| 久久久91精品| 成人影欧美片| 久久99久国产精品黄毛片入口| 久久综合网导航| 久久久精品免费| 51xtv成人影院| 精品亚洲va在线va天堂资源站| 免费国产羞羞网站视频| 在线观看一区二区视频| 成人av网站在线播放| 91久久精品一区二区二区| 免费黄色片视频| 欧美日韩在线播放三区四区| 亚洲天堂一二三| 91精品综合久久久久久| 亚洲精品国偷拍自产在线观看蜜桃| 精品日韩在线观看| 午夜成人免费影院| 亚洲欧美国产日韩天堂区| 国产高清一区在线观看| 日韩最新中文字幕电影免费看| 中文字幕中文字幕在线十八区 | 三级网站在线播放| 欧美在线视频全部完| 一区二区www| 日韩欧美国产综合| 香蕉av一区二区三区| 国产一区二区三区在线视频 | 69视频在线免费观看| 在线国产成人影院| 亚洲最大福利视频网站| 久久夜色精品国产噜噜av小说| 日本日本精品二区免费| 国产精品videosex性欧美| 国产一区二区三区av在线| 美女视频亚洲色图| 视频一区免费观看| 你懂的视频一区二区| 免费成人在线视频网站| 日本在线不卡一区| 亚洲成a人无码| 久久久久88色偷偷免费| 国产探花在线播放| 欧美日韩亚洲激情| 国产精品国产一区二区三区四区| 精品91自产拍在线观看一区| 二人午夜免费观看在线视频| 欧美激情第1页| 日本美女久久| 国内精品二区| 亚洲第一偷拍| 虎白女粉嫩尤物福利视频| 国产成人综合亚洲网站| 免费一级黄色录像| 香蕉久久一区二区不卡无毒影院 | 日本少妇激情视频| 欧美亚洲禁片免费| 粉嫩av一区二区夜夜嗨| 中文国产亚洲喷潮| 阿v视频在线| 亚洲va欧美va国产综合久久| 欧美禁忌电影| 成人免费网站入口| 久久激情五月婷婷| 日韩精品无码一区二区三区久久久| 亚洲乱码精品一二三四区日韩在线| 国产女主播喷水视频在线观看| 亚洲精品一区二区三区影院| 激情在线小视频| 国产第一区电影| 欧美人与动xxxxz0oz| 激情视频小说图片| 久久国内精品视频| b站大片免费直播| 天天做天天摸天天爽国产一区| h狠狠躁死你h高h| 色爱精品视频一区| 欧美影视资讯| 乱色588欧美| 亚洲精品影院在线观看| 欧美老女人bb| 亚洲主播在线播放| 国产黄色小视频在线观看| 最近中文字幕2019免费| 日韩免费va| 日韩福利视频| 日韩一区欧美二区| 一级片视频免费看| 色婷婷综合视频在线观看| 午夜福利理论片在线观看| 国外成人在线直播| 国产成人高清精品免费5388| 97碰在线视频| 成人久久久精品乱码一区二区三区| 99re这里只有| 亚洲国产日韩一级| 性猛交富婆╳xxx乱大交天津| 久久不射热爱视频精品| 欧美1区2区3| 日韩国产成人无码av毛片| 成人午夜av在线| 久久精品国产亚洲AV无码男同 | 国产精品一区二区久久久| 国产伦精品一区二区三区千人斩| 青青青在线播放| 国产亚洲综合色| 综合久久中文字幕| 久久精品国产96久久久香蕉| 91丨精品丨国产| 成人黄色片免费| 成人涩涩免费视频| 久久综合加勒比| 日韩av在线资源| 免费日韩电影| 亚洲巨乳在线观看| 黄色av成人| 波多野结衣影院| 色婷婷av一区二区三区软件| 高清福利在线观看| 国产欧美韩国高清| 亚洲精品在线观看91| 国产精品欧美性爱| 亚洲成人av一区二区| 午夜av免费在线观看| 国产成人在线一区二区| 一区二区电影| 五月天激情小说| 91极品视觉盛宴| 国产黄色小视频在线| 国产伦精品一区二区三区四区视频| 国产欧美日韩一级| 色屁屁草草影院ccyy.com| 欧美一区二区视频在线观看2020| 9999在线视频| 一区二区不卡在线视频 午夜欧美不卡' | 中文字幕电影一区| 国产色视频在线| 国产91精品久久久久| 日本女优一区| 精品伦一区二区三区| 在线亚洲高清视频| 99自拍视频在线观看| 久久一区二区三区欧美亚洲| 精品在线播放免费| 久久夜色精品亚洲| 丝袜亚洲欧美日韩综合| 欧美中文一区| 尤物网站在线看| 在线视频欧美精品| 欧美hdxxx| 亚洲精品中文字幕在线| 91亚洲精品乱码久久久久久蜜桃| 国产精品久久久久久免费|