精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Meta用《圣經》訓練超多語言模型:識別1107種、辨認4017種語言

人工智能 新聞
世界上有許多語言瀕臨滅絕,而當前的語音識別和語音生成技術的局限性只會進一步加速這一趨勢。

在《圣經》中有一個巴別塔的故事,說是人類聯合起來計劃興建一座高塔,希望能通往天堂,但神擾亂了人類的語言,計劃也就因此失敗。到了今天,AI 技術有望拆除人類語言之間的藩籬,幫助人類造出文明的巴別塔。

近日,Meta 的一項研究向這個方面邁出了重要一步,他們將新提出的方法稱為 Massively Multilingual Speech(超多語言語音 / MMS),其以《圣經》作為訓練數據的一部分,得到了以下成果:

  • 在 1107 種語言上用 wave2vec 2.0 訓練得到了一個有 10 億參數的多語言語音識別模型,相比于 OpenAI 的 Whisper 模型,其錯誤率降低了 50% 以上。 
  • 單個音頻合成模型就支持這 1107 種語言的文本轉語音(TTS)。 
  • 開發了一個能夠辨別 4017 種語言的語言辨識分類器。 

對于很多罕見語言的數據稀少問題,Meta 是如何解決的呢?他們采用的方法很有意思,即采用宗教的語料庫,因為像是《圣經》這樣的語料具有最「對齊的」語音數據。盡管這個數據集偏向宗教內容并且主要是男性聲音,但其論文表明這個模型在其它領域以及使用女聲時也表現優良。這是基礎模型的涌現行為,著實讓人驚嘆。而更讓人驚嘆的是,Meta 將新開發的模型(語音識別、TTS 和語言辨識)都免費發布出來了!

  • 模型下載:https://github.com/facebookresearch/fairseq/tree/main/examples/mms
  • 論文地址:https://research.facebook.com/publications/scaling-speech-technology-to-1000-languages/

新提出的方法

為了打造出一個能識別千言萬語的語音模型,首要的挑戰是收集各種語言的音頻數據,因為現目前已有的最大語音數據集也只有至多 100 種語言。為了克服這個問題,Meta 的研究者使用了宗教文本,比如《圣經》,這些文本已被翻譯成了許多不同語言,并且那些譯本都已被廣泛研究過。這些譯本都有人們用不同語言閱讀的錄音,并且這些音頻也是公開可用的。使用這些音頻,研究者創建了一個數據集,其中包含人們用 1100 種語言閱讀《新約》的音頻,其中每種語言的平均音頻長度為 32 小時。

然后他們又納入了基督教的其它許多讀物的無標注錄音,從而將可用語言數量增加到了 4000 以上。盡管這個數據集領域單一,并且大都是男聲,但分析結果表明 Meta 新開發的模型在女聲上表現也同樣優良,并且該模型也不會格外偏向于產生更宗教式的語言。研究者在博客中表示,這主要是得益于他們使用的 Connectionist Temporal Classification(連接主義時間分類)方法,相比于大型語言模型(LLM)或序列到序列語音識別模型,這種方法要遠遠更為受限。

圖片

潛在的性別偏見情況分析。在 FLEURS 基準上,這個在超多語言語音(MMS)數據集上訓練的自動語音識別模型在男聲和女聲上的錯誤率是差不多的。

為了提升數據質量,使之能被機器學習算法使用,他們還采用了一些預處理方法。首先,他們在現有的 100 多種語言的數據上訓練了一個對齊模型,然后再搭配使用了一個高效的強制對齊算法,該算法可處理 20 分鐘以上的超長錄音。之后,經過多輪對齊過程,最終再執行一步交叉驗證過濾,基于模型準確度移除可能未對齊的數據。為了方便其他研究者創建新的語音數據集,Meta 將該對齊算法添加到了 PyTorch 并放出了該對齊模型。

要訓練出普遍可用的監督式語音識別模型,每種語言僅有 32 小時的數據可不夠。因此,他們的模型是基于 wav2vec 2.0 開發的,這是他們之前在自監督語音表征學習上的研究成果,能極大減少訓練所需的有標注數據量。具體來說,研究者使用 1400 多種語言的大約 50 萬小時語音數據訓練了一個自監督模型 —— 這個語言數量已經超過之前任何研究的五倍以上了。然后,基于具體的語音任務(比如多語言語音識別或語言辨識),研究者再對所得模型進行微調。

結果

研究者在一些已有基準上評估了新開發的模型。

其多語言語音識別模型的訓練使用了含 10 億參數的 wav2vec 2.0 模型,訓練數據集包含 1100 多種語言。隨著語言數量增加,模型性能確實會下降,但下降幅度非常小:當語言數量從 61 種增加到 1107 種時,字符錯誤率僅上升了 0.4%,但語言覆蓋范圍卻增加了 18 倍以上。

圖片

在 61 種 FLEURS 語言的基準測試上,隨語言數量增長的字符錯誤率變化情況,錯誤率越高,模型越差。

通過對比 OpenAI 的 Whisper 模型,研究者發現他們的模型的詞錯誤率僅有 Whisper 的一半,而同時新模型支持的語言數量還多 11 倍。這個結果足以表明新方法的卓越能力。

圖片

在可直接比較的 54 種 FLEURS 語言的基準測試上,OpenAI Whisper 與 MMS 的詞錯誤率對比。

接下來,使用之前已有的數據集(如 FLEURS 和 CommonVoice)和新數據集,Meta 的研究者還訓練了一個語言辨識(LID)模型,并在 FLEURS LID 任務上進行了評估。結果表明,新模型不僅表現很棒,而且支持的語言數量也增加了 40 倍。

之前的研究在 VoxLingua-107 基準上也僅支持 100 多種語言,而 MMS 支持超過 4000 種語言。

另外 Meta 還構建了一個支持 1100 種語言的文本轉語音系統。當前文本轉語音模型的訓練數據通常是來自單個說話人的語音語料。MMS 數據的一個局限性是許多語言都只有少量說話人,甚至往往只有一個說話人。但是,在構建文本轉語音系統時,這卻成了一個優勢,于是 Meta 就順便造了一個支持 1100 多種語言的 TTS 系統。研究者表示,這些系統生成的語音質量其實相當好,下面給出了幾個例子。

約魯巴語、伊洛科語和邁蒂利語的 MMS 文本轉語音模型演示。

盡管如此,研究者表示 AI 技術都仍不完美,MMS 也是如此。舉個例子,MMS 在語音轉文本時可能錯誤轉錄選定的詞或短語。這可能導致輸出結果中出現冒犯性和 / 或不準確的語言。研究者強調了與 AI 社區合作共同進行負責任開發的重要性。

用單個模型支持千言萬語的價值

世界上有許多語言瀕臨滅絕,而當前的語音識別和語音生成技術的局限性只會進一步加速這一趨勢。研究者在博客中設想:也許技術能鼓勵人們留存自己的語言,因為有了好的技術后,他們完全可以使用自己喜歡的語言來獲取信息和使用技術。

他們相信 MMS 項目是朝這個方向邁出的重要一步。他們還表示這個項目還將繼續開發,未來還將支持更多語言,甚至還會解決方言和口音的難題。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-25 15:30:00

語言模型數據

2023-09-04 19:19:36

語言模型LLM

2025-11-12 17:15:53

MetaAI模型

2023-08-28 00:33:48

開源語音識別

2021-08-09 10:03:03

數據開源語音

2020-10-28 10:38:08

谷歌模型機器翻譯

2014-04-16 14:50:20

Spark

2009-08-25 10:44:50

C#實現多語言

2011-08-05 17:54:33

Cocoa Touch 多語言

2014-07-09 09:20:06

WPFWPF應用

2012-04-19 11:40:21

Titanium

2023-08-04 10:18:15

2024-09-29 13:10:08

2020-09-16 14:01:10

Vue.js項目語言

2019-10-10 09:00:00

谷歌數據技術

2024-05-09 08:14:09

系統設計語言多語言

2022-08-09 07:22:15

語言數據庫程序

2021-03-02 13:53:37

人工智能深度學習Google mBER

2022-07-20 16:36:02

模型AI

2021-06-29 21:48:32

開源語言架構
點贊
收藏

51CTO技術棧公眾號

中文字幕日韩在线视频| 在线观看成人小视频| 国产伦理一区二区三区| 手机在线看片1024| 亚洲成人最新网站| 亚洲精品美女免费| 奇米影音第四色| 国产又色又爽又黄刺激在线视频| 99精品国产一区二区三区不卡| 国产成人精品a视频一区www| 日韩精品123区| 亚洲ab电影| 欧美一区二区视频网站| 日本a级片免费观看| 黄色在线观看网站| 久久香蕉国产线看观看99| 91久久久久久久久久久久久| 欧美videossex极品| 亚洲高清资源在线观看| 亚洲片av在线| 毛茸茸free性熟hd| 国产精品久久免费视频 | 91精品国产综合久久婷婷香蕉| 丁香婷婷综合激情| 女女色综合影院| 久久久av毛片精品| 国产私拍一区| 国产av无码专区亚洲a∨毛片| 久久久久国内| 性欧美xxxx视频在线观看| 99视频只有精品| 日本欧美肥老太交大片| 国产婷婷成人久久av免费高清| 无码人妻少妇色欲av一区二区| 成人在线黄色| 色综合久久久久久久久久久| 国产 日韩 欧美在线| 最爽无遮挡行房视频在线| 中国色在线观看另类| 欧美精品亚洲精品| 婷婷丁香一区二区三区| 国产不卡高清在线观看视频| 91久久国产综合久久91精品网站| 波多野结衣视频在线看| 亚洲综合99| 91国产美女视频| 天天操天天射天天爽| 国内综合精品午夜久久资源| 欧美老妇交乱视频| 欧美 日韩 国产 一区二区三区| 色777狠狠狠综合伊人| 在线观看日韩欧美| 亚洲自拍偷拍图| 欧美午夜精彩| 色老头一区二区三区| 成人无码精品1区2区3区免费看| 欧美熟乱15p| 最近2019年中文视频免费在线观看| 欧洲美一区二区三区亚洲 | 午夜视频久久久| 国产三级视频在线看| 久久伊人蜜桃av一区二区| 久久精品五月婷婷| 麻豆影视在线| 中文字幕二三区不卡| 亚洲永久一区二区三区在线| 婷婷视频在线| 亚洲天天做日日做天天谢日日欢 | 黄色录像a级片| 欧美日韩大片免费观看| 亚洲欧美国产精品| 手机看片福利视频| 66久久国产| 国产69精品久久久| 亚洲天堂av片| 六月婷婷色综合| 91色在线观看| 天天操天天射天天舔| 久久久欧美精品sm网站| 亚洲日本精品一区| 欧美人与性动交α欧美精品济南到| 香蕉成人啪国产精品视频综合网| 无码aⅴ精品一区二区三区浪潮| 欧美人与性动交xxⅹxx| 7777精品伊人久久久大香线蕉超级流畅 | 欧美性三三影院| 婷婷中文字幕在线观看| 91蝌蚪精品视频| 国产午夜一区二区| 婷婷伊人五月天| 国产精品普通话对白| 国产欧美日韩最新| 人妻一区二区三区四区| 国产亚洲视频系列| 日韩精品福利片午夜免费观看| 国产在线精彩视频| 欧美人妇做爰xxxⅹ性高电影| 无码人妻一区二区三区免费n鬼沢| 九九热精品视频在线观看| 日韩中文综合网| 日韩精品视频播放| 美女视频黄久久| 国产精品一区二区三区观看| 国产高清在线| 亚洲成a人v欧美综合天堂| 超碰在线97免费| 女同一区二区三区| 久久综合伊人77777尤物| 亚洲精品男人的天堂| 国产老肥熟一区二区三区| 欧美激情论坛| 里番在线播放| 69久久夜色精品国产69蝌蚪网| 自拍视频一区二区| 欧美精品日韩| 国产自摸综合网| 黄色片在线免费看| 亚洲国产日韩精品| 日日干日日操日日射| 国内精品视频在线观看| 久久人人爽国产| 国产又粗又猛又爽又黄的视频一| 久久久五月婷婷| 三上悠亚久久精品| 日韩在线成人| 久久久精品电影| 中文字幕视频免费观看| 久久美女高清视频| 免费 成 人 黄 色| 懂色av一区二区| 欧美成年人视频| 一级黄色大毛片| 欧美国产精品久久| 女性隐私黄www网站视频| 看全色黄大色大片免费久久久| 久久国产精品久久久久久| 影音先锋国产在线| 亚洲国产成人午夜在线一区| 免费高清在线观看免费| 丝袜美腿一区二区三区动态图| 欧美激情在线视频二区| 性生活视频软件| 亚洲激情男女视频| 亚洲制服在线观看| 亚洲综合色网| 成人免费福利在线| 国产超级va在线视频| 欧美精品久久久久久久久老牛影院| jizz日本免费| 国产精品女主播一区二区三区| 国产三级精品在线不卡| 国产99在线观看| 亚洲精品国精品久久99热一| 久久久久久久久久免费视频| 成人动漫在线一区| 国产在线精品91| 欧美一级二级三级视频| 2025国产精品视频| 精品欧美不卡一区二区在线观看 | 亚洲欧美日韩一区二区三区四区| 久久综合av免费| 91视频免费版污| 日韩午夜电影网| 91成人免费看| 91精品国产黑色瑜伽裤| 国产婷婷色综合av蜜臀av| 欧美性生活大片免费观看网址| 国产黑丝在线视频| 国产精品theporn| 国产欧美一区二区视频 | 清纯唯美日韩制服另类| 久草视频视频在线播放| 精品视频一区三区九区| 男人在线观看视频| 成人毛片老司机大片| 欧美日韩黄色一级片| 国产成人ay| 成人妇女淫片aaaa视频| 伊人影院在线视频| 亚洲国模精品一区| 天堂av免费在线观看| 自拍偷自拍亚洲精品播放| 少妇极品熟妇人妻无码| 久久成人一区| 亚洲在线不卡| 国产成人精品亚洲线观看| 日本高清不卡在线| 日本视频在线| 亚洲国产一区自拍| 岳乳丰满一区二区三区| 一区二区成人在线| 在线观看福利片| 国产一区二区美女| 成人午夜视频免费在线观看| 99久久婷婷| 久久久久资源| 一区在线不卡| 欧洲精品毛片网站| 中文字幕在线观看网站| 亚洲视频免费一区| www.久久成人| 欧美三级日本三级少妇99| 国产一级片久久| 国产精品亲子伦对白| 亚洲国产精品自拍视频| 久久国产综合精品| 人妻熟女一二三区夜夜爱| 91精品国产视频| 欧美日本韩国一区二区三区| 欧美中文高清| 国产精品黄色影片导航在线观看| 污污网站在线看| 在线观看日韩视频| 日本在线视频1区| 日韩欧美一区二区不卡| 中文字幕一二三四| 欧美日韩在线另类| 久久中文字幕无码| 1024国产精品| 国产一区二区三区四区在线| 白白色亚洲国产精品| 国产又粗又长又爽又黄的视频| 久久久噜噜噜久久狠狠50岁| 欧美性潮喷xxxxx免费视频看| 日本电影一区二区| 日本一区二区三区免费看| 欧美电影在线观看免费| 波多野结衣精品久久| 国产激情一区| 成人淫片在线看| 日本久久一区| 国产乱人伦真实精品视频| 成人激情综合| 国产91精品久久久久久| а√天堂中文在线资源8| 欧美大成色www永久网站婷| 无遮挡动作视频在线观看免费入口| 亚洲欧美国产精品| 嫩草在线播放| 亚洲美女激情视频| 91超碰rencao97精品| 免费毛片b在线观看| 欧美精品videosex性欧美| av电影免费在线观看| 久久精品中文字幕| 国产原创在线观看| 理论片在线不卡免费观看| 日本美女高清在线观看免费| 最近2019年日本中文免费字幕| 成人影院免费观看| 一本一道久久a久久精品逆3p| 国产一级免费在线观看| 在线电影中文日韩| 五月婷婷在线视频| 久久av在线看| 污片在线免费观看| 国产做受高潮69| 三妻四妾完整版在线观看电视剧| 97免费中文视频在线观看| 欧美激情20| 日韩av电影国产| 国产成人精品一区二区三区视频| 国产精品久久久久久久久男| 欧美另类激情| 亚洲xxxx做受欧美| 玖玖玖免费嫩草在线影院一区| 乱一区二区三区在线播放| 久久99国产成人小视频| 亚洲精品乱码久久久久久蜜桃91 | 免费看啪啪网站| 亚洲综合色站| 波多野结衣之无限发射| 噜噜噜躁狠狠躁狠狠精品视频| 日韩在线第三页| 久久99精品国产麻豆婷婷洗澡| 小日子的在线观看免费第8集| 成人毛片老司机大片| 国产人妻大战黑人20p| 中文字幕亚洲一区二区av在线| 天天综合天天做| 粉嫩老牛aⅴ一区二区三区| 超碰在线观看91| 制服丝袜日韩国产| 天堂中文在线官网| 一本一本久久a久久精品牛牛影视 一本色道久久综合亚洲精品小说 一本色道久久综合狠狠躁篇怎么玩 | 国产69精品久久久久毛片| 欧美做受喷浆在线观看| 国产精品视频一二| 国产精品成人免费观看| 色域天天综合网| 国产精品视频a| 亚洲精品第一页| 日本在线免费| 2019精品视频| 亚洲国产天堂| 久久青青草原| 欧美一区二区三区久久精品茉莉花| 鲁一鲁一鲁一鲁一澡| 久久国产精品色| 久久人人爽人人人人片| 亚洲欧美日韩国产手机在线| 国产午夜精品一区二区理论影院| 欧美日韩综合一区| 国产综合在线播放| 在线国产精品播放| 黄色在线免费观看网站| 成人欧美一区二区三区在线湿哒哒 | 视频免费一区| 97超碰蝌蚪网人人做人人爽| 国产不卡精品| 亚洲成人网上| 国产精品美女久久久浪潮软件| 手机精品视频在线| 国产精品免费丝袜| 中文在线第一页| 精品盗摄一区二区三区| 黄色网页在线看| 国产精品成人v| 精品国产一区二区三区不卡蜜臂 | 最近中文字幕无免费| 18欧美乱大交hd1984| 五月婷婷丁香在线| 亚洲男女性事视频| 97人人爽人人澡人人精品| 91在线精品播放| 四虎8848精品成人免费网站| 日韩欧美精品在线观看视频| av激情综合网| 久久久精品视频在线| 91精品久久久久久蜜臀| 欧美jizzhd69巨大| 成人a免费视频| 日韩在线观看一区 | 性欧美大战久久久久久久免费观看 | 成人黄色777网| 亚洲国产成人精品综合99| 欧美影院午夜播放| 成人免费在线视频网| 5252色成人免费视频| 久久亚州av| 国产h视频在线播放| 不卡的av在线播放| 久草精品视频在线观看| 精品少妇一区二区三区日产乱码| av在线看片| 91在线视频精品| 欧美va天堂在线| 性一交一黄一片| 一区二区三区丝袜| 亚洲av无码乱码国产精品| 理论片在线不卡免费观看| 欧美黄视频在线观看| 粉嫩av一区二区三区天美传媒| 国产一区二区毛片| 久一区二区三区| 亚洲国产成人久久综合一区| 高端美女服务在线视频播放| 国产一区二区无遮挡| 国产精品毛片一区二区三区| 爱爱免费小视频| 欧美亚洲一区二区三区四区| 99中文字幕一区| 亚洲自拍av在线| 一区免费在线| 蜜桃av免费看| 欧美喷潮久久久xxxxx| caoporn免费在线视频| 国产二区不卡| 久久激情综合| 99成人在线观看| 日韩精品一区二区在线| 黄视频免费在线看| 五月天丁香综合久久国产 | av午夜在线| 成人伊人精品色xxxx视频| 亚洲高清自拍| 国产人妻大战黑人20p| 欧美日本一区二区三区四区| 手机在线免费看av| 久久久久一区二区三区| 老司机精品视频导航| 青娱乐国产在线| 亚洲女人被黑人巨大进入| 精品国产美女a久久9999| av日韩在线看| 久久久一区二区三区| 国产精品久久久久久久久久久久久久久久| 欧美猛交ⅹxxx乱大交视频| 亚洲专区视频| 日本亚洲一区二区三区| 精品日本高清在线播放| 日韩黄色影院| 精品国产_亚洲人成在线| 奇米在线7777在线精品| 国产极品美女高潮无套嗷嗷叫酒店| 亚洲欧美国产另类| 一区二区三区四区精品视频| 狠狠爱免费视频| 一个色综合网站| yw193.com尤物在线|