精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

ICLR 2025|小米新一代Kaldi語音識別算法CR-CTC,純CTC性能實現(xiàn)SOTA

人工智能 新聞
近日,小米集團新一代 Kaldi 團隊關(guān)于語音識別算法的論文《CR-CTC: Consistency regularization on CTC for improved speech recognition》被 ICLR 2025 接收。

新一代 Kaldi 團隊是由 Kaldi 之父、IEEE fellow、小米集團首席語音科學家 Daniel Povey 領(lǐng)銜的團隊,專注于開源語音基礎(chǔ)引擎研發(fā),從神經(jīng)網(wǎng)絡(luò)聲學編碼器、損失函數(shù)、優(yōu)化器和解碼器等各方面重構(gòu)語音技術(shù)鏈路,旨在提高智能語音任務(wù)的準確率和效率。

目前,新一代 Kaldi 項目 (https://github.com/k2-fsa)主要由四個子項目構(gòu)成:核心算法庫 k2、通用語音數(shù)據(jù)處理工具包 Lhotse、解決方案集合 Icefall 以及服務(wù)端引擎 Sherpa,方便開發(fā)者輕松訓練、部署自己的智能語音模型。

近日,小米集團新一代 Kaldi 團隊關(guān)于語音識別算法的論文《CR-CTC: Consistency regularization on CTC for improved speech recognition》被 ICLR 2025 接收。

  • 論文鏈接:https://arxiv.org/pdf/2410.05101
  • 論文代碼:https://github.com/k2-fsa/icefall/pull/1766(已 merge 進 icefall 框架)


摘要

主流的自動語音識別(ASR)模型包括 CTC [1]、transducer [2] 和混合系統(tǒng) CTC/AED [3]。CTC 是其中最簡單、最便于部署的方法,但由于它的性能通常明顯落后于 Transducer 和 CTC/AED,這限制了它的實際應(yīng)用。

為此,新一代 Kaldi 團隊提出了 Consistency-Regularized CTC (CR-CTC),可以讓純 CTC 模型的識別性能比肩 Transducer 和 CTC/AED。CR-CTC 在多個主流的 ASR 數(shù)據(jù)集,包括 LibriSpeech、Aishell-1、GigaSpeech 等數(shù)據(jù)集上,取得新的 SOTA 結(jié)果(不依賴外部訓練數(shù)據(jù)和外部語言模型)。

例如,在 LibriSpeech 數(shù)據(jù)集上訓練 Zipformer-L,標準 CTC 的 WER 為 2.5/5.72,CTC/AED 的 WER 為 2.09/4.59, Pruned Transducer 的 WER 為 2.00/4.38;CR-CTC 的 WER 為 2.02/4.35;CTC/AED 和 Pruned Transducer 掛上 CR-CTC 聯(lián)合訓練后,WER 可分別進一步降低到 1.96/4.08 和 1.88/3.95。

方法實現(xiàn)

如 Figure 1 所示,CR-CTC 方法非常簡單,先從同一個輸入 Mel-spectrogram  x 得到兩個不同的 augmented views  和,分別輸入?yún)?shù)共享的 encoder 模型 f,得到對應(yīng)的兩個 CTC 概率分布,除了計算兩個 CTC loss ,還引入 consistency regularization loss 來約束兩個分布的一致性:。系統(tǒng)總體 loss 為:

其中 α 為控制正則的超參數(shù),默認設(shè)置為 0.2。

Different augmented views

我們對同一個輸入 x 的兩個 copy 獨立地使用 SpecAugment [4] 來獲得不同的 augmented views 。SpecAugment 包含 time warping、frequency masking 和 time masking。由于 time warping 會顯著改變輸出的時間戳,因此我們在創(chuàng)建 copy 前先應(yīng)用 time warping,防止兩個分支的輸出分布在時間戳上嚴重不匹配。接著,分別對兩個 copy 獨立應(yīng)用 frequency masking 和 time masking,得到了 。相較于普通的 ASR 系統(tǒng),我們特意使用了更大程度的 time masking。

Consistency regularization loss

我們在CTC 分布的每一幀上應(yīng)用 consistency regularization,通過最小化每一對分布之間的雙向 KL 散度: 和 。此處,sg 表示 stop-gradient,防止這一項的梯度影響目標分布。Consistency regularization loss 公式為:

方法解釋

論文從三個不同的角度來解釋 CR-CTC 的本質(zhì)行為:1)self-distillation;2)masked prediction;3)peak suppression。

Self-distillation

當我們在訓練中使用 dropout [5] 和 stochastic depth [6] 等模型正則技術(shù),可以看作我們正在隱式地訓練隨機采樣的不同 sub-model,這些 sub-model 最終被集成為一個 ensemble 用于推理。與 R-Drop [7] 和 cosub [8] 類似,CR-CTC 在進行對不同 sub-model 之間的 self-distillation,監(jiān)督信號為對方提供的幀級別的 token 分布。另外,CR-CTC 使用了不同的 augmented views(以及更大程度的 time-masking),讓這些 sub-model 接觸輸入數(shù)據(jù)的不同角度的信息,加強他們預(yù)測的多樣性,這樣有利于更豐富、更完備的知識蒸餾。

Masked prediction

在 CR-CTC 中,那些覆蓋在 time masking 區(qū)域的幀,被要求著基于其他沒有被 masked 的區(qū)域,去預(yù)測對方提供的 token 分布。這個過程類似于 masked-based 自監(jiān)督模型 [9,10,11],鼓勵模型去學習非 mask 部分的上下文表征信息,并發(fā)掘模型隱式的語言建模能力。我們在 CR-CTC 中使用不同的 augmented views,減少兩邊同時被覆蓋在 time masking 區(qū)域的幀的出現(xiàn),提高這些被 masked 位置所接收的 token 分布的質(zhì)量。另外,使用更大程度的 time masking 可以加強 masked prediction 行為,進而增強模型對上下文表征信息的學習。 

Peak suppression

眾所周知,CTC 通常會學習到非常尖的概率分布。如 Figure 2 (left) 所示,non-blank token 只占 1 幀,其他的都是 blank,它們的概率都非常高。這種現(xiàn)象表明模型有可能已經(jīng)過擬合了,泛化能力不強。CR-CTC 的 consistency regularization 引導(dǎo)著模型學習兩邊分布的平均,這使得模型學習到的 CTC 分布會更加平滑。這個 peak suppression 行為減少了在訓練數(shù)據(jù)上的過度置信,從而增強模型的泛化能力。如 Figure 2 (right) 所示,CR-CTC 學習到的分布更加平滑,概率更低,伴隨著更多 non-blank 的 repeat 出現(xiàn)。

實驗結(jié)果

論文主要使用 Zipformer [12] 作為 speech encoder 進行實驗驗證。由于 CR-CTC 訓練時需要進行兩次 forward,我們對 CR-CTC 模型的 batch size 和 epoch 數(shù)都設(shè)置為標準 CTC 模型的一半,來確保兩者訓練代價可比較。具體使用的 GPU 數(shù)量和 epoch 數(shù)在論文附錄中。

與 SOTA 模型相比較

Table 1、2、3 分別展示了不同模型在 LibriSpeech、Aishell-1、GigaSpeech 三個數(shù)據(jù)集上的表現(xiàn)(不依賴外部訓練數(shù)據(jù)和外部語言模型)。總的來說,CR-CTC 的性能顯著超越標準 CTC,和 CTC/AED 與 Transducer 模型效果相當。另外,掛上 CR-CTC 聯(lián)合訓練,可以進一步提升 CTC/AED 和 Transducer 的性能。在這三個數(shù)據(jù)集上,我們?nèi)〉昧诵碌?SOTA 結(jié)果。

消融實驗

Table 4、5、6 分別展示了 CR-CTC 關(guān)于不同解釋角度 self-distillation、masked prediction、peak suppression 的消融實驗結(jié)果,具體說明可參考論文。

與掛一個 auxiliary head 聯(lián)合訓練相比較

想要提升 CTC 系統(tǒng)的性能,一個最直接的方法便是掛一個 AED head 或者一個 Transducer head 聯(lián)合訓練。如 Table 7 所示,CR-CTC 的性能明顯超過這兩個方法,參數(shù)還更少。

在 Conformer 模型上驗證

如 Table 17 所示,使用 Conformer [13] 作為 speech encoder 時,CR-CTC 同樣可以顯著提升 CTC 的性能,并且略微超過 CTC/AED 和 Transducer。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2010-09-26 13:29:46

JVM垃圾回收

2018-06-07 10:34:22

開源DFSMN語音識別

2012-07-02 10:36:19

菲亞特

2022-03-10 16:01:29

Playwright開源

2013-01-04 16:15:08

微軟ERPDynamics AX

2009-02-26 21:11:18

VTL數(shù)據(jù)保護虛擬磁帶庫

2012-03-05 10:01:39

科大訊飛

2012-03-07 14:56:54

新一代語音云發(fā)布暨語音

2016-01-26 11:58:12

2012-09-24 10:12:22

高性能計算浪潮

2023-03-21 08:01:44

Crimson硬件CPU

2019-05-14 09:58:07

iPhoneA13蘋果

2019-08-27 09:19:59

芯片A13iPhone

2025-04-11 10:00:52

2020-05-26 14:10:34

Web前端指標

2025-04-25 03:00:00

開源數(shù)據(jù)集成工具數(shù)據(jù)庫

2012-12-13 09:35:20

新一代ERPMicrosoft D微軟

2011-03-31 17:49:51

微軟嵌入式WindowsEmbe

2009-03-11 13:02:20

存儲虛擬化數(shù)據(jù)中心

2010-06-17 16:54:49

新一代Hotmail
點贊
收藏

51CTO技術(shù)棧公眾號

欧美浪妇xxxx高跟鞋交| 欧美激情在线看| 久久久中文字幕| 搡老熟女老女人一区二区| 欧美free嫩15| 亚洲精品精品亚洲| 久久综合伊人77777麻豆| 夜夜躁狠狠躁日日躁av| 一区在线免费观看| 这里只有精品丝袜| 亚洲精品无码一区二区| 亚洲第一会所001| 亚洲一级二级在线| 亚洲精品乱码视频| 开心激情综合网| 美国毛片一区二区三区| 国模私拍一区二区三区| 婷婷国产成人精品视频| 三级小说欧洲区亚洲区| 欧美一区日本一区韩国一区| 四虎永久在线精品无码视频| 色呦呦在线观看视频| 国产日韩欧美精品综合| 国产伦精品一区二区三区四区免费| 久久久999久久久| 精品福利av| www欧美日韩| 久操视频免费看| 成人动漫视频| 91精品国产麻豆国产自产在线| 欧美韩国日本在线| 岛国毛片av在线| 专区另类欧美日韩| 午夜精品亚洲一区二区三区嫩草| 欧美一级特黄aaaaaa大片在线观看| 久久精品72免费观看| 国产精品va在线| 国产成人在线播放视频| 欧美日韩精品| 久久夜色精品国产欧美乱| 中文字幕有码在线播放| 亚洲人成网77777色在线播放| 精品国产精品一区二区夜夜嗨| 精品亚洲视频在线| 国产精品美女午夜爽爽| 日本乱人伦一区| av观看免费在线| 日本免费一区二区六区| 午夜伦理一区二区| 拔插拔插海外华人免费| 日韩av毛片| 一区二区三区四区亚洲| 992tv快乐视频| av在线免费播放| 亚洲欧美日韩国产成人精品影院 | 91国偷自产中文字幕久久| 欧美一级二区| 国产98色在线| 最新中文字幕在线观看视频| 日韩av在线播放中文字幕| 国产精品va在线播放| 中文字幕视频在线播放| 久久精品国产77777蜜臀| 91精品国产综合久久香蕉的用户体验| 一二三四区视频| 国产一区视频导航| 国产高清在线一区| 深夜福利视频在线免费观看| 久久一留热品黄| 色播五月综合| 黄色网址视频在线观看| 国产精品三级av在线播放| 日韩av不卡在线播放| 91亚洲精选| 亚洲视频一区二区免费在线观看| 男人j进女人j| 2020国产在线| 一本色道久久综合狠狠躁的推荐| 天天爽天天爽夜夜爽| 人人玩人人添人人澡欧美| 91精品国产91久久久久久最新毛片| 欧美性猛交乱大交| 警花av一区二区三区 | 九一在线视频| 国产精品激情偷乱一区二区∴| 欧美 另类 交| 黄色激情在线播放| 91九色最新地址| 日韩av一卡二卡三卡| 91精品国产自产在线丝袜啪| 亚洲免费影视第一页| 日韩av网站在线播放| 欧美深夜福利| 国产精品v片在线观看不卡| 国产高清第一页| 91视频免费播放| 中文字幕在线亚洲三区| 阿v视频在线观看| 欧美日韩亚洲丝袜制服| 精品一区二区视频在线观看 | 亚洲图片制服诱惑| 娇小11一12╳yⅹ╳毛片| 欧美午夜国产| 国产精品免费视频xxxx| 黄色一级大片在线免费看国产一| 中文字幕精品—区二区四季| 嫩草影院中文字幕| 成人在线免费av| 日韩大片在线观看视频| 永久免费未视频| 香蕉精品999视频一区二区| 91精品视频免费看| 国产小视频免费在线网址| 一区二区在线观看免费视频播放| 成年人免费在线播放| 日韩精品中文字幕一区二区| 一区二区三区久久精品| 日韩精品――中文字幕| 国产一区二区三区综合| 日韩精品在在线一区二区中文| 岛国毛片av在线| 欧美一级理论性理论a| 国产又粗又猛又爽又黄的视频四季| 中文欧美日韩| 国产伦精品一区二区三区照片| 日本在线视频网| 日本韩国欧美国产| 醉酒壮男gay强迫野外xx| 欧美日韩1区| 成人免费视频在线观看超级碰| 久草视频在线看| 欧美日韩另类字幕中文| 又黄又色的网站| 亚洲欧美在线专区| 国产日韩欧美视频在线| 福利小视频在线观看| 色婷婷一区二区三区四区| 999精品免费视频| 国产精品www994| 51国偷自产一区二区三区| 日本福利在线| 欧美日韩免费观看一区三区| 蜜乳av中文字幕| 日韩精彩视频在线观看| 欧美下载看逼逼| 欧美电影h版| 亚洲人成在线观看| 国产字幕在线观看| 国产女人18毛片水真多成人如厕| 日本成人在线免费视频| 精品国产一区二区三区香蕉沈先生| 8050国产精品久久久久久| 完全免费av在线播放| 色播色播色播色播色播在线| 亚洲aaa精品| 国产不卡一二三| 亚洲区一区二| 久久99久久99精品蜜柚传媒| 美女在线视频免费| 亚洲女同性videos| 国产男人搡女人免费视频| 国产午夜亚洲精品不卡| 午夜免费福利在线| 91成人精品| 国产精品对白一区二区三区| 超碰91在线观看| 亚洲女人天堂视频| 一级视频在线播放| 一区二区免费看| 中文字幕在线播放视频| 久久动漫亚洲| 一级二级三级欧美| 136导航精品福利| 91超碰caoporn97人人| 国产中文字幕在线播放| 欧美日韩mp4| 久久久久99精品| 久久久久久亚洲综合| 日韩有码免费视频| 五月天久久网站| 国产经典一区二区三区| 成人免费无遮挡| 久久中文字幕视频| 天堂v在线观看| 欧美丝袜丝交足nylons| 青青青在线免费观看| 91一区一区三区| 超碰成人在线播放| 国产精品资源| 自拍视频一区二区三区| 美女视频免费精品| 国产精品亚洲网站| 7777kkk亚洲综合欧美网站| 亚洲色图17p| 亚洲av无码乱码国产麻豆| 色素色在线综合| 少妇久久久久久被弄高潮| 久久亚洲精品国产精品紫薇| 亚洲制服在线观看| 久久久久久黄| 免费特级黄色片| 日韩国产专区| 欧美国产视频在线观看| 国产一区二区视频在线看| 秋霞午夜一区二区| 免费看电影在线| 最近2019中文字幕在线高清| 亚洲 欧美 精品| 欧美成人官网二区| 一级黄在线观看| 色一区在线观看| 日本a在线观看| 亚洲欧美aⅴ...| 久久丫精品忘忧草西安产品| 波多野结衣在线aⅴ中文字幕不卡| jizz欧美性11| 天堂av在线一区| 久久成人免费观看| 欧美日韩免费观看一区=区三区| 午夜精品美女久久久久av福利| 欧美色图婷婷| 成人自拍偷拍| 精品国产亚洲日本| 成人福利视频在线观看| 日韩欧美看国产| 性欧美xxxx视频在线观看| 最爽无遮挡行房视频在线| 色噜噜狠狠色综合网图区 | xxxx欧美18另类的高清| 国产资源在线播放| 亚洲人成网7777777国产| 日本精品专区| 亚洲娇小xxxx欧美娇小| 丰满人妻一区二区三区免费视频| 91精品一区二区三区久久久久久| 一区二区三区在线免费观看视频| 欧美丝袜第一区| 国产一级做a爱片久久毛片a| 亚洲电影激情视频网站| 久久中文字幕无码| 亚洲国产日韩精品| 久久精品国产亚洲av无码娇色| 亚洲精品自拍动漫在线| 久久国产精品国语对白| 日韩美女视频一区二区| 亚洲一二三四五六区| 国产精品国产自产拍高清av王其| 神马久久久久久久久久久| 日本一区二区三区国色天香| 91社区视频在线观看| 国产精品欧美综合在线| 我要看一级黄色录像| 亚洲欧洲成人av每日更新| 国产色无码精品视频国产| 亚洲四区在线观看| 欧美精品色哟哟| 亚洲妇女屁股眼交7| 亚洲综合一二三| 一本久道中文字幕精品亚洲嫩| 精品视频一二三区| 欧美午夜免费电影| 国产免费久久久| 精品粉嫩超白一线天av| 亚洲 欧美 精品| 国产一区二区三区在线观看视频| av在线免费观看网| 久久成人人人人精品欧| 丰乳肥臀在线| 日韩av电影免费观看高清| 亚洲www啪成人一区二区| 国产日韩精品在线播放| 亚洲无线观看| 鲁丝片一区二区三区| 欧美日韩在线观看视频小说| 中文字幕一区二区三区5566| 欧美日韩岛国| 精品中文字幕av| 美女国产一区二区| 性xxxxxxxxx| 26uuu欧美| 熟女av一区二区| 午夜精品一区在线观看| 日本欧美www| 日韩欧美一级二级| 国内精品一区视频| 久久99久久99精品中文字幕| 人人鲁人人莫人人爱精品| 91九色视频导航| 亚洲婷婷丁香| 台湾无码一区二区| 日韩激情在线观看| 久久久男人的天堂| 国产欧美一区二区精品婷婷| 欧美人妻一区二区| 在线免费观看视频一区| 亚洲黄色在线观看视频| 在线观看视频亚洲| 交100部在线观看| 91久久嫩草影院一区二区| 亚洲精品国产精品粉嫩| 男人日女人的bb| 免费精品视频在线| 国产吞精囗交久久久| 一区二区三区日韩精品视频| 九九热最新视频| 亚洲经典中文字幕| 手机av在线播放| 成人福利网站在线观看| 亚洲成a人片77777在线播放| 日韩欧美猛交xxxxx无码| 麻豆精品在线看| 扒开jk护士狂揉免费| 亚洲高清免费一级二级三级| 99久久久久久久| 中文字幕亚洲综合久久筱田步美| 中文在线资源| 黑人中文字幕一区二区三区| 亚洲欧美综合| 亚欧美在线观看| 国产亚洲一本大道中文在线| 日韩福利片在线观看| 日韩美女主播在线视频一区二区三区 | a在线视频v视频| 亚洲永久免费观看| 国产精品99久久精品| 日本免费观看网站| 久久久久久久久97黄色工厂| 99视频在线看| 欧美成人一区二区三区片免费| 久久日韩视频| 国产精品自产拍在线观看| 国产99久久| 欧美韩国日本在线| 久久综合色天天久久综合图片| 日本熟妇毛茸茸丰满| 精品免费视频一区二区| av在线免费播放| 999国产视频| 欧美激情性爽国产精品17p| 中文字幕日韩久久| ㊣最新国产の精品bt伙计久久| 中文字幕在线网址| www.亚洲男人天堂| 精品三级国产| 中国女人做爰视频| 国产成人三级在线观看| 久草国产在线观看| 精品国产一区二区亚洲人成毛片 | 国产91在线播放精品91| 久久av影视| 亚洲天堂网一区| 亚洲同性同志一二三专区| 国产男女无套免费网站| 欧美日本亚洲视频| 国产香蕉精品| 激情五月开心婷婷| 欧美韩日一区二区三区四区| 中文字幕福利视频| 久久伊人精品天天| 亚洲国产高清在线观看| 久久久亚洲国产精品| 91伊人久久大香线蕉| 波多野结衣电车| 精品国模在线视频| 综合中文字幕| www.亚洲天堂网| 最新热久久免费视频| 日本黄色大片视频| 国产精品久久久久9999| 午夜精品视频一区二区三区在线看| 中文字幕无码毛片免费看| 婷婷开心久久网| 91精彩在线视频| 91青青草免费在线看| 久久久成人网| 国产精品三区在线观看| 精品国产区一区| 国产成人精品123区免费视频| 伊人狠狠色丁香综合尤物| youjizz久久| 又污又黄的网站| 久久男人资源视频| 成人在线电影在线观看视频| 少妇愉情理伦片bd| 日韩欧美综合在线视频| 激情在线小视频| 九色91视频| 激情深爱一区二区| 好吊操这里只有精品| 中文字幕日韩精品在线观看| 91成人精品在线| 久久国产这里只有精品| 亚洲国产精品一区二区尤物区| chinese偷拍一区二区三区| 国产91免费视频| 久久99热狠狠色一区二区| 欧美三级韩国三级日本三斤在线观看| 色哟哟网站入口亚洲精品| 国产精品xxxav免费视频| www.com黄色片|