精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用OpenAI的Whisper 模型進行語音識別

人工智能
語音識別是人工智能中的一個領域,它允許計算機理解人類語音并將其轉換為文本。該技術用于 Alexa 和各種聊天機器人應用程序等設備。而我們最常見的就是語音轉錄,語音轉錄可以語音轉換為文字記錄或字幕。

語音識別是人工智能中的一個領域,它允許計算機理解人類語音并將其轉換為文本。該技術用于 Alexa 和各種聊天機器人應用程序等設備。而我們最常見的就是語音轉錄,語音轉錄可以語音轉換為文字記錄或字幕。

wav2vec2、Conformer 和 Hubert 等最先進模型的最新發展極大地推動了語音識別領域的發展。這些模型采用無需人工標記數據即可從原始音頻中學習的技術,從而使它們能夠有效地使用未標記語音的大型數據集。它們還被擴展為使用多達 1,000,000 小時的訓練數據,遠遠超過學術監督數據集中使用的傳統 1,000 小時,但是以監督方式跨多個數據集和領域預訓練的模型已被發現表現出更好的魯棒性和對持有數據集的泛化,所以執行語音識別等任務仍然需要微調,這限制了它們的全部潛力 。為了解決這個問題OpenAI 開發了 Whisper,一種利用弱監督方法的模型。

本文將解釋用于訓練的數據集的種類以及模型的訓練方法,以及如何使用Whisper 

Whisper 模型介紹

使用數據集:

Whisper模型是在68萬小時標記音頻數據的數據集上訓練的,其中包括11.7萬小時96種不同語言的演講和12.5萬小時從”任意語言“到英語的翻譯數據。該模型利用了互聯網生成的文本,這些文本是由其他自動語音識別系統(ASR)生成而不是人類創建的。該數據集還包括一個在VoxLingua107上訓練的語言檢測器,這是從YouTube視頻中提取的短語音片段的集合,并根據視頻標題和描述的語言進行標記,并帶有額外的步驟來去除誤報。

模型:

主要采用的結構是編碼器-解碼器結構。

重采樣:16000 Hz

特征提取方法:使用25毫秒的窗口和10毫秒的步幅計算80通道的log Mel譜圖表示。

特征歸一化:輸入在全局內縮放到-1到1之間,并且在預訓練數據集上具有近似為零的平均值。

編碼器/解碼器:該模型的編碼器和解碼器采用Transformers。

編碼器的過程:

編碼器首先使用一個包含兩個卷積層(濾波器寬度為3)的詞干處理輸入表示,使用GELU激活函數。

第二個卷積層的步幅為 2。

然后將正弦位置嵌入添加到詞干的輸出中,然后應用編碼器 Transformer 塊。

Transformers使用預激活殘差塊,編碼器的輸出使用歸一化層進行歸一化。

模型框圖:

圖片

解碼的過程:

在解碼器中,使用了學習位置嵌入和綁定輸入輸出標記表示。

編碼器和解碼器具有相同的寬度和數量的Transformers塊。

訓練

為了改進模型的縮放屬性,它在不同的輸入大小上進行了訓練。

通過 FP16、動態損失縮放,并采用數據并行來訓練模型。

使用AdamW和梯度范數裁剪,在對前 2048 次更新進行預熱后,線性學習率衰減為零。

使用 256 個批大小,并訓練模型進行 220次更新,這相當于對數據集進行兩到三次前向傳遞。

由于模型只訓練了幾個輪次,過擬合不是一個重要問題,并且沒有使用數據增強或正則化技術。這反而可以依靠大型數據集內的多樣性來促進泛化和魯棒性。

Whisper 在之前使用過的數據集上展示了良好的準確性,并且已經針對其他最先進的模型進行了測試。

優點:

  • Whisper 已經在真實數據以及其他模型上使用的數據以及弱監督下進行了訓練。
  • 模型的準確性針對人類聽眾進行了測試并評估其性能。
  • 它能夠檢測清音區域并應用 NLP 技術在轉錄本中正確進行標點符號的輸入。
  • 模型是可擴展的,允許從音頻信號中提取轉錄本,而無需將視頻分成塊或批次,從而降低了漏音的風險。
  • 模型在各種數據集上取得了更高的準確率。

Whisper在不同數據集上的對比結果,相比wav2vec取得了目前最低的詞錯誤率

圖片

模型沒有在timit數據集上進行測試,所以為了檢查它的單詞錯誤率,我們將在這里演示如何使用Whisper來自行驗證timit數據集,也就是說使用Whisper來搭建我們自己的語音識別應用。

使用Whisper 模型進行語音識別

TIMIT 閱讀語音語料庫是語音數據的集合,它專門用于聲學語音研究以及自動語音識別系統的開發和評估。它包括來自美國英語八種主要方言的 630 位演講者的錄音,每人朗讀十個語音豐富的句子。語料庫包括時間對齊的拼字、語音和單詞轉錄以及每個語音的 16 位、16kHz 語音波形文件。該語料庫由麻省理工學院 (MIT)、SRI International (SRI) 和德州儀器 (TI) 共同開發。TIMIT 語料庫轉錄已經過手工驗證,并指定了測試和訓練子集,以平衡語音和方言覆蓋范圍。

安裝:

!pip install git+https://github.com/openai/whisper.git
!pip install jiwer
!pip install datasets==1.18.3

第一條命令將安裝whisper模型所需的所有依賴項。jiwer是用來下載文字錯誤率包的datasets是hugface提供的數據集包,可以下載timit數據集。

導入庫

import whisper
from pytube import YouTube
from glob import glob
import os
import pandas as pd
from tqdm.notebook import tqdm

加載timit數據集

from datasets import load_dataset, load_metric

timit = load_dataset("timit_asr")

計算不同模型尺寸下的Word錯誤率

考慮到過濾英語數據和非英語數據的需求,我們這里選擇使用多語言模型,而不是專門為英語設計的模型。

但是TIMIT數據集是純英文的,所以我們要應用相同的語言檢測和識別過程。另外就是TIMIT數據集已經分割好訓練和驗證集,我們可以直接使用。

要使用Whisper,我們就要先了解不同模型的的參數,大小和速度。

圖片

加載模型

model = whisper.load_model('tiny')

tiny可以替換為上面提到的模型名稱。

定義語言檢測器的函數

def lan_detector(audio_file):
print('reading the audio file')
audio = whisper.load_audio(audio_file)
audio = whisper.pad_or_trim(audio)
mel = whisper.log_mel_spectrogram(audio).to(model.device)
_, probs = model.detect_language(mel)
if max(probs, key=probs.get) == 'en':
return True
return False

轉換語音到文本的函數

def speech2text(audio_file):
text = model.transcribe(audio_file)
return text["text"]

在不同模型大小下運行上面的函數,timit訓練和測試得到的單詞錯誤率如下:

從u2b上轉錄語音

與其他語音識別模型相比,Whisper 不僅能識別語音,還能解讀一個人語音中的標點語調,并插入適當的標點符號,我們下面使用u2b的視頻進行測試。

這里就需要一個包pytube,它可以輕松的幫助我們下載和提取音頻

def youtube_audio(link):
youtube_1 = YouTube(link)
videos = youtube_1.streams.filter(only_audio=True)

name = str(link.split('=')[-1])
out_file = videos[0].download(name)

link = name.split('=')[-1]
new_filename = link+".wav"
print(new_filename)
os.rename(out_file, new_filename)
print(name)
return new_filename,link

獲得wav文件后,我們就可以應用上面的函數從中提取文本。

總結

本文的代碼在這里

https://drive.google.com/file/d/1FejhGseX_S1Ig_Y5nIPn1OcHN8DLFGIO/view

還有許多操作可以用Whisper完成,你可以根據本文的代碼自行嘗試。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2023-11-09 09:00:00

OpenAI人工智能Whisper

2023-11-05 10:01:37

AI模型

2024-05-28 08:11:44

SpringTensorFlow訓練

2023-03-07 13:32:33

谷歌模型

2022-10-08 08:36:02

UbuntuLinux語音識別

2017-03-20 10:14:03

語音識別匹配算法模型

2012-07-25 13:23:32

ibmdw

2023-06-16 08:00:00

語音助手GPTWhisper

2019-11-20 12:30:21

Python編程語言語音識別

2023-08-31 13:25:09

AI模型

2021-04-27 15:47:12

人工智能語音識別Transformer

2024-10-28 09:38:16

OpenAIWhisper人工智能

2018-05-02 11:38:14

語音識別法院

2024-12-13 15:53:58

VLM小型視覺語言模型LLM

2023-05-19 11:14:35

2025-04-09 11:01:19

2024-10-28 07:15:00

OpenAIWhisper語音轉錄工具

2025-04-02 08:55:13

人工智能帖子生成器事件驅動

2024-08-27 08:38:34

2025-05-16 09:12:00

點贊
收藏

51CTO技術棧公眾號

欧美综合在线播放| 国产精品流白浆视频| 人妻精品久久久久中文字幕69| 黄色网页在线看| 国产成人久久精品77777最新版本| 欧美猛交ⅹxxx乱大交视频| 艳妇乳肉豪妇荡乳xxx| 欧美xxx网站| 亚洲人成7777| 蜜桃麻豆www久久国产精品| 波多野结衣一二区| 欧美三级特黄| 亚洲视频在线看| 亚洲区 欧美区| 日日夜夜天天综合| 亚洲一区二区成人在线观看| 欧美日韩一区在线播放| aa视频在线免费观看| 国产精品婷婷| 欧美成人h版在线观看| 性欧美成人播放77777| 91精品亚洲一区在线观看| 天天av天天翘天天综合网| 亚洲成人网上| 婷婷久久久久久| 国产一区二区免费视频| 国产精品1区2区在线观看| 69av.com| 久久久久美女| 夜夜嗨av一区二区三区免费区| 又色又爽又黄18网站| 日韩一级二级| 亚洲午夜精品17c| 午夜啪啪免费视频| 国产在线日本| 26uuu亚洲| 国产精品一区二区三区精品| 6—12呦国产精品| 日韩精品亚洲一区| 57pao国产成人免费| 精品视频久久久久| 中文字幕免费精品| 久久精品亚洲热| 超碰97av在线| 国语产色综合| 亚洲人成电影在线| 一二三不卡视频| 欧美国产极品| 亚洲国产成人精品一区二区| 红桃视频一区二区三区免费| 四虎国产精品成人免费影视| 在线观看日韩电影| 北条麻妃av高潮尖叫在线观看| 91超碰在线| 亚洲r级在线视频| 男人天堂av片| av中文字幕在线观看第一页| 亚洲一区二区五区| 六月婷婷激情网| a级网站在线播放| 亚洲色图欧洲色图| 中文字幕在线中文| 秋霞在线视频| 午夜视频一区在线观看| 欧美国产综合在线| av2020不卡| 福利一区福利二区微拍刺激| 每日在线更新av| 韩国久久久久久| 在线欧美日韩国产| 人人干人人干人人| 亚洲18在线| 91精品国产综合久久婷婷香蕉 | 日韩成人免费看| 国产精品都在这里| 一本色道久久综合亚洲| 韩国av一区二区三区| 91麻豆蜜桃| 人妻91麻豆一区二区三区| gogo大胆日本视频一区| 欧美精品一区二区三区四区五区| 嫩草研究院在线观看| 国产女主播视频一区二区| 亚洲欧美日韩国产yyy| 久操视频在线观看| 亚洲无线码一区二区三区| 精品这里只有精品| 超碰这里只有精品| 日韩欧美国产小视频| 国产精品久久无码| 成人激情开心网| 欧美黑人xxxx| 精品国产一区二区三区四| 蜜桃视频在线一区| 国产激情一区二区三区在线观看| 日本在线丨区| 1区2区3区国产精品| 波多野结衣综合网| 国产精品久久久久77777丨| 日韩一级视频免费观看在线| 风间由美一二三区av片| 99久精品视频在线观看视频| 欧美激情视频一区二区| 黄色av一区二区| 国产高清亚洲一区| 日韩一区国产在线观看| 成人短视频在线| 日韩欧美在线视频观看| 尤物网站在线看| 尤物tv在线精品| 久久99久久99精品免观看粉嫩 | 亚洲成年人影院在线| 国产美女永久免费无遮挡| 欧美日韩国产亚洲一区| 国产精品第2页| 无码国精品一区二区免费蜜桃 | www.youjizz.com亚洲| 免费观看久久久4p| 久久一区二区精品| 新版中文在线官网| 欧美性生交片4| 国产精品300页| 欧美国产另类| 国产在线播放91| 国产在线中文字幕| 午夜精品久久久久久| 国产黄色一区二区三区| 日本a口亚洲| 欧洲成人在线视频| 人妻夜夜爽天天爽| 一区二区三区中文字幕电影| 欧美伦理片在线观看| 偷拍精品福利视频导航| 欧美激情一区二区三区高清视频| 亚洲图片中文字幕| 国产人成一区二区三区影院| 亚洲午夜精品久久久久久人妖| 日韩在线视频一区二区三区| 日韩在线观看免费全| 一级一级黄色片| 久久久精品免费免费| 国产精品50p| 国产精品自在线拍| 欧美福利小视频| 国产成人精品av在线观| 亚洲视频一区二区免费在线观看 | 日韩中文在线播放| 亚洲男人天天操| 国产精品777777| 99re66热这里只有精品3直播| 黄色三级中文字幕| 一区二区亚洲视频| 欧美激情精品久久久久久久变态 | 国产精品视频123| 97久久久精品综合88久久| 秋霞无码一区二区| 日韩成人av在线资源| 欧美亚洲国产视频小说| 天堂av网在线| 日韩欧美极品在线观看| 成人免费毛片糖心| 热久久免费视频| 亚洲精品一区二区三区蜜桃久| 日韩免费在线电影| 欧美大胆a视频| 亚洲精品无遮挡| 福利微拍一区二区| 亚洲最大成人综合网| 久久成人综合网| 国产一区 在线播放| 欧美毛片免费观看| 国产精品尤物福利片在线观看| 久久bbxx| 亚洲精品videossex少妇| 91玉足脚交嫩脚丫在线播放| 中文字幕不卡一区| 无码人妻一区二区三区在线视频| 亚洲三级网站| 亚洲成人第一| 成人午夜网址| 国产成人精品综合| 4438x成人网全国最大| 日韩hd视频在线观看| 亚洲精品国产精品国自产网站按摩| 中文字幕一区二| 少妇激情一区二区三区视频| 日本欧美大码aⅴ在线播放| 不卡中文字幕在线| 全球av集中精品导航福利| 国产精品丝袜久久久久久不卡| 伊人影院蕉久影院在线播放| 亚洲欧美在线磁力| 国产区精品在线| 精品动漫一区二区三区| 中文字幕第24页| 国产美女视频一区| 精品国产一区三区| 亚洲人metart人体| 国产手机精品在线| 精品欧美一区二区三区在线观看 | 午夜精品国产更新| 免费看黄色三级| 国产精品小仙女| 国产成人精品视频免费看| 成人在线一区| 高清一区二区三区视频| 性欧美hd调教| 欧美成人精品一区| 国产三级视频在线播放线观看| 欧美成人bangbros| 最近中文字幕av| 亚洲午夜影视影院在线观看| 非洲一级黄色片| 91亚洲精品乱码久久久久久蜜桃| 尤物国产在线观看| 亚洲毛片一区| 亚洲最新免费视频| 精品大片一区二区| 国产精品成人观看视频免费| av在线不卡精品| 97香蕉超级碰碰久久免费软件 | 中文字幕日韩av综合精品| 亚洲精品国产精品国| 在线观看日韩一区| 黄色激情视频在线观看| 国产精品第四页| 日韩人妻一区二区三区| www.日本不卡| www.日本久久| 首页亚洲欧美制服丝腿| 国产日韩第一页| 日韩欧美国产精品综合嫩v| 国产精品区一区二区三在线播放 | 91精品久久| 最近2019中文字幕大全第二页| 成人小说亚洲一区二区三区| 欧美日韩国产不卡| 一区二区小视频| 日韩欧美综合在线视频| 久久综合色综合| 国产视频不卡一区| 精品国产成人亚洲午夜福利| 成人黄色国产精品网站大全在线免费观看| 亚洲 激情 在线| 亚洲一区久久| 日本xxxxxxx免费视频| 亚洲久久一区| 男人日女人视频网站| 亚洲人成人一区二区三区| 992tv快乐视频| 久久久久久免费视频| 一区一区视频| 一区二区三区午夜视频| 欧美亚洲视频一区| 成人情趣视频| 欧美久久久久久一卡四| 美女毛片一区二区三区四区最新中文字幕亚洲 | 成年人午夜剧场| 中文字幕色av一区二区三区| 国产一区二区三区精品在线| 欧美国产丝袜视频| 日本午夜精品视频| 国产欧美日韩精品一区| 欧美激情aaa| 国产精品免费看片| 久久久久人妻一区精品色| 国产欧美日韩精品在线| 国产尤物在线播放| 亚洲人成人一区二区在线观看| 精品国产视频在线观看| 综合av第一页| 国产成人自拍视频在线| 精品久久久久久亚洲精品| 国产第一页在线播放| 亚洲福利视频三区| 日本一级二级视频| 亚洲午夜电影网| 欧美三级午夜理伦| 欧美性videos高清精品| 国产一级在线视频| 91精品91久久久中77777| 小泽玛利亚一区二区三区视频| 在线观看一区不卡| www黄色网址| 亚洲激情在线观看| 国产中文字幕在线看| 久久五月天色综合| 欧美寡妇性猛交xxx免费| 97国产精品视频| 深夜视频一区二区| 亚洲aⅴ日韩av电影在线观看| 久久综合给合| 国内不卡一区二区三区| 久久视频在线| 国内少妇毛片视频| 久久国产精品久久久久久电车| 国产成人无码一二三区视频| 国内成人免费视频| 自拍视频一区二区| 欧美激情一区二区三区在线| 国产无遮挡aaa片爽爽| 日本韩国一区二区| 国产熟女一区二区三区四区| av中文一区| 国语精品中文字幕| 欧美一级精品| 青青视频免费在线观看| 日韩在线卡一卡二| 中文字幕 欧美 日韩| 97超碰欧美中文字幕| 波多野结衣亚洲一区二区| 欧美日韩精品在线播放| 国产精品伦一区二区三区| 日韩国产精品视频| 女女色综合影院| 国产综合在线视频| 亚洲电影观看| 国产富婆一区二区三区| 成人免费看片39| 国产午夜福利100集发布| 国产毛片精品视频| 特级西西www444人体聚色 | 日韩国产在线播放| 免费黄色网页在线观看| 7m精品福利视频导航| 精品亚洲二区| 午夜精品一区二区三区四区| 亚洲一区图片| 午夜影院福利社| 亚洲特级片在线| 午夜精品久久久久久久久久久久久蜜桃| 欧美性受极品xxxx喷水| 手机看片福利永久| 久久精品在线视频| 99视频有精品高清视频| 欧美日韩精品免费观看视一区二区 | 免费成人在线观看视频| 久久精品老司机| 樱花草国产18久久久久| 国产精品色综合| 国产亚洲成精品久久| 美女扒开腿让男人桶爽久久软| 成人黄色在线免费观看| 99精品美女| 午夜视频你懂的| 中文在线资源观看网站视频免费不卡 | 91视频www| 国产成人亚洲欧洲在线| 精品动漫一区二区三区在线观看| 伊人影院蕉久影院在线播放| 成人自拍性视频| 国产精品99久久精品| 激情久久综合网| 亚洲欧美影音先锋| 亚洲最大成人av| 久久国产精品影视| 成人国产精品久久| 欧美精品一区二区性色a+v| 国产伦精品一区二区三区免费迷 | 国产乱子伦精品无码码专区| www.国产一区| 国产午夜久久av| 中文字幕久精品免| 国产999精品久久久久久| 日韩视频中文字幕在线观看| 91精品91久久久中77777| 69视频在线| 国产中文字幕日韩| 成人免费看片39| 蜜桃视频无码区在线观看| 亚洲激情中文1区| 国产aⅴ爽av久久久久成人| 97人洗澡人人免费公开视频碰碰碰| 黄色欧美在线| 分分操这里只有精品| a美女胸又www黄视频久久| 精品国产免费观看| 亚洲女人被黑人巨大进入al| 成人片免费看| 一区二区三区四区欧美日韩| 国产成人免费在线视频| xxxxxx国产| 亚洲欧洲午夜一线一品| www欧美在线观看| 国产 欧美 日韩 一区| 99国产精品久| 国产美女免费看| 久久久中精品2020中文| 成人av资源网址| 成人午夜激情av| 亚洲女同一区二区| 韩国av在线免费观看| 日本精品视频网站| 国产精品毛片一区二区在线看| 国产精品熟妇一区二区三区四区| 丁香五六月婷婷久久激情| 成人精品一区二区三区校园激情| 国产精品裸体一区二区三区| 久久看片网站| 中文字幕人妻一区二|