精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

秒殺同行!Kimi開源全新音頻基礎模型,橫掃十多項基準測試,總體性能第一

人工智能 新聞
Kimi-Audio 總體性能排名第一,幾乎沒有明顯短板。

kimi 又發布了新的開源項目 —— 一個全新的通用音頻基礎模型 Kimi-Audio,支持語音識別、音頻理解、音頻轉文本、語音對話等多種任務,在十多個音頻基準測試中實現了最先進的 (SOTA) 性能。

結果顯示,Kimi-Audio 總體性能排名第一,幾乎沒有明顯短板。

例如在 LibriSpeech ASR 測試上,Kimi-Audio 的 WER 僅 1.28%,顯著優于其他模型。VocalSound 測試上,Kimi 達 94.85%,接近滿分 。MMAU 任務中,Kimi-Audio 摘得兩項最高分;VoiceBench 設計評測對話助手的語音理解能力,Kimi-Audio 在所有子任務中得分最高,包括一項滿分。

研發人員開發了評估工具包,可在多個基準任務上對音頻 LLM 進行公平、全面評估 ,五款音頻模型(Kimi-Audio、Qwen2-Audio、Baichuan-Audio、StepAudio、Qwen2.5-Omni)在各類音頻基準測試中的表現對比。紫線(Kimi-Audio)基本覆蓋最外層,表明其綜合表現最佳。 

目前,模型代碼、模型檢查點以及評估工具包已經在 Github 上開源。

項目鏈接:https://github.com/MoonshotAI/Kimi-Audio

新穎的架構設計

為實現 SOTA 級別的通用音頻建模, Kimi-Audio 采用了集成式架構設計,包括三個核心組件 —— 音頻分詞器(Audio Tokenizer)、音頻大模型(Audio LLM)、音頻去分詞器(Audio Detokenizer)。

這一架構使 Kimi-Audio 能夠在單一模型框架下,流暢地處理從語音識別、理解到語音對話等多種音頻語言任務。

Kimi-Audio 由三個主要組件組成:音頻分詞器(Audio Tokenizer)、音頻大模型(Audio LLM)、音頻去分詞器(Audio Detokenizer)。

具體而言,音頻分詞器(Audio Tokenizer)負責將輸入音頻轉化為通過矢量量化(vector quantization)得到的離散語義 token,幀率為 12.5Hz。同時,音頻分詞器還提取連續的聲學向量,以增強感知能力。

這種結合方式使模型既具有語義上的壓縮表示,又保留了豐富的聲學細節,從而為多種音頻任務提供了堅實的表示基礎。

音頻大模型(Audio LLM)是系統的核心,負責生成語義 token 以及文本 token,以提升生成能力。其架構基于共享 Transformer 層,能夠處理多模態輸入,并在后期分支為專門用于文本和音頻生成的兩個并行輸出頭。

音頻去分詞器(Audio Detokenizer)使用流匹配(flow matching)方法,將音頻大模型預測出的離散語義 token 轉化為連貫的音頻波形,生成高質量、具有表現力的語音。

數據建構與訓練方法

除了新穎的模型架構,構建 SOTA 模型的核心工作還包括數據建構和訓練方法。

為實現 SOTA 級別的通用音頻建模,Kimi-Audio 在預訓練階段使用了約 1300 萬小時覆蓋多語言、音樂、環境聲等多種場景的音頻數據,并搭建了一條自動處理 “流水線” 生成高質量長音頻 - 文本對。

預訓練后,模型進行了監督微調(SFT),數據涵蓋音頻理解、語音對話和音頻轉文本聊天三大類任務,進一步提升了指令跟隨和音頻生成能力。

image.png

Kimi-Audio 預訓練數據處理流程的直觀展示。簡單來說,就是把原始音頻一步步凈化、切分、整理,變成干凈、有結構、有標注的訓練數據。

在訓練方法上,為實現強大的音頻理解與生成能力,同時保持模型的知識容量與智能水平,研發人員以預訓練語言模型為初始化,設計了三個類別的預訓練任務:

僅文本和僅音頻預訓練,用于分別學習兩個模態的知識;音頻到文本的映射,促進模態轉換能力;音頻文本交錯訓練,進一步彌合模態間的鴻溝。

在監督微調階段,他們設計了一套訓練配方,以提升訓練效率與任務泛化能力。

考慮到下游任務的多樣性,研究者沒有設置特殊的任務切換操作,而是為每個任務使用自然語言作為指令;對于指令,他們構建了音頻和文本版本(即音頻由 Kimi-TTS 在零樣本方式下基于文本生成),并在訓練期間隨機選擇一種;為了增強遵循指令能力的魯棒性,他們使用大語言模型為 ASR 任務構建了 200 條指令,為其他任務構建了 30 條指令,并為每個訓練樣本隨機選擇一條。他們構建了大約 30 萬小時的數據用于監督式微調。

如表 1 和表 2 所示,他們基于全面的消融實驗,在每個數據源上對 Kimi-Audio 進行了 2-4 個訓練周期的微調,使用 AdamW 優化器,學習率從 1e?? 到 1e?? 進行余弦衰減,使用 10% 的 token 進行學習率預熱。

image.png

image.png

此外,他們還分三個階段訓練音頻解碼器。首先,使用預訓練數據中的大約 100 萬小時的音頻,對流匹配模型和聲碼器進行預訓練,以學習具有多樣化音色、語調和質量的音頻。其次,采用分塊微調策略,在相同的預訓練數據上將動態塊大小調整為 0.5 秒到 3 秒 。最后,在 Kimi-Audio 說話者提供的高質量單聲道錄音數據上進行微調。

評估結果

研究者基于評估工具包,詳細評估了 Kimi-Audio 在一系列音頻處理任務中的表現,包括自動語音識別(ASR)、音頻理解、音頻轉文本聊天和語音對話。他們使用已建立的基準測試和內部測試集,將 Kimi-Audio 與其他音頻基礎模型(Qwen2-Audio 、Baichuan-Audio、Step-Audio、GLM4-Voice 和 Qwen2.5-Omini )進行了比較。

自動語音識別

研究者對 Kimi-Audio 的自動語音識別(ASR)能力進行了評估,涵蓋了多種語言和聲學條件的多樣化數據集。如表 4 所示,Kimi-Audio 在這些數據集上持續展現出比以往模型更優越的性能。他們報告了這些數據集上的詞錯誤率(WER),其中較低的值表示更好的性能。

image.png

值得注意的是,Kimi-Audio 在廣泛使用的 LibriSpeech 基準測試中取得了最佳結果,在 test-clean 上達到了 1.28 的錯誤率,在 test-other 上達到了 2.42,顯著超越了像 Qwen2-Audio-base 和 Qwen2.5-Omni 這樣的模型。在普通話 ASR 基準測試中,Kimi-Audio 在 AISHELL-1(0.60)和 AISHELL-2 ios(2.56)上創下了最先進的結果。此外,它在具有挑戰性的 WenetSpeech 數據集上表現出色,在 test-meeting 和 test-net 上均取得了最低的錯誤率。最后,研究者在內部的 Kimi-ASR 測試集上的評估確認了該模型的魯棒性。這些結果表明,Kimi-Audio 在不同領域和語言中均具有強大的 ASR 能力。

音頻理解

除了語音識別外,研究者還評估了 Kimi-Audio 理解包括音樂、聲音事件和語音在內的各種音頻信號的能力。表 5 總結了在各種音頻理解基準測試上的性能,通常較高的分數表示更好的性能。

image.png

在 MMAU 基準測試中,Kimi-Audio 在聲音類別(73.27)和語音類別(60.66)上展現出卓越的理解能力。同樣,在 MELD 語音情感理解任務上,它也以 59.13 的得分超越了其他模型。Kimi-Audio 在涉及非語音聲音分類(VocalSound 和 Nonspeech7k )以及聲學場景分類(TUT2017 和 CochlScene)的任務中也處于領先地位。這些結果突顯了 Kimi-Audio 在解讀復雜聲學信息方面的高級能力,超越了簡單的語音識別范疇。

音頻到文本聊天

研究者使用 OpenAudioBench 和 VoiceBench 基準測試 評估了 Kimi-Audio 基于音頻輸入進行文本對話的能力。這些基準測試評估了諸如指令遵循、問答和推理等各個方面。性能指標因基準測試而異,較高的分數表示更好的對話能力。結果如表 6 所示。

image.png

在 OpenAudioBench 上,Kimi-Audio 在多個子任務上實現了最先進的性能,包括 AlpacaEval、Llama Questions 和 TriviaQA,并在 Reasoning QA 和 Web Questions 上取得了極具競爭力的性能。VoiceBench 評估進一步證實了 Kimi-Audio 的優勢。它在 AlpacaEval(4.46)、CommonEval(3.97)、SD-QA(63.12)、MMSU(62.17)、OpenBookQA(83.52)、Advbench(100.00)和 IFEval(61.10)上均持續超越所有對比模型。Kimi-Audio 在這些全面的基準測試中的整體表現證明了其在基于音頻的對話和復雜推理任務中的卓越能力。

語音對話

最后,他們基于多維度的主觀評估,評估了 Kimi-Audio 的端到端語音對話能力。如表 7 所示,Kimi-Audio 與 GPT-4o 和 GLM-4-Voice 等模型在人類評分(1-5 分量表,分數越高越好)的基礎上進行了比較。

image.png

除去 GPT-4o,Kimi-Audio 在情感控制、同理心和速度控制方面均取得了最高分。盡管 GLM-4-Voice 在口音控制方面表現略佳,但 Kimi-Audio 的整體平均得分仍高達 3.90,超過了 Step-Audio-chat(3.33)、GPT-4o-mini(3.45)和 GLM-4-Voice(3.65),并與 GPT-4o(4.06)僅存在微小差距。總體而言,評估結果表明,Kimi-Audio 在生成富有表現力和可控性的語音方面表現出色。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2010-03-12 18:16:07

Python編程語言

2024-04-08 13:29:52

2010-10-18 09:56:33

服務器基準測試SDSPEC

2023-07-31 09:13:13

ValidatorGolang

2025-06-10 09:10:00

2025-01-06 06:10:00

開源.NEThttps://mp

2016-09-23 16:36:25

LinuxPCPhoronix

2009-12-10 09:24:06

SunX64AMD

2024-03-06 18:09:06

Linux性能工具

2022-12-06 14:11:32

開源模型

2023-06-06 07:03:02

2025-04-28 14:10:22

2021-07-17 15:25:05

PHP 8.1基準測試開發

2024-04-11 08:22:32

AgentQuest語言模型

2023-09-13 14:45:14

性能測試開發

2021-09-09 12:28:50

Sentry Web性能監控

2024-03-28 14:26:51

人工智能

2025-04-29 08:14:14

2023-09-28 08:01:06

MySQL事務失效
點贊
收藏

51CTO技術棧公眾號

国产91久久久| 亚洲美女精品久久| 久久成年人免费电影| www.好吊操| 中文字幕在线观看你懂的| 红杏视频成人| 蜜臀久久久久久久| 亚洲国产精品嫩草影院久久| 在线综合视频网站| 国产无遮挡又黄又爽又色视频| 99精品中文字幕在线不卡 | 国产黑丝在线视频| 丁香在线视频| 激情亚洲另类图片区小说区| 色哟哟国产精品| 国产精品一区二区三区免费| 99久久精品久久亚洲精品| 厕沟全景美女厕沟精品| www.亚洲色图.com| 欧美高清视频在线| 色婷婷.com| 国产69精品久久app免费版| 国产真实乱对白精彩久久| 国产亚洲视频在线观看| 国产主播在线看| 天堂av资源网| 99视频+国产日韩欧美| 日韩免费电影一区| a级片一区二区| 99热在线只有精品| 91精品国产91久久综合| 欧美电影一区二区| 妞干网这里只有精品| 国产视频手机在线| 亚洲天堂免费| 日韩三级精品电影久久久| 人妻无码一区二区三区四区| 国产福利电影在线| 91视视频在线直接观看在线看网页在线看| 午夜精品一区二区三区av| 午夜福利三级理论电影| 国语对白在线刺激| 成人app下载| 51视频国产精品一区二区| 国产男女猛烈无遮挡a片漫画 | 免费国产黄色片| 日韩午夜黄色| 欧美黑人性视频| 在线免费日韩av| 国产区精品视频在线观看豆花| 亚洲国产视频一区二区| 国产精品一区二区性色av| 无码人中文字幕| 麻豆视频久久| 亚洲aⅴ怡春院| 欧美一进一出视频| 中文字幕在线视频免费| 日韩精品免费视频人成| 久久伊人色综合| 国产成人在线网址| 91影院成人| 精品美女一区二区三区| 久久久久久久久久久免费视频| 69xxxx欧美| 粉嫩嫩av羞羞动漫久久久| 欧美在线日韩在线| 免费国产羞羞网站美图| 卡通动漫精品一区二区三区| 亚洲成人aaa| 99视频在线视频| 制服丝袜在线播放| 久久综合九色综合97_久久久| 国产免费一区二区三区香蕉精| 国产性生活视频| 一区二区三区四区在线观看国产日韩| 久久激情视频久久| 国产精品1000部啪视频| 亚欧洲精品视频在线观看| 欧美日韩一区中文字幕| 韩日视频在线观看| 黄色激情在线播放| 国产精品成人免费精品自在线观看 | 久久久久久穴| 欧美成人午夜影院| 亚洲欧洲久久久| 999久久精品| 日韩精品在线观| 亚欧精品在线视频| 91国内精品| 欧美日韩大陆一区二区| 黄在线观看网站| 国产成+人+综合+亚洲欧美| 无码av免费一区二区三区试看| 三年中国中文在线观看免费播放| 男人的天堂在线视频| 国产成人精品免费| 欧美不卡1区2区3区| 狠狠综合久久av一区二区| 91蝌蚪国产九色| 一区二区三区日韩视频| 白白色在线观看| 欧美伊人久久久久久久久影院| 东京热加勒比无码少妇| 国外成人福利视频| 日韩欧美aaa| 久久久久免费看黄a片app| 成人免费在线| 亚洲欧美色综合| 一区二区三区四区欧美日韩| 国产免费永久在线观看| 一区二区三区中文字幕精品精品 | 精品久久久久久久久久久久久| 亚洲一区二区三区四区五区xx| 综合激情网...| 这里只有精品视频在线| 中文字幕一二三四区| 亚洲h色精品| 国产成人久久久| 波多野结衣电车痴汉| 粉嫩aⅴ一区二区三区四区| 亚洲精品美女久久7777777| 国产美女性感在线观看懂色av | 中文字幕中文字幕一区三区| 另类专区亚洲| 亚洲护士老师的毛茸茸最新章节| 婷婷社区五月天| 久久国产亚洲精品| 久久精品成人欧美大片| www.日韩一区| 久久蜜桃一区二区| 国产网站免费在线观看| 在线看片福利| 午夜精彩视频在线观看不卡| 午夜激情影院在线观看| 国产精品一区二区精品视频观看| 制服丝袜国产精品| 人妻激情偷乱视频一区二区三区| 一区二区三区四区高清视频| 在线成人激情黄色| 男人的午夜天堂| 日韩精品电影一区亚洲| 久久影院理伦片| sm捆绑调教国产免费网站在线观看 | 精品久久国产精品| 在线观看毛片av| 另类综合日韩欧美亚洲| 亚洲va久久久噜噜噜| www.色婷婷.com| 99国产精品久| 中文精品一区二区三区| 国产精品videossex撒尿| 欧美一区二区在线不卡| 日韩中文字幕在线看| 亚洲一区二区在线播放| 国产视频二区在线观看| 色婷婷激情久久| 韩国女同性做爰三级| 丝袜亚洲另类欧美| 成人xxxx视频| 无码精品人妻一区二区三区影院| 久久精品视频一区二区三区| 一区二区精品视频| 欧美成人一二区| 久久精品99久久香蕉国产色戒| 国产乱淫av免费| 久久久三级国产网站| 那种视频在线观看| 欧美午夜精彩| 欧美激情手机在线视频 | 永久av免费网站| 久色婷婷小香蕉久久| eeuss中文| 66精品视频在线观看| 91wwwcom在线观看| 99热精品在线播放| 亚洲成av人片一区二区| 醉酒壮男gay强迫野外xx| 日韩成人伦理电影在线观看| 一区二区三区国| jizz性欧美2| 欧洲日韩成人av| 欧美成年黄网站色视频| 色综合久久久久综合| 女人十八毛片嫩草av| 99视频一区| 国产一区二区毛片| 日韩理论片在线观看| 丝袜美腿av在线| 欧美在线视频全部完| 亚洲国产精品无码久久久久高潮 | 在线日韩第一页| 国产精品视频一二区| 亚洲成人免费在线| 一区二区三区伦理片| 国产一区美女在线| 波多野结衣之无限发射| 日韩系列欧美系列| 国产精品日韩高清| 免费视频成人| 午夜精品一区二区三区av| 大乳在线免费观看| 性感美女久久精品| 99久久99久久精品免费| 成人精品免费网站| 久久婷五月综合| jiujiure精品视频播放| 热久久美女精品天天吊色| 男人的天堂在线视频免费观看 | 亚洲精品一线二线三线| 国产精品久久久精品四季影院| 日本欧美在线观看| 日本免费高清一区| 一区二区在线视频观看| 国产精品美女www| 网友自拍视频在线| 欧美午夜精品免费| 日韩毛片在线视频| 不卡高清视频专区| 992tv人人草| 麻豆免费精品视频| 少妇高清精品毛片在线视频 | 污视频在线免费观看一区二区三区| 色在线免费观看| 亚洲欧美国产另类| 国产91久久久| 欧美一区二区三区在线电影| 中国一级特黄视频| 色诱视频网站一区| 全部毛片永久免费看| 99爱在线观看| 奇米亚洲午夜久久精品| 成人午夜免费在线| 综合伊思人在钱三区| 欧美精品激情在线| 日本中文字幕在线观看| 亚洲日本中文字幕| 国产精品无码久久av| 在线观看视频一区二区欧美日韩| 国产微拍精品一区| 精品国产乱码久久久久久虫虫漫画| 久久精品一区二区三| 91久色porny| 成人影视免费观看| 久久久亚洲精品一区二区三区 | 欧美污视频网站| 亚洲在线播放| 午夜精品一区二区在线观看的| 欧美交a欧美精品喷水| 国产精品福利无圣光在线一区| 男人资源在线播放| 日韩亚洲综合在线| 国产婷婷视频在线| 日韩av中文字幕在线播放| 国产99久久久久久免费看| 亚洲人成在线播放网站岛国| www.99re6| 一区二区三区在线观看欧美| 欧美激情一区二区视频| 亚洲综合在线五月| 日本免费www| 国产精品毛片无遮挡高清| 日本五十肥熟交尾| 久草热8精品视频在线观看| 国产免费黄色一级片| 亚洲黄页一区| 国产成年人在线观看| 综合久久精品| 精品国产一区二区三区无码| 亚洲一区国产| 亚洲av综合色区| 不卡日本视频| 一区二区三区国产福利| 国产精品黄色| 一区二区三区欧美在线| 综合激情在线| 国产免费黄视频| 久久精品国产在热久久| 色欲无码人妻久久精品| 91首页免费视频| 三级黄色录像视频| 婷婷成人综合网| 这里只有久久精品视频| 日韩三级视频中文字幕| 深夜视频在线免费| 亚洲成人av在线播放| 日本天堂影院在线视频| 欧美精品一区二区久久久| 欧美日韩影视| 毛片精品免费在线观看| 性欧美freesex顶级少妇| 成人激情视频在线| 欧美激情15p| 国产盗摄视频在线观看| 国产精品嫩草99av在线| www.亚洲自拍| 久久久精品一品道一区| 九九热这里有精品视频| 在线视频一区二区三| 亚洲va欧美va| 日韩欧美国产电影| 都市激情一区| 68精品国产免费久久久久久婷婷| 日本久久二区| 成人欧美在线视频| 偷拍自拍亚洲色图| 玖玖精品在线视频| 日本美女一区二区| 丰满少妇一区二区三区| 91免费看片在线观看| 国产免费久久久久| 日本丰满少妇一区二区三区| 精品久久久久久久久久久国产字幕| 91精品国模一区二区三区| 黄色国产在线| 亚洲午夜精品久久久久久久久久久久 | 成人性生交大片免费看中文 | 成人av高清在线| 69夜色精品国产69乱| 色欧美日韩亚洲| 少妇喷水在线观看| 欧美激情a∨在线视频播放| 久久国内精品| 日韩尤物视频| 免费在线亚洲欧美| 污片免费在线观看| 亚洲一区二区中文在线| 国产视频在线观看视频| 在线成人激情黄色| 一呦二呦三呦精品国产| 国产欧美在线看| 麻豆精品一区| 宅男av一区二区三区| 热久久国产精品| 夜夜春很很躁夜夜躁| 亚洲精品免费播放| 一级片aaaa| 亚洲精品在线电影| 日韩精品分区| 97视频资源在线观看| 首页亚洲中字| 欧美激情 国产精品| a美女胸又www黄视频久久| 精品一区在线视频| 91国产视频在线观看| 欧洲一区av| 日本精品久久电影| 久久亚洲资源中文字| 日韩videos| 日本伊人色综合网| 国产三级在线观看完整版| 欧洲av一区二区嗯嗯嗯啊| yourporn在线观看中文站| 国产精品久久久久免费a∨大胸| 国产亚洲第一伦理第一区| 欧美 国产 精品| 国产精品原创巨作av| 中文字字幕码一二三区| 欧美日韩一区二区在线 | 精品动漫一区二区三区在线观看| 国产丝袜视频在线播放| 狠狠色综合色区| 国产精品成久久久久| 自拍日韩亚洲一区在线| 91丨porny丨最新| 免费在线不卡av| 久久精品国亚洲| 中文字幕一区二区三区四区久久| 日本丰满少妇xxxx| 久久精品在这里| 91麻豆视频在线观看| 欧美极品少妇xxxxⅹ免费视频 | 国产精品7777777| 欧美图片一区二区三区| 性开放的欧美大片| 亚洲在线一区二区| 99热这里只有成人精品国产| 国产综合精品久久久久成人av| 91精品国产综合久久久久久漫画 | 91露出在线| 97av影视网在线观看| 久久国产免费| 久久久久99精品成人片试看| 日韩精品视频免费| 日韩色性视频| 日本日本19xxxⅹhd乱影响| 欧美激情自拍偷拍| 欧美一区二区三区网站| 亚洲第一网站男人都懂| 奇米777日韩| 欧美日韩视频在线一区二区观看视频| 韩日成人在线| 一级黄色性视频| 精品少妇一区二区三区视频免付费 | 亚洲一区二区三区四区五区黄| 免费a在线观看| 国产高清在线一区| 欧美69视频| 中文字幕永久有效| 欧美日韩性视频在线| 岛国成人毛片|