精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

開(kāi)源版GPT-4o來(lái)了,AI大神Karpathy盛贊!67頁(yè)技術(shù)報(bào)告全公開(kāi)

人工智能 新聞
兩個(gè)多月前那個(gè)對(duì)標(biāo)GPT-4o的端到端語(yǔ)音模型,終于開(kāi)源了。大神Karpathy體驗(yàn)之后表示:nice!

前段時(shí)間技驚四座、劍指GPT-4o的實(shí)時(shí)語(yǔ)音模型Moshi,終于開(kāi)源了!

自然聊天,情緒豐富,隨意打斷,拒絕呆板和回合制!

大神Karpathy體驗(yàn)之后也表示:nice~

圖片

來(lái)自法國(guó)的初創(chuàng)團(tuán)隊(duì)Kyutai,于7月初發(fā)布了這個(gè)對(duì)標(biāo)GPT-4o的神奇的端到端語(yǔ)音模型。

2個(gè)多月后的今天,他們兌現(xiàn)了自己的承諾,將代碼、模型權(quán)重和一份超長(zhǎng)的技術(shù)報(bào)告一股腦開(kāi)源。

圖片

論文地址:https://kyutai.org/Moshi.pdf

開(kāi)源代碼:https://github.com/kyutai-labs/moshi

開(kāi)放權(quán)重:https://huggingface.co/collections/kyutai

在海的那一邊,GPT-4o的語(yǔ)音模式還沒(méi)有完全端上來(lái),這邊的模型已經(jīng)免費(fèi)送了。

大家可以去官網(wǎng)(moshi.chat)在線免費(fèi)體驗(yàn),相比于平時(shí)你問(wèn)我答的AI語(yǔ)音助手,這種「像人一樣」的聊天方式還是很奇特的。

圖片

整個(gè)模型的參數(shù)量為7.69B,pytorch平臺(tái)上只有bf16版本,如果在本地跑的話對(duì)顯存有一定要求,而candle上提供了8bit版本,mlx上更是有4bit版本可供使用。

圖片

moshiko和moshika表示男聲和女聲兩個(gè)版本

moshi作為一個(gè)全雙工口語(yǔ)對(duì)話框架,由幾部分組成:首先是Mimi,目前最先進(jìn)的流式神經(jīng)音頻編解碼器,能夠以完全流式的方式(延遲80毫秒)處理24 kHz音頻(12.5 Hz表示,帶寬1.1 kbps)。

圖片

然后是負(fù)責(zé)知識(shí)儲(chǔ)備、理解和輸出的Transformer部分,包括Helium Temporal Transformer和Depth Transformer。

其中小型的深度Transformer負(fù)責(zé)對(duì)給定時(shí)間步長(zhǎng)的碼本間依賴性進(jìn)行建模,而大型(7B參數(shù))時(shí)間Transformer對(duì)時(shí)間依賴性進(jìn)行建模。

作者還提出了「內(nèi)心獨(dú)白」:在訓(xùn)練和推理過(guò)程中,對(duì)文本和音頻進(jìn)行聯(lián)合建模。這使得模型能夠充分利用文本模態(tài)傳遞的知識(shí),同時(shí)保留語(yǔ)音的能力。

Moshi模擬兩種音頻流:一種來(lái)自Moshi自身(模型的輸出),另一種來(lái)自用戶(音頻輸入)。

圖片

沿著這兩個(gè)音頻流,Moshi預(yù)測(cè)與自己的語(yǔ)音(內(nèi)心獨(dú)白)相對(duì)應(yīng)的文本,極大地提高了生成的質(zhì)量。

Moshi的理論延遲為160毫秒(Mimi幀大小80毫秒 + 聲學(xué)延遲80毫秒),在L4 GPU上的實(shí)際總延遲僅有200毫秒。

技術(shù)細(xì)節(jié)

Moshi突破了傳統(tǒng)AI對(duì)話模型的限制:延遲、文本信息瓶頸和基于回合的建模。

Moshi使用較小的音頻語(yǔ)言模型增強(qiáng)了文本LLM主干,模型接收并預(yù)測(cè)離散的音頻單元,通過(guò)理解輸入并直接在音頻域中生成輸出來(lái)消除文本的信息瓶頸,同時(shí)又可以受益于底層文本LLM的知識(shí)和推理能力。

Moshi擴(kuò)展了之前關(guān)于音頻語(yǔ)言模型的工作,引入了第一個(gè)多流音頻語(yǔ)言模型,將輸入和輸出音頻流聯(lián)合顯式處理為兩個(gè)自回歸token流,完全消除了說(shuō)話者轉(zhuǎn)向的概念,從而允許在任意動(dòng)態(tài)(重疊和中斷)的自然對(duì)話上訓(xùn)練模型。

圖片

Helium

首先介紹負(fù)責(zé)文本部分的Helium,這里采用了一些比較通用的設(shè)計(jì)。

比如,在注意力層、前饋層和輸出線性層的輸入處使用RMS歸一化;使用旋轉(zhuǎn)位置嵌入(RoPE)、4,096 個(gè)token的上下文長(zhǎng)度和 FlashAttention來(lái)進(jìn)行高效訓(xùn)練;使用門(mén)控線性單元,SiLU作為門(mén)控函數(shù)。

Helium的分詞器基于SentencePiece的一元模型,包含32,000個(gè)主要針對(duì)英語(yǔ)的元素。

作者將所有數(shù)字拆分為單個(gè)數(shù)字,并使用字節(jié)退避來(lái)確保分詞器不會(huì)丟失信息。使用AdamW優(yōu)化器訓(xùn)練模型,先采用固定學(xué)習(xí)率,然后進(jìn)行余弦學(xué)習(xí)率衰減。

圖片

7B Helium語(yǔ)言模型和Moshi架構(gòu)訓(xùn)練的超參數(shù)

研究人員在公共英語(yǔ)數(shù)據(jù)的2.1T token上對(duì)模型進(jìn)行了預(yù)訓(xùn)練。

訓(xùn)練數(shù)據(jù)包括維基百科、Stack Exchange和大量科學(xué)文章,還依賴網(wǎng)絡(luò)爬取(特別是來(lái)自CommonCrawl的數(shù)據(jù))來(lái)擴(kuò)展數(shù)據(jù)集,并通過(guò)重復(fù)數(shù)據(jù)刪除、語(yǔ)言識(shí)別和質(zhì)量過(guò)濾等操作獲得高質(zhì)量的訓(xùn)練集。

Mimi

Mimi使用殘差矢量量化 (RVQ) 將音頻轉(zhuǎn)換為Moshi預(yù)測(cè)的離散token,并通過(guò)蒸餾將非因果的高級(jí)語(yǔ)義信息傳輸?shù)揭蚬P蜕傻膖oken中,從而允許對(duì)語(yǔ)義進(jìn)行流式編碼和解碼。

圖片

Mimi架構(gòu)的靈感來(lái)自SoundStream和Encodec,編碼器通過(guò)級(jí)聯(lián)殘差卷積塊將單通道波形投射到潛在表示。所有卷積都是因果的,因此該自動(dòng)編碼器可以以流方式運(yùn)行。

通過(guò)4個(gè)步幅為(4、5、6、8)的卷積塊 ,以及步幅為2的1D卷積,Mimi的編碼器將24kHz波形投影為每秒12.5幀、維度為512的潛在表示,而解碼器采用轉(zhuǎn)置卷積將潛在表示投射回24kHz音頻。

為了提高M(jìn)imi將語(yǔ)音編碼為緊湊表示的能力,研究人員在模型中添加了Transformer模塊,分別位于量化之前和之后。

每個(gè)Transformer塊包含8層、8個(gè)頭、使用RoPE位置編碼、250幀(20 秒)的有限上下文、模型維度512、MLP維度2048。使用 LayerScale來(lái)保證穩(wěn)定訓(xùn)練,對(duì)角線值初始化為0.01。兩個(gè)Transformer都使用因果屏蔽,保留了整個(gè)架構(gòu)與流式推理的兼容性。

Moshi

Moshi作為一種用于音頻語(yǔ)言建模的新架構(gòu),將Helium與較小的Transformer模型相結(jié)合,以分層和流式傳輸?shù)姆绞筋A(yù)測(cè)音頻token。

這種無(wú)條件音頻語(yǔ)言模型,提供了優(yōu)于非流模型的清晰度和音頻質(zhì)量,同時(shí)以流方式生成音頻。作者進(jìn)一步擴(kuò)展了這種架構(gòu),以并行模擬多個(gè)音頻流,從而可以在概念上和實(shí)踐上簡(jiǎn)單地處理具有任意動(dòng)態(tài)的全雙工對(duì)話。

圖片

在上圖的整體架構(gòu)中,RQ Transformer將長(zhǎng)度為K·S的扁平序列分解為大型時(shí)間Transformer的S個(gè)時(shí)間步長(zhǎng),生成上下文嵌入,用于在K個(gè)步驟上調(diào)節(jié)較小的深度Transformer。

與使用單個(gè)模型對(duì)展平序列進(jìn)行建模相比,這允許通過(guò)增加S來(lái)縮放到更長(zhǎng)的序列,或者通過(guò)增加K來(lái)縮放到更高的深度。

圖片

架構(gòu)中的深度Transformer有6層,維度為1024,16個(gè)注意力頭。與之前的工作不同,作者在深度Transformer中為線性層、投影層和全連接層使用每個(gè)索引的不同參數(shù)。

圖片

事實(shí)上,不同的子序列可能需要不同的轉(zhuǎn)換。鑒于該Transformer的尺寸較小,這對(duì)訓(xùn)練和推理時(shí)間都沒(méi)有影響,但上表結(jié)果顯示這種深度參數(shù)化是有益的。

內(nèi)心獨(dú)白

內(nèi)心獨(dú)白是一種用于音頻語(yǔ)言模型訓(xùn)練和推理的新方法,它通過(guò)在音頻token之前預(yù)測(cè)時(shí)間對(duì)齊的文本token,顯著提高了生成語(yǔ)音的事實(shí)性和語(yǔ)言質(zhì)量。

Moshi允許推理來(lái)自用戶音頻和Moshi音頻的非語(yǔ)言信息,但這與Moshi在其語(yǔ)音輸出中生成文本并不矛盾。根據(jù)過(guò)去的觀察,從粗到細(xì)的生成(從語(yǔ)義到聲學(xué)token)對(duì)于生成一致的語(yǔ)音至關(guān)重要。

圖片

作者利用這種層次結(jié)構(gòu),使用文本token作為語(yǔ)義token的每個(gè)時(shí)間步前綴。實(shí)驗(yàn)表明,這不僅極大地提高了生成語(yǔ)音的長(zhǎng)度和質(zhì)量,還展示了單個(gè)延遲超參數(shù)如何允許從ASR模型切換到TTS模型,而不會(huì)改變損失、架構(gòu)或訓(xùn)練數(shù)據(jù)。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2024-09-19 13:34:27

AI開(kāi)源模型

2024-08-14 14:30:00

AI訓(xùn)練

2024-07-31 13:20:14

2025-04-16 09:15:00

AI模型數(shù)據(jù)

2024-05-14 19:16:52

ChatGPTGPT-4oOpenAI

2024-05-14 11:29:15

2025-04-08 02:26:00

2025-08-11 08:42:00

GPT-5AI模型

2025-05-26 09:05:00

2025-08-07 14:05:40

OpenAI大模型開(kāi)源

2024-05-21 12:23:17

2024-06-05 08:29:35

2024-06-21 09:58:38

2024-08-13 13:50:00

數(shù)據(jù)模型

2025-06-23 07:05:00

AI智能體虛擬社區(qū)

2024-09-23 15:10:00

2024-05-20 08:20:00

OpenAI模型

2024-11-28 15:51:19

GPT-4o微軟

2025-08-05 09:15:15

2024-05-24 14:04:04

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

中文字幕人成一区| 国产免费一区二区三区在线观看| 在线观看一区二区三区四区| 都市激情国产精品| 欧美激情自拍偷拍| 亚洲中国色老太| 国产精品视频久久久久久久| 欧美a级成人淫片免费看| 日韩欧美精品三级| 麻豆av免费在线| 黄色的网站在线观看| 91在线播放网址| 国产精品视频xxx| 欧美日韩中文视频| 日韩欧美1区| 精品国产乱码久久久久久浪潮| 亚洲人成无码www久久久| 成人片在线看| 国产日韩欧美高清| 国产亚洲自拍偷拍| 91成人在线免费| 国产日韩免费| 精品中文字幕在线观看| 人人妻人人澡人人爽| 成人性生交大片免费看96| 91成人网在线| 黄色免费福利视频| 一区二区三区伦理| 国产精品丝袜91| 九色综合日本| 性一交一乱一透一a级| 日韩高清在线观看| 91sa在线看| 免费中文字幕视频| 99久久99久久精品国产片果冰| 日韩精品视频在线观看网址| 三上悠亚 电影| 四虎国产精品成人免费影视| 在线一区二区三区四区五区| 男人日女人下面视频| 亚洲制服国产| 国产精品狼人久久影院观看方式| 欧洲精品一区色| 亚洲色欧美另类| 成人av在线影院| 亚洲最大福利网| 一级aaaa毛片| 免费在线观看一区二区三区| 国产91在线播放九色快色| 97超碰人人干| 亚洲美女黄网| 久久久久久久久国产| 免费在线观看日韩| 国产综合精品一区| 欧美国产一区二区三区| 欧美日韩大片在线观看| 婷婷亚洲五月色综合| 日韩中文字幕av| 91资源在线播放| 欧美一区三区| 色天天综合狠狠色| 国产尤物在线播放| 欧美+亚洲+精品+三区| 久久久国产视频| 美女的奶胸大爽爽大片| 欧美精品成人| 欧美久久精品一级黑人c片 | 精品一区二区三区免费看| 欧美日韩激情在线| 加勒比av中文字幕| 国产精品久久久久久av公交车| 欧美精品久久一区| 国产大片一区二区三区| 精品一区二区三区中文字幕| 日韩欧美三级在线| 亚洲中文字幕一区| 伊人久久大香线蕉无限次| 亚洲视频国产视频| 激情高潮到大叫狂喷水| 午夜久久黄色| 2019中文字幕全在线观看| 久久亚洲精品石原莉奈| 免费美女久久99| 亚洲aa在线观看| 农村少妇久久久久久久| 久久婷婷久久一区二区三区| 日韩国产一区久久| 毛片在线播放a| 一区二区视频在线| 日本熟妇人妻xxxxx| 2019中文亚洲字幕| 亚洲国产高清福利视频| 精品人妻无码一区| 亚洲天天影视网| 欧美一级电影免费在线观看| 最新中文字幕第一页| 国产一区二区视频在线| 精选一区二区三区四区五区| 都市激情一区| 亚洲永久精品大片| www.com毛片| 亚洲精品tv| 亚洲国产日韩欧美在线动漫| 亚洲黄色网址大全| 激情欧美丁香| 国产欧美一区二区三区视频 | 精品一区二区三区视频| 国产高清精品一区二区| 啊v视频在线| 亚洲国产精品久久艾草纯爱| 国产无套粉嫩白浆内谢的出处| 精品精品视频| 亚洲欧美成人在线| 青青草手机在线视频| 日韩国产在线一| 国产精品区一区二区三含羞草| 国产在线观看黄| 亚洲国产成人av网| 国产亚洲视频一区| 精品国产1区| 高清亚洲成在人网站天堂| 在线亚洲欧美日韩| 久久久综合视频| 免费的一级黄色片| 日韩午夜视频在线| 亚洲偷欧美偷国内偷| 国产主播在线播放| 国产一区二区精品在线观看| 色大师av一区二区三区| 涩涩视频网站在线观看| 日韩一区二区三区电影 | 国产欧美亚洲精品a| 欧美交受高潮1| 97人妻精品一区二区三区软件| 91香蕉视频污在线| 国产日本在线播放| 国产亚洲精aa在线看| 中文字幕精品国产| www.欧美色| 2020国产精品自拍| 国产精品333| 高潮久久久久久久久久久久久久| 久久资源免费视频| 在线免费看av的网站| 亚洲国产精品成人综合色在线婷婷 | 天堂网在线观看视频| 一区二区三区视频在线看| 五月天激情播播| 久久视频精品| 国产一区在线播放| 免费网站黄在线观看| 欧美无人高清视频在线观看| 欧美偷拍一区二区三区| 老司机精品导航| 日韩欧美一区二区三区久久婷婷| 欧美大片高清| 国产亚洲精品综合一区91| 日韩熟女一区二区| 欧美国产一区二区| 不卡的av中文字幕| 亚洲色图二区| 高清国产在线一区| 波多野结衣中文字幕久久| 亚洲第一页自拍| 黄色在线观看国产| 欧美国产日韩亚洲一区| 成人性生交免费看| 91tv官网精品成人亚洲| 超碰97在线人人| 丁香花在线观看完整版电影| 亚洲第一网中文字幕| 岛国av中文字幕| 日本一区二区成人在线| 天天操精品视频| 精品动漫一区| 欧美精品欧美精品| 日韩伦理一区二区| 欧美激情久久久久| 黄色小视频在线免费观看| 欧美视频日韩视频| 99精品久久久久| 不卡免费追剧大全电视剧网站| 日韩免费毛片视频| 国产精品久久久久久影院8一贰佰 国产精品久久久久久麻豆一区软件 | 国产精品mm| 欧美日韩综合精品| 91视频亚洲| 91精品成人久久| www.亚洲视频| 日韩精品一区二| 日本中文在线播放| 国产精品电影院| 日本五十肥熟交尾| 麻豆精品久久精品色综合| 日本a在线天堂| 精品在线观看入口| 91中文精品字幕在线视频| 一二三四视频在线中文| 日韩在线播放视频| 欧美视频xxx| 欧美吞精做爰啪啪高潮| 精品一区二区三区四| 国产农村妇女毛片精品久久麻豆| 波多野吉衣在线视频| 日韩精品高清不卡| 久久久久久久9| 热久久天天拍国产| 精品国产电影| 青草伊人久久| 国产精品久久久久久久电影 | 亚洲综合偷拍欧美一区色| 日韩人妻无码精品综合区| 国产乱人伦精品一区二区在线观看| 黄www在线观看| 国内精品久久久久久久97牛牛| 日韩欧美精品在线不卡 | 亚洲国产欧美不卡在线观看 | 涩涩av在线| 欧美理论电影在线观看| 91官网在线| 亚洲精品网站在线播放gif| 亚洲av永久纯肉无码精品动漫| 91黄色免费观看| 欧美一级视频免费观看| 曰韩精品一区二区| 亚洲AV成人无码精电影在线| 久久亚洲综合色一区二区三区| 欧美图片自拍偷拍| 国产一区二区三区美女| 亚洲欧美日韩三级| 秋霞午夜av一区二区三区| 黄色一级片播放| 在线免费观看欧美| 国产在线xxxx| 最新精品国产| 手机看片日韩国产| 99久久99久久精品国产片桃花| 亚欧洲精品在线视频免费观看| 台湾佬综合网| 久久久国产精品一区二区三区| 国产精品白丝一区二区三区| av资源站久久亚洲| 涩爱av色老久久精品偷偷鲁| 亚洲一区二区自拍| 日韩视频在线直播| av一本久道久久波多野结衣| av成人app永久免费| 成人91免费视频| 中文字幕一区二区三区中文字幕| 91手机在线播放| 亚洲五码在线| 超碰97在线人人| 国产精品极品国产中出| 国产乱码精品一区二区三区日韩精品| 国产精品毛片av| 精品国产一区二区三区日日嗨| 九九热hot精品视频在线播放| 国产精品入口免费| 欧美久久香蕉| 欧美18视频| 久久不见久久见中文字幕免费 | 免费黄色片在线观看| 亚洲美女中文字幕| h网站在线免费观看| 日韩在线视频免费观看| a黄色片在线观看| 久久久久久久久爱| 天天免费亚洲黑人免费| 国产精品视频一区二区高潮| 亚洲视频自拍| 成人免费在线一区二区三区| 天堂网av成人| 亚洲国产精品久久久久久女王| 99国产精品一区二区| 在线观看18视频网站| 国内精品久久久久久久影视蜜臀 | 91麻豆免费视频网站| 一区二区三区在线视频免费 | 97视频资源在线观看| 狠狠久久伊人| 日韩一区二区三区资源| 一本到12不卡视频在线dvd| www.成年人视频| 三级影片在线观看欧美日韩一区二区| 国产一伦一伦一伦| 不卡区在线中文字幕| 免费一级特黄3大片视频| 一区二区三区四区不卡在线| 欧产日产国产69| 欧美一区二区三区系列电影| 国产又爽又黄网站亚洲视频123| 亚洲乱码一区av黑人高潮| 欧美videos极品另类| 国内精品久久久久久| 国产精品久久久久久妇女| 丁香婷婷久久久综合精品国产| 国产精品一区二区三区av麻| 三级在线免费观看| 久久久天天操| wwwxxx色| 久久久久九九视频| 免费在线观看亚洲| 欧美色手机在线观看| 四虎永久在线精品免费网址| 丝袜美腿亚洲一区二区| rebdb初裸写真在线观看| 成人动漫网站在线观看| 免费看久久久| 黄色网zhan| 日本欧美韩国一区三区| 亚洲国产精品成人综合久久久| 国产精品国产精品国产专区不蜜| 国产高潮久久久| 日韩欧美在线网站| 欧美午夜电影一区二区三区| 人人做人人澡人人爽欧美| 一区二区网站| 在线观看亚洲视频啊啊啊啊| 久久免费国产| 美女久久久久久久久| 亚洲天堂av一区| 99成人精品视频| 亚洲美女黄色片| 91av久久| 97se在线视频| 99久久久久国产精品| 三级a在线观看| 26uuu国产电影一区二区| 黄网站免费在线| 欧美一区二区三区男人的天堂| 在线日本视频| 国产精品国产三级国产aⅴ浪潮| 日韩手机在线| 极品粉嫩国产18尤物| 国产盗摄视频一区二区三区| 国产又粗又硬又长又爽| 欧美色网一区二区| 成人好色电影| 国产精品久久久久久久久影视 | 天堂网av手机版| 欧美精品一区二区三区久久久| av免费在线观看网址| 成人亚洲欧美一区二区三区| 国产精品传媒精东影业在线| jizz大全欧美jizzcom| 国产精品电影一区二区| 在线观看国产黄| 日韩亚洲一区二区| 二区三区精品| 日本一二三区视频在线| 国产乱码精品一区二区三区忘忧草| 在线观看亚洲网站| 91精品福利在线一区二区三区| bt在线麻豆视频| 91文字幕巨乱亚洲香蕉| 在线观看日韩av电影| 在线观看免费视频国产| 欧美日韩国产在线| 免费在线观看一级毛片| 国产精品福利网| 日韩成人综合| 激情在线观看视频| 亚洲一区二区影院| 天天干天天摸天天操| 欧美亚洲在线观看| 日产精品一区二区| 一级做a免费视频| 一区二区三区四区亚洲| 天天综合网天天综合| 日韩美女写真福利在线观看| 欧美欧美黄在线二区| 中文字幕天天干| 亚洲欧美日韩系列| 天天操天天舔天天干| 国产99视频在线观看| 视频在线不卡免费观看| av电影中文字幕| 欧美日韩性视频在线| 成人免费视频| av成人午夜| 日韩在线观看一区二区| 暗呦丨小u女国产精品| 亚洲国产精品久久91精品| 中文一区一区三区高中清不卡免费| 日韩欧美一区二区三区四区 | 成人三级在线| 香蕉成人久久| 久草福利资源在线| 亚洲精品国产精品乱码不99按摩| 欧美性理论片在线观看片免费| 国产一区一区三区| 91亚洲精华国产精华精华液| 黄色大全在线观看| 欧美国产第一页| 加勒比久久综合| 日本50路肥熟bbw| 欧美撒尿777hd撒尿| 国产在线美女| 中文字幕一区二区三区四区五区六区 | 国产精品久久久久久搜索|