精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

遷移DeepSeek-R1同款算法,小米讓7B模型登頂音頻理解推斷MMAU榜單

人工智能 新聞
MMAU是一個(gè)由一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本構(gòu)成的評(píng)測(cè)基準(zhǔn),難度非常高,人類專家的成績(jī)?yōu)?2.2%。

7B小模型+3.8萬(wàn)條訓(xùn)練數(shù)據(jù),就能讓音頻理解和推斷評(píng)測(cè)基準(zhǔn)MMAU榜單王座易主?

受到DeepSeek-R1中強(qiáng)化學(xué)習(xí)算法的啟發(fā),小米大模型團(tuán)隊(duì)對(duì)阿里的Qwen2-Audio-7B模型進(jìn)行了微調(diào)。

結(jié)果模型在MMAU上的準(zhǔn)確率從49.2%提升到了64.5%(漲幅31%),比以前霸榜的GPT-4o還高出近10個(gè)百分點(diǎn)。

MMAU是一個(gè)由一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本構(gòu)成的評(píng)測(cè)基準(zhǔn),難度非常高,人類專家的成績(jī)?yōu)?2.2%。

圖片

來(lái)自阿里的Qwen2-Audio-7B模型在此評(píng)測(cè)集上的準(zhǔn)確率為49.2%,經(jīng)小米大模型團(tuán)隊(duì)用清華大學(xué)發(fā)布的AVQA數(shù)據(jù)集,使用SFT微調(diào)后提升到了51.8%。

這樣的提升并不明顯,而當(dāng)小米團(tuán)隊(duì)選擇改用DeepSeek-R1的GRPO算法時(shí),發(fā)現(xiàn)獲得了巨大的性能提升,一舉達(dá)到了MMAU的新SOTA。

目前,小米大模型團(tuán)隊(duì)已經(jīng)把訓(xùn)練代碼、模型參數(shù)開源,并提供了技術(shù)報(bào)告、在線Demo。

圖片

7B小模型拿下MMAU榜單SOTA

如前所述,小米大模型團(tuán)隊(duì)通過(guò)SFT,使用清華AVQA數(shù)據(jù)集對(duì)選擇了來(lái)自阿里的Qwen2-Audio-7B進(jìn)行了微調(diào),成績(jī)提升了2.6個(gè)百分點(diǎn)。

直到DeepSeek-R1的發(fā)布,為小米在該項(xiàng)任務(wù)上的研究帶來(lái)了啟發(fā)。

DeepSeek-R1的Group Relative Policy Optimization(GRPO)方法,讓模型僅通過(guò)”試錯(cuò)-獎(jiǎng)勵(lì)”機(jī)制就能使自主進(jìn)化,涌現(xiàn)出類似人類的反思、多步驗(yàn)證等推理能力。

在同一時(shí)間,卡內(nèi)基梅隆大學(xué)發(fā)布的預(yù)印本論文(arxiv:2503.01067),通過(guò)精巧的實(shí)驗(yàn)得出了一個(gè)有趣的論斷:

當(dāng)任務(wù)存在明顯的生成-驗(yàn)證差距(Generation-Verification Gap),即任務(wù)生成結(jié)果的難度遠(yuǎn)大于驗(yàn)證結(jié)果正確性的難度時(shí),強(qiáng)化學(xué)習(xí)比起有監(jiān)督微調(diào)具有獨(dú)特優(yōu)勢(shì)

而AQA任務(wù),恰好是完美的生成-驗(yàn)證差距顯著的任務(wù)。

離線微調(diào)方法,如SFT,有點(diǎn)像背題庫(kù),你只能根據(jù)已有的題目和答案訓(xùn)練,但遇到新題可能不會(huì)做;

而強(qiáng)化學(xué)習(xí)方法,如GRPO,像老師在要求你多想幾個(gè)答案,然后老師告訴你哪一個(gè)答案好,讓你主動(dòng)思考,激發(fā)出自身的能力,而不是被“填鴨式”教學(xué)。

當(dāng)然,如果訓(xùn)練量足夠,比如有學(xué)生愿意花很多年的時(shí)間來(lái)死記硬背題庫(kù),也許最終也能達(dá)到不錯(cuò)的效果,但效率太低,浪費(fèi)太多時(shí)間。

而主動(dòng)思考,更容易快速地達(dá)到舉一反三的效果。強(qiáng)化學(xué)習(xí)的實(shí)時(shí)反饋可能會(huì)幫助模型更快鎖定高質(zhì)量答案的分布區(qū)域,而離線方法需要遍歷整個(gè)可能性空間,效率要低得多。

基于上述洞察,小米嘗試將DeepSeek-R1的GRPO算法遷移到Qwen2-Audio-7B模型上

令人驚喜的是,在僅使用AVQA的3.8萬(wàn)條訓(xùn)練樣本的情況下,強(qiáng)化學(xué)習(xí)微調(diào)后的模型在MMAU評(píng)測(cè)集上實(shí)現(xiàn)了64.5%的準(zhǔn)確率,這一成績(jī)比目前榜單上第一名的商業(yè)閉源模型GPT-4o有近10個(gè)百分點(diǎn)的優(yōu)勢(shì)。

有趣的是,如果在訓(xùn)練中強(qiáng)制要求模型輸出包含thinking標(biāo)簽的推理過(guò)程時(shí),準(zhǔn)確率反而下降至61.1%。這說(shuō)明顯式的思維鏈結(jié)果輸出可能并不利于模型的訓(xùn)練

小米大模型團(tuán)隊(duì)的實(shí)驗(yàn)揭示了幾個(gè)和傳統(tǒng)認(rèn)知不同的結(jié)論:

  • 關(guān)于微調(diào)方法:強(qiáng)化學(xué)習(xí)在3.8萬(wàn)條數(shù)據(jù)集上的表現(xiàn),顯著超過(guò)監(jiān)督學(xué)習(xí)在57萬(wàn)條數(shù)據(jù)集上的結(jié)果;
  • 關(guān)于參數(shù)規(guī)模:相比千億級(jí)模型,7B參數(shù)的模型通過(guò)強(qiáng)化學(xué)習(xí)也可展現(xiàn)強(qiáng)推理能力;
  • 關(guān)于隱式推理:顯式思維鏈輸出反而成為性能瓶頸。

盡管當(dāng)前準(zhǔn)確率已突破64%,但距離人類專家82%的水平仍有差距。

小米大模型團(tuán)隊(duì)表示,在當(dāng)前的實(shí)驗(yàn)中,強(qiáng)化學(xué)習(xí)策略還是比較粗糙,訓(xùn)練過(guò)程對(duì)思維鏈的引導(dǎo)并不充分,我們會(huì)在后續(xù)做進(jìn)一步探索。

此次實(shí)驗(yàn)驗(yàn)證了強(qiáng)化學(xué)習(xí)在音頻理解和判斷領(lǐng)域的獨(dú)特價(jià)值,也為后續(xù)研究打開了一扇新的大門。

小米團(tuán)隊(duì)期待,當(dāng)機(jī)器不僅能“聽見”聲音,還能“聽懂”聲音背后的因果邏輯時(shí),真正的智能聽覺時(shí)代將會(huì)來(lái)臨。

人類專家準(zhǔn)確率82.23%

MMAU(Massive Multi-Task Audio Understanding and Reasoning)評(píng)測(cè)集由美國(guó)馬里蘭大學(xué)和Adobe的研究人員于去年聯(lián)合提出,是音頻理解和推斷能力的量化標(biāo)尺

它通過(guò)一萬(wàn)條涵蓋語(yǔ)音、環(huán)境聲和音樂(lè)的音頻樣本,結(jié)合人類專家標(biāo)注的問(wèn)答對(duì),測(cè)試模型在27種技能,如跨場(chǎng)景推理、專業(yè)知識(shí)等應(yīng)用上的表現(xiàn),期望模型達(dá)到接近人類專家的邏輯分析水平。

  • 面對(duì)一段汽車行駛中的座艙錄音,AI 能否判斷出汽車是否存在潛在的故障?
  • 在交響樂(lè)演出現(xiàn)場(chǎng),AI 能否推測(cè)出作曲家創(chuàng)造這首音樂(lè)時(shí)的心情?
  • 在早高峰地鐵站混亂的腳步聲潮中,AI 能否預(yù)判閘機(jī)口可能發(fā)生的沖撞風(fēng)險(xiǎn)?

圖片

在大模型時(shí)代,人們已經(jīng)不滿足于機(jī)器僅僅識(shí)別說(shuō)話的內(nèi)容、聲音的種類,更期望機(jī)器具備復(fù)雜的理解和判斷能力,MMAU衡量的就是這種能力。

這是一個(gè)很難的評(píng)測(cè)集,作為基準(zhǔn)上限,人類專家在MMAU上的準(zhǔn)確率為82.23%

目前MMAU官網(wǎng)榜單上表現(xiàn)最好的模型是GPT-4o,準(zhǔn)確率為57.3%。緊隨其后的是谷歌的Gemini 2.0 Flash,準(zhǔn)確率為55.6%。

訓(xùn)練代碼:https://github.com/xiaomi-research/r1-aqa

模型參數(shù):https://huggingface.co/mispeech/r1-aqa

技術(shù)報(bào)告:https://arxiv.org/abs/2503.11197交互Demo:http://120.48.108.147:7860/

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-03-27 10:28:32

2025-03-10 08:30:00

AI模型訓(xùn)練

2025-06-25 08:54:03

模型訓(xùn)練AI

2025-02-19 08:00:00

2024-07-15 08:58:00

2025-04-03 06:30:00

2024-08-13 15:40:00

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-06-12 09:48:27

2024-07-18 12:53:13

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-02-25 10:03:20

2025-04-29 09:06:00

2024-04-02 09:17:50

AI數(shù)據(jù)開源

2025-06-17 09:09:00

2025-03-05 03:00:00

DeepSeek大模型調(diào)優(yōu)

2025-03-06 17:29:21

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩av在线电影观看| 欧美成人在线免费视频| 男女男精品视频站| 日韩伦理在线电影| 国产凹凸在线观看一区二区| 久久久久久久久久久网站| 精品人妻无码一区二区三区换脸| 日日夜夜亚洲精品| 亚洲r级在线视频| 日本欧美精品久久久| 国产又爽又黄免费软件| 99xxxx成人网| zzijzzij亚洲日本成熟少妇| 国产一级伦理片| 成人国产精品一区二区网站| 精品久久久久人成| 91麻豆天美传媒在线| 特黄视频在线观看| 久久国产精品99久久久久久老狼| 性欧美激情精品| 国产一区二区播放| 精品一级毛片| 亚洲第一精品久久忘忧草社区| 在线观看免费黄网站| 成年人黄色大片在线| 国产精品白丝在线| 久久综合九九| 蜜桃久久一区二区三区| 精品一区二区三区在线观看| 日韩暖暖在线视频| 日本三级午夜理伦三级三| 国产精品久久天天影视| 国产亚洲精品成人av久久ww| 欧美一区二区三区在线观看| 中文字幕欧美国内| 日本黄色免费观看| 亚洲精品高潮| 国产亚洲毛片| 一区二区三区四区日本视频| 国产福利不卡视频| 国产精品吴梦梦| 圆产精品久久久久久久久久久| 91精品国产乱码久久久久久| 日韩在线激情视频| 国产免费无遮挡吸奶头视频| 色先锋久久影院av| 欧美精品一区二区不卡| 精品人妻二区中文字幕| 3d动漫一区二区三区在线观看| 欧美自拍偷拍一区| 国产又大又黄又粗的视频| 欧美大胆a人体大胆做受| 亚洲高清三级视频| 美女扒开大腿让男人桶| 日本天码aⅴ片在线电影网站| 亚洲日本成人在线观看| 警花观音坐莲激情销魂小说| 青青青青在线| 中文字幕在线一区免费| 一区二区三区欧美在线| 久操视频在线观看| 亚洲精品大片www| a级片一区二区| 国产乱妇乱子在线播视频播放网站| 一区二区在线电影| 欧美大片在线播放| 最新日韩精品| blacked蜜桃精品一区| 国产精品久久久久久久久久久免费看 | 欧美性x x x| 婷婷成人基地| 欧美老妇交乱视频| 国产精品99精品无码视| 国产视频一区三区| 国产精品激情av在线播放| 伊人免费在线观看| 激情文学综合插| julia一区二区中文久久94| 色综合久久久久久| 久久九九久精品国产免费直播| 相泽南亚洲一区二区在线播放| 麻豆系列在线观看| 亚洲欧美色图小说| 欧美 日韩 国产在线观看| 老司机成人影院| 在线不卡欧美精品一区二区三区| 亚洲国产综合av| 日韩欧美黄色| www.日韩视频| 日本少妇久久久| 日韩av一二三| 成人情视频高清免费观看电影| 天天操天天干天天操| 中文字幕+乱码+中文字幕一区| 青青草原网站在线观看| 理论片午夜视频在线观看| 欧美在线三级电影| 黑森林av导航| 日韩在线综合| 国内精品一区二区三区| 亚洲在线视频播放| 91免费在线播放| 91xxx视频| 韩国主播福利视频一区二区三区| 国产精品mm| 精品国产乱码久久久久久老虎| 女尊高h男高潮呻吟| 日韩精品成人在线| 色综合综合网| 久久99亚洲精品| 亚洲精品无码久久久久| 国产成人免费视频网站 | 男人添女人下面免费视频| 高清日韩中文字幕| 久久精品99久久久久久久久| 国产精品一区二区三区四| 国产另类ts人妖一区二区| 欧美午夜精品久久久久免费视| 在线中文字幕-区二区三区四区 | 88av.com| 久久久久久久久久久久久久久久久久久久| 国产一区二区三区在线看| 日韩成人免费在线观看| 国产一区二区视频在线| 亚洲 国产 欧美一区| 亚洲国产福利| 亚洲韩国青草视频| 欧美成人三级在线观看| 精品一区二区三区不卡| 色女人综合av| 欧美激情喷水| 亚洲精品小视频在线观看| 国产在线观看免费视频今夜| 国产精品影视在线观看| 一区二区三区四区五区视频| 日韩免费福利视频| 亚洲跨种族黑人xxx| 日产亚洲一区二区三区| 国产精品夜夜嗨| 福利网在线观看| 色999韩欧美国产综合俺来也| 亚洲色图综合久久| 亚洲熟女综合色一区二区三区| 99久久国产综合精品女不卡| 日韩视频在线视频| 国产毛片精品| 久久久久久久久久婷婷| 后入内射欧美99二区视频| 一区二区三区国产豹纹内裤在线| 五月天国产视频| 先锋资源久久| 91中文在线视频| 18+激情视频在线| 日韩美女在线视频 | 天堂а√在线资源在线| 欧美日韩国产综合一区二区| 91无套直看片红桃在线观看| 久久国产综合精品| 国产精品av免费| 久久在线观看| 欧美高清在线视频观看不卡| 亚洲欧美国产高清va在线播放| 亚洲电影在线免费观看| 亚洲精品在线视频免费观看 | 校园春色 亚洲色图| 久久影院100000精品| 亚洲va男人天堂| av免费在线观看网址| 精品国产免费视频| 国产www在线| 国产精品女主播av| 久久精品视频在线观看免费| 欧美伊人影院| 国内一区在线| 成人mm视频在线观看| 久久国产精品久久精品| 亚洲免费成人网| 在线观看欧美日本| 国产性生活大片| 99re这里只有精品首页| 97公开免费视频| 色综合色综合| 国产 高清 精品 在线 a| 中老年在线免费视频| 最近2019年中文视频免费在线观看| 国产又黄又粗又猛又爽| 欧美日韩亚洲精品内裤| 岛国片在线免费观看| 成人av资源在线观看| 中文字幕永久视频| 国内精品美女在线观看 | www.日本高清| 久久超碰97中文字幕| 欧美久久久久久久久久久久久| av中文一区| 国产aⅴ精品一区二区三区黄| 成人开心激情| 欧美日本中文字幕| 电影在线一区| 亚洲黄色在线观看| 国产精品无码在线播放| 欧美性69xxxx肥| 伊人av成人| 国产日韩三级| 国产日韩中文字幕| 在线毛片观看| 欧美精品成人在线| 毛片在线看网站| 亚洲男女性事视频| www.天天干.com| 欧美日韩中文字幕一区| 国产一级做a爱片久久毛片a| 专区另类欧美日韩| 久久久久久国产精品无码| 国产精品99久久久久久宅男| 午夜在线观看av| 性高湖久久久久久久久| 国产午夜精品视频一区二区三区| 成人同人动漫免费观看| 久久九九视频| 国产91精品入| 91视频免费进入| 日韩欧美专区| 国产精品视频成人| 婷婷六月国产精品久久不卡| 久久久久久久亚洲精品| a黄色片在线观看| 色老头一区二区三区| 国产专区在线| 亚洲精品一区中文| 天天综合网在线观看| 精品国产污污免费网站入口 | 欧美成人免费全部| 午夜视频成人| 中文字幕久精品免费视频| 九色视频网站在线观看| 亚洲精品一区中文| 日韩电影网址| 亚洲免费电影一区| 亚洲色偷精品一区二区三区| 精品盗摄一区二区三区| 日本韩国免费观看| 精品国产网站在线观看| 蜜桃久久一区二区三区| 亚洲第一视频网| 日韩一区二区三区在线观看视频| 日韩精品影音先锋| 丰满少妇在线观看bd| 精品国产亚洲一区二区三区在线观看 | 老司机久久99久久精品播放免费| 五月丁香综合缴情六月小说| 亚洲国产免费看| 日本在线xxx| 久久高清免费观看| 成人在线观看黄| 日韩激情视频网站| 天堂视频免费看| 国产精品资源在线| 97中文字幕在线观看| av中文字幕一区| 香蕉网在线播放| 亚洲国产精华液网站w| 天天操天天摸天天舔| 日韩毛片精品高清免费| 黄色一级视频在线观看| 午夜激情久久久| 日韩精品一区不卡| 欧美无乱码久久久免费午夜一区| 伊人成人在线观看| 日韩一区二区三区免费看| 免费观看黄色一级视频| 亚洲天堂免费观看| 免费**毛片在线| 久久久久久九九九| 台湾佬中文娱乐久久久| 91久久精品久久国产性色也91| 欧美欧美在线| 欧美人xxxxx| 偷拍欧美精品| 国产精品无码av在线播放| 秋霞电影网一区二区| 宇都宫紫苑在线播放| 2欧美一区二区三区在线观看视频 337p粉嫩大胆噜噜噜噜噜91av | 欧美成在线观看| 亚洲插插视频| 91久久国产婷婷一区二区| 欧美1区2区3区4区| 亚洲自拍三区| 一本色道久久综合亚洲精品高清| 国产v亚洲v天堂无码久久久| 国产伦精品一区二区三区免费迷 | 一区二区三区欧美久久| 欧美 日韩 精品| 宅男在线国产精品| 亚洲三级中文字幕| 久久久精品中文字幕| 日韩电影免费看| 91日韩在线播放| 欧美日韩播放| av免费看网址| 久久99国产精品久久| 人妻少妇精品视频一区二区三区| 国产精品妹子av| 欧美一级片免费在线观看| 制服丝袜亚洲网站| 韩日视频在线| 91高清视频在线免费观看| 亚洲国产伊人| 免费在线成人av电影| 国产精品九九| 色婷婷.com| 亚洲国产高清aⅴ视频| 亚洲激情视频一区| 欧美xxxx老人做受| 免费在线观看av| 国产成人啪精品视频免费网| 国产区精品视频在线观看豆花| 青青草免费在线视频观看| 日本网站在线观看一区二区三区| 精品视频站长推荐| 一区二区在线观看免费视频播放| 一区二区三区亚洲视频| 亚洲性xxxx| 涩涩视频在线免费看| 翡翠波斯猫1977年美国| 欧美午夜国产| 亚洲欧美天堂在线| 国产精品久久久久久久裸模| 国产亚洲欧美日韩高清| 日韩第一页在线| 岛国毛片av在线| 国产精品久久波多野结衣| 欧美激情在线| 午夜激情视频网| 亚洲日本乱码在线观看| 国产视频www| 久久这里有精品视频| www久久久| 三年中国中文在线观看免费播放| 琪琪一区二区三区| 日韩精品电影一区二区三区| 欧美在线影院一区二区| 91涩漫在线观看| 成人黄色免费片| 久久激情电影| 999在线精品视频| 自拍视频在线观看一区二区| a网站在线观看| 欧美美最猛性xxxxxx| 亚洲一区网址| www插插插无码视频网站| 99久久99久久精品免费观看| 国产成人无码精品久久久久| 精品999久久久| 超碰99在线| 欧美大陆一区二区| 日韩av在线免费观看不卡| 国产精品理论在线| 欧美精品乱人伦久久久久久| www红色一片_亚洲成a人片在线观看_| 91精品中国老女人| 亚洲国产裸拍裸体视频在线观看乱了中文| 国产日韩视频一区| 日韩欧美亚洲综合| 91在线品视觉盛宴免费| 成人欧美一区二区三区黑人| 欧美精品国产| 国产精品一区二区入口九绯色| 日本韩国视频一区二区| 色综合久久久久综合一本到桃花网| 91亚洲午夜在线| 日韩一级免费| 国产成人综合亚洲| 91久久久久国产一区二区| 亚洲天堂免费视频| 91久久青草| 免费看国产曰批40分钟| 国产日韩欧美不卡| 国产三级三级在线观看| 国模私拍视频一区| 激情综合网站| 黄色片子免费看| 一本久道中文字幕精品亚洲嫩| 91网页在线观看| 成人午夜电影免费在线观看| 日欧美一区二区| 久久久久久久久久91| 亚洲人成五月天| 一区二区在线免费播放| avav在线看| 亚洲精品va在线观看| 日韩三级电影网| 亚洲最大的网站| 老司机精品福利视频| 久久久美女视频| 永久免费毛片在线播放不卡| 精品三级av在线导航| 免费精品99久久国产综合精品应用| 亚洲第一成人在线| 美女av在线播放|