精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

MiniMax開源首個視覺RL統(tǒng)一框架,閆俊杰領(lǐng)銜!推理感知兩手抓,性能橫掃M(jìn)EGA-Bench

人工智能 新聞
最新開源V-Triune(視覺三重統(tǒng)一強(qiáng)化學(xué)習(xí)系統(tǒng))框架,使VLM首次能夠在單個后訓(xùn)練流程中,聯(lián)合學(xué)習(xí)和掌握視覺推理和感知任務(wù)。

僅需一個強(qiáng)化學(xué)習(xí)(RL)框架,就能實(shí)現(xiàn)視覺任務(wù)大統(tǒng)一?

現(xiàn)有RL對推理和感知任務(wù)只能二選一,但“大模型六小強(qiáng)”之一MiniMax表示:我全都要!

最新開源V-Triune(視覺三重統(tǒng)一強(qiáng)化學(xué)習(xí)系統(tǒng))框架,使VLM首次能夠在單個后訓(xùn)練流程中,聯(lián)合學(xué)習(xí)和掌握視覺推理和感知任務(wù)。

通過三層組件設(shè)計基于動態(tài)交并比(IoU)的獎勵機(jī)制,彌補(bǔ)了傳統(tǒng)RL方法無法兼顧多重任務(wù)的空白。

圖片

甚至基于V-Triune,MiniMax還一步到位,貼心地給大家開發(fā)了全新的Orsta(One RL to See Them All)模型系列(7B至32B),在MEGA-Bench Core基準(zhǔn)測試中從+2.1%顯著提升至+14.1%。

圖片

值得注意的是,在論文的作者一欄,MiniMax創(chuàng)始人兼CEO閆俊杰也參與了這項(xiàng)研究。

圖片

目前V-Triune框架和Orsta模型都在GitHub上實(shí)現(xiàn)全面開源,點(diǎn)擊文末鏈接即可跳轉(zhuǎn)一鍵獲取。

那話不多說,咱們直接上細(xì)節(jié)。

推理感知“兩手抓”

視覺任務(wù)可以分為推理感知兩類,在當(dāng)前,RL研究主要集中于數(shù)學(xué)QA和科學(xué)QA等視覺推理任務(wù)。

而目標(biāo)檢測和定位等視覺感知任務(wù),因亟需獨(dú)特的獎勵設(shè)計和訓(xùn)練穩(wěn)定性保障,還沒有得到一個很好的解決方案……

圖片

針對上述問題,MiniMax針對性地提出了新框架V-Triune,作為首個面向VLM后訓(xùn)練的統(tǒng)一RL系統(tǒng),通過三個互補(bǔ)組件核心巧妙實(shí)現(xiàn)二者的平衡。

樣本級數(shù)據(jù)格式化

讓每個樣本自定義其獎勵設(shè)置和驗(yàn)證器,支持動態(tài)路由和權(quán)重調(diào)整,以處理多種任務(wù)需求。

數(shù)據(jù)模式基于HuggingFace數(shù)據(jù)集實(shí)現(xiàn),包含以下三個字段:

  1. reward_model:樣本級定義獎勵類型、權(quán)重。
  2. verifier:指定驗(yàn)證器及其參數(shù)。
  3. data_source:標(biāo)識樣本來源。

最終實(shí)現(xiàn)了多樣化數(shù)據(jù)集的無縫集成,同時支持高度靈活的獎勵控制。

驗(yàn)證器級獎勵計算

采用異步客戶端-服務(wù)器架構(gòu),將獎勵計算與主訓(xùn)練循環(huán)解耦。

圖片

客戶端通過代理工作器異步發(fā)送請求,而服務(wù)器則根據(jù)”verifier”字段路由至專用驗(yàn)證器。

主要使用兩類驗(yàn)證器:

  1. MathVerifyVerifierr:處理推理、OCR和計數(shù)任務(wù)。
  2. DetectionVerifier:處理檢測和定位任務(wù),應(yīng)用動態(tài)IoU獎勵。

從而實(shí)現(xiàn)在無需修改核心訓(xùn)練流程的情況下,靈活擴(kuò)展新任務(wù)或更新獎勵邏輯。

數(shù)據(jù)源級指標(biāo)監(jiān)控

在多任務(wù)多源訓(xùn)練中,按數(shù)據(jù)源記錄以下指標(biāo):

  1. 獎勵值:追蹤數(shù)據(jù)集特定穩(wěn)定性。
  2. IoU和mAP(感知任務(wù)):記錄不同閾值下的IoU和mAP。
  3. 響應(yīng)長度和反思率:跟蹤響應(yīng)長度分布、截斷率,以及15個預(yù)定義反思詞(如“re-check”)的出現(xiàn)比例。

該監(jiān)控機(jī)制幫助診斷模型行為(如過度思考或膚淺響應(yīng)),并確保學(xué)習(xí)的穩(wěn)定性。

圖片

動態(tài)IoU獎勵

此外針對監(jiān)測和定位任務(wù),團(tuán)隊(duì)還創(chuàng)新性地提出了動態(tài)IoU獎勵,分階段調(diào)整閾值,以緩解冷啟動問題,同時引導(dǎo)模型逐步提升定位精度:

  • 初始10%訓(xùn)練步驟:
  • 10%-25%訓(xùn)練步驟:
  • 剩余訓(xùn)練步驟:

圖片

雖然V-Triune提供了可擴(kuò)展的數(shù)據(jù)、任務(wù)和指標(biāo)框架,但早期實(shí)驗(yàn)顯示,聯(lián)合訓(xùn)練可能會導(dǎo)致評估性能下降梯度范數(shù)突增等不穩(wěn)定現(xiàn)象,于是團(tuán)隊(duì)又通過以下調(diào)整逐步解決:

  1. 凍結(jié)ViT參數(shù),防止梯度爆炸。
  2. 過濾偽圖像特殊詞元,確保輸入特征對齊,提升訓(xùn)練穩(wěn)定性。
  3. 構(gòu)建隨機(jī)化CoT提示池,降低提示依賴性。
  4. 由于V-Triune基于Verl框架實(shí)現(xiàn),主節(jié)點(diǎn)內(nèi)存壓力較大,需解耦測試階段與主訓(xùn)練循環(huán)以管理內(nèi)存。

Orsta模型

另外值得一提的是,基于開源的Qwen2.5-VL模型,團(tuán)隊(duì)還訓(xùn)練出7B和32B的Orsta模型

圖片

依據(jù)4類推理任務(wù)(數(shù)學(xué)、謎題、科學(xué)、圖表分析)和4類感知任務(wù)(物體檢測、目標(biāo)定位、計數(shù)、OCR)的訓(xùn)練數(shù)據(jù),進(jìn)行規(guī)則和難度的兩階段過濾和訓(xùn)練優(yōu)化。

最終實(shí)現(xiàn)在MEGA-Bench Core基準(zhǔn)測試中,Orsta相比原始模型提升至+14.1%,尤其是在感知任務(wù)中,mAP指標(biāo)顯著提高,證明了該統(tǒng)一方法的有效性和可擴(kuò)展性。

圖片

MiniMax布局多模態(tài)領(lǐng)域

MiniMax作為商湯背景出身的AI六小龍之一,近期在多模態(tài)領(lǐng)域可謂動作頻頻,模型橫跨語言、音頻、視頻。

圖片

例如MiniMax的S2V-01視頻模型、MiniMax-VL-01視覺多模態(tài)模型以及MiniMax-T2A-01系列語言模型等。

尤其是廣受好評的MiniMax-01系列,包含基礎(chǔ)語言模型和視覺多模態(tài)模型兩種,性能上比肩DeepSeek-V3、GPT-4o等國內(nèi)外頂尖模型的同時,還首次創(chuàng)新性實(shí)現(xiàn)了對新型Lightning Attention架構(gòu)的大規(guī)模擴(kuò)展。

最新發(fā)布的Speech-02,在AI語言生成上也是一騎絕塵,直接刷新全球權(quán)威語音基準(zhǔn)測試榜單第一,一舉打破OpenAI、ElevenLabs的行業(yè)壟斷。

圖片

同時,據(jù)MiniMax高級研究總監(jiān)鐘怡然同量子位訪談時所說:

MiniMax將會進(jìn)一步探索多模態(tài)架構(gòu)創(chuàng)新,即原生的生成理解統(tǒng)一大模型的架構(gòu)。

而今天這個統(tǒng)一視覺任務(wù)的RL架構(gòu)也許僅僅是一個開始。

論文鏈接:https://arxiv.org/abs/2505.18129代碼鏈接:https://github.com/MiniMax-AI/One-RL-to-See-Them-All

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2009-05-19 15:06:33

TD-SCDMA3G建設(shè)

2011-08-10 16:21:40

網(wǎng)康ITM網(wǎng)絡(luò)擁塞

2023-10-07 00:11:22

CIO

2010-03-15 15:02:54

2017-11-01 10:11:00

CIO創(chuàng)新房地產(chǎn)

2023-05-08 15:14:38

技術(shù)AI

2021-04-26 08:24:41

DDoS攻擊黑客

2009-02-16 09:58:00

無線路由自動斷線故障

2015-04-15 13:04:45

AMDLisa Su策略

2022-09-05 11:39:38

瑞數(shù)信息動態(tài)安全

2015-04-15 13:49:31

公共Wi-Fi避害兩手抓

2021-07-26 08:01:35

數(shù)據(jù)資產(chǎn)智能化安全性

2013-12-20 09:08:40

智慧城市

2018-07-10 17:48:22

百度云

2024-11-15 15:38:00

模型測評

2017-01-16 13:13:34

H3C關(guān)鍵業(yè)務(wù)

2025-05-15 09:04:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

久久躁狠狠躁夜夜爽| 操你啦视频在线| 97成人超碰| 午夜精品视频| 色综合久久久久综合| 成人黄色在线免费| 国产精品探花一区二区在线观看| 麻豆网址在线观看| 在线观看爽视频| 韩国一区二区三区| 亚洲人成亚洲人成在线观看| 一区二区三区四区五区视频| 亚洲区一区二区三| 亚洲网一区二区三区| 国产日韩精品久久久| 97国产精品人人爽人人做| 免费观看黄网站| 国产大片在线免费观看| 国产美女诱惑一区二区| 精品欧美黑人一区二区三区| 欧美一区二区三区四区夜夜大片| 日韩成人av一区二区| 国产一二区在线| 免费成人av在线播放| 亚洲欧美在线一区| 波多野结衣在线免费观看| 天堂аⅴ在线地址8| 日本成人中文字幕| 中文字幕亚洲国产| 激情网站五月天| 欧美视频综合| 玖玖视频精品| 亚洲人成网站免费播放| 丰满饥渴老女人hd| 青娱乐极品盛宴一区二区| 国产欧美一区二区精品性| 欧美在线激情视频| 久久久久久九九九九九| 中文字幕乱码在线播放| 一区二区三区久久| caoporen国产精品| 久久免费视频播放| 加勒比视频一区| 婷婷综合另类小说色区| 免费在线成人av| 中文字幕第一页在线播放| 精品久久久久久久| 欧美日韩精品专区| 日韩一级免费看| 午夜视频免费在线| 爽爽淫人综合网网站| 91黄色8090| 在哪里可以看毛片| 免费福利视频一区| 日韩欧美在线一区| 亚洲精品一区二区三区樱花| 国产视频aaa| 亚洲午夜黄色| 国产午夜精品免费一区二区三区 | 综合激情网五月| 开心激情综合| 精品国产乱码久久久久久闺蜜| 日本一区视频在线播放| 亚洲av无码不卡| 婷婷综合亚洲| 亚洲精品美女在线| 国产91色在线观看| 青青草原av在线| 久久综合久久综合亚洲| 国产欧美精品一区二区| 久久免费视频99| 亚洲国产一区二区三区高清| 亚洲亚裔videos黑人hd| 成人免费毛片糖心| 日韩在线观看| 精品中文字幕久久久久久| 亚洲国产日韩欧美在线观看| 丁香花视频在线观看| 欧美激情综合五月色丁香| 视频一区二区在线| 日本美女一级片| 日本欧美一区二区| 国产在线观看精品| 女人十八岁毛片| 欧美va天堂在线| 欧美黑人性猛交| 美女100%露胸无遮挡| 视频亚洲一区二区| 欧美综合亚洲图片综合区| 成人小视频在线观看免费| 国产黄色片在线播放| 国产精品日产欧美久久久久| 国语精品中文字幕| 国产片高清在线观看| 国产a久久麻豆| 国产在线观看精品| 免费a视频在线观看| 久久日韩粉嫩一区二区三区| 亚洲午夜久久久影院伊人| 麻豆av在线播放| 欧洲精品中文字幕| 国产精品91av| 国产日韩一区二区三免费高清| 亚洲美女偷拍久久| 日韩动漫在线观看| а√天堂8资源在线官网| 精品日韩美女的视频高清| 久久国产精品免费观看| 1pondo在线播放免费| 久久久久国产精品免费免费搜索| 国产精品露脸av在线| 黄色片网站在线免费观看| 视频精品一区二区| 国产精品自拍首页| www.久久综合| 国产精品一区一区| 99在线视频播放| 福利视频在线看| 亚洲成av人影院| 男人的天堂狠狠干| 超碰在线cao| 性欧美疯狂xxxxbbbb| 天天色综合社区| 亚洲成人一品| 亚洲天堂av在线播放| 免费一级片在线观看| 国产精品magnet| 午夜精品久久久久久99热软件| 亚洲国产精品午夜在线观看| 国模大胆一区二区三区| 国产精品视频免费在线| 视频一区二区在线播放| 久久综合狠狠综合| av 日韩 人妻 黑人 综合 无码| 中文字幕资源网在线观看| 亚洲精品视频免费观看| 女性女同性aⅴ免费观女性恋 | 久久精品国产99国产| 国产精品69久久| 无码人妻黑人中文字幕| 视频一区二区三区中文字幕| 精品一区二区三区自拍图片区| 久久米奇亚洲| 欧美日韩在线一区| 男人网站在线观看| 影视先锋久久| 国产精品电影一区二区三区| 国产精品极品| 亚洲一区二区三区中文字幕在线| 国产一区精品在线| 亚洲av片在线观看| 亚洲一区二区在线视频| 性高潮久久久久久| 欧美一区国产在线| 51国偷自产一区二区三区的来源| 看片网址国产福利av中文字幕| 欧美亚洲三区| 国产高清在线不卡| 懂色av中文在线| 欧美亚洲国产怡红院影院| 中文字幕在线视频精品| 91成人精品在线| 欧美精品在线极品| 四虎成人在线观看| 国产麻豆9l精品三级站| 欧美日韩亚洲国产成人| 这里有精品可以观看| 日韩成人中文电影| 亚洲综合图片网| 日本一区二区视频在线| 在线观看免费av网址| 农村少妇一区二区三区四区五区| 在线精品播放av| 黄色在线观看免费| 成人精品一区二区三区中文字幕| 亚洲综合色av| 免费国产在线观看| 色噜噜夜夜夜综合网| 2025中文字幕| 国产深夜精品| 亚洲黄色成人久久久| 视频欧美精品| 欧美精品久久一区二区| 在线观看免费观看在线| av午夜精品一区二区三区| 涩涩涩999| 国产精品一区二区三区www| 欧美国产精品va在线观看| 欧美在线精品一区二区三区| 色噜噜久久综合| avtt天堂在线| 麻豆精品久久久| 国产 国语对白 露脸| 精品综合久久88少妇激情| 国产精品高清在线| 亚洲人午夜射精精品日韩| 日本精品视频一区二区| 日本a级片视频| 久久精品水蜜桃av综合天堂| 亚洲天堂网站在线| 日韩在线观看一区 | 91麻豆精品久久久久蜜臀| theav精尽人亡av| 另类综合日韩欧美亚洲| 欧美乱做爰xxxⅹ久久久| 国产99久久| 亲爱的老师9免费观看全集电视剧| 丰满熟女一区二区三区| 中文字幕字幕中文在线中不卡视频| 一级黄色录像免费看| 国产毛片久久久| 国产精品网站大全| 蜜桃视频在线网站| 亚洲福利视频专区| 国产真人真事毛片| 成人激情动漫在线观看| 丁香六月激情网| 日韩欧美一区二区三区免费看| 国产噜噜噜噜久久久久久久久| av在线第一页| 欧美综合色免费| 欧美精品亚洲精品日韩精品| 成人免费视频免费观看| 久热在线视频观看| 久久国产免费| 午夜午夜精品一区二区三区文| 99久久久国产精品免费调教网站| 伊是香蕉大人久久| 无码国产精品高潮久久99| 91精品国产综合久久小美女| 亚洲精品无码久久久久| 国产精品区一区二区三| 精品少妇人妻一区二区黑料社区 | 992tv在线成人免费观看| 成人在线视频亚洲| yellow中文字幕久久| 国产乱淫片视频| 亚洲人成精品久久久久久| 国产老头和老头xxxx×| 久久精品国产**网站演员| 99久久久无码国产精品6| 国产精品一区2区3区| 国产精品揄拍500视频| 老司机2019福利精品视频导航| 精品噜噜噜噜久久久久久久久试看| 国产一级大片在线观看| 亚洲色图.com| 艳妇荡乳欲伦69影片| 福利电影一区二区| 女王人厕视频2ⅴk| 国产精一品亚洲二区在线视频| 国产精品日韩三级| 网曝91综合精品门事件在线| 国产精品96久久久久久| 国模冰冰炮一区二区| 欧美专区在线播放| 欧美1级2级| 欧美成人精品不卡视频在线观看| 天天插天天干天天操| 欧美艳星brazzers| 成人一级免费视频| 在线观看av一区二区| 自拍偷拍色综合| 欧美日韩aaaaaa| 国产男男gay网站| 日韩美女在线视频| 天天爽夜夜爽人人爽| 色呦呦国产精品| 黄色大全在线观看| 欧美美女喷水视频| 国产精品21p| 欧美在线不卡一区| 国产美女精品视频国产| 欧美成人video| 无码国产精品96久久久久| 亚洲色图五月天| 日本视频在线免费观看| 欧美另类极品videosbest最新版本| 国产精品区一区二区三含羞草| 韩国中文字幕在线| 超碰97人人做人人爱少妇| a级网站在线播放| 国语自产精品视频在线看一大j8| 国产富婆一级全黄大片| 色综合久久99| 中文字幕一区二区免费| 日韩一区二区三区观看| 中文字幕人妻精品一区| 4438x亚洲最大成人网| 亚洲国产999| 欧美二区三区91| 国产91免费在线观看| 亚洲乱码一区av黑人高潮 | 婷婷一区二区三区| 日韩电影在线观看一区二区| 欧美日韩一区不卡| 日韩欧美成人一区二区三区 | 国产精品白浆一区二小说| 欧美性猛交xxxxx水多| 一区二区的视频| 日本精品视频一区二区三区| 国产精品无码在线播放| 亚洲电影在线看| 3d成人动漫在线| 午夜精品久久久久久久99热 | 日本中文字幕成人| 日本孕妇大胆孕交无码| 中文字幕亚洲欧美日韩在线不卡| 国产 日韩 欧美 综合| 亚洲天堂免费观看| 伊人在我在线看导航| 国产成人精品电影| 成人性生交大片免费看中文视频| 57pao成人永久免费视频| 神马午夜伦理不卡| 国产精品精品视频| 成人在线视频你懂的| 亚洲一区二区三区免费观看| 日韩一级免费| 无码人妻丰满熟妇区96| 国内精品久久久久久久影视蜜臀 | 日韩欧美极品在线观看| 99久久精品无免国产免费| 一区二区欧美在线| 华人av在线| av成人综合网| 91精品国产自产在线观看永久∴ | 欧美挤奶吃奶水xxxxx| 中文字幕第一页亚洲| 蜜桃在线一区二区三区| 亚洲中文字幕一区| 91在线视频网址| 亚洲av无码国产精品久久| 久久久久久久久久美女| 久久网中文字幕| 91精品久久久久久久99蜜桃| 在线免费观看黄色网址| 国产精国产精品| 欧美三级午夜理伦三级在线观看| 日本免费高清一区二区| 最新日韩欧美| 日韩无码精品一区二区| 亚洲国产精品一区二区www在线| 欧美激情视频二区| 欧美日韩亚洲激情| 亚洲 欧美 自拍偷拍| 78m国产成人精品视频| 黑色丝袜福利片av久久| 97超碰在线人人| 久久久久久久波多野高潮日日| 美女一区二区三区视频| 久久99国产精品久久| 在线播放国产视频| 一区二区三区**美女毛片| 国产又粗又猛又黄又爽无遮挡| 亚洲第一天堂av| av小说在线播放| 国产精品女人网站| 日韩欧美大片| 国产3p在线播放| 亚洲视频一区在线| a天堂在线观看视频| 欧美放荡办公室videos4k| 高清日韩中文字幕| 国产3p露脸普通话对白| 久久在线观看免费| 在线免费一区二区| 日韩视频在线一区| 欧美影院精品| 久久久亚洲精品无码| 卡一卡二国产精品| 北条麻妃在线观看视频| 日韩一区二区三区精品视频| a√中文在线观看| 欧美福利一区二区三区| 亚洲成人三区| 潘金莲一级淫片aaaaaaa| 午夜精品aaa| 国产精品秘入口| 91情侣偷在线精品国产| 欧美日韩123| 成年网站免费在线观看| 亚洲老妇xxxxxx| 视频二区在线观看| 国产精品白嫩美女在线观看| 午夜精品一区二区三区国产| 日本一级大毛片a一 | 91porn在线| 天天做天天摸天天爽国产一区| 国产www视频| 69久久夜色精品国产69乱青草| 麻豆精品久久| 视频在线精品一区| 国产精品69毛片高清亚洲| 蜜乳av中文字幕| 欧美午夜女人视频在线| 午夜国产福利在线| 国产在线精品一区二区中文 | 91亚洲午夜精品久久久久久| 97人妻精品视频一区|