精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

顯著超越SFT,o1/DeepSeek-R1背后秘訣也能用于多模態(tài)大模型了

人工智能
他們將DeepSeek-R1背后的基于規(guī)則獎勵的強化學習方法和OpenAI的強化微調(diào)(Reinforcement Fine-Tuning,RFT)范式,成功從純文本大語言模型拓展到了視覺語言大模型(LVLM)。

o1/DeepSeek-R1背后秘訣也能擴展到多模態(tài)了!

舉個例子,提問多模態(tài)大模型:“什么寶可夢可以釋放技能十萬伏特”時,模型通過推理過程準確找出皮卡丘對應的坐標框,展示出模型的泛化能力。

圖片

這是來自上海交大、上海AI Lab、港中文大學的研究人員推出的視覺強化微調(diào)開源項目——Visual-RFT (Visual Reinforcement Fine-Tuning), 只需10~1000條數(shù)據(jù),就能通過思考過程和基于規(guī)則的監(jiān)督提升多模態(tài)大模型的性能。

圖片

具體來說,他們將DeepSeek-R1背后的基于規(guī)則獎勵的強化學習方法和OpenAI的強化微調(diào)(Reinforcement Fine-Tuning,RFT)范式,成功從純文本大語言模型拓展到了視覺語言大模型(LVLM)。

通過針對視覺的細分類、目標檢測等任務設計對應的規(guī)則獎勵,Visual-RFT打破了DeepSeek-R1方法局限于文本、數(shù)學推理、代碼等少數(shù)領域的認知,為視覺語言模型的訓練開辟了全新路徑。

下面具體來看。

從R1到Visual-RFT:強化學習的多模態(tài)突破

OpenAI o1主打的強化微調(diào)能力(Reinforcement Fine-Tuning)能只用少量樣本就將o1遷移到新的任務上。

最近DeepSeek-R1解釋了o1模型背后的強推理能力來自基于可驗證獎勵(Verified Rewards)/規(guī)則獎勵(Rule-based Verifier)的強化學習策略。

不過,目前主流的認知在于這種基于規(guī)則獎勵的方法只適用于數(shù)學推理、代碼等少數(shù)便于驗證的任務。

而在Visual-RFT中,研究人員將這一策略遷移到了視覺語言模型。

通過對細分類、目標檢測等任務建立對應的可驗證規(guī)則獎勵,研究解決了傳統(tǒng)方法在視覺領域中的局限性,只需少量微調(diào)樣本就實現(xiàn)了更高效、泛化性更強的視覺理解與推理能力。

傳統(tǒng)的視覺指令微調(diào)(Visual Instruction Tuning/Supervised Fine-Tuning,SFT)需要海量數(shù)據(jù)對模型微調(diào),在數(shù)據(jù)量有限(例如某些難以收集數(shù)據(jù)的特定學科場景)的情況下帶來的提升有限。

與之不同,新研究提出的視覺強化微調(diào)(Visual Reinforcement Fine-Tuning)具有少樣本學習能力更強的泛化性,在數(shù)據(jù)量有限的場景下相比指令微調(diào)具有很大的優(yōu)勢。

為驗證Visual-RFT(視覺強化微調(diào))的的泛化能力和普適性,力求對視覺領域的全面覆蓋,研究人員在多個視覺感知任務上對Visual-RFT進行驗證,包含Detection,Classification,Grounding等。

其中,Visual-RFT在open vocabulary,few-shot learning等設定下,僅僅通過非常少量的數(shù)據(jù)就取得了顯著的性能提升,輕松實現(xiàn)能力的遷移,且結(jié)果明顯優(yōu)于SFT的微調(diào)方法

在Reasoning Grounding(推理定位)的測試中,Visual-RFT展現(xiàn)出強大的視覺推理能力。

評測結(jié)果如下圖所示:

圖片

為了在視覺多模態(tài)領域驗證可驗證獎勵的作用,研究人員提出了使用基于IoU的verified reward獎勵應用于detection和grounding等任務,使用基于分類正確判斷的cls reward用于classification任務。

圖片

部分推理定位結(jié)果顯示,通過引入思考過程和強化學習策略,Visual-RFT(多模態(tài)強化微調(diào))顯著超越SFT,更加準確地定位物體。

如詢問模型,圖中的運動員在水下依然保持清晰的視野需要帶什么物體時候,通過傳統(tǒng)指令微調(diào)的方法模型直接將整個運動員框出。

而Visual-RFT通過引入推理過程準確地指出防水眼睛及其所在的位置并準確框出。

圖片

部分推理細粒度分類結(jié)果也展示了相同結(jié)論。

圖片

小結(jié)一下,相比于傳統(tǒng)的視覺指令微調(diào)(Visual Instruction/Supervised Fine-Tuning),Visual-RFT(視覺強化微調(diào))通過強化學習方法,對問題進行深入的think分析取得更佳推理性能,相較于傳統(tǒng)的指令微調(diào)(SFT)方法取得顯著提升。

Visual-RFT實驗結(jié)果

Visual-RFT(視覺強化微調(diào))在各大圖文感知任務中均展現(xiàn)出強大的性能。

實驗主要基于視覺語言大模型基座QWen2-VL 2B/7B模型,和傳統(tǒng)的監(jiān)督微調(diào)(Supervised Fine-Tuning)方法進行對比。

在開放目標檢測、少樣本檢測、細粒度分類和推理定位任務上,Visual-RFT相比SFT全面實現(xiàn)了性能提升。

值得一提的是,該研究的測試數(shù)據(jù)既包含COCO、LVIS等通用場景,又包含從互聯(lián)網(wǎng)中收集的卡通人物等開放場景數(shù)據(jù)。只需要幾十條數(shù)據(jù),模型通過Visual-RFT可以學會檢測某動漫中的史萊姆形象。

實驗結(jié)果廣泛驗證了Visual-RFT的卓越性能和魯棒性。

圖片

目前,包含訓練、評測代碼,數(shù)據(jù)在內(nèi),Visual-RFT項目已全面開源。

項目地址:https://github.com/Liuziyu77/Visual-RFT

責任編輯:武曉燕 來源: 量子位
相關推薦

2025-02-03 14:17:27

2025-03-13 08:13:47

DeepSeekMLLMVision-R1

2025-01-24 15:03:27

2025-04-29 09:06:00

2025-02-19 08:00:00

2025-09-08 09:06:16

2025-03-05 03:00:00

DeepSeek大模型調(diào)優(yōu)

2025-11-19 08:56:42

2024-11-19 15:00:00

模型開源

2025-02-13 08:51:23

DeepSeek大模型

2025-02-06 10:18:45

2025-04-22 09:12:00

AI模型數(shù)據(jù)

2024-11-25 17:23:10

2025-03-10 08:10:00

AI研究安全

2025-06-25 08:54:03

模型訓練AI

2025-02-08 14:03:25

2025-02-08 10:42:34

點贊
收藏

51CTO技術棧公眾號

亚洲 欧美 视频| 一区二区三区视频网| 亚洲色图狠狠干| 日韩影院免费视频| 久久精品成人欧美大片| 亚洲美女在线播放| 日韩一级二级| 亚洲最大成人网4388xx| 日韩av电影免费观看| 国产视频第二页| 久久综合狠狠| 欧美情侣性视频| 538精品视频| 欧美激情视频免费看| 欧美日韩偷拍视频| 国产日产精品一区二区三区四区的观看方式| 欧美日韩在线精品一区二区三区激情| 嫩草影院中文字幕| 五月天婷婷在线视频| 成人黄色在线视频| 92福利视频午夜1000合集在线观看| 国产精品111| **女人18毛片一区二区| 亚洲日韩第一页| 久久人妻少妇嫩草av蜜桃| 日韩一区精品| 色偷偷88欧美精品久久久| 国产精品一色哟哟| av中文字幕在线观看| 日本一区二区免费在线观看视频| 国内精品二区| 国产黄色av片| 理论片日本一区| 国产97免费视| 黑人一级大毛片| 激情丁香综合| 欧美激情视频一区二区| 卡通动漫亚洲综合| 91亚洲国产成人久久精品| 亚洲色图综合网| 久久久久中文字幕2018| 成年网站在线播放| 亚洲人成午夜免电影费观看| 亚洲国产精品天堂| 国产精品videossex国产高清| 免费网站看v片在线a| 国产精品人人做人人爽人人添| 欧美裸体网站| 九色在线观看视频| 久久久久国产一区二区三区四区| 麻豆亚洲一区| 丰满少妇被猛烈进入| 国产成人午夜片在线观看高清观看| 国产精品美女午夜av| 国产精品xxxxxx| 日本免费新一区视频| 国产成人鲁鲁免费视频a| 中文字字幕在线中文| 久久综合图片| 国产精品jizz在线观看麻豆| 天堂网一区二区| 热久久久久久久| 国产精品视频久久久久| 国产有码在线观看| 国产精品一卡二| 国产精品高清一区二区三区| 免费观看国产视频| 26uuuu精品一区二区| 欧美一区二区在线视频观看| 国产精品一区在线看| 色av手机在线| 成人免费av网站| 国产区欧美区日韩区| 亚洲区小说区图片区| 久久久精品中文字幕麻豆发布| 欧美三级电影在线播放| 91社区在线观看| 亚洲精品国产品国语在线app| 欧美人与动牲交xxxxbbbb| heyzo高清在线| 国产一区二区美女诱惑| 国产精品亚洲一区二区三区| 午夜久久久久久久久久影院| 蜜臀av性久久久久蜜臀aⅴ流畅| 国产精品久久97| 国产精品免费无遮挡| 国产风韵犹存在线视精品| 国产不卡一区二区三区在线观看| 手机av在线免费观看| 久久色在线视频| 亚州欧美一区三区三区在线 | 日韩国产在线一| 国产精品视频内| 国产黄色av片| www欧美成人18+| 在线观看欧美亚洲| 婷婷色在线播放| 久草在线新免费首页资源站| 狠狠色丁香婷婷综合| 成人欧美一区二区三区视频xxx| 人成网站在线观看| 欧美国产97人人爽人人喊| 一区二区三区在线观看www| 免费污视频在线| 在线精品视频一区二区三四| 欧美视频亚洲图片| 日本亚洲不卡| xxx欧美精品| 精品欧美一区二区三区免费观看| 麻豆精品在线观看| 国产精品视频免费观看| 成人在线二区| 午夜私人影院久久久久| 黄色在线视频网| 高清精品xnxxcom| 精品国产一区二区三区久久久狼| 日韩字幕在线观看| 激情五月激情综合网| 九9re精品视频在线观看re6| 国产一区久久精品| 日韩欧美中文第一页| 巨乳女教师的诱惑| 精品国精品国产自在久国产应用| 欧美激情性做爰免费视频| 亚洲 小说区 图片区| av一区二区不卡| 黑人巨茎大战欧美白妇| 欧美国产日韩电影| 日韩久久免费电影| 国产一级片免费| 久草热8精品视频在线观看| 欧美激情论坛| sis001亚洲原创区| 欧美一区三区四区| 中国1级黄色片| 久久婷婷av| 久久av免费观看| 色老头在线观看| 欧美一区二区在线播放| 中文字幕精品亚洲| 日韩国产欧美视频| 欧美一级二级三级| 麻豆mv在线看| 欧美tickling网站挠脚心| 亚洲伊人久久综合| av黄色免费网站| 日韩午夜黄色| 国产有色视频色综合| 污视频网站免费在线观看| 777精品伊人久久久久大香线蕉| 久久亚洲无码视频| 日韩专区中文字幕一区二区| 免费亚洲精品视频| 蜜桃视频在线网站| 亚洲精品日韩欧美| 国产99久久久| 久久综合色一综合色88| 国产最新免费视频| 蜜臀久久99精品久久一区二区| 2019中文字幕在线免费观看| 亚洲成人777777| 一个色综合网站| 日本一区二区在线观看视频| 亚洲国产精品一区| 久久国产精品亚洲va麻豆| 一个人看的www视频在线免费观看| 日韩精品电影网| 日韩精品一区二区亚洲av| 久久久久久久久久美女| 在线观看的毛片| 欧美成人自拍| 99热在线国产| 九色porny自拍视频在线播放| 日韩精品久久久久久久玫瑰园| 国产成人无码av| 中文字幕免费观看一区| 亚洲一区二区福利视频| 中文字幕一区二区三区欧美日韩| 97超级碰碰| 女人让男人操自己视频在线观看| 亚洲男人第一网站| 中文字幕一区二区在线视频| 中文字幕综合网| 亚洲午夜久久久久久久久| 模特精品在线| 中文字幕精品一区日韩| 99re6热只有精品免费观看| 性色av一区二区三区| 97成人在线观看视频| 网友自拍视频在线| 日韩精品一区二区三区视频 | 久久久久久久久久久9不雅视频| 91沈先生在线观看| 国产福利电影在线播放| 亚洲无限av看| 亚洲va欧美va| 色综合色狠狠综合色| 男人的午夜天堂| 99精品视频一区| 校园春色 亚洲色图| 国产精品大片免费观看| 欧美一区二区三区在线播放| 久久天堂久久| 国产不卡一区二区在线播放| 91网在线看| 亚洲欧洲国产一区| 精品久久人妻av中文字幕| 色呦呦日韩精品| 超碰手机在线观看| 久久精品欧美日韩| 免费在线观看日韩av| 日韩**一区毛片| 蜜臀av无码一区二区三区| 久久在线电影| 欧美激情第六页| 中文字幕亚洲在线观看| 国产精品日韩在线| 美女高潮在线观看| 欧美成人一二三| www免费网站在线观看| 精品欧美一区二区在线观看| 一区二区国产欧美| 在线观看亚洲精品| 真人做人试看60分钟免费| 国产免费黄色录像| 亚洲图片欧美视频| 性欧美videos| 国产精品欧美精品| 青青草成人免费视频| 成人一区在线观看| 图片区乱熟图片区亚洲| 男女性色大片免费观看一区二区| 国产特级淫片高清视频| 欧美三级免费| 午夜啪啪福利视频| 婷婷丁香综合| 亚洲一区二区精品在线| 国产成人手机高清在线观看网站| 国产精品区一区二区三在线播放| 欧洲一区在线| 91久久综合亚洲鲁鲁五月天| 色999久久久精品人人澡69 | 秋霞国产精品| 97视频在线免费观看| 在线免费观看a视频| 操人视频在线观看欧美| 欧美a免费在线| www.欧美免费| 欧美边添边摸边做边爱免费| 日韩最新av在线| 日本蜜桃在线观看| 日韩三级影视基地| 香蕉视频网站在线观看| 中文字幕一区二区三区电影| 三区四区电影在线观看| 日韩中文字幕在线视频| 在线免费av电影| 俺也去精品视频在线观看| 在线观看麻豆蜜桃| 久久激情五月丁香伊人| sm国产在线调教视频| 九九久久精品一区| 欧美高清另类hdvideosexjaⅴ| 九九九久久久久久| 国产99在线观看| 欧美做爰性生交视频| 极品日韩久久| 成人国产一区二区三区精品麻豆| 国产精品欧美一区二区三区奶水| 另类中文字幕国产精品| 国产免费一区二区三区在线观看 | 国产一区二区视频在线观看| 久久99久久久精品欧美| 亚洲一区二区在线播放| 97久久综合区小说区图片区| 国产一区免费在线| 精品国产乱码久久久久久1区2匹 | 在线精品福利| 亚洲精品无码久久久久久| 日韩精品免费视频人成| 欧美成人手机在线视频| 成人高清视频在线| 黄色aaa视频| 国产精品久久久久久久浪潮网站 | 欧美视频在线免费| 最近日韩免费视频| 欧美一区二区视频免费观看| 丰满少妇一级片| 国产亚洲精品美女| av在线free| 欧美综合国产精品久久丁香| 欧美激情不卡| 好吊色欧美一区二区三区四区| 精品一区二区三区的国产在线观看| av动漫免费观看| 亚洲三级毛片| 自拍偷拍21p| 成人av一区二区三区| 欧美 日韩 国产 成人 在线观看| 亚洲欧美成人一区二区三区| 800av免费在线观看| 欧美日本在线一区| 天天色天天操天天射| 日韩中文字幕在线看| 免费v片在线观看| 成人精品视频99在线观看免费| 日本成人在线免费视频| 99在线观看免费视频精品观看| 成人亚洲精品777777大片| 国产福利一区二区三区视频在线 | 中文字幕高清一区| 日本免费在线播放| 欧美老女人在线| 日本一本草久在线中文| 九九精品在线播放| 日本一区二区中文字幕| 精品无人区一区二区三区 | 亚洲ww精品| 久久精品一区二区三区不卡免费视频| 天天综合一区| 99免费视频观看| 99在线热播精品免费| 国产成人久久久久| 欧美色国产精品| 免费人成黄页在线观看忧物| 欧美激情亚洲自拍| 精品国产亚洲一区二区三区在线 | 欧美视频免费在线观看| www.av黄色| 久久久精品一区二区三区| 69堂免费精品视频在线播放| 精品一区二区视频| 日韩一级不卡| 天堂www中文在线资源| 一区二区在线看| 国产乱码精品一区二区三区精东| 亚洲三级av在线| 性欧美freesex顶级少妇| 国产精品一区二区三区四区五区| 在线成人直播| 免费欧美一级片| 成人欧美一区二区三区1314| 亚洲专区第一页| 中文字幕欧美国内| 国产一区二区三区影视| 亚洲电影网站| 久久国产乱子精品免费女| 色屁屁草草影院ccyy.com| 在线观看av不卡| 精品欧美不卡一区二区在线观看 | 性无码专区无码| 亚洲国产欧美日韩精品| 96av在线| 精品国产一区二区三区日日嗨| 亚洲乱码视频| 日本一卡二卡在线| 欧美性猛交xxxx黑人猛交| 三区在线视频| 国产精品99久久久久久www| 污视频在线观看免费网站| 成人三级在线视频| 日本三级午夜理伦三级三| 亚洲国产成人精品电影| 免费看男女www网站入口在线| 久久久亚洲综合网站| 久久影院亚洲| 日韩一区二区三区四区视频| 欧美精品精品一区| 青草av在线| 国内精品**久久毛片app| 免费视频久久| 大胸美女被爆操| 欧美一区二区三区视频免费播放| 免费av不卡在线观看| 精品在线不卡| 美女网站视频久久| 欧美黄色aaa| 337p日本欧洲亚洲大胆精品| 成人免费影院| 伊人婷婷久久| 成人视屏免费看| 综合网在线观看| www国产91| 国产suv精品一区二区四区视频| 日本www在线播放| 国产欧美日韩中文久久| 国产suv精品一区二区69| 91精品国产高清自在线| 成人女性视频| 绯色av蜜臀vs少妇| 色噜噜狠狠成人中文综合| 美女写真理伦片在线看| 91精品国产自产在线老师啪| 亚洲国产一区二区三区a毛片| 最近中文字幕在线mv视频在线 | 黄色aaa级片| 亚洲激情五月婷婷| 青青草视频在线观看| 91视频免费在线| 亚洲综合电影一区二区三区|