精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

北航推出全開源TinyLLaVA-Video-R1,小尺寸模型在通用視頻問答數據上也能復現(xiàn)Aha Moment!

人工智能 新聞
近日,北京航空航天大學的研究團隊推出小尺寸視頻推理模型 TinyLLaVA-Video-R1,其模型權重、代碼以及訓練數據全部開源!

當前,基于強化學習提升多模態(tài)模型的推理能力已經取得一定的進展。但大多研究者們選擇 7B+ 的模型作為基座,這對于許多資源有限的科研人員而言仍存在顯著的門檻。

同時,在視頻推理領域,由于高質量強推理性數據較為稀少,通用問答數據較難激發(fā)模型的深層次邏輯推理能力,因此先前一些初步嘗試的效果大多不盡如人意。

近日,北京航空航天大學的研究團隊推出小尺寸視頻推理模型 TinyLLaVA-Video-R1,其模型權重、代碼以及訓練數據全部開源!

該工作驗證了小尺寸模型在通用問答數據集上進行強化學習也能有不錯的效果,與使用相同數據進行監(jiān)督微調的模型相比,TinyLLaVA-Video-R1 在多個 benchmark 上都有性能提升。同時,模型還能在訓練與測試的過程中多次展現(xiàn)自我反思與回溯行為!

圖片

  • 論文標題:TinyLLaVA-Video-R1: Towards Smaller LMMs for Video Reasoning
  • 論文地址:https://arxiv.org/abs/2504.09641
  • Github:https://github.com/ZhangXJ199/TinyLLaVA-Video-R1

在推特上,HuggingFace AK 也連續(xù)兩次轉發(fā)推薦了這篇文章:

圖片

為什么選擇 TinyLLaVA-Video 作為 Base Model?

圖片

圖表 1 TinyLLaVA-Video 整體框架

雖然現(xiàn)有的開源視頻理解模型基座具有強大的理解與感知能力,但由于其訓練數據不透明,使用開源視頻數據進行后訓練可能會引入不可控的變量,從而影響實驗結果和結論的可靠性。

因此,北航團隊選擇訓練過程完全可溯源的 TinyLLaVA-Video 作為 Base Model,該模型采用 Qwen2.5-3B 作為語言模型,SigLIP 作為視覺編碼器。雖然 TinyLLaVA-Video 僅有 3.6B 的參數,且在預訓練階段為了控制訓練時長并未使用大量數據,但其仍能在多個 Benchmark 上能夠優(yōu)于現(xiàn)有的多個 7B+ 模型。

TinyLLaVA-Video-R1 主要做了什么?

引入少量人工標注的高質量冷啟動數據

該工作發(fā)現(xiàn),受限于小尺寸模型的能力,當直接使用 TinyLLaVA-Video 作為基礎模型,隨著訓練的進行,模型有一定的概率學會「偷懶」,所有的響應雖然符合格式要求,但并不給出思考過程,響應均為<think> </think> <answer> option </answer>,同時在 Qwen2-VL-2B 上進行實驗也得到相似的實驗現(xiàn)象。

而當使用人工標注的 16 條 CoT 數據為模型進行冷啟動后,在實驗的過程中就不再出現(xiàn)這樣的現(xiàn)象,同時,模型也將更快學會遵守格式要求。因此該工作認為,冷啟動對于小尺寸模型推理是必要的,即使是極少量的冷啟動數據,對于穩(wěn)定模型訓練也是很有幫助的。

引入長度獎勵與答案錯誤懲罰

現(xiàn)有的許多推理工作僅僅設置格式獎勵而沒有添加長度獎勵,但受限于小尺寸語言模型的能力,在這種設置下進行訓練并不會使模型的響應長度增加,甚至出現(xiàn)一點下降。

在引入連續(xù)長度獎勵后,模型的響應長度在訓練過程中顯著增加,如圖所示。然而在這種設置下,模型為了增加響應長度而進行了一些無意義的推理,這不僅沒有提高性能,反而導致訓練時間顯著增加。

圖片

因此,TinyLLaVA-Video-R1 進一步將答案錯誤懲罰納入總獎勵,觀察到模型響應的質量有所提升,并且在整個訓練過程中輸出長度和獎勵也能夠保持增長。

為 GRPO 的優(yōu)勢計算引入微小噪聲

同時,TinyLLaVA-Video-R1 在實驗中也觀察到了優(yōu)勢消失的問題:當集合中的所有響應都是正確的,并且給予相同的獎勵時,它們計算出的優(yōu)勢會消失到零。這一現(xiàn)象影響了策略更新,降低了樣本效率。為了最大化對每個樣本的利用,TinyLLaVA-Video-R1 在優(yōu)勢計算時引入了額外的高斯噪聲圖片,盡管這種噪聲僅引起輕微的擾動,但它能夠確保組內響應優(yōu)勢的多樣性。

實驗結果

圖片

首先,TinyLLaVA-Video-R1 驗證了使用強化學習能夠明顯提升模型性能,與使用相同數據進行監(jiān)督微調的 TinyLLaVA-Video-SFT 相比,TinyLLaVA-Video-R1 在多個 benchmark 中均有更佳的表現(xiàn)。

圖片

同時,TinyLLaVA-Video-R1 能夠理解和分析視頻內容,逐步評估每個選項,并最終給出答案。與僅輸出最終答案的模型相比,該模型能夠生成有意義的思考過程,使其回答更加可解釋且有價值。這也是視頻推理模型相對于傳統(tǒng)視頻理解模型的重要提升與優(yōu)勢。

圖片

與其他使用強化學習提升模型推理能力的工作相似,北航團隊也在 TinyLLaVA-Video-R1 上復現(xiàn)了「Aha Moment」,即模型在思考的過程中引發(fā)緊急驗證等行為。實驗結果也驗證了,即使使用弱推理的通用視頻數據對小尺寸模型進行訓練,也能夠引發(fā)模型的回溯與自我反思。

后續(xù),北航團隊也將進一步研究小尺寸視頻推理模型,未來工作將包括引入高質量視頻推理數據與強化學習算法改進。

同時,TinyLLaVA 系列項目也始終致力于在有限計算資源下研究小尺寸模型的訓練與設計空間,堅持完全開源原則,完整公開模型權重、源代碼及訓練數據,為資源有限的研究者們理解與探索多模態(tài)模型提供平臺。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-10 14:30:00

模型數據開源

2025-02-18 10:54:04

2025-04-03 15:46:53

2024-02-04 07:20:00

AI模型

2025-08-25 08:45:00

模型代碼開源

2025-02-11 16:11:12

2025-04-15 09:22:00

AI訓練模型

2025-02-13 09:10:00

2024-07-30 10:51:51

2025-04-16 15:28:31

模型AI數據

2024-12-18 15:02:48

2025-04-02 09:00:00

模型開源AI

2020-01-07 14:37:59

代碼開發(fā)AI

2025-02-11 09:17:57

2024-07-22 07:10:00

小模型機器學習蘋果

2025-04-09 09:15:00

數據模型AI

2011-03-08 15:08:29

羅技科技高清視頻串流

2023-05-15 09:43:49

模型數據

2025-06-25 08:54:03

模型訓練AI

2025-02-20 15:32:28

點贊
收藏

51CTO技術棧公眾號

精品国产_亚洲人成在线| 精品少妇v888av| 日本男人操女人| jizz在线观看| 国产综合成人久久大片91| 久久精品国产成人| 美女黄色一级视频| 成人av集中营| 亚洲成人资源网| 日韩精品一区二区三区色偷偷| 国产精品久久777777换脸| 亚洲黄色影院| 日韩一区二区三区国产| 无码一区二区精品| 青青国产精品| 欧美日韩午夜剧场| 天堂av在线中文| 国产三级在线观看| 国产不卡在线播放| 国产精品人成电影在线观看| 精品肉丝脚一区二区三区| 国内黄色精品| 精品福利一二区| 欧美美女性视频| 日韩大片免费观看| 亚洲激情在线播放| 亚洲一区三区| 欧洲天堂在线观看| 成年人网站91| 91在线中文字幕| 真实的国产乱xxxx在线91| 伊人成人在线| 欧美人与物videos| 亚洲人与黑人屁股眼交| 九九综合九九| 亚洲国产精久久久久久 | 国产在线看一区| 日韩免费在线免费观看| 国产情侣在线视频| 亚洲国产片色| 国内精品久久久久久久| 看片网站在线观看| 91不卡在线观看| 最近日韩中文字幕中文| av电影网站在线观看| 日韩美女国产精品| 亚洲精品av在线| 久久精品女同亚洲女同13| 91午夜精品| 欧美成人一级视频| 国产男女无遮挡猛进猛出| 日本久久二区| 欧美日本在线看| 超碰超碰在线观看| jizzjizz少妇亚洲水多| 在线观看国产91| 国产精品人人妻人人爽人人牛| 丁香花在线电影小说观看| 亚洲一区二区三区在线看| 国产精品久久久久久久久电影网| 丝袜综合欧美| 午夜激情久久久| 日本福利视频在线| 亚洲风情在线资源| 欧美在线免费播放| 天天操,天天操| 亚洲一区有码| 精品国产一区二区三区久久影院| 日本人妻一区二区三区| 国内精品偷拍| 亚洲男人天堂视频| 国产调教在线观看| 亚洲国产不卡| 久久久久久久久久久免费精品 | 欧美日韩精品中文字幕| 日韩av黄色网址| 日韩电影免费观| 欧美色国产精品| 欧美污在线观看| 国产劲爆久久| 亚洲欧美日韩天堂| www.4hu95.com四虎| 99久久夜色精品国产亚洲96| 欧美成年人视频网站欧美| 国产无遮挡又黄又爽又色| 在线一区视频| 国产精品久久久久久久久久三级 | 精品国产一区二区三| 国产视频第一页在线观看| 亚洲欧洲日产国码二区| 国产毛片久久久久久国产毛片| 伊人久久国产| 91麻豆精品国产91久久久| 折磨小男生性器羞耻的故事| 久草成人资源| 久久天堂电影网| 日本高清www免费视频| 日本不卡一区二区三区| 99re国产| 国产精品久久久久久久龚玥菲 | 亚洲毛茸茸少妇高潮呻吟| 少妇太紧太爽又黄又硬又爽小说| 欧美久久成人| 国产精品热视频| 少妇人妻偷人精品一区二区 | 精品国产麻豆免费人成网站| b站大片免费直播| 你懂的国产精品| 国产精品91一区| 亚洲黄色在线观看视频| 国产欧美一区二区在线| www.射射射| 日韩三级一区| 亚洲天堂第二页| 国产亚洲成人av| 理论片日本一区| 明星裸体视频一区二区| 欧美精品videosex| 欧美日韩中文字幕一区二区| 亚洲中文字幕无码av| 国产精品久久久久9999赢消| 国产精品成人观看视频国产奇米| 亚洲精品911| 亚洲欧美激情在线| 网站一区二区三区| 蜜乳av综合| 91高清免费在线观看| 精品国产亚洲一区二区麻豆| 亚洲国产精品黑人久久久| 国产黄页在线观看| 2020最新国产精品| 久久在精品线影院精品国产| 一级片在线免费播放| a级高清视频欧美日韩| 特级西西人体www高清大胆| 福利一区二区| 亚洲三级黄色在线观看| 天海翼一区二区| 成人污污视频在线观看| 91嫩草国产丨精品入口麻豆| 午夜精品久久久久久毛片| 国产一区二区精品丝袜| 日韩免费av网站| 91蜜桃免费观看视频| 国产a级片网站| 超碰一区二区三区| 欧美黑人xxxⅹ高潮交| 国产手机精品视频| 亚洲视频1区2区| 日韩va在线观看| 999视频精品| 91精品视频免费看| 中日韩高清电影网| 日韩欧美国产小视频| 午夜国产小视频| 极品销魂美女一区二区三区| 亚洲一区二区三区精品在线观看| 国产乱子精品一区二区在线观看| 色噜噜狠狠狠综合曰曰曰88av| 国产精品51麻豆cm传媒| 国产精品久久久久久久第一福利| 天天干天天综合| 99精品美女| 丁香婷婷久久久综合精品国产| 日本一级理论片在线大全| 精品久久人人做人人爰| 日操夜操天天操| 2022国产精品视频| 浓精h攵女乱爱av| 911久久香蕉国产线看观看| 亚洲xxxxx电影| 暧暧视频在线免费观看| 亚洲精品久久久久久久久久久| 中文字幕在线观看视频网站| 久久免费视频一区| 国产无遮挡猛进猛出免费软件 | 97精品久久久午夜一区二区三区| 各处沟厕大尺度偷拍女厕嘘嘘| 久久99国产成人小视频| 国产精品入口日韩视频大尺度| 国产三区视频在线观看| 亚洲第一偷拍网| 国产免费a视频| 亚洲欧洲成人自拍| 少妇搡bbbb搡bbb搡打电话| 国产精品视频| 久久久国产精华液999999| 草莓视频一区二区三区| 国产成人精品免费久久久久| caoporm免费视频在线| 日韩av在线免费| 在线免费a视频| 亚洲香肠在线观看| 精品一区二区三区蜜桃在线| 国产精品18久久久| 欧美日韩亚洲一二三| 91精品一区二区三区综合在线爱| 国产一区二区免费在线观看| 欧美日韩尤物久久| 欧美日韩国产二区| av男人的天堂在线| 亚洲第一中文字幕在线观看| 中文在线观看免费高清| 亚洲午夜精品一区二区三区他趣| 一区二区三区久久久久| 国产成人aaaa| www.com操| 国产精品免费看| 黄色特一级视频| 不卡日本视频| 久久久久久国产精品免费免费| 久久69av| 国产精品一香蕉国产线看观看| 白白色在线观看| 草民午夜欧美限制a级福利片| 青青草免费在线视频| 日韩一区二区精品在线观看| 婷婷激情五月综合| 图片区小说区国产精品视频| 放荡的美妇在线播放| 国产亚洲综合色| 黄色免费看视频| 久久99国产精品免费| 久久久久久久片| 亚洲一区欧美激情| 免费特级黄色片| 午夜天堂精品久久久久| 亚洲欧美日韩不卡一区二区三区| 日韩在线影视| 国产日韩欧美二区| 亚洲综合影院| 3d精品h动漫啪啪一区二区| 国产一区高清| 国产成人综合亚洲| 亚洲综合在线电影| 日本精品视频在线| 日韩影院在线| 96精品视频在线| 大桥未久在线视频| 亚洲91精品在线观看| 伦理av在线| 欧美精品videosex性欧美| 亚洲91av| 欧美激情一区二区三区高清视频| 成人在线视频亚洲| 久久亚洲影音av资源网| 黄色网址视频在线观看| 日韩网站免费观看高清| 日韩精品黄色| 日韩一区av在线| 黄色一级片在线观看| www.日韩av.com| 午夜在线视频| 欧美成年人网站| 黄色小说在线播放| 97碰在线观看| 小早川怜子影音先锋在线观看| 欧美亚洲视频在线看网址| 电影一区二区三| 国产福利精品av综合导导航| 亚洲第一会所| 成人欧美在线观看| 午夜视频在线观看精品中文| 国产高清精品一区二区| 久久97精品| 麻豆成人av| 日韩国产欧美| 欧美 国产 精品| 亚洲视屏一区| 成年人免费大片| 久久精品国产秦先生| 久久精品一二三四| 99国产精品久久久久| 人妻av无码一区二区三区 | 日韩视频中文字幕在线观看| 亚洲精品综合在线| 国产性xxxx高清| 欧美日韩久久一区| www.久久久久久| 日韩国产精品视频| 国产视频精选在线| 九九九热精品免费视频观看网站| 国产精品一品| 国产精品福利网站| 日韩精品一区二区三区中文字幕 | 99久久久久国产精品| 日本成人在线不卡| 久久不射2019中文字幕| 国产成人美女视频| 成人18视频在线播放| 香蕉久久久久久久| 亚洲国产精品欧美一二99| www.com国产| 91精品国产入口| 涩涩视频在线观看免费| www.国产精品一二区| 91丝袜在线| 国产日韩精品一区二区| 国内精品偷拍| aaa免费在线观看| 亚洲伊人观看| 色综合久久久无码中文字幕波多| 久久久精品影视| 欧美极品视频在线观看| 欧美综合一区二区三区| 亚洲国产剧情在线观看| 日韩中文字幕视频在线观看| 中国色在线日|韩| 99在线免费观看视频| 热久久天天拍国产| 2019日韩中文字幕mv| 精品写真视频在线观看| 亚洲久久久久久久| 亚洲成人免费电影| wwwxxxx国产| 日韩亚洲精品电影| 日韩精品99| 好看的日韩精品视频在线| 亚洲xxx拳头交| 好男人www社区| 91污片在线观看| 精品在线视频观看| 欧美一区二区三区电影| 3d成人动漫在线| 国产99久久久欧美黑人| 国产乱人伦精品一区| 一二三在线视频| 久久国产欧美日韩精品| 黄色片网站免费| 91国产精品成人| 色久视频在线播放| 97香蕉久久超级碰碰高清版| 亚洲一区二区三区免费| 青青草综合视频| 国产一区二区三区美女| 亚洲人做受高潮| 欧美日韩视频在线一区二区| www在线免费观看| 国产不卡av在线免费观看| 九一精品国产| 女性隐私黄www网站视频| 91麻豆免费看片| av中文在线播放| 日韩精品视频观看| 九色porny丨首页入口在线| 国偷自产av一区二区三区小尤奈| 激情综合在线| 久久人人爽人人人人片| 精品国产91久久久久久老师| 亚洲人成色777777精品音频| 韩国精品美女www爽爽爽视频| 红杏aⅴ成人免费视频| 久艹视频在线免费观看| 99国产麻豆精品| 久久精品视频1| 一本一本久久a久久精品综合小说| 先锋欧美三级| 亚洲永久激情精品| 国产一区二区三区免费播放| 九九热这里有精品视频| 欧美成人精品1314www| 欧美gv在线| 欧美12av| 久久99精品一区二区三区| 91麻豆精品成人一区二区| 欧美一区二区成人6969| 免费在线看电影| 久久天天狠狠| 日本午夜精品视频在线观看 | 亚洲一区国产视频| 熟妇人妻中文av无码| 日韩**中文字幕毛片| 水蜜桃精品av一区二区| 日本少妇一级片| 懂色av中文一区二区三区天美 | 国产suv精品一区二区四区视频| 日本少妇高潮喷水视频| 国产婷婷色一区二区三区四区| 在线亚洲欧美日韩| 欧美激情精品久久久久久蜜臀| 欧美五码在线| 一区二区三区视频网| 亚洲一区影音先锋| 大乳在线免费观看| 91传媒视频免费| 久久精品国语| 91高清免费观看| 日韩精品中文字幕视频在线| 久久免费影院| 久久久久久久午夜| 国产精品久久久久久久蜜臀| www.五月婷婷| 国产精品午夜视频| 在线成人www免费观看视频| 手机看片日韩av| 精品91自产拍在线观看一区| 九九热这里有精品| 国产亚洲黄色片| 国产精品久久三| 偷拍自拍在线|