精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

7B超越GPT!1/20數(shù)據(jù),無需知識蒸餾,馬里蘭等推出全新視覺推理方法

人工智能 新聞
通過蒙特卡洛樹 搜索篩選高難度樣本,ThinkLite-VL僅用少量數(shù)據(jù)就能顯著提升視覺語言模型的推理能力,無需知識蒸餾,為高效訓(xùn)練提供了新思路。

在大模型時代,視覺語言模型(Vision-Language Models, VLMs)正在從感知走向推理。在諸如圖像問答、圖表理解、科學(xué)推理等任務(wù)中,VLM不再只需要「看見」和「描述」,而是要能「看懂」和「想清楚」。

然而,當(dāng)前主流的推理能力提升方法普遍存在兩個問題:

1. 訓(xùn)練樣本質(zhì)量參差不齊:常見的數(shù)據(jù)集雖然體量龐大,但真正「有挑戰(zhàn)性」的樣本比例較低。

2. 過度依賴知識蒸餾:許多模型在訓(xùn)練時依賴大型模型(如GPT-4o)的推理過程作為教師信號,使得訓(xùn)練流程復(fù)雜且難以推廣。

這使得訓(xùn)練一個高性能的VLM成本極高,也限制了模型的自主學(xué)習(xí)能力。

能否通過自我提升,訓(xùn)練出高性能的推理模型?

近日,來自馬里蘭大學(xué),密歇根大學(xué),和微軟的團隊聯(lián)合提出了ThinkLite-VL模型試圖打破這種依賴,探索「數(shù)據(jù)更少、能力更強」的可能性。

圖片

論文鏈接:https://arxiv.org/pdf/2504.07934

GitHub項目:https://github.com/si0wang/ThinkLite-VL

Hugging Face:https://huggingface.co/russwang/ThinkLite-VL-7B

論文主要關(guān)注一個核心問題:如果不給VLM額外的「教師指導(dǎo)」(如知識蒸餾),能否僅通過自身的反饋機制和強化學(xué)習(xí)訓(xùn)練,獲得強大的推理能力?

直覺上,答案是肯定的:人類也可以通過不斷嘗試、失敗和總結(jié)來提升自己的推理能力。但對模型而言,這需要我們解決一個關(guān)鍵挑戰(zhàn)——如何準(zhǔn)確判斷哪些訓(xùn)練樣本是「值得學(xué)」的?

圖片

用MCTS判斷「樣本難度」,篩選高質(zhì)量訓(xùn)練集

ThinkLite-VL的最大創(chuàng)新在于:用蒙特卡洛樹搜索(Monte Carlo Tree Search, MCTS)來重新定義「樣本難度」。

研究人員首先從廣泛使用的開源多模態(tài)訓(xùn)練數(shù)據(jù)集中收集了70k的樣本,涵蓋了三個關(guān)鍵的視覺任務(wù):數(shù)學(xué)推理,自然圖像理解和圖表理解,具體的數(shù)據(jù)分布和來源如下表所示。

圖片

值得注意的是,為了避免大模型在回答過程中因為選擇題選項中提供了正確答案而「蒙對」,研究人員將大部分的樣本從選擇題格式改成了開放問答格式,這樣一來模型就必須依靠自身的推理能力真正理解題目并解決問題,真正的把題做對。

之后,研究人員提出了一種基于蒙特卡洛樹搜索(MCTS)的樣本選擇方式。

具體來說,大模型將問題和圖像作為輸入,讓模型通過蒙特卡洛樹搜索進行一步步推理,然后記錄模型需要通過多少次推理迭代才能得到正確答案。模型所需要的MCTS迭代次數(shù)越多,說明模型需要通過更多的探索和思考才能解決問題,表明該問題對于模型來說更難。

整個過程中,只使用了VLM本身的LLM部分判斷MCTS final answer的正確與否,模型通過解題成功的探索次數(shù)認(rèn)識到哪些題是「難題」,并將其作為學(xué)習(xí)重點。

在對所有的樣本都進行MCTS之后,作者最終篩選出迭代次數(shù)大于5或在50次迭代內(nèi)模型都無法解決的樣本,總共11k,作為最終的訓(xùn)練集。

圖片

強化學(xué)習(xí)訓(xùn)練:少樣本+困難樣本,推理效果更強

研究人員基于Qwen2.5-VL-7B-Instruct,在選出的11k樣本上使用GRPO進行了強化學(xué)習(xí)訓(xùn)練,得到了最終的模型 ThinkLite-VL-7B。相比于其他reasoning model來說,ThinkLite-VL-7B大大減少了訓(xùn)練數(shù)據(jù)量,并且沒有蒸餾任何外部推理模型的知識。

圖片

在八個主流視覺推理任務(wù)上進行測試,包括MathVista, MathVerse, MathVision,MMMU,MMStar, MMVet, MMBench和AI2D, 結(jié)果發(fā)現(xiàn)ThinkLite-VL-7B的平均性能相比base model Qwen2.5-VL-7B-Instruct提升了7%,從59.69 提高到 63.89,并且顯著優(yōu)于使用隨機采樣選擇相同大小數(shù)據(jù)量進行強化學(xué)習(xí)訓(xùn)練的模型。

此外,相比7B級別的其他reasoning VLM,ThinkLite-VL-7B同樣具有明顯優(yōu)勢,包括OpenVLThinker-7B,MM-Eureka-Qwen-7B等。

特別地,在MathVista上ThinkLite-VL-7B達(dá)到了75.1的SoTA準(zhǔn)確率,超過了GPT-4o和o1等閉源模型和Qwen2.5-VL-72B等開源更大參數(shù)量的模型。

圖片

圖片

這意味著,即使在沒有額外監(jiān)督、沒有知識蒸餾、沒有大規(guī)模數(shù)據(jù)的前提下,只需要正確選擇少量對于VLM具有挑戰(zhàn)性的高質(zhì)量樣本,VLM也能通過self-improve顯著提升推理能力。

研究人員進一步對不同難度組合的訓(xùn)練集進行了消融分析,發(fā)現(xiàn):

  1. 僅用最難的樣本(無法解出)可以提升能力,但效果不及中等+困難樣本的組合;

  2. 簡單樣本雖然在訓(xùn)練過程中快速提升reward,但對最終推理能力提升作用有限;

  3. 使用中等難度加上困難樣本的組合才能最大程度提升模型的推理能力,即使模型在訓(xùn)練中無法解決全部的樣本。

這一發(fā)現(xiàn)對未來的模型訓(xùn)練有重要啟示:合理的樣本難度分布比樣本數(shù)量更關(guān)鍵。

論文一作王璽堯是馬里蘭大學(xué)計算機系三年級phd,導(dǎo)師為Furong Huang教授,主要研究方向為強化學(xué)習(xí)在大語言模型和視覺語言模型訓(xùn)練中的應(yīng)用,在ICML, NeurIPS, ICLR, ACL, EMNLP, NAACL, CVPR等會議上發(fā)表過多篇論文。

圖片

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2024-03-04 13:36:00

模型訓(xùn)練

2023-10-31 12:23:17

GPT-4版本VLM

2025-11-04 08:42:27

2025-04-15 09:00:00

模型推理AI

2025-01-10 11:42:40

2025-01-10 12:58:37

2024-06-11 14:30:18

2024-06-17 13:34:38

2025-04-16 15:28:31

模型AI數(shù)據(jù)

2024-11-11 17:33:35

2025-03-06 09:55:49

2025-08-18 17:20:17

AI大模型數(shù)據(jù)

2025-03-03 09:00:00

2025-06-25 08:54:03

模型訓(xùn)練AI

2025-09-18 09:00:47

2023-10-13 19:58:33

Mistral7B模型

2024-12-20 12:30:00

模型AI數(shù)據(jù)

2025-05-16 09:10:00

2024-09-13 09:14:32

2023-10-17 19:43:03

RACE排序數(shù)據(jù)
點贊
收藏

51CTO技術(shù)棧公眾號

青青草视频成人| 777av视频| 97成人免费视频| 欧美精品九九| 亚洲欧美国产精品久久久久久久| 男人透女人免费视频| 日本在线看片免费人成视1000| 久久精品国产在热久久| 97久久精品人人澡人人爽缅北| 在线免费观看黄色小视频| 亚洲精品毛片| 亚洲.国产.中文慕字在线| 欧洲一区二区日韩在线视频观看免费 | 波多野结衣国产| 精品国产网站| 精品国产免费一区二区三区四区| 日日摸天天爽天天爽视频| 污网站在线免费看| 国产精品午夜免费| 久久99精品久久久久久三级 | 日韩亚洲欧美一区| www.日本xxxx| 国产夫妻在线播放| 国产精品国产三级国产普通话蜜臀| 国产伦精品一区二区三区免费视频| 波多野结衣高清视频| 狠狠入ady亚洲精品经典电影| 一区二区三区四区视频| 特级西西人体4444xxxx| 欧美久久一区二区三区| 欧美日韩国产小视频| 无码播放一区二区三区| 色呦呦久久久| 最近中文字幕一区二区三区| 日本三级中国三级99人妇网站| 亚洲成人av综合| 国产一区二区在线免费观看| 国产精品免费视频久久久| 亚洲 欧美 日韩 综合| 韩国欧美一区| 欧美理论片在线观看| 波兰性xxxxx极品hd| 欧美**vk| 亚洲美女自拍视频| 欧美bbbbb性bbbbb视频| 欧美亚洲tv| 亚洲福利视频专区| 久久久午夜精品福利内容| 精品中文字幕一区二区三区四区| 欧美日韩一区二区欧美激情| 久久久久久三级| 亚洲精品一区三区三区在线观看| 狠狠久久五月精品中文字幕| 国产黄色一级网站| 免费成人在线电影| 五月激情丁香一区二区三区| 国产精品网站免费| 韩国成人二区| 精品国产乱码久久久久久婷婷| 国产乱淫av片杨贵妃| av影片在线| 黑人巨大精品欧美一区二区免费| 五十路熟女丰满大屁股| 波多野一区二区| 欧美日韩国产中文精品字幕自在自线| 欧美深夜福利视频| 一二三四视频在线中文| 色综合久久综合网| 成年网站在线播放| 欧美成人毛片| 日韩女优av电影在线观看| 日本人dh亚洲人ⅹxx| 亚洲天堂中文字幕在线观看| 日韩视频国产视频| 国产草草浮力影院| 国产探花一区二区| 中文字幕一精品亚洲无线一区| 免费一级suv好看的国产网站 | 大胆欧美熟妇xx| 国产精选在线| 在线精品亚洲一区二区不卡| 777视频在线| 欧美片网站免费| 亚洲精品成a人在线观看| 菠萝菠萝蜜网站| 成人系列视频| 萌白酱国产一区二区| 日本三级片在线观看| 久久精品一区| 91精品国产综合久久香蕉的用户体验 | 91官网在线| 亚洲精品福利视频网站| 日韩a∨精品日韩在线观看| 亚洲精品在线影院| 日韩美女视频一区二区在线观看| 国产黄色三级网站| 999精品色在线播放| 久久久久久久久久久久久久久久久久av| av大片在线免费观看| 蜜桃久久久久久久| 国产日产精品一区二区三区四区 | 中文字幕综合一区| 国产午夜福利片| 日韩电影在线看| 亚洲在线观看视频网站| 日韩三级电影网| 亚洲免费观看视频| www.日日操| 成人在线超碰| 日韩视频在线观看免费| 午夜毛片在线观看| 国产高清久久久久| 台湾成人av| 理论不卡电影大全神| 欧美一区二区三区日韩视频| brazzers精品成人一区| 国产在线日韩| 91精品久久久久久久久| 国产最新视频在线| 亚洲成人一区在线| 日韩不卡的av| 日韩欧美综合| 69av在线视频| 成人免费视频国产免费麻豆| 国产精品久久久久永久免费观看| 欧美日韩在线中文| **爰片久久毛片| 九九热视频这里只有精品| 亚洲熟妇无码久久精品| 久久精品夜色噜噜亚洲aⅴ| 欧美国产视频一区| 精品国产亚洲一区二区在线观看| 一区二区三区www| 久久亚洲天堂网| 99久久免费精品| 国产91视频一区| 国产精品中文| 日韩色av导航| 国产又黄又粗又硬| 中文字幕不卡在线| 黄色一级免费大片| 狠狠做六月爱婷婷综合aⅴ| 91精品国产高清自在线| 日韩一级片免费在线观看| 伊人色综合久久天天| 一级网站在线观看| 一区二区蜜桃| 91久久国产婷婷一区二区| 91ph在线| 在线播放国产精品二区一二区四区 | 日韩一级特黄| 在线观看不卡av| 最新在线中文字幕| 国产偷国产偷精品高清尤物| 欧美综合在线观看视频| 红桃成人av在线播放| 国产成人精品av| 国产免费视频在线| 欧美性受极品xxxx喷水| 国产在线综合视频| 蜜桃传媒麻豆第一区在线观看| 亚洲一区二区不卡视频| 91麻豆精品国产91久久久更新资源速度超快| 国产亚洲精品久久久| 91丨九色丨海角社区| 中文字幕精品在线不卡| 蜜桃福利午夜精品一区| 亚洲综合色站| 99re视频在线| 华人av在线| 亚洲人成在线观看网站高清| 中文字幕一区二区三区四区视频| 国产精品视频在线看| 欧美一级免费在线| 亚洲茄子视频| 日本不卡一区二区三区视频| 国产精品久久久久久久久久齐齐| www国产精品com| 亚洲欧美另类综合| 日韩欧美在线免费观看| 少妇的滋味中文字幕bd| 国产精品中文欧美| 国产亚洲综合视频| 日本一区二区高清不卡| 91在线短视频| 国产综合色区在线观看| 久久久国产精品x99av| 好吊色一区二区三区| 一本到一区二区三区| 糖心vlog免费在线观看| 成人福利视频在线看| 国产精品人人爽人人爽| 欧美1区2区3区| 精品国产电影| 电影中文字幕一区二区| 97婷婷涩涩精品一区| 尤物视频在线免费观看| 精品国产91乱码一区二区三区| 69av视频在线观看| 亚洲电影一区二区三区| 国产一区二区三区四区在线| 盗摄精品av一区二区三区| 青青青在线视频免费观看| 黄色成人av网站| 亚欧洲精品在线视频免费观看| 丁香综合av| 国产欧美精品一区二区三区介绍| 成人女同在线观看| 按摩亚洲人久久| 美丽的姑娘在线观看免费动漫| 91麻豆精品国产| 无码人妻久久一区二区三区不卡| 亚洲精品国产成人久久av盗摄| 少妇av片在线观看| 91免费版在线看| 中文字幕人妻熟女人妻a片| 免费视频一区| 精品少妇人欧美激情在线观看| 色综合狠狠操| 欧美色欧美亚洲另类七区| 欧美影院在线| 国产日韩在线免费| 蜜桃精品在线| 91精品国产成人| 国产精品偷拍| 欧美xxxx综合视频| 91在线看黄| 亚洲视频在线播放| 视频一区二区在线播放| 亚洲福利在线看| 狠狠综合久久av一区二区| 欧美久久久久免费| 亚洲视频在线观看一区二区| 色嗨嗨av一区二区三区| 日本在线播放视频| 亚洲成av人片一区二区三区| 免费在线观看黄视频| 自拍偷拍亚洲激情| 亚洲天堂一级片| 国产精品成人免费在线| 国产亚洲精品精品精品| 国产清纯美女被跳蛋高潮一区二区久久w| 亚洲精品中文字幕在线播放| 成人精品在线视频观看| 日本一级大毛片a一| 成人视屏免费看| av在线天堂网| 国产91综合一区在线观看| 久久无码人妻一区二区三区| 国产一区视频网站| 久久精品一卡二卡| 国产成人在线视频免费播放| ass极品水嫩小美女ass| 国产成人在线网站| 一本色道久久hezyo无码| 国产高清不卡二三区| 亚洲一区和二区| 成人av在线资源网站| 少妇户外露出[11p]| 26uuu另类欧美亚洲曰本| 在线观看日本中文字幕| 国产欧美一区二区精品秋霞影院| 天天摸日日摸狠狠添| 中文字幕一区在线| 国产精品白嫩白嫩大学美女| 亚洲伊人伊色伊影伊综合网| 国产精品成人久久| 日韩欧美一区二区在线| 中文字幕视频在线播放| 3atv在线一区二区三区| www.五月天激情| 日韩av在线网址| 成人在线观看黄色| 久久精品中文字幕免费mv| 女同一区二区免费aⅴ| 欧美重口另类videos人妖| 春暖花开亚洲一区二区三区| 91精品国产综合久久男男| 97se亚洲| 精品日韩欧美| 成人综合专区| wwwwww欧美| 天堂av在线一区| 男插女视频网站| 久久综合久久综合久久| 日本激情视频一区二区三区| 一区二区三区**美女毛片| a v视频在线观看| 欧美日韩亚洲不卡| 三级小视频在线观看| 在线精品播放av| 青春草视频在线观看| 国产精品xxx视频| 日本高清久久| 欧美日韩国产免费一区二区三区| 91精品高清| 亚洲中文字幕无码不卡电影| 久久成人免费网| 免费中文字幕av| 国产精品你懂的在线欣赏| 日产精品久久久久| 欧美日韩成人高清| 天天躁日日躁狠狠躁喷水| 中文字幕在线亚洲| 亚洲人成在线网站| 亚洲字幕一区二区| 欧美色女视频| 成人午夜视频在线观看免费| 久久se精品一区精品二区| 中文在线永久免费观看| 亚洲同性同志一二三专区| 波多野结衣二区三区| 亚洲第一精品福利| 操你啦视频在线| 国产精品美女久久久免费| 狼人精品一区二区三区在线| 中文字幕在线亚洲精品| 日本亚洲一区二区| 久久人人爽人人人人片| 亚洲国产中文字幕在线视频综合 | 色戒汤唯在线观看| 999在线观看免费大全电视剧| 久久国产成人精品| 欧美少妇性生活视频| av亚洲精华国产精华| www.av视频| 欧美精品乱码久久久久久按摩| 可以在线观看的黄色| 午夜精品久久久久久99热| 警花av一区二区三区| 一区不卡字幕| 日av在线不卡| 国产精品av久久久久久无| 都市激情亚洲色图| 污视频在线免费| 欧美黄色片在线观看| 国产精品一区免费在线| 手机在线视频你懂的| 久久精品国产第一区二区三区| 国产精品高清无码在线观看| 欧美日韩精品二区| 头脑特工队2在线播放| 久久青草精品视频免费观看| av不卡一区二区| 国产欧美日韩网站| 99视频一区二区| aaa人片在线| 亚洲精品一区中文字幕乱码| 亚洲综合电影| 日本高清久久一区二区三区| 日韩高清不卡一区| wwwww黄色| 欧美丰满嫩嫩电影| a视频在线播放| 古典武侠综合av第一页| 黄色成人在线网站| 最近日本中文字幕| 日本高清免费不卡视频| a天堂中文在线88| 国产热re99久久6国产精品| 久久久久久久久丰满| 波多野吉衣在线视频| 亚洲伊人色欲综合网| 污污网站免费在线观看| 日本久久精品视频| 日韩国产一区二区三区| av噜噜在线观看| 亚洲一区二区欧美日韩| 天堂av在线资源| 国产精品99一区| 91精品国产91久久综合| 污污免费在线观看| 在线视频你懂得一区| 日本暖暖在线视频| 97久草视频| 日韩视频一区二区三区在线播放免费观看| 亚洲第一页av| 欧美亚一区二区| 在线视频国产区| 免费日韩av电影| 精品一区二区三区香蕉蜜桃| 久久久久久久久久一区二区三区| 日韩精品视频三区| 久久99国产精品二区高清软件| 欧美另类videos| 99久久伊人精品| 91福利免费视频| 97免费视频在线| 欧美成免费一区二区视频| 挪威xxxx性hd极品| 欧美图片一区二区三区| 变态调教一区二区三区| 亚洲ai欧洲av| 成年人网站91| 国产精品久久欧美久久一区| 久久久久久久国产精品| 欧美手机在线| 水蜜桃av无码| 宅男在线国产精品| h片在线观看下载|