精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

九大基準全面領先,性能暴漲10.8%!視覺價值模型VisVM成「圖像描述」新寵

人工智能
視覺價值模型(VisVM)通過「推理時搜索」來提升多模態視覺語言模型的圖像描述質量,減少幻覺現象。實驗表明,VisVM能顯著提高模型的視覺理解能力,并可通過自我訓練進一步提升性能。

在現代多模態視覺語言模型(VLM)的發展中,提高圖像描述的準確性和細節豐富性始終是一個挑戰。盡管基于大規模數據的訓練極大推動了模型性能,但在實際應用中,模型仍面臨識別細微圖像區域和減少「幻覺」現象的問題。

推理時搜索(inference time search)作為一種提升響應質量的有效方法,已在大型語言模型中展現出巨大潛力。

O1和QwQ等大語言模型通過在推理階段在語言空間中進行搜索得到更好的回答,在數學和代碼等任務中展現了遠超越其他模型的卓越性能。

那么,我們能否同樣通過推理時搜索來提升多模態視覺語言模型的響應質量,并減少響應中的幻覺呢?答案是是的。

來自馬里蘭大學和微軟的研究團隊提出了視覺價值模型(Vision Value Model, VisVM),通過精確控制搜索過程來顯著提高模型在視覺任務中的表現。

圖片圖片

論文地址:https://arxiv.org/abs/2412.03704

項目頁面:https://si0wang.github.io/projects/VisVM/

項目代碼:https://github.com/si0wang/VisVM

VisVM是一種價值網絡,可以通過對逐步生成描述性標題提供獎勵信號來指導視覺語言模型(VLM)在推理時的搜索。

模型訓練

VisVM首先使用VLM自身生成多個多樣化的響應,并將這些響應按照句子維度拆分成<current sentence,next sentence>的sentence pair。

對于每一個current sentence使用CLIP model計算這句話和對應圖像的cosine similarity作為reward,最后構成< current sentence, reward,next sentence, Image>的四元組作為VisVM的訓練數據。

VisVM使用強化學習中的時序差分學習(Temporal Difference learning)作為損失函數進行訓練。這使得VisVM不僅可以評估當前句子與圖像之間的匹配程度,還可以預測當前句子如何影響未來句子的生成,為搜索提供一個長期價值信號。

VisVM引導下的推理階段搜索:

在訓練好VisVM之后,作者使用VisVM作為獎勵信號來逐步精細化推理過程。這一過程包括以下幾個步驟:

1. 生成多個句子候選:首先,模型會生成多個可能的句子,作為響應的候選。

2. 通過VisVM進行評估:接下來,利用VisVM對這些候選句子進行綜合評估,考察其與圖像內容的匹配度以及對未來生成句子的潛在影響(句子中包含的幻覺,細致程度等)。

3. 選擇最佳句子:根據VisVM的評估,從候選中挑選出最優的句子來繼續生成。

相比于直接使用只考慮當前句子與圖像匹配程度的clip分數作為獎勵信號進行搜索,VisVM可以進一步通過考慮后續生成的句子中的潛在幻覺來預測長期價值,使得VisVM能夠避開具有更高幻覺風險的響應候選,并生成不易產生幻覺且更詳細的圖像描述。

通過這種迭代的推理過程,VLM能夠構建出完整且高質量的響應序列,有效減少信息遺漏和幻覺錯誤,顯著提升模型的應用性能。

實驗

研究人員采用LLaVA-Next-Mistral-7B作為實驗的基礎模型,通過在其encoder的最后一層添加一個線性層作為value head,構建了VisVM并基于這個結構使用上文中構造的數據集與損失函數進行訓練。

在后續的實驗中,均使用LLaVA-Next-Mistral-7B作為base model用于生成響應。

研究人員首先評估了使用不同解碼方式生成的響應質量,作者從COCO2017數據集中采樣了1000個圖像,并與llava detailed description 數據集中用于圖像描述的9個prompt進行了隨機匹配作為測試集用于生成圖像藐視。

分別使用人類評估和GPT-4o評估,將VisVM引導的搜索與其他常規方法如CLIP-PRM指導搜索、Best-of-N選擇和貪婪解碼得到的圖像描述進行了比較。

結果表明VisVM在生成圖像描述時不僅細節更為豐富,產生的幻覺也大幅減少,其生成的描述性內容更加受到evaluator的青睞。

尤其是在人類作為評估者的情況下,VisVM引導搜索得到的圖像描述相比于其他三個方法分別取得了66.0%, 63.5%和74.0%的獲勝比率。

圖片圖片

例如,在描述這個場景時,VisVM引導的搜索甚至可以描述出擋風玻璃上的水滴擋住了綠色指示牌,這種細節在人類標注的時候甚至都難以察覺。展示了視覺價值模型對于細節描述的強大能力。

圖片圖片

在現有幻覺的benchmark中,研究人員在VLM的inference階段使用了非搜索方式生成響應用于評估。

在CHAIR和MMHal兩個用于測試VLM幻覺的benchmark上VisVM引導的搜索取得了顯著優于其他方法的效果,展示出減少VLM生成響應中的幻覺的強大能力

圖片圖片

并且,作者還進一步探索了了VisVM引導搜索的scaling law,結果發現無論是采用VisVM引導的搜索還是CLIP-PRM引導的搜索,隨著搜索步驟大小的增加,模型的性能都會逐步提升。這一現象證明了擴大推理時間的計算量能夠顯著增強VLM的視覺理解能力。

特別值得注意的是,隨著步驟大小的增加,VisVM引導搜索的性能提升速度更快,使得兩種方法之間的性能差距不斷擴大。VisVM在達到與CLIP-PRM相當的性能時,其計算效率幾乎是后者的兩倍。

通過擴大搜索步驟,VisVM不僅能更快地達到理想的性能,還能以更低的計算成本實現,這在提升模型處理復雜視覺任務時尤為重要。

圖片圖片

基于VisVM強大的減少幻覺的能力,作者使用使用LLaVA-NEXT-Mistral-7B作為基礎模型,并利用VisVM作為獎勵信號,搜索生成高質量的圖像描述作為監督微調(SFT)數據,對LLaVA-NEXT-Mistral-7B進行訓練。

在九個理解和幻覺基準上的測試表明,VisVM引導的自我訓練使LLAVA-next-7B的性能平均提升了10.8%,相比于其他搜索方法得到的圖像描述作為訓練數據提升顯著。

特別是在提升了視覺理解能力后,VLM的reasoning能力也有所提高,例如MMMU和MathVista兩個benchmark,該結果進一步展示了VisVM搜索得到的圖像描述質量之高。

此外,這也揭示了VisVM在自我訓練框架中的應用潛力,僅通過在語言空間中進行高質量搜索并進行微調,就能顯著提升原始VLM的視覺理解能力,這一發現為未來VLM的發展提供了新的方向和思路。

圖片圖片

圖片圖片

參考資料:https://arxiv.org/abs/2412.03704

責任編輯:武曉燕 來源: 新智元
相關推薦

2022-01-10 15:39:59

物聯網人工智能AIoT

2024-01-16 12:31:13

OpenAIGLM-4大模型

2024-09-23 08:30:00

AI模型

2010-03-26 11:01:31

災備虛擬化

2024-09-29 13:10:08

2023-11-20 22:02:54

開源模型

2012-09-24 11:17:11

2010-09-03 15:50:23

2025-07-02 09:17:13

2012-11-16 13:55:04

線下渠道連鎖賣場運營商網點

2023-12-04 13:40:09

AI訓練

2023-01-05 09:33:37

視覺模型訓練

2011-05-27 15:52:13

2024-09-27 14:00:00

大語言模型AI

2024-08-19 02:10:00

服務性能優化服務架構

2024-09-19 13:40:00

2023-04-28 15:53:55

框架模型

2010-07-02 10:17:45

UML模型圖
點贊
收藏

51CTO技術棧公眾號

激情久久久久| 成人在线tv视频| 亚洲男人的天堂av| 好吊色欧美一区二区三区四区| 国产成人精品a视频一区| 羞羞答答一区二区| 5858s免费视频成人| 成人免费毛片在线观看| 国产大学生校花援交在线播放 | 久久综合色婷婷| 成人av在线天堂| 国产三级av片| 伊人久久大香线蕉精品组织观看| 亚洲精品456在线播放狼人| 性欧美极品xxxx欧美一区二区| av电影免费在线观看| 久久在线免费观看| 成人av资源| 亚洲天堂中文在线| 99成人在线| 蜜月aⅴ免费一区二区三区| 亚洲a v网站| av自拍一区| 91精品国产综合久久久久久 | 日韩精品一区二区三区中文不卡 | 成人免费看片98| 成人羞羞视频播放网站| 日韩精品视频免费在线观看| av在线网站免费观看| 97欧美成人| 色综合久久综合网97色综合| 久久成人福利视频| 日本韩国在线视频爽| 久久久久国产免费免费| 国模精品一区二区三区| 性少妇videosexfreexxx片| 日韩一区欧美二区| 45www国产精品网站| 欧美日韩免费一区二区| 99热在线成人| 日韩在线观看免费高清完整版| 巨胸大乳www视频免费观看| xxxx日韩| 亚洲国产精品国自产拍av秋霞| 91网址在线观看精品| 少妇高潮一区二区三区99| 色婷婷久久99综合精品jk白丝| 春日野结衣av| 成年人在线网站| 亚洲成人在线网站| 免费看欧美黑人毛片| 日本在线视频中文有码| 伊人色综合久久天天人手人婷| 中文字幕一区二区三区四区五区 | 国产精品久久午夜夜伦鲁鲁| 色综合电影网| 在线播放日本| 国产精品免费aⅴ片在线观看| 亚洲国产欧美不卡在线观看 | 国产精品狼人久久影院观看方式| 天堂一区二区三区 | 中文字幕免费高清在线| 91在线成人| 欧美丰满嫩嫩电影| 国产精品欧美性爱| 久久人人爽人人爽人人片av不| 精品99一区二区| 一级特级黄色片| 亚洲品质自拍| 中文字幕自拍vr一区二区三区| 九九九视频在线观看| 99热国内精品| 欧美精品久久久久久久免费观看| 免费观看成人毛片| 日韩va亚洲va欧美va久久| 国产日韩视频在线观看| www.五月婷| 26uuu国产日韩综合| 日韩国产在线一区| caoporn免费在线| 香蕉成人伊视频在线观看| 日本一区二区黄色| 欧美激情不卡| 亚洲大胆人体av| 成人午夜剧场视频网站| 99久久婷婷国产综合精品电影√| 欧美理论片在线观看| 国产成人免费看| 久久精品国产秦先生| 国产精品入口免费| 成年网站在线| 亚洲影视在线观看| 日日碰狠狠丁香久燥| 精品国产三区在线| 亚洲精品视频网上网址在线观看| 熟女少妇a性色生活片毛片| 99av国产精品欲麻豆| 国产精品久久久久久av下载红粉| 午夜精品无码一区二区三区| 久久精品亚洲一区二区三区浴池| 最近免费观看高清韩国日本大全| 国产免费拔擦拔擦8x在线播放| 欧美乱妇23p| 亚洲第一黄色网址| 一区二区三区毛片免费| 秋霞av国产精品一区| 色老头一区二区三区在线观看| 国产在线青青草| 成人在线视频www| 日韩av在线免费播放| 国产黄色小视频网站| 国产免费成人| 国产精品二区二区三区| 91九色在线porn| 精品色蜜蜜精品视频在线观看| 91在线第一页| 成人亚洲一区二区| 欧美亚洲在线播放| 亚洲国产精品suv| 亚洲欧美怡红院| 韩国日本在线视频| 成人免费直播在线| 麻豆成人在线看| 中文字幕在线播放不卡| 99国产精品久久久久久久久久| 欧美另类videosbestsex日本| 91tv亚洲精品香蕉国产一区| 日韩大片免费观看视频播放| 精品在线免费观看视频| 国产一区三区三区| 亚洲精品在线视频观看| 桃子视频成人app| 日韩精品在线观| 日韩欧美亚洲国产| 国产91对白在线观看九色| 国产一二三四五| 国产精品亚洲欧美日韩一区在线| 国产亚洲精品久久久久久牛牛| 中文字幕一区二区三区手机版| 国产一区二区三区蝌蚪| 一区二区三区视频在线播放| 97欧美成人| 在线日韩欧美视频| 中文天堂在线资源| 中文字幕精品一区二区三区精品| 日韩精品无码一区二区三区免费| 丝袜美腿综合| 国产成人精品a视频一区www| 国产视频网址在线| 欧美中文字幕一区二区三区亚洲| 蜜桃无码一区二区三区| 日韩专区在线视频| 日韩av在线电影观看| 欧美影视资讯| 色婷婷综合成人av| 国产毛片毛片毛片毛片毛片| 日韩理论片网站| 可以看的av网址| 99成人免费视频| 欧美激情www| 午夜无码国产理论在线| 日韩在线视频免费观看| 国产精品视频a| 亚洲综合久久久久| 手机在线成人av| 久久中文欧美| 一区二区三区四区视频在线观看| 四虎地址8848精品| 欧美黑人一级爽快片淫片高清| 成人免费观看在线视频| 污片在线观看一区二区| 亚洲精品午夜视频| 韩国成人精品a∨在线观看| av磁力番号网| 牛牛精品成人免费视频| 国产97在线播放| 黄色大片在线播放| 亚洲大胆人体av| 久久久久久久久久一级| 亚洲乱码国产乱码精品精98午夜| 午夜不卡久久精品无码免费| 久久动漫亚洲| youjizz.com亚洲| 任我爽精品视频在线播放| 国产精品久久av| 日本大片在线播放| 亚洲深夜福利在线| 精品人妻少妇嫩草av无码专区| 天天色综合天天| 99在线视频免费| 国产91对白在线观看九色| 人人干人人视频| 欧美福利电影在线观看| 欧美日韩一区二| 国产一区二区视频在线看| 欧美在线影院在线视频| bestiality新另类大全| 亚洲天堂网在线观看| 国产成人精品一区二三区四区五区| 亚洲一二三区在线观看| 成熟人妻av无码专区| 成人午夜视频网站| 国产精品自拍视频在线| 国产欧美日韩一级| 日本道在线视频| 精品国产一区二区三区小蝌蚪| 97欧洲一区二区精品免费| 亚洲日本网址| 性视频1819p久久| 亚洲小说区图片| 色偷偷av亚洲男人的天堂| 免费理论片在线观看播放老| 日韩精品一区二区三区视频播放| 中文 欧美 日韩| 色婷婷精品大视频在线蜜桃视频 | 欧美一区三区| 久久久久久国产精品免费免费| 精品视频一区二区三区| 国产精品久久久久久一区二区 | 老司机免费视频| 精品亚洲成a人在线观看| 久久久久免费精品| 99国产精品99久久久久久粉嫩| 四虎永久免费网站| 久久国产成人午夜av影院宅| 欧美一级二级三级| 超碰成人在线观看| 超碰在线97av| 久久久久毛片免费观看| 成人精品视频久久久久 | 成人动漫在线视频| 国产精品日韩精品在线播放 | 久久久久久一区二区三区 | 第一会所亚洲原创| 欧洲精品码一区二区三区免费看| 国产女人18毛片水真多18精品| 97se亚洲综合在线| 国产精品麻豆| 91福利视频导航| 日韩欧美久久| 99在线看视频| 成人自拍在线| 国产在线观看一区| 美女一区二区在线观看| 国产精品一区在线观看| 久久wwww| 99影视tv| 青青操综合网| 欧美久久久久久久| 精品国内自产拍在线观看视频| 欧洲久久久久久| 91久久夜色精品国产按摩| 亚洲精品中字| 欧美久久久久| 波多野结衣之无限发射| 免费欧美在线| 午夜国产一区二区三区| 九一久久久久久| 污免费在线观看| 不卡一区二区中文字幕| 少妇精品一区二区| 国产三级精品在线| 69夜色精品国产69乱| 亚洲精品高清在线观看| 国产午夜视频在线播放| 色综合久久久网| 中文字幕一区二区三区人妻四季 | 亚洲啪av永久无码精品放毛片| av一区二区三区四区| 精品少妇一区二区三区免费观| 国产欧美日韩精品在线| 情侣偷拍对白清晰饥渴难耐| 亚洲人精品午夜| 日韩av在线电影| 在线观看日韩一区| 国产美女主播在线观看| 亚洲精品在线电影| 邻居大乳一区二区三区| 久久久精品国产亚洲| bl在线肉h视频大尺度| 日韩美女福利视频| 国产剧情一区二区在线观看| 韩国一区二区三区美女美女秀| 国产综合久久久| 粉嫩av一区二区三区天美传媒| 亚洲一区二区毛片| 亚洲精品永久视频| 99久久精品国产观看| www成人啪啪18软件| 亚洲v日本v欧美v久久精品| 久久久久久久久久一级| 精品日韩在线一区| av资源种子在线观看| 欧美激情aaaa| 香蕉久久一区| 麻豆久久久9性大片| 欧美在线三区| 午夜激情在线观看视频| 成人午夜大片免费观看| 精品人体无码一区二区三区| 亚洲国产精品久久艾草纯爱| 中文字幕av在线免费观看| 欧美精品一区二区三区在线播放| 成人精品一区| 欧美中文字幕在线| 久久天堂久久| 亚洲视频在线二区| 午夜一区在线| 任你躁av一区二区三区| 中文字幕综合网| 中文字幕av网站| 亚洲色在线视频| 午夜欧美激情| av免费精品一区二区三区| 日本不卡高清| 欧美xxxxx在线视频| 成人97人人超碰人人99| 99久久婷婷国产综合| 欧美吻胸吃奶大尺度电影| 天堂av电影在线观看| 高清在线视频日韩欧美| 久久中文字幕一区二区| 一区不卡视频| 日韩av一二三| 怡红院一区二区三区| 欧美日韩综合视频| 少妇精品高潮欲妇又嫩中文字幕 | 日韩在线免费| 欧美不卡在线一区二区三区| 亚洲日本成人| 香蕉视频污视频| 夜夜夜精品看看| 精品国产无码AV| 九九热这里只有在线精品视| 国产精品久久久久久久久久辛辛| 伊人久久99| 久久99国产乱子伦精品免费| 精品丰满少妇一区二区三区| 色噜噜狠狠成人中文综合| 男人av在线| 国产精品av免费在线观看| 国产麻豆精品久久| 五月婷婷之综合激情| 国产精品欧美精品| 亚洲一区二区影视| 日韩在线www| 欧州一区二区三区| 久久久久久久香蕉| 丰满白嫩尤物一区二区| 国产五月天婷婷| 日韩av在线影院| 中文字幕在线中文字幕在线中三区| 久久精品综合一区| 视频一区视频二区中文字幕| 熟女少妇内射日韩亚洲| 欧美性淫爽ww久久久久无| 77777影视视频在线观看| 91久久精品国产91性色| 欧美成人国产| 国产精品无码电影| 色狠狠色狠狠综合| 欧美r级在线| 9a蜜桃久久久久久免费| 国产精品毛片在线| 一二三四国产精品| 欧美一级电影网站| 岛国在线视频网站| 日本视频一区在线观看| 国内精品国产三级国产a久久| 久久久全国免费视频| 亚洲国产日韩欧美综合久久| 欧美日韩亚洲国产| 99久久99久久精品| 久久综合九色综合97婷婷女人| 中文字幕黄色av| 色综合久久久888| 精品影片在线观看的网站| 人人干人人干人人| 亚洲一区二区欧美| 精品三级久久久久久久电影聊斋| 国产精品亚洲精品| 国产精品www994| 精品人伦一区二区| 日韩一区国产二区欧美三区| 亚洲人体视频| 天堂av在线中文| 久久综合久久久久88| 一区二区 亚洲| 国产91精品高潮白浆喷水| 91欧美在线| 国产人妻人伦精品1国产丝袜| 欧美久久高跟鞋激| 中文字幕不卡三区视频| 99re99热| 久久久国际精品| 欧美熟妇另类久久久久久不卡| 国产精品久久一| 亚洲精品系列| 极品盗摄国产盗摄合集| 伊人伊成久久人综合网站|