精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上

發(fā)布于 2025-3-12 00:43
瀏覽
0收藏

Unified Reward Model for Multimodal Understanding and Generation

2025-03-07|FDU, SII, Shanghai AI Lab, Shanghai Academy of Artificial Intelligence for Science|??75

??http://arxiv.org/abs/2503.05236v1???
???https://huggingface.co/papers/2503.05236???
???https://codegoat24.github.io/UnifiedReward/??

研究背景與意義

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

本文提出了一種名為UNIFIEDREWARD的統(tǒng)一獎勵模型,旨在解決多模態(tài)理解和生成任務(wù)中的偏好對齊問題。現(xiàn)有模型通常針對特定任務(wù)設(shè)計(jì),限制了其在不同視覺應(yīng)用中的適應(yīng)性。作者認(rèn)為,通過聯(lián)合學(xué)習(xí)多個視覺任務(wù),可以產(chǎn)生協(xié)同效應(yīng),增強(qiáng)圖像理解、視頻評估等任務(wù)的表現(xiàn)。

  • 研究背景:近年來,人類偏好對齊技術(shù)顯著推動了多模態(tài)生成和理解的進(jìn)步。然而,大規(guī)模收集人類反饋既耗時又耗費(fèi)資源。
  • 研究意義:本研究通過構(gòu)建大規(guī)模的人類偏好數(shù)據(jù)集,并開發(fā)出首個能夠同時進(jìn)行成對排名和點(diǎn)評分的統(tǒng)一獎勵模型,解決了現(xiàn)有模型的局限性,提升了跨域視覺任務(wù)的性能。

研究方法與創(chuàng)新

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

UNIFIEDREWARD的核心在于其獨(dú)特的訓(xùn)練流程和數(shù)據(jù)構(gòu)建方式。該模型基于一個涵蓋圖像和視頻生成/理解任務(wù)的大規(guī)模人類偏好數(shù)據(jù)集進(jìn)行訓(xùn)練,隨后用于自動構(gòu)建高質(zhì)量的偏好對數(shù)據(jù)。

  • 技術(shù)創(chuàng)新

a.大規(guī)模數(shù)據(jù)集:首次構(gòu)建了一個包含236K條記錄的數(shù)據(jù)集,覆蓋了圖像和視頻的理解與生成任務(wù)。

b.聯(lián)合學(xué)習(xí)框架:通過將視覺任務(wù)視為相互關(guān)聯(lián)的整體,實(shí)現(xiàn)了更高效的模型訓(xùn)練。

c.細(xì)粒度篩選機(jī)制:采用成對排名和點(diǎn)評分相結(jié)合的方法,確保了偏好數(shù)據(jù)的質(zhì)量。

  • 優(yōu)勢對比

a.相比于僅能處理單一任務(wù)的現(xiàn)有模型,UNIFIEDREWARD展示了更強(qiáng)的泛化能力和更高的效率。

b.實(shí)驗(yàn)結(jié)果顯示,在多種基準(zhǔn)測試中,該模型均取得了顯著優(yōu)于基線模型的成績。

實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

為了驗(yàn)證UNIFIEDREWARD的有效性,研究人員進(jìn)行了廣泛的實(shí)驗(yàn),包括圖像和視頻生成及理解任務(wù)。實(shí)驗(yàn)結(jié)果表明,聯(lián)合學(xué)習(xí)多個視覺任務(wù)不僅能緩解數(shù)據(jù)不足的問題,還能顯著提高學(xué)習(xí)效果。

  • 圖像生成:使用Pick-a-Pic數(shù)據(jù)集進(jìn)行偏好數(shù)據(jù)構(gòu)建,結(jié)果顯示,基于UNIFIEDREWARD的DPO方法在多個指標(biāo)上均優(yōu)于直接訓(xùn)練。
  • 視頻生成:通過T2V-Turbo模型進(jìn)行對比實(shí)驗(yàn),發(fā)現(xiàn)UNIFIEDREWARD在質(zhì)量、語義一致性等方面均有明顯提升。
  • 多任務(wù)學(xué)習(xí):實(shí)驗(yàn)還證明了聯(lián)合訓(xùn)練圖像和視頻理解任務(wù)可以帶來額外的性能增益,例如整體準(zhǔn)確率提高了5.3%,宏觀準(zhǔn)確率提高了8.3%。

結(jié)論與展望

綜上所述,UNIFIEDREWARD不僅為多模態(tài)理解和生成任務(wù)提供了一種全新的解決方案,而且通過聯(lián)合學(xué)習(xí)多個視覺任務(wù),展現(xiàn)了強(qiáng)大的泛化能力和實(shí)際應(yīng)用潛力。未來的研究方向可能包括進(jìn)一步優(yōu)化模型架構(gòu)、探索更多類型的視覺任務(wù)以及擴(kuò)展到其他領(lǐng)域如自然語言處理等。

  • 總結(jié)貢獻(xiàn):提出了首個統(tǒng)一獎勵模型,解決了現(xiàn)有模型的局限性,顯著提升了跨域視覺任務(wù)的性能。
  • 方法展望:建議繼續(xù)探索如何更好地整合不同類型的任務(wù),以實(shí)現(xiàn)更加通用和高效的獎勵模型。

R1-Omni: Explainable Omni-Multimodal Emotion Recognition with Reinforcing Learning

2025-03-07|Alibaba Group|??9

??http://arxiv.org/abs/2503.05379v1???
???https://huggingface.co/papers/2503.05379???
???https://github.com/HumanMLLM/R1-Omni??

研究背景與意義

本研究聚焦于情感識別任務(wù),特別是結(jié)合視覺和音頻信息的多模態(tài)大模型。當(dāng)前,強(qiáng)化學(xué)習(xí)(RL)在提升大模型性能方面展現(xiàn)出巨大潛力,尤其是通過可驗(yàn)證獎勵機(jī)制(RLVR)。然而,現(xiàn)有的RLVR應(yīng)用主要集中在圖像-文本模態(tài)上,尚未探索視頻中更豐富的信息源,如動態(tài)視覺內(nèi)容和音頻。

本文首次將RLVR應(yīng)用于視頻多模態(tài)大模型(Omni-model),旨在優(yōu)化其推理能力、情感識別準(zhǔn)確性和泛化能力。研究不僅顯著提升了模型在分布內(nèi)數(shù)據(jù)上的表現(xiàn),還在分布外數(shù)據(jù)上展示了更強(qiáng)的魯棒性。此外,改進(jìn)后的推理能力使得不同模態(tài)(視覺和音頻)對情感識別的貢獻(xiàn)更加清晰,為多模態(tài)大模型的優(yōu)化提供了寶貴見解。

研究方法與創(chuàng)新

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

本研究采用了一種新穎的訓(xùn)練范式——強(qiáng)化學(xué)習(xí)與可驗(yàn)證獎勵(RLVR),并結(jié)合了組相對策略優(yōu)化(GRPO)。RLVR簡化了獎勵機(jī)制,確保模型輸出與任務(wù)的正確性標(biāo)準(zhǔn)對齊,而GRPO則通過比較生成響應(yīng)的質(zhì)量來優(yōu)化策略,無需額外的批評模型。

具體而言,我們擴(kuò)展了RLVR的應(yīng)用范圍,從傳統(tǒng)的數(shù)學(xué)和編程領(lǐng)域轉(zhuǎn)向多模態(tài)情感識別。通過使用MAFW和DFEW數(shù)據(jù)集中的15,306個視頻樣本進(jìn)行訓(xùn)練,盡管這些數(shù)據(jù)集僅提供情感類別標(biāo)注,但通過RLVR,我們成功增強(qiáng)了模型的推理、性能和泛化能力。

創(chuàng)新點(diǎn):

  1. 首次應(yīng)用:首次將RLVR應(yīng)用于視頻多模態(tài)大模型,特別是在情感識別任務(wù)中。
  2. 增強(qiáng)推理能力:通過RLVR,模型能夠更清晰地理解視覺和音頻信息如何共同作用于情感識別。
  3. 魯棒性提升:模型在分布外數(shù)據(jù)上的表現(xiàn)顯著優(yōu)于監(jiān)督微調(diào)(SFT)模型。
  4. 結(jié)構(gòu)化輸出:引入了嚴(yán)格的格式獎勵,確保模型生成的解釋符合預(yù)定義的HTML標(biāo)簽格式,便于后續(xù)分析和評估。

實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析

多模態(tài)理解和生成:多模態(tài)理解與生成統(tǒng)一獎勵模型;將獎勵模型多模態(tài)情緒識別上-AI.x社區(qū)

實(shí)驗(yàn)分為冷啟動階段和RLVR訓(xùn)練階段。冷啟動階段使用EMER數(shù)據(jù)集中的580個視頻樣本進(jìn)行預(yù)訓(xùn)練,以賦予模型初步的推理能力。隨后,通過RLVR進(jìn)一步優(yōu)化模型。

實(shí)驗(yàn)結(jié)果:

  1. 推理能力增強(qiáng):R1-Omni在多個數(shù)據(jù)集上表現(xiàn)出更強(qiáng)的推理能力和更高的解釋一致性。
  2. 理解能力提升:在MAFW和DFEW數(shù)據(jù)集上,R1-Omni的無權(quán)重平均召回率(UAR)和加權(quán)平均召回率(WAR)均顯著高于其他模型。
  3. 泛化能力更強(qiáng):在RAVDESS數(shù)據(jù)集(作為分布外測試集)上,R1-Omni同樣表現(xiàn)出色,UAR和WAR分別達(dá)到43.00%和44.69%,遠(yuǎn)超SFT模型的表現(xiàn)。

結(jié)論與展望

本研究表明,RLVR在多模態(tài)情感識別任務(wù)中具有顯著優(yōu)勢,不僅提升了模型的推理和理解能力,還增強(qiáng)了其在未見過的數(shù)據(jù)上的泛化能力。未來的研究方向包括:

  1. 加強(qiáng)基礎(chǔ)模型能力:通過更大規(guī)模的預(yù)訓(xùn)練或更多樣化的數(shù)據(jù)集來進(jìn)一步提升基礎(chǔ)模型的性能。
  2. 減少推理幻覺:開發(fā)機(jī)制以檢測和減輕模型在推理過程中可能出現(xiàn)的幻覺現(xiàn)象。
  3. 充分利用音頻線索:改進(jìn)模型對音頻特征(如語調(diào)和抑揚(yáng)頓挫)的提取和整合能力。
  4. 深化情感智能:引導(dǎo)模型探索更深層次的心理活動和情感驅(qū)動因素,提升其捕捉復(fù)雜情感動態(tài)的能力。

盡管R1-Omni取得了顯著進(jìn)展,但在字幕識別、推理幻覺和音頻利用等方面仍存在局限性,需要進(jìn)一步研究和改進(jìn)。

本文轉(zhuǎn)載自??AI研究前瞻??,作者:胡耀淇



已于2025-3-13 16:00:59修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
亚洲一区二区三区无码久久| 一区二区三区视频| 日本最新中文字幕| 日韩成人av在线资源| 亚洲国产综合在线| 久久久com| 亚洲一区在线观| 欧美在线精品一区| 国产丝袜一区视频在线观看| 高清欧美精品xxxxx| 飘雪影视在线观看免费观看| 免费看黄色91| 丝袜亚洲欧美日韩综合| 五月天中文字幕在线| 免费男女羞羞的视频网站在线观看| 国产毛片精品国产一区二区三区| 91国产精品91| 国产馆在线观看| 高清一区二区三区av| 亚洲va韩国va欧美va| 日韩视频在线播放| 亚洲第一天堂影院| 日本欧美一区二区在线观看| 美女999久久久精品视频| 亚洲自拍偷拍精品| 久久亚洲国产精品尤物| 亚洲高清中文字幕| 亚洲精品久久久久久一区二区| a在线观看视频| 久久精品毛片| 欧美福利在线观看| 成年人网站免费看| 日本伊人久久| 欧美系列一区二区| 免费人成自慰网站| 欧美三级电影一区二区三区| 99re这里只有精品视频首页| 91精品在线观| 91黑人精品一区二区三区| 午夜国产精品视频| 最近2019中文字幕mv免费看 | 91视频在线免费| 国产精品诱惑| 在线观看亚洲a| 国产成人在线免费看| av观看在线| 国产精品久久一级| 台湾成人av| 免费一级在线观看播放网址| 不卡一区在线观看| 91精品国产一区二区三区动漫| 在线免费av片| 日本vs亚洲vs韩国一区三区| 91国内在线视频| 伊人国产在线观看| 亚洲九九精品| 欧美与欧洲交xxxx免费观看 | 欧美高清视频一区| 亚洲三级黄色片| 国产亚洲成aⅴ人片在线观看| 日韩国产伦理| 黄色网址在线免费观看| 亚洲精品日产精品乱码不卡| 国产女主播av| av有码在线观看| 欧美日韩国产在线看| 成年人网站大全| 国产精品无码久久久久| 日韩欧美一区二区视频| 亚洲成年人在线观看| 欧美a一欧美| 国产一区二区日韩| 日本黄色免费片| 欧美国产先锋| 2019精品视频| 中文字幕网址在线| 福利一区二区在线| 久久综合给合久久狠狠色| 国产亚洲依依| 亚洲免费av网站| 狠狠干 狠狠操| 影视一区二区三区| 日韩精品自拍偷拍| 泷泽萝拉在线播放| 99久久这里只有精品| 久久噜噜噜精品国产亚洲综合| 在线能看的av| 国产一区二区三区在线观看免费| 高清免费日韩| 国产精品一区二区三区四区色| 国产精品久久久久永久免费观看 | 亚洲国产黄色片| 日本性高潮视频| 欧美va天堂在线| 欧美在线一级va免费观看| 亚洲天堂一二三| www.性欧美| 一区二区三区三区在线| 国产拍在线视频| 欧美伦理视频网站| 国产传媒第一页| 久久精品国内一区二区三区水蜜桃| 国内成人精品一区| 亚洲专区在线播放| 91免费版在线看| 红桃一区二区三区| 福利视频亚洲| 国产丝袜一区视频在线观看| 四虎影院中文字幕| 性一交一乱一区二区洋洋av| 亚洲999一在线观看www| 国产h视频在线观看| 婷婷成人激情在线网| 特黄特黄一级片| 残酷重口调教一区二区| 性亚洲最疯狂xxxx高清| www.成人在线观看| **性色生活片久久毛片| 男人的天堂日韩| 色哟哟精品丝袜一区二区| 欧美日韩国产成人| 国产欧美一级片| 亚洲国产精品成人综合| 久久久免费视频网站| 爱爱精品视频| 中文字幕综合一区| 国产精品人人人人| 成人高清视频在线观看| 国产日韩欧美大片| 精品国产亚洲一区二区三区大结局| 在线国产精品视频| 国产黄色免费视频| 久久先锋影音av| 成人毛片视频网站| 久久香蕉网站| 97人人模人人爽人人喊中文字 | 日韩精品中文字幕在线| 国产精品30p| 成人精品视频.| www成人免费| 亚洲一区二区三区四区电影| 久久久99久久精品女同性| 亚洲在线精品视频| 中文字幕日韩一区| 日本77777| 一本一本久久a久久综合精品| 国产区精品视频| 男人和女人做事情在线视频网站免费观看| 欧美在线观看视频一区二区三区| 日韩丰满少妇无码内射| 日韩—二三区免费观看av| 台湾成人av| 中文字幕成人| 欧美精品免费在线| 成人精品在线播放| 精品国产乱码久久久久久虫虫漫画| 成人区人妻精品一区二| 亚洲三级色网| 欧美国产一二三区| 亚洲成人人体| 日韩中文字幕第一页| 国产片在线播放| 一区二区三区不卡视频| 丰满熟女人妻一区二区三区| 亚洲日本成人| 婷婷四房综合激情五月| 精品国产麻豆| 777午夜精品福利在线观看| 邻居大乳一区二区三区| 欧美日韩成人一区| 少妇影院在线观看| av激情综合网| 男女污污的视频| 香蕉av一区二区| 国产精品yjizz| 天天免费亚洲黑人免费| 日韩在线视频国产| 黄色一级大片在线免费看国产| 日韩欧美高清视频| 久久福利免费视频| 99国产精品久久久久| 蜜臀一区二区三区精品免费视频| 欧美久久一级| 鲁丝一区鲁丝二区鲁丝三区| 日本一区二区中文字幕| 久久久久久有精品国产| 高清日韩av电影| 日韩精品最新网址| 涩涩视频在线观看| 亚洲第一综合色| 国精产品视频一二二区| 高清国产一区二区| 亚州精品一二三区| 欧美日韩一区自拍| 特级西西444www大精品视频| 伊人久久影院| 国产日韩在线精品av| 国产在线美女| 久久综合五月天| 国产日韩精品在线看| 日韩视频一区在线观看| 亚洲精品国产欧美在线观看| 一级精品视频在线观看宜春院 | 欧美日韩一区二区在线| 亚洲精品一区二区三区在线播放| 成人av电影在线播放| 57pao国产成永久免费视频| 香蕉久久国产| 亚洲精品少妇一区二区| 青青一区二区三区| 九色91国产| aiai久久| 92国产精品视频| 成人激情视屏| 日韩av第一页| а√天堂8资源中文在线| 久久综合网hezyo| 91在线看片| 亚洲女人天堂视频| 污视频在线免费观看| 日韩区在线观看| 99免费在线视频| 欧美人成免费网站| 伊人网站在线观看| 在线一区二区三区| 丰满少妇xoxoxo视频| 五月开心婷婷久久| 国产精品美女毛片真酒店| 亚洲精品福利视频网站| 男人操女人的视频网站| 中文字幕一区二区三区视频| 山东少妇露脸刺激对白在线| 久久精品视频网| 白白色免费视频| 久久午夜羞羞影院免费观看| 免费黄色在线视频| 久久女同性恋中文字幕| 亚洲精品视频大全| 91香蕉视频黄| 加勒比一区二区| 国产三级精品视频| 男人舔女人下部高潮全视频| 久久精子c满五个校花| b站大片免费直播| 久久精品视频在线看| 香蕉视频久久久| 国产精品乱子久久久久| 日本成人精品视频| 亚洲色图.com| 欧美黑人精品一区二区不卡| 有码一区二区三区| 国产精品99re| 欧美日韩另类字幕中文| 天堂网视频在线| 欧美日韩一级大片网址| 国产精品国产精品国产专区| 777亚洲妇女| 亚洲黄色在线播放| 亚洲精美色品网站| 久久这里精品| 最近更新的2019中文字幕| 久草中文在线| 久久久久久亚洲| 桃花岛tv亚洲品质| 91久久久久久久一区二区| 亚洲精品视频一二三区| 国产高清在线一区| 亚洲人挤奶视频| 涩涩涩999| 欧美精品麻豆| 国产最新免费视频| 麻豆精品一二三| 无码人妻一区二区三区精品视频| 久久综合精品国产一区二区三区 | 蜜芽tv福利在线视频| 最好看的2019年中文视频| 黄色片免费在线观看| 国内揄拍国内精品少妇国语| 欧亚一区二区| 国产91亚洲精品一区二区三区| 全国精品免费看| 亚洲最大色综合成人av| 亚洲国产网站| 免费黄色一级网站| 国产精品影视在线| 一区二区黄色片| 亚洲欧美另类图片小说| 国产嫩bbwbbw高潮| 在线不卡免费欧美| 欧美色视频免费| 久久久精品电影| 日韩电影免费观| 99久久精品无码一区二区毛片 | 在线观看国产精品日韩av| 影音先锋在线视频| 国产福利精品视频| av综合网址| 国产系列第一页| 久久国产高清| 国产a级片视频| 日韩一区中文字幕| 国产女主播喷水视频在线观看| 日韩一区二区三区免费看| 国产高清视频在线播放| 91极品女神在线| 日韩中文字幕在线一区| 亚洲精品久久久久久一区二区| 亚洲久久在线| 精品人妻人人做人人爽夜夜爽| 欧美激情一区二区三区四区| 日韩毛片在线视频| 日韩一区二区三| 天天综合视频在线观看| 国产999精品| 乱亲女h秽乱长久久久| 日本福利视频在线观看| 美女免费视频一区二区| 熟女少妇一区二区三区| 亚洲成人精品影院| 精品国产免费无码久久久| 色偷偷综合社区| 欧美性片在线观看| 人偷久久久久久久偷女厕| 日韩网站在线| 久久免费视频在线观看| 99热在线观看免费精品| 7799精品视频| 麻豆网站在线看| 国产日韩换脸av一区在线观看| 国产99久久| 国产一区二区在线视频播放| 成人免费毛片app| 免费一级全黄少妇性色生活片| 欧美高清视频不卡网| 伊人免费在线| 91精品久久久久久久久| 日韩av在线播放网址| 免费一区二区三区在线观看| 欧美国产1区2区| 亚洲天堂avav| 久久精彩免费视频| 国产精品视频首页| 最新av在线免费观看| 精品一二线国产| 天天操天天操天天操天天操天天操| 欧美日韩色一区| 日本电影全部在线观看网站视频| 国产在线久久久| 中文字幕一区二区三区乱码图片| 久久精品无码一区二区三区毛片| 亚洲女女做受ⅹxx高潮| 亚洲黄色小说网| 91地址最新发布| 欧美综合久久| 蜜桃福利午夜精品一区| 亚洲欧美偷拍三级| 国产叼嘿视频在线观看| 欧美激情在线观看| 色综合www| 欧美三级理论片| 亚洲精品日韩一| 天天射,天天干| 国产成+人+综合+亚洲欧洲| 欧美日韩亚洲在线观看| 午夜精品中文字幕| 亚洲最色的网站| 污污网站免费在线观看| 国产精品h在线观看| 久久性感美女视频| 中文字幕无人区二| 色综合欧美在线视频区| 日本在线免费播放| 成人综合色站| 久久香蕉精品| 日韩三级在线观看视频| 精品国产一区二区三区久久影院| 一区二区三区短视频| 中文字幕久精品免| 成人黄色小视频在线观看| 无码人妻精品一区二区三区不卡| 日韩色av导航| 免费成人三级| 色综合色综合色综合色综合| 亚洲激情图片小说视频| 欧美日本韩国一区二区| 92国产精品久久久久首页| 亚洲欧美日韩一区在线观看| 国产视频精品免费| 亚洲成人精品久久| 日韩护士脚交太爽了| 男女视频网站在线观看| 1024亚洲合集| 精品久久av| 国产精品9999久久久久仙踪林| 日韩中文字幕一区二区三区| 久久久国产精华液| 中文字幕亚洲激情| 日韩精品免费一区二区夜夜嗨| 国产永久免费网站| 一本色道久久综合亚洲精品按摩|