精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

細粒度對齊無需仔細標注了!淘天提出視覺錨定獎勵,自我校準實現多模態對齊

人工智能 新聞
為有效緩解 LVLMs 中的幻覺現象,團隊提出了一種創新的令牌級偏好對齊方法(Token Preference Optimization,TPO),針對性設計了一個能夠自我校準的視覺錨定獎勵信號。

核心作者包括顧紀豪,王瑛瑤。工作由淘天集團算法技術 - 未來生活實驗室團隊主要完成。為了建設面向未來的生活和消費方式,進一步提升用戶體驗和商家經營效果,淘天集團集中算力、數據和頂尖的技術人才,成立未來生活實驗室。實驗室聚焦大模型、多模態等 AI 技術方向,致力于打造大模型相關基礎算法、模型能力和各類 AI Native 應用,引領 AI 在生活消費領域的技術創新。

近年來,視覺大模型(Large Vision Language Models, LVLMs)領域經歷了迅猛的發展,這些模型在圖像理解、視覺對話以及其他跨模態任務中展現出了卓越的能力。然而,隨著 LVLMs 復雜性和能力的增長,「幻覺現象」的挑戰也日益凸顯。

為有效緩解 LVLMs 中的幻覺現象,團隊提出了一種創新的令牌級偏好對齊方法(Token Preference Optimization,TPO),針對性設計了一個能夠自我校準的視覺錨定獎勵信號

該方法首次在多模態偏好對齊領域實現了自動校準獎勵,優化每個令牌生成時與視覺信息的相關性。同時,它也是多模態領域首個無需人工細粒度標注的令牌級偏好優化方法,從而提升了模型的優化效率和自動化水平。

圖片

  • 論文標題:Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation
  • 作者單位:阿里巴巴淘天集團 & MBZUAI
  • 論文鏈接:https://arxiv.org/pdf/2412.14487

背景

現如今的 DPO 方法通過直接對齊人類偏好,在緩解大型視覺語言模型幻覺問題方面取得了顯著成效。然而它仍然面臨兩個問題:

  • 缺少高效和可擴展的 token-level 的獎勵信號:如圖 1 所示,現有的多模態偏好對齊方法要么使用 sequence-level 的獎勵,要么需要通過細粒度標注獲得 token- level 的監督信號。因此,設計一個高效且可擴展的 token-level 的監督信號非常重要。
  • 在訓練的過程中忽略了視覺錨定的 tokens(visual-anchored tokens)對所有 token 分配相同的獎勵是低效的,依賴視覺信息生成的 tokens 更容易產生幻覺并需要重點對待(如圖 2 中的 glass)。

圖片

圖 1:TPO 方法和其它消除幻覺的 DPO 改進方法的對比。比較了是否關注視覺錨定信息,是否生成 token-level 的監督信號和是否需要細粒度標注。比較的方法包括 DPO、POVID、CSR、RLHF-V、V-DPO 和論文中的方法 TPO。

為了解決上述問題,TPO 具有如下特點:

  • 自動識別偏好數據中的視覺錨定 token,無需人工細粒度標注。
  • 在每個訓練步自動地分配 token-level 的獎勵,該獎勵可以反映當前 token 對圖片信息的依賴程度。

圖 2 可視化了 TPO 訓練前后的 ground truth 及模型回復的視覺錨定獎勵。可以看到,我們的方法有效地找到了視覺錨定的 tokens,并能夠在訓練之后增強模型對視覺信息的關聯。

圖片

圖 2:一個視覺 QA 對的例子以及 TPO 對視覺信息錨定程度的打分可視化,上面的框是 GT_answer,下面的框是 LVLM 在使用 TPO 訓練前后的回復。在每一個框中,上方是 TPO 訓練前的打分,下方則是訓練后的打分。

方法

圖片

圖 3:TPO 的整體流程

TPO 整體流程

(以下步驟中的數據包含輸入 x,圖像 v 和正負樣本 y_w,y_l。當不強調正樣本或負樣本時,統稱為 y.)

1. 自校準的視覺錨定獎勵生成

TPO 通過捕捉在圖像是否加噪時每個生成 token 的生成概率差的變化來衡量其視覺錨定程度,首先對輸入圖像進行加噪處理

圖片

這里 ε ∈ N(0,1),圖片 圖片是提前設置好的噪聲參數,是含有 1000 個元素呈等差數列的列表。k 代表加噪步數。

在獲得了加噪圖像之后計算圖片,用來反映每個 token 的視覺錨定程度。它可以在每個訓練步中的自動更新,對于 y 中的每一個 token圖片

圖片

進一步地,在此引入自我校準的過程獲得最終的監督信號。這一步的目的是為正負樣本分配相應獎勵的同時,能夠對二者中所有視覺錨定 token 進行視覺信息關聯度的優化。最終的視覺監督信號被定義為:

圖片

通過 sigmoid 歸一化,圖片。可以看出,對于正樣本,監督信號 c 隨 s 的增大而增大,對于負樣本則相反。由于當 圖片 時,該 token 沒有錨定視覺信息,無監督信號,此時設置 a=0.5, s=0,則 c=1,監督信號將不發揮作用。

TPO 訓練

在獲得了自校準的視覺錨定信號圖片之后,可以根據 DPO 方式定義新的視覺錨定分布

圖片

則反饋函數為:

圖片

其中圖片圖片分別代表來自 policy 模型和 reference 模型的反饋信號。可以看到,相對于原始的 DPO,該團隊在此基礎上為每一個 token 加入了監督信號圖片,而且圖片可以在訓練過程中的每一個 step 中迭代,達到自我校準的目的。

TPO 在反饋函數中引入了圖片,該項可以推導出合理的上下界。由于正負樣本不同的圖片計算方法,在訓練過程中會讓圖片不斷增大,讓模型輸出錨定更多的視覺信息。

最終得到 TPO 的優化目標為:

圖片

實驗結果

實驗設置

  • 基礎模型:LLaVA-1.5(7B)/(13B)。
  • 數據:RLHF-V(5k)。
  • Benchmark:幻覺評測集 AMBER、MMHal、HallusionBench,通用評測集 SeedBench、MMBench、LLaVA-Bench 及 MM-Vet。

主實驗結果

圖片

圖 4:各種強化學習方法在 LLaVA-1.5 上測試的在幻覺和通用 benchmarks 上的實驗效果,其中 POVID 和 CSR 方法的結果是根據開源的模型權重測試的效果,V-DPO 的結果來自該文章的結果。

  • TPO 在 LLaVA-1.5(7B)/(13B)模型上均帶來非常顯著的幻覺緩解效果,在大部分幻覺指標上超越了現有的偏好對齊幻覺緩解方法。
  • 在 HallusionBench 中,easy 代表基于原圖問答,hard 代表基于人工編輯的反事實圖片問答。我們的方相較于初始模型在 hard 問題上取得了更顯著的提高,說明在 TPO 后,答案生成更依賴于視覺信息而非語言模型先驗知識。

消融實驗

  • 圖像加噪的 steps 數量:如圖 5 顯示,加噪步數設置為 500 最優。
  • 獎勵自校準中的 a: a=0.5 最優,即當 s=0 時,c=1 時,不分配獎勵信號。

圖片

圖 5: 各指標隨著加入噪聲步數和參數 a 的變化趨勢

  • 獎勵分配方式:只為正樣本或負樣本單獨引入 TPO 的獎勵,也可取得較優的對齊效果,但同時分配獲得最優表現。調換正負樣本中 token 獲取的獎勵和其視覺錨定程度的相關性,TPO 表現變差。

圖片

圖 6: 消融實驗

分析實驗

  • Attention 分析:圖 7 展示了在 TPO 訓練前后,模型回復中每個 token 對圖像 token 的 attention 分數加和的分布。可以看到,TPO 訓練可以拉高模型回復對圖像信息的關聯程度,錨定更多圖像信息,進而緩解幻覺問題。

圖片圖 7:attention weights 對比圖,左邊藍色的是訓練前模型回答錯誤的回復,右邊紅色的是訓練后模型回答正確的回復。

  • 獎勵自校準分析:圖 8 展示了正負樣本的監督信號 c 隨訓練 step 的變換,證明了 TPO 在不斷自我校準獎勵的過程中,讓模型逐漸關注到更多的圖像信息。

圖片

圖 8: 正負樣本的 c 隨訓練 step 得變化過程

淘天集團算法技術 - 未來生活實驗室團隊將持續深耕強化學習領域,為解決多模態幻覺問題貢獻力量。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-29 09:21:00

2025-02-26 13:00:00

2024-06-20 10:49:15

2022-02-28 10:31:22

人工智能視覺檢測

2024-10-28 14:20:00

2025-02-18 09:10:00

2025-03-25 10:13:26

模型AI數據

2023-12-04 13:40:09

AI訓練

2024-06-27 08:00:00

存儲數據庫細粒度

2023-08-15 14:35:48

2010-04-14 11:04:53

Oracle細粒度

2025-03-12 03:00:00

Finer-CAM醫學影像深度學習

2009-10-27 09:31:24

Windows Ser口令策略

2010-04-19 09:35:58

Oracle細粒度

2009-04-16 17:59:25

細粒度權限

2024-11-04 13:30:00

模型AI

2023-11-09 15:10:00

訓練數據

2025-09-01 08:10:09

細粒度圖像分類細粒度視覺分類FGVC

2024-07-31 15:38:00

2025-10-21 12:40:05

點贊
收藏

51CTO技術棧公眾號

国产麻豆精品在线观看| 亚洲综合小说图片| 亚洲午夜免费视频| 国产精品一区二区免费看| 综合激情网五月| 黄色不卡一区| 精品国产一区二区国模嫣然| 91猫先生在线| 老司机午夜在线视频| 国产精一区二区三区| 日本精品性网站在线观看| 午夜精品一区二区三区视频| 亚洲成人一品| 日韩欧美在线影院| www.涩涩涩| av中文在线资源库| 成人免费在线播放视频| 精品福利影视| 国产欧美日韩综合精品一区二区三区| 免费视频一区| 欧美激情精品久久久久久大尺度| xxxx日本黄色| 日韩精品社区| 日韩一区国产二区欧美三区| 91极品尤物在线播放国产| 91久久精品久久国产性色也91| 成人免费av片| 日韩欧美中文字幕在线视频| 欧美在线观看视频一区二区| 欧美黑人经典片免费观看| 免费高清在线观看| 久久伊人蜜桃av一区二区| 99国产超薄肉色丝袜交足的后果| a片在线免费观看| 噜噜爱69成人精品| 韩日欧美一区二区| 国产在线视频99| 2023国产精品久久久精品双| 伊人久久免费视频| 国精产品一区一区三区免费视频 | 亚洲高清久久久| 在线观看成人av电影| 久热av在线| 91看片淫黄大片一级在线观看| 国产精品国产亚洲精品看不卡15| 国产a级免费视频| 国产乱淫av一区二区三区 | 欧美激情一区二区三区免费观看| aⅴ色国产欧美| 97视频在线播放| 伊人国产在线观看| 伊人成人在线| 久久人91精品久久久久久不卡| 欧美特黄一级片| 久久电影院7| 色综合伊人色综合网| 农村老熟妇乱子伦视频| 日韩情爱电影在线观看| 日韩在线免费观看视频| www.xx日本| 中文字幕免费一区二区三区| 欧美精品一区二区免费| 欧美三级在线免费观看| 合欧美一区二区三区| 欧美激情一区二区久久久| 国产无套内射又大又猛又粗又爽| 99热精品在线| 国产精品高潮呻吟久久av无限| 日批视频免费观看| 激情综合色播五月| 99三级在线| 午夜性色福利视频| 国产欧美精品国产国产专区| 一区二区成人国产精品 | 欧美伦理在线视频| 日韩在线视频国产| 欧美人妻精品一区二区三区| 亚洲国产清纯| 国产精品 欧美在线| 亚洲一区二区影视| 国产suv精品一区二区三区| 激情小说综合区| 91在线视频免费看| 伊人色综合久久天天人手人婷| www精品久久| 欧美一区久久久| 宅男噜噜噜66一区二区66| 性活交片大全免费看| 亚洲丁香日韩| 超碰日本道色综合久久综合 | 亚洲精品视频啊美女在线直播| 青青草精品毛片| 91尤物国产福利在线观看| 国产成人精品亚洲777人妖| 欧美动漫一区二区| 99在线播放| 色999日韩国产欧美一区二区| 亚洲精品第三页| 欧美激情影院| 欧美成人免费一级人片100| 日韩欧美成人一区二区三区| 久久黄色级2电影| 精品无码久久久久久久动漫| 麻豆av在线免费看| 精品国产鲁一鲁一区二区张丽| 一级黄色录像在线观看| 日韩精品社区| 欧美黑人性生活视频| 波多野结衣一区二区三区在线 | 国产一区在线免费观看| 91.xxx.高清在线| 精品国产乱码久久久久酒店 | 99精品欧美一区二区三区综合在线| 亚洲精品一区二区三区av| 国产精选在线| 日韩一区二区免费在线电影 | 视频福利在线| 亚洲九九爱视频| xxxx一级片| 亚洲激情77| 97精品国产97久久久久久| 一区二区久久精品66国产精品| 99精品国产视频| 99久久99久久精品| 99视频有精品高清视频| 亚洲欧洲日产国码av系列天堂| 久久综合色综合| 国产精品一区二区久激情瑜伽| 四虎一区二区| 欧美激情喷水| 国产欧美日韩在线| 91精品国产免费久久综合| 蜜臀av粉嫩av懂色av| 91精品国产91久久久久久黑人| 国产精品美女久久| 国产福利在线| 色一区在线观看| 成人免费无码大片a毛片| 精品96久久久久久中文字幕无| 亚洲在线视频福利| 老司机精品视频在线观看6| 欧美性受xxxx黑人xyx性爽| 亚洲自拍偷拍一区二区| 亚洲欧美日韩视频二区| 久久精品国产精品青草色艺| zzzwww在线看片免费| 亚洲第一精品夜夜躁人人躁| 精品少妇theporn| 懂色av一区二区三区免费观看| 伊人再见免费在线观看高清版 | 欧美日韩生活片| 毛片不卡一区二区| 中文字幕日韩一区二区三区| 国产伊人久久| 久久伊人免费视频| www.五月天激情| 亚洲午夜久久久久久久久久久| 97人妻精品一区二区三区免费| 亚洲东热激情| 欧美福利一区二区三区| 国产精品字幕| www.日韩.com| 亚洲黄色在线播放| 午夜精彩视频在线观看不卡| 一区二区精品免费| 麻豆精品国产传媒mv男同| 在线视频一区观看| 亚洲精品在线a| 91精品国产乱码久久久久久久久| 日夜干在线视频| 在线观看欧美日本| 国产一区二区视频在线观看免费| 成人深夜福利app| 六月丁香婷婷激情| 日韩精品免费一区二区三区| 91久久精品一区二区别| 老司机深夜福利在线观看| 亚洲偷欧美偷国内偷| 国产又粗又黄又爽的视频| 一区二区欧美视频| b站大片免费直播| 精品一区精品二区高清| 91精品国产91久久久久麻豆 主演| 日本欧美韩国国产| 国产一区二区在线免费| 欧洲在线视频| 亚洲午夜激情免费视频| 国产美女精品视频国产| 激情久久av一区av二区av三区| 国产又粗又猛又爽又黄av| 国产在线精品一区在线观看麻豆| 免费在线观看视频a| 欧美艳星介绍134位艳星| 成人动漫视频在线观看免费| 三上悠亚一区二区| 九九精品在线视频| 国产毛片av在线| 欧美成人一区二区三区| 欧美性猛交xxxx乱大交hd | 欧美视频在线第一页| 亚洲综合图色| 高清不卡一区二区三区| 欧美成人app| 97视频在线观看免费| 男人影院在线观看| 亚洲免费福利视频| 午夜精品小视频| 欧美三级在线视频| 日韩成人免费观看| 亚洲欧美另类久久久精品2019| 一级片视频免费看| 不卡区在线中文字幕| 日韩成人精品视频在线观看| 欧美亚洲一区| 97干在线视频| 999精品一区| 日韩高清国产精品| 色婷婷av一区二区三区丝袜美腿| 51国偷自产一区二区三区的来源 | 青青青视频在线播放| 99久久精品免费看国产免费软件| www.污网站| 麻豆视频观看网址久久| 激情内射人妻1区2区3区| 亚洲三级影院| 国产精品第157页| 最新欧美人z0oozo0| 中文字幕一区二区三区精彩视频| 久草成人资源| 欧美精品七区| 国产精品丝袜在线播放| 91视频网页| 午夜精品在线| 亚洲伊人久久大香线蕉av| 色综合一区二区日本韩国亚洲| 国产精品pans私拍| 台湾佬中文娱乐久久久| 欧美综合第一页| 亚洲性色av| 欧美性受xxx| 成人福利视频| 国产成人久久精品| 欧美黑人粗大| 国产精品美女久久久免费| 欧美片第一页| 国产精品国产三级国产专播精品人| 中文在线资源| 国产成人精品一区二区在线| 天天综合网站| 国产精品一区二区三区毛片淫片 | av综合电影网站| 日本欧美精品在线| 高潮一区二区| 国产精品国产三级国产专播精品人| 日本在线中文字幕一区二区三区| 国产成人精品视频在线| 日本一区二区三区视频在线| 国产精品美乳一区二区免费| 四虎永久精品在线| 91精品中文在线| 中文字幕一区二区三区日韩精品| 国产a一区二区| 秋霞综合在线视频| 欧美日韩一区综合| 色999日韩| 9191国产视频| 国产精品综合| 91福利国产成人精品播放| 久久精品99国产精品日本| 欧美国产日韩在线视频| 99久久免费视频.com| 51妺嘿嘿午夜福利| 亚洲天堂2016| 日韩精品视频免费播放| 日韩欧亚中文在线| 国产精品久久久久久免费免熟| 日韩一区二区免费高清| 日韩电影免费| 日韩中文视频免费在线观看| 色呦呦呦在线观看| 国产成人aa精品一区在线播放| 精品人妻午夜一区二区三区四区 | 亚洲成av人乱码色午夜| 五月天婷婷社区| 中文字幕不卡在线视频极品| 在线电影福利片| 欧美最猛黑人xxxx黑人猛叫黄| 欧美一级做a| 国产精品视频在线免费观看 | 日韩日本欧美亚洲| 成人在线免费观看黄色| 日韩av免费在线看| 日韩高清二区| 日韩精品极品视频在线观看免费| 亚洲第一偷拍| 成人黄色片视频| 国产高清一区日本| 四季av中文字幕| 偷拍一区二区三区四区| 国产一区二区视频免费观看| 亚洲精品国偷自产在线99热 | 不卡视频在线| 欧美综合在线播放| 精品在线你懂的| 亚洲狠狠婷婷综合久久久久图片| 中文字幕亚洲综合久久菠萝蜜| 九九热在线视频播放| 欧美一区二区三区免费在线看 | 欧美一区二区.| 精品国产第一国产综合精品| 日本精品一区二区| 最新国产乱人伦偷精品免费网站| 欧美wwwwwww| 久久综合成人精品亚洲另类欧美 | 欧美丰满一区二区免费视频| 日本在线视频1区| 欧美激情第99页| 一区二区三区| 日本一区二区三区视频免费看 | 手机av在线免费| 国产情人综合久久777777| 日本三级中文字幕| 欧美一区二区视频免费观看| 91涩漫在线观看| 欧美一区二区三区免费观看| 粉嫩的18在线观看极品精品| 97超碰免费观看| 美腿丝袜亚洲色图| 欧美成人另类视频| 在线观看网站黄不卡| 四虎电影院在线观看| 午夜精品久久久久久久男人的天堂 | 亚洲成a人片在线www| 亚洲欧洲www| 亚洲天堂avav| 色小说视频一区| 91av一区| 杨幂一区欧美专区| 青青草国产精品97视觉盛宴| av电影网站在线观看| 欧美性色视频在线| 日韩a在线观看| 青青a在线精品免费观看| 在线视频亚洲专区| 黄色免费观看视频网站| 91女神在线视频| 精品久久久久久久久久久久久久久久 | 欧美壮男野外gaytube| 亚洲日本三级| 激情婷婷综合网| 日本一区免费视频| 在线观看毛片视频| 精品国产依人香蕉在线精品| 香蕉久久久久久| 国产一二三四五| 国产成人自拍在线| 日韩av女优在线观看| 亚洲国产黄色片| xxxxx性欧美特大| 日韩欧美精品一区二区三区经典| 日本不卡高清视频| 亚洲少妇xxx| 日韩精品最新网址| 888av在线视频| 你懂的网址一区二区三区| 日本不卡中文字幕| 亚洲欧美精品aaaaaa片| 日韩欧美视频一区| 黄频免费在线观看| 日韩高清国产精品| 激情六月婷婷综合| 国产成人精品av久久| 亚洲欧洲视频在线| 日韩一级特黄| 91视频 - 88av| 91啦中文在线观看| 91国内精品视频| 欧美激情一区二区久久久| 亚洲最好看的视频| √天堂资源在线| 粉嫩av一区二区三区免费野| 成年人视频在线免费观看| 亚洲a∨日韩av高清在线观看| 亚洲大胆av| 天天干天天舔天天操| 日韩欧美美女一区二区三区| 亚洲插插视频| 精品一区二区成人免费视频| 97久久精品人人做人人爽| 久久精品99北条麻妃| 欧美精品久久久久久久免费观看 | 99视频热这里只有精品免费| 日韩中文字幕高清| 欧美第一淫aaasss性| 精品一级毛片| 亚洲麻豆一区二区三区| 欧美在线不卡一区| 白浆视频在线观看| 中文字幕中文字幕99| 91麻豆蜜桃一区二区三区|