精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

當視覺大模型陷入認知失調,馬里蘭大學構建了一個幻覺自動生成框架

人工智能 新聞
馬里蘭大學的研究團隊提出了一個名為 AutoHallusion 的視覺大模型幻覺自動生成框架。

本文的共同第一作者是馬里蘭大學電子計算機工程系的博士生吳曦旸(https://wuxiyang1996.github.io/)和計算機科學系的關天瑞(https://tianruiguan.phd/)。吳曦旸的研究方向主要涵蓋強化學習、自動駕駛,以及大語言模型在機器人導航和計算機視覺中的應用。關天瑞的研究則聚焦于計算機視覺和視覺語言模型在機器人、自動駕駛等領域的應用。本文的指導老師為李典奇,周天翼教授 (https://tianyizhou.github.io/)和 Dinesh Manocha 教授 (https://www.cs.umd.edu/people/dmanocha)。

想象一下,有一天你在沙漠中看到一個雪人,或者在雪地里發現一棵棕櫚樹。面對這些與周圍環境格格不入的景象,你是否會感到心理上的不適?

在認知科學領域,研究者普遍認為人腦傾向于利用以往的經驗來解讀觀察到的信息并構建記憶。然而,當人腦接收到與以往認知不符的信息時,可能會因為 “認知失調”(Cognitive Dissonance)而對外部環境產生誤判,進而在行為上表現出矛盾。例如,我們通常認為電腦是由人類操控的,但如果我們看到一只章魚在操控電腦,這種不符合常理的場景會讓人腦產生認知失調的不適感。

隨著對大模型的深入研究,研究人員發現,在認知和推理任務上,大模型的思維過程與人腦有一定相似之處。因此,針對人腦認知失調特點設計的實驗也能使大模型出現類似的 “幻覺” 現象。

基于這一觀察,馬里蘭大學的研究團隊提出了一個名為 AutoHallusion 的視覺大模型幻覺自動生成框架。這一工作基于團隊之前在 CVPR 2024 上發表的工作 HalluionBench(https://arxiv.org/pdf/2310.14566)。它通過在場景圖像中插入或刪除特定物體,并針對這些修改后的圖像提問,從而檢測大模型在回答時可能出現的幻覺現象。

這一方法能夠自動生成大量的大模型幻覺案例,有效緩解當前大模型幻覺研究中數據集缺乏的問題。在 GPT-4V、Gemini 和 Claude 等大模型上的實驗表明,這些模型在本文提出的提出的基準數據集上問答準確率最高僅為 66.0%。該研究成果已發表于 EMNLP 2024。

圖片

  • 論文標題:AUTOHALLUSION: Automatic Generation of Hallucination Benchmarks for Vision-Language Models
  • 論文鏈接:https://arxiv.org/pdf/2406.10900
  • 項目主頁及代碼:https://wuxiyang1996.github.io/autohallusion_page/

文章概述

大型視覺語言模型(LVLMs)在內容生成、自動駕駛和機器人等領域中扮演著重要角色。然而,它們也會出現 “幻覺” 現象,即生成的響應中包含視覺內容中不存在的信息。這些幻覺通常是由于語言模塊過度依賴語言先驗信息而忽略視覺輸入所致。

為了解決這一問題,之前的工作通常收集幻覺案例建立基準數據集,并以此對大模型進行微調,以減少可能存在的幻覺。然而,手動創建幻覺案例和基準既耗時又昂貴。此外,之前的工作對大模型產生幻覺的機制研究有限,在缺乏足夠代表性案例的情況下對大模型進行微調,可能會導致模型出現過擬合現象。

為此,本文提出了 AUTOHALLUSION 框架,可以自動生成各種幻覺案例并進行批量生產。該框架基于認知科學原理,針對大模型產生幻覺的原因,提出了三種主要策略:插入異常物體、插入成對物體和移除相關物體,通過操控場景中的物體構成來創建與語言先驗相沖突的圖像。

為了生成能夠觸發大模型幻覺的(圖像 - 問題)組合,本文針對修改后的圖像,設計相應的問題探測大模型的語言模塊,定位特定物體或其在相關情境中的語言先驗信息。如果大模型的推理受到語言先驗的偏見影響,例如在根據圖片回答某一特定物體的問題時,大模型根據場景圖片的先驗知識而非物體本身傳遞的信息來作答,那么就可能生成與事實不符或前后不一致的響應,從而導致幻覺現象。

AUTOHALLUSION 在包括 GPT-4V、Gemini、Claude 和 LLaVA 等最新的大模型上進行了實驗,并整理發布了一個基準數據集,來評估模型性能。在該基準數據集上的實驗結果表明,GPT-4V 等大模型的問答準確率最高僅為 66.0%。

數據集地址:https://github.com/wuxiyang1996/AutoHallusion

研究方法

圖片

AUTOHALLUSION 的整體流程分為四個部分:

1. 場景生成:AUTOHALLUSION 使用合成或真實世界圖像作為場景圖。例如,在辦公室場景中,假設場景中有電腦、辦公桌、辦公椅等與辦公室主題一致的物體,而不會有炒鍋等與主題無關的物體。圖像可以通過 DALL-E 等圖像生成模型根據提示生成,也可以從 MSCOCO 等公開數據集中提取場景。

2. 圖像處理:AUTOHALLUSION 采用三種策略操控場景中的物體構成,以創建與語言先驗相沖突的圖像:

  • 插入異常物體:將與場景主題不相關的異常物體添加到場景中,例如,在辦公室場景中添加通常不會出現的炒鍋。
  • 插入成對物體:對通常一起出現的兩個物體進行分離,保留一個并移除另一個。例如,牙刷和牙膏通常一起出現,而在修改后的圖像中,只保留牙刷并移除牙膏。
  • 移除相關物體:從原場景中移除一個相關物體,例如,在辦公室場景中抹除顯示器。

3. 構造問題:AUTOHALLUSION 針對圖像處理過程中插入或刪除的物體進行提問,并相應地構造事實信息。問題主要分為兩類:

  • 存在性問題:詢問目標物體是否存在于圖像中,問題提示信息的細節級別不一,從不提供額外信息到提供完整的圖像描述。
  • 空間關系問題:詢問目標物體與場景中其他物體的相對位置,并在問題提示中提供場景物體的名稱或描述。

圖片

4. 幻覺檢測:AUTOHALLUSION 通過對比大模型的回答與事實信息或其他回答,來判斷其回答中是否存在幻覺。目前,AUTOHALLUSION 能夠檢測以下兩種類型的大模型幻覺:

  • 正確性:大模型的回答與基本事實不一致。
  • 一致性:大模型在面對包括不同級別的補充信息的問題時,無法給出一致的答案,或者在針對某一特定物體的提問中,未能提供與圖像描述一致的答案。

實驗結果

下表展示了通過 AutoHallusion 生成的大模型幻覺案例的成功率,結果顯示出以下幾個主要發現:

  • 插入物體的幻覺生成策略比刪除物體的策略更有效。
  • 基于物體存在性構建的問題比基于物體空間關系的問題更容易引發幻覺。
  • GPT-4V 在防止大模型幻覺方面表現最好。
  • 針對真實世界數據集構建的幻覺案例成功率高于合成數據集。本文認為,這可能是由于大模型難以處理真實世界圖像中物體語義關系的復雜性所致。

圖片

下圖展示了針對物體 - 場景對齊關系的消融實驗結果。在該實驗中,本文采用不同的大模型來生成用于圖像編輯的物體,并在視覺問答(VQA)任務中進行評估。

圖片

基準數據集指標

本文從以下三個方面評估了通過 AutoHallusion 生成的基準數據集:

  • 多樣性:衡量數據集中不同場景和對象的數量,包括 200 個(合成)/160 個(真實世界)樣本。
  • 圖像質量:通過原始圖像和編輯圖像的 IS(Inception Score)分數,以及原始圖像與編輯圖像之間的 Frechet Inception Distance (FID) 距離來評估。
  • 有效性:通過每個樣本中引發幻覺的平均問題數量來衡量。

圖片

下表展示了 GPT-4V、Gemini、Claude 和 LLaVA 等大模型在通過 AutoHallusion 生成的基準數據集上的表現。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-31 12:23:17

GPT-4版本VLM

2025-09-18 09:00:47

2025-08-18 17:20:17

AI大模型數據

2025-09-03 14:02:08

AI大模型訓練

2023-10-07 06:50:03

2023-11-03 12:56:00

AI模型

2025-04-26 09:25:00

模型推理AI

2025-03-03 09:00:00

2020-10-26 10:51:09

人工智能AI語言

2025-04-15 09:00:00

模型推理AI

2019-01-03 09:04:04

谷歌系統機器

2025-01-23 08:22:22

2024-01-30 21:18:57

語言模型圖像序列機器人

2025-02-26 07:00:00

Go 語言Ollama 模型dubbogo

2021-10-09 15:32:11

信息安全技術

2021-07-02 16:24:08

自動駕駛無人駕駛人工智能

2025-01-06 11:10:00

架構模型AI

2024-06-17 13:34:38

2023-06-19 13:44:00

AI3D
點贊
收藏

51CTO技術棧公眾號

一二三四区精品视频| 精品一区二区三区日韩| 懂色aⅴ精品一区二区三区蜜月| 国产精品入口福利| 九九视频在线免费观看| 亚州综合一区| 欧美日本在线一区| 人妻无码久久一区二区三区免费| 国产精品一区二区黑人巨大 | 色一情一乱一乱一91av| 欧美不卡视频一区| 波多野结衣久久精品| www黄在线观看| 国产精品magnet| 亚洲天堂久久av| 9191在线视频| 国产精品蜜月aⅴ在线| 亚洲综合激情小说| 亚洲一区二区三区涩| 91视频免费网址| 国产乱论精品| 678五月天丁香亚洲综合网| 热99这里只有精品| av在线免费播放| 国产三级精品视频| 国产精品一国产精品最新章节| 欧美三级在线免费观看| 在线观看欧美| 色欧美乱欧美15图片| 国产高清不卡无码视频| 亚洲精品国产av| 麻豆91精品91久久久的内涵| 91精品国产99| 精品久久免费视频| 精品素人av| 日韩欧美一二三区| 天天操狠狠操夜夜操| 91精品论坛| 国产日产亚洲精品系列| 精品一区久久久久久| a天堂中文在线观看| 久久精品国产精品亚洲红杏| 秋霞午夜一区二区| 日韩三级小视频| 欧美日韩 国产精品| 久久精品在线播放| 精品熟妇无码av免费久久| 日韩在线黄色| 日韩精品在线观看一区| 国产麻豆天美果冻无码视频| 秋霞国产精品| 亚洲欧美日韩国产手机在线| 日韩精品一区二区在线| 亚洲美女在线看| 成人做爰www看视频软件| 在线播放高清视频www| 亚洲午夜国产一区99re久久| 中文字幕色呦呦| 日韩精品视频无播放器在线看 | 精品中文字幕一区二区| 国产精品国产三级国产aⅴ浪潮 | 国产又黄又粗又长| 麻豆精品在线观看| 国产在线不卡精品| 99精品免费观看| 国产精品社区| 日韩免费视频在线观看| 亚洲一级二级片| 91精品婷婷色在线观看| 久久国产精品久久久| 九九这里只有精品视频| 综合在线视频| 欧美激情一区二区三区在线视频观看 | 国产调教在线观看| 日韩成人精品一区| 久久久精品亚洲| 色在线观看视频| 韩国一区二区三区在线观看| 26uuu日韩精品一区二区| 无码一区二区三区| 精品在线视频一区| 成人欧美一区二区三区视频| 天天干天天插天天操| 久久只精品国产| 亚洲精品欧美精品| 在线看一级片| 欧美日韩激情小视频| 日韩av电影在线播放| 麻豆tv在线播放| 亚洲天堂资源| 91.麻豆视频| 在线观看免费视频黄| 日韩精品福利一区二区三区| 中国china体内裑精亚洲片| 亚洲综合网在线| 91久久视频| 国产欧美 在线欧美| 亚洲成人一二三区| 国产午夜精品一区二区| 成人欧美一区二区三区视频xxx| 中文字幕人妻一区二区三区视频| 在线视频精品| 成人免费淫片视频软件| 五月天福利视频| 亚洲欧洲国产日本综合| 少妇无码av无码专区在线观看 | 26uuu亚洲综合色| 国产欧美日韩视频一区二区三区| 亚洲系列第一页| 成人精品视频一区二区三区尤物| 2014亚洲精品| 岛国在线视频免费看| 亚洲国产美女搞黄色| 日本免费a视频| 91九色综合| 欧美日韩免费一区二区三区| 午夜剧场免费看| 欧美国产一级| 欧洲亚洲在线视频| 亚洲av无码国产精品永久一区| 国产精品自拍av| 日韩av影视| 国产白浆在线免费观看| 日韩写真欧美这视频| 日本美女bbw| 久久综合中文| 精品国产二区在线| 尤物视频在线看| 在线成人免费视频| 成人小视频免费看| 久久综合图片| 成人黄色影片在线| 在线国产情侣| 国产理论在线| 亚洲高清久久久| 亚洲午夜精品在线观看| 警花av一区二区三区| 91麻豆精品国产无毒不卡在线观看| 国产传媒免费观看| 日本久久黄色| 国产精品日韩精品| 精品国产99久久久久久宅男i| 成人黄色一级视频| 4444亚洲人成无码网在线观看| a级片免费在线观看| 日韩一区二区免费电影| 男人在线观看视频| 国产一区二区三区在线看麻豆| 国产乱子伦精品| av在线最新| 亚洲激情在线视频| 欧美一级视频免费观看| 91免费看片在线观看| 九色在线视频观看| 国产精久久久| 不卡中文字幕av| 国产高清在线免费| 亚洲一区二区视频在线观看| 在线中文字日产幕| 天天射天天综合网| 欧美做爰性生交视频| 青青国产在线| 亚洲一级不卡视频| 影音先锋人妻啪啪av资源网站| 99久久激情| 日本精品久久中文字幕佐佐木| 99免费在线视频| 一区二区三区四区精品在线视频| 久久久国产欧美| 91综合在线| av资源一区二区| 老色鬼在线视频| 日韩精品一区二区三区老鸭窝| 毛片久久久久久| 国产一区二区导航在线播放| 超级碰在线观看| 蜜桃久久久久| 国产精品第一第二| 日本成人网址| 在线欧美一区二区| 国产这里有精品| 91在线丨porny丨国产| 亚洲三级视频网站| 欧美视频二区| 欧美深深色噜噜狠狠yyy| 99久久婷婷国产综合精品首页| 亚洲全黄一级网站| 国产精品老熟女视频一区二区| 欧美激情一区二区三区| 欧美色图校园春色| 亚洲精品成人影院| 欧美三级电影一区| 一区二区三区四区欧美| 日韩中文在线| 国产99久久精品一区二区 夜夜躁日日躁| 国产黄色一区二区| 亚洲柠檬福利资源导航| 国产男女猛烈无遮挡a片漫画| av成人国产| 亚洲成年人专区| 亚洲妇女av| 亚洲综合色av| 欧美78videosex性欧美| 亚洲性线免费观看视频成熟| 国产高潮流白浆喷水视频| 91精品1区2区| 国产精品theporn动漫| www.日韩精品| xxx中文字幕| 日本不卡123| 大j8黑人w巨大888a片| 亚洲国产不卡| 视频二区一区| 欧美精品国产白浆久久久久| 日本一区二区不卡| 91精品专区| 欧美一区二区网站| 欧美人妻精品一区二区三区| 国产欧美日韩视频在线观看| 日韩成人av一区二区| 国产精品一二三区在线| jizz欧美性11| 日韩高清一区在线| 东京热加勒比无码少妇| 亚洲激情不卡| 菠萝蜜视频在线观看入口| 日韩精品二区| 五月天亚洲综合情| 国产欧美久久一区二区三区| 好吊色欧美一区二区三区| 亚洲性受xxx喷奶水| 高清欧美性猛交xxxx黑人猛交| 男男电影完整版在线观看| 亚洲成人xxx| 免费av一级片| 精品国产三级电影在线观看| 国产欧美熟妇另类久久久| 在线不卡免费欧美| 亚洲熟女乱色一区二区三区久久久| 一区二区三区欧美亚洲| 人妻丰满熟妇av无码久久洗澡| 美女视频免费一区| 另类小说第一页| 日韩不卡手机在线v区| 六月激情综合网| 性久久久久久| 国产第一页视频| 欧美.www| 日韩欧美亚洲v片| 国产精品自在| 精品免费国产| 亚洲资源网站| 视频一区三区| 97精品一区二区| 看一级黄色录像| 免费人成在线观看播放视频| 欧美国产乱子伦| 在线观看你懂的视频| 老妇喷水一区二区三区| 日韩成人三级视频| 日韩精品一区二区三区免费观看| 国产高清精品一区| 久久狠狠久久| 欧美成人免费在线| 俺要去色综合狠狠| 久久精品国产综合精品| 亚洲毛片免费看| 色就是色欧美| 在线成人直播| 日韩国产欧美亚洲| 美女久久网站| 在线观看日本一区二区| 国产一区二区三区在线看麻豆| 久草综合在线观看| 久久精品免费观看| 国产wwwxx| 国产一区二区三区免费看| 18深夜在线观看免费视频| 成人av网站在线| 美女久久久久久久久久| 自拍偷拍亚洲激情| 快灬快灬一下爽蜜桃在线观看| 91污片在线观看| 日本美女bbw| 一区二区三区久久久| 亚洲另类欧美日韩| 欧美日韩国产一级| 无码国产伦一区二区三区视频 | 99草在线视频| 欧美喷水一区二区| 黄色福利在线观看| 色偷偷偷综合中文字幕;dd| 在线观看免费视频你懂的| 91成人在线播放| 日韩精品极品| 92国产精品久久久久首页| 天堂成人娱乐在线视频免费播放网站| 粉嫩av四季av绯色av第一区 | 国产精品污www一区二区三区| 日本久久伊人| 色之综合天天综合色天天棕色| 欧美综合一区| 精品少妇在线视频| 免费人成精品欧美精品| av免费观看不卡| 国产精品国产a级| 国产尤物在线视频| 日韩欧美激情一区| 人妻中文字幕一区| 精品国产一区二区三区久久久狼| 国内精品久久久久国产| 青青在线视频一区二区三区 | 超碰97在线资源| 日韩欧美国产精品综合嫩v| 日本福利视频在线| 91亚洲精品在看在线观看高清| 一区二区在线观看视频在线观看| 国产精品综合激情| 国产精品久久久久久久久果冻传媒 | 99精品国产九九国产精品| 久久偷看各类wc女厕嘘嘘偷窃 | 自拍偷拍第9页| 日韩欧美第一页| 91成人国产综合久久精品| 亚洲欧洲日韩国产| 1区2区3区在线| 国产精品h在线观看| 精品精品国产三级a∨在线| 国产免费xxx| 另类国产ts人妖高潮视频| 在线xxxxx| 国产精品色眯眯| 欧美亚洲另类小说| 精品亚洲一区二区三区在线观看| 一级日本在线| 国产精品久久色| 国内亚洲精品| 大香煮伊手机一区| 久久免费的精品国产v∧| 国产黄色小视频网站| 欧美日韩一区二区三区高清 | 日本一区二区三区在线视频| 一区二区日本视频| 想看黄色一级片| 国产精品天美传媒| 日韩精品视频免费看| 欧美大片顶级少妇| 一区二区三区伦理| 91视频免费进入| 激情视频一区| 私密视频在线观看| 婷婷综合在线观看| 无码国产色欲xxxx视频| 97成人在线视频| 亚洲a级精品| 亚洲国产精品女人| 日韩电影在线观看网站| 亚洲成人福利视频| 亚洲国产成人高清精品| 日本人妻丰满熟妇久久久久久| 中文字幕亚洲一区二区三区| 日本一道高清亚洲日美韩| 亚洲狠狠婷婷综合久久久| 激情都市一区二区| 放荡的美妇在线播放| 精品国产在天天线2019| 国内老司机av在线| 久久综合久久久| 欧美精品一卡| 91丨porny丨对白| 色美美综合视频| 日色在线视频| 国产精品美女久久久久久免费| 外国成人在线视频| 精品免费国产一区二区| 性欧美freehd18| 成人欧美视频在线| 欧美亚洲三区| 老司机深夜福利网站| 日韩精品一区二区三区视频播放| 国产福利免费在线观看| 91久久久久久久久| 亚洲精品黄色| 少妇视频一区二区| 亚洲第一区中文99精品| 毛片无码国产| 精品日韩在线播放| 99riav久久精品riav| 国产又黄又大又爽| 2019亚洲日韩新视频| 999久久久精品国产| 99精品一区二区三区无码吞精| 亚洲一区二区av在线| 免费国产在线视频| 91九色露脸| 日日夜夜免费精品| 在线观看亚洲大片短视频| 日韩精品一区二区三区视频在线观看 | 青青青青在线视频| 欧美国产精品劲爆|