精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

多模態LLM幻覺問題降低30%!業內首個“啄木鳥”免重訓方法誕生

開發 前端 人工智能
一個免重訓、即插即用的通用架構,直接從模型給出的錯誤文本下手,“倒推”出可能出現“幻覺”之處,然后與圖片確定事實,最終直接完成修正。

還在用指令微調解決多模態大模型的“幻覺”問題嗎?

比如下圖中模型將橙色柯基錯認為“紅狗”,還指出周圍還有幾條。

圖片圖片

現在,中科大的一項研究想到了一個全新辦法:

一個免重訓、即插即用的通用架構,直接從模型給出的錯誤文本下手,“倒推”出可能出現“幻覺”之處,然后與圖片確定事實,最終直接完成修正。

他們將這個方法命名為“啄木鳥”(Woodpecker)。

圖片圖片

就像這位所謂的“森林醫生”先找出樹木的蟲洞再吃掉里面的蟲子一樣,本文中所提出的“啄木鳥”也是多模態大模型們的“幻覺”醫生,能夠將問題先診斷出來再一一糾正。

結果是“醫術確實高明”,成功將:

(1)MiniGPT-4的準確性從54.67%提高到了85.33%;

(2)mPLUG Ow的準確性從62%提到了86.33%。

如下圖所示,各種難以檢測到的小對象、復雜的計數場景,它都能沒問題。

圖片圖片

那么,它具體是如何診斷的呢?

“啄木鳥法”治療多模態LLM幻覺

目前,業內對于大模型幻覺問題的解決辦法基本都是用特定數據進行指令微調。

比如說,一些多模態大模型(MLLM)在回答問題時總是傾向于肯定答案(eg. 面對一個光頭人物圖,問它頭發是什么顏色,張口就說“黑”),那么我們再喂給模型一些包含負樣本的數據,就能解決它“無中生有”的幻覺,遇到沒有的就說“no”。

除了指令微調,也有的會進行架構調整,反正都要重新訓練一個新的模型。

本文提出的“啄木鳥”框架,是業內第一個無需此操作就能解決“幻覺”的全新辦法。

它一共分為5個步驟,每一步都采用了清晰透明的設計方式,因此具備良好的可解釋性。

圖片圖片

具體而言:

第一步,關鍵概念提取。

指找出模型給出的答案中提到的主要對象,即最有可能解除“幻覺”的元素。

例如對于下圖,多模態大模型最開始可能描述圖中有一輛自行車停在一個垃圾桶旁邊,還說圖上有幾個人從垃圾桶旁邊走過。

圖片圖片

那么,我們就可以得到三個關鍵概念:自行車、垃圾桶和人。

第二步,問題構造。

指在獲取關鍵概念后,圍繞它們提出一些問題有助于檢驗“幻覺”所在的問題。

可主要分為對象層面和屬性層面,前者可以問“圖中有幾輛自行車?”,后者可問“垃圾桶位于什么位置?”。

在此,由于屬性問題比較依賴于上下文,作者也用了一些帶有上下文的例子來提示模型,以便提出的問題更有意義

第三步,視覺驗證。

指引用專家模型回答上步提出的所有問題,方便后續校正。

對于對象層面的問題,例如我們利用GroundingDINO來進行目標檢測,確定關鍵目標是否存在以及關鍵目標的數量。

對于屬性問題,則用BLIP-2來搞定。這類傳統VQA模型輸出答案的長度有限,"幻覺"問題更少。

第四步,視覺斷言生成。

簡單來說,就是基于于前兩步中獲得的問題以及對應的視覺信息,合成結構化的“視覺斷言”。

格式如下:

圖片圖片

最后,“幻覺”糾正。

即根據上步的總結比對模型原始的輸出,得出新的答案。

具體實施環節中,“啄木鳥”采用GPT-3.5-turbo來完成關鍵概念提取、提問和最后一步的糾正。

由于一些多模態模型的指令跟隨能力較弱,導致結果可能輸出無關文本(例如表情、特殊符號),再加上有時一些模型只輸出一個“是”或“否”,這讓實際的校正過程也面臨挑戰。

不過,我們兩個簡單措施就可以搞定:

(1)將模型回答的“是”或“否”與“啄木鳥”給出的答案組合起來,比如“是的,圖像中有一只狗”,就不怕模型原本只是給出一個簡單的“yes or no”逃過校正了。

(2)在校正過程中,將原始問題添加到LLM,以便LLM更好地掌握文本和任務要求。

效果驗證:幻覺減少30%

整個方法看起來非常好理解,效果如何呢?

在此,作者在POPE、MME和LLaVA-QA90數據集上進行了全面的定量和定性實驗。

基線模型選用這四個主流多模態大模型:

MiniGPT-4、mPLUG Owl、LLaVA和Otter。

最終,POPE數據集上的結果如下:

(w/Ours表示由“啄木鳥”校正的MLLM響應,x為未采用,對勾為采用)

可以看到,“啄木鳥”都能給這幾個模型帶來不同程度的提升,同時大幅降低模型回答“yes”的概率。

其中在隨機設定下,它給MiniGPT-4和mPLUG-Owl和在準確率指標上分別帶來了30.66%和24.33%的提升。

圖片圖片

在更全面的MME數據集上,“啄木鳥”也有效減少了多模態大模型在對象級和屬性級層面的“幻覺”,也就是某物是否存在、數量多少,以及它的位置和顏色。

比如LLaVA的顏色得分從78.33分大幅提升到155分。

圖片圖片

不過,位置方面的“幻覺”提升不是特別大,作者推測可能是VQA模型BLIP-2在位置推理方面的能力相對較弱等原因造成的。

為了更直接地衡量修正表現,更直接的方式是使用開放評測。

不同于以往將圖片轉譯后送入純文本GPT-4的做法,作者利用OpenAI最近開放的視覺接口,提出使用GPT-4V對修正前后的圖片描述直接對下列兩個維度進行打分:

(1)準確度:模型的答復相對于圖片內容是否準確;

(2)細節程度:模型答復的細節豐富度。 

在該實驗條件下,實驗結果如下表所示(滿分為10):

圖片圖片

結果表明經過“啄木鳥“修正后圖片描述的準確性有一定的提升,這說明該框架可以有效修正描述中幻視的部分。

另一方面,“啄木鳥“修正后引入的定位信息豐富了文本描述,提供了進一步的位置信息,從而提升了細節豐富度。

GPT-4V輔助的評測樣例如下圖所示:

圖片圖片

試玩

還有Demo供大家測試使用。

如下圖所示,上傳圖片并輸入請求,就可以得到修正前以及修正后的模型答復,以及供參考驗證的新圖片。

 

Woopecker論文地址:
https://arxiv.org/abs/2310.16045 Woopecker代碼地址:https://github.com/BradyFU/Woodpecker

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-10-30 15:06:00

模型數據

2025-06-27 08:40:00

模型推理AI

2025-01-08 08:21:16

2024-12-18 18:57:58

2024-11-14 13:05:12

2024-12-31 08:03:12

2024-01-24 13:16:00

AI訓練

2024-01-11 16:24:12

人工智能RAG

2025-05-06 08:40:00

2024-01-15 06:15:00

模型數據

2024-12-16 07:00:00

2025-08-06 09:10:10

2023-10-27 09:47:22

模態框架

2025-05-08 06:00:00

AI幻覺AI人工智能

2024-08-08 13:04:28

2024-01-03 13:37:00

模型數據

2023-12-25 09:07:50

AI人工智能Ferret

2024-12-17 08:05:34

大型語言模型MetaAILLM

2025-04-28 12:28:27

點贊
收藏

51CTO技術棧公眾號

国产精品亚洲精品| 亚洲国产成人精品久久| 91制片厂免费观看| 亚洲国产www| 免费日韩一区二区| 尤物yw午夜国产精品视频明星| 最新国产黄色网址| 草草在线视频| 中文字幕在线不卡视频| 99re6在线| 国产免费a视频| 欧美激情综合色综合啪啪| 精品爽片免费看久久| 色91精品久久久久久久久| 色是在线视频| 一区二区三区免费网站| 四虎一区二区| 五月色婷婷综合| 国产毛片精品国产一区二区三区| 欧美在线一区二区视频| 久久免费小视频| 日韩一区亚洲二区| 亚洲久久久久久久久久久| 成人三级做爰av| 国产成人免费| 色噜噜夜夜夜综合网| 国产高清不卡无码视频| 午夜伦理在线| 亚洲国产高清aⅴ视频| 激情小说网站亚洲综合网| 国产熟女一区二区三区四区| 日本美女一区二区三区| 欧美综合在线第二页| 国产精品美女毛片真酒店| 国产精品99久久精品| 亚洲天堂色网站| 蜜桃精品成人影片| 国产成人精品亚洲线观看| 91精品国产91热久久久做人人| 亚洲欧美另类动漫| 性欧美18一19sex性欧美| 香蕉乱码成人久久天堂爱免费| 欧美一二三不卡| 精品自拍一区| 综合电影一区二区三区| 午夜精品一区二区三区在线观看| 加勒比一区二区三区在线| 久久五月婷婷丁香社区| 久久久国产精品一区二区三区| 丰满肉嫩西川结衣av| 国产999精品久久久久久绿帽| 91精品在线国产| 99国产在线播放| 精品一区二区三区欧美| 国产欧美亚洲精品| 国产精品久久久久久久一区二区| 久久精品999| 亚洲综合色av| 丰满肥臀噗嗤啊x99av| 成人福利电影精品一区二区在线观看| 国产精品美女久久久久av福利| 日韩中文字幕免费在线观看| 成人av在线网站| 久久综合一区| 成人性爱视频在线观看| 中文字幕制服丝袜一区二区三区| 中文字幕中文字幕在线中一区高清 | 都市激情一区| 国产精品乱人伦| 黄色a级在线观看| 人妖欧美1区| www在线观看黄色| 香蕉乱码成人久久天堂爱免费| a在线视频观看| 日韩av福利| 欧美日韩国产精选| 肉丝美足丝袜一区二区三区四| 一区二区三区高清在线观看| 亚洲成av人乱码色午夜| 特大黑人巨人吊xxxx| 精品国产91乱码一区二区三区四区 | 同心难改在线观看| 久久九九久久九九| 三年中国中文在线观看免费播放| 欧美人与牲禽动交com| 精品国产户外野外| 伊人国产在线视频| 日韩精品中文字幕一区二区| 亚洲激情自拍图| 337人体粉嫩噜噜噜| 亚洲人体av| 57pao成人永久免费视频| 一级黄色在线观看| 国产乱码精品一区二区三区忘忧草| 精品国产一区二区三区麻豆免费观看完整版 | 九九九国产视频| 日韩国产在线观看| 亚洲综合小说区| 黄色大片在线看| 亚洲精品国产a久久久久久| 欧美性久久久久| 欧美激情精品| 国产亚洲人成a一在线v站| 黄色一级视频免费观看| 丝袜美腿高跟呻吟高潮一区| 亚洲在线视频观看| 黄色毛片在线看| 亚洲一区二区三区自拍| 特级丰满少妇一级| 欧美亚洲色图校园春色| 久久成人av网站| 色老头在线视频| 成人aa视频在线观看| 亚洲日本理论电影| 亚洲女同志freevdieo| 91精品国产91久久综合桃花 | www.xx日本| 国产一区二区精品久| 欧美精品在线免费| 中文字幕 视频一区| 99久久综合99久久综合网站| 亚洲小说欧美另类激情| 性欧美freehd18| 日韩av中文字幕在线| 国产极品国产极品| 男人的j进女人的j一区| 久久久久久艹| 手机av在线| 精品国产第一区二区三区观看体验| 精品人体无码一区二区三区| 欧美一级一区| 久久99精品国产99久久| 男女免费观看在线爽爽爽视频| 欧美久久久久久久久中文字幕| 亚洲最大成人网站| 一本色道88久久加勒比精品| 电影午夜精品一区二区三区| www免费在线观看| 欧美军同video69gay| 成人性视频免费看| 人禽交欧美网站| 污视频在线免费观看一区二区三区| 亚洲天堂电影| 亚洲欧美日韩久久久久久| 国产精品7777777| www.日韩精品| 欧美日韩在线一| 日本欧美韩国国产| 欧美中文在线观看| 欧美精品久久久久久久久久丰满| 欧美性猛交xxxx免费看久久久| 人妻无码中文久久久久专区| 亚洲黄网站黄| 久久精品aaaaaa毛片| 人成在线免费网站| 国产亚洲a∨片在线观看| 久久永久免费视频| 中文字幕亚洲视频| 欧美大片久久久| 欧美日本二区| 国产精品久久久久久久久久久久冷| h片在线观看| 日韩av在线影院| 国产99久久久久久免费看| 欧美高清在线一区| 日韩a一级欧美一级| 欧美黄免费看| 狠狠久久综合婷婷不卡| 另类专区亚洲| 日韩在线视频导航| 性一交一乱一透一a级| 舔着乳尖日韩一区| 全黄一级裸体片| 毛片基地黄久久久久久天堂| 人人妻人人澡人人爽精品欧美一区| 久久久久久亚洲精品美女| 午夜精品福利视频| 亚洲欧洲成人在线| 欧美日韩国产不卡| 国产亚洲第一页| 久久久久国产免费免费| 在线黄色免费看| 亚洲黄色三级| 亚洲在线播放电影| 综合成人在线| 国产精品jizz在线观看麻豆| 国产精品久久久久久福利| 亚洲精品456在线播放狼人| 欧美成人一区二区视频| 一区二区三区欧美亚洲| 我和岳m愉情xxxⅹ视频| 国产专区综合网| 欧美一级在线看| 亚洲综合小说| 区一区二区三区中文字幕| 福利一区三区| 日韩美女写真福利在线观看| 黄色在线免费| 国产丝袜一区二区三区免费视频| 91影院在线播放| 疯狂做受xxxx欧美肥白少妇 | 成人激情视频| 国产精品我不卡| 综合久久av| 国产91在线播放精品91| 日本大片在线播放| 中文字幕亚洲欧美一区二区三区| 丰满熟妇人妻中文字幕| 欧美日韩久久久| 少妇高潮av久久久久久| 亚洲激情图片小说视频| 日本一区二区视频在线播放| av成人动漫在线观看| 中文 日韩 欧美| 日韩成人av影视| 国产一区二区网| 韩日视频一区| 99久re热视频精品98| 精品久久久久久久久久久下田| 国产精品国产一区二区| 国产 日韩 欧美| 国产精品爽爽爽爽爽爽在线观看| 丝袜老师在线| 性欧美视频videos6一9| 调教一区二区| 免费97视频在线精品国自产拍| www.中文字幕久久久| bt欧美亚洲午夜电影天堂| 五月天欧美精品| 午夜性福利视频| 九九精品视频在线看| 国产无套内射久久久国产| 精品电影一区| a级免费在线观看| 国产精品v一区二区三区| 国产女人18毛片| 亚洲精品小说| 国产一二三四五| 伊人久久大香线蕉精品组织观看| 一区二区三区的久久的视频| 日本a级不卡| 亚洲精品成人三区| 国产在视频线精品视频www666| 欧美18视频| 免费欧美激情| 日韩久久不卡| 欧美日韩中文字幕一区二区三区| 日韩女优中文字幕| re久久精品视频| 中文字幕一区二区三区四区五区六区 | 3p视频在线观看| 最近2019中文字幕mv免费看| 日本在线视频网| 欧美成在线视频| 天使と恶魔の榨精在线播放| 欧美国产日本高清在线| 18aaaa精品欧美大片h| 中文字幕亚洲天堂| 粉嫩精品一区二区三区在线观看 | 久久久久国产成人精品亚洲午夜| 久久久久久久无码| 99精品视频一区二区| 国产精品无码网站| 国产欧美一区二区三区在线看蜜臀| 女人黄色一级片| 日韩美女精品在线| 久久婷婷国产麻豆91| 精品国产精品自拍| www.亚洲激情| 91精品久久久久久蜜臀| wwwav在线播放| 亚洲精品久久久久国产| 国产视频二区在线观看| 久久久精品久久| 国产激情在线观看| 午夜精品一区二区三区在线| 国产综合色区在线观看| 成人午夜黄色影院| 国产精品丝袜在线播放| 婷婷精品国产一区二区三区日韩| 欧美福利电影在线观看| 久久精品国产精品亚洲色婷婷| 日本不卡免费在线视频| 午夜性福利视频| 国产欧美日韩激情| 亚洲国产成人精品综合99| 欧美日韩亚洲91| 国产精品天天操| 亚洲免费电影在线观看| 国产黄色在线免费观看| 人体精品一二三区| 国产成人免费av一区二区午夜| 久久精品国产一区二区三区日韩 | 久热爱精品视频线路一| 蜜桃麻豆影像在线观看| 91麻豆国产精品| 亚洲成aⅴ人片久久青草影院| 亚洲图片都市激情| 一本久道久久久| 91大神免费观看| 欧美激情在线一区二区| 久久久久99精品| 欧美日韩国产三级| 日韩电影免费| 欧美激情videos| 日韩欧美专区| 欧美专区一二三| 99riav国产精品| 伦伦影院午夜理论片| 中文字幕不卡在线观看| 日韩一区二区视频在线| 精品久久国产字幕高潮| 欧美成人二区| 国产精品www色诱视频| 欧洲精品一区| 成人免费性视频| 国产原创一区二区| 貂蝉被到爽流白浆在线观看 | 人妻熟女一二三区夜夜爱| 国产乱色国产精品免费视频| 能直接看的av| 在线一区二区视频| 亚州视频一区二区三区| 欧美精品生活片| 日韩成人在线电影| 色大师av一区二区三区| 亚洲综合另类| 中文字幕日韩三级片| 午夜免费久久看| 亚洲狼人综合网| 欧美猛交免费看| 国产中文欧美日韩在线| 综合国产精品久久久| 男人的天堂亚洲一区| 国产jjizz一区二区三区视频| 福利视频导航一区| 天堂中文在线资| 国产91精品高潮白浆喷水| 黄色成人美女网站| 91成人在线观看喷潮教学| 成人a免费在线看| 日产亚洲一区二区三区| 亚洲高清色综合| av剧情在线观看| 久久精品magnetxturnbtih| 一本综合久久| 女人被狂躁c到高潮| 欧美午夜精品久久久久久久| 日韩精品系列| 国产精品大陆在线观看| 成人精品影院| 最新天堂在线视频| 亚洲美女少妇撒尿| 亚洲经典一区二区三区| 久久久最新网址| 任你躁在线精品免费| 国语对白做受xxxxx在线中国| 久久综合九色综合97婷婷女人| 日本中文字幕久久| 最新中文字幕亚洲| 精品国产亚洲一区二区三区| 国产精品视频一二三四区| 粉嫩高潮美女一区二区三区| 日干夜干天天干| 国产一区二区av| 国产亚洲精aa在线看| 阿v天堂2018| 久久精品免费在线观看| 伊人网站在线观看| 九九精品在线播放| 牛牛影视一区二区三区免费看| 欧美性猛交久久久乱大交小说| 国产精品国模大尺度视频| 国产高清不卡视频| 2019中文字幕在线| 日韩欧美午夜| 日韩女优在线视频| 91福利资源站| caoporn免费在线| 精品国产一区二区三区麻豆小说 | 欧美精品视频www在线观看| 伊人222成人综合网| 麻豆精品视频| 激情综合色播五月| 亚洲国产成人精品激情在线| 在线国产精品视频| 国产精品17p| 在线观看免费不卡av| 亚洲电影激情视频网站| av在线女优影院| 国产综合色一区二区三区| 久久狠狠亚洲综合| 色婷婷av国产精品| 久久中国妇女中文字幕| 视频小说一区二区| 白丝校花扒腿让我c| 欧美性xxxxxx少妇| av资源中文在线| 熟妇熟女乱妇乱女网站| 91久色porny|