精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用人工智能幻覺評估圖像真實感? 原創

發布于 2025-4-9 08:18
瀏覽
0收藏

本文提出了一種使用人工智能幻覺來評估圖像真實感的新方法,對此方法的實現原理進行詳細闡述,并給出詳細的實驗結果證明。

引言

最近,俄羅斯的一項新研究提出了通過一種非常規方法來檢測不切實際的人工智能生成的圖像。這種方法的主要思想是:不是通過提高大型視覺語言模型(LVLM)的準確性,而是通過有意利用它們??產生幻覺的傾向??。?

這種新方法使用LVLM提取有關圖像的多個“原子事實”,然后應用??自然語言推理??(NLI)系統地衡量這些陳述之間的矛盾,從而有效地將模型的缺陷轉化為檢測違背常識的圖像的診斷工具。?

使用人工智能幻覺評估圖像真實感?-AI.x社區

WHOOPS!數據集中的兩幅圖像以及LVLM模型自動生成的語句(左側圖像非常逼真,因此可以產生一致的描述,而右側圖像則不同尋常,導致模型產生幻覺,產生矛盾或錯誤的語句。圖片來源:https://arxiv.org/pdf/2503.15948)

當被要求評估第二幅圖像的真實度時,LVLM發現有些不對勁,因為所描繪的駱駝有三個駝峰,這在??自然界中是未知的??

然而,LVLM最初將大于2個駝峰與大于2只動物混為一談,因為這是你在一張“駱駝圖片”中看到三個駝峰的唯一方式。然后,它繼續產生幻覺,產生比三個駝峰更不可能的東西(即“兩個頭”),并且從未詳細描述似乎引發其懷疑的內容——不太可能的額外駝峰。

這項新研究的研究人員發現,LVLM模型可以原生地執行此類評估,并且與針對此類任務進行??微調???的模型相當(甚至更好)。由于微調復雜、昂貴且在下游適用性方面相當脆弱;因此,他們發現當前AI革命中??最大的障礙??之一的原生用途是對文獻中總體趨勢的一次令人耳目一新的轉變。?

開放式評估

作者斷言,上述方法的重要性在于它可以與開源框架一起部署。雖然像ChatGPT這樣的先進且高投資的模型(該論文承認)可能在這項任務中提供更好的結果,但對于我們大多數人(尤其是業余愛好者和VFX社區)來說,該文獻的真正價值在于有可能在本地實現中融入和開發新的突破;相反,所有注定要用于專有商業API系統的產品都可能被撤回、任意漲價和經受審查——這些審查政策更有可能反映公司的企業關切,而不是用戶的需求和責任。

??這篇新論文???的標題為《不要對抗幻覺,而要利用它們:使用NLI而非原子事實估計圖像真實性》,該文由來自斯科爾科沃科學技術學院(Skoltech)、莫斯科物理技術學院以及俄羅斯公司MTSAI和AIRI的五名研究人員共同撰寫。該論文還提供了一個相應的??GitHub頁面??。?

研究方法

論文作者們使用以色列/美國??WHOOPS!數據集??研究這個項目:?

使用人工智能幻覺評估圖像真實感?-AI.x社區

WHOOPS!數據集中不可能出現的圖像示例。值得注意的是,這些圖像如何組合合理的元素,并且它們的不可能性必須基于這些不兼容方面的串聯來計算。來源:https://whoops-benchmark.github.io/。

該數據集包含500張合成圖像和超過10,874條注釋,專門用于測試AI模型的常識推理和構圖理解。它是與設計師合作創建的,這些設計師的任務是通過文本到圖像系統(例如Midjourney和DALL-E系列)生成具有挑戰性的圖像——產生難以或不可能自然捕捉的場景:

使用人工智能幻覺評估圖像真實感?-AI.x社區

WHOOPS!數據集中的更多示例。來源:https://huggingface.co/datasets/nlphuji/whoops

他們提出的新方法可劃分為三個階段:首先,LVLM(具體來說是??LLaVA-v1.6-mistral-7b???)被提示生成多個描述圖像的簡單語句(稱為“原子事實”)。這些語句是使用??多樣化集束搜索??生成的,確保輸出的可變性。?

使用人工智能幻覺評估圖像真實感?-AI.x社區

多樣化集束搜索通過優化多樣性增強目標,提供了更多種類的字幕選項(來源:https://arxiv.org/pdf/1610.02424)。

接下來,他們使用自然語言推理模型系統地將每個生成的語句與每個其他語句進行比較,該模型分配的分數反映了語句對是否相互包含、矛盾或中立。

矛盾的話,表明圖像中存在幻覺或不切實際的元素:

使用人工智能幻覺評估圖像真實感?-AI.x社區

實驗中使用的檢測管道的架構

最后,他們將這些成對的NLI分數聚合為單個“現實分數”,以量化生成的語句的整體一致性。

研究人員探索了不同的聚合方法,發現基于聚類的方法效果最佳。他們應用k-means聚類算法將單個NLI分數分成兩個聚類,然后選擇值較低的聚類的質心作為最終指標。

使用兩個聚類直接符合分類任務的二元性質,即區分真實圖像和非真實圖像。其邏輯類似于簡單地選擇總體最低分;然而,聚類允許指標表示多個事實的平均矛盾,而不是依賴于單個異常值。

數據和測試

研究人員使用旋轉??測試分割???(即??交叉驗???)在WHOOPS!基線基準上測試了他們的系統。測試的模型是分割的??BLIP2 FlanT5-XL???和??BLIP2 FlanT5-XXL??,以及零樣本格式的BLIP2 FlanT5-XXL(即無需額外訓練)。?

對于遵循指令的基線,作者用短語“Is this unusual? Please explain briefly with a short sentence(這不尋常嗎?請用一個簡短的句子簡要解釋一下)”提示LVLM,??先前的研究??發現這對發現不切實際的圖像很有效。?

評估的模型是??LLaVA 1.6 Mistral 7B???、??LLaVA 1.6 Vicuna 13B???和兩種大小(7/130億個參數)的??InstructBLIP??。?

測試過程圍繞102對真實和非真實(“怪異”)圖像展開。每對圖像由一張正常圖像和一張違背常理的圖像組成。

三位人類注釋者對圖像進行了標注,達成了92%的共識,表明人類對“怪異”的定義具有高度的認同感。評估方法的準確性是通過正確區分現實和非現實圖像的能力來衡量的。

該系統使用三重交叉驗證進行評估,使用固定種子隨機打亂數據。作者在訓練期間調整了蘊涵分數(邏輯上一致的陳述)和矛盾分數(邏輯上沖突的陳述)的權重,而“中性”分數固定為零。最終準確率計算為所有測試分割的平均值。

使用人工智能幻覺評估圖像真實感?-AI.x社區

對五個生成事實的子集進行不同NLI模型和聚合方法的比較,以準確性作為衡量標準。

對于上面顯示的初步結果,論文指出:

“clust方法脫穎而出,成為表現最佳的方法之一。這意味著,匯總所有矛盾分數至關重要,而不是只關注極端值。此外,最大的NLI模型(nli-deberta-v3-large)在所有聚合方法中的表現優于所有其他模型,這表明它更有效地抓住了問題的本質。”

作者發現,最優權重始終傾向于矛盾而非蘊涵,這表明矛盾對于區分不切實際的圖像更具參考價值。他們的方法優于測試的所有其他零樣本方法,接近經過微調的BLIP2模型的性能:

使用人工智能幻覺評估圖像真實感?-AI.x社區

各種方法在WHOOPS!基準上的表現。微調(ft)方法顯示在頂部,而零樣本(zs)方法列在下面。其中,模型大小表示參數數量,準確率用作評估指標。

他們還指出,在同樣的提示下,InstructBLIP的表現優于同類LLaVA模型,這多少有點出乎意料。在承認GPT-4o的卓越準確性的同時,該論文強調了作者傾向于展示實用的開源解決方案,而且似乎可以合理地宣稱在明確利用幻覺作為診斷工具方面具有新穎性。

結論

作者承認他們的項目得益于2024年??FaithScore??活動,這是德克薩斯大學達拉斯分校和約翰霍普金斯大學合作舉辦的活動。?

使用人工智能幻覺評估圖像真實感?-AI.x社區

FaithScore評估的工作原理說明。首先,識別LVLM生成的答案中的描述性陳述。接下來,將這些陳述分解為單個原子事實。最后,將原子事實與輸入圖像進行比較以驗證其準確性。其中,帶下劃線的文本突出顯示客觀描述內容,而藍色文本表示幻覺陳述,從而使FaithScore能夠提供可解釋的事實正確性衡量標準。來源:https://arxiv.org/pdf/2311.01477。

FaithScore通過驗證與圖像內容的一致性來衡量LVLM生成的描述的忠實度,而新論文中抽出的方法明確利用了LVLM幻覺,通過使用自然語言推理生成的事實中的矛盾來檢測不切實際的圖像。

新成果自然取決于當前語言模型的怪異之處,以及它們產生幻覺的傾向。如果模型開發最終產生一個完全不產生幻覺的模型,那么新成果的一般原理也將不再適用。然而,這仍然是一個充滿挑戰的前景。

譯者介紹

朱先忠,51CTO社區編輯,51CTO專家博客、講師,濰坊一所高校計算機教師,自由編程界老兵一枚。

原文標題:??Using AI Hallucinations to Evaluate Image Realism??作者:Martin Anderson

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2025-4-9 08:23:03修改
收藏
回復
舉報
回復
相關推薦
日韩精品一二三四| 日韩视频第二页| 一级片免费在线观看视频| 国产黄色片免费观看| 亚洲+变态+欧美+另类+精品| av中文字幕一区| 日日摸夜夜添一区| 日韩美女一区| 欧美三日本三级少妇99| 日韩精品久久久久久久软件91| 国产视频一区在线播放| 91精品国产91久久久| 中文字幕欧美视频| 色是在线视频| 成人av第一页| 欧美激情第1页| 特黄特色免费视频| 国产午夜精品久久久久免费视| 欧美亚洲国产激情| 欧美日韩国产丝袜美女| 亚洲淫片在线视频| 潘金莲一级黄色片| 日韩一区二区三免费高清在线观看| 91农村精品一区二区在线| 欧美黄色片在线观看| b站大片免费直播| 亚洲最新无码中文字幕久久| 成人精品在线视频观看| 久久久久日韩精品久久久男男| 中文字幕avav| 电影久久久久久| 久久久久久久久久久电影| 555www成人网| 性欧美13一14内谢| jizz性欧美2| 午夜精品一区在线观看| 国产区一区二区| 久久高清无码视频| 136国产福利精品导航网址应用| 亚洲美女屁股眼交3| 91手机在线观看| 久久精品国产亚洲AV无码麻豆| 国产精伦一区二区三区| 福利精品视频在线| 伊人久久在线观看| 少妇一级淫片免费看| 国产精品亚洲欧美| 一本色道久久88亚洲综合88| 岛国毛片在线播放| 91麻豆一二三四在线| 国产成人av一区二区| 国内精品久久久久久久| 免费在线一区二区三区| 91不卡在线观看| 精品久久人人做人人爰| 无码aⅴ精品一区二区三区浪潮| 国产蜜臀在线| 91免费在线播放| 国内视频一区二区| 精品国产伦一区二区三区| 亚洲久久一区二区| 亚洲人精品午夜在线观看| 在线黄色免费观看| 成人亚洲视频| 亚洲va欧美va人人爽午夜| 黄色成人在线免费观看| 免费人成在线观看网站| 久久99国产精品免费| 久久久久久久一区二区| 一区二区三区久久久久| 亚洲日本va| 精品国产一区a| 黄色手机在线视频| 九色porny丨入口在线| 精品日韩视频在线观看| 国产最新免费视频| 香蕉成人app免费看片| 久久久久久久精| 你懂的视频在线一区二区| 在线免费观看日韩视频| 亚洲大片av| 精品国产依人香蕉在线精品| 成人在线视频免费播放| 国产精品久久久久久吹潮| 欧美情侣在线播放| 日本一本二本在线观看| 欧美大片1688网站| 黑丝美女久久久| www.欧美日本| 免费一二一二在线视频| 在线日韩一区二区| 我的公把我弄高潮了视频| 秋霞成人影院| 久久在线观看免费| 国产日韩三区| 六十路在线观看| 亚洲天堂精品在线观看| 日韩欧美亚洲v片| 成码无人av片在线观看网站| 中文字幕高清不卡| 精品一区在线播放| 亚洲第一黄色片| 国产乱淫av一区二区三区 | 91精品又粗又猛又爽| 日韩一区二区三区在线免费观看 | 成人一级毛片| 久久久久久久久国产精品| 波多野结衣小视频| 午夜一区不卡| 992tv在线成人免费观看| 欧美日韩 一区二区三区| 国产v日产∨综合v精品视频| 日韩精品欧美在线| av资源中文在线| 午夜久久久影院| 日韩欧美亚洲另类| 婷婷久久免费视频| 亚洲精品自产拍| 草草地址线路①屁屁影院成人| 激情视频极品美女日韩| 亚洲成人av中文字幕| 美女伦理水蜜桃4| silk一区二区三区精品视频| 亚洲网在线观看| 性久久久久久久久久| 岳的好大精品一区二区三区| 欧美成人免费播放| 久久伊人成人网| 日韩视频在线一区二区三区 | 国产一区二区三区在线看麻豆| 国产剧情日韩欧美| 国产又粗又黄又爽的视频| 狠狠色丁香久久婷婷综| 91成人理论电影| av中文在线| 亚洲欧美在线视频观看| 午夜探花在线观看| 男女在线观看视频| 精品成人在线视频| www黄色av| 国产欧美自拍一区| 欧美激情网站在线观看| 国产ts变态重口人妖hd| 最好看的中文字幕久久| 日韩在线不卡一区| 成人无号精品一区二区三区| 国产成人精品久久二区二区| 一区二区小视频| 国产成人在线视频网址| 久久精品一区二区三区不卡免费视频| 毛片在线播放网站| 日韩欧美综合在线视频| 日本人69视频| 日韩av有码| 欧美激情精品久久久久久大尺度 | 五月婷婷视频在线| 秋霞电影网一区二区| 亚洲影院在线看| 97超碰资源站在线观看| 欧美成人video| 久久精品国产亚洲av无码娇色| 成人成人成人在线视频| 国模无码视频一区二区三区| 91综合国产| 中文在线不卡视频| 亚欧视频在线观看| 99久久久精品| 久热免费在线观看| 在线综合色站| 97avcom| 深夜福利在线看| 久久久av毛片精品| 狠狠热免费视频| 国产66精品| 2024亚洲男人天堂| 成人在线二区| 欧美一区日韩一区| 欧美黄色激情视频| 麻豆精品一区二区| 热re99久久精品国产99热| 欧美wwww| 亚洲精品一区在线观看香蕉| 成人黄色免费网| 成人在线综合网| 欧美aⅴ在线观看| 91久久国产| 国产精品女主播| 久久手机免费观看| 欧美日韩高清一区二区三区| www.99re7.com| 国产午夜三级一区二区三| 日韩欧美中文视频| 91精品啪在线观看国产81旧版 | 精品中文一区| 国a精品视频大全| 国产视频福利在线| 色综合天天天天做夜夜夜夜做| 国产三级在线观看完整版| 久久人人超碰| 欧美精品七区| 人在线成免费视频| 日韩在线精品视频| 国产成人精品免费看视频| 色综合欧美在线| 毛片视频免费播放| 秋霞电影网一区二区| 激情六月天婷婷| 成人中文视频| 精品日本一区二区| 久久视频免费| 欧美麻豆久久久久久中文| 国产美女主播在线观看| 亚洲欧美一区二区在线观看| 免费看黄色aaaaaa 片| 国产毛片精品视频| 亚洲色图 在线视频| 亚洲理伦在线| 免费看日b视频| 欧美电影《睫毛膏》| 国产在线拍偷自揄拍精品| 视频三区在线| 91精品国产综合久久久久久久| 亚洲一二三四视频| 91在线高清观看| 国产成人亚洲综合91精品| 亚洲欧美强伦一区二区| 一区二区三区欧美亚洲| 在线观看国产中文字幕| 亚洲国产二区| 小泽玛利亚av在线| 我不卡手机影院| 国产综合久久久久影院| 被灌满精子的波多野结衣| 国产一区二区| 欧美大片在线看| 999在线视频| 日韩一区二区三区视频在线 | 亚洲午夜在线视频| 懂色av粉嫩av蜜乳av| 首页综合国产亚洲丝袜| 欧洲金发美女大战黑人| 91综合久久一区二区| 国产亚洲自拍偷拍| 久久久久观看| 精品午夜一区二区三区| 欧洲亚洲一区二区三区| 日产日韩在线亚洲欧美| 麻豆网站在线| www.久久久久| 亚洲欧洲成人在线| 欧美久久久一区| 免费一级肉体全黄毛片| 亚洲欧美日韩在线播放| 69夜色精品国产69乱| 亚洲男人的天堂在线观看| 成年人av电影| 国产午夜精品理论片a级大结局 | 精品久久久无码中文字幕| 91精品欧美一区二区三区综合在| 国产一区二区网站| 欧美一区二区女人| 丰满肥臀噗嗤啊x99av| 亚洲精品短视频| 一级黄色大毛片| 宅男噜噜噜66一区二区66| www.精品视频| 亚洲国产欧美一区二区三区久久| 五月婷婷在线播放| 国产一区二区日韩| 国产成人l区| 97激碰免费视频| 国产小视频免费在线观看| 国产亚洲精品91在线| 麻豆tv入口在线看| 久久久久亚洲精品成人网小说| 一二三四视频在线中文| 欧美大码xxxx| 热三久草你在线| 国产热re99久久6国产精品| 亚洲3区在线| 欧美午夜精品理论片a级大开眼界| 成人动漫免费在线观看| 亚洲成年人专区| av中文字幕一区二区| 九九九九九精品| 久久要要av| 免费无码毛片一区二三区| 欧美人与禽猛交乱配视频| 亚洲三区在线观看| 精品高清久久| 国产911在线观看| 久久综合狠狠| 黄页网站在线看| 激情五月婷婷综合网| 波多野结衣加勒比| 亚洲欧洲日产国产综合网| 色网站在线播放| 91精品麻豆日日躁夜夜躁| 亚洲三级黄色片| 欧美老少配视频| 素人一区二区三区| 韩国成人一区| 久久久国产精品| 日本新janpanese乱熟| 国产成都精品91一区二区三| 天天躁夜夜躁狠狠是什么心态| a级高清视频欧美日韩| 人人干在线观看| 欧美三级免费观看| 无码人妻精品一区二区三区9厂| 午夜视频一区二区| 国产又粗又大又黄| 亚洲人成毛片在线播放| 欧美24videosex性欧美| 国产噜噜噜噜久久久久久久久| 天美av一区二区三区久久| av 日韩 人妻 黑人 综合 无码| 轻轻草成人在线| aa片在线观看视频在线播放| 一区二区在线看| 亚洲一区二区天堂| 亚洲天堂av网| 这里有精品可以观看| 春色成人在线视频| 好吊妞视频这里有精品| 亚洲成年人专区| 久久精品国产99| 久久久久久久久久久久| 亚洲va国产天堂va久久en| 国产白浆在线观看| 麻豆一区二区在线观看| 亚洲制服国产| 成人写真福利网| 一区二区免费| 9色视频在线观看| 国产一区二区在线观看免费| 又嫩又硬又黄又爽的视频| 91国产成人在线| 99久久久无码国产精品免费| 色诱女教师一区二区三区| 韩日一区二区| 一区二区冒白浆视频| 蜜臀a∨国产成人精品| 国产精品一区二区在线免费观看| 亚洲同性同志一二三专区| 国产一区二区网站| 久久香蕉频线观| 亚洲精品a区| 野外做受又硬又粗又大视频√| 国产v综合v亚洲欧| 中文在线观看免费网站| 欧美视频中文一区二区三区在线观看| 国产美女无遮挡永久免费| 久久亚洲私人国产精品va| 精品国产亚洲一区二区三区在线| 妞干网这里只有精品| 国产成人在线视频网址| 国产福利拍拍拍| 亚洲天堂第一页| 欧美美女被草| 乱一区二区三区在线播放| 亚久久调教视频| 亚洲一二三四视频| 欧美一区午夜精品| 国产99在线| 97人人香蕉| 91久久久久| 亚洲av无码一区二区三区人 | 青青草97国产精品麻豆| 又色又爽又黄视频| 久久精品日韩一区二区三区| 亚洲精品一区二三区| 久久人人爽人人爽人人片亚洲| 亚洲精品影片| 久草精品在线播放| 中文字幕一区av| 国产午夜无码视频在线观看| 最近2019中文字幕第三页视频| 日本高清久久| 116极品美女午夜一级| 国产精品久久久久桃色tv| 色屁屁影院www国产高清麻豆| 日韩久久免费av| 黄色在线免费| 国产日韩欧美一区二区三区四区| 狂野欧美一区| 欧美高清视频一区二区三区| 日韩精品999| а√天堂中文在线资源8| 日本不卡一区| 国产精品中文字幕欧美| 日韩精品一区二区亚洲av| 久久天天躁夜夜躁狠狠躁2022| 精品按摩偷拍| 午夜精品免费看| 色综合视频一区二区三区高清| 成人日日夜夜| 日韩欧美手机在线| 99精品视频在线观看| 国产男女无套免费网站|