精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

告別評(píng)估亂象!首個(gè)視覺(jué)解釋綜合性基準(zhǔn)發(fā)布,附人類真值 | KDD'25

人工智能 新聞
埃默里大學(xué)團(tuán)隊(duì)推出首個(gè)覆蓋8個(gè)真實(shí)任務(wù)、帶有人類解釋真值的視覺(jué)解釋基準(zhǔn)Saliency-Bench,統(tǒng)一評(píng)估流程與開(kāi)源工具讓顯著性方法可公平比較,獲KDD’25接收,為可解釋AI奠定透明、可靠的基石。

深度學(xué)習(xí)模型的「黑盒」問(wèn)題一直是AI發(fā)展的瓶頸,而基于顯著性圖的視覺(jué)解釋是打開(kāi)這個(gè)黑盒的關(guān)鍵鑰匙。

然而,由于缺乏帶注釋的數(shù)據(jù)集和標(biāo)準(zhǔn)化的評(píng)估方案,整個(gè)領(lǐng)域的發(fā)展受到了限制,「如何科學(xué)、統(tǒng)一地評(píng)估這些解釋的質(zhì)量?」成了一個(gè)亟待解決的問(wèn)題。

為此,埃默里大學(xué)的研究團(tuán)隊(duì)推出了一個(gè)旨在全面評(píng)估視覺(jué)解釋的開(kāi)創(chuàng)性基準(zhǔn)Saliency-Bench,該基準(zhǔn)不僅構(gòu)建和標(biāo)注了涵蓋場(chǎng)景分類、癌癥診斷、行為識(shí)別等8個(gè)不同任務(wù)的多樣化數(shù)據(jù)集,還提供了一套標(biāo)準(zhǔn)化的評(píng)估流程和開(kāi)源工具包,讓研究人員可以輕松復(fù)現(xiàn)、比較和迭代。

圖片

論文鏈接: https://arxiv.org/abs/2310.08537

項(xiàng)目主頁(yè): https://github.com/yifeizhangcs/XAIdataset.github.io

在多家主流模型和方法上的大量實(shí)驗(yàn)證明,Saliency-Bench為衡量XAI方法的忠實(shí)性和對(duì)齊性提供了堅(jiān)實(shí)的基石,推動(dòng)了可解釋AI向著更可靠、更透明的方向發(fā)展。

該研究獲得KDD 2025 Datasets and Benchmarks Track接收,提出首個(gè)全面評(píng)估視覺(jué)解釋的開(kāi)創(chuàng)性基準(zhǔn)Saliency-Bench。

為視覺(jué)解釋建立評(píng)估標(biāo)準(zhǔn)

深度神經(jīng)網(wǎng)絡(luò)(DNNs)在圖像分類等任務(wù)中取得了巨大成功,但其「黑盒」特性使其決策過(guò)程難以捉摸,這在醫(yī)療、金融等高風(fēng)險(xiǎn)領(lǐng)域是不可接受的。

可解釋AI(XAI)技術(shù),特別是通過(guò)生成「顯著性圖」(saliency map)來(lái)高亮模型決策關(guān)鍵區(qū)域的方法,已成為提升模型透明度的重要途徑。

然而,長(zhǎng)期以來(lái),對(duì)這些XAI方法的評(píng)估存在三大挑戰(zhàn):

  1. 缺乏標(biāo)準(zhǔn)化的評(píng)估框架:不同的研究使用不同的指標(biāo)和流程,導(dǎo)致結(jié)果難以橫向比較和復(fù)現(xiàn)。
  2. 缺少全面且多樣化的數(shù)據(jù)集:現(xiàn)有的基準(zhǔn)測(cè)試數(shù)據(jù)集要么局限于特定領(lǐng)域(如醫(yī)療或物體檢測(cè)),要么規(guī)模太小,無(wú)法全面評(píng)估XAI方法的泛化能力。
  3. 基準(zhǔn)和分析不夠深入:很少有工作能夠在多個(gè)數(shù)據(jù)集上對(duì)多種主流方法進(jìn)行系統(tǒng)性的橫向評(píng)測(cè)。

為了解決這些問(wèn)題,Saliency-Bench應(yīng)運(yùn)而生,不僅僅是一個(gè)數(shù)據(jù)集集合,更是一個(gè)完整的視覺(jué)解釋評(píng)估生態(tài)系統(tǒng)。

圖片

Saliency-Bench框架概覽圖,展示了Saliency-Bench的整體框架。從多樣化的應(yīng)用場(chǎng)景出發(fā),涵蓋了數(shù)據(jù)集構(gòu)建、多類型顯著性方法、標(biāo)準(zhǔn)化評(píng)估(包含忠實(shí)性和對(duì)齊性指標(biāo))到最終基準(zhǔn)測(cè)試結(jié)果的完整流程。

Saliency-Bench的核心貢獻(xiàn)可以總結(jié)為四點(diǎn):

  1. 全面的數(shù)據(jù)集集合:精心構(gòu)建并標(biāo)注了8個(gè)數(shù)據(jù)集,覆蓋了從性別分類、環(huán)境識(shí)別到癌癥診斷和行為分類等多種任務(wù),并且包含了二分類和多分類問(wèn)題。
  2. 標(biāo)準(zhǔn)化的評(píng)估流程:開(kāi)發(fā)了一套統(tǒng)一的評(píng)估流水線,能夠?qū)Σ煌@著性方法生成的視覺(jué)解釋進(jìn)行標(biāo)準(zhǔn)化處理,并使用統(tǒng)一的指標(biāo)進(jìn)行衡量,確保了實(shí)驗(yàn)的可復(fù)現(xiàn)性。
  3. 廣泛的基準(zhǔn)測(cè)試和分析:對(duì)6種主流的顯著性方法(如GradCAM, RISE等)在不同模型架構(gòu)(ResNet-18, VGG-19, ViT)上進(jìn)行了大規(guī)模的基準(zhǔn)測(cè)試,并提供了深入的性能分析。
  4. 用戶友好的評(píng)估工具包:提供了一個(gè)易于使用的Python工具包,封裝了數(shù)據(jù)加載、模型評(píng)估等功能,極大地簡(jiǎn)化了研究人員的評(píng)估過(guò)程。

八大真實(shí)世界數(shù)據(jù)集,一次性補(bǔ)齊XAI評(píng)測(cè)短板

Saliency-Bench最大的亮點(diǎn)之一就是其前所未有的數(shù)據(jù)集廣度和深度。研究人員通過(guò)人工標(biāo)注、利用先驗(yàn)知識(shí)(如前景提取)等多種方式,為8個(gè)來(lái)自不同領(lǐng)域的公開(kāi)數(shù)據(jù)集制作了高質(zhì)量的像素級(jí)解釋真值(ground-truth)。

八大數(shù)據(jù)集示例圖

圖片

來(lái)自Gender-XAI, Environment-XAI, Disease-XAI, Cancer-XAI, Security-XAI, Pet-XAI, Action-XAI, 和 Object-XAI 這8個(gè)數(shù)據(jù)集的示例圖片及其對(duì)應(yīng)的像素級(jí)真值解釋

圖片

8個(gè)數(shù)據(jù)集的類別(二分類/多分類)、類別數(shù)量、樣本總數(shù)、標(biāo)注類型(人工標(biāo)注/前景提取)和數(shù)據(jù)格式等關(guān)鍵信息

誰(shuí)是最好的視覺(jué)解釋方法?用數(shù)據(jù)說(shuō)話!

研究人員選取了6種主流的顯著性方法,在ResNet-18, VGG-19和ViT-B/16等不同架構(gòu)上進(jìn)行了全面的性能評(píng)測(cè)。評(píng)估指標(biāo)兼顧了兩個(gè)核心維度:

對(duì)齊性 (Alignment):生成的解釋與人類認(rèn)知的真值有多接近?(使用 mIoU 和 Pointing Game (PG) 指標(biāo))

忠實(shí)性 (Faithfulness):生成的解釋是否真實(shí)反映了模型的決策依據(jù)?(使用 iAUC 指標(biāo))

實(shí)驗(yàn)結(jié)果亮點(diǎn)

沒(méi)有「萬(wàn)金油」方法:不同方法在不同任務(wù)和模型上表現(xiàn)各異。總體而言,RISE 和 GradCAM/GradCAM++ 在多個(gè)數(shù)據(jù)集中表現(xiàn)相對(duì)穩(wěn)健和可靠。

模型架構(gòu)影響顯著:通常,在 ResNet-18 上的解釋質(zhì)量要優(yōu)于 VGG-19,這可能得益于其更先進(jìn)的架構(gòu)設(shè)計(jì)。

ViT注意力機(jī)制潛力巨大:Vision Transformer的自注意力圖作為一種內(nèi)生的解釋方法,表現(xiàn)出了強(qiáng)大的競(jìng)爭(zhēng)力,尤其在捕捉全局和長(zhǎng)距離依賴關(guān)系方面,其生成的顯著性圖比傳統(tǒng)CNN方法更精細(xì)。

圖片

主流方法在ResNet-18和VGG-19上的詳細(xì)評(píng)測(cè)結(jié)果,展示了6種顯著性方法在8個(gè)數(shù)據(jù)集上,基于ResNet-18和VGG-19模型的mIoU, PG, iAUC三項(xiàng)指標(biāo)的詳細(xì)得分。

總結(jié)與展望

研究人員推出了Saliency-Bench,一個(gè)為視覺(jué)解釋評(píng)估提供全面數(shù)據(jù)集、標(biāo)準(zhǔn)化流程和開(kāi)源工具的綜合性基準(zhǔn)測(cè)試套件。 通過(guò)對(duì)多種主流方法和模型的廣泛測(cè)試,為社區(qū)提供了一個(gè)可靠的平臺(tái)來(lái)衡量和比較XAI技術(shù)和視覺(jué)解釋的性能。

Saliency-Bench的發(fā)布將有效遏制當(dāng)前XAI評(píng)估中的「各自為政」現(xiàn)象,為開(kāi)發(fā)更忠實(shí)、更可靠的視覺(jué)解釋方法提供堅(jiān)實(shí)的基石,最終推動(dòng)可解釋AI在更多關(guān)鍵領(lǐng)域的應(yīng)用落地。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2025-10-23 12:49:08

2025-02-27 10:08:19

2013-11-04 14:56:17

IT

2025-06-04 08:40:00

AI教育生成

2020-03-10 10:44:11

網(wǎng)絡(luò)監(jiān)控網(wǎng)絡(luò)管理網(wǎng)絡(luò)監(jiān)控工具

2025-09-10 18:03:16

AI智能體開(kāi)源

2024-07-11 11:53:56

2022-07-14 14:00:01

Linux命令解析

2023-09-05 17:42:18

2025-02-12 10:12:00

視頻模型AI

2025-05-23 08:47:00

2024-07-15 07:52:00

2025-04-28 14:04:03

Gemini模型AI

2025-07-17 09:21:11

2024-10-21 13:50:00

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)

2023-10-31 12:23:17

GPT-4版本VLM

2020-10-10 10:35:17

人工智能機(jī)器學(xué)習(xí)技術(shù)

2024-06-12 11:50:23

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

成人做爰视频网站| 91精品91久久久中77777老牛| 国产一区二区三区四区视频 | 圆产精品久久久久久久久久久| 日韩在线影视| 欧美日产在线观看| 青青草国产免费| 成人jjav| av激情亚洲男人天堂| 国产精品999999| 免费一级肉体全黄毛片| 国内精品久久久久久久久电影网 | 亚洲91久久| 日韩大陆欧美高清视频区| 午夜久久久精品| xxxcom在线观看| 中文字幕一区二区三中文字幕| 国产精品国产精品国产专区不卡| 中文字幕 自拍偷拍| 亚洲婷婷免费| 久久精品国产亚洲| 人妻无码一区二区三区| 日韩一区二区三区精品| 欧美亚洲愉拍一区二区| 黄网站欧美内射| 免费黄色网址在线观看| 久久综合久久综合久久| 97超碰在线播放| 中文字幕在线观看精品| 久久国产精品久久w女人spa| 久久99国产精品自在自在app | 午夜影院欧美| 这里只有视频精品| 美国黄色一级毛片| 成人av影音| 日韩视频免费观看高清完整版| 天天影视综合色| 都市激情亚洲综合| 天天影视色香欲综合网老头| 美女av免费观看| 久久77777| 国产精品高清亚洲| 一级日韩一区在线观看| 成人77777| 国产午夜精品一区二区三区嫩草| 精品国产乱码一区二区三区四区| 亚洲国产中文字幕在线| 国产一区二区三区国产| 成人免费黄色网| 一级黄色大毛片| 奇米精品一区二区三区在线观看一| 欧美最猛性xxxxx(亚洲精品)| 久久无码精品丰满人妻| 欧美激情视频一区二区三区免费| 久久久999精品| 国产激情无码一区二区三区| 久久中文亚洲字幕| 色偷偷91综合久久噜噜| 蜜桃视频最新网址| 日韩欧美一区二区三区免费看| 在线观看亚洲区| 日韩黄色中文字幕| 欧美国产一级| 久久精品国产精品| 久久久无码一区二区三区| 欧美日韩国产高清| 国内精品小视频在线观看| 日产亚洲一区二区三区| 午夜亚洲性色福利视频| 热久久99这里有精品| 午夜一区二区三区四区| 裸体在线国模精品偷拍| 亚洲bt欧美bt日本bt| www视频在线| 99精品欧美一区二区三区综合在线| 精品视频高清无人区区二区三区| 九色视频在线观看免费播放| 欧美韩国日本综合| 黄色一级片av| 欧美13videosex性极品| 在线观看免费一区| 久久精品国产露脸对白| 国产伦乱精品| 国产亚洲欧美日韩美女| 男人与禽猛交狂配| 一级成人国产| 成人黄色av网站| 男人天堂av网| 国产精品视频看| 日韩精品一区二区在线视频| 无码小电影在线观看网站免费| 在线观看欧美日本| 国产免费a级片| 妖精视频一区二区三区免费观看| xxx成人少妇69| 日本在线视频免费| 久久99日本精品| 狠狠干一区二区| 黄色网在线看| 色综合久久综合网| 久久久久久国产精品日本| 色老板在线视频一区二区| 日韩视频免费大全中文字幕| 精品美女久久久久| 国内精品第一页| 欧美亚洲免费在线| 中文字幕伦理免费在线视频| 色欧美乱欧美15图片| 爱情岛论坛亚洲自拍| 精品久久久久中文字幕小说| 欧美高跟鞋交xxxxxhd| 国产日韩久久久| 99久久综合狠狠综合久久| 亚洲日本精品国产第一区| av伦理在线| 91精品国产综合久久久久久| 一道本在线观看| 在线免费观看欧美| 成人免费网站在线看| 麻豆影视在线| 亚洲成人激情综合网| 亚洲欧美天堂在线| 日韩黄色大片网站| 日本久久精品视频| 日韩在线一区二区三区四区| 亚洲三级电影网站| 日韩av片网站| 免费精品国产| 97超碰国产精品女人人人爽| www.爱爱.com| 亚洲欧美aⅴ...| 999在线观看| 日本久久一二三四| 国产99久久精品一区二区永久免费 | 视频一区视频二区在线观看| 国语精品中文字幕| 成人性生交大片免费看网站 | 俄罗斯女人裸体性做爰| 日韩中文在线电影| 国产欧美一区二区三区四区 | 欧美精品一区二区免费| 91亚洲国产成人精品一区| 国产免费成人在线视频| 熟女人妇 成熟妇女系列视频| 香蕉视频一区二区三区| 91av视频导航| 视频在线不卡| 色综合久久中文字幕综合网| avtt香蕉久久| 亚洲欧美成人综合| 欧美日韩精品免费看| 亚洲天堂电影| 亚洲人在线视频| 少妇无套内谢久久久久| 中文字幕二三区不卡| 午夜精品中文字幕| 亚洲色图欧美| 成人欧美视频在线| 国内激情视频在线观看| 日韩福利视频在线观看| 成人免费91在线看| 99热在线这里只有精品| 国产一区 二区| 久久久精品欧美| a毛片在线免费观看| 亚洲精品国产无天堂网2021| 欧美xxxx日本和非洲| 亚洲韩日在线| 欧美日韩免费观看一区| 成人全视频免费观看在线看| 深夜福利日韩在线看| 国产精品一级视频| 亚洲国产三级在线| 欧美图片第一页| 麻豆国产91在线播放| 在线观看成人免费| 精品国产导航| 国产精品久久久久7777婷婷| 免费大片在线观看www| 欧美一级二级三级蜜桃| 好吊操这里只有精品| 国产拍欧美日韩视频二区| 欧美国产日韩另类| 一区免费在线| 日本一区免费| 天堂av一区| 欧洲精品在线视频| 在线日本视频| 亚洲精品在线观| 中文字幕av免费观看| 一区二区不卡在线视频 午夜欧美不卡在| 波多野结衣加勒比| 欧美aaaaaa午夜精品| 国产精品免费看久久久无码| 亚洲国产最新| 91九色对白| 国精产品一区一区三区四川| 久久中文字幕在线| 欧美女优在线| 日韩免费成人网| 亚洲综合图片网| 一区二区三区四区不卡视频| 性少妇bbw张开| 国产激情偷乱视频一区二区三区| 国产又黄又大又粗视频| 一区二区在线影院| 欧美激情一区二区三区在线视频| 国产一区二区视频在线看| 秋霞午夜一区二区| 欧美人与动牲性行为| 中文字幕亚洲综合久久| 狠狠躁日日躁夜夜躁av| 欧美日产在线观看| 极品国产91在线网站| 亚洲一二三区不卡| 中文字幕在线观看2018| 国产欧美日韩不卡免费| 精品一区二区视频在线观看| 国产麻豆91精品| 欧美男女交配视频| 久久亚洲电影| 欧美深夜福利视频| 欧美亚韩一区| 97超碰人人爱| 91欧美国产| 日韩欧美亚洲区| 亚洲欧洲色图| 久久99欧美| 黄色免费大全亚洲| 91久久精品国产91久久性色tv| 涩涩涩久久久成人精品| 国产精品久久不能| 欧美色片在线观看| 国产精品成人久久久久| 中文字幕不卡三区视频| 668精品在线视频| gogo久久| 久久久久免费视频| 黑人极品ⅴideos精品欧美棵| 欧美大成色www永久网站婷| 精精国产xxxx视频在线| www日韩欧美| 国产cdts系列另类在线观看| 日韩视频永久免费观看| 91se在线| 色悠悠久久久久| 黄色网址视频在线观看| 久久影院资源网| 伊人影院蕉久影院在线播放| 久久偷看各类女兵18女厕嘘嘘| 婷婷五月在线视频| 久久精品国产一区二区三区| 麻豆av在线导航| 欧美成aaa人片免费看| 亚洲性图自拍| 久久久久久国产精品| 成人免费网站观看| 欧美中在线观看| 亚州一区二区三区| 91精品久久久久久| 日韩欧美高清一区二区三区| 国产精品免费一区二区| 亚洲色图美女| 亚洲精品国产精品国自产| 99精品视频在线观看播放| 日韩国产精品毛片| 亚洲二区视频| 男女曰b免费视频| 麻豆极品一区二区三区| 先锋资源在线视频| av在线一区二区| 中文字幕网站在线观看| 中文字幕制服丝袜成人av| 天天看片中文字幕| 亚洲va韩国va欧美va精品| 免费观看成人毛片| 欧美日韩精品一区二区在线播放| 99久久免费国产精精品| 亚洲二区中文字幕| 成人午夜电影在线观看| 欧美精品一区二区免费| 超碰aⅴ人人做人人爽欧美| 国产精品视频最多的网站| 国产精品高清一区二区| 精品国产乱码久久久久软件| 日本欧美肥老太交大片| 欧美图片激情小说| 日韩国产精品久久久| 91丨porny丨九色| 久久蜜臀精品av| 国产三级国产精品国产国在线观看| 亚洲国产成人av| 中文字幕久久久久| 亚洲成年人在线| 日本免费在线观看| 97超碰国产精品女人人人爽| 少妇高潮一区二区三区99| 精品久久久久久亚洲| 欧美大黑bbbbbbbbb在线| 国产精品又粗又长| 国产在线国偷精品产拍免费yy| av网站有哪些| 亚洲狠狠丁香婷婷综合久久久| 无码人妻丰满熟妇区bbbbxxxx| 日韩欧美色综合| 色综合久久影院| 热99精品里视频精品| 粉嫩一区二区三区四区公司1| 亚洲国产精品久久久久婷婷老年 | 日韩中文字幕在线免费| 久久精品久久99精品久久| 欧洲一级黄色片| 亚洲制服丝袜av| 91女人18毛片水多国产| 亚洲日本成人女熟在线观看| a国产在线视频| 波多野结衣成人在线| 91亚洲成人| 亚洲污视频在线观看| 97久久久精品综合88久久| 久久久一二三区| 欧美精品高清视频| av一本在线| 国产精品xxx视频| 欧美成人基地| 亚洲中文字幕无码av永久| 国产黄人亚洲片| 日本黄色小说视频| 91精品国产黑色紧身裤美女| 95在线视频| 国产精品男人的天堂| 激情五月综合网| 91看片就是不一样| 久久久精品欧美丰满| 亚洲天堂一区在线观看| 日韩高清免费观看| 天堂av中文在线观看| 久久艳妇乳肉豪妇荡乳av| 一区二区三区国产盗摄| 亚洲天堂av网站| 亚洲v日本v欧美v久久精品| 欧美77777| 97久久精品人人澡人人爽缅北| 国产一区二区三区不卡av| 国产欧美日韩网站| 99久久久国产精品免费蜜臀| 天天操天天干视频| 亚洲欧洲一区二区三区久久| 中文日产幕无线码一区二区| 欧美一区二区视频17c| 免费在线观看成人av| 一卡二卡三卡四卡| 欧美自拍偷拍一区| 91这里只有精品| 91在线观看免费网站| 午夜精品影院| 性农村xxxxx小树林| 同产精品九九九| 久草在线免费福利资源| 国产日本欧美一区二区三区| 欧美第一精品| 久久av一区二区三| 天天综合色天天综合| 成人网视频在线观看| 91九色国产视频| 黑丝一区二区| 最新中文字幕视频| 欧美三区免费完整视频在线观看| av播放在线| 成人片在线免费看| 国产日韩综合| 日本黄区免费视频观看 | 四虎永久在线精品免费网址| 7m第一福利500精品视频| 精品国产123区| 欧美国产日韩在线视频| 精品动漫一区二区| 在线免费观看黄| 99在线首页视频| 久久国产一二区| 翔田千里88av中文字幕| 亚洲黄色片网站| 日韩黄色三级在线观看| 日韩av中文字幕第一页| 国产午夜精品一区二区三区四区| 国产乱码精品一区二区| 91精品国产91| 999精品在线| 黄色a一级视频| 在线不卡a资源高清| 国产高清中文字幕在线| 亚洲在线色站| 99在线精品免费| 国产毛片久久久久| 欧美一级成年大片在线观看| 亚洲女同中文字幕| 在线国产视频一区| 欧美岛国在线观看| 99riav视频一区二区| 六月婷婷在线视频|