精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

AI學會灌水和造假!Google新研究揭露了AI現實應用的陷阱

新聞 人工智能
Google AI發文探討不規范(Underspecification)是如何給機器學習帶來挑戰的。

 [[430918]]

今天,機器學習(ML)模型得到了大規模的使用,而且影響力也越來越大。然而,當它們被用于現實世界的領域時,往往表現出意想不到的行為。Google AI發文探討不規范(Underspecification)是如何給機器學習帶來挑戰的。

如今,機器學習(ML)模型得到了比以往任何時候都更廣泛的使用,并且它的影響力也變得越來越大。

[[430919]]

然而,把它們放在現實領域中使用時,問題可不小,甚至經常會出現一些意想不到的行為。

例如,當分析一個計算機視覺(CV)模型的bad case的時候,研究人員有時會發現模型確實掌握了大部分對特征的理解能力,但對一些人類根本不會注意的、不相關的特征表現出驚人的敏感性。

再比如,一個自然語言處理(NLP)模型,讓它學習文本吧,它也確實在學,只不過有時會依賴文本沒有直接指示的人口統計相關性作為依據,更麻煩的是,這種錯誤還不太好預測。

[[430920]]

其實,有些失敗的原因,是眾所周知的:例如,在不精確的數據上訓練了ML模型,或者訓練模型來解決結構上與應用領域不匹配的預測問題。

然而,即使處理了這些已知的問題,模型行為在部署中仍然是不一致的,甚至在訓練運行之間也是不同的。

影響ML模型信度的罪魁:不規范

谷歌團隊在「Journal of Machine Learning Research」上發表了一篇論文「不規范對現代機器學習的可信度提出了挑戰」。

https://arxiv.org/pdf/2011.03395.pdf

文章中,研究人員表明:在現代機器學習系統中,一個特別容易造成故障的問題是不規范。

而且,在各種各樣的實際機器學習(ML)系統中都經常會出現不規范,所以,谷歌對此提出了一些緩解策略。

什么是不規范?

不規范背后的意思是,雖然機器學習模型在保留的數據上進行過驗證,但這種驗證通常不足以保證模型在新環境中使用時,依然具有明確定義的行為。

ML系統之所以成功,很大程度上是因為它們在保留數據集上,對模型進行了驗證,靠這樣的方式來確保模型的高性能。

模型驗證流程

然而,對于固定的數據集和模型架構,通常有許多不同的方法,可以使訓練好的模型獲得高驗證性能。

但是在標準的預測任務中,編碼不同解決方案的模型通常被視為等價的,因為它們的持續預測性能大致相等。

但是,如果以超出標準預測性能的標準來衡量這些模型時,它們之間的區別就會變得很明顯,這就是要考驗這些模型對不相關的輸入擾動的公平性或魯棒性。

舉個例子,在標準驗證中表現同樣出色的模型中,一些模型可能在社會群體和人種之間表現出比其他模型更大的性能差異,或者更加依賴不相關的信息。

輕微擾動就可以讓深度學習網絡完全失靈

那么,當這些模型用于現實場景時,這些差異就會轉化為預測行為上的真正差異。

不規范會導致研究人員在構建ML模型時想到的需求和ML管道(即模型的設計和實現)實際執行的需求之間的差距。

一個重要后果就是,ML管道原則上可以返回一個滿足研究需求的模型,可是,這樣一來,在實踐中,這個模型也就只能滿足對保留數據的準確預測,而對超出這些數據分布的數據,它卻無能為力。

如何識別應用中的不規范?

這項工作研究了在現實應用中,使用機器學習模型時,不規范的具體含義。

谷歌給出的策略是使用幾乎相同的機器學習(ML)管道來構建模型集,只對其施加對非常小的改變,這種改變之小,即使是對他們同時進行標準驗證,性能也不會有實際影響。這種策略的重點是關注模型初始化訓練和確定數據排序的隨機種子。

ML Pipeline示意圖

如果這些小變化會對模型的重要屬性帶來實質性影響,那么,就說明ML管道沒有完全指出模型在真實世界會出現的行為。而研究人員在實驗的每個領域中,都發現了這些微小的變化會導致模型的行為在現實世界的使用中出現實質性變化。

計算機視覺中的不規范

舉一個例子,你可以想想計算機視覺中不規范與魯棒性的關系。

計算機視覺中的一個主要挑戰是,深度學習模型在人類認為沒什么挑戰性的分布變化下,經常會變得脆弱。

眾所周知,在ImageNet基準測試中,表現良好的圖像分類模型在ImageNet-C等基準測試中表現不佳,只不過是因為這些測試將常見的圖像損壞(如像素化或運動模糊)應用于標準ImageNet測試集。所以,在實驗中,標準管道沒有規定出模型對這些破壞的敏感度。

ImageNet-C數據集樣例

按照上面的策略,使用相同的管道和相同的數據生成50個ResNet-50圖像分類模型。這些模型之間的唯一區別是訓練中使用的隨機種子。

當在標準的ImageNet驗證集上進行評估時,這些模型實際上獲得了相同的性能。然而,當模型在ImageNet-C(即在損壞的數據上)中的不同測試集上進行評估時,模型的測試性能變化比在標準的ImageNet上驗證大幾個數量級。

就算是在大得多的數據集上進行預訓練的大規模模型,像在JFT-300M的3億圖像數據集上預先訓練的BiT-L模型,這種不規范持續存在。對于這些模型,在訓練的微調階段改變隨機種子會產生類似的變化。

左圖:在嚴重損壞的ImageNet-C數據上,相同的隨機初始化的ResNet-50模型之間的精度變化。線條表示集合中每個模型在使用未損壞測試數據和損壞數據(像素化、對比度、運動模糊和亮度改變)的分類任務中的性能。給定值是相對于總體平均值的精度偏差,用在「干凈的」ImageNet測試集上的精度標準偏差來衡量。黑色實線突出顯示了任意選擇的模型的性能,以顯示一個測試的性能如何不能很好地指示其他測試的性能。

右圖:標準ImageNet測試集中的示例圖像,其中包含ImageNet-C基準測試的損壞版本。

另外,在專門為醫學成像構建的專用計算機視覺模型中,這個問題也同樣存在。其中深度學習模型顯示出巨大的前景。

這里以兩個應用方向為例,一個是眼科方向,用于從視網膜眼底圖像檢測糖尿病視網膜病變,另一個是皮膚病方向,從皮膚的照片判斷患者的皮膚病情況。

研究人員對實際重要的維度上對這些pipeline生成的模型進行了壓力測試。

對于眼科方向,研究人員測試了以不同隨機種子訓練的模型,在訓練期間未遇見的新相機拍攝的圖像時的執行結果。

對于皮膚科方向,測試思路大致相似,但針對的是皮膚類型不同的患者。

左上:在來自不同相機類型的圖像上評估時,使用不同隨機種子訓練的糖尿病視網膜病變分類模型之間的AUC變化。左下:在不同的估計皮膚類型上評估時,使用不同隨機種子訓練的皮膚狀況分類模型之間的準確性差異(由皮膚科醫生訓練的外行根據回顧性照片進行近似,可能會出現標記錯誤)。右圖:來自原始測試集(左)和壓力測試集(右)的示例圖像。

結果顯示,標準驗證確實不足以完全體現訓練模型在這些任務上的性能。比如在眼科方向的測試中,訓練中使用的隨機種子導致模型在面對新相機拍出的圖片時,出現了比標準驗證集更大的變量波動。

這些結果再次表明,單獨的標準保持測試不足以確保醫療應用中模型的可靠性,需要對用于醫療領域模型的測試和驗證協議進行擴展。在醫學文獻中,這些驗證被稱為「外部驗證」。

除了醫學領域外,分類不規范導致的問題在其他應用領域也同樣存在。比如:

  • 在NLP任務中,分類不規范會影響由BERT模型衍生出的句子。

  • 在急性腎損傷預測任務重,分類不規范會導致對操作信號與生理信號的更多依賴。

  • 在多基因風險評分 (PRS)任務中,分類不規范會影響 PRS 模型的性能。

結論

解決不規范問題是頗具挑戰性的,它需要對超出標準預測性能的模型進行完整的規范和測試。要做到這一點,需要充分了解模型使用環境,了解如何收集訓練數據,而且在可用數據不足時,需要結合領域內的專業知識。

而上述幾點恰恰在當今的機器學習研究中經常被低估。長期以來,對于這些領域的投入是不足的。

要解決這個問題,首先需要為機器學習實用模型指定新的壓力測試協議,對現有的測試方式進行擴展。在將新的測試標準編入可衡量的指標之后,通過數據增強、預訓練和因果結構等算法策略,可能有助于改進這些模型的性能。

但同樣應該注意的是,理想的壓力測試和改進過程通常需要迭代,因為機器學習系統需求和使用它們的世界都在不斷變化。

 

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-11-11 08:49:00

AI機器人訓練

2024-04-15 08:00:00

AI程序員

2025-06-10 00:00:00

AI紅利員工

2025-07-24 10:43:46

2018-04-04 16:37:55

2024-11-20 13:11:43

2025-07-23 07:57:53

2019-05-06 10:50:44

AI智能算法

2024-10-09 14:55:00

2025-11-10 08:59:00

AI模型ChatGPT

2025-02-12 10:05:00

AILLM訓練

2025-08-21 07:00:00

AI工具人工智能大模型

2023-12-11 21:43:47

2025-02-28 08:00:00

AI工廠數據中心GPU

2022-01-06 15:18:47

盜竊團伙攻擊勒索軟件

2019-08-08 10:36:55

AI 數據人工智能

2025-02-26 07:55:14

2018-06-20 12:53:21

戴爾

2009-05-30 09:33:10

Palm PreWebOS移動OS

2022-01-13 10:09:26

微軟MacOS系統漏洞
點贊
收藏

51CTO技術棧公眾號

亚洲涩涩在线| 国产一级片网址| 成人在线不卡| 亚洲精品日韩一| 国产精品对白一区二区三区| 免费观看一级视频| 亚洲丝袜美腿一区| 欧美色成人综合| 97在线免费视频观看| 日韩一卡二卡在线| 免费高清在线一区| 色综合久久88色综合天天看泰| 在线黄色免费网站| 成人精品国产| 精品国产鲁一鲁一区二区张丽 | 中文字幕一区二区在线视频 | 欧美日韩一级黄色片| 国产精品黑丝在线播放| 亚洲成色777777女色窝| 小泽玛利亚视频在线观看| a'aaa级片在线观看| 国产午夜精品理论片a级大结局| 91久久久久久久| 国产剧情在线视频| 亚洲视频观看| 久久久国产91| 91视频免费在观看| 欧美美女黄色| 日韩一区二区精品| 日本不卡一区在线| 韩国美女久久| 午夜久久久影院| 97av中文字幕| 国产精品一区二区三区视频网站| 久久色.com| 成人av中文| 一级视频在线播放| 久久久久久亚洲精品杨幂换脸| 久久91精品国产91久久久| 三区四区在线观看| 亚洲精品**不卡在线播he| 精品久久久久一区| 一起草最新网址| 亚洲视频自拍| 欧美色综合影院| 成人黄色一区二区| 手机看片久久| 在线观看中文字幕不卡| 国产日韩一区二区在线| 天堂在线中文网官网| 亚洲电影在线免费观看| 亚洲精品国产suv一区88| 黄色在线免费| 亚洲手机成人高清视频| 亚洲AV无码成人精品一区| 免费在线观看日韩欧美| 欧美激情一区二区三区不卡 | 免费av网站在线| 一区精品久久| 韩国三级电影久久久久久| 欧美国产日韩综合| 亚洲乱码免费伦视频| 日韩中文字幕精品| 五月天免费网站| 欧美国产一级| 精品国产一区久久久| 少妇视频一区二区| 性xxxx欧美老肥妇牲乱| 久久综合网hezyo| 欧美交换国产一区内射| 黑人一区二区三区四区五区| 欧美黄色三级网站| 国产在线欧美在线| 亚洲精品韩国| 国产成人午夜视频网址| 国产成人一二三区| 色女人在线视频| 亚洲高清久久久| 欧美日韩成人免费视频| 欧美大片免费高清观看| 欧美日韩中文字幕精品| 特黄视频免费观看| 成人台湾亚洲精品一区二区| 亚洲精品久久视频| 能免费看av的网站| 色婷婷色综合| 久久久久久久999| 免费av网站在线| 韩国成人福利片在线播放| 国产精品露出视频| 搞黄视频在线观看| 日本一区二区三区四区在线视频| 超碰在线免费观看97| eeuss鲁一区二区三区| 91极品视觉盛宴| 无套白嫩进入乌克兰美女| 麻豆精品少妇| 精品国产依人香蕉在线精品| 日韩av免费网址| 奇米色777欧美一区二区| 97人摸人人澡人人人超一碰| 男男激情在线| 樱花影视一区二区| 人妻内射一区二区在线视频| 亚洲精品大片| 日韩激情av在线播放| 久草福利资源在线| 999亚洲国产精| 成人a在线观看| 丝袜视频国产在线播放| 亚洲欧美一区二区三区久本道91 | 成人性生交大片免费看网站| 日本高清不卡一区| 无码人妻一区二区三区精品视频| 欧美亚洲国产激情| 97国产suv精品一区二区62| 中文字幕欧美在线观看| 不卡av电影在线播放| 亚洲自拍三区| 色尼玛亚洲综合影院| 精品999久久久| 我要看黄色一级片| 久久三级福利| 精品国产乱码久久久久软件 | 亚洲黄色录像| 欧美高清视频一区二区| 在线观看国产小视频| aaa亚洲精品| 热久久最新网址| 人人精品久久| 亚洲一级黄色av| 51国产偷自视频区视频| 一区二区三区日韩欧美精品| 99精品在线直播| 成人免费在线电影| 亚洲国产视频一区二区| 欧美wwwwwww| 你懂的视频欧美| 91精品国产一区| 亚洲精品视频91| 国产网红在线观看| 国产精品欧美在线观看| 久久影院在线观看| 欧美成人一区二区视频| 99精品久久99久久久久| 日本一道在线观看| 久久成人国产精品入口| 久久蜜桃精品| 久久精品aaaaaa毛片| 女人天堂av在线播放| 3d成人动漫网站| 最新黄色av网址| 久久精品av麻豆的观看方式| 日韩三级电影网站| 欧美亚洲大片| 中文字幕视频在线免费欧美日韩综合在线看 | 99re这里只有精品视频首页| 777精品久无码人妻蜜桃| 国产精品宾馆| 18一19gay欧美视频网站| 午夜小视频在线播放| 欧美性猛交xxxx免费看| 亚洲国产精品黑人久久久| 久热精品视频在线观看| 欧美成人综合一区| 美足av综合网| 亚洲成年人在线| 日韩黄色在线视频| 99久久精品99国产精品| 欧美在线观看成人| 免费电影一区二区三区| 国产精品久久一区主播| 午夜免费视频在线国产| 91精品欧美久久久久久动漫| 国产三级国产精品国产国在线观看| 国产在线观看免费一区| 国产高清不卡无码视频| 精品精品国产毛片在线看| 777国产偷窥盗摄精品视频| 欧美老女人性开放| 欧美午夜影院一区| 欧美亚洲日本在线| 不卡的电视剧免费网站有什么| 女人扒开屁股爽桶30分钟| 神马影视一区二区| 成人做爰www免费看视频网站| 伊人福利在线| 日韩经典中文字幕| 在线观看国产小视频| 亚洲综合av网| 一道本在线观看| 黑人巨大精品欧美一区| 人妻av中文系列| 波多野结衣在线播放一区| 91免费的视频在线播放| 欧美aa在线观看| 精品国产一区二区三区四区在线观看 | 91精品1区2区| 精品97人妻无码中文永久在线| 久久你懂得1024| 中文字幕欧美视频| 日韩高清在线电影| 中文精品无码中文字幕无码专区| 亚洲欧美tv| 91视频在线免费观看| 都市激情亚洲一区| 欧美激情网友自拍| 中文字幕在线播放| 日韩精品极品毛片系列视频| 99精品视频免费看| 欧洲av在线精品| 日韩精品无码一区二区| 国产精品久久久久毛片软件| 精品无码国产一区二区三区51安| 久久国产福利国产秒拍| 精品视频一区二区在线| 尤物在线精品| 99精品一区二区三区的区别| 视频精品在线观看| 国产在线一区二区三区四区| 国产美女精品视频免费播放软件| 国产99久久久欧美黑人| h片在线观看| 九九热精品视频国产| 欧美日韩在线资源| 亚洲一区二区黄| 色婷婷中文字幕| 日韩欧美一区二区在线视频| 一道本无吗一区| 91豆麻精品91久久久久久| 国产做受高潮漫动| 亚洲一区二区三区精品在线| 乱h高h女3p含苞待放| 国产精品女上位| 亚洲国产日韩一区无码精品久久久| av在线不卡电影| 99免费观看视频| 国产精品中文字幕日韩精品 | 波多野结衣在线观看视频| 精品av在线播放| 黄色一级片免费看| 亚洲国产精品一区二区www在线| 少妇被躁爽到高潮无码文| 国产精品国产三级国产普通话99 | 天堂影院在线| 日韩大片在线观看视频| 天天综合在线视频| 亚洲第一网站免费视频| 人妻妺妺窝人体色www聚色窝| 欧美v国产在线一区二区三区| 国产成人精品一区二三区四区五区| 制服丝袜成人动漫| 国产亚洲精品资源在线26u| 日本丰满少妇xxxx| 欧美精品国产一区| 精品一区二区成人免费视频| 日韩综合网站| 伊甸园精品99久久久久久| 欧美在线色图| 在线视频福利一区| 久久久人成影片免费观看| 超碰在线免费观看97| 欧美国产另类| 欧美午夜性视频| 亚洲精选成人| 久久久999视频| 日韩影院在线观看| 免费一区二区三区在线观看| 久久99精品国产麻豆婷婷洗澡| 日韩va在线观看| 国产mv日韩mv欧美| 9.1成人看片| 欧美激情一区二区三区全黄| 欧美色视频一区二区三区在线观看| 亚洲欧美视频在线观看视频| 免费在线观看黄色av| 午夜久久久久久| 波多野结衣电车痴汉| 欧美日韩综合色| 超碰在线播放97| 日韩精品中文字幕视频在线| 岛国大片在线观看| 久久久精品电影| av在线加勒比| 国产精品高清免费在线观看| 国产aⅴ精品一区二区四区| 97se亚洲综合| 在线成人动漫av| 色爽爽爽爽爽爽爽爽| 日韩视频一区二区三区在线播放免费观看| 成人在线观看黄| 国产一区91精品张津瑜| www.超碰97| 亚洲人吸女人奶水| 黄色在线观看国产| 欧美一级生活片| 青青青草原在线| 欧美成人一区在线| 国产另类xxxxhd高清| 国产91精品入口17c| 国产乱码精品一区二区三区四区| 国产a级片免费看| 久久天堂成人| 影音先锋资源av| 国产精品久久久久久久久动漫 | 欧美午夜精品在线| 97超碰资源站| 亚洲欧美色婷婷| 成人女同在线观看| 成人欧美一区二区三区在线湿哒哒 | 激情综合亚洲| 无码人中文字幕| 亚洲黄色视屏| 在线免费观看av的网站| 粉嫩一区二区三区性色av| 在线观看日本中文字幕| 尤物在线观看一区| 91麻豆精品在线| 亚洲国产精品美女| av免费在线免费| 国产精品视频yy9099| 激情亚洲另类图片区小说区| 麻豆中文字幕在线观看| 久久久久综合| 香港三日本8a三级少妇三级99| 亚洲婷婷综合色高清在线| 天天干,天天干| 亚洲激情自拍图| 欧美6一10sex性hd| 国产欧美久久久久久| 亚洲男人都懂第一日本| www.男人天堂网| 精品一区二区在线免费观看| 成人午夜福利一区二区| 婷婷一区二区三区| 亚洲第一天堂在线观看| 久久久极品av| 91成人app| 国产精品jizz在线观看老狼| 日韩电影在线免费| 亚洲AV无码国产成人久久| 精品国产31久久久久久| 亚州男人的天堂| 91av视频在线| 色天下一区二区三区| 黄网站欧美内射| 成人动漫在线一区| 日本熟妇毛耸耸xxxxxx| 精品久久久三级丝袜| segui88久久综合| 国内精品国语自产拍在线观看| 国内自拍一区| 在线看黄色的网站| 婷婷六月综合亚洲| 青青久在线视频免费观看| 国产91成人在在线播放| 亚洲成aⅴ人片久久青草影院| 丰满爆乳一区二区三区| 26uuu色噜噜精品一区| 天天干天天干天天操| 亚洲情综合五月天| 国产精品久久亚洲不卡| 亚洲高清123| 久久99精品久久久| 国产成人无码aa精品一区| 精品福利一区二区三区免费视频| heyzo高清中文字幕在线| 久久一区二区精品| 日本中文在线一区| 免费黄色国产视频| 日韩免费看网站| 乱馆动漫1~6集在线观看| 玛丽玛丽电影原版免费观看1977| 亚洲欧美日本国产专区一区| 国产又粗又长免费视频| 欧美一区二区三区四区久久| 超黄网站在线观看| 日本一区二区三区免费观看| 久久国产精品第一页| 青娱乐国产精品| 亚洲精品日韩欧美| 日本a人精品| 欧美日韩亚洲视频| 污视频网站在线播放| 国产成人一区二区三区| 99精品在线观看| 老熟女高潮一区二区三区| 懂色aⅴ精品一区二区三区蜜月 | 一区二区视频免费完整版观看| 一本色道久久综合亚洲二区三区| 国产精品夜夜嗨| 黄色在线免费观看| 久久精品99久久香蕉国产色戒| 都市激情亚洲欧美| 国产精品乱码久久久久| 亚洲一卡二卡三卡四卡无卡久久 | 精精国产xxx在线视频app| 国产一区香蕉久久| 亚洲一级二级| 2019男人天堂|