精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

在表格數(shù)據(jù)上,為什么基于樹的模型仍然優(yōu)于深度學(xué)習(xí)?

人工智能 新聞
為什么基于樹的機(jī)器學(xué)習(xí)方法,如 XGBoost 和隨機(jī)森林在表格數(shù)據(jù)上優(yōu)于深度學(xué)習(xí)?本文給出了這種現(xiàn)象背后的原因,他們選取了 45 個(gè)開放數(shù)據(jù)集,并定義了一個(gè)新基準(zhǔn),對(duì)基于樹的模型和深度模型進(jìn)行比較,總結(jié)出三點(diǎn)原因來(lái)解釋這種現(xiàn)象。

深度學(xué)習(xí)在圖像、語(yǔ)言甚至音頻等領(lǐng)域取得了巨大的進(jìn)步。然而,在處理表格數(shù)據(jù)上,深度學(xué)習(xí)卻表現(xiàn)一般。由于表格數(shù)據(jù)具有特征不均勻、樣本量小、極值較大等特點(diǎn),因此很難找到相應(yīng)的不變量。

基于樹的模型不可微,不能與深度學(xué)習(xí)模塊聯(lián)合訓(xùn)練,因此創(chuàng)建特定于表格的深度學(xué)習(xí)架構(gòu)是一個(gè)非常活躍的研究領(lǐng)域。許多研究都聲稱可以擊敗或媲美基于樹的模型,但他們的研究遭到很多質(zhì)疑。

事實(shí)上,對(duì)表格數(shù)據(jù)的學(xué)習(xí)缺乏既定基準(zhǔn),這樣一來(lái)研究人員在評(píng)估他們的方法時(shí)就有很多自由度。此外,與其他機(jī)器學(xué)習(xí)子域中的基準(zhǔn)相比,大多數(shù)在線可用的表格數(shù)據(jù)集都很小,這使得評(píng)估更加困難。

為了緩解這些擔(dān)憂,來(lái)自法國(guó)國(guó)家信息與自動(dòng)化研究所、索邦大學(xué)等機(jī)構(gòu)的研究者提出了一個(gè)表格數(shù)據(jù)基準(zhǔn),其能夠評(píng)估最新的深度學(xué)習(xí)模型,并表明基于樹的模型在中型表格數(shù)據(jù)集上仍然是 SOTA。

對(duì)于這一結(jié)論,文中給出了確鑿的證據(jù),在表格數(shù)據(jù)上,使用基于樹的方法比深度學(xué)習(xí)(甚至是現(xiàn)代架構(gòu))更容易實(shí)現(xiàn)良好的預(yù)測(cè),研究者并探明了其中的原因。

圖片

論文地址:https://hal.archives-ouvertes.fr/hal-03723551/document值得一提的是,論文作者之一是 Ga?l Varoquaux ,他是 Scikit-learn 計(jì)劃的領(lǐng)導(dǎo)者之一。目前該項(xiàng)目在 GitHub 上已成為最流行的機(jī)器學(xué)習(xí)庫(kù)之一。而由 Ga?l Varoquaux 參與的文章《Scikit-learn: Machine learning in Python》,引用量達(dá) 58949。?

圖片

本文貢獻(xiàn)可總結(jié)為:

該研究為表格數(shù)據(jù)創(chuàng)建了一個(gè)新的基準(zhǔn)(選取了 45 個(gè)開放數(shù)據(jù)集),并通過 OpenML 共享這些數(shù)據(jù)集,這使得它們易于使用。

該研究在表格數(shù)據(jù)的多種設(shè)置下比較了深度學(xué)習(xí)模型和基于樹的模型,并考慮了選擇超參數(shù)的成本。該研究還分享了隨機(jī)搜索的原始結(jié)果,這將使研究人員能夠廉價(jià)地測(cè)試新算法以獲得固定的超參數(shù)優(yōu)化預(yù)算。

在表格數(shù)據(jù)上,基于樹的模型仍然優(yōu)于深度學(xué)習(xí)方法

?新基準(zhǔn)參考 45 個(gè)表格數(shù)據(jù)集,選擇基準(zhǔn)如下 :

  • 異構(gòu)列,列應(yīng)該對(duì)應(yīng)不同性質(zhì)的特征,從而排除圖像或信號(hào)數(shù)據(jù)集。
  • 維度低,數(shù)據(jù)集 d/n 比率低于 1/10。
  • 無(wú)效數(shù)據(jù)集,刪除可用信息很少的數(shù)據(jù)集。
  • I.I.D.(獨(dú)立同分布)數(shù)據(jù),移除類似流的數(shù)據(jù)集或時(shí)間序列。
  • 真實(shí)世界數(shù)據(jù),刪除人工數(shù)據(jù)集,但保留一些模擬數(shù)據(jù)集。
  • 數(shù)據(jù)集不能太小,刪除特征太少(< 4)和樣本太少(< 3 000)的數(shù)據(jù)集。
  • 刪除過于簡(jiǎn)單的數(shù)據(jù)集。
  • 刪除撲克和國(guó)際象棋等游戲的數(shù)據(jù)集,因?yàn)檫@些數(shù)據(jù)集目標(biāo)都是確定性的。

 在基于樹的模型中,研究者選擇了 3 種 SOTA 模型:Scikit Learn 的 RandomForest,GradientBoostingTrees (GBTs) , XGBoost 。該研究對(duì)深度模型進(jìn)行了以下基準(zhǔn)測(cè)試:MLP、Resnet 、FT Transformer、SAINT 。圖 1 和圖 2 給出了不同類型數(shù)據(jù)集的基準(zhǔn)測(cè)試結(jié)果

圖片?圖片

實(shí)證調(diào)查:為什么基于樹的模型在表格數(shù)據(jù)上仍然優(yōu)于深度學(xué)習(xí)

歸納偏差。基于樹的模型在各種超參數(shù)選擇中擊敗了神經(jīng)網(wǎng)絡(luò)。事實(shí)上,處理表格數(shù)據(jù)的最佳方法有兩個(gè)共有屬性:它們是集成方法、bagging(隨機(jī)森林)或 boosting(XGBoost、GBT),而這些方法中使用的弱學(xué)習(xí)器是決策樹。

?發(fā)現(xiàn) 1:神經(jīng)網(wǎng)絡(luò)(NN)傾向于過度平滑的解決方案

如圖 3 所示,對(duì)于較小的尺度,平滑訓(xùn)練集上的目標(biāo)函數(shù)會(huì)顯著降低基于樹的模型的準(zhǔn)確率,但幾乎不會(huì)影響 NN。這些結(jié)果表明,數(shù)據(jù)集中的目標(biāo)函數(shù)并不平滑,與基于樹的模型相比,NN 難以適應(yīng)這些不規(guī)則函數(shù)。這與 Rahaman 等人的發(fā)現(xiàn)一致,他們發(fā)現(xiàn) NN 偏向于低頻函數(shù)。基于決策樹的模型學(xué)習(xí)分段(piece-wise)常函數(shù),沒有這樣的偏置。

圖片

發(fā)現(xiàn) 2:非信息特征更能影響類似 MLP 的 NN

表格數(shù)據(jù)集包含許多非信息( uninformative)特征,對(duì)于每個(gè)數(shù)據(jù)集,該研究根據(jù)特征的重要性會(huì)選擇丟棄一定比例的特征(通常按隨機(jī)森林排序)。從圖 4 可以看出,去除一半以上的特征對(duì) GBT 的分類準(zhǔn)確率影響不大。

圖片

圖 5 可以看到移除非信息特征 (5a) 減少了 MLP (Resnet) 與其他模型(FT Transformers 和基于樹的模型)之間的性能差距 ,而添加非信息特征會(huì)擴(kuò)大差距,這表明 MLP 對(duì)非信息特征的魯棒性較差。在圖 5a 中,當(dāng)研究者移除更大比例的特征時(shí),相應(yīng)的也會(huì)刪除有用信息特征。圖 5b 表明,去除這些特征所帶來(lái)的準(zhǔn)確率下降可以通過去除非信息特征來(lái)補(bǔ)償,與其他模型相比,這對(duì) MLP 更有幫助(同時(shí),該研究還刪除了冗余特性,也不會(huì)影響模型性能)。

圖片

發(fā)現(xiàn) 3:通過旋轉(zhuǎn),數(shù)據(jù)是非不變的

與其他模型相比,為什么 MLP 更容易受到無(wú)信息特征的影響?其中一個(gè)答案是,MLP 是旋轉(zhuǎn)不變的:當(dāng)對(duì)訓(xùn)練集和測(cè)試集特征應(yīng)用旋轉(zhuǎn)時(shí),在訓(xùn)練集上學(xué)習(xí) MLP 并在測(cè)試集上進(jìn)行評(píng)估,這一過程是不變的。事實(shí)上,任何旋轉(zhuǎn)不變的學(xué)習(xí)過程都具有最壞情況下的樣本復(fù)雜度,該復(fù)雜度至少在不相關(guān)特征的數(shù)量上呈線性增長(zhǎng)。直觀地說,為了去除無(wú)用特征,旋轉(zhuǎn)不變算法必須首先找到特征的原始方向,然后選擇信息最少的特征。

圖 6a 顯示了當(dāng)對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)旋轉(zhuǎn)時(shí)的測(cè)試準(zhǔn)確率變化,證實(shí)只有 Resnets 是旋轉(zhuǎn)不變的。值得注意的是,隨機(jī)旋轉(zhuǎn)顛倒了性能順序:結(jié)果是 NN 在基于樹的模型之上,Resnets 在 FT Transformer 之上,這表明旋轉(zhuǎn)不變性是不可取的。事實(shí)上,表格數(shù)據(jù)通常具有單獨(dú)含義,例如年齡、體重等。圖 6b 中顯示:刪除每個(gè)數(shù)據(jù)集中最不重要的一半特征(在旋轉(zhuǎn)之前),會(huì)降低除 Resnets 之外的所有模型的性能,但與沒有刪除特征使用所有特征時(shí)相比,相比較而言,下降的幅度較小。

圖片

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2022-08-29 14:59:12

深度學(xué)習(xí)樹的模型神經(jīng)網(wǎng)絡(luò)

2024-06-26 10:50:35

2023-08-13 19:45:12

DNS

2020-09-16 10:02:08

神經(jīng)網(wǎng)絡(luò)模型

2021-03-08 11:28:59

人工智能深度學(xué)習(xí)Python

2014-07-16 09:45:36

DOS

2017-08-08 16:38:50

IT敏捷devops

2023-10-30 07:24:18

IT項(xiàng)目DevOps

2022-03-28 11:51:00

深度學(xué)習(xí)機(jī)器學(xué)習(xí)模型

2023-08-11 10:58:04

深度學(xué)習(xí)自然語(yǔ)言檢索增強(qiáng)

2012-05-02 15:56:20

PHP

2020-04-16 11:19:55

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)層

2022-02-14 13:59:47

數(shù)據(jù)數(shù)據(jù)孤島大數(shù)據(jù)

2021-03-02 16:25:13

手機(jī)iPhone安卓

2021-04-03 12:39:20

SQL數(shù)據(jù)庫(kù)編程語(yǔ)言

2022-03-28 18:59:02

DockerFlask深度學(xué)習(xí)

2021-06-25 11:19:04

LinuxWindows操作系統(tǒng)

2016-12-23 09:09:54

TensorFlowKubernetes框架

2018-05-09 09:55:36

數(shù)據(jù)分析

2023-05-15 14:02:24

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲精品久久久久久久久久久久久久| 草草视频在线免费观看| 永久免费无码av网站在线观看| 中日韩免视频上线全都免费| 在线视频你懂得一区二区三区| 亚洲乱码国产乱码精品天美传媒| 国内精品偷拍视频| 亚洲欧美春色| 另类天堂视频在线观看| 亚洲观看黄色网| 九七电影院97理论片久久tvb| 一区二区久久久久久| 欧美一级片免费观看| 精品二区在线观看| 日韩av一区二| 午夜精品福利视频| 天天做夜夜爱爱爱| 欧美极品中文字幕| 337p日本欧洲亚洲大胆精品| 午夜久久久精品| 色是在线视频| 亚洲综合一区二区| 亚洲欧美影院| 亚洲色图另类小说| 国产91露脸合集magnet| 国产精品久久9| 日本中文字幕网| 91精品秘密在线观看| 亚洲视频999| 岛国精品资源网站| 中文无码日韩欧| 欧美日韩另类一区| 成人久久久久久久久| 黄色的视频在线观看| 国产婷婷精品av在线| 国产精品视频福利| 性生活视频软件| 激情综合色播激情啊| 日本在线观看天堂男亚洲 | 东京热一区二区三区四区| 欧美1级日本1级| 久久久成人av| 日韩影院一区二区| 国产精品久久久久久久| 一区二区日韩精品| 免费视频91蜜桃| 欧美日韩播放| 国产亚洲福利一区| a级大片在线观看| 小说区图片区色综合区| 日韩高清av在线| 国产精品第七页| 全国精品免费看| 亚洲美女av在线| 无码人妻精品一区二区三区温州| 日韩伦理一区二区三区| 亚洲精品国产美女| 亚洲人成人无码网www国产| 伊人久久综合影院| 亚洲香蕉伊综合在人在线视看| 黄瓜视频污在线观看| 宅男在线一区| 色噜噜狠狠狠综合曰曰曰88av| 久久亚洲AV无码专区成人国产| 久久av超碰| 一本色道久久88亚洲综合88| 精品伦精品一区二区三区视频密桃| 精品日本12videosex| 中文字幕欧美在线| 少妇被躁爽到高潮无码文| 欧美精品网站| 26uuu国产精品视频| 亚洲不卡在线视频| 亚洲欧美国产日韩综合| 黄瓜视频成人app免费| 色婷婷久久久综合中文字幕| 国产原创popny丨九色| xx欧美xxx| 欧美无砖专区一中文字| 夜夜嗨av色综合久久久综合网 | 久久精品国产精品青草| 91精品免费看| 天天干,夜夜操| 亚洲国产高清在线观看视频| 一级特黄妇女高潮| mm视频在线视频| 色噜噜狠狠成人网p站| 午夜精品中文字幕| 成人涩涩网站| 国产一区二区三区久久精品| 色婷婷在线视频观看| 一区二区三区国产在线| 国产精品最新在线观看| 好吊色视频一区二区| 欧美经典一区二区| 国产不卡一区二区视频| 欧美日韩精品在线| 国产精品久久成人免费观看| 美女网站视频在线| 一本一本大道香蕉久在线精品| 永久免费的av网站| 美女福利一区| 精品国产一区二区三区久久狼5月| 妺妺窝人体色www在线下载| 亚洲欧美春色| 成人av资源网| 最新真实国产在线视频| 亚洲va国产天堂va久久en| 欧美wwwwwww| 欧美sss在线视频| 久久综合电影一区| 波多野结衣高清视频| 岛国一区二区三区| 三年中文高清在线观看第6集| 妞干网免费在线视频| 欧美一区二区三区日韩视频| 欧美黄色激情视频| 亚洲日韩成人| av在线不卡一区| 日本电影在线观看网站| 欧美日韩免费看| 人妻精品久久久久中文字幕69| 国产精品美女久久久久久不卡| 色综合久综合久久综合久鬼88| 中文字幕精品一区二| 91香蕉视频污| 欧美在线一区视频| ccyy激情综合| 欧美巨乳美女视频| 国产又粗又猛又爽又黄91| 国产亚洲成年网址在线观看| 日韩伦理在线免费观看| 久久一级大片| 久久香蕉国产线看观看av| 羞羞色院91蜜桃| 久久久久久免费网| 黄色av网址在线播放| 久久久久久青草| 亚洲国产成人高清精品| 蜜桃视频无码区在线观看| 99久久精品网| 国产精品中文字幕在线观看| 欧美一区二区视频| 福利视频一区二区| 国产麻豆xxxvideo实拍| 亚洲福利国产| 国产伦理一区二区三区| 成人福利电影| 亚洲第一天堂av| 黄色小说在线观看视频| 国产成人av电影在线| 菠萝蜜视频在线观看入口| 九九99久久精品在免费线bt| 久久99精品国产99久久6尤物| av手机免费看| 亚洲高清不卡在线观看| 久久久高清视频| 亚洲一区成人| 日韩精品资源| 2019中文亚洲字幕| 欧美乱妇高清无乱码| 99国产精品久久久久久久| 久久99精品视频一区97| 国产日韩一级片| 亚洲欧洲成人av每日更新| 久久这里只精品| 欧美独立站高清久久| 91精品视频免费观看| 在线看一级片| 亚洲成人激情视频| 91麻豆精品在线| 日韩一区中文字幕| 四虎永久免费观看| 性一交一乱一区二区洋洋av| 日韩av高清| vam成人资源在线观看| 久久91精品国产91久久久| 偷拍精品一区二区三区| 日本高清无吗v一区| 99精品中文字幕| 懂色av一区二区夜夜嗨| 116极品美女午夜一级| 热久久天天拍国产| 91视频最新| 吞精囗交69激情欧美| 久久精品国产一区二区三区| 色婷婷av一区二区三| 91福利精品第一导航| 久久久精品视频免费观看| 91在线视频免费观看| 日本黄色福利视频| 99精品国产在热久久婷婷| 日韩jizzz| swag国产精品一区二区| 国产精品成人va在线观看| 伊人福利在线| 亚洲最大中文字幕| 欧美 日韩 中文字幕| 欧美日韩国产一级二级| 99久在线精品99re8热| 日韩理论在线观看| 色无极影院亚洲| 国产99久久久精品| 91高清国产视频| 国产精品婷婷| 黄色片免费在线观看视频| 欧美日韩123| 国产一区再线| 欧美经典影片视频网站| 国产精品69av| 天堂av在线网| 欧美激情综合色| 麻豆传媒免费在线观看| 国产丝袜视频一区| 亚洲免费成人在线| 51精品国自产在线| 国产成人无码专区| 欧美日韩国产中字| 久久免费视频精品| 亚洲欧美二区三区| 亚洲色图日韩精品| 国产欧美综合色| 欧美丰满少妇人妻精品| 成人免费观看av| 古装做爰无遮挡三级聊斋艳谭| 日本欧美一区二区| 男女午夜激情视频| 亚洲综合99| 国产精品免费入口| aa级大片欧美三级| 免费拍拍拍网站| 国色天香一区二区| 久久久久久久香蕉| 99热在线成人| 在线观看成人av电影| 欧美一区二区麻豆红桃视频| 日本高清一区| 精品国产一区一区二区三亚瑟 | 国产精品网曝门| 国产激情在线免费观看| 2023国产精品视频| 欧美老熟妇乱大交xxxxx| 久久在线观看免费| 手机免费看av| 久久久国际精品| xxxx日本黄色| 欧美国产成人精品| 四虎影视一区二区| 自拍偷在线精品自拍偷无码专区 | 五月婷婷欧美视频| 国产成人在线免费观看视频| 亚洲第一狼人社区| 国产成人精品网| 色婷婷国产精品综合在线观看| 精品国产xxx| 欧美视频日韩视频| 国产精品欧美亚洲| 日韩午夜电影在线观看| 国产综合在线播放| 精品五月天久久| av在线电影观看| 久久人人爽人人爽人人片亚洲| 国产日产一区二区| 国产综合在线看| a日韩av网址| 成人a级免费视频| 一区二区三区四区高清视频| 精品91免费| 成人精品中文字幕| 日本一二三区视频在线| 亚洲美洲欧洲综合国产一区| 中文字幕日本最新乱码视频| 日韩电影在线一区二区三区| 日韩va在线观看| 菠萝蜜视频在线观看一区| 好吊日免费视频| 亚洲欧美在线视频观看| 国产在线综合网| 色婷婷亚洲综合| 午夜精品久久久久久久99热黄桃| 亚洲福利在线视频| av电影在线观看一区二区三区| 久久不射电影网| 久草在线资源福利站| 国产精品嫩草影院一区二区| 免费一区二区三区在线视频| 麻豆av一区| 91精品国偷自产在线电影 | 综合色婷婷一区二区亚洲欧美国产| 好吊一区二区三区| 国产超碰在线播放| 成人性色生活片免费看爆迷你毛片| 欧美一区二区三区成人精品| 亚洲同性gay激情无套| 日韩伦理在线视频| 欧美精品tushy高清| 亚洲色大成网站www| 美女av一区二区三区 | 国产欧美另类| 8x8x成人免费视频| 久久九九久久九九| 国产精品第一页在线观看| 欧美日韩中文另类| 色视频免费在线观看| 欧美精品制服第一页| 黄色精品视频| 久久精品国产精品国产精品污 | 超碰超碰在线观看| 97se亚洲国产综合在线| 顶臀精品视频www| 欧美色综合天天久久综合精品| 亚洲精品综合网| 久久精品中文字幕电影| 欧美精品总汇| 九九九九精品| 亚洲视频一区| 少妇愉情理伦片bd| 中文字幕一区二区三区色视频| 四虎成人在线观看| 亚洲韩国青草视频| 日韩av激情| 97久久人人超碰caoprom欧美| 日韩成人激情| 91福利国产成人精品播放| 91视频免费看| 国产精品一区二区6| 精品国内二区三区| 欧美卡一卡二| 91九色在线免费视频| 91久久久精品国产| 成人综合久久网| 国产精品免费久久久久| 亚洲成人av网址| 亚洲欧美综合另类中字| 色是在线视频| 日本不卡久久| 日韩—二三区免费观看av| 91视频免费在观看| 欧美视频中文字幕| 永久免费av片在线观看全网站| 国产成人精品久久| 精品国产中文字幕第一页| 精品久久久久久久无码| 国产午夜精品福利| 日批视频免费观看| 日韩在线视频二区| 亚洲久草在线| 久久久天堂国产精品| 国产精品18久久久久久久久| 免费一级a毛片夜夜看| 精品精品国产高清一毛片一天堂| 成人ssswww在线播放| 国内精品**久久毛片app| 亚洲人体大胆视频| 亚洲精品国产91| 欧美午夜一区二区三区免费大片| 亚洲s色大片| 2014亚洲精品| 中文在线不卡| 中文字幕在线观看免费高清| 欧美三级欧美一级| 美女黄视频在线观看| 99久久一区三区四区免费| 亚洲国产午夜| 日韩影视一区二区三区| 正在播放亚洲一区| 牛牛精品在线视频| 欧美极品色图| 久久精品国产亚洲高清剧情介绍 | 一区二区三区在线观看免费视频| 欧美网站一区二区| 国产精品久久久久久福利| 成人欧美一区二区三区视频| 亚洲一区欧美激情| 国产又粗又黄又猛| 日韩你懂的在线观看| 色资源二区在线视频| 亚洲视频在线观看日本a| 国产suv精品一区二区883| 国产精品第5页| 久久精品一区中文字幕| 国产区精品视频在线观看豆花| 五月婷婷狠狠操| 一区二区高清视频在线观看| 欧美偷拍视频| 91免费版黄色| 丝袜诱惑制服诱惑色一区在线观看| 国产老头老太做爰视频| 日韩电影免费观看中文字幕| 久久久国产精品网站| 日韩伦理在线免费观看| 国产精品视频看| 亚洲欧洲综合在线| 91夜夜揉人人捏人人添红杏| 国产精品日韩精品欧美精品| 尤物在线免费视频| 亚洲欧美一区二区三区久久| 深夜福利一区| 婷婷免费在线观看| 欧美性猛交xxxx乱大交极品|