精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

大數據競賽平臺——Kaggle入門篇

大數據
這篇文章適合那些剛接觸Kaggle、想盡快熟悉Kaggle并且獨立完成一個競賽項目的網友,對于已經在Kaggle上參賽過的網友來說,大可不必耗費時間閱讀本文。本文分為兩部分介紹Kaggle,第一部分簡單介紹Kaggle,第二部分將展示解決一個競賽項目的全過程。如有錯誤,請指正!

這篇文章適合那些剛接觸Kaggle、想盡快熟悉Kaggle并且獨立完成一個競賽項目的網友,對于已經在Kaggle上參賽過的網友來說,大可不必耗費時間閱讀本文。本文分為兩部分介紹Kaggle,***部分簡單介紹Kaggle,第二部分將展示解決一個競賽項目的全過程。如有錯誤,請指正!

[[182402]]

1、Kaggle簡介

Kaggle是一個數據分析的競賽平臺,網址:https://www.kaggle.com/

企業或者研究者可以將數據、問題描述、期望的指標發布到Kaggle上,以競賽的形式向廣大的數據科學家征集解決方

案,類似于KDD-CUP(國際知識發現和數據挖掘競賽)。Kaggle上的參賽者將數據下載下來,分析數據,然后運用機

器學習、數據挖掘等知識,建立算法模型,解決問題得出結果,***將結果提交,如果提交的結果符合指標要求并且在參賽者中排名***,將獲得比賽豐厚的獎金。更多內容可以參閱:大數據眾包平臺

下面我以圖文的形式介紹Kaggle:

進入Kaggle網站:

大數據競賽平臺——Kaggle入門篇

這是當前正在火熱進行的有獎比賽,有冠軍杯形狀的是“Featured”,譯為“號召”,召集數據科學高手去參賽。下面那個灰色的有試劑瓶形狀的是“Research”,獎金少一點。這兩個類別的比賽是有獎競賽,難度自然不小,作為入門者,應該先做練習賽:

大數據競賽平臺——Kaggle入門篇

左圖的比賽是“101”,右圖的是“Playground”,都是練習賽,適合入門。入門Kaggle***的方法就是獨立完成101和playground這兩個級別的競賽項目。本文的第二部分將選101中的“Digit Recognition”作為講解。

點擊進入賽題“Digit Recognition”:

大數據競賽平臺——Kaggle入門篇

這是一個識別數字0~9的練習賽,“Competition Details“是這個比賽的描述,說明參賽者需要解決的問題。”Get the Data“是數據下載,參賽者用這些數據來訓練自己的模型,得出結果,數據一般都是以csv格式給出:

大數據競賽平臺——Kaggle入門篇

其中,train.csv就是訓練樣本,test.csv就是測試樣本,由于這個是訓練賽,所以還提供了兩種解決方案,knn_benchmark.R和rf_benchmark.R,前者是用R語。言寫的knn算法程序,后者是用R語言寫的隨機森林算法程序,它們的結果分別是knn_benchmark.csv和rf_benchmark.csv。關于csv格式文件,我前一篇文章有詳述:【Python】csv模塊的使用。

得出結果后,接下來就是提交結果”Make a submission“:

大數據競賽平臺——Kaggle入門篇

要求提交的文件是csv格式的,假如你將結果保存在result.csv,那么點擊”Click or drop submission here“,選中result.csv文件上傳即可,系統將測試你提交的結果的準確率,然后排名。

另外,除了“Competition Details“、”Get the Data“、”Make a submission“,側邊欄的”Home“、”Information“、”Forum”等,也提供了關于競賽的一些相關信息,包括排名、規則、輔導……

【以上是***部分,暫且寫這么多,有補充的以后再更】

2、競賽項目解題全過程

(1)知識準備

首先,想解決上面的題目,還是需要一點ML算法的基礎的,另外就是要會用編程語言和相應的第三方庫來實現算法,常用的有:

Python以及對應的庫numpy、scipy、scikit-learn(實現了ML的一些算法,可以直接用)、theano(DeepLearning的算法包)。

R語言、weka

如果用到深度學習的算法,cuda、caffe也可以用。

總之,使用什么編程語言、什么平臺、什么第三方庫都無所謂,無論你用什么方法,Kaggle只需要你線上提交結果,線下你如何實現算法是沒有限制的。

Ok,下面講解題過程,以”Digit Recognition“為例,數字識別這個問題我之前寫過兩篇文章,分別用kNN算法和Logistic算法去實現,有完整的代碼,有興趣可以閱讀:kNN算法實現數字識別、 Logistic回歸實現數字識別

(2)Digit Recognition解題過程

下面我將采用kNN算法來解決Kaggle上的這道Digit Recognition訓練題。上面提到,我之前用kNN算法實現過,這里我將直接copy之前的算法的核心代碼,核心代碼是關于kNN算法的主體實現,我不再贅述,我把重點放在處理數據上。

以下工程基于Python、numpy

獲取數據

從”Get the Data“下載以下三個csv文件:

大數據競賽平臺——Kaggle入門篇

分析train.csv數據

train.csv是訓練樣本集,大小42001*785,***行是文字描述,所以實際的樣本數據大小是42000*785,其中***列的每一個數字是它對應行的label,可以將***列單獨取出來,得到42000*1的向量trainLabel,剩下的就是42000*784的特征向量集trainData,所以從train.csv可以獲取兩個矩陣trainLabel、trainData。

下面給出代碼,另外關于如何從csv文件中讀取數據,參閱:csv模塊的使用

大數據競賽平臺——Kaggle入門篇

這里還有兩個函數需要說明一下,toInt()函數,是將字符串轉換為整數,因為從csv文件讀取出來的,是字符串類型的,比如‘253’,而我們接下來運算需要的是整數類型的,因此要轉換,int(‘253’)=253。toInt()函數如下:

大數據競賽平臺——Kaggle入門篇

nomalizing()函數做的工作是歸一化,因為train.csv里面提供的表示圖像的數據是0~255的,為了簡化運算,我們可以將其轉化為二值圖像,因此將所有非0的數字,即1~255都歸一化為1。nomalizing()函數如下:

大數據競賽平臺——Kaggle入門篇

分析test.csv數據

test.csv里的數據大小是28001*784,***行是文字描述,因此實際的測試數據樣本是28000*784,與train.csv不同,沒有label,28000*784即28000個測試樣本,我們要做的工作就是為這28000個測試樣本找出正確的label。所以從test.csv我們可以得到測試樣本集testData,代碼如下:

大數據競賽平臺——Kaggle入門篇

分析knn_benchmark.csv

前面已經提到,由于digit recognition是訓練賽,所以這個文件是官方給出的參考結果,本來可以不理這個文件的,但是我下面為了對比自己的訓練結果,所以也把knn_benchmark.csv這個文件讀取出來,這個文件里的數據是28001*2,***行是文字說明,可以去掉,***列表示圖片序號1~28000,第二列是圖片對應的數字。從knn_benchmark.csv可以得到28000*1的測試結果矩陣testResult,代碼:

大數據競賽平臺——Kaggle入門篇

到這里,數據分析和處理已經完成,我們獲得的矩陣有:trainData、trainLabel、testData、testResult

算法設計

這里我們采用kNN算法來分類,核心代碼:

大數據競賽平臺——Kaggle入門篇

關于這個函數,參考:kNN算法實現數字識別

簡單說明一下,inX就是輸入的單個樣本,是一個特征向量。dataSet是訓練樣本,對應上面的trainData,labels對應trainLabel,k是knn算法選定的k,一般選擇0~20之間的數字。這個函數將返回inX的label,即圖片inX對應的數字。

對于測試集里28000個樣本,調用28000次這個函數即可。

保存結果

kaggle上要求提交的文件格式是csv,上面我們得到了28000個測試樣本的label,必須將其保存成csv格式文件才可以提交,關于csv,參考:【Python】csv模塊的使用。

代碼:

大數據競賽平臺——Kaggle入門篇

綜合各函數

上面各個函數已經做完了所有需要做的工作,現在需要寫一個函數將它們組合起來解決digit recognition這個題目。我們寫一個handwritingClassTest函數,運行這個函數,就可以得到訓練結果result.csv。

大數據競賽平臺——Kaggle入門篇

運行這個函數,可以得到result.csv文件:

大數據競賽平臺——Kaggle入門篇

2 0 9 9 3 7 0 3…….就是每個圖片對應的數字。與參考結果knn_benchmark.csv比較一下:

大數據競賽平臺——Kaggle入門篇

28000個樣本中有1004個與kknn_benchmark.csv中的不一樣。錯誤率為3.5%,這個效果并不好,原因是我并未將所有訓練樣本都拿來訓練,因為太花時間,我只取一半的訓練樣本來訓練,即上面的結果對應的代碼是:

  1. [python] view plain copyclassifierResult = classify(testData[i], trainData[0:20000], trainLabel[0:20000], 5) 

訓練一半的樣本,程序跑了將近70分鐘(在個人PC上)。

提交結果

將result.csv整理成kknn_benchmark.csv那種格式,即加入***行文字說明,加入***列的圖片序號,然后make a submission,結果準確率96.5%:

大數據競賽平臺——Kaggle入門篇

下載工程代碼:github地址

責任編輯:未麗燕 來源: 36大數據
相關推薦

2011-01-18 17:00:31

Postfix入門

2017-09-12 10:26:47

springbootmaven結構

2018-08-15 13:56:47

Kaggle數據挖掘項目

2019-04-10 09:44:05

2013-01-18 10:04:33

大數據分析

2020-11-16 10:19:33

Java

2016-09-06 17:43:12

SwiftCloudKit開發

2009-06-09 13:02:30

NetBeans使用教程

2022-03-28 09:31:58

for循環語句

2012-01-17 10:47:07

jQuery

2020-11-13 07:22:46

Java基礎While

2022-01-27 09:35:45

whiledo-while循環Java基礎

2015-07-30 09:43:10

獨立游戲開發入門

2022-07-06 07:57:37

Zookeeper分布式服務框架

2020-11-09 10:19:05

Java

2020-11-19 10:36:16

Java基礎方法

2021-12-21 09:02:31

Matplotlib Python可視化

2022-03-10 09:33:21

Java數組初始化

2010-09-08 13:42:06

2018-12-21 12:25:08

點贊
收藏

51CTO技術棧公眾號

91精品福利视频| 国产午夜精品久久久久久久| 欧美精品福利在线| 制服丝袜第二页| 欧洲精品久久久久毛片完整版| 亚洲欧美日韩一区二区三区在线观看 | 91狠狠综合久久久久久| 精品一区二区三区中文字幕| 精品国产鲁一鲁一区二区张丽| 日韩妆和欧美的一区二区| 国产乱叫456在线| 亚洲女同在线| 久久69精品久久久久久久电影好| 91视频免费观看网站| 日韩久久99| 欧美午夜性色大片在线观看| 欧美一级黄色录像片| 欧美日韩激情视频一区二区三区| 国内欧美视频一区二区| 热re91久久精品国99热蜜臀| 黄色一级片在线免费观看| 国产午夜一区| 亚洲国产欧美自拍| 男人操女人下面视频| 欧美magnet| 精品av在线播放| 国产精品无码电影在线观看| yw193.com尤物在线| www.视频一区| 国产精品v欧美精品∨日韩| 在线不卡免费视频| 日精品一区二区| 97成人超碰免| 国产大片中文字幕| 欧美午夜一区| 欧美高清videos高潮hd| 蜜桃av.com| 日韩电影免费网站| 亚洲天堂av网| 国产精品一二三区在线观看| 色婷婷狠狠五月综合天色拍| 亚洲精品国产精品国产自| 人妻体体内射精一区二区| 天堂综合在线播放| 欧美日韩第一区日日骚| 免费看国产黄色片| 国产91亚洲精品久久久| 在线观看中文字幕不卡| 国产成人无码一二三区视频| 欧美久久天堂| 精品国产乱码久久久久酒店 | 性欧美video高清bbw| 中文字幕日韩一区| 伊人久久大香线蕉精品| 在线观看免费高清完整| 中国av一区二区三区| 日产国产精品精品a∨| 国产日产精品久久久久久婷婷| 久久久影院官网| 久久一区二区三区av| 牛牛影视精品影视| 久久亚洲综合色| 日本一区二区精品视频| 日本高清视频在线播放| 亚洲av成人片色在线观看高潮| 国语一区二区三区| 日韩av在线不卡| 国产人妻人伦精品1国产丝袜| 伊人久久大香线蕉综合网蜜芽| 精品视频在线播放| 最近中文字幕免费视频| 日韩一区二区三区免费播放| 久久精品国产精品| 国产在线视频99| 亚洲尤物精选| 国产精自产拍久久久久久| 国产精品一二三四五区| 懂色av一区二区夜夜嗨| 欧美激情论坛| 久久99精品久久| 亚洲国产精品久久久久婷婷884| 日日碰狠狠添天天爽超碰97| 欧美一级大黄| 欧美一区二区三区四区视频| av不卡中文字幕| 国产麻豆精品久久| 美女久久久久久久| 黄色在线免费观看| 久久精品国产一区二区| 国产经典一区二区三区| 青青操视频在线| 亚洲女厕所小便bbb| 男女私大尺度视频| 成人看片毛片免费播放器| 欧美一区二区三区在线| 这里只有久久精品| 国产精品a久久久久| 日本一区二区三区在线播放| 国产精品欧美亚洲| 久久综合九色综合久久久精品综合 | 日本激情视频在线| gogo人体一区| 日韩一区视频在线| 久久久久久少妇| 国产精品一品二品| 日韩av不卡在线播放| 女人黄色免费在线观看| 欧美三级视频在线播放| 国产亚洲无码精品| 女人色偷偷aa久久天堂| 国产精品激情自拍| 午夜视频福利在线观看| 亚洲免费在线电影| 在线观看的毛片| 高潮久久久久久久久久久久久久 | 天天鲁一鲁摸一摸爽一爽| 亚洲激情一区| 亚洲xxxxx性| a视频网址在线观看| 欧美日韩在线视频观看| 激情av中文字幕| 911久久香蕉国产线看观看| 国产精品成久久久久三级| 神马一区二区三区| 亚洲综合激情网| 日韩va在线观看| 欧美高清视频手机在在线| 日本久久久久久久| 日本在线视频1区| 精品成人久久av| 男女一区二区三区| 国产精品99一区二区| 91精品免费| 午夜av在线免费观看| 欧美一二三在线| 国产精品白丝喷水在线观看| 九九国产精品视频| 一区二区成人国产精品| 老司机精品视频网| 国产婷婷色综合av蜜臀av| 日韩成人高清视频| av激情综合网| 国产极品在线视频| 欧美综合精品| 97在线视频免费播放| 天天射,天天干| 欧美日韩国产综合新一区 | 欧美日韩中字| 国产精品久久97| 色综合久久影院| 欧美老年两性高潮| a在线视频播放观看免费观看| 韩国精品久久久| 久久免费一级片| 亚洲第一二区| 91极品视频在线| 青青国产在线| 欧美色精品天天在线观看视频| 欧美性受xxxx黑人| 国产综合久久久久久鬼色| 欧美另类videos| 精品人人人人| 日本国产一区二区三区| 在线激情小视频| 日韩三级电影网址| 日韩少妇高潮抽搐| 国产亚洲综合性久久久影院| 国产原创精品在线| 欧美一区网站| 国产欧美在线一区二区| 3d欧美精品动漫xxxx无尽| 爽爽爽爽爽爽爽成人免费观看| 精品二区在线观看| 精品国产31久久久久久| 国产亚洲精品熟女国产成人| 精品一区二区三区影院在线午夜| 免费极品av一视觉盛宴| 青青一区二区| 国产在线播放91| 91白丝在线| 中文字幕欧美专区| www日本在线| 日本精品视频一区二区| 国产成人综合在线视频| 91亚洲精品久久久蜜桃| 亚洲 欧美 日韩系列| 中文字幕免费精品| 久久精品中文字幕一区二区三区| 国产精品诱惑| 国内精品久久久久久影视8| 成黄免费在线| 精品久久一区二区| 中文文字幕一区二区三三| 亚洲已满18点击进入久久| 国产精品成人一区二区三区电影毛片 | 亚洲日本丝袜连裤袜办公室| 女同性恋一区二区三区| 看国产成人h片视频| 男人日女人逼逼| 亚洲综合激情在线| 奇米精品在线| youjizz亚洲| 国产97在线视频| 白白色在线观看| 色噜噜狠狠狠综合曰曰曰88av| 免费的黄色av| 欧美伦理视频网站| www.伊人久久| 亚洲一区二区欧美激情| 国精品人伦一区二区三区蜜桃| 成人av电影免费观看| 日韩欧美理论片| 天堂资源在线中文精品| 妺妺窝人体色www看人体| 欧美xxxx中国| 日韩aⅴ视频一区二区三区| 少妇高潮一区二区三区| 国产a一区二区| 精品三级国产| 国产综合在线观看视频| 亚洲天堂一区二区| 欧美一级在线亚洲天堂| 9999在线视频| 久久久久久久香蕉网| 久草资源在线观看| 最近2019中文字幕第三页视频| 完全免费av在线播放| 国产精品成久久久久三级| 亚洲女同志freevdieo| 久久久久久久久久av| 日本伦理一区二区| 久久综合国产精品台湾中文娱乐网 | 国产自产v一区二区三区c| 日本肉体xxxx裸体xxx免费| 水野朝阳av一区二区三区| 免费日韩视频在线观看| 国产日韩欧美| 鲁一鲁一鲁一鲁一色| 亚洲黄色在线| jizzjizz国产精品喷水| 亚洲精华国产欧美| 国产911在线观看| 欧美成人久久| 久草视频这里只有精品| 欧美久久99| 成人免费视频91| 亚洲精品婷婷| 欧美视频第一区| 日韩精品成人一区二区三区| 日日碰狠狠躁久久躁婷婷| 日韩精品视频网站| 久久久久久久久久久久91| 麻豆传媒一区二区三区| 在线视频日韩欧美| 岛国精品在线观看| 影音先锋人妻啪啪av资源网站| 不卡视频一二三| 久久久久亚洲av无码专区桃色| 91丨九色丨黑人外教| 99久久精品免费视频| 国产精品蜜臀在线观看| 波多野结衣爱爱视频| 依依成人精品视频| 天堂网一区二区三区| 色综合久久综合| 一区二区三区精| 欧美本精品男人aⅴ天堂| 欧洲精品久久一区二区| 亚洲欧美日韩国产中文专区| 超碰免费97在线观看| 久热精品视频在线观看| www在线看| 国产精品狠色婷| 伊人久久噜噜噜躁狠狠躁| 国产一区二区三区色淫影院| 国产精品亚洲二区| 大地资源网在线观看免费官网| 亚洲精品欧美| 性猛交ⅹ×××乱大交| 国产99久久精品| 亚洲一区二区三区日韩| 亚洲乱码精品一二三四区日韩在线| 久久亚洲成人av| 欧美性色黄大片| 亚洲女同志亚洲女同女播放| 亚洲人成自拍网站| 在线观看中文| 国产精品6699| 91精品啪在线观看国产爱臀| 欧美不卡福利| 欧美日韩成人| 日本www.色| www..com久久爱| 国精品人伦一区二区三区蜜桃| 天涯成人国产亚洲精品一区av| 亚洲中文一区二区三区| 日韩大陆欧美高清视频区| 日本最黄一级片免费在线| 2019中文字幕在线观看| 蜜桃精品视频| 日日骚一区二区网站| 亚洲人成人一区二区三区| 五月天av在线播放| 久久男人中文字幕资源站| 国产中文字幕免费| 欧美喷潮久久久xxxxx| 午夜小视频在线播放| 欧美乱大交xxxxx另类电影| 欧美性片在线观看| 国产在线资源一区| 午夜精品影院| www.污污视频| 国产亚洲精品久| 成人免费看片98欧美| 亚洲精品一线二线三线| 精品视频在线一区二区| 国产精品日韩欧美大师| 亚洲调教一区| 欧美色图色综合| www.亚洲人| 日产精品久久久久| 精品成人a区在线观看| 黄色在线免费网站| 国产精品人成电影| 精品久久电影| 北条麻妃在线观看| 成人国产亚洲欧美成人综合网| 精品自拍偷拍视频| 欧美精品xxxxbbbb| 日本三级在线播放完整版| 国产精品一区二区久久精品| 国产精品嫩模av在线| 欧美日韩在线一| 91丝袜国产在线播放| 啦啦啦免费高清视频在线观看| 欧美videossexotv100| 影音先锋在线播放| 91在线播放视频| 午夜国产精品视频| 日韩精品xxx| 一区二区欧美视频| 精品人妻少妇AV无码专区 | 厕沟全景美女厕沟精品| 久久精品国产一区二区三区日韩| 亚洲精品日本| 手机免费看av| 欧美视频在线一区二区三区| 丁香在线视频| 91精品国产综合久久男男 | 国产熟女一区二区三区五月婷 | 日韩videos| 蜜桃久久久久久| 紧身裙女教师波多野结衣| 日韩欧美一二区| av中文在线资源库| 欧美精品成人一区二区在线观看| 噜噜噜久久亚洲精品国产品小说| 鲁丝一区二区三区| 欧美人伦禁忌dvd放荡欲情| 免费av在线播放| 99精品99久久久久久宅男| 18成人免费观看视频| 国产中年熟女高潮大集合| 欧美亚洲精品一区| 国产二区三区在线| 国产精品乱码| 日日摸夜夜添夜夜添亚洲女人| 夫妇露脸对白88av| 欧美一区二区性放荡片| 国产99re66在线视频| 久久综合入口| 激情图片小说一区| 日产精品久久久久久久| 一本一道久久a久久精品逆3p| 国产一区二区三区| 成人免费观看cn| 国产精品日产欧美久久久久| 精品人妻一区二区三区三区四区| 久久久久久久久亚洲| 精品久久不卡| 日本精品一二三区| 欧美无人高清视频在线观看| 黄色片网站在线| 国产伦精品一区二区三区在线| 丝袜国产日韩另类美女| 欧美日韩一级大片| 原创国产精品91| 91精品国产自产在线丝袜啪| 91n.com在线观看| 亚州成人在线电影| 日韩免费网站| 玛丽玛丽电影原版免费观看1977| 麻豆国产一区二区| 黄色在线观看国产| 欧美大胆a视频| 欧美理论视频| 在线天堂www在线国语对白| 欧美日韩国产高清一区二区| 美女的胸无遮挡在线观看| 亚洲国产高清国产精品|