精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

前端也要懂機器學習之一

人工智能 機器學習
本文將通過上下兩篇來對機器學習的內容進行闡述,這是第一篇,主要介紹一些基礎知識和特征工程;后續推出的一批主要利用闡述機器學習中的監督學習算法和非監督學習算法。

[[374893]]

背景:

近年來機器學習的熱度不斷升高,前端領域也在不斷布局,從大的研究方向來看,有前端智能化、端智能;從框架這個角度來看,也有很多js版的框架,例如TensorFlow.js、Ml.js、Brain.js等。雖然當前來看其在前端落地的應用還不是很多,但是把握趨勢就是把握未來。本文將通過上下兩篇來對機器學習的內容進行闡述,這是第一篇,主要介紹一些基礎知識和特征工程;后續推出的一批主要利用闡述機器學習中的監督學習算法和非監督學習算法。

一、基礎

1.1 定義

機器學習是從數據中自動分析獲得模型,并利用模型對未知數據進行預測。

 

1.2 算法分類

機器學習的前提是數據,根據數據中是否有目標可以劃分為:監督學習算法和無監督學習算法。

  • 監督學習算法——輸入數據是由輸入特征值和目標值所組成。
  • 無監督學習算法——輸入數據是由輸入特征值和目標值所組成

 

1.3 如何選擇合適算法

機器學習有這么多算法,面對一個問題時應該如何選擇合適的算法成為了不可避免的問題,下面就來敘述兩條選擇合適算法的黃金法則。

1.確定使用機器學習算法的目的。

  • 將數據劃分為離散的組是唯一需求——聚類算法
  • 除將數據劃分為離散的組,還需要估計數據與每個組的相似度——密度估計算法
  • 目標變量為離散型——分類算法
  • 目標變量為連續型——回歸算法
  • 若想要預測目標變量的值——監督學習算法
  • 若無目標變量值——無監督學習

2.需要分析或收集的數據是什么,了解其數據特征

  • 特征值是離散型變量還是連續型變量
  • 特征值中是否存在缺失的值
  • 何種原因造成缺失值
  • 數據中是否存在異常值
  • 某個特征發生的頻率如何
  • ……

1.4 整體流程

不管多么復雜的內容經過前人的總結最會有一套方法論供我們這樣的小白使用,下面就來闡述一下機器學習通用的流程。

 

獲取數據

獲取數據是機器學習的第一步,例如使用公開的數據源、爬蟲獲取數據源、日志中獲取數據、商業數據等。

數據處理

得到數據后并不一定符合使用需求,所以需要進行數據清洗、數據填充、數據格式轉換,達到減小訓練的數據量,加快算法的訓練時間的目的。

特征工程

特征工程是使用專業背景知識和技巧處理數據,使得特征能在機器學習算法上發揮更好的作用的過程,直接影響機器學習的效果,主要包含特征提取、特征預處理、特征降維。

算法訓練

將處理之后的數據輸入到合適的算法進行訓練。

模型評估

使用測試集來評估模型的性能.模型性能指標有很多,比如在分類模型中常用的有錯誤率,精準率,召回率,F1指標,ROC等。

應用

將機器學習算法轉換為應用程序執行實際任務,從而檢驗該算法是否可以在實際工作中正常使用。

二、特征工程

業界流傳著一句話 “數據決定了機器學習的上限,而算法只是盡可能逼近這個上限”,這里的數據指的就是經過特征工程處理后的數據。特征工程是使用專業背景知識和技巧處理數據,使得特征能在機器學習算法上發揮更好的作用的過程,可見特征工程在機器學習中的重要地位。對于特征工程主要分為三步:特征抽取、特征預處理、特征降維。

注:特征工程是一個很深的學科,此處不展開闡述。

2.1 特征提取

特征提取指的就是將任意數據(如文本或圖像)轉換為可用于機器學習的數字特征,常用的主要包含:字典特征提取、文本特征提取、圖像特征提取。

2.2 特征預處理

通過特征提取,能得到未經處理的特征,該特征具有以下問題:

量綱不同:特征可能具有量綱,導致其特征的規格不一樣,容易影響(支配)目標結果,使得一些算法無法學習到其它的特征,需要進行無量綱化處理。

信息冗余:對于某些定量特征,其包含的有效信息為區間劃分,需要進行二值化處理。

定性特征不能直接使用:某些機器學習算法和模型只接受定量特征的輸入,則需要將定性特征轉換為定量特征,可通過啞編碼實現。

2.2.1 無量綱化

無量綱化使不同規格的數據轉換到同一規則,常用方法有歸一化和標準化

1.歸一化

  • 定義

對原始數據進行線性變換,使得結果映射到[0,1]之間。

  • 計算公式

 

  • 特點

最大最小值容易受到異常點影響,穩定性較差。

2.標準化

  • 定義

將原始數據進行變換到均值為0、標準差為1的范圍內

  • 計算公式

 

  • 特點

較少的異常點對結果影響不大,穩定性較好。

2.2.2 定量特征二值化

對于定量特征可進行二值化,通過選取一個合適的閾值,大于某閾值的為1,小余等于某閾值的為0。

 

2.2.3 定性特征啞編碼

大部分算法對于定性特征無法訓練模型,利用啞編碼(one-hot)可以將定性特征處理為定量特征用于模型訓練,其基本思想是:將離散特征的每一種值看成一種狀態,若該特征有N個值,則存在N種狀態,例如女孩子的頭發按照辮子的多少可以劃分為:無辮子、一個辮子、兩個辮子、多個辮子,則該特征有4種狀態,利用啞編碼可以表示為:

  • 無辮子 ====》[1, 0, 0, 0]
  • 一個辮子 ====》[0, 1, 0, 0]
  • 兩個辮子 ====》[0, 0, 1, 0]
  • 多個辮子 ====》[0, 0, 0, 1]

2.3 特征降維

在機器學習中對維度較高的數據進行處理時會極大消耗系統資源,甚至產生維度災難。在某些限定條件下,通過降維的方式可降低隨機變量的個數,用一個低維度向量來表示原始高維度的特征。常用的降維的方式有:特征選擇、PCA、LDA等。

2.3.1 特征選擇

數據預處理完畢之后需要選擇有意義的特征進行訓練,特征選擇從以下兩方面考慮:

特征是否發散:若某特征不發散(例如方差接近為0),則認為該特征無差異。

特征與目標的相關性:優先選擇與目標相關性較高的特征。

常用的特征選擇方式有:Filter(過濾法)、Wrapper(包裝法)、Embedded(集成法)。

2.3.1.1 Filter(過濾法)

先進行特征選擇,然后去訓練學習器,其特征選擇的過程與學習器無關。其主要思想是給每一維的特征賦予權重,權重代表該特征的重要性,然后設定閾值或者待選擇閾值的個數選擇特征。常用方法有方差選擇法(低方差特征過濾)、相關系數法等。

一、低方差特征過濾

方差指的是各變量值與其均值離差平方的平均數,是測算數值型數據離散程度的重要方法,方差越大則表征數據的離散程度越大,反之越小。對于數據中的特征值,方差小則表示特征大多樣本的值比較相近;方差大則表示特征很多樣本的值都有差別。低方差特征過濾正是基于該思想,通過設定方差閾值來去掉小于該閾值的特征。方差計算公式如下:

 

二、相關系數法

皮爾遜相關系數(r)定義為兩個變量之間的協方差和標準差的商,是反映變量之間相關關系密切程度的統計指標,其值r范圍為[-1, 1],含義為:

  • 當r > 0時表示兩變量正相關
  • r < 0時,兩變量為負相關
  • 當|r|=1時,表示兩變量為完全相關
  • 當r=0時,表示兩變量間無相關關系
  • 當0<|r|<1時,表示兩變量存在一定程度的相關。且|r|越接近1,兩變量間線性關系越密切;|r|越接近于0,表示兩變量的線性相關越弱

 

2.3.1.2 Wrapper(包裝法)

把要使用的分類器作為特征選擇的評價函數,對于特定的分類器選擇最優的特征子集。其主要思想是將子集的選擇看作是一個搜索尋優問題,生成不同的組合,對組合進行評價,再與其它的組合進行比較。常用方法有遞歸特征消除法。

  • 遞歸特征消除的主要思想是反復的構建模型(如SVM或者回歸模型)然后選出最好的(或者最差的)的特征(可以根據系數來選),把選出來的特征選擇出來,然后在剩余的特征上重復這個過程,直到所有特征都遍歷了。這個過程中特征被消除的次序就是特征的排序。因此,這是一種尋找最優特征子集的貪心算法。

2.3.1.3 Embedded(集成法)

將特征選擇嵌入到模型訓練當中。其主要思想是通過使用某些機器學習的算法和模型進行訓練,得到各個特征的權值系數,根據系數從大到小選擇特征。常用方法有:基于懲罰項的特征選擇法(L1、L2)、決策樹的特征選擇法(信息熵、信息增益)。

注:該方法與算法強相關,所以在算法實現的時候進行闡述。

2.3.2 PCA(主成分分析法)

主成分分析(Principal components analysis,PCA)是一種分析、簡化數據集的技術。主成分分析經常用于減少數據集的維數,同時保持數據集中的對方差貢獻最大的特征(旨在找到數據中的主成分,并利用這些主成分表征原始數據,從而達到降維的目的)。這是通過保留低階主成分,忽略高階主成分做到的。

一、 優缺點

1.優點:

  • 降低數據的復雜性,識別最重要的多個特征
  • 僅需方差衡量信息量,不受數據集以外的因素影響
  • 各主成分之間正交,可消除原始數據成分間的相互影響的因素
  • 計算方法簡單,主要運算式特征值分解,易于實現

2.缺點:

可能損失有用信息(由于沒有考慮數據標簽,容易將不同類別數據完全混合在一起,很難區分)

  • 二適用數據類型——數值型數據

2.3.3 LDA(線性判別分析法)

LDA是一種監督學習的降維技術,它的數據集的每個樣本是有類別輸出的。PCA與此不同,PCA是不考慮樣本類別輸出的無監督降維技術。LDA的思想是“最大化類間距離和最小化類內距離”(將數據在低維度上進行投影,投影后希望每一種類別數據的投影點盡可能的接近,而不同類別的數據的類別中心之間的距離盡可能的大)

1.優點:

  • 在降維過程中可以使用類別的先驗知識經驗
  • LDA在樣本分類信息依賴均值而不是方差的時候,比PCA之類的算法較優

2.缺點:

  • LDA不適合對非高斯分布(非正態分布)樣本進行降維
  • LDA降維后可降為[1, 2,……,k-1]維,其中k為類別數
  • LDA在樣本分類信息依賴方差而不是均值的時候,降維效果不好
  • LDA可能過度擬合數據

參考文獻

 

  • 特征工程到底是什么
  • LDA和PCA降維
  • 機器學習實戰

本文轉載自微信公眾號「執鳶者」,可以通過以下二維碼關注。轉載本文請聯系執鳶者公眾號。

 

責任編輯:武曉燕 來源: 執鳶者
相關推薦

2021-01-18 05:33:08

機器學習前端算法

2021-01-19 06:16:05

前端Babel 技術熱點

2017-03-16 08:46:43

TensorFlow安裝入門

2016-11-28 09:24:08

Python內存技巧

2021-03-18 11:45:49

人工智能機器學習算法

2020-05-19 14:00:09

人工智能機器學習AI

2021-02-04 15:08:37

Vue漸進式框架

2020-05-06 09:10:08

機器學習無監督機器學習有監督機器學習

2021-09-29 07:41:27

前端技術編程

2022-02-16 15:32:58

FlexUI框架容器組件

2011-04-18 10:21:37

XML

2022-02-22 13:50:01

TypeScrip前端框架

2011-04-12 14:28:52

XML

2019-07-29 10:39:39

前端性能優化緩存

2009-10-23 13:24:20

linux Shell

2021-08-04 06:56:49

HTTP緩存前端

2020-10-14 14:18:33

機器學習機器學習架構人工智能

2022-11-30 17:05:33

代碼程序場景

2022-11-14 08:44:56

前端門面模式接口

2021-09-26 05:05:46

GoFiber Express
點贊
收藏

51CTO技術棧公眾號

亚洲欧美在线免费观看| 日本一区二区三区久久久久久久久不| 国内精品久久久久久久久| 少妇一级淫免费观看| 精品国产第一福利网站| 亚洲色图.com| 欧美久久久久久久| 99视频免费看| 日韩成人精品视频| 久久免费成人精品视频| av在线播放中文字幕| 在线精品国产亚洲| 欧美日韩国产色站一区二区三区| 久久亚洲国产成人精品无码区| 国产原创av在线| 国产成人精品aa毛片| 国产精品久久久久久久久影视| 久久久.www| 全球成人免费直播| 日韩禁在线播放| 乱码一区二区三区| 亚洲欧美专区| 欧洲一区在线观看| 日韩精品视频久久| 超碰在线97国产| 自拍偷拍欧美精品| 五月天亚洲综合| 欧美女优在线| 97精品国产露脸对白| 99www免费人成精品| 一级黄色大片免费| 日韩成人精品在线观看| 热久久这里只有| 制服.丝袜.亚洲.中文.综合懂色| 综合亚洲视频| 精品国产欧美成人夜夜嗨| 成人免费无遮挡无码黄漫视频| 1769国产精品视频| 91精品国产福利| 天天综合天天添夜夜添狠狠添| 91另类视频| 在线免费av一区| 看欧美ab黄色大片视频免费| 国产黄大片在线观看| 亚洲一卡二卡三卡四卡五卡| 99中文字幕在线观看| 麻豆影视国产在线观看| 国产精品网曝门| 午夜精品短视频| av在线第一页| 中文字幕一区在线观看视频| 一区在线电影| 老司机福利在线视频| 国产精品美女一区二区在线观看| 亚洲激情啪啪| 免费在线你懂的| 亚洲欧美日韩国产一区二区三区| 久久av秘一区二区三区| av色综合久久天堂av色综合在| 中文字幕中文乱码欧美一区二区| 一本久道久久综合狠狠爱亚洲精品| yourporn在线观看视频| 综合亚洲深深色噜噜狠狠网站| 日本黄色播放器| 中文字幕免费高清电视剧网站在线观看 | 91精品国产高清| 亚洲黄色三级视频| 久久国产直播| 91久久综合亚洲鲁鲁五月天| 99视频在线观看免费| 国产不卡视频在线播放| 国产综合18久久久久久| 男生女生差差差的视频在线观看| 久久精品视频免费| 亚洲午夜精品国产| 污污片在线免费视频| 午夜视频一区二区三区| www.日日操| 国产精品国产亚洲精品| 亚洲黄色在线看| 亚洲av无码国产精品麻豆天美| 成人羞羞网站入口| 欧美日韩第一视频| 中文字幕亚洲乱码熟女1区2区| 免费成人性网站| 国产精品免费一区二区三区四区| 美州a亚洲一视本频v色道| 国产精品人成在线观看免费| 欧美久久久久久久久久久久久久| 神马久久午夜| 91精品麻豆日日躁夜夜躁| 中文字幕无码人妻少妇免费| 不卡一区综合视频| 欧美激情精品久久久久久蜜臀| 国产免费av一区| 国产一区二区三区免费播放| 精品综合久久久| 欧洲不卡视频| 精品美女国产在线| 女同激情久久av久久| 老司机成人在线| 精品国产网站地址| 天堂网视频在线| 国产sm精品调教视频网站| 日本不卡在线播放| 国产一线二线在线观看| 欧美色老头old∨ideo| 欧美xxxxx精品| 91精品在线观看国产| 日本免费一区二区三区视频观看| www.黄色av| 中文字幕精品三区| 国产成人精品视频免费看| 日韩欧美高清一区二区三区| 亚洲午夜未删减在线观看 | av网站有哪些| 综合激情视频| 国产欧美日韩精品专区| 日韩精品系列| 亚洲图片欧美色图| 国产成人在线综合| 成人aaaa| 国产精品成人一区| 欧美精品少妇| 天天色综合成人网| 在线黄色免费网站| 欧美日本中文| 91九色偷拍| 麻豆最新免费在线视频| 欧美亚洲图片小说| 色婷婷在线影院| 亚洲自拍另类| 久久精品日产第一区二区三区精品版 | 97婷婷涩涩精品一区| 国产成人三级一区二区在线观看一 | 小泽玛利亚一区| 欧美a级一区二区| 欧洲亚洲一区二区| 粉嫩一区二区三区| 亚洲色图50p| 看黄色一级大片| 国产欧美视频一区二区| 日韩有码免费视频| 国产一区二区三区日韩精品| 2023亚洲男人天堂| 亚洲日本国产精品| 疯狂做受xxxx高潮欧美日本 | 成人毛片在线精品国产| 亚洲综合一区二区三区| 久久久久久有精品国产| 欧美日韩在线视频播放| 久久久久免费观看| 日本老熟妇毛茸茸| 欧美日韩中文一区二区| 国产欧美精品日韩| 超碰在线免费播放| 欧美大片国产精品| 日韩无码精品一区二区三区| 成人一区二区三区视频在线观看| 欧美国产日韩激情| 婷婷精品在线| 国产精品夜间视频香蕉| 好吊日视频在线观看| 精品欧美乱码久久久久久1区2区| 久久久久久久9999| 91亚洲午夜精品久久久久久| 无码人妻丰满熟妇区毛片| 欧美日中文字幕| 川上优av一区二区线观看| 欧美黑人激情| 日韩精品中午字幕| 日韩在线视频免费播放| 日本一二三四高清不卡| 免费黄频在线观看| 国产欧美短视频| 亚洲精品一区二区三区四区五区 | 日韩免费福利电影在线观看| 久久久精品视频免费| 久久久亚洲综合| 亚洲一二三不卡| 亚洲国产三级| 亚洲狠狠婷婷综合久久久| 日韩三级久久| 日韩免费在线视频| 超碰在线最新| 亚洲精品在线91| 亚洲一级在线播放| 五月婷婷激情综合| 黄色片网站免费| 成人在线视频首页| 91制片厂毛片| 亚洲三级视频| 亚洲日本精品国产第一区| 99久久人爽人人添人人澡| 国产999精品久久久| 欧美理论片在线播放| 亚洲视频专区在线| 丰满熟女一区二区三区| 欧美色图片你懂的| 视频一区二区三区四区五区| 亚洲免费观看高清完整版在线| 亚洲第一页av| 国产高清无密码一区二区三区| 国产av无码专区亚洲精品| 欧美精品播放| 一个色的综合| 少妇精品久久久| 精品国产乱码久久久久久88av| 五月天色综合| 国产精品18久久久久久首页狼| 欧美xxx黑人xxx水蜜桃| 久久精品夜夜夜夜夜久久| 国产三级视频在线看| 亚洲成人激情视频| 国产黄色大片网站| 欧美裸体bbwbbwbbw| 一级做a爰片久久毛片| 亚洲福利视频一区二区| 麻豆视频在线免费看| 欧美激情中文不卡| 人妻少妇一区二区| 国产精品系列在线观看| 一本岛在线视频| 日韩av中文字幕一区二区| 9久久9毛片又大又硬又粗| 欧美日韩精品| 高清无码一区二区在线观看吞精| 99视频精品全国免费| 亚洲精品欧美精品| 精品香蕉视频| 日韩福利二区| 亚洲素人在线| 欧洲精品一区色| 精品国产午夜| 日韩av大全| 操欧美老女人| 亚洲一区二区三区涩| 久久综合国产| 中文字幕一区综合| 999视频精品| 亚洲第一页在线视频| 日韩综合精品| 中文字幕一区二区三区乱码| 国产精品久久久久一区二区三区厕所| 五月天久久综合网| 欧美肥老太太性生活| 亚洲综合第一| 亚洲欧洲日韩| 狠狠噜天天噜日日噜| 国产一区清纯| 逼特逼视频在线| 日本不卡的三区四区五区| 久久久国产欧美| 老汉av免费一区二区三区| 亚洲a级黄色片| 国产福利一区在线| 国产免费a级片| 91社区在线播放| 国产精品天天干| 亚洲国产成人午夜在线一区| 纪美影视在线观看电视版使用方法| 国产精品你懂的在线| 娇小11一12╳yⅹ╳毛片| 亚洲欧洲av色图| 精品99在线观看| 日韩欧美中文字幕在线观看| 黄色一级视频免费看| 欧美吻胸吃奶大尺度电影| 国产三级自拍视频| 亚洲国产精品久久久久秋霞不卡| 你懂得在线网址| 久久精品电影网站| av伦理在线| 国产精品永久免费在线| 亚洲日本一区二区三区在线| 九九99久久| 久久中文字幕av一区二区不卡| 国产青草视频在线观看| 男人天堂欧美日韩| 久久精品久久99| 久久综合99re88久久爱| 久久人妻无码aⅴ毛片a片app| 亚洲国产一区在线观看| 中文字幕av网站| 日韩欧美国产电影| yourporn在线观看视频| 欧美激情免费在线| 精品久久在线| 国产在线一区二区三区播放| 欧州一区二区| 妺妺窝人体色777777| 美女一区二区三区| 北京富婆泄欲对白| 中文字幕第一区二区| 国产一级久久久| 欧美日本高清视频在线观看| 殴美一级特黄aaaaaa| 日韩在线中文字幕| 69av成人| 亚洲最大福利视频网| 精品视频免费在线观看| 六月婷婷在线视频| 国内久久精品视频| 久久久久久久久久久久| 亚洲18女电影在线观看| 国产精品色综合| 亚洲视频在线视频| 极品在线视频| 超碰在线97av| 亚洲久久久久| 91精品无人成人www| 91网页版在线| 国产一国产二国产三| 欧美一卡在线观看| 91社区在线高清| 国产成人短视频| 欧美日韩导航| h无码动漫在线观看| 久久激五月天综合精品| 日韩人妻无码精品综合区| 亚洲高清中文字幕| a级片免费观看| 久久精品亚洲精品| 日本免费成人| 一区二区精品在线观看| 日本欧美大码aⅴ在线播放| 9.1成人看片| 黄色成人在线播放| 深爱激情五月婷婷| 久久久久久国产精品美女| 久久视频社区| 大桥未久一区二区三区| 久久精品国产99国产| 成人一级片免费看| 欧美日韩黄色影视| 欧美三级电影一区二区三区| 国产精品久久久久久五月尺| 欧美精品色图| 特级丰满少妇一级| 国产精品美女久久福利网站| 中文字幕免费播放| www.日韩av.com| 精品久久亚洲| 996这里只有精品| 风间由美一区二区三区在线观看| 欧美成人一二三区| 精品国产一区二区三区忘忧草| 亚洲性图自拍| 国产欧美日韩亚洲| 亚洲一区自拍| 极品蜜桃臀肥臀-x88av| 在线观看免费视频综合| h视频在线播放| 成人观看高清在线观看免费| 婷婷综合在线| av电影在线播放| 欧美日韩免费在线| 男人天堂亚洲二区| 国产精品免费久久久久久| 99久久婷婷| 亚洲国产精品狼友在线观看| 午夜久久福利影院| 飘雪影视在线观看免费观看| 国产va免费精品高清在线| 精品欧美久久| 五月天开心婷婷| 亚洲国产视频一区二区| 深夜视频在线免费| 国产精品一二三在线| 欧美高清不卡| 欧美bbbbb性bbbbb视频| 欧美优质美女网站| 在线观看电影av| 欧美日韩电影一区二区| 久久精品国产精品亚洲综合| 美女毛片在线观看| 亚洲欧美国产日韩天堂区| 国产精品原创视频| 全黄性性激高免费视频| 日本一区二区综合亚洲| 亚洲精品字幕在线观看| 日韩av免费看| 午夜精品网站| 美女100%无挡| 日韩一区二区三| 日日av拍夜夜添久久免费| 一道本在线观看视频| 99精品久久99久久久久| 国产精品一级视频| 69久久夜色精品国产69| 91超碰成人| 亚洲自拍偷拍图| 亚洲第一中文字幕在线观看| 欧美黑粗硬大| 日本精品www| 亚洲综合图片区| 日韩av中文| 欧美久久久久久久| www.99精品| 精品国产亚洲一区二区麻豆|