精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

終于把機器學習中的特征選擇搞懂了!!!

人工智能 機器學習
特征選擇是機器學習中的重要步驟,其目的是從高維特征空間中選擇對模型性能最有價值的特征。通過減少冗余和無關的特征,特征選擇可以提高模型的訓練效率、減少過擬合并提升模型的泛化性能。

今天給大家分享機器學習中的一個關鍵概念:特征選擇。

特征選擇是機器學習中的重要步驟,其目的是從高維特征空間中選擇對模型性能最有價值的特征。

通過減少冗余和無關的特征,特征選擇可以提高模型的訓練效率、減少過擬合并提升模型的泛化性能。

特征選擇的重要性

  1. 提高模型性能:通過去除冗余或無關的特征,可以減少噪聲,提高模型的準確性和穩定性。
  2. 減少計算成本:較少的特征意味著更低的計算復雜度,加快訓練和預測速度。
  3. 防止過擬合:去除不相關特征有助于減少模型的復雜度,降低過擬合風險。
  4. 提高模型可解釋性:更少的特征使得模型更容易理解和解釋,有助于發現數據中的關鍵因素。

特征選擇的方法

特征選擇通常分為三種主要方法:

  • 過濾法
  • 包裹法
  • 嵌入法

過濾法

過濾法基于統計指標對特征進行評分,并根據評分選擇特征。

這類方法與具體的機器學習算法無關,通常作為預處理步驟。

常見技術

  • 相關系數,衡量每個特征與目標變量之間的線性相關性。例如,皮爾遜相關系數。
  • 卡方檢驗,適用于分類問題,評估特征與目標變量的獨立性。
  • 信息增益,基于信息理論,衡量特征提供的信息量。
  • 互信息,衡量特征與目標變量之間的非線性依賴關系。
  • 方差選擇法,去除方差低于某一閾值的特征,認為這些特征變化較小,信息量不足。

優缺點

  • 優點:計算速度快,適用于高維數據。
  • 缺點:忽略特征之間的相關性,可能無法捕捉到特征與目標變量之間的復雜關系。

包裝法

包裝法將特征選擇視為一個搜索問題,通過訓練模型評估特征子集的性能,選擇最優子集。這類方法與具體的機器學習算法緊密相關。

常見技術

  • 遞歸特征消除
    遞歸地訓練模型,移除最不重要的特征,直到達到預定的特征數量。
  • 前向選擇
    從空特征集開始,逐步添加對模型性能提升最大的特征。
  • 后向消除
    從所有特征開始,逐步移除對模型性能影響最小的特征。

優缺點

  • 優點:能夠考慮特征之間的相互作用,通常能獲得更好的模型性能。
  • 缺點:計算成本高,尤其在高維數據中,可能不適用。

嵌入法

嵌入法在模型訓練過程中進行特征選擇,將特征選擇嵌入到模型的訓練過程中。

這類方法結合了過濾法和包裝法的優點。

常見技術

  • Lasso回歸:通過 L1 正則化,將不重要的特征系數壓縮為零,實現特征選擇。
  • 決策樹及其集成方法:例如,隨機森林和梯度提升樹可以基于特征重要性進行特征選擇。
  • 彈性網絡:結合 L1 和 L2 正則化,兼具 Lasso和嶺回歸的優點。

優缺點

  • 優點:與模型訓練相結合,能夠自動選擇重要特征,計算效率較高。
  • 缺點:依賴于具體的模型選擇。

案例分享

下面我將通過 Python 代碼展示如何在機器學習中應用不同的特征選擇方法,包括過濾法、包裝法和嵌入法。

這里,我們以經典的乳腺癌數據集為例進行說明。

數據加載與預處理

首先,我們導入相關的庫,并加載數據集。

# 導入必要的庫
import pandas as pd
import numpy as np
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt
import seaborn as sns

# 加載乳腺癌數據集
data = load_breast_cancer()
X = pd.DataFrame(data.data, columns=data.feature_names)
y = pd.Series(data.target)

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

過濾法

過濾法基于統計指標對特征進行評分和選擇。

這里我們使用 SelectKBest 結合卡方檢驗和互信息兩種方法。

使用卡方檢驗選擇特征

from sklearn.feature_selection import SelectKBest, chi2
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 由于卡方檢驗要求非負特征,我們確保數據為非負
X_train_chi2 = X_train_scaled - X_train_scaled.min()
X_test_chi2 = X_test_scaled - X_train_scaled.min()

# 選擇k個最佳特征
k = 2
selector = SelectKBest(score_func=chi2, k=k)
X_train_selected = selector.fit_transform(X_train_chi2, y_train)
X_test_selected = selector.transform(X_test_chi2)

# 查看選擇的特征
selected_features = X.columns[selector.get_support()]
print(f"選擇的特征(卡方檢驗): {list(selected_features)}")

# 使用邏輯回歸進行訓練和評估
model = LogisticRegression(max_iter=200)
model.fit(X_train_selected, y_train)
y_pred = model.predict(X_test_selected)
accuracy = accuracy_score(y_test, y_pred)
print(f"過濾法(卡方檢驗)后的準確率: {accuracy:.4f}")

#選擇的特征(卡方檢驗): ['mean concave points', 'worst concave points']
#過濾法(卡方檢驗)后的準確率: 0.9386

使用互信息選擇前10個特征

from sklearn.feature_selection import mutual_info_classif

# 選擇前10個互信息最高的特征
selector_mi = SelectKBest(score_func=mutual_info_classif, k=10)
X_train_mi_selected = selector_mi.fit_transform(X_train_scaled, y_train)
X_test_mi_selected = selector_mi.transform(X_test_scaled)

# 查看選擇的特征
selected_features_mi = X.columns[selector_mi.get_support()]
print("互信息選擇的特征:\n", selected_features_mi)

# 訓練模型
model.fit(X_train_mi_selected, y_train)
y_pred = model.predict(X_test_mi_selected)

# 評估模型
accuracy = accuracy_score(y_test, y_pred)
print("互信息后的模型準確率:", accuracy)

#互信息后的模型準確率: 0.9824561403508771

包裝法

包裝法將特征選擇視為一個搜索問題。

這里我們使用遞歸特征消除(RFE)方法。

from sklearn.feature_selection import RFE

# 使用邏輯回歸作為基模型
model = LogisticRegression(max_iter=200)
# 選擇k個特征
k = 2
rfe = RFE(estimator=model, n_features_to_select=k)
rfe.fit(X_train_scaled, y_train)

# 查看選擇的特征
selected_features = X.columns[rfe.support_]
print(f"選擇的特征(RFE): {list(selected_features)}")

# 訓練并評估模型
X_train_rfe = rfe.transform(X_train_scaled)
X_test_rfe = rfe.transform(X_test_scaled)

model.fit(X_train_rfe, y_train)
y_pred = model.predict(X_test_rfe)
accuracy = accuracy_score(y_test, y_pred)
print(f"包裝法(RFE)后的準確率: {accuracy:.4f}")

#選擇的特征(RFE): ['worst area', 'worst concave points']
#包裝法(RFE)后的準確率: 0.9561

嵌入法

嵌入法在模型訓練過程中進行特征選擇,常見的方法包括Lasso回歸和基于樹的特征重要性。

使用 Lasso 回歸進行特征選擇

from sklearn.linear_model import LassoCV

# 使用Lasso進行特征選擇
lasso = LassoCV(cv=5, random_state=42)
lasso.fit(X_train_scaled, y_train)

# 獲取非零系數的特征
coef = pd.Series(lasso.coef_, index=X.columns)
selected_features_lasso = coef[coef != 0].index
print("Lasso選擇的特征:\n", selected_features_lasso)

# 訓練模型
X_train_lasso_selected = X_train_scaled[:, coef != 0]
X_test_lasso_selected = X_test_scaled[:, coef != 0]
model.fit(X_train_lasso_selected, y_train)
y_pred = model.predict(X_test_lasso_selected)
y_pred = (y_pred > 0.5).astype(int)

# 評估模型
accuracy = accuracy_score(y_test, y_pred)
print("Lasso后的模型準確率:", accuracy)

#Lasso后的模型準確率: 0.9824561403508771

使用隨機森林進行特征重要性排序

from sklearn.ensemble import RandomForestClassifier

# 訓練隨機森林模型
rf = RandomForestClassifier(n_estimators=100, random_state=42)
rf.fit(X_train, y_train)

# 獲取特征重要性
importances = pd.Series(rf.feature_importances_, index=X.columns)
importances_sorted = importances.sort_values(ascending=False)
print("特征重要性排名:\n", importances_sorted)

# 選擇前10個重要特征
selected_features_rf = importances_sorted.head(10).index
print("隨機森林選擇的特征:\n", selected_features_rf)

# 訓練模型
X_train_rf_selected = X_train[selected_features_rf]
X_test_rf_selected = X_test[selected_features_rf]
model.fit(X_train_rf_selected, y_train)
y_pred = model.predict(X_test_rf_selected)

# 評估模型
accuracy = accuracy_score(y_test, y_pred)
print("隨機森林后的模型準確率:", accuracy)

# 隨機森林后的模型準確率: 0.9912280701754386

# 可視化特征重要性
plt.figure(figsize=(10,6))
sns.barplot(x=importances_sorted.values[:10], y=importances_sorted.index[:10])
plt.title("隨機森林特征重要性")
plt.xlabel("重要性分數")
plt.ylabel("特征")
plt.show()

圖片圖片

綜合比較

為了比較不同特征選擇方法對模型性能的影響,我們可以匯總各方法的準確率。

# 匯總準確率
accuracy_results = {
    "卡方檢驗": 0.9386,
    "互信息": 0.9824561403508771,
    "RFE": 0.9561,
    "Lasso": 0.9824561403508771,
    "隨機森林": 0.9912280701754386
}

accuracy_df = pd.DataFrame(list(accuracy_results.items()), columns=["特征選擇方法", "模型準確率"])
print(accuracy_df)

# 可視化比較
plt.figure(figsize=(8,6))
sns.barplot(x="模型準確率", y="特征選擇方法", data=accuracy_df, palette="viridis")
plt.title("不同特征選擇方法的模型準確率比較")
plt.xlabel("準確率")
plt.ylabel("特征選擇方法")
plt.xlim(0.9, 1.0)
plt.show()

圖片圖片


責任編輯:武曉燕 來源: 程序員學長
相關推薦

2025-01-20 09:21:00

2024-10-08 10:16:22

2024-10-08 15:09:17

2024-10-28 15:52:38

機器學習特征工程數據集

2024-10-28 00:00:10

機器學習模型程度

2025-01-15 11:25:35

2024-10-30 08:23:07

2024-11-05 12:56:06

機器學習函數MSE

2024-08-23 09:06:35

機器學習混淆矩陣預測

2024-10-14 14:02:17

機器學習評估指標人工智能

2024-09-18 16:42:58

機器學習評估指標模型

2024-11-25 08:20:35

2025-01-20 09:00:00

2025-01-07 12:55:28

2025-02-17 13:09:59

深度學習模型壓縮量化

2024-07-17 09:32:19

2024-09-23 09:12:20

2024-12-03 08:16:57

2024-10-16 07:58:48

2025-07-15 10:41:44

點贊
收藏

51CTO技術棧公眾號

午夜影院免费体验区| 日韩a级片在线观看 | 亚洲精品你懂的| 成人xxxxx| 成人毛片18女人毛片| 四季av一区二区三区免费观看| 精品播放一区二区| 香蕉视频禁止18| 五月婷婷视频在线观看| 久久久www免费人成精品| 成人午夜在线影院| 中文字幕在线日本| 在线欧美福利| 久久手机精品视频| 少妇精品无码一区二区免费视频| 9999久久久久| 欧美人动与zoxxxx乱| 日本免费不卡一区二区| av免费在线观| 国产精品剧情在线亚洲| 久久爱av电影| 免费国产精品视频| 精品写真视频在线观看| 国产精品对白刺激| 欧美一级片免费在线观看| 欧美在线免费一级片| 中文字幕精品网| 性久久久久久久久久| 91蝌蚪精品视频| 欧美精品在线一区二区三区| 久久久精品麻豆| 黄色激情在线播放| 香蕉影视欧美成人| 国产91沈先生在线播放| 50度灰在线| 中文字幕日本乱码精品影院| 视频一区二区在线观看| 久久久久久青草| 91在线免费播放| 国产视频在线观看一区| 国模人体一区二区| 国产成人在线看| 91成人伦理在线电影| 国产精品久久久久久久成人午夜| 日本麻豆一区二区三区视频| 国产99视频在线观看| 国产又大又黄又粗| 久久国产福利| 国产成人午夜视频网址| 波多野结衣在线观看视频| 亚洲欧美日本国产专区一区| 2021久久精品国产99国产精品| 国产精品16p| 国产视频一区欧美| 日韩av免费看| 中文字幕 国产| 麻豆成人av在线| 成人午夜小视频| 国产高清免费观看| 国产99久久久精品| 国产精品久久久久久久小唯西川| 亚洲精品国产精品国| 成人激情小说网站| 欧美日韩一区二区三区免费| 国产在线超碰| 国产精品久久久久久福利一牛影视| 亚洲欧美日韩国产yyy| 国产调教视频在线观看| 亚洲综合清纯丝袜自拍| 久久视频这里有精品| 免费成人美女女| 欧美精品免费视频| 亚洲美女在线播放| 国产精品三级| 日韩有码在线播放| 天天操天天爽天天干| 日韩电影在线免费| 666精品在线| 欧美孕妇孕交| 国产精品久久午夜夜伦鲁鲁| 黄色三级中文字幕| 中文字幕这里只有精品| 欧美人与z0zoxxxx视频| 日本一区二区在线观看视频| 精品国产日韩欧美| 九色精品美女在线| 美女又爽又黄免费视频| 精品亚洲欧美一区| 久久久久国产精品视频| 国产原创精品视频| 午夜伊人狠狠久久| 不卡中文字幕在线观看| 美女av一区| 日韩一二三在线视频播| 成人免费区一区二区三区| 久久激五月天综合精品| 国产女人水真多18毛片18精品| 精品视频二区| 亚洲国产毛片aaaaa无费看| 欧美自拍小视频| 国产ts一区| 日韩在线欧美在线| 三级视频在线观看| 国产91在线观看| 亚洲成人精品电影在线观看| av中文字幕在线观看第一页| 欧美高清视频一二三区 | 热久久久久久久久| 西野翔中文久久精品字幕| 欧美成人激情在线| 日本视频www色| caoporn国产一区二区| 精品一区二区成人免费视频| 性欧美1819sex性高清| 亚洲精品一区二区精华| 成人性视频免费看| 日韩影院在线观看| 女同一区二区| 成人一级福利| 欧美成人福利视频| 乱h高h女3p含苞待放| 日韩精品电影在线| 免费亚洲一区二区| 2020av在线| 精品久久久久久久久久久久包黑料 | 波多野结衣作品集| 国产一区福利| 色中色综合影院手机版在线观看 | 精品国产一区二区精华| 26uuu成人网| 精品一区二区综合| 日本免费一区二区三区| 毛片无码国产| 日韩精品久久久久| 欧美亚韩一区二区三区| 成人美女视频在线观看| 粉嫩av一区二区三区天美传媒| 国产精品天堂蜜av在线播放| 一区二区中文字幕| 一级黄色片视频| 国产精品久久午夜夜伦鲁鲁| 亚洲视频第二页| 日韩成人激情| 国产在线播放91| 人人干在线视频| 欧美日韩高清在线播放| 91狠狠综合久久久| 国产一区二区精品在线观看| 米仓穗香在线观看| 国产成人福利av| 午夜精品一区二区三区在线视频| 色wwwwww| 色婷婷综合久久久| 国产一区二区三区精品在线| 人人爽香蕉精品| 一区二区三区欧美在线| 国模大尺度视频一区二区| 久久伊人91精品综合网站| 精品毛片在线观看| 亚洲成人动漫在线观看| 亚洲第一香蕉网| 免费视频一区二区| 日韩国产精品毛片| 中文无码日韩欧| 欧美亚洲在线播放| 福利成人在线观看| 欧美一区二区视频在线观看2020| 欧美日韩在线观看成人| ww久久中文字幕| 一区二区三区网址| 欧美成人69av| 牛人盗摄一区二区三区视频| 欧美激情啪啪| 性金发美女69hd大尺寸| 精品美女视频在线观看免费软件 | 亚洲综合视频网| 久久国产精品影院| 久久精品久久久精品美女| 国产在线观看欧美| 自拍自偷一区二区三区| 91亚洲精品视频| 国产一二在线播放| 在线观看国产欧美| 国产综合在线播放| 欧美性感一类影片在线播放| 麻豆影视在线播放| 国产亚洲va综合人人澡精品| 香蕉视频xxxx| 日韩一区精品视频| 欧美a级免费视频| 国产真实有声精品录音| 亚洲xxx视频| 日韩一区精品| 97久久精品国产| 欧美a免费在线| 日韩电影中文字幕在线观看| 国产精品日韩无码| 日韩欧美精品在线观看| 成熟的女同志hd| 久久久久久久电影| 亚洲v在线观看| 麻豆免费看一区二区三区| 欧美爱爱视频免费看| 欧美福利在线| 天堂一区二区三区| 亚洲精品中文字幕99999| 91久久伊人青青碰碰婷婷| 欧美韩国亚洲| 91精品国产自产91精品| 怡红院红怡院欧美aⅴ怡春院| 中文字幕免费国产精品| 青青草免费观看免费视频在线| 日韩亚洲欧美一区| 一区二区三区免费在线| 色悠悠亚洲一区二区| 久久不卡免费视频| 亚洲一区二区欧美激情| 日本中文在线视频| 国产精品欧美一区二区三区| 久久精品成人av| proumb性欧美在线观看| 中文字幕55页| 国产一区二区电影| 国产欧美一区二| 精品一区免费av| www.久久av.com| 奇米色777欧美一区二区| 粉嫩虎白女毛片人体| 久久99伊人| 久久久精品在线视频| 日韩午夜电影| 男人和女人啪啪网站| 韩日成人av| 久久综合久久网| 亚洲午夜精品久久久久久app| 黄色成人在线免费观看| 中文在线日韩| 毛片在线视频观看| 欧美日韩亚洲一区| 激情成人开心网| 亚洲一级网站| 波多野结衣与黑人| 国产精品久久| 欧美在线一区视频| 国产精品久久久久久模特 | 日韩黄色在线免费观看| 丰满人妻一区二区三区免费视频| 日韩免费一区二区| 视频一区二区免费| 亚洲男人天堂视频| 成人高清免费观看mv| 这里只有精品在线播放| 亚洲1卡2卡3卡4卡乱码精品| 久久久精品在线| 欧美午夜大胆人体| 2025国产精品视频| 欧美日韩国产网站| 成人免费在线视频网址| 网站一区二区| 精品亚洲一区二区三区四区五区高| 卡一精品卡二卡三网站乱码| 欧美激情专区| 久久精品高清| 国产一级做a爰片久久毛片男| 99精品热6080yy久久| 妺妺窝人体色www在线小说| 日韩高清在线电影| 免费欧美一级片| 不卡在线视频中文字幕| 欧美成人国产精品一区二区| 国产精品不卡一区| 日韩三级免费看| 在线视频你懂得一区二区三区| 国产色视频在线| 亚洲黄色成人网| 丁香婷婷在线观看| 欧美黄色片免费观看| 成人美女黄网站| 成人网中文字幕| 宅男在线一区| 国内自拍中文字幕| 免费精品视频| 91亚洲一区二区| 97精品视频在线观看自产线路二| 夫妇露脸对白88av| 午夜精彩视频在线观看不卡| 中文字幕视频在线播放| 日韩欧美中文字幕精品| 国产福利在线看| 欧美精品久久久久久久| 成人在线不卡| 国精产品99永久一区一区| 91欧美大片| 波多野结衣乳巨码无在线| 久久国产免费看| 精品夜夜澡人妻无码av| 亚洲综合无码一区二区| 探花国产精品一区二区| 亚洲国产一区自拍| 伊人影院在线视频| 国产精品网站视频| 亚洲日本三级| 国产不卡一区二区视频| 裸体在线国模精品偷拍| 免费中文字幕av| 亚洲电影一级黄| 99国产精品久久久久久久成人| 亚洲天堂2020| 密臀av在线播放| 99精品国产一区二区| 日韩精品一卡| 国产情侣av自拍| eeuss鲁片一区二区三区在线观看| 一区二区视频免费看| 欧美日韩高清不卡| 成人福利在线| 国产成人精品久久| 亚洲黄页网站| 国产视频九色蝌蚪| 高清在线不卡av| 男女性高潮免费网站| 欧美男同性恋视频网站| 二区在线观看| 国产精品久久久久久av福利软件| 天海翼精品一区二区三区| 男人添女荫道口图片| 成人亚洲一区二区一| a级黄色片免费看| 3751色影院一区二区三区| 毛片在线看片| 国产日韩在线免费| 手机在线一区二区三区| 黄色永久免费网站| 国产精品久久久久久一区二区三区| 亚洲黄网在线观看| 亚洲人线精品午夜| 欧美一级二级视频| 日韩欧美手机在线| 青青青爽久久午夜综合久久午夜| 97人妻精品一区二区免费| 色综合久久久久网| av女优在线| 国产精品自拍网| 91久久电影| 少妇性l交大片7724com| 亚洲影院免费观看| 日本精品久久久久久| 91av国产在线| 国产欧美久久一区二区三区| 黄色aaa级片| 国产精品成人在线观看| 国产视频手机在线观看| 欧美日韩国产第一页| 美国成人xxx| 日本www高清视频| 中文字幕国产一区二区| 在线免费av片| 欧美日韩福利在线观看| 女人抽搐喷水高潮国产精品| 乱子伦视频在线看| 国产精品免费视频一区| 精品国产区一区二| 69视频在线免费观看| 精品大片一区二区| 欧美激情第四页| 午夜视频在线观看一区二区| 韩国福利在线| 91夜夜未满十八勿入爽爽影院| 好吊一区二区三区| 亚洲天堂网一区二区| 欧美日韩极品在线观看一区| av在线麻豆| 欧美高清性xxxxhd | 日本黄色www| 精品动漫一区二区三区| 成人不用播放器| 成人欧美一区二区三区在线观看| 宅男噜噜噜66一区二区| 战狼4完整免费观看在线播放版| 欧美大片在线观看一区二区| 成人av观看| 女人床在线观看| 国产人成亚洲第一网站在线播放| 国产剧情久久久| 日本成人黄色片| 午夜精品剧场| 天天躁夜夜躁狠狠是什么心态| 91精品黄色片免费大全| av日韩电影| 大地资源网在线观看免费官网| 久久九九久久九九| 精品人妻久久久久一区二区三区 | av日韩久久| 国产免费成人在线| 依依成人精品视频| 在线播放日本| 欧美大香线蕉线伊人久久| 国产精品一卡二卡在线观看| 日韩乱码一区二区三区| 国语自产精品视频在免费|