精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

用Python進行多元線性回歸分析(附代碼)

開發 后端
本文就用python代碼來展示一下如何用多元線性回歸來解決實際問題。

[[339266]]

很多人在做數據分析時會經常用到一元線性回歸,這是描述兩個變量間統計關系的最簡單的回歸模型。但現實問題中,我們往往會碰到多個變量間的線性關系的問題,這時就要用到多元線性回歸,多元線性回歸是一元回歸的一種推廣,其在實際應用中非常廣泛,本文就用python代碼來展示一下如何用多元線性回歸來解決實際問題。

圖1. 多元回歸模型中要用到的公式

如圖1所示,我們假設隨機變量y與一般變量x1、x2、...、xp之間線性回歸模型為(1)式,式中y為因變量,x1、x2、...、xp是自變量,β1、β2、...、βp是回歸系數,β0是回歸常數。對于一個實際問題,如果我們獲得n組觀測數據(xi1,xi2,...,xip;y)(i = 1,2,...,n),則我們可以把這n組觀測數據寫成矩陣形式y=Xβ+ε。

在求出了回歸方程之后,我們往往還要對回歸方程進行顯著性檢驗。這里的顯著性檢驗主要包括三部分。第一個是F檢驗,也就是檢驗自變量x1、x2、...、xp從整體上對y是否有明顯的影響,主要用到(2)、(3)、(4)式,其中(2)和(3)式是一個式子,不過是用不同符號表示;第二個是t檢驗,是對每個自變量進行顯著性檢驗,就是看每個自變量是否對y有顯著性影響,這和前面從整體上檢驗還是有區別的;第三個是擬合優度,也就是R2,其取值在0到1之間,越接近1,表明回歸擬合的效果越好,越接近于0,則效果越差,但R只能直觀反映擬合的效果,不能代替F檢驗作為嚴格的顯著性檢驗。

上面是多元線性回歸的一個簡單介紹,其詳細原理內容較多,有興趣的讀者可以去查閱一下相關文獻,這里不再贅述,只重點講解如何用python進行分析。下面我們還是用代碼來展示一下多元線性回歸的分析過程。

這里我們用到的數據來源于2013年《中國統計年鑒》,數據以居民的消費性支出為因變量y,其他9個變量為自變量,其中x1是居民的食品花費,x2是衣著花費,x3是居住花費,x4是醫療保健花費,x5是文教娛樂花費,x6是職工平均工資,x7是地區的人均GDP,x8是地區的消費價格指數,x9是地區的失業率。在這所有變量里面,x1至x7以及y的單位是元,x9是百分數,x8沒有單位,因為其是消費價格指數。數據的總體大小為31x10,即31行、10列,大體內容如圖2所示。

圖2. 數據集部分內容

首先還是導入需要的庫。 

  1. import numpy as np  
  2. import pandas as pd  
  3. import statsmodels.api as sm 

接下來是數據預處理,因為原數據的列標太長,我們要處理一下,去除其中的中文,只留下英文名稱。 

  1. file = r'C:\Users\data.xlsx'  
  2. data = pd.read_excel(file)  
  3. data.columns = ['y', 'x1', 'x2', 'x3', 'x4', 'x5', 'x6', 'x7', 'x8', 'x9'] 

然后我們就開始生成多元線性模型,代碼如下。 

  1. x = sm.add_constant(data.iloc[:,1:]) #生成自變量  
  2. y = data['y'] #生成因變量  
  3. model = sm.OLS(y, x) #生成模型  
  4. result = model.fit() #模型擬合  
  5. result.summary() #模型描述 

很明顯,這里的自變量是指x1到x9這9個自變量,代碼data.iloc[:,1:]就是去掉原數據中第一列,也就是y那一列的數據,result.summary()則是生成一份結果描述,其內容如圖3所示。

圖3. 包含所有自變量的回歸結果

在這個結果中,我們主要看“coef”、“t”和“P>|t|”這三列。coef就是前面說過的回歸系數,const這個值就是回歸常數,所以我們得到的這個回歸模型就是y = 320.640948 + 1.316588 x1 + 1.649859 x2 + 2.17866 x3 - 0.005609 x4 + 1.684283 x5 + 0.01032 x6 + 0.003655 x7 -19.130576 x8 + 50.515575 x9。而“t”和“P>|t|”這兩列是等價的,使用時選擇其中一個就行,其主要用來判斷每個自變量和y的線性顯著關系,后面我們會講到。從圖中還可以看出,Prob (F-statistic)為4.21e-20,這個值就是我們常用的P值,其接近于零,說明我們的多元線性方程是顯著的,也就是y與x1、x2、...、x9有著顯著的線性關系,而R-squared是0.992,也說明這個線性關系比較顯著。理論上,這個多元線性方程已經求出來了,而且效果還不錯,我們就可以用其進行預測了,但這里我們還是要進行更深一步的探討。前面說過,y與x1、x2、...、x9有著顯著的線性關系,這里要注意x1到x9這9個變量被看作是一個整體,y與這個整體有顯著的線性關系,但不代表y與其中的每個自變量都有顯著的線性關系,我們在這里要找出那些與y的線性關系不顯著的自變量,然后把它們剔除,只留下關系顯著的,這就是前面說過的t檢驗,t檢驗的原理內容有些復雜,有興趣的讀者可以自行查閱資料,這里不再贅述。我們可以通過圖3中“P>|t|”這一列來判斷,這一列中我們可以選定一個閾值,比如統計學常用的就是0.05、0.02或0.01,這里我們就用0.05,凡是P>|t|這列中數值大于0.05的自變量,我們都把它剔除掉,這些就是和y線性關系不顯著的自變量,所以都舍去,請注意這里指的自變量是x1到x9,不包括圖3中const這個值。但是這里有一個原則,就是一次只能剔除一個,剔除的這個往往是P值最大的那個,比如圖3中P值最大的是x4,那么就把它剔除掉,然后再用剩下的x1、x2、x3、x5、x6、x7、x8、x9來重復上述建模過程,再找出P值最大的那個自變量,把它剔除,如此重復這個過程,直到所有P值都小于等于0.05,剩下的這些自變量就是我們需要的自變量,這些自變量和y的線性關系都比較顯著,我們要用這些自變量來進行建模。

我們可以將上述過程寫成一個函數,命名為looper,代碼如下。 

  1. def looper(limit):  
  2.     cols = ['x1', 'x2', 'x3', 'x5', 'x6', 'x7', 'x8', 'x9']  
  3.     for i in range(len(cols)):  
  4.         datadata1 = data[cols]  
  5.         x = sm.add_constant(data1) #生成自變量  
  6.         y = data['y'] #生成因變量  
  7.         model = sm.OLS(y, x) #生成模型  
  8.         result = model.fit() #模型擬合  
  9.         pvalues = result.pvalues #得到結果中所有P值  
  10.         pvalues.drop('const',inplace=True) #把const取得  
  11.         pmax = max(pvalues) #選出最大的P值  
  12.         if pmax>limit:  
  13.             ind = pvalues.idxmax() #找出最大P值的index  
  14.             cols.remove(ind) #把這個index從cols中刪除  
  15.         else:  
  16.             return result  
  17. result = looper(0.05)  
  18. result.summary() 

其結果如圖4所示。從結果中可以看到最后剩下的有效變量為x1、x2、x3和x5,我們得到的多元線性模型為y = -1694.6269 + 1.3642 x1 + 1.7679 x2 + 2.2894 x3 + 1.7424 x5,這個就是我們最終要用到的有效的多元線性模型。

圖4. 剔除無效變量后的回歸模型

那么問題來了,前面我們得到的包含所有自變量的多元線性模型和這個剔除部分變量的模型,我們要選擇哪一個,畢竟第一個模型的整體線性效果也挺顯著,依據筆者的經驗,這個還是要看具體的項目要求。因為我們實際項目中遇到的問題都是現實生活中真實存在的例子,不再是單純的數學題了,比如本例中的x8消費價格指數和x9地區的失業率,這兩個肯定對y是有一定影響的,如果盲目剔除,可能會對最終的結果產生不良影響,所以我們還是要根據實際需求來做決定。

最后還有一個問題要討論一下,就是本例中沒有對原始數據進行數據標準化。那么我們在數據分析中是否要對原始數據進行標準化?

這個也是要視情況而定。像本例中這些數據都是帶有具體的量綱和單位,那么就不要對其進行標準化,我們得到的這個線性回歸模型是在原始變量基礎上進行擬合所得的結果,這個式子是包含物理單位的,說白了它們都是有一定實際意義的。在這種情況下,我們輸入特定的自變量的值,即可得到相應的y值,預測效果直截了當,這是采取原始數據進行線性擬合的好處。

如果我們對原始數據采取了標準化處理,情況就不同了。標準化處理后自變量、因變量的物理單位沒有了,我們拿此時的模型做預測時就會十分麻煩,要對新的自變量取值進行標準化,得到的y還是一個標準化后的數據,一眼看不到它的實際大小和物理意義。當然有些純數學問題,其變量沒有單位,這時候可以對其進行標準化,這會有利于對問題的分析。所以這個還是要視情況而定。 

 

責任編輯:龐桂玉 來源: Python中文社區
相關推薦

2020-12-20 20:31:56

Python機器學習多元線性回歸

2020-11-10 08:37:05

Python線性回歸機器學習

2020-07-23 09:15:25

Python機器學習聚類分析

2020-10-10 12:53:57

邏輯回歸機器學習分析

2019-10-11 08:46:45

Python數據Numpy

2025-04-27 04:02:00

機器學習模型網絡

2023-11-10 15:47:06

線性回歸內核技巧

2021-01-20 08:30:00

數據分析機器學習IT

2018-03-09 10:37:48

詩歌代碼寫詩

2021-07-21 16:16:40

PythonNLTK編程語言

2022-09-08 09:39:03

PythonOCR代碼

2018-09-04 11:45:31

前端JavaScriptNodeJS

2022-05-25 07:11:13

Python人臉識別代碼

2018-04-24 10:45:00

Python人工智能圖像識別

2018-01-10 17:06:36

Python線性回歸數據

2024-03-01 07:26:49

RustPolars機器學習

2020-05-14 10:00:06

Python數據技術

2018-04-26 08:40:33

線性回歸算法機器學習

2017-12-05 16:26:36

爬蟲大數據共享單車

2018-05-14 10:43:53

平衡數據數據分析Python
點贊
收藏

51CTO技術棧公眾號

欧美性xxxx极品hd欧美风情| 国产盗摄女厕一区二区三区| 色黄久久久久久| 欧美国产日韩在线视频| 白白色在线观看| 久久精品视频网| 69174成人网| 香蕉影院在线观看| 66视频精品| 亚洲精品自产拍| 亚洲视频在线不卡| 成年美女黄网站色大片不卡| 亚洲色图欧美激情| 国产亚洲欧美一区二区 | 天天av综合| 亚洲精品国产精品久久清纯直播| 亚洲激情在线观看视频| 国产蜜臀av在线播放| 国产精品女主播在线观看| 国产乱码精品一区二区三区不卡| 超碰在线观看91| 国产精品久久| 在线a欧美视频| 成人做爰www看视频软件 | 亚洲综合中文字幕68页| 一级成人黄色片| 国产精品theporn| 揄拍成人国产精品视频| 欧美大片免费播放器| 久久在线观看| 欧美日韩国产精品成人| 一女被多男玩喷潮视频| 午夜成年人在线免费视频| 国产精品嫩草99a| 欧美日韩在线观看一区二区三区 | 日本欧美一区| 亚洲地区一二三色| 亚洲乱码日产精品bd在线观看| 精品推荐蜜桃传媒| 91亚洲精品久久久蜜桃网站| 97碰碰视频| 国产区精品在线| 麻豆视频观看网址久久| 国产成人精品一区| 日韩不卡视频在线| 一区二区三区精品视频在线观看 | 先锋影音欧美| 国产三级视频在线看| 99久久婷婷国产综合精品电影| 成人在线视频网站| 亚洲永久精品视频| 日本va欧美va精品发布| 国产精品日韩欧美综合| 亚洲视频在线免费播放| 美国欧美日韩国产在线播放| 国产美女扒开尿口久久久| 波多野结衣一二区| 日本vs亚洲vs韩国一区三区| 国产日韩欧美电影在线观看| 中文字幕日韩第一页| 麻豆国产欧美日韩综合精品二区| 国产精品免费一区| 国产又黄又粗又硬| 久久99精品久久久久久动态图| 91精品国产综合久久香蕉的用户体验| 在线视频欧美亚洲| 国产一区欧美二区| 国产精品久久一区二区三区| 人妻一区二区三区四区| 91麻豆福利精品推荐| 青娱乐国产91| 日本不卡视频| 伊人夜夜躁av伊人久久| 亚洲熟妇无码一区二区三区导航| 色网在线免费观看| 91成人免费电影| 欧美性猛交xxxx乱大交91| 亚洲日本va| 国产丝袜高跟一区| 中文字幕精品亚洲| 欧美区一区二| 欧美一级片久久久久久久| 中文字幕丰满人伦在线| 国产精品一区三区| 玛丽玛丽电影原版免费观看1977| 国产视频福利在线| 亚洲美女一区二区三区| 91好吊色国产欧美日韩在线| 日韩免费小视频| 91麻豆精品国产91久久久久久久久 | 在线能看的av网址| 欧美色精品在线视频| 在线观看免费看片| 亚洲精品白浆高清| 日韩在线观看免费高清| 日韩免费黄色片| 蜜桃在线一区二区三区| 国产精选一区二区| 亚洲麻豆精品| 欧美日韩精品国产| 在线能看的av网站| 中文字幕av一区二区三区人| 久久精品影视伊人网| 久热这里只有精品6| 日本91福利区| 鬼打鬼之黄金道士1992林正英| 蜜桃视频在线观看网站| 洋洋成人永久网站入口| 亚洲老女人av| 日韩电影不卡一区| 久久99热精品| 在线播放成人av| 26uuu亚洲| 一级全黄肉体裸体全过程| 中文字幕在线中文字幕在线中三区| 69p69国产精品| 鲁丝一区二区三区| 亚洲午夜一区| 亚洲精品免费一区二区三区| 福利在线观看| 色综合天天综合网天天狠天天| wwwxxx色| 99久久亚洲精品| 国产精品成人aaaaa网站| 丁香六月色婷婷| 亚洲日本韩国一区| 日本特黄a级片| 免费看av成人| 久久久久久久久久久av| 国产男男gay网站| 国产精品毛片无遮挡高清| 欧美女人性生活视频| 成人激情自拍| 欧美日韩成人黄色| 99久久精品国产色欲| 国产精品福利一区二区| 五月天激情视频在线观看| 妖精一区二区三区精品视频| 欧美国产日韩一区二区三区| 国产免费高清视频| 亚洲婷婷综合久久一本伊一区| 中文字幕第21页| 亚洲丝袜啪啪| 国产成人97精品免费看片| 日韩欧美在线番号| 欧美日韩在线视频一区| 精品视频站长推荐| 野花国产精品入口| 久久国产精品亚洲va麻豆| 交100部在线观看| 日韩成人av在线播放| 青青国产在线观看| 久久无码av三级| 欧在线一二三四区| 精品久久不卡| 国产日韩中文在线| 日本在线视频观看| 日韩一区二区在线观看视频播放| 91精品国产闺蜜国产在线闺蜜| 精品一区精品二区高清| 熟妇熟女乱妇乱女网站| 成人影院网站ww555久久精品| 久久精品亚洲精品| 亚洲欧美黄色片| 欧美午夜片欧美片在线观看| www.av欧美| 秋霞影院一区二区| 黄色www在线观看| 中文无码日韩欧| 欧美在线影院在线视频| 可以直接在线观看的av| 欧美亚洲愉拍一区二区| 欧美色视频一区二区三区在线观看| 激情欧美一区二区| 免费一级特黄毛片| 国内精品久久久久久久久电影网| 国产女人18毛片水18精品| 99福利在线| 日韩成人在线网站| 中文字幕码精品视频网站| 1024精品合集| 黄色激情在线观看| 日本不卡123| 特级西西人体www高清大胆| 日韩理论电影中文字幕| 国产精品视频自拍| 国产后进白嫩翘臀在线观看视频| 精品调教chinesegay| 国产又粗又黄又爽视频| 亚洲成人在线网站| 免费成人深夜蜜桃视频| av午夜一区麻豆| 亚洲美女性囗交| 亚洲美女黄色| 伊人久久大香线蕉午夜av| 国产精品极品国产中出| 国产精品国模在线| 免费不卡av| 亚洲性生活视频在线观看| 国产欧美一级片| 日韩欧美国产高清91| 亚洲最大的黄色网址| 国产亚洲精品久| 亚洲成av人片在线观看无| 麻豆freexxxx性91精品| 乱妇乱女熟妇熟女网站| 综合天堂久久久久久久| 亚洲 日韩 国产第一区| 久久影视三级福利片| 91免费版网站入口| 欧美日韩免费看片| 久久久久久久久久久国产| 国产最新在线| 国产一区二区三区视频| 男人天堂综合网| 在线91免费看| 中文字幕在线观看免费| 日韩欧美福利视频| 国产欧美日韩另类| 一区二区三区毛片| 成年人免费视频播放| 久久久久国产精品麻豆ai换脸| 国产精品果冻传媒| 国产高清精品在线| 狠狠干狠狠操视频| 日本美女一区二区三区视频| 九九九九免费视频| 亚洲美女网站| av在线免费观看国产| 91av精品| 黄色www在线观看| 97精品在线| 在线中文字日产幕| 精品欠久久久中文字幕加勒比| 成人免费网站在线观看| 欧美日韩尤物久久| 国产大片精品免费永久看nba| 91九色美女在线视频| 欧美成人久久久| 欧洲美女少妇精品| 综合网日日天干夜夜久久| 国产色a在线| 国产亚洲成精品久久| 免费在线黄色电影| 亚洲性无码av在线| 爱爱爱免费视频在线观看| 亚洲日韩欧美视频| 狠狠狠综合7777久夜色撩人 | 欧美美女性视频| 秋霞影院一区二区| 亚洲午夜激情影院| 精品一区二区三区av| 波多野结衣国产精品| 久久狠狠亚洲综合| 伊人五月天婷婷| 国产综合色产在线精品| 青娱乐精品在线| 国产盗摄女厕一区二区三区| 亚洲少妇一区二区三区| av在线综合网| wwwwww日本| 国产人成一区二区三区影院| 蜜桃av免费观看| 亚洲三级在线播放| 精品处破女学生| 无吗不卡中文字幕| 久久精品偷拍视频| 6080日韩午夜伦伦午夜伦| 亚洲第一页在线观看| 亚洲娇小xxxx欧美娇小| 国产日本在线观看| 久久精品99无色码中文字幕| 羞羞网站在线免费观看| 26uuu另类亚洲欧美日本一 | 色欲综合视频天天天| 亚洲视屏在线观看| 日韩午夜在线观看| 亚欧在线观看视频| 日韩在线视频中文字幕| 国内在线免费视频| 日本高清视频一区| 国内精品视频| 就去色蜜桃综合| 色999国产精品| 妞干网在线视频观看| 首页综合国产亚洲丝袜| 欧美成人乱码一二三四区免费| 大白屁股一区二区视频| 级毛片内射视频| 亚洲一区在线看| 波多野结衣黄色网址| 日韩一级片网址| 九一在线视频| 久久久亚洲欧洲日产国码aⅴ| 蜜桃视频成人m3u8| 国产精品一区二区三区精品| 秋霞欧美视频| 日本一道本久久| 久久国产生活片100| 手机在线成人av| 亚洲天堂成人网| 亚洲精品成人在线视频| 欧美一区二区免费| 国产一区二区三区福利| 久久久久久久久久国产| 成人自拍视频| 视频一区国产精品| 国产精品久久久亚洲一区| 伦伦影院午夜理论片| 国产精品欧美一区喷水| 亚洲黄色三级视频| 日韩视频在线一区二区| 粉嫩一区二区三区国产精品| 欧美亚洲在线播放| 成人在线超碰| 成年丰满熟妇午夜免费视频| 免费成人美女在线观看| brazzers精品成人一区| 亚洲电影激情视频网站| 国产偷拍一区二区| 中文字幕久热精品在线视频| 国产高清自产拍av在线| 国产成人亚洲欧美| 欧美成人有码| 波多野结衣免费观看| 国产精品麻豆网站| 中文字幕一区二区在线视频| 亚洲男人天堂2019| 在线观看v片| 精品欧美日韩在线| 亚洲欧洲一区| 人妻激情偷乱频一区二区三区| 亚洲免费在线看| 99久久精品国产一区二区成人| 少妇精69xxtheporn| jizz欧美| 亚洲人成影视在线观看| 热久久国产精品| 影音先锋男人看片资源| 精品婷婷伊人一区三区三| 国产精品四虎| 国产精品久久二区| 欧美日韩精品一区二区视频| 91热这里只有精品| 中文子幕无线码一区tr| 午夜视频网站在线观看| 中文欧美日本在线资源| 91p九色成人| 一区二区三视频| 精品一区二区在线播放| 在线看的片片片免费| 日韩一区二区三区电影| 日韩少妇视频| 久久精品综合一区| 欧美资源在线| 美女100%露胸无遮挡| 欧美日高清视频| 91极品在线| 精品久久久久久中文字幕动漫 | 91精品美女在线| 亚洲高清影视| 一边摸一边做爽的视频17国产| 午夜日韩在线观看| 九色在线播放| 成人精品一区二区三区电影免费 | 欧美xxxx做受欧美.88| www.亚洲一二| 99视频在线免费| 中文字幕日韩精品一区| 亚洲精品国产片| 欧洲日本亚洲国产区| 欧美r级电影| 不许穿内裤随时挨c调教h苏绵| 精品久久久久久久久久ntr影视| 国产h视频在线观看| 5g影院天天爽成人免费下载| 国产日韩一区二区三区在线播放 | 亚洲综合丝袜美腿| 你懂得在线网址| 亚洲va码欧洲m码| 中文久久精品| 后入内射无码人妻一区| 欧美精品一区二区三区一线天视频 | 欧美性视频在线播放| va亚洲va日韩不卡在线观看| 综合网在线观看| 色综合91久久精品中文字幕| 成人香蕉社区| 中文字幕天天干| 亚洲在线观看免费| av一本在线| 99久久99久久| 久久精品久久综合| 国精产品视频一二二区| 亚洲成人三级在线| 91福利精品在线观看| 一本色道久久综合亚洲二区三区 | 日本视频在线观看一区二区三区 | 51精品国产| xxww在线观看|