精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

手把手教你采集京東銷售數據并做簡單的數據分析和可視化

大數據 數據可視化
隨著移動支付的普及,電商網站不斷涌現,由于電商網站產品太多,由用戶產生的評論數據就更多了,這次我們以京東為例,針對某一單品的評論數據進行數據采集,并且做簡單數據分析。

[[421418]]

前言

大家好!我是古月星辰,大三本科生,數學專業,Python爬蟲愛好者一枚。今天給大家帶來JD數據的簡單采集和可視化分析,希望大家可以喜歡。

一、目標數據

隨著移動支付的普及,電商網站不斷涌現,由于電商網站產品太多,由用戶產生的評論數據就更多了,這次我們以京東為例,針對某一單品的評論數據進行數據采集,并且做簡單數據分析。

二、頁面分析

這個是某一手機頁面的詳情頁,對應著手機的各種參數以及用戶評論信息,頁面URL是:

  1. https://item.jd.com/10022971060622.html#none 

然后通過分析找到評論數據對應的數據接口,如下圖所示:

它的請求url:

  1. https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_com 
  2. ment98& productId=10022971060622 &score=0&sortType=5& page=0 &pageSize=10&isShadowSk 
  3. u=0&fold=1 

注意看到這兩個關鍵參數

1. productId: 每個商品有一個id

2. page: 對應的評論分頁

三、解析數據

對評論數據的url發起請求:

  1. url:https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comm 
  2. ent98& productId=10022971060622 &score=0&sortType=5& page=0 &pageSize=10&isShado 
  3. wSku=0&fold=1 

json.cn 打開json數據(我們的評論數據是以json形式與頁面進行交互傳輸的),如下圖所示:

分析可知,評論url中對應十條評論數據,對于每一條評論數據,我們需要獲取3條數

據,contents,color,size(注意到上圖的maxsize,100,也就是100*10=1000條評論)。

四、程序

1.導入相關庫

  1. import  requests 
  2. import  json 
  3. import  time 
  4. import  openpyxl  #第三方模塊,用于操作Excel文件的 
  5. #模擬瀏覽器發送請求并獲取響應結果 
  6. import random 

2.獲取評論數據

  1. def get_comments(productId,page): 
  2.     url='https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId={0}&score=0&sortType=5&page={1}&pageSize=10&isShadowSku=0&fold=1'.format(productId,page) # 商品id 
  3.     resp=requests.get(url,headers=headers) 
  4.     #print(resp.text)  #響應結果進行顯示輸出 
  5.     s1=resp.text.replace('fetchJSON_comment98(','') #fetchJSON_comment98( 
  6.     s=s1.replace(');',''
  7.     #將str類型的數據轉成json格式的數據 
  8.     # print(s,type(s)) 
  9.     # print('*'*100) 
  10.     res=json.loads(s) 
  11.     print(type(res)) 
  12.     return res 

3.獲取最大頁數(也可以不寫)

  1. def get_max_page(productId): 
  2.     dic_data=get_comments(productId,0)  #調用剛才寫的函數,向服務器發送請求,獲取字典數據 
  3.     return dic_data['maxPage'

4.提取數據

  1. def get_info(productId): 
  2.     #調用函數獲取商品的最大評論頁數 
  3.     #max_page=get_max_page(productId) 
  4.     # max_page=10 
  5.     lst=[]  #用于存儲提取到的商品數據 
  6.     for page in range(0,get_max_page(productId)):   #循環執行次數 
  7.         #獲取每頁的商品評論 
  8.         comments=get_comments(productId,page) 
  9.         comm_lst=comments['comments']   #根據key獲取value,根據comments獲取到評論的列表(每頁有10條評論) 
  10.         #遍歷評論列表,分別獲取每條評論的中的內容,顏色,鞋碼 
  11.         for item in comm_lst:   #每條評論又分別是一個字典,再繼續根據key獲取值 
  12.             content=item['content']  #獲取評論中的內容 
  13.             color=item['productColor'] #獲取評論中的顏色 
  14.             size=item['productSize'] #鞋碼 
  15.             lst.append([content,color,size])  #將每條評論的信息添加到列表中 
  16.         time.sleep(3)  #延遲時間,防止程序執行速度太快,被封IP 
  17.     save(lst)  #調用自己編寫的函數,將列表中的數據進行存儲 

5.用于將爬取到的數據存儲到Excel中

  1. def save(lst): 
  2.     wk=openpyxl.Workbook () #創建工作薄對象 
  3.     sheet=wk.active  #獲取活動表 
  4.     #遍歷列表,將列表中的數據添加到工作表中,列表中的一條數據,在Excel中是 一行 
  5.     for item in lst: 
  6.         sheet.append(item) 
  7.     #保存到磁盤上 
  8.     wk.save('銷售數據.xlsx'

6.運行程序

  1. if __name__ == '__main__'
  2.     productId='10029693009906' # 單品id 
  3.     get_info(productId) 

五、簡單數據

1.簡單配置

  1. # 導入相關庫 
  2. import pandas as pd  
  3. import matplotlib.pyplot as plt 
  4. # 這兩行代碼解決 plt 中文顯示的問題 
  5. plt.rcParams['font.sans-serif'] = ['SimHei'
  6. plt.rcParams['axes.unicode_minus'] = False 
  7. # 由于采集的時候沒有設置表頭,此處設置表頭 
  8. data = pd.read_excel('./銷售數據.xlsx', header=None, names = ['comments','color','intro'] ) #  
  9. data.head() 

2.手機顏色數量對比

  1. x = ['白色','黑色','綠色','藍色','紅色','紫色'
  2. y = [314,295,181,173,27,10] 
  3. plt.bar(x,y) 
  4. plt.title('各種顏色手機數量對比'
  5. plt.xlabel('顏色'
  6. plt.ylabel('數量'
  7. # plt.legend() # 顯示圖例 
  8. plt.show() 

可以看出用戶購買的手機白色和黑色的機型比較多.占據了60%多。3.評論詞云展示1)先要提取評論數據

  1. import xlrd 
  2. def strs(row): 
  3.     values = ""
  4.     for i in range(len(row)): 
  5.         if i == len(row) - 1: 
  6.             values = values + str(row[i]) 
  7.         else
  8.             values = values + str(row[i]) 
  9.     return values 
  10. # 打卡文件 
  11. data = xlrd.open_workbook("./銷售數據.xlsx"
  12. sqlfile = open("data.txt""a")  # 文件讀寫方式是追加 
  13. table = data.sheets()[0]  # 表頭 
  14. nrows = table.nrows  # 行數 
  15. ncols = table.ncols  # 列數 
  16. colnames = table.row_values(1)  # 某一行數據 
  17. # 打印出行數列數 
  18. for ronum in range(1, nrows): 
  19.         row = table.cell_value(rowx=ronum, colx = 0) #只需要修改你要讀取的列數-1 
  20.         values = strs(row)  # 調用函數,將行數據拼接成字符串 
  21.         sqlfile.writelines(values + "\n")  # 將字符串寫入新文件 
  22. sqlfile.close()  # 關閉寫入的文件 

2)詞云展示

  1. # 導入相應的庫 
  2. import jieba 
  3. from PIL import Image 
  4. import numpy as np 
  5. from wordcloud import WordCloud 
  6. import matplotlib.pyplot as plt 
  7. # 導入文本數據并進行簡單的文本處理 
  8. # 去掉換行符和空格 
  9. text = open("./data.txt",encoding='gbk').read() 
  10. text = text.replace('\n',"").replace("\u3000",""
  11.  
  12. # 分詞,返回結果為詞的列表 
  13. text_cut = jieba.lcut(text) 
  14. # 將分好的詞用某個符號分割開連成字符串 
  15. text_cut = ' '.join(text_cut) 

注意: 這里我們不能使用encoding='uth-8',會報出一個錯誤:

  1. 'utf-8' codec can't decode byte 0xd3 in position 0: invalid continuation byte 

所以我們需要改成 gbk。

  1. word_list = jieba.cut(text) 
  2. space_word_list = ' '.join(word_list) 
  3. print(space_word_list) 
  4. # 調用包PIL中的open方法,讀取圖片文件,通過numpy中的array方法生成數組 
  5. mask_pic = np.array(Image.open("./xin.png")) 
  6. word = WordCloud( 
  7.     font_path='C:/Windows/Fonts/simfang.ttf',  # 設置字體,本機的字體 
  8.     mask=mask_pic,  # 設置背景圖片 
  9.     background_color='white',  # 設置背景顏色 
  10.     max_font_size=150,  # 設置字體最大值 
  11.     max_words=2000,  # 設置最大顯示字數 
  12.     stopwords={'的'}  # 設置停用詞,停用詞則不在詞云途中表示 
  13.                  ).generate(space_word_list) 
  14. image = word.to_image() 
  15. word.to_file('2.png')  # 保存圖片 
  16. image.show() 

最后得到的效果圖,如下圖所示:

本文轉載自微信公眾號「Python爬蟲與數據挖掘」,可以通過以下二維碼關注。轉載本文請聯系Python爬蟲與數據挖掘公眾號。

 

 

責任編輯:武曉燕 來源: Python爬蟲與數據挖掘
相關推薦

2017-05-18 12:45:35

數據分析數據理解數據

2020-12-17 09:40:01

Matplotlib數據可視化命令

2015-10-26 09:24:30

微信公眾號數據分析

2021-08-26 09:00:48

PyechartsPython可視化

2021-05-10 06:48:11

Python騰訊招聘

2021-07-14 09:00:36

Python數據Python基礎

2017-10-18 16:08:15

可視化交叉驗證代碼

2020-06-17 08:35:12

數據分析Python代碼

2023-02-01 10:16:50

Python可視化

2021-09-30 18:27:38

數據倉庫ETL

2022-02-09 09:03:42

分詞、詞頻統計可視化

2020-05-14 10:19:23

Python可視化分析

2021-12-29 20:20:25

結構化數據Pandas

2018-04-05 22:55:34

數據問答系統SQuAD

2020-06-22 13:41:27

數據集數據清洗數據模型

2021-09-18 14:26:49

Linux Linux 啟動流程Linux 系統

2024-10-16 11:40:47

2020-04-14 10:20:12

MySQL數據庫死鎖

2011-04-21 10:32:44

MySQL雙機同步

2020-11-27 07:38:43

MongoDB
點贊
收藏

51CTO技術棧公眾號

91精品国产一区二区在线观看 | 国产成年人在线观看| 高潮毛片又色又爽免费| 日韩美女一区二区三区在线观看| 欧美性受xxxx| 先锋影音网一区| 一级片在线观看视频| 一本一本久久a久久综合精品| 欧美美女一区二区| 在线观看av的网址| 头脑特工队2在线播放| 国产欧美欧美| 上原亚衣av一区二区三区| 免费高清视频在线观看| 色是在线视频| 中文字幕一区二区三中文字幕| 91视频国产一区| 日产欧产va高清| 日韩av久操| 亚洲精品一区二区三区影院| 国产淫片av片久久久久久| 欧美一区二区三区在线观看免费| 国产成人在线免费| 日本高清视频一区| 日本青青草视频| 国产一区二区三区免费观看在线 | 日本aa在线| 91麻豆福利精品推荐| 91久久国产婷婷一区二区| 欧美在线视频第一页| 欧美日韩夜夜| 日韩一区国产二区欧美三区| 久操网在线观看| 香蕉视频国产在线观看| 99免费精品视频| 国产日韩综合一区二区性色av| 日本三级视频在线| 99久久.com| 日韩精品极品视频| 中文字幕55页| 国产一区二区主播在线| 亚洲va中文字幕| 咪咪色在线视频| 免费成人av电影| 国产电影一区在线| 国产精品美女www| 日韩精品一区二区不卡| 亚洲中无吗在线| 亚洲另类激情图| 涩视频在线观看| 国产免费av国片精品草莓男男| 婷婷综合五月天| 欧美成人免费在线| 天天摸天天碰天天爽天天弄| 国产精品一区二区黑丝| 国产噜噜噜噜噜久久久久久久久| 日本五十路女优| 欧美天天在线| 国产一区二区三区视频在线观看| 国产亚洲色婷婷久久99精品91| 一区二区在线视频观看| 欧美一级欧美三级在线观看| 久久撸在线视频| 电影k8一区二区三区久久| 日韩理论片网站| 欧美日韩综合网| 日本私人网站在线观看| 91片在线免费观看| 久久久久综合一区二区三区| 亚洲乱码精品久久久久..| 久久99久久99| 成人免费在线视频网址| 可以免费在线观看的av| 国产精品三上| 国产99视频在线观看| 少妇高潮av久久久久久| 男人的天堂成人在线| 国产精品99久久久久久www| 久久精品视频5| 在线一区免费观看| 奇米4444一区二区三区 | 欧美午夜精彩| 亚洲а∨天堂久久精品喷水| 美女黄色一级视频| 人人精品亚洲| 日韩毛片在线看| 高清国产在线观看| 欧美电影免费播放| 欧美国产第二页| 亚洲国产成人精品激情在线| 久久激情中文| 成人久久18免费网站图片| av免费观看网址| caoporn国产一区二区| 免费国产一区| 国产三级视频在线| 国产精品久久毛片a| 免费观看国产视频在线| 91桃色在线观看| 91久久一区二区| 欧美国产日韩另类| 欧美激情久久久久久久久久久| 亚洲欧美国产日韩中文字幕| 少妇视频一区二区| 亚洲精品影院在线观看| 91av在线国产| 91麻豆国产在线| 国产**成人网毛片九色 | 亚洲在线视频网站| 红桃av在线播放| 97精品国产综合久久久动漫日韩| 91麻豆精品国产91久久久| av电影在线播放| 久久av综合| 久久中文字幕在线| 日韩欧美亚洲视频| 精品一区二区在线观看| 国产在线精品一区二区中文| 亚洲三区在线播放| ...av二区三区久久精品| 精品人妻一区二区三区四区在线| 久久亚洲精品人成综合网| 欧美理论片在线| 在线免费观看污视频| 99久久这里只有精品| 97色在线观看| 亚洲自拍第二页| 91香蕉视频污在线| 欧美三级午夜理伦三级老人| 欧美大片1688| 这里只有精品视频在线观看| 亚洲调教欧美在线| 婷婷精品进入| 国产精品久久久久久久久久新婚 | 色偷偷综合网| 中文字幕亚洲一区| 日韩av一区二区在线播放| 久久久久久穴| 精品国产一二| 欧美巨大xxxx做受沙滩| 欧美久久久久久久久| 亚洲av综合一区二区| 在线精品在线| 97视频资源在线观看| 网友自拍视频在线| 在线一区二区三区四区五区| 韩国三级hd两男一女| 亚洲国产一区二区三区在线播放| 国产精品video| www天堂在线| 一区二区在线观看av| 天堂网在线免费观看| 国产劲爆久久| 久久久久一本一区二区青青蜜月| 国产黄a三级三级三级| 亚洲日本在线a| www.亚洲天堂网| 国产女人18毛片水真多18精品| 另类色图亚洲色图| 国产精品久久久久久久久久久久久久久久久久| 久久久久国产精品麻豆| 免费看又黄又无码的网站| 成人激情自拍| 久久久久久久久久国产| 六月婷婷综合网| 亚洲国产精品自拍| 亚洲国产综合av| 欧美一区免费| 国产91视觉| 国内老司机av在线| 亚洲国产精品嫩草影院久久| 日本一区二区三区免费视频| 不卡一二三区首页| 男女啪啪免费视频网站| 天堂成人娱乐在线视频免费播放网站| 国产91精品久| 黑人与亚洲人色ⅹvideos| 91黄色免费观看| 亚洲不卡的av| 国产专区综合网| 五月天激情图片| 成人资源在线| 欧美一级视频免费在线观看| 国产永久免费高清在线观看| 欧美亚洲自拍偷拍| 五月天色婷婷丁香| 成人免费va视频| 日韩精品一区二区三区久久| 精品成av人一区二区三区| 国产精品一区二区三| 18视频在线观看| 亚洲精品国产美女| 中文字幕久久网| 一区二区在线看| 精品人妻少妇嫩草av无码| 国产精品美女久久久| 亚洲欧美日韩综合一区| 这里视频有精品| 浅井舞香一区二区| 一本一道波多野毛片中文在线| 欧美xfplay| 久久人妻免费视频| 亚洲欧美日韩精品久久久久| 黄色性视频网站| 免费av网站大全久久| 国风产精品一区二区| 亚洲精品小区久久久久久| 国产精品自在线| 多野结衣av一区| 中文字幕在线视频日韩| 黄频在线免费观看| 欧美日韩国产中文| 久久99精品波多结衣一区| 国产精品久久久久久户外露出| 69xxx免费视频| 蜜臀av亚洲一区中文字幕| 亚洲小视频在线播放| 精品中文字幕一区二区三区av| 亚洲字幕一区二区| 精品日本视频| 4438全国成人免费| a级片国产精品自在拍在线播放| 日韩国产精品视频| www.香蕉视频| 日韩欧美在线国产| 久久久久久蜜桃| 国产精品久久毛片| 女尊高h男高潮呻吟| 国产suv精品一区二区883| 黑森林精品导航| 99亚洲视频| 好吊色视频988gao在线观看| 日韩av有码| 日韩美女在线观看| av美女在线观看| 欧美激情一级欧美精品| 日韩另类在线| 欧美人交a欧美精品| 性直播体位视频在线观看| 久久久999精品| 日本在线人成| 久久精品国产91精品亚洲| 中文字幕在线免费| 色噜噜久久综合伊人一本| 日韩大片在线永久免费观看网站| 一区二区三区动漫| 92国产在线视频| 精品国产一区二区三区久久| 日本中文字幕在线观看| 色偷偷噜噜噜亚洲男人| 免费看a在线观看| 久久久91精品国产一区不卡| av片在线观看网站| 欧美激情欧美狂野欧美精品| 欧美日韩色网| 高清亚洲成在人网站天堂| 福利影院在线看| 日本中文字幕成人| 日本在线视频一区二区| 国产伦精品免费视频| 懂色av蜜臀av粉嫩av喷吹| 一二三四区在线| 香蕉加勒比综合久久| 久久精品国产亚洲AV无码麻豆| 亚洲伊人伊色伊影伊综合网| 久久久一二三区| 亚洲sss视频在线视频| 亚洲日本韩国在线| 在线观看亚洲精品| 国产情侣在线播放| 欧美岛国在线观看| 色鬼7777久久| 少妇高潮 亚洲精品| 羞羞网站在线看| 欧美一性一乱一交一视频| 91大神在线观看线路一区| 91午夜理伦私人影院| 精品国产午夜肉伦伦影院| 欧美一区二区福利| 亚洲激情中文在线| 久草热视频在线观看| 久久精品国产亚洲a| av不卡中文字幕| 国产日韩精品一区| 国产精品一区二区亚洲| 亚洲国产另类精品专区| 亚洲av人无码激艳猛片服务器| 日韩欧美资源站| 国产香蕉在线| 欧美激情一区二区三区久久久| 免费亚洲电影| 99re在线视频观看| 九九免费精品视频在线观看| 99热这里只有精品7| 性娇小13――14欧美| 手机免费看av网站| 久久蜜桃香蕉精品一区二区三区| 999精品视频在线观看播放| 欧美午夜激情视频| 国产男男gay网站| 亚洲网站在线看| 成年人国产在线观看| 国产日韩一区在线| 亚洲第一论坛sis| 女人被男人躁得好爽免费视频| 日本不卡高清视频| 国产美女视频免费观看下载软件| 国产精品久久久久四虎| 亚洲欧美偷拍视频| 精品国产乱码久久久久久免费| 在线视频1区2区| 日韩免费av一区二区| 国语一区二区三区| dy888午夜| 免费在线观看不卡| 中文字幕在线观看的网站| 一区二区三区.www| 国产老妇伦国产熟女老妇视频| 亚洲视频在线免费观看| 蜜桃麻豆av在线| 国产伦视频一区二区三区| 91精品国产91久久久久久密臀 | 久久久久se| 狠狠入ady亚洲精品| 欧美精品 - 色网| 国产精品日韩成人| 日本中文字幕在线观看视频| 日韩精品视频在线播放| 国产精品论坛| 国产精品久久久久免费| 欧美国产91| 精品国产午夜福利在线观看| 综合欧美亚洲日本| 国产精品视频a| 日韩网站免费观看| 欧美videos粗暴| 一区二区视频在线播放| 美女www一区二区| 国产免费嫩草影院| 欧美日韩亚洲另类| 在线免费看av| 成人日韩在线电影| av网站在线免费| 国产精品一区久久久| 成人在线免费视频观看| 杨幂毛片午夜性生毛片 | 亚洲精品9999| 青娱乐精品视频在线| 日韩视频在线观看免费视频| 欧洲人成人精品| 在线观看黄色av| 成人精品久久一区二区三区| 亚洲九九在线| 欧美图片自拍偷拍| 疯狂做受xxxx高潮欧美日本| 午夜视频在线播放| 日本国产一区二区三区| 国产探花在线精品| 黄大色黄女片18第一次| 亚洲三级免费观看| 黄色av中文字幕| 日本伊人精品一区二区三区介绍| 国产亚洲一区二区三区啪| 国产精品区在线| 亚洲柠檬福利资源导航| 国产综合在线播放| 日韩美女视频免费在线观看| 人人狠狠综合久久亚洲婷婷| 一级黄色片国产| 亚洲成av人片一区二区三区| 青春有你2免费观看完整版在线播放高清 | 四虎永久免费地址| 欧美一区二区大片| 日本三级一区| 亚洲永久激情精品| 成人性色生活片免费看爆迷你毛片| 日韩成人免费观看| 中文字幕在线观看亚洲| 色妞ww精品视频7777| 欧美性大战久久久久xxx| 日本一区二区三区国色天香| hs视频在线观看| 2020国产精品视频| 欧美国产一级| 亚洲精品国产成人av在线| 日本黄色一区二区| 羞羞的网站在线观看| 欧美亚洲国产免费| 国产精品一二三四五| 久久免费激情视频| 久久久99久久精品女同性| 久久精品国产亚洲5555| 国产精品视频中文字幕| 亚洲国产毛片aaaaa无费看 | 久久久噜噜噜久噜久久综合| 99久久精品日本一区二区免费| 青青久久av北条麻妃海外网| 午夜精品免费| 日本一二三不卡视频| 亚洲精品999|