精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

《狄仁杰之四大天王》影評分析(爬蟲+詞云+熱力圖)

大數據 數據分析
作為徐老怪的忠實影迷,《狄仁杰之四大天王》肯定是要去看的,看豆瓣評分和前兩部相差不多,但其實胡蘿卜醬并不是很喜歡前兩部,所以在猶豫要不要去看,受到糖甜甜甜的《我不是藥神》推送影響,于是也簡單去分析了一下《狄仁杰》的影評。

作為徐老怪的忠實影迷,《狄仁杰之四大天王》肯定是要去看的,看豆瓣評分和前兩部相差不多,但其實胡蘿卜醬并不是很喜歡前兩部,所以在猶豫要不要去看,受到糖甜甜甜的《我不是藥神》推送影響,于是也簡單去分析了一下《狄仁杰》的影評。

[[238686]]

01 數據爬取

本來小編是打算爬取豆瓣的全部影評,但是很不幸,數據爬取到一半,我的賬號被封了(建議大家改為動態IP進行爬取,代碼可用,可加QQ群獲取),于是轉戰于貓眼。貓眼的短評不能直接通過源碼獲得,需要尋找他的數據接口,如下:

http://m.maoyan.com/mmdb/comments/movie/341516.json?_v_=yes&offset=1

其中341516屬于電影的專屬id,offset代表頁數且只展示1000頁的內容,同時僅限于當日的評論。此文只為做影評分析演示,所以小編只爬取了今日的評論,去重后僅為幾百條,建議大家多爬取今天的數據,在做分析。

代碼如下:

  1. import requests 
  2. import json 
  3. import time 
  4. import random 
  5.  
  6. #下載一頁數據 
  7. def get_one_page(url): 
  8.     headers = { 
  9.     'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36' 
  10.     } 
  11.     response = requests.get(url,headers=headers) 
  12.     if response.status_code == 200:  #頁面正常響應 
  13.         return response.text # 返回頁面源代碼 
  14.     return None 
  15.  
  16. #解析一頁數據 
  17. def parse_ono_page(html): 
  18.     data = json.loads(html)['cmts'] #評論以json形式存儲,故以json形式截取 
  19.     for item in data: 
  20.         yield{ #該方法返回一個字典 
  21.             'comment':item['content'], 
  22.             'date':item['time'].split(' ')[0], 
  23.             'rate':item['score'], 
  24.             'city':item['cityName'], 
  25.             'nickname':item['nickName'
  26.         } 
  27.  
  28. #保存數據到文本文檔 
  29. def save_to_txt(): 
  30.     for i in range(1, 1001): 
  31.         url='http://m.maoyan.com/mmdb/comments/movie/341516.json?_v_=yes&offset=' + str(i) 
  32.         html = get_one_page(url) 
  33.         print('正在保存第%d頁.'% i) 
  34.         for item in parse_ono_page(html): 
  35.             with open('狄仁杰.txt','a',encoding='utf-8'as f: 
  36.                 f.write(item['date'] + ',' + item['nickname'] + ',' + item['city'] + ',' +str(item['rate'])+','+item['comment']+'\n'
  37.         #反爬 
  38.         time.sleep(5 + float(random.randint(1,100)) /20)  
  39.  
  40. # 獲取的評論可能有重復,為了最終統計的真實性,需做去重處理 
  41. def delete_repeat(old,new): 
  42.     oldfile = open(old,'r',encoding='UTF-8'
  43.     newfile = open(new,'w',encoding='UTF-8'
  44.     content_list = oldfile.readlines() #讀取的數據集 
  45.     content_alreadly_ditinct = [] #存儲不重復的評論數據 
  46.     for line in content_list: 
  47.         if line not in content_alreadly_ditinct: #評論不重復 
  48.             newfile.write(line+'\n'
  49.             content_alreadly_ditinct.append(line) 
  50.  
  51. if __name__ =='__main__'
  52.     save_to_txt() 
  53.     delete_repeat(r'狄仁杰.txt', r'狄仁杰_new.txt'

爬取數據如下:

《狄仁杰之四大天王》影評分析(爬蟲+詞云+熱力圖)

02 數據分析

直觀來看,有用的數據僅為城市,評分和評論。我們分別采用熱力圖,柱狀圖和云圖來進行可視化分析。

觀影者分布熱力圖

根據觀影者的城市,我們畫出了觀影者分布情況,如下圖:

《狄仁杰之四大天王》影評分析(爬蟲+詞云+熱力圖)

 

可明顯發現東部地區,尤其是北京、上海、廣東,成都等城市更為突出,當然,這和經濟發展有著重要的聯系,也符合我們的常規想法。

代碼如下:

  1. from wordcloud import WordCloud, STOPWORDS 
  2. import pandas as pd 
  3. import jieba 
  4. import matplotlib.pyplot as plt 
  5. import seaborn as sns 
  6. from pyecharts import Geo 
  7.  
  8. f = open('狄仁杰_new.txt',encoding='UTF-8'
  9. data = pd.read_csv(f,sep=',',header=None,encoding='UTF-8',names=['date','nickname','city','rate','comment']) 
  10.  
  11. city = data.groupby(['city']) 
  12. rate_group = city['rate'
  13. city_com = city['city'].agg(['count']) 
  14. city_com.reset_index(inplace=True
  15. data_map = [(city_com['city'][i],city_com['count'][i]) for i in range(0,city_com.shape[0])] 
  16. geo = Geo("狄仁杰",title_color="#fff",title_pos="center",width=1200, 
  17.           height=600,background_color="#404a59"
  18.  
  19. while True:  
  20.     try: 
  21.         attr, val = geo.cast(data_map) 
  22.         geo.add("", attr, val, visual_range=[0, 50], visual_text_color="#fff", is_geo_effect_show=False
  23.                 is_piecewise=True, visual_split_number=6, symbol_size=15, is_visualmap=True
  24.  
  25.     except ValueError as e: 
  26.         e = str(e) 
  27.         e = e.split("No coordinate is specified for ")[1]  # 獲取不支持的城市名稱 
  28.         for i in range(0,len(data_map)): 
  29.             if e in data_map[i]: 
  30.                 data_map.pop(i) 
  31.                 break 
  32.     else
  33.         break 
  34. geo.render('狄仁杰.html'

評分柱狀圖

相較于豆瓣的評分機制,在貓眼的評分機制允許給出半星的評價,于是通過簡單的柱狀圖來大概看一下評分情況。

《狄仁杰之四大天王》影評分析(爬蟲+詞云+熱力圖)

 

大部分的評分都高于3分,尤其是給出滿分的最多,只有少數的觀影者給出了低分,看來徐克這部電影的口碑還行,至少在及格線以上。那大家觀完影,最直觀的感受是什么呢,接下來就通過短評分析來看看。

代碼如下:

  1. #評分分析 
  2. rate = data['rate'].value_counts() 
  3.  
  4. sns.set_style("darkgrid"
  5. bar_plot = sns.barplot(x=rate.index,y=(rate.values/sum(rate)),palette="muted"
  6. plt.xticks(rotation=90) 
  7. plt.show() 

短評詞云圖

為了分析短評,我們采用jieba對短評進行了分詞,然后做出詞云圖。

背景圖:

[[238688]]

 

詞云圖:

 

[[238689]]

和前兩部一樣,最突出的是特效,劇情和徐老怪,看來在這部電影里面,徐克肯定也將特效做的很棒,個人風格也肯定展示的***。同時,也能發現好看,不錯,推薦也是觀影者的主要感受,看來還是蠻值得去看的。

代碼如下:

  1. #分詞 
  2. comment = jieba.cut(str(data["comment"]),cut_all=False
  3. wl_space_split= " ".join(comment) 
  4. #導入背景圖 
  5. backgroud_Image = plt.imread('xuke.jpg'
  6. stopwords = STOPWORDS.copy() 
  7. print(" STOPWORDS.copy()",help(STOPWORDS.copy())) 
  8. #可以自行加多個屏蔽詞,也可直接下載停用詞表格 
  9. stopwords.add("電影"
  10. stopwords.add("一部"
  11. stopwords.add("一個"
  12. stopwords.add("沒有"
  13. stopwords.add("什么"
  14. stopwords.add("有點"
  15. stopwords.add("這部"
  16. stopwords.add("這個"
  17. stopwords.add("不是"
  18. stopwords.add("真的"
  19. stopwords.add("感覺"
  20. stopwords.add("覺得"
  21. stopwords.add("還是"
  22. stopwords.add("特別"
  23. stopwords.add("非常"
  24. stopwords.add("可以"
  25. stopwords.add("因為"
  26. stopwords.add("為了"
  27. stopwords.add("比較"
  28. print (stopwords) 
  29. #設置詞云參數 
  30. #參數分別是指定字體/背景顏色/***的詞的大小,使用給定圖作為背景形狀 
  31. wc =WordCloud(width=1024,height=768,background_color='white'
  32.               mask = backgroud_Image,font_path='C:/Windows/Fonts/simkai.ttf'
  33.               stopwords=stopwords,max_font_size=400, 
  34.               random_state=50) 
  35. #將分詞后數據傳入云圖 
  36. wc.generate_from_text(wl_space_split) 
  37. plt.imshow(wc) 
  38. plt.axis('off')#不顯示坐標軸 
  39. plt.show() 
  40. #保存結果到本地 
  41. wc.to_file(r'xuke_wordcloud.jpg'

03 結語

本文只是做了簡單的數據爬取和分析,主要是用以學習如何進行分詞,詞云和熱力圖,建議大家可以基于此進行練習。(胡蘿卜醬要抽空去看狄仁杰了,開熏)

責任編輯:未麗燕 來源: 經管人學數據分析
相關推薦

2010-07-19 10:05:07

jQuery

2014-03-27 15:57:45

Android組件Activity

2018-03-20 14:40:58

Python爬蟲豆瓣影評

2012-05-10 18:10:35

2012-02-08 13:52:30

云計算

2019-03-01 09:10:59

數據保護備份數據管理

2011-10-21 13:59:48

Java云計算

2012-07-19 09:15:43

CloudStackEucalyptusvCloud Dire

2016-03-30 11:51:55

2016-12-09 09:23:50

android組件Service

2019-06-14 16:25:14

關鍵詞SAP Concur企業

2023-08-07 07:16:33

AMDNavi 31Navi 31 XL

2016-03-17 17:35:15

云容器虛擬化管理Docker

2015-07-17 09:50:16

Carthage優劣比較

2011-06-10 09:44:15

iCloud蘋果

2012-03-26 21:52:07

平臺

2023-04-04 10:54:12

2010-03-12 16:26:35

2016-07-08 14:02:29

云計算

2012-02-09 08:59:09

云計算誤區
點贊
收藏

51CTO技術棧公眾號

亚洲欧美一区二区三区久本道91| 亚洲AV无码成人精品区明星换面| 免费看一级一片| 久久野战av| av成人老司机| 欧美猛少妇色xxxxx| 欧洲成人一区二区| 国产精品theporn动漫| 亚洲伊人伊成久久人综合网| 久久精品视频一区二区| 97久久超碰福利国产精品…| 91视频免费入口| 欧美日韩视频在线播放| 国产一区二区精品久| 亚洲国产视频在线| 欧美一级片免费在线| 成人欧美精品一区二区| 动漫一区在线| 国产一区高清在线| 久久精品2019中文字幕| 艹b视频在线观看| 国产女人在线观看| 一区二区精品| 精品视频在线播放色网色视频| 亚洲乱码日产精品bd在线观看| 国产一区二区波多野结衣 | 电影午夜精品一区二区三区 | 国产精品久久久久久麻豆一区软件| 一本到不卡免费一区二区| 国产精品二区二区三区| 免费在线不卡av| 欧美日韩中文字幕一区二区三区| 91成人网在线| 一区视频二区视频| 91好色先生tv| 裸体一区二区| 中文字幕一区电影| 手机免费av片| 中文在线免费| www.欧美.com| 不卡视频一区二区| 五月天婷婷综合网| 国产剧情一区| 欧美精品一区二| wwwxxx黄色片| 麻豆视频在线观看免费网站| 久久久久亚洲蜜桃| 久久爱av电影| 久久午夜鲁丝片| 国产欧美一区二区三区国产幕精品| 亚洲精品资源美女情侣酒店| 成年人小视频在线观看| 电影亚洲精品噜噜在线观看| 亚洲电影第三页| 国产激情片在线观看| caoporn免费在线| 亚洲三级久久久| www.黄色网址.com| 天天躁日日躁狠狠躁伊人| 日韩va亚洲va欧美va久久| 久久av中文字幕| 成人免费毛片日本片视频| 97成人超碰| 亚洲成a人v欧美综合天堂| 美女三级99| 精品久久久免费视频| 午夜在线精品偷拍| 久久91亚洲精品中文字幕奶水 | 亚洲精品欧美激情| 黑人巨大精品欧美一区二区小视频 | 亚洲欧美日韩国产另类专区 | 播金莲一级淫片aaaaaaa| 天堂久久午夜av| 亚洲观看高清完整版在线观看| 激情成人开心网| 国产精品25p| 亚洲色大成网站www久久九九| 一区二区三区不卡在线| 午夜在线视频免费| 国产一区在线视频| 都市激情久久久久久久久久久| 欧美视频一二区| 极品少妇xxxx精品少妇| 日韩免费在线看| 国产福利久久久| 另类av一区二区| 国产美女被下药99| 狠狠人妻久久久久久综合| 欧美日韩午夜| 久久中文字幕在线| 免费观看一级视频| 久久精品国产清高在天天线| 成人国产在线激情| 国产精品51麻豆cm传媒| 国产在线观看一区二区| 狠狠色综合网站久久久久久久| 精品影院一区| 91免费精品国自产拍在线不卡| 亚洲在线第一页| 一区二区三区日| 成人丝袜视频网| yellow视频在线观看一区二区| 日韩欧美在线观看一区二区| 波多野结衣亚洲一区| av日韩中文字幕| 成人免费在线观看| 国产亚洲污的网站| 欧美视频小说| 黄色网址在线播放| 一区二区欧美在线观看| 波多野结衣与黑人| 日韩欧美一区二区三区在线观看| 欧美一区二区免费视频| 亚洲热在线视频| 麻豆国产精品| 日韩女同互慰一区二区| 国产裸体视频网站| 欧美男男gaytwinkfreevideos| 亚洲精品在线不卡| 麻豆一区二区三区精品视频| 国产一区亚洲| 欧美黑人又粗大| 日本黄色片视频| 国产精品夜夜嗨| 国产精品久久久久av福利动漫| 亚洲黄色一级大片| 成人午夜电影网站| 亚洲欧美一二三| bl视频在线免费观看| 亚欧色一区w666天堂| 中国黄色片一级| 欧美美女视频| 日本高清视频精品| 中文字幕一区二区三区四区视频| 美国毛片一区二区三区| 成人美女免费网站视频| 精品影院一区| 色婷婷精品久久二区二区蜜臀av| 国产人成视频在线观看| 黄色成人精品网站| 99视频日韩| 啪啪免费视频一区| 欧美午夜美女看片| 在线免费观看av的网站| 国产精品1区在线| 亚洲成人久久一区| 国产手机在线观看| 亚洲精品a级片| 国内精品模特av私拍在线观看| 少妇太紧太爽又黄又硬又爽| 日本美女一区二区三区视频| 亚洲在线免费看| 免费av网站在线观看| 欧美精品99久久久**| 中文成人无字幕乱码精品区| 国产真实有声精品录音| 日本高清视频一区| sese一区| 欧美精品少妇一区二区三区| 色哟哟一一国产精品| 国产欧美在线| 欧美日韩电影一区二区| 欧洲一级精品| 日韩一区二区在线视频| 国产特黄大片aaaa毛片| caoporm超碰国产精品| 国产精品333| 亚洲精品大片| 亚洲美女自拍视频| 真实国产乱子伦对白在线| 久久九九免费| 久久久久久网址| 国产成人久久777777| 台湾天天综合人成在线| www.日韩视频| 亚洲欧美高清视频| 中文字幕av一区二区三区免费看 | 国产精品久久精品| 黄色三级网站在线观看| 亚洲动漫第一页| 亚洲精品乱码久久久久久久久久久久| 自拍视频亚洲| 国产精品视频大全| 天堂av在线资源| 亚洲免费在线视频一区 二区| 男人女人拔萝卜视频| 宅男噜噜噜66国产日韩在线观看| 日本视频精品一区| 国产高清日韩| 日本亚洲欧洲色α| 福利在线视频网站| 亚洲女人天堂av| 国产特级黄色片| 中文字幕中文字幕在线一区| 粉嫩虎白女毛片人体| 亚洲欧美网站在线观看| 久久国产精品精品国产色婷婷| 国产精品99精品一区二区三区∴| 久久777国产线看观看精品| 免费观看成年在线视频网站| 婷婷成人综合网| 黄色国产在线视频| 奇米精品一区二区三区四区| 欧美图片激情小说| xxxx日韩| 久久免费视频观看| www日韩tube| 亚洲国模精品一区| 欧美激情亚洲综合| 99精品国产视频| 337p粉嫩大胆噜噜噜鲁| 亚欧洲精品视频在线观看| 欧美一区二区三区…… | 国外成人性视频| 久久五月精品| 91精品国产综合久久久久久漫画| 刘亦菲国产毛片bd| 国模大尺度一区二区三区| av黄色在线网站| 亚洲网站啪啪| 国产麻豆欧美日韩一区| 亚洲欧美日韩不卡| 亚洲最好看的视频| 97精品一区二区视频在线观看| 婷婷在线视频观看| 欧美日本一道本| 久草视频手机在线| 国产一区二区在线看| 日韩精品免费播放| 999国产精品视频| 97碰碰视频| av成人影院在线| 欧美日韩成人在线播放| 欧美69xxx| 最近免费中文字幕视频2019| 国产毛片毛片毛片毛片毛片| 欧美怡红院视频| 国产黄色的视频| 成人精品一区二区三区中文字幕| 99精品视频国产| 国产情侣久久| 欧美一级片免费播放| 欧美精美视频| 免费成人在线观看av| 欧美1区二区| 国产色婷婷国产综合在线理论片a| dj大片免费在线观看| 久久久精品久久久| 草莓福利社区在线| 大胆欧美人体视频| 性欧美ⅴideo另类hd| 亚洲精品一区二区在线| 天堂资源中文在线| 亚洲老板91色精品久久| 欧美女子与性| 中文字幕欧美日韩| 欧美精品hd| 免费99精品国产自在在线| 外国精品视频在线观看| 日韩hd视频在线观看| 一级片在线免费观看视频| 欧美午夜精品一区| 国产一区二区三区三州| 日韩小视频在线观看专区| 亚洲成人av影片| 在线看不卡av| 一级特黄aaa| 日韩午夜三级在线| 欧美自拍偷拍第一页| 日韩久久免费电影| av天在线观看| 日韩毛片在线看| 国产专区在线播放| 日日骚av一区| 男女羞羞视频在线观看| 538国产精品一区二区免费视频| 欧美色网一区| 91精品国产99久久久久久| 老司机福利在线视频| 欧美成人四级hd版| 性xxxxfreexxxxx欧美丶| 久久久噜噜噜久久久| 亚洲精品永久免费视频| 国产日韩欧美综合| 精品国产导航| dy888夜精品国产专区| 欧美亚洲国产日韩| 亚洲精品中文字幕在线| 免费看av成人| 影音先锋男人的网站| 亚洲人成人一区二区三区| wwwjizzjizzcom| 亚洲精品极品少妇16p| 国产精品久久..4399| 蜜臀av性久久久久av蜜臀妖精| 欧美一级片中文字幕| 精品一区免费av| 久久国产这里只有精品| 成人午夜免费av| 国产一二三av| 精品成人国产在线观看男人呻吟| 亚洲天堂中文网| 欧美日韩激情一区二区| 日韩一级片免费| 精品国产一区二区三区久久久 | 人妻一区二区三区免费| 中文字幕久精品免费视频| 欧美sm一区| 欧美一区二区三区……| 免费一级欧美片在线观看网站| 欧美日韩精品久久| 亚洲午夜在线| 蜜臀av性久久久久蜜臀av| 先锋影音久久| 逼特逼视频在线观看| 1区2区3区精品视频| 多男操一女视频| 91国偷自产一区二区开放时间| 亚洲图片欧美日韩| 欧美日韩在线播放一区| 国产孕妇孕交大片孕| 日韩一区二区三区电影在线观看 | 久久不见久久见国语| 僵尸世界大战2 在线播放| 国产一区91精品张津瑜| 色www亚洲国产阿娇yao| 色综合天天综合在线视频| 免费观看毛片网站| 九九热这里只有精品免费看| 永久免费观看精品视频| 亚洲精品高清视频| 日韩电影免费在线| 国产中年熟女高潮大集合| 午夜欧美视频在线观看 | 日本亚洲欧洲无免费码在线| 日韩精品伦理第一区| 色999日韩| 蜜桃网站在线观看| 韩国一区二区在线观看| 日日碰狠狠添天天爽| 亚洲午夜私人影院| 99久久久久久久| 久久国产精品偷| 国产精品欧美一区二区三区不卡| 亚洲毛片aa| 久久精品国产精品青草| 香蕉久久久久久久| 欧美巨大另类极品videosbest | 欧美精品乱码久久久久久| freemovies性欧美| 国产精品一区二区三区久久| 久久性感美女视频| 亚洲综合伊人久久| 综合激情成人伊人| 亚洲AV无码精品国产| 国精产品一区一区三区有限在线| 大奶在线精品| 水蜜桃亚洲一二三四在线| 国产一区清纯| 99re这里只有| 色悠悠久久综合| 98在线视频| 亚洲尤物视频网| 99在线精品视频在线观看| 日韩av在线看免费观看| 在线观看91视频| 国产盗摄在线观看| 国产一区精品在线| 88国产精品视频一区二区三区| 91pony九色| 国产欧美精品一区二区三区四区| 久草视频免费在线| 亚洲国产又黄又爽女人高潮的| 成人性生活视频| 国产自产精品| 久久中文在线| 国产精品无码在线| 一本大道久久精品懂色aⅴ| 97在线观看免费观看高清 | 亚洲精品成a人| 在线免费a视频| 欧美富婆性猛交| 免费看成人吃奶视频在线| 亚洲网中文字幕| 懂色aⅴ精品一区二区三区蜜月| www.狠狠干| 欧美怡春院一区二区三区| 99精品视频在线观看播放| 污污免费在线观看| 欧美亚洲国产一区在线观看网站| 91精品久久久| 日韩欧美精品在线不卡| 国产乱人伦精品一区二区在线观看 | 欧美丝袜丝交足nylons172| 日本久久久精品视频| 国产精品三级在线观看| 中文字幕乱伦视频| 欧美日韩成人在线视频| 国产日韩视频在线| 日本一区二区免费视频|