精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

開(kāi)發(fā) 后端 數(shù)據(jù)分析
獲取數(shù)據(jù),其實(shí)邏輯并不復(fù)雜:爬取歌單列表里的所有歌單url、進(jìn)入每篇歌單爬取所有歌曲url,去重、進(jìn)入每首歌曲首頁(yè)爬取熱評(píng),匯總。

獲取數(shù)據(jù)

其實(shí)邏輯并不復(fù)雜:

  • 爬取歌單列表里的所有歌單url。
  • 進(jìn)入每篇歌單爬取所有歌曲url,去重。
  • 進(jìn)入每首歌曲首頁(yè)爬取熱評(píng),匯總。

歌單列表是這樣的:

 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

翻頁(yè)并觀察它的url變化,注意下方動(dòng)圖,每次翻頁(yè)末尾變化35。 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

采用requests+pyquery來(lái)爬取:

  1. def get_list(): 
  2.  list1 = [] 
  3.  for i in range(0,1295,35): 
  4.  url = 'https://music.163.com/discover/playlist/?order=hot&cat=%E5%8D%8E%E8%AF%AD&limit=35&offset='+str(i) 
  5.  print('已成功采集%i頁(yè)歌單\n' %(i/35+1)) 
  6.  data = [] 
  7.  html = restaurant(url) 
  8.  doc = pq(html) 
  9.  for i in range(1,36): # 一頁(yè)35個(gè)歌單 
  10.  a = doc('#m-pl-container > li:nth-child(' + str(i) +') > div > a').attr('href'
  11.  a1 = 'https://music.163.com/api' + a.replace('?','/detail?'
  12.  data.append(a1) 
  13.  list1.extend(data) 
  14.  time.sleep(5+random.random()) 
  15.  return list1 

這樣我們就可以獲得38頁(yè)每頁(yè)35篇歌單,共1300+篇歌單。

下面我們需要進(jìn)入每篇歌單爬取所有歌曲url,并且要注意最后“去重”,不同歌單可能包含同一首歌曲。

點(diǎn)開(kāi)一篇歌單,注意紅色圈出的id。 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

觀察一下,我們要在每篇歌單下方獲取的信息也就是紅框圈出的這些,利用剛剛爬取到的歌單id和網(wǎng)易云音樂(lè)的api可以構(gòu)造出: 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

不方便看的話我們解析一下json。 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手
  1. def get_playlist(url): 
  2.  data = [] 
  3.  doc = get_json(url) 
  4.  obj=json.loads(doc) 
  5.  jobs=obj['result']['tracks'
  6.  for job in jobs: 
  7.  dic = {} 
  8.  dic['name']=jsonpath.jsonpath(job,'$..name')[0] #歌曲名稱 
  9.  dic['id']=jsonpath.jsonpath(job,'$..id')[0] #歌曲ID 
  10.  data.append(dic) 
  11.  return data  

這樣我們就獲取了所有歌單下的歌曲,記得去重。

  1. #去重 
  2. data = data.drop_duplicates(subset=None, keep='first', inplace=True)  

剩下就是獲取每首歌曲的熱評(píng)了,與前面獲取歌曲類似,也是根據(jù)api構(gòu)造,很容易就找到了。 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手
  1. def get_comments(url,k): 
  2.  data = [] 
  3.  doc = get_json(url) 
  4.  obj=json.loads(doc) 
  5.  jobs=obj['hotComments'
  6.  for job in jobs: 
  7.  dic = {} 
  8.  dic['content']=jsonpath.jsonpath(job,'$..content')[0]  
  9.  dic['time']= stampToTime(jsonpath.jsonpath(job,'$..time')[0]) 
  10.  dic['userId']=jsonpath.jsonpath(job['user'],'$..userId')[0] #用戶ID 
  11.  dic['nickname']=jsonpath.jsonpath(job['user'],'$..nickname')[0]#用戶名 
  12.  dic['likedCount']=jsonpath.jsonpath(job,'$..likedCount')[0]  
  13.  dic['name']= k 
  14.  data.append(dic) 
  15.  return data  

匯總后就獲得了44萬(wàn)條音樂(lè)熱評(píng)數(shù)據(jù)。 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

數(shù)據(jù)分析

清洗填充一下。

  1. def data_cleaning(data): 
  2.  cols = data.columns 
  3.  for col in cols: 
  4.  if data[col].dtype == 'object'
  5.  data[col].fillna('缺失數(shù)據(jù)', inplace = True
  6.  else
  7.  data[col].fillna(0, inplace = True
  8.  return(data) 

按照點(diǎn)贊數(shù)排個(gè)序。

  1. #排序 
  2. df1['likedCount'] = df1['likedCount'].astype('int'
  3. df_2 = df1.sort_values(by="likedCount",ascending=False
  4. df_2.head() 

 Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

再看看哪些熱評(píng)是被復(fù)制粘貼搬來(lái)搬去的。

  1. #排序 
  2. df_line = df.groupby(['content']).count().reset_index().sort_values(by="name",ascending=False
  3. df_line.head() 

 Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

第一個(gè)和第三個(gè)只是末尾有沒(méi)有句號(hào)的區(qū)別,可以歸為一類。這樣的話,重復(fù)次數(shù)最多個(gè)這句話竟然重復(fù)了412次,額~~

看看上熱評(píng)次數(shù)次數(shù)最多的是哪位大神?從他的身上我們能學(xué)到什么經(jīng)驗(yàn)?

  1. df_user = df.groupby(['userId']).count().reset_index().sort_values(by="name",ascending=False
  2. df_user.head() 

按照 user_id 匯總一下,排序。 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

成功“捕獲”一枚“段子手”,上熱評(píng)次數(shù)高達(dá)347,我們?cè)倏纯催@位大神究竟都評(píng)論些什么?

  1. df_user_max = df.loc[(df['userId'] == 101***770)] 
  2. df_user_max.head() 

 Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

這位“失眠的陳先生”看來(lái)各種情話嫻熟于手啊,下面就以他舉例來(lái)看看如何成為網(wǎng)易云音樂(lè)評(píng)論里的熱評(píng)段子手吧。

數(shù)據(jù)可視化

先看看這347條評(píng)論的贊數(shù)分布。

  1. #贊數(shù)分布圖 
  2. import matplotlib.pyplot as plt 
  3. data = df_user_max['likedCount'
  4. #data.to_csv("df_user_max.csv", index_label="index_label",encoding='utf-8-sig'
  5. plt.hist(data,100,normed=True,facecolor='g',alpha=0.9) 
  6. plt.show() 

 Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

很明顯,贊數(shù)并不多,大部分都在500贊之內(nèi),幾百贊卻能躋身熱評(píng),這也側(cè)面說(shuō)明了這些歌曲是比較小眾的,看來(lái)是經(jīng)常在新歌區(qū)廣撒網(wǎng)。

我們使用len() 求出每條評(píng)論的字符串長(zhǎng)度,再畫(huà)個(gè)分布圖: 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手

評(píng)論的字?jǐn)?shù)集中在18—30字之間,這說(shuō)明在留言時(shí)要注意字?jǐn)?shù),保險(xiǎn)的做法是不要太長(zhǎng)讓人讀不下去,也不要太短以免不夠經(jīng)典。

做個(gè)詞云。 

Python爬蟲(chóng)44萬(wàn)條數(shù)據(jù)揭秘:如何成為網(wǎng)易音樂(lè)評(píng)論區(qū)的網(wǎng)紅段子手 

 

責(zé)任編輯:未麗燕 來(lái)源: 今日頭條
相關(guān)推薦

2018-08-27 07:01:33

數(shù)據(jù)分析數(shù)據(jù)可視化租房

2019-07-16 08:51:03

熱搜新浪微博數(shù)據(jù)

2025-09-01 01:45:00

數(shù)據(jù)虛擬列表

2018-07-22 15:57:00

數(shù)據(jù)可視化大數(shù)據(jù)數(shù)據(jù)分析

2011-03-31 11:24:14

數(shù)據(jù)搜索本文字段

2021-11-02 14:46:50

數(shù)據(jù)

2023-10-19 15:13:25

2019-11-28 18:54:50

數(shù)據(jù)庫(kù)黑客軟件

2022-06-17 10:15:35

面試API前端

2022-04-28 20:12:44

二分法搜索算法

2024-04-09 07:56:36

MySQL數(shù)據(jù)性能

2017-07-22 22:11:36

數(shù)據(jù)丟失操作

2018-07-09 16:21:17

網(wǎng)易云

2024-05-11 12:34:51

EasyExcelOOM代碼

2022-10-27 21:32:28

數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心

2025-11-11 07:10:00

架構(gòu)消息開(kāi)發(fā)

2023-06-12 07:44:21

大數(shù)據(jù)數(shù)據(jù)治理

2013-03-04 10:57:01

網(wǎng)易云音樂(lè)

2018-09-13 09:39:03

騰訊運(yùn)維IT

2014-01-21 17:36:58

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

做爰视频毛片视频| av2014天堂网| 国产理论电影在线| 99久久精品国产一区二区三区| 97色在线播放视频| 精品无码在线观看| 午夜久久av| 欧美日韩视频免费播放| 亚洲精品高清国产一线久久| 亚洲第一大网站| 日韩黄色小视频| 欧美成人中文字幕在线| 日韩aaaaa| 四虎成人精品一区二区免费网站| 亚洲成人精品影院| 亚洲制服欧美久久| 手机av在线免费观看| 加勒比av一区二区| 4438全国亚洲精品在线观看视频| 男人晚上看的视频| 图片婷婷一区| 日韩欧美在线1卡| 蜜桃免费在线视频| 亚洲精品88| 一区二区成人在线观看| 先锋在线资源一区二区三区| 日本黄色不卡视频| 国产一区二区免费在线| 国产精品电影一区| aaa人片在线| 精品成人国产| 成年人精品视频| 亚欧精品视频一区二区三区| 一道在线中文一区二区三区| 精品久久久三级丝袜| 欧美日韩精品区别| 日本国产一区| 在线观看免费视频综合| 黄色一级在线视频| 毛片大全在线观看| 亚洲乱码中文字幕综合| 亚洲一区二三| 粉嫩av在线播放| 国产亚洲欧美日韩在线一区| 欧美成人一区二区在线| 色婷婷av一区二区三| 成人深夜视频在线观看| 成人av中文| 性中国古装videossex| 国产精品亚洲一区二区三区妖精| 成人免费网视频| 一级黄色片在线看| 久久99精品一区二区三区三区| 国产精品日韩在线| 中文字幕男人天堂| 免费av成人在线| 国产精品一区=区| 夜夜躁很很躁日日躁麻豆| 青青草国产成人99久久| 国产精品视频久久久久| 亚洲熟妇av乱码在线观看| 麻豆成人91精品二区三区| 国产精品丝袜久久久久久不卡| 中文有码在线播放| 手机看片一区二区三区| 国产成人手机高清在线观看网站| 亚洲精品视频网上网址在线观看 | 天堂va在线| 一区二区三区在线免费观看 | 鲁大师影院一区二区三区| 欧美与欧洲交xxxx免费观看 | 久久99精品久久久久子伦| 色噜噜一区二区三区| 久久精品亚洲精品国产欧美| 亚洲精品乱码视频| 爆操欧美美女| 亚洲午夜日本在线观看| 午夜肉伦伦影院| 欧美色网在线| 日韩欧美一区二区三区在线| 亚洲观看黄色网| 成人情趣视频网站| 欧美成人激情视频免费观看| 日本一级一片免费视频| 日韩成人av影视| 亚洲xxxxx电影| 天堂中文在线看| 国产精品三级电影| 国产精品69久久久| 欧洲精品一区二区三区| 日韩欧美的一区二区| 真人bbbbbbbbb毛片| 成人羞羞视频播放网站| 欧美成年人网站| 男人天堂视频在线| 国产成人免费视| 日韩精品大片| 国产极品人妖在线观看| 欧美性一级生活| 成人做爰69片免费| 精品一区二区三区中文字幕老牛| 操日韩av在线电影| 69亚洲精品久久久蜜桃小说| 国产美女主播视频一区| 欧美亚洲另类久久综合| a级影片在线观看| 色欧美日韩亚洲| 香蕉视频在线观看黄| 精品在线手机视频| 欧美激情极品视频| 一级淫片免费看| 久久综合久久综合亚洲| 91国在线高清视频| 123成人网| 日韩不卡中文字幕| 麻豆chinese极品少妇| 日av在线不卡| 蜜桃视频在线观看91| 日本一本在线免费福利| 欧美日韩一本到| 一级黄色性视频| 一区二区福利| 国产区二精品视| 中文字幕资源网在线观看| 欧美日韩精品二区第二页| 在线观看日韩精品视频| 激情亚洲成人| 91视频在线免费观看| 日本www在线观看视频| 日韩欧美精品网站| 精品无码国产一区二区三区51安| 国产精品v日韩精品v欧美精品网站| 国产精品v片在线观看不卡| 午夜影院免费视频| 亚洲午夜视频在线| 亚洲免费观看在线| 亚洲小说欧美另类社区| 99九九视频| 18加网站在线| 欧美成人r级一区二区三区| 国产极品国产极品| 国产自产高清不卡| 老司机av福利| xxxx国产视频| 亚洲男人天堂网址| 美国十次了思思久久精品导航 | 亚洲免费观看高清完整版在线观看 | 国精产品一区二区三区| 鲁大师成人一区二区三区| 蜜桃免费一区二区三区| 欧美极品影院| 正在播放国产一区| 一区二区三区黄| 成人免费视频在线观看| 深爱五月综合网| 国产中文一区| 精品国产乱码久久久久久88av| a√中文在线观看| 日韩电影在线观看永久视频免费网站| 国产又色又爽又黄的| 91蜜桃婷婷狠狠久久综合9色| 男女激情无遮挡| 伊人成综合网yiren22| 国产成+人+综合+亚洲欧洲| 国产永久av在线| 欧美美女直播网站| 午夜精品一区二区三区视频| 国产精品一区二区三区乱码| 日韩精品综合在线| 久久99精品久久久久久园产越南| 国产极品jizzhd欧美| 毛片在线不卡| 亚洲成色999久久网站| 99热只有这里有精品| 欧美激情一区二区三区不卡| 黄色三级视频在线播放| 最新国产拍偷乱拍精品| 欧美激情专区| 国产精一区二区| 国内精品小视频| 丁香婷婷在线| 日韩午夜电影在线观看| 少妇一级淫片免费放中国| 国产人成亚洲第一网站在线播放| 九九九九九伊人| 亚洲韩日在线| 亚洲一区三区电影在线观看| av一级亚洲| 国产精品久久久久久五月尺| 91国内在线| 亚洲香蕉伊综合在人在线视看| 国产精品无码天天爽视频| 午夜视频在线观看一区| 日本理论中文字幕| 国产成人av福利| 日韩欧美在线免费观看视频| 欧美日韩中文| 亚洲精品中文字幕在线| 卡一精品卡二卡三网站乱码| 国产综合色香蕉精品| 手机在线理论片| 欧美精品午夜视频| 爱久久·www| 亚洲国内精品在线| 国产毛片久久久久| 色综合天天综合网天天看片| 韩国一级黄色录像| 久久精品夜夜夜夜久久| 无码人妻精品一区二区三区99不卡| 三级不卡在线观看| www.射射射| 一本一道久久a久久精品蜜桃| 欧美一区二区三区在线免费观看| 99这里只有精品视频| 国产日韩欧美综合| 电影一区二区三区| 国产69精品久久久久99| 黄色一级片在线观看| 亚洲午夜未删减在线观看| 香蕉人妻av久久久久天天| 日韩午夜激情免费电影| 国产一区二区三区黄片| 在线影院国内精品| www.伊人久久| 天天射综合影视| 久久在线视频精品| 亚洲美女视频在线| 婷婷丁香综合网| 欧美激情一区二区三区不卡| 日韩精品电影一区二区| 2022国产精品视频| 国产精品伦子伦| 不卡电影一区二区三区| 中文字幕99页| 成人深夜视频在线观看| 农村末发育av片一区二区| 国产乱码精品1区2区3区| 不用播放器的免费av| 久久国产综合精品| 欧美精品久久久久久久久25p| 青椒成人免费视频| 五月天婷婷激情视频| 青青青爽久久午夜综合久久午夜| 国产一级不卡毛片| 青青国产91久久久久久| 蜜臀av免费观看| 久久66热re国产| 欧美又黄又嫩大片a级| 国产精品资源在线看| 日批视频在线看| 国产a区久久久| 美女黄色一级视频| 97se亚洲国产综合自在线不卡| 第四色在线视频| 久久婷婷国产综合国色天香 | 性生活三级视频| 日韩欧美国产综合| 狠狠躁日日躁夜夜躁av| 亚洲国产精品久久| 日韩在线免费看| 怡红院精品视频| 成人日日夜夜| 久久久久亚洲精品成人网小说| 国产无遮挡裸体视频在线观看| 97视频在线观看免费高清完整版在线观看 | 国产裸体舞一区二区三区| 久久九九国产| 国产成人美女视频| 成人在线视频一区二区| 亚洲第一黄色网址| 国产欧美精品国产国产专区| 少妇高潮在线观看| 亚洲一区二区三区免费视频| 免费黄色网址在线| 欧美日本免费一区二区三区| 性生活免费网站| 亚洲网址你懂得| 亚洲丝袜精品| 欧美专区第一页| 国产精品久久久久久av公交车| 鬼打鬼之黄金道士1992林正英| 国产99亚洲| 一本色道久久88亚洲精品综合| 99riav国产精品| 极品粉嫩美女露脸啪啪| 大胆亚洲人体视频| www色com| 亚洲成va人在线观看| 欧美 亚洲 另类 激情 另类| 欧美一级夜夜爽| 高h视频在线| 久久久久久久久久久av| 日本一区免费网站| 成人av电影免费| 日韩免费在线| 成人性免费视频| 国产专区综合网| 免费黄色在线视频| 一区二区三区精品久久久| 精品国产xxx| 日韩你懂的在线观看| 99riav在线| 国产91成人在在线播放| 国产精品一区二区美女视频免费看| 免费h精品视频在线播放| 欧美va天堂在线| 亚洲欧美自偷自拍另类| 99国产精品国产精品久久| 看黄色录像一级片| 一本色道久久综合亚洲aⅴ蜜桃| va视频在线观看| 宅男66日本亚洲欧美视频| free性护士videos欧美| 亚洲一区二区三区成人在线视频精品 | 欧美影视一区二区| 亚洲高清在线| 精品无码av一区二区三区不卡| 中文字幕av一区二区三区| 毛片视频网站在线观看| 亚洲第一视频网| 在线看三级电影| 成人综合网网址| 成人看的视频| 久久久精品麻豆| 高清一区二区三区| 欧美精品久久久久久久久老牛影院 | 黄网页在线观看| 国产精品日日做人人爱| 久久不见久久见免费视频7| 国产玉足脚交久久欧美| 国产福利电影一区二区三区| 免费成人深夜夜行网站| 精品污污网站免费看| 成人18在线| 日韩免费观看网站| 亚洲+小说+欧美+激情+另类| 成年人看的毛片| 国产成人自拍高清视频在线免费播放| 波兰性xxxxx极品hd| 欧美日韩一区视频| 天堂аⅴ在线地址8| 国产精品久久色| 日韩国产一区| 亚洲小视频网站| 国产精品美女久久久久aⅴ国产馆| 欧美一级黄视频| 伊人久久久久久久久久久久久 | 亚洲自拍偷拍福利| 小说区亚洲自拍另类图片专区| 日本免费色视频| 亚洲色图欧美激情| 国产视频在线观看视频| 美女av一区二区| 超碰97久久| 黄色网页免费在线观看| 久久综合狠狠综合久久综合88| 日韩精品久久久久久免费| 亚洲天堂精品在线| 成人a在线观看高清电影| 一区二区三区免费看| 国产一区在线精品| 豆国产97在线 | 亚洲| 亚洲精品久久久久久下一站| 色是在线视频| 神马影院我不卡| 国产一区二区三区在线观看免费| 青春草免费视频| 亚洲精品狠狠操| 精品久久在线| 男女日批视频在线观看| 久久综合久久综合九色| 中文字幕在线观看欧美| 久久成人人人人精品欧| 国产伦乱精品| 黄色一级免费大片| 亚洲视频每日更新| 亚洲AV成人无码一二三区在线| 国产精品xxxxx| 欧美在线二区| 免费中文字幕av| 4438成人网| 欧美xo影院| 米仓穗香在线观看| 久久婷婷久久一区二区三区| 国产又大又粗又硬| 91高潮精品免费porn| 亚洲啊v在线观看| 久久久久久久久免费看无码 | 亚洲不卡免费视频| 全亚洲最色的网站在线观看| 久久精品国产亚洲夜色av网站| 一二三区视频在线观看| 欧美主播一区二区三区| 青青草视频在线免费直播| 日韩福利视频| 国产.欧美.日韩| 一级做a爰片久久毛片16| 97在线观看视频| 综合天天久久| 一级特黄曰皮片视频|