精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

新聞聯播也可以拿來做數據分析?

大數據 數據分析
今天從一個極簡角度,給大家展示如何利用文本數據做點有意思的統計,并通過可視化工具展示出來,希望對大家有所幫助。

在Tushare Pro數據開放平臺上,最近上線了近10年CCTV新聞聯播文本數據,以及各大財經網站的即時資訊文本。

很多用戶表示出了比較高的興趣,紛紛要求開通權限獲取數據。也有一些用戶看到這種文本類型的非結構化數據,表示一臉懵逼兩眼茫然。

今天從一個極簡角度,給大家展示如何利用文本數據做點有意思的統計,并通過可視化工具展示出來,希望對大家有所幫助。

數據準備

獲取近10年的新聞聯播文本有兩個方法,一是自己寫爬蟲,將CCTV網站的新聞聯播網頁爬取下來,二是通過Tushare SDK的API免費獲取數據。

如果是自己爬,好處是可以鍛煉自己的爬蟲編程能力,磨練自己被可能不統一的網頁格式虐心千百遍還不砸電腦的心態意志。

壞處是爬數據,清洗數據確實浪費時間,搞不好真有可能費電腦。

當然如果直接通過Tushare SDK調取數據,只需要一行代碼即可獲取到格式統一的數據。

df = pro.cctv_news(date='20181222')

數據格式效果如下

如果要獲取其他新聞資訊,也很簡單:

df = pro.news(src='sina', start_date='20181223', end_date='20181224')

新聞源目前支持如下:

?新聞聯播也可以拿來做數據分析??

獲取獲取后,可以存csv也可以存Excel,或者存數據庫都可以,這樣就完成了原始數據準備。

分詞處理

借助Python jieba分詞工具,我們可以快速的實現文本的分詞功能。同時可以設置關鍵字黑名單和白名單,過濾不需要的,提取想要的關鍵詞。

import jieba

#過濾關鍵詞
blacklist = ['責任編輯', '一定','一年', '一起', '一項', '一點兒', '一度','一系列','一道','一次','一億','進行', '實現', '已經', '指出',
'為什么', '是不是', '”', '一個', '一些', 'cctv', '一邊', '一部', '一致', '一窗', '萬億元', '億元', '一致同意', '本臺記住', '發生',
'上述', '不僅', '不再 ', '下去', '首次', '合作', '發展', '國家', '加強', '共同', '重要', '我們', '你們', '他們', '目前',
'領導人', '推進', '中方', '堅持', '支持', '表示', '時間', '協調', '時間', '制度', '工作', '強調', '進行', '推動', '通過',
'北京時間', '有沒有', '新聞聯播', '本臺消息', '這個', '那個', '就是', '今天', '明天', '參加', '今年', '明天']

#新增關鍵詞
stopwords = ['一帶一路', '雄安新區', '區塊鏈', '數字貨幣', '虛擬貨幣', '比特幣', '對沖基金', '自貿區', '自由貿易區','鄉村振興','美麗中國','共享經濟','租購同權','新零售',
'共有產權房','樓市調控', '產權保護', '互聯網金融', '5G', '4G', '國企改革', '大灣區', '長江經濟帶']

for word in stopwords:
jieba.add_word(word)

df = pd.read_csv(file, encoding='utf8')
list = []
df = df[df.content.isnull() == False]

for idx, row in df.iterrows():
data = jieba.cut(row['content'])
data = dict(Counter(data))

df = pd.DataFrame(list, columns=['date', 'keyword', 'count'])

按日期處理分詞之后,我們可以對詞頻進行統計,生成一個完整的詞頻csv文件。

為了讓大家更好地完成本次實驗,我們直接提供已經完成統計的csv文件供大家下載,請在文章末尾獲取下載方式。

詞頻統計分析

新聞詞云統計

對于具有影響力的新聞節目,可能很多人先想到的是哪些關鍵詞出現的次數最多?對于常見新聞詞語,一定逃不出你的預料之中,下面這個詞云圖可以驗證你的判斷。

??

實現詞云非常方便,前提是你已經準備好了詞頻統計。幸運的是,我們為你提供了現成的詞云統計csv文件,在下載的文件中可以找到一個all.csv的文件。

from pyecharts import WordCloud

all = pd.read_csv('all.csv', encoding='utf8')
name = list(all.head(80)['keyword'].values)
val = list(all.head(80)['count'].values)
wordcloud = WordCloud(width=1300, height=620)
wordcloud.add("", name, val, word_size_range=[20, 100])
wordcloud.render('')

正如你所看到的,我們借助了pyecharts這個工具來實現可視化。以下所有圖形效果都是借助pyecharts來實現的,更多具體的使用可以自行學習echarts和pyecharts的知識來加強圖形制作能力,這里不做太多的介紹。

新聞分類統計

除了新聞聯播常見關鍵詞,我們可能還想知道一些特定詞語出現在新聞聯播的次數,以便了解該類信息受關照程度,比如在過去10年當中,哪些省份和省會城市最受新聞聯播關注?

我們將各省在新聞聯播出現的數據進行分年統計,然后通過柱狀圖的形式展示出來。

from pyecharts import Bar


pro_data = pd.read_csv('pro_count_list.csv', encoding='utf8')
bar = Bar("", width=1000, height=500)
ps = pro_data.groupby(['key', 'year']).sum().reset_index()
attr = list(ps['key'].drop_duplicates().values)

for x in range(2009, 2019):
val = ps[ps.year == x]
val = list(val['count'].values)
bar.add(str(x), attr, val, is_stack=True, xaxis_interval=0, xaxis_rotate=60, yaxis_rotate=30)

bar.render('')

 

?新聞聯播也可以拿來做數據分析??

通過上圖我們可以知道,作為首都的北京毫無疑問是關注最多的地方。而在每年因為不同的政治、經濟或者文化事件,不同的省出現的頻次也呈現出一些差異。

比如2018年在政策上對海南的傾斜,對珠三角的關注等,而在2017年香港回歸20年,河北雄安新區的提出等事件,讓這些地方備受關注。

同樣的方法,我們也可以對各省會城市出現的頻次進行按年份統計。

?新聞聯播也可以拿來做數據分析??

可以清楚的看到,在2009年烏魯木齊因暴恐事件受到了極大的新聞關注,而??谠诮鼉赡觊_放海南的大背景下也成了新聞聯播的常客。

如果柱狀圖看的不夠清晰,我們可以借助地圖熱力方式來顯示各省收關注程度可能更清楚。

from pyecharts import Map


pros = pro_data.groupby(['key'])['count'].sum().reset_index()
pros['count'] = pros['count']/10
pro_att = list(pros['key'].values)
pro_val = list(pros['count'].values)
map = Map("近十年新聞聯播提到各省的頻次", width=1200, height=600)

map.add(
"",
pro_att,
pro_val,
maptype="china",
is_visualmap=True,
visual_text_color="#000",
)

map.render('')

 

 

?新聞聯播也可以拿來做數據分析??

在熱力地圖上,顏色越深表示受關注越大,我們看到北京最紅,而東部沿海比西部,東北要比內蒙受關注更多。

如果想要了解各地級市或者縣級在新聞聯播出現的次數,我們同樣可以借助地圖效果來展示,通過散點效果可以大致看出在新聞聯播出現的情況。

?新聞聯播也可以拿來做數據分析??

新聞占比統計

可能有些人很想了解哪些大學在新聞聯播出現的次數最多,就像北京被關注最多一樣,北京的清華北大應該也是關注最多的?

我們來通過數據統計,根據排名前30位的占比來分析一下。

from pyecharts import Pie


dx = pd.read_csv('d:\\cctv_done\\u.csv', encoding='utf8')
dx = dx.head(30)
attr = list(dx['key'].values)
val = list(dx['count'].values)
pie = Pie("近十年新聞聯播提到的大學頻次", title_pos='center')
pie.add("", attr, val, is_label_show=True, is_legend_show=False)
pie.render()

 

?新聞聯播也可以拿來做數據分析??

我們對清華、北大、人大等知名大學的排名可能并不會覺得奇怪,但在受關注度排名前30的大學中,發現了一所國外的大學,那就是莫斯科大學,在接近10年的歷史里,總共提到了31次。

而在與世界各國的往來方面,我們同樣可以借助上述的方法,統計出各國在新聞聯播出現的次數來得到體現。

?新聞聯播也可以拿來做數據分析??

正如我們所知,中國與美國的關系是中國外交關系最緊密的,而中俄,中日關系也是非常重要。但同時我們也看到,諸如敘利亞、伊朗、朝鮮、伊拉克、巴基斯坦等戰亂和動蕩的國家讓世界人民也讓中國人民操碎了心。

新聞分時統計

在國際關系方面,我們從上面各國出現在新聞聯播的次數基本上得到了體現,但從每年的關注情況方面,我們可以通過折線圖更加清楚的了解到一些細節。

from pyecharts import Line


cdss = ctdf_all.head(10)
attr = [str(year) for year in range(2009, 2019)]
line = Line("")

for ckey in cdss['key'].values:
val = ctdfs[ctdfs.key == ckey]['count'].values
line.add(ckey, attr, val, is_smooth=True)

line.render()

 

?新聞聯播也可以拿來做數據分析??

從分時圖可以看出,美國、俄羅斯出現在新聞聯播出現的頻次一直很高,而且近年呈上升趨勢,而日本在2015年以后,提到的次數越來越少,反映出與日本的關系的變化。

在其他新聞和經濟熱詞方面,我們也進行了一些檢驗,比如人工智能、智能制造和5G等近年來越來越多的被提到,而在提到“金融風險”的次數也伴隨提及“金融”二字出現的越來越多。

另外,我們也跟蹤了一帶一路、自貿區、雄安新區等熱詞的頻次,比如雄安新區,在2017年4月1日首次出現之后,也是經常出現在新聞聯播里,通常快要到事件或概念提出的周年的時候,出現的頻次會更多。

?新聞聯播也可以拿來做數據分析??

總結

對于新聞等非結構化數據的統計分析,是一個很有意思的過程,也許你會發現一些意外的驚喜。尤其是結合互聯網社區的數據,比如微信微博等,可以從中挖掘出很有價值的信息。

本次實驗過程只是一個簡單的開始,還有很多更值得分析的角度和方法,只為拋磚引玉,希望對大家有所助益。

 

責任編輯:未麗燕 來源: 挖地兔
相關推薦

2015-01-07 09:57:20

2015-04-13 09:15:56

新聞聯播阿里云

2009-06-30 19:26:12

云計算虛擬服務器

2020-02-11 19:43:37

云辦公銳捷

2009-05-13 09:02:37

2020-05-15 15:09:51

R語言數據分析

2016-12-01 14:56:18

數據可視化

2023-05-26 07:50:17

數據分析師BI工具

2023-12-29 10:04:47

數據分析

2019-10-14 15:57:36

數據分析多維度二八法

2015-09-25 09:25:34

數據分析

2020-02-13 17:15:25

藍信

2020-07-22 07:49:14

數據分析技術IT

2024-12-29 19:36:04

2016-09-30 01:04:45

數據分析數據

2018-05-18 09:18:00

數據分析報告數據收集
點贊
收藏

51CTO技術棧公眾號

久久精品在这里| 天堂91在线| 欧美日韩破处| 欧美日韩国产精品一区二区不卡中文 | 国产精品333| 污视频网站免费观看| 欧美高清视频在线观看mv| 91精品国产入口| 波多野结衣与黑人| 好吊色在线观看| **女人18毛片一区二区| 欧美成人精品1314www| 草草草视频在线观看| 高潮无码精品色欲av午夜福利| 成人免费在线观看av| 欧美一二三在线| 欧美牲交a欧美牲交| 国产三级视频在线播放| 影音先锋亚洲一区| 91精品国产综合久久久蜜臀粉嫩 | 91精品国产自产在线丝袜啪| 欧美日韩精品国产| 一区二区三区在线观看www| 丰满人妻av一区二区三区| 欧美在线综合| 久久久精品日本| 国产亚洲无码精品| 性欧美gay| 99re6这里只有精品视频在线观看 99re8在线精品视频免费播放 | 不卡大黄网站免费看| 97国产精品视频| 久久免费手机视频| 激情小说亚洲图片| 亚洲一区二区三区在线播放| 美乳视频一区二区| av网站在线免费看| 日韩成人午夜精品| 97超级碰碰碰久久久| 日本少妇高潮喷水xxxxxxx| 川上优av中文字幕一区二区| 粉嫩在线一区二区三区视频| 国产精品成人在线| 少妇按摩一区二区三区| 精品一区二区三区四区五区 | 一本色道久久综合亚洲精品小说 | 色偷偷91综合久久噜噜| 毛片一区二区三区四区| 免费在线看v| 日韩高清电影一区| 亚洲女人被黑人巨大进入| 国产探花在线观看视频| 日韩大片欧美大片| 亚洲午夜免费电影| 国产伦视频一区二区三区| 999视频在线| 综合av在线| 中文字幕日韩免费视频| wwwwwxxxx日本| 爱草tv视频在线观看992| 9l国产精品久久久久麻豆| 成人天堂噜噜噜| 中文字幕+乱码+中文乱码www| 亚洲一区免费| 国产一区二区三区久久精品| 亚洲 激情 在线| 国产最新在线| 成人综合婷婷国产精品久久蜜臀| 欧美肥婆姓交大片| 懂色av懂色av粉嫩av| 999国产精品视频| 中文字幕欧美在线| 538精品视频| 欧美日本三级| 欧美一区二区视频在线观看| 亚洲天堂av一区二区| 日本一区免费网站| 一区二区三区日韩精品视频| 久久综合九色综合网站| 色婷婷综合视频| 日本不卡中文字幕| 欧美黑人国产人伦爽爽爽| 日本青青草视频| 日韩精品成人在线观看| 欧美日韩国产成人在线91| 香港三级日本三级a视频| 污污网站在线看| 国产日本欧洲亚洲| 色噜噜狠狠色综合网| 淫片在线观看| 亚洲日穴在线视频| 国产成人免费高清视频| 七七成人影院| 中文字幕在线一区| 麻豆成人小视频| 国产精品视频无码| 国产盗摄一区二区三区| 国产精品久久久久久久一区探花| 久久99久国产精品黄毛片色诱| 亚洲一区二区久久| 亚洲精品乱码久久久久久蜜桃欧美| 999国产精品一区| 亚洲国产97在线精品一区| 中文字幕一区二区三区人妻不卡| 日本午夜精品久久久久| 精品久久久久久| 国产福利片一区二区| 最新超碰在线| 精品久久久久久久久中文字幕| 黄www在线观看| 欧美黄色网络| 色婷婷久久久久swag精品| 深夜黄色小视频| 欧美7777| 91麻豆精品国产综合久久久久久| aaa毛片在线观看| 欧美成人福利| 在线观看网站黄不卡| 国产欧美精品一二三| 老牛国内精品亚洲成av人片| 欧美在线视频你懂得| 婷婷无套内射影院| 久久人人视频| 亚洲国产精品资源| 亚洲色图27p| 99精品热视频只有精品10| 欧美日本高清一区| 久久久久久久久久网站| 免费欧美日韩| 日本国产精品视频| 在线视频一区二区三区四区| 国产米奇在线777精品观看| 成人在线小视频| 秋霞欧美在线观看| 国产欧美一区二区精品仙草咪 | 久久久久久香蕉| 欧美午夜在线播放| 亚洲欧美三级在线| 四虎国产精品成人免费入口| 国产精品va| 91精品国产综合久久香蕉的用户体验 | 污污视频在线免费看| 中文字幕日韩欧美一区二区三区| 激情综合在线观看| 日韩中文字幕无砖| 日韩在线视频一区| 高潮毛片又色又爽免费| 极品销魂美女一区二区三区| 亚洲精品欧美一区二区三区| 玖玖综合伊人| 精品福利一区二区| 国产吃瓜黑料一区二区| 国产精品黑丝在线播放| 色综合天天狠天天透天天伊人| 最近国语视频在线观看免费播放| 99国内精品久久| 色999五月色| 高清av在线| 狠狠久久五月精品中文字幕| 日本69式三人交| 亚洲午夜av| av成人综合网| av免费看在线| 欧美一级国产精品| 强行糟蹋人妻hd中文| 久久国产剧场电影| 99re热精品| 三级在线电影| 国产精品不卡视频| 人人妻人人做人人爽| 日本精品在线观看| 日韩av在线网站| 国产精品白浆一区二小说| 国产精品一卡二| 日本一级黄视频| 成人软件在线观看| 亚洲欧美成人精品| 波多野结衣黄色| 成人午夜激情影院| 今天免费高清在线观看国语| 偷拍自拍在线看| 亚洲美女av在线播放| 五月婷婷丁香在线| 中日韩免费视频中文字幕| 一道本在线免费视频| 91精品亚洲| 成人欧美一区二区| 成入视频在线观看| 亚洲欧美精品一区| 中文亚洲av片在线观看| 中文字幕亚洲区| 亚洲三级在线视频| 亚洲经典在线| 成人www视频在线观看| 黄视频网站在线| 色激情天天射综合网| 亚洲黄色网址大全| 国产精品原创巨作av| 日韩高清av| 亚洲一区有码| 亚洲欧美制服另类日韩| 欧美另类视频在线观看| 蜜臀av性久久久久蜜臀aⅴ| 波多野结衣三级在线| 欧洲亚洲视频| 国产欧美一区二区三区四区 | 国产成人午夜性a一级毛片| 亚洲第一福利网站| av黄色在线播放| 国产999精品久久久久久绿帽| 免费观看国产成人| 黄网站在线观| 亚洲老头老太hd| 国产在线免费视频| 国产午夜精品福利| 色婷婷狠狠18禁久久| 欧美激情第10页| 国产日本欧美一区| 丁香高清在线观看完整电影视频| 欧美一区二区私人影院日本| 国产精品999在线观看| 粉嫩av一区二区三区粉嫩| 国产91对白刺激露脸在线观看| 欧美wwwww| 久久国产精品久久| 黄色aa久久| 日韩在线观看成人| 亚洲成人中文字幕在线| 一本大道久久精品懂色aⅴ| 天海翼在线视频| www国产成人免费观看视频 深夜成人网| www.99r| 国产精品成人av| 欧美人与性禽动交精品| 亚洲不卡在线| 久久久久久网站| 手机看片一区二区三区| 欧美精品1区2区3区| 怡红院一区二区三区| 麻豆免费精品视频| 国产精品宾馆在线精品酒店| 欧美99在线视频观看| 午夜欧美性电影| 亚洲制服一区| 久久精品久久精品国产大片| 亚洲v.com| 国产午夜精品免费一区二区三区| 亚洲乱码精品久久久久..| 午夜免费久久看| 国产这里有精品| 国产日韩精品一区二区浪潮av| 日本美女视频网站| 在线观看视频日韩| 日本一区二区精品| 午夜先锋成人动漫在线| 国产欧美日韩伦理| 9l亚洲国产成人精品一区二三| 午夜精品理论片| 午夜av在线免费观看| 精品视频在线观看日韩| 欧美一区二区三区激情| 日韩欧美一级在线播放| 久久艹免费视频| 欧美国产97人人爽人人喊| 亚洲欧美色图视频| 久久99精品国产麻豆婷婷 | h片在线观看视频免费免费| 久久99国产精品自在自在app| 黄色国产网站在线播放| 在线观看国产精品日韩av| 日本高清视频免费观看| 欧美伊人久久大香线蕉综合69| 亚洲天堂视频网站| 色哟哟在线观看一区二区三区| 亚洲精品中文字幕乱码三区91| 狠狠躁18三区二区一区| 国产wwwwxxxx| 99精品国产91久久久久久| 情侣黄网站免费看| 这里只有精品在线| 日韩精品在在线一区二区中文| 国产高清精品二区| 国产成人在线亚洲欧美| 在线播放免费av| 欧美精品18videosex性欧美| 成人在线免费看| 亚洲国产三级网| 毛片网站在线| 中文字幕亚洲二区| 国产一二三区在线观看| 亚洲午夜国产成人av电影男同| 97人妻精品一区二区三区| 欧美性xxxxxx| 国产无套粉嫩白浆内谢| 狠狠躁夜夜躁人人躁婷婷91| 亚洲综合成人av| 日韩三级在线观看| 亚洲字幕av一区二区三区四区| 欧美一区二区视频在线观看| 免费av一级片| 亚洲人成人99网站| 美女国产在线| 亚洲欧美自拍一区| 色窝窝无码一区二区三区| 亚洲美女性视频| 久热国产在线| 97不卡在线视频| 成人黄色动漫| 91精品久久久久久久久久| 成人在线黄色| 99久久国产免费免费| 日韩午夜视频在线| 国产精品青青草| 草草视频在线一区二区| 国产一区再线| 日本天堂一区| 国产综合av一区二区三区| 欧美日韩国产高清电影| 日韩欧美手机在线| 欧美成人tv| 熟女人妇 成熟妇女系列视频| 亚洲主播在线| 永久免费黄色片| 加勒比av一区二区| 香蕉网在线播放| 久久综合九色欧美综合狠狠| 在线视频 日韩| 97久久精品人人澡人人爽| 91香蕉视频网| 日韩美女视频一区| 天天干天天色综合| 在线观看日韩国产| 国产乱人乱偷精品视频| 欧美一区二区三区播放老司机 | 亚洲性69xxxbbb| 国产偷倩在线播放| 高清一区二区三区日本久| 日韩不卡免费高清视频| 国产精品一区在线播放| 精品国产乱子伦一区二区| 一区二区三区国产福利| 久久裸体视频| 久久久久亚洲AV成人无码国产| 99久久夜色精品国产网站| 亚洲精品乱码久久久久久久| 综合久久久久久久| 国产盗摄x88av| 欧美日韩在线直播| 欧美 日韩 人妻 高清 中文| 精品国产乱码久久久久久图片| 日本美女一级片| 欧美贵妇videos办公室| 国产自产自拍视频在线观看| 99久久精品久久久久久ai换脸| 你懂的在线观看一区二区| 国产一区二区三区四区hd| 国产va免费精品观看精品视频| 精品国产av无码一区二区三区| 国产精品538一区二区在线| 少妇熟女视频一区二区三区| 亚洲桃色在线一区| 亚洲一区中文字幕永久在线| 中文字幕日本欧美| 手机在线免费av| 亚洲综合中文字幕在线| 欧美激情网址| 精品少妇在线视频| 不卡一区在线观看| 美国一级黄色录像| 欧美性大战久久久久久久蜜臀| 成人综合影院| 国产色综合天天综合网| 国产精品久久久网站| 免费在线成人av| 久久99伊人| 亚洲av无码一区二区三区人 | 天天爱天天做天天操| 国产在线乱码一区二区三区| 成人手机在线免费视频| 精品成人久久av| 五月天福利视频| 国产精品普通话| 久久不见久久见国语| 五月婷婷六月丁香激情| 日本一区二区视频在线| 一级黄色大片视频| 亚洲精品720p| 超碰激情在线| 国产精品18毛片一区二区| 久久国产精品久久久久久电车 | 日本韩国精品一区二区| 国内精品美女av在线播放| 欧美精品色图| 青青青在线视频免费观看| 亚洲精品国产a久久久久久| 免费成人av电影| 国产精品第一区| 影音先锋久久久| 在线观看国产网站| 欧美一级久久久久久久大片| a级网站在线播放|