精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

使用Python進行社交媒體情感分析入門

開發 后端 機器學習
本文研究了 NLP 的一個特定領域:情感分析。重點是確定輸入語言的積極、消極或中性性質。本部分將解釋 NLP 和情感分析的背景,并探討兩個開源的 Python 包。

[[265146]]

學習自然語言處理的基礎知識并探索兩個有用的 Python 包。

自然語言處理(NLP)是機器學習的一種,它解決了口語或書面語言和計算機輔助分析這些語言之間的相關性。日常生活中我們經歷了無數的 NLP 創新,從寫作幫助和建議到實時語音翻譯,還有口譯。

本文研究了 NLP 的一個特定領域:情感分析。重點是確定輸入語言的積極、消極或中性性質。本部分將解釋 NLP 和情感分析的背景,并探討兩個開源的 Python 包。第 2 部分將演示如何開始構建自己的可擴展情感分析服務。

在學習情感分析時,對 NLP 有一個大體了解是有幫助的。本文不會深入研究數學本質。相反,我們的目標是闡明 NLP 中的關鍵概念,這些概念對于將這些方法實際結合到你的解決方案中至關重要。

自然語言和文本數據

合理的起點是從定義開始:“什么是自然語言?”它是我們人類相互交流的方式,溝通的主要方式是口語和文字。我們可以更進一步,只關注文本交流。畢竟,生活在 Siri、Alexa 等無處不在的時代,我們知道語音是一組與文本無關的計算。

數據前景和挑戰

我們只考慮使用文本數據,我們可以對語言和文本做什么呢?首先是語言,特別是英語,除了規則還有很多例外,含義的多樣性和語境差異,這些都可能使人類口譯員感到困惑,更不用說計算機翻譯了。在小學,我們學習文章和標點符號,通過講母語,我們獲得了尋找直覺上表示唯一意義的詞的能力。比如,出現諸如 “a”、“the” 和 “or” 之類的文章,它們在 NLP 中被稱為停止詞,因為傳統上 NLP 算法是在一個序列中找到這些詞時意味著搜索停止。

由于我們的目標是自動將文本分類為情感類,因此我們需要一種以計算方式處理文本數據的方法。因此,我們必須考慮如何向機器表示文本數據。眾所周知,利用和解釋語言的規則很復雜,輸入文本的大小和結構可能會有很大差異。我們需要將文本數據轉換為數字數據,這是機器和數學的***方式。這種轉變屬于特征提取的范疇。

在提取輸入文本數據的數字表示形式后,一個改進可能是:給定一個文本輸入體,為上面列出的文章確定一組向量統計數據,并根據這些數據對文檔進行分類。例如,過多的副詞可能會使撰稿人感到憤怒,或者過度使用停止詞可能有助于識別帶有內容填充的學期論文。誠然,這可能與我們情感分析的目標沒有太大關系。

詞袋

當你評估一個文本陳述是積極還是消極的時候,你使用哪些上下文來評估它的極性?(例如,文本中是否具有積極的、消極的或中性的情感)一種方式是隱含形容詞:被稱為 “disgusting”(惡心) 的東西被認為是消極的,但如果同樣的東西被稱為 “beautiful”(漂亮),你會認為它是積極的。從定義上講,俗語給人一種熟悉感,通常是積極的,而臟話可能是敵意的表現。文本數據也可以包括表情符號,它帶有固定的情感。

理解單個單詞的極性影響為文本的詞袋bag-of-words(BoW)模型提供了基礎。它分析一組單詞或詞匯表,并提取關于這些單詞在輸入文本中是否存在的度量。詞匯表是通過處理已知極性的文本形成稱為標記的訓練數據。從這組標記數據中提取特征,然后分析特征之間的關系,并將標記與數據關聯起來。

“詞袋”這個名稱說明了它的用途:即不考慮空間位置或上下文的的單個詞。詞匯表通常是由訓練集中出現的所有單詞構建的,訓練后往往會被修剪。如果在訓練之前沒有清理停止詞,那么停止詞會因為其高頻率和低語境而被移除。很少使用的單詞也可以刪除,因為缺乏為一般輸入實例提供的信息。

但是,重要的是要注意,你可以(并且應該)進一步考慮單詞在單個訓練數據實例之外的情形,這稱為詞頻term frequency(TF)。你還應該考慮輸入數據在所有訓練實例中的單詞計數,通常,出現在所有文檔中的低頻詞更重要,這被稱為逆文本頻率指數inverse document frequency(IDF)。這些指標一定會在本主題系列的其他文章和軟件包中提及,因此了解它們會有所幫助。

詞袋在許多文檔分類應用程序中很有用。然而,在情感分析中,當缺乏情境意識的問題被利用時,事情就可以解決。考慮以下句子:

  • 我們不喜歡這場戰爭。
  • 我討厭下雨天,好事是今天是晴天。
  • 這不是生死攸關的問題。

這些短語的情感對于人類口譯員來說是有難度的,而且通過嚴格關注單個詞匯的實例,對于機器翻譯來說也是困難的。

在 NLP 中也可以使用稱為 “n-grams” 的單詞分組。一個二元組考慮兩個相鄰單詞組成的組而不是(或除了)單個詞袋。這應該可以緩解諸如上述“不喜歡”之類的情況,但由于缺乏語境意思,它仍然是個問題。此外,在上面的第二句中,下半句的情感語境可以被理解為否定前半部分。因此,這種方法中也會丟失上下文線索的空間局部性。從實用角度來看,使問題復雜化的是從給定輸入文本中提取的特征的稀疏性。對于一個完整的大型詞匯表,每個單詞都有一個計數,可以將其視為一個整數向量。大多數文檔的向量中都有大量的零計數向量,這給操作增加了不必要的空間和時間復雜度。雖然已經提出了許多用于降低這種復雜性的簡便方法,但它仍然是一個問題。

詞嵌入

詞嵌入Word embedding是一種分布式表示,它允許具有相似含義的單詞具有相似的表示。這是基于使用實值向量來與它們周圍相關聯。重點在于使用單詞的方式,而不僅僅是它們的存在與否。此外,詞嵌入的一個巨大實用優勢是它們關注于密集向量。通過擺脫具有相應數量的零值向量元素的單詞計數模型,詞嵌入在時間和存儲方面提供了一個更有效的計算范例。

以下是兩個優秀的詞嵌入方法。

Word2vec

***個是 Word2vec,它是由 Google 開發的。隨著你對 NLP 和情緒分析研究的深入,你可能會看到這種嵌入方法。它要么使用一個連續的詞袋continuous bag of words(CBOW),要么使用一個連續 skip-gram 模型。在 CBOW 中,一個單詞的上下文是在訓練中根據圍繞它的單詞來學習的。連續 skip-gram 學習傾向于圍繞給定的單詞學習單詞。雖然這可能超出了你需要解決的問題,但是如果你曾經面對必須生成自己的詞嵌入情況,那么 Word2vec 的作者就提倡使用 CBOW 方法來提高速度并評估頻繁的單詞,而 skip-gram 方法更適合嵌入稀有單詞更重要的嵌入。

GloVe

第二個是用于詞表示的全局向量Global Vectors for Word Representation(GloVe),它是斯坦福大學開發的。它是 Word2vec 方法的擴展,試圖通過將經典的全局文本統計特征提取獲得的信息與 Word2vec 確定的本地上下文信息相結合。實際上,在一些應用程序中,GloVe 性能優于 Word2vec,而在另一些應用程序中則不如 Word2vec。最終,用于詞嵌入的目標數據集將決定哪種方法***。因此,***了解它們的存在性和高級機制,因為你很可能會遇到它們。

創建和使用詞嵌入

***,知道如何獲得詞嵌入是有用的。在第 2 部分中,你將看到我們通過利用社區中其他人的實質性工作,站到了巨人的肩膀上。這是獲取詞嵌入的一種方法:即使用現有的經過訓練和驗證的模型。實際上,有無數的模型適用于英語和其他語言,一定會有一種模型可以滿足你的應用程序,讓你開箱即用!

如果沒有的話,就開發工作而言,另一個極端是培訓你自己的獨立模型,而不考慮你的應用程序。實質上,你將獲得大量標記的訓練數據,并可能使用上述方法之一來訓練模型。即使這樣,你仍然只是在理解你輸入文本數據。然后,你需要為你應用程序開發一個特定的模型(例如,分析軟件版本控制消息中的情感價值),這反過來又需要自己的時間和精力。

你還可以對針對你的應用程序的數據訓練一個詞嵌入,雖然這可以減少時間和精力,但這個詞嵌入將是特定于應用程序的,這將會降低它的可重用性。

可用的工具選項

考慮到所需的大量時間和計算能力,你可能想知道如何才能找到解決問題的方法。的確,開發可靠模型的復雜性可能令人望而生畏。但是,有一個好消息:已經有許多經過驗證的模型、工具和軟件庫可以為我們提供所需的大部分內容。我們將重點關注 Python,因為它為這些應用程序提供了大量方便的工具。

SpaCy

SpaCy 提供了許多用于解析輸入文本數據和提取特征的語言模型。它經過了高度優化,并被譽為同類中最快的庫。最棒的是,它是開源的!SpaCy 會執行標識化、詞性分類和依賴項注釋。它包含了用于執行此功能的詞嵌入模型,還有用于為超過 46 種語言的其他特征提取操作。在本系列的第二篇文章中,你將看到它如何用于文本分析和特征提取。

vaderSentiment

vaderSentiment 包提供了積極、消極和中性情緒的衡量標準。正如 原論文 的標題(《VADER:一個基于規則的社交媒體文本情感分析模型》)所示,這些模型是專門為社交媒體文本數據開發和調整的。VADER 接受了一組完整的人類標記過的數據的訓練,包括常見的表情符號、UTF-8 編碼的表情符號以及口語術語和縮寫(例如 meh、lol、sux)。

對于給定的輸入文本數據,vaderSentiment 返回一個極性分數百分比的三元組。它還提供了一個單個的評分標準,稱為 vaderSentiment 復合指標。這是一個在 [-1, 1] 范圍內的實值,其中對于分值大于 0.05 的情緒被認為是積極的,對于分值小于 -0.05 的被認為是消極的,否則為中性。

責任編輯:龐桂玉 來源: Linux中國
相關推薦

2019-05-20 13:20:36

Python編程語言情感分析

2020-05-08 10:54:33

大數據社交媒體營銷

2020-03-04 12:55:13

Emacs待辦事項應用

2016-12-07 14:45:25

KNIME情感分析數據分析

2018-09-04 11:45:31

前端JavaScriptNodeJS

2018-01-04 13:07:43

Python機器學習情感分析

2016-12-07 14:23:48

KNIME數據分析情感分析

2016-12-07 14:56:51

KNIME數據分析

2023-02-03 11:40:49

機器學習分析情感

2013-01-14 11:35:59

IBMdW

2016-11-16 15:05:42

情感分析

2018-02-07 17:32:54

情感分析

2023-10-07 00:04:23

2012-10-11 17:05:41

IBMdw

2017-08-05 10:39:15

社交媒體信息IT

2017-03-21 10:55:22

大數據

2020-05-11 11:03:47

漏洞信息泄露網絡安全

2023-08-07 09:10:18

2012-09-25 09:09:51

JSjQuery素材

2017-05-15 14:00:28

大數據Python情感極性分析
點贊
收藏

51CTO技術棧公眾號

国产成人免费av一区二区午夜 | 91精品福利观看| 国产欧美一区二区三区在线看蜜臀 | 亚洲成a人片在线www| 人人澡人人添人人爽一区二区| 国产黄人亚洲片| 午夜精品久久久久久久久久久久| 久久人人妻人人人人妻性色av| 综合日韩av| 国产精品美日韩| 91成人免费观看| 国产在线观看黄色| 日本成人小视频| 欧美一区二区三区人| 伊人再见免费在线观看高清版 | 午夜精品一区二区三级视频| www.爱久久| 色视频成人在线观看免| 致1999电视剧免费观看策驰影院| 成人1区2区3区| 免费日韩av片| 久久精品视频中文字幕| 国产精品手机在线观看| 精品国产欧美日韩一区二区三区| 亚洲人成人一区二区在线观看| 国产一区再线| 国产精品欧美久久久久天天影视| 欧美福利电影在线观看| 亚洲精品一区二区三区四区高清| 99视频在线免费| 蜜桃视频在线观看免费视频网站www| 成人动漫av在线| 国产精品偷伦免费视频观看的| 国产精品9191| 97国产成人高清在线观看| 精品国产91久久久久久久妲己| 免费日韩中文字幕| 日本h片在线观看| 国产精品每日更新| 久久99欧美| 亚洲精品字幕在线| 麻豆精品一区二区三区| 青青久久aⅴ北条麻妃| 青青草原国产视频| 精品中文字幕一区二区三区av| 91精品国产免费| 黄色av免费在线播放| 黄色污污视频在线观看| 亚洲人成影院在线观看| 亚洲精品9999| 黄色av免费在线看| 91麻豆文化传媒在线观看| 亚洲一区中文字幕| 天天天天天天天干| 国产视频久久| 97国产精品视频| 免看一级a毛片一片成人不卡| 91日韩欧美| 亚洲最新中文字幕| 美国黄色a级片| 欧美jizz19性欧美| 亚洲精品国产美女| 91九色蝌蚪porny| 91亚洲无吗| 欧美电影免费观看完整版| 超碰在线免费av| 亚洲三级在线| 337p亚洲精品色噜噜| 久久久久久蜜桃一区二区| 欧美日韩精品免费观看视完整| 午夜视频在线观看一区| 97超碰在线人人| 国产精品69xx| 无吗不卡中文字幕| 欧美一区二区中文字幕| √天堂8资源中文在线| 亚洲综合av网| 日韩精品―中文字幕| av有码在线观看| 欧美日韩亚洲一区二区三区| 各处沟厕大尺度偷拍女厕嘘嘘| 日本在线啊啊| 91成人免费网站| 污污的网站18| 亚洲综合伊人| 欧美不卡一二三| 国产黑丝在线观看| 自拍自偷一区二区三区| 亚洲欧美自拍一区| 成人小视频免费看| 日韩午夜电影网| 美乳少妇欧美精品| 国产午夜福利精品| 香蕉久久夜色精品| 国产精品jizz在线观看麻豆| 欧美性猛交xxxx乱大交hd| 美美哒免费高清在线观看视频一区二区| 国产精品久久久久久久久久免费| 中文字幕一区2区3区| 国产在线视频一区二区| 成人久久18免费网站漫画| 五月天福利视频| 欧美激情综合在线| 天天干天天色天天爽| 91美女精品| 日本久久电影网| 在线观看av免费观看| 99a精品视频在线观看| 日韩成人在线视频| 美女网站视频色| 亚洲欧美伊人| 26uuu日韩精品一区二区| 懂色av蜜臀av粉嫩av喷吹| 国产综合久久久久久鬼色| 国内不卡一区二区三区| 北岛玲一区二区三区| 亚洲精品国产精华液| 91av资源网| 成人在线视频国产| 日韩成人在线视频网站| 国产手机视频精品| 一区二区在线免费观看视频| 无码日韩精品一区二区免费| 日韩在线免费观看视频| 国偷自拍第113页| 狠狠色伊人亚洲综合成人| 激情视频一区二区| 国产精品扒开做爽爽爽的视频| 亚洲成人动漫av| 国产乱子夫妻xx黑人xyx真爽| 国产精品免费精品自在线观看| 精品播放一区二区| 能免费看av的网站| 一本一道久久a久久精品蜜桃 | 欧美一级艳片视频免费观看| 国产精品无码一区二区三| 精品久久影院| 97视频人免费观看| 国产一区二区视频免费观看| 久久影院电视剧免费观看| www.99riav| 日本免费在线一区| 亚洲欧美三级伦理| 国产精品99精品无码视| 国产精品自在在线| 亚洲精品日韩精品| 自拍偷拍欧美视频| 亚洲福利视频网| 欧美精品99久久久| 国产麻豆精品在线| 四虎永久在线精品免费一区二区| 欧美78videosex性欧美| 在线成人小视频| 成人黄色短视频| 日韩电影免费在线看| 久久综合九九| 三妻四妾完整版在线观看电视剧| 日韩一区国产二区欧美三区| 国产激情无码一区二区三区| 免费成人在线影院| 亚洲a∨一区二区三区| 一根才成人网| 亚洲欧美三级在线| av资源免费观看| 92国产精品观看| 狠狠干 狠狠操| 日韩高清影视在线观看| 欧美亚洲日本黄色| 午夜激情在线视频| 亚洲成人免费视频| 亚洲三级在线视频| 午夜久久一区| av成人午夜| 欧美男男video| 亚洲成年网站在线观看| 久草精品视频在线观看| www.66久久| 777久久久精品一区二区三区| 欧美美女在线直播| 浅井舞香一区二区| 成年女人的天堂在线| 91国在线观看| 黄色精品视频在线观看| 国产乱理伦片在线观看夜一区 | 久久久久久久久久久妇女| 国产专区精品视频| 免费在线你懂的| 日韩视频免费观看高清完整版 | 最新国产成人av网站网址麻豆| 一级特黄特色的免费大片视频| 日韩一区在线看| xxxx视频在线观看| 欧美午夜电影在线观看 | 欧美日韩不卡在线视频| 亚州综合一区| 日本久久亚洲电影| 国产三级在线免费观看| 91精品国产色综合久久不卡电影| 妺妺窝人体色www聚色窝仙踪| 91原创在线视频| 成人性生生活性生交12| 亚洲九九视频| 精品在线视频一区二区三区| 欧美影视资讯| 精品综合久久久久久97| 欧美视频免费一区二区三区| 欧美精品v国产精品v日韩精品 | 理论在线观看| 777亚洲妇女| 午夜精品久久久久久久久久久久久蜜桃 | 亚洲免费观看高清完整版在线 | 偷拍女澡堂一区二区三区| 视频在线在亚洲| 日本xxxxx18| 女人av一区| www国产亚洲精品| 综合日韩av| 欧美日韩国产91| 国产三级视频在线看| 精品久久久久99| 这里只有精品免费视频| 亚洲欧洲日产国产综合网| 四虎1515hh.com| 天使萌一区二区三区免费观看| 日韩精品一区二区三区电影| 一区二区美女| 国产精品久久精品国产 | 亚洲AV午夜精品| 在线观看亚洲精品视频| 国产一级片免费看| 日韩一区欧美一区| 制服 丝袜 综合 日韩 欧美| 成人激情文学综合网| 男人的天堂最新网址| 麻豆精品网站| 欧美日韩中文字幕在线播放| 国产欧美日韩精品一区二区三区 | 一区二区在线观| 综合综合综合综合综合网| 99国产在线观看| 日韩精品三区| 97福利一区二区| 免费av不卡在线观看| 久久精品国产一区| 波多野结衣在线网站| 亚洲偷欧美偷国内偷| 四虎影院在线播放| 亚洲福利视频在线| jizz中国女人| 欧美日韩极品在线观看一区| 亚洲国产精品无码久久久| 欧美日韩免费观看中文| 日韩av在线播放观看| 亚洲免费观看高清完整版在线观看 | 欧美色视频日本版| 日韩成年人视频| 亚洲色图在线看| 亚洲自拍偷拍一区二区| 99精品欧美一区二区三区小说 | 久久人人爽人人爽人人av| 欧美一区高清| 欧美在线观看视频免费| 欧美日韩 国产精品| 国产激情片在线观看| 综合亚洲视频| www.国产亚洲| 狠狠综合久久| 亚洲精品一区二区三| 精品国产91| 亚洲第一导航| 久久香蕉国产| 成人免费看片视频在线观看| 亚洲精品二区三区| 午夜啪啪福利视频| 亚洲精品一二三区区别| 91视频成人免费| 黄色成人在线网址| 国精产品一区一区三区视频| 亚洲免费影院| 又粗又黑又大的吊av| 噜噜爱69成人精品| 黄色手机在线视频| 韩国欧美一区二区| 亚洲熟妇一区二区| 91麻豆文化传媒在线观看| 亚洲av综合一区二区| 国产欧美日韩视频一区二区| 国产精品无码无卡无需播放器| 国产精品网站在线播放| 亚洲视频重口味| 亚洲国产精品久久一线不卡| 久久久精品视频在线| 亚洲不卡一区二区三区| 久久精品视频1| 欧美日韩在线一区二区| 亚洲AV无码成人片在线观看| 日韩一区和二区| 日本韩国一区| 久久精品视频免费播放| caoporn视频在线观看| 国产精品免费一区豆花| 欧美影院精品| 快播亚洲色图| 久久久久久久久久久妇女| 免费看欧美黑人毛片| 青娱乐精品在线视频| 国产吃瓜黑料一区二区| 久久综合久久综合亚洲| 东方伊人免费在线观看| 亚洲尤物在线视频观看| 亚洲国产av一区二区三区| 欧美丰满高潮xxxx喷水动漫| 全部免费毛片在线播放一个| 亚洲美女黄色片| av在线播放观看| 国产成人激情小视频| 日韩激情精品| 日韩欧美手机在线| 亚洲欧美bt| 亚洲综合自拍网| 一区二区免费看| 国产乱淫av免费| 色系列之999| 亚洲www啪成人一区二区| 欧美精品七区| 亚洲视频二区| 呦呦视频在线观看| 亚欧色一区w666天堂| 国产sm主人调教女m视频| 日韩视频免费中文字幕| 成人在线不卡| 亚洲狠狠婷婷综合久久久| 日韩国产成人精品| jizz中文字幕| 色婷婷久久综合| 欧美女同网站| 欧美一区二区影院| 亚洲黄色录像| 久久综合久久色| 国产午夜三级一区二区三| 啦啦啦免费高清视频在线观看| 亚洲国产精品免费| 国产夫妻在线播放| 狠狠色综合网站久久久久久久| 好看的日韩av电影| 污污免费在线观看| 五月天丁香久久| 日韩在线免费看| 国产精品v片在线观看不卡| 久操精品在线| 天天操天天摸天天爽| 国产精品久久看| 国产欧美久久久精品免费| 久久亚洲综合国产精品99麻豆精品福利| 香蕉久久一区| 日韩中文在线字幕| 成人av在线资源| av大全在线观看| 在线日韩欧美视频| 日本一区二区中文字幕| 黄色网zhan| www.在线成人| 天堂网免费视频| 北条麻妃99精品青青久久| 97色婷婷成人综合在线观看| 黄色污污在线观看| caoporm超碰国产精品| 在线观看日本视频| 中文字幕亚洲精品| 欧美成人精品午夜一区二区| 国产美女主播在线播放| xnxx国产精品| 一二三四区视频| 欧美激情第99页| 精品视频国产| 亚洲高清在线不卡| 五月天精品一区二区三区| 波多野结衣在线影院| eeuss一区二区三区| 丝袜亚洲另类欧美| 农村黄色一级片| 亚洲久久久久久久久久久| 日韩精品一级毛片在线播放| 91成人综合网| 亚洲国产精品精华液2区45| 99国产成人精品| 欧美中文字幕在线视频| 亚洲成人二区| aa片在线观看视频在线播放| 91精品国产91久久综合桃花| 国产盗摄精品一区二区酒店| 区一区二区三区中文字幕| 国产精品一区二区你懂的| 久久久久久久久久成人| 色综合久综合久久综合久鬼88| 精品国产一区二区三区| www.午夜av| 91豆麻精品91久久久久久| 国产羞羞视频在线播放| 亚洲精品免费在线看|