精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

如何使用Python自然語言處理NLP創建摘要

開發 后端 自然語言處理
摘要已成為21世紀解決數據問題的一種非常有幫助的方法。在本篇文章中,我將向你展示如何使用Python中的自然語言處理(NLP)創建個人文本摘要生成器。

你有沒有讀過很多的報告,而你只想對每個報告做一個快速的總結摘要?你是否曾經遇到過這樣的情況?

摘要已成為21世紀解決數據問題的一種非常有幫助的方法。在本篇文章中,我將向你展示如何使用Python中的自然語言處理(NLP)創建個人文本摘要生成器。

前言:個人文本摘要器不難創建——初學者可以輕松做到!

什么是文本摘要

基本上,在保持關鍵信息的同時,生成準確的摘要,而不失去整體意義,這是一項任務。

摘要有兩種一般類型:

  • 抽象摘要>>從原文中生成新句子。
  • 提取摘要>>識別重要句子,并使用這些句子創建摘要。

應該使用哪種總結方法

我使用提取摘要,因為我可以將此方法應用于許多文檔,而不必執行大量(令人畏懼)的機器學習模型訓練任務。

此外,提取摘要法比抽象摘要具有更好的總結效果,因為抽象摘要必須從原文中生成新的句子,這是一種比數據驅動的方法提取重要句子更困難的方法。

如何創建自己的文本摘要器

我們將使用單詞直方圖來對句子的重要性進行排序,然后創建一個總結。這樣做的好處是,你不需要訓練你的模型來將其用于文檔。

文本摘要工作流

下面是我們將要遵循的工作流…

導入文本>>>>清理文本并拆分成句子>>刪除停用詞>>構建單詞直方圖>>排名句子>>選擇前N個句子進行提取摘要

(1) 示例文本

我用了一篇新聞文章的文本,標題是蘋果以5000萬美元收購AI初創公司,以推進其應用程序。你可以在這里找到原始的新聞文章:https://analyticsindiamag.com/apple-acquires-ai-startup-for-50-million-to-advance-its-apps/

你還可以從Github下載文本文檔:https://github.com/louisteo9/personal-text-summarizer

(2) 導入庫 

  1. # 自然語言工具包(NLTK) 
  2. import nltk 
  3. nltk.download('stopwords'
  4.  
  5. # 文本預處理的正則表達式 
  6. import re 
  7.  
  8. # 隊列算法求首句 
  9. import heapq 
  10.  
  11. # 數值計算的NumPy 
  12. import numpy as np 
  13.  
  14. # 用于創建數據幀的pandas 
  15. import pandas as pd 
  16.  
  17. # matplotlib繪圖 
  18. from matplotlib import pyplot as plt 
  19. %matplotlib inline 

(3) 導入文本并執行預處理

有很多方法可以做到。這里的目標是有一個干凈的文本,我們可以輸入到我們的模型中。 

  1. # 加載文本文件 
  2. with open('Apple_Acquires_AI_Startup.txt''r'as f: 
  3.     file_data = f.read() 

這里,我們使用正則表達式來進行文本預處理。我們將

(A)用空格(如果有的話…)替換參考編號,即[1]、[10]、[20],

(B)用單個空格替換一個或多個空格。 

  1. text = file_data 
  2. # 如果有,請用空格替換 
  3. text = re.sub(r'\[[0-9]*\]',' ',text)  
  4.  
  5. # 用單個空格替換一個或多個空格 
  6. text = re.sub(r'\s+',' ',text) 

然后,我們用小寫(不帶特殊字符、數字和額外空格)形成一個干凈的文本,并將其分割成單個單詞,用于詞組分數計算和構詞直方圖。

形成一個干凈文本的原因是,算法不會把“理解”和“理解”作為兩個不同的詞來處理。 

  1. # 將所有大寫字符轉換為小寫字符 
  2. clean_text = text.lower() 
  3.  
  4. # 用空格替換[a-zA-Z0-9]以外的字符 
  5. clean_text = re.sub(r'\W',' ',clean_text)  
  6.  
  7. # 用空格替換數字 
  8. clean_text = re.sub(r'\d',' ',clean_text)  
  9.  
  10. # 用單個空格替換一個或多個空格 
  11. clean_text = re.sub(r'\s+',' ',clean_text) 

(4) 將文本拆分為句子

我們使用NLTK sent_tokenize方法將文本拆分為句子。我們將評估每一句話的重要性,然后決定是否應該將每一句都包含在總結中。

  1. sentences = nltk.sent_tokenize(text) 

(5) 刪除停用詞

停用詞是指不給句子增加太多意義的英語單詞。他們可以安全地被忽略,而不犧牲句子的意義。我們已經下載了一個文件,其中包含英文停用詞

這里,我們將得到停用詞的列表,并將它們存儲在stop_word 變量中。 

  1. # 獲取停用詞列表 
  2. stop_words = nltk.corpus.stopwords.words('english'

(6) 構建直方圖

讓我們根據每個單詞在整個文本中出現的次數來評估每個單詞的重要性。

我們將通過(1)將單詞拆分為干凈的文本,(2)刪除停用詞,然后(3)檢查文本中每個單詞的頻率。 

  1. # 創建空字典以容納單詞計數 
  2. word_count = {} 
  3.  
  4. # 循環遍歷標記化的單詞,刪除停用單詞并將單詞計數保存到字典中 
  5. for word in nltk.word_tokenize(clean_text): 
  6.     # remove stop words 
  7.     if word not in stop_words: 
  8.         # 將字數保存到詞典 
  9.         if word not in word_count.keys(): 
  10.             word_count[word] = 1 
  11.         else
  12.             word_count[word] += 1 

讓我們繪制單詞直方圖并查看結果。 

  1. plt.figure(figsize=(16,10)) 
  2. plt.xticks(rotation = 90) 
  3. plt.bar(word_count.keys(), word_count.values()) 
  4. plt.show() 

 使用NLP創建摘要

讓我們把它轉換成橫條圖,只顯示前20個單詞,下面有一個helper函數。 

  1. # helper 函數,用于繪制最上面的單詞。 
  2. def plot_top_words(word_count_dict, show_top_n=20): 
  3.     word_count_table = pd.DataFrame.from_dict(word_count_dict, orient = 'index').rename(columns={0: 'score'}) 
  4.  
  5.     word_count_table.sort_values(by='score').tail(show_top_n).plot(kind='barh', figsize=(10,10)) 
  6.     plt.show() 

讓我們展示前20個單詞。

  1. plot_top_words(word_count, 20)  
使用NLP創建摘要

從上面的圖中,我們可以看到“ai”和“apple”兩個詞出現在頂部。這是有道理的,因為這篇文章是關于蘋果收購一家人工智能初創公司的。

(7) 根據分數排列句子

現在,我們將根據句子得分對每個句子的重要性進行排序。我們將:

  • 刪除超過30個單詞的句子,認識到長句未必總是有意義的;
  • 然后,從構成句子的每個單詞中加上分數,形成句子分數。

高分的句子將排在前面。前面的句子將形成我們的總結。

注意:根據我的經驗,任何25到30個單詞都可以給你一個很好的總結。 

  1. # 創建空字典來存儲句子分數 
  2. sentence_score = {} 
  3.  
  4. # 循環通過標記化的句子,只取少于30個單詞的句子,然后加上單詞分數來形成句子分數 
  5. for sentence in sentences: 
  6.     # 檢查句子中的單詞是否在字數字典中 
  7.     for word in nltk.word_tokenize(sentence.lower()): 
  8.         if word in word_count.keys(): 
  9.             # 只接受少于30個單詞的句子 
  10.             if len(sentence.split(' ')) < 30: 
  11.                 # 把單詞分數加到句子分數上 
  12.                 if sentence not in sentence_score.keys(): 
  13.                     sentence_score[sentence] = word_count[word] 
  14.                 else
  15.                     sentence_score[sentence] += word_count[word] 

我們將句子-分數字典轉換成一個數據框,并顯示sentence_score。

注意:字典不允許根據分數對句子進行排序,因此需要將字典中存儲的數據轉換為DataFrame。 

  1. df_sentence_score = pd.DataFrame.from_dict(sentence_score, orient = 'index').rename(columns={0: 'score'}) 
  2. df_sentence_score.sort_values(by='score', ascending = False

 使用NLP創建摘要

(8) 選擇前面的句子作為摘要

我們使用堆隊列算法來選擇前3個句子,并將它們存儲在best_quences變量中。

通常3-5句話就足夠了。根據文檔的長度,可以隨意更改要顯示的最上面的句子數。

在本例中,我選擇了3,因為我們的文本相對較短。 

  1. # 展示最好的三句話作為總結          
  2. best_sentences = heapq.nlargest(3, sentence_score, key=sentence_score.get) 

讓我們使用print和for loop函數顯示摘要文本。 

  1. print('SUMMARY'
  2. print('------------------------'
  3.  
  4. # 根據原文中的句子順序顯示最上面的句子 
  5. for sentence in sentences: 
  6.     if sentence in best_sentences: 
  7.         print (sentence) 

這是到我的Github的鏈接以獲取Jupyter筆記本。你還將找到一個可執行的Python文件,你可以立即使用它來總結你的文本:https://github.com/louisteo9/personal-text-summarizer

讓我們看看算法的實際操作!

以下是一篇題為“蘋果以5000萬美元收購人工智能創業公司(Apple Acquire AI Startup)以推進其應用程序”的新聞文章的原文

In an attempt to scale up its AI portfolio, Apple has acquired Spain-based AI video startup — Vilynx for approximately $50 million.

Reported by Bloomberg, the AI startup — Vilynx is headquartered in Barcelona, which is known to build software using computer vision to analyse a video’s visual, text, and audio content with the goal of “understanding” what’s in the video. This helps it categorising and tagging metadata to the videos, as well as generate automated video previews, and recommend related content to users, according to the company website.

Apple told the media that the company typically acquires smaller technology companies from time to time, and with the recent buy, the company could potentially use Vilynx’s technology to help improve a variety of apps. According to the media, Siri, search, Photos, and other apps that rely on Apple are possible candidates as are Apple TV, Music, News, to name a few that are going to be revolutionised with Vilynx’s technology.

With CEO Tim Cook’s vision of the potential of augmented reality, the company could also make use of AI-based tools like Vilynx.

The purchase will also advance Apple’s AI expertise, adding up to 50 engineers and data scientists joining from Vilynx, and the startup is going to become one of Apple’s key AI research hubs in Europe, according to the news.

Apple has made significant progress in the space of artificial intelligence over the past few months, with this purchase of UK-based Spectral Edge last December, Seattle-based Xnor.ai for $200 million and Voysis and Inductiv to help it improve Siri. With its habit of quietly purchasing smaller companies, Apple is making a mark in the AI space. In 2018, CEO Tim Cook said in an interview that the company had bought 20 companies over six months, while only six were public knowledge.

摘要如下: 

  1. SUMMARY 
  2. ------------------------ 
  3. In an attempt to scale up its AI portfolio, Apple has acquired Spain-based AI video startup — Vilynx for approximately $50 million. 
  4. With CEO Tim Cook’s vision of the potential of augmented reality, the company could also make use of AI-based tools like Vilynx. 
  5. With its habit of quietly purchasing smaller companies, Apple is making a mark in the AI space

結尾

祝賀你!你已經在Python中創建了你的個人文本摘要器。我希望,摘要看起來很不錯。

 

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2021-05-17 09:00:00

自然語言人工智能技術

2021-05-18 07:15:37

Python

2024-04-24 11:38:46

語言模型NLP人工智能

2023-08-04 10:18:15

2022-03-29 09:58:15

自然語言處理人工智能技術

2018-07-08 07:08:07

2021-06-01 12:46:26

人工智能機器人 機器學習

2021-05-13 07:17:13

Snownlp自然語言處理庫

2024-12-06 12:19:43

自然語言NLP人工智能

2021-02-22 11:38:59

深度學習人工智能機器學習

2017-06-29 13:02:54

大數據自然語言NLP

2023-05-30 14:39:34

ChatGPT-4NLP

2024-02-05 14:18:07

自然語言處理

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2017-04-17 15:03:16

Python自然語言處理

2021-11-12 15:43:10

Python自然語言數據

2018-10-19 08:48:22

自然語言NLP開源工具

2023-12-05 15:09:57

PythonNLP

2017-11-14 19:19:07

人工智能自然語言處理百度

2017-08-23 09:36:21

點贊
收藏

51CTO技術棧公眾號

亚洲欧美自拍视频| 午夜精品久久久| 在线视频欧美区| 成人久久久久久| 欧美xxxxx精品| 日本高清视频在线播放| 亚洲成aⅴ人片久久青草影院| 麻豆成人91精品二区三区| 精品国产乱码久久久久久老虎 | 麻豆一区二区三区精品视频| 欧美性片在线观看| 91丨九色porny丨蝌蚪| 久久五月情影视| 国产视频一区二区视频| 人妻少妇精品无码专区| 欧美一区二区三区久久精品茉莉花| 一本久久精品一区二区| 国产精品二区在线| 一女三黑人理论片在线| 国产经典三级在线| 国产精品亚洲а∨天堂免在线| 永久免费看mv网站入口亚洲| 国产激情在线观看视频| 欧美91精品久久久久国产性生爱| 精久久久久久| 亚洲成人1234| 日韩网站在线免费观看| 免费观看的毛片| 日韩中文字幕区一区有砖一区| 日韩www在线| 黄色影院一级片| 五月婷婷开心中文字幕| 国产精品综合| 亚洲日本成人女熟在线观看 | 久久国产精品亚洲77777| 精品乱码亚洲一区二区不卡| 免费不卡av在线| 午夜不卡视频| 91香蕉视频污在线| 超碰97在线人人| 国产精品美女毛片真酒店| 国产主播性色av福利精品一区| 亚洲五月六月丁香激情| 成人在线资源网址| 一区二区www| 亚洲欧美一级二级三级| 国产一区二区三区网站| 在线观看av日韩| 免费黄色网页在线观看| 国产黄色精品网站| 亚州欧美日韩中文视频| 少妇大叫太粗太大爽一区二区| 粉嫩一区二区三区| 国产精品视频九色porn| 91精品国产综合久久香蕉922| 欧美在线视频第一页| 91夜夜蜜桃臀一区二区三区| 亚洲一区二区欧美| 成人手机在线播放| 天天插天天干天天操| 日韩精品一二区| 欧美亚洲在线观看| 亚洲欧美精品aaaaaa片| 国语一区二区三区| 精品国产一区久久| 中文字幕一区二区三区人妻在线视频| 亚洲精品88| 国产精品短视频| 国产精品免费一区二区| 超碰人人人人人人| 巨乳诱惑日韩免费av| 美女福利视频一区| 亚洲av片不卡无码久久| 日韩母乳在线| 91精品黄色片免费大全| 中文字幕无码精品亚洲35| 日韩黄色影院| 国产精品成人在线观看| gogogo免费高清日本写真| 四虎永久在线观看| 91免费观看国产| 欧美久久在线| 朝桐光av在线一区二区三区| 高清在线不卡av| 国产精品免费网站| 国产手机在线视频| 中文一区一区三区免费在线观看| 日韩精品在线观看视频| 久久综合桃花网| 欧美色片在线观看| 91精品国产91热久久久做人人| 亚洲午夜无码av毛片久久| 欧美aa视频| 亚洲一区二区影院| www.玖玖玖| 国产亚洲精彩久久| 91久久香蕉国产日韩欧美9色| 日韩亚洲欧美一区二区| www在线免费观看| 99精品视频免费在线观看| 亚洲伊人一本大道中文字幕| 国产精品免费无遮挡无码永久视频| 影音先锋中文字幕一区| 欧洲成人性视频| 日韩av黄色片| 日本欧美韩国一区三区| 青青草原成人在线视频| 一卡二卡三卡在线| 不卡视频免费播放| av一本久道久久波多野结衣| 日本在线一二三| eeuss影院一区二区三区| 99影视tv| 国产专区在线| 久久久精品黄色| 欧美xxxx黑人又粗又长精品| 亚洲人妻一区二区三区| 国产精品久久国产精麻豆99网站 | 992tv免费直播在线观看| 99精品1区2区| 一道本在线观看视频| 国产精品粉嫩| 色婷婷久久久久swag精品| 黄色三级视频在线播放| 精品国产亚洲一区二区三区大结局| 欧美日韩国产综合视频在线观看| 少妇黄色一级片| 天堂精品久久久久| 精品日韩av一区二区| 精品人妻无码一区| 色777狠狠狠综合伊人| 日韩在线视频线视频免费网站| jizz日本在线播放| 国产精品99在线观看| www.久久色.com| www.av成人| 天堂成人国产精品一区| 国产精品乱码视频| 中国av在线播放| 亚洲综合在线五月| 免费av观看网址| 精品三级久久久| 色噜噜亚洲精品中文字幕| 天码人妻一区二区三区在线看| 日韩高清一区在线| 狠狠色综合网站久久久久久久| 亚洲av片一区二区三区| 亚洲综合视频在线| 亚欧美一区二区三区| 色婷婷色综合| 国产美女高潮久久白浆| 国产高潮流白浆喷水视频| 成人app下载| 特大黑人娇小亚洲女mp4| 99视频这里有精品| 亚洲黄色有码视频| 日本成人免费视频| 久久久久国产精品一区二区| 久久亚洲免费| 蜜桃麻豆影像在线观看| 欧美性受极品xxxx喷水| 国产91在线免费观看| 亚洲国产一区二区在线观看| 久久免费视频网站| 国产日韩久久久| 国产老肥熟一区二区三区| 日本福利视频导航| 成人在线分类| 亚洲人线精品午夜| 一级一级黄色片| 国产欧美日韩精品一区| 特级西西人体www高清大胆| 欧美电影院免费观看| 久久99亚洲热视| 黄色污污视频软件| 中文成人av在线| 亚洲色成人www永久在线观看| 在线播放高清视频www| 国产视频丨精品|在线观看| 在线天堂中文字幕| 久久久精品国产免大香伊| 亚洲欧美自偷自拍另类| 精品国产乱子伦一区二区| 色噜噜久久综合伊人一本| 国产绿帽一区二区三区| 国产偷v国产偷v亚洲高清| 日本男女交配视频| 全球中文成人在线| 亚洲网站视频福利| 亚洲一区二区人妻| 国产午夜精品久久| 国产美女视频免费看| 国产成人一区| 国模私拍一区二区三区| 黄色毛片在线看| 91精品国产综合久久久久久久 | 亚洲图片欧美综合| 欧美 日本 国产| 麻豆91在线播放| 亚洲色成人www永久在线观看| 国产精品亚洲片在线播放| 91精品久久久久久久久久久| caoporn-草棚在线视频最| 欧美精品久久久久久久久老牛影院 | 1024在线看片| 午夜影院日韩| 国产欧美日韩综合精品二区| 欧美精品电影| 亚洲电影av在线| 中文字幕乱码无码人妻系列蜜桃| 91看片淫黄大片一级| 日本一二区免费| 色135综合网| 国产呦系列欧美呦日韩呦| 国产91在线精品| 永久免费毛片在线播放不卡| 国产高清精品软件丝瓜软件| 色久优优欧美色久优优| 久久综合综合久久| 国产精品久久三区| 黄色正能量网站| 国产91在线看| 日韩欧美亚洲另类| 先锋影音国产一区| 2022中文字幕| 久久综合99| 成人国产亚洲精品a区天堂华泰| 华人av在线| 日韩av在线免费播放| 国产裸体无遮挡| 在线观看亚洲成人| 亚洲免费在线观看av| 久久久久久久电影| 国产在线不卡av| 羞羞视频在线观看欧美| av 日韩 人妻 黑人 综合 无码| 色综合久久一区二区三区| 欧洲亚洲一区二区三区四区五区| 欧美黑人巨大xxxxx| 韩国19禁主播vip福利视频| 里番在线观看网站| 欧美日韩一卡二卡| 欧美黄色aaa| 中文字幕电影一区| 97人妻精品一区二区免费| 日本aⅴ亚洲精品中文乱码| av免费观看网| 一区在线免费观看| 日本一本中文字幕| 欧美另类专区| 国语精品中文字幕| 老司机在线精品视频| 国产美女99p| 国产一区福利| 麻豆av一区二区三区| 久久中文字幕导航| 久久久久久九九九九| 黄页免费欧美| 国产精品久久一区| 成人在线不卡| 成人黄色av网| 精品91福利视频| 91成人理论电影| 国产成人精品123区免费视频| 欧洲日本亚洲国产区| gogo亚洲高清大胆美女人体 | 日本高清xxxx| 亚洲欧洲色图| 欧美人xxxxx| 精品国产一区二区三区| 超碰在线观看97| 亚洲国产一区二区三区网站| 日本精品视频在线观看| dj大片免费在线观看| 亚洲视频日韩精品| av免费在线一区二区三区| 久久久精品中文字幕| 黄色av免费在线看| 日韩中文在线中文网三级| av网址在线播放| 午夜精品一区二区三区在线 | 自拍偷拍激情视频| 日本伊人色综合网| 手机免费av片| 大陆成人av片| 伊人精品视频在线观看| 成人性生交大片免费看中文网站| a视频免费观看| 欧美激情在线一区二区| 欧美老熟妇一区二区三区| 亚洲大尺度视频在线观看| 欧美在线视频第一页| 亚欧色一区w666天堂| 老熟妇一区二区三区啪啪| 日韩精品在线一区二区| 国产又粗又大又黄| 精品国产乱码久久久久久蜜臀 | 久久精品在这里| 欧洲美女女同性互添| 日本一区二区三区在线观看| 精品自拍偷拍视频| 91久久香蕉国产日韩欧美9色| 99国产成人精品| 亚洲欧美中文字幕| 秋霞在线视频| 欧美黄色成人网| 亚洲卡一卡二| 欧美另类极品videosbest最新版本 | 国产日韩欧美在线一区| 毛片a片免费观看| 亚洲精选视频在线| 91麻豆制片厂| 午夜久久电影网| 国产精品视频一区二区三区,| 欧美日韩国产片| 天堂网在线播放| 久久伊人91精品综合网站| 久久人体大尺度| 成人欧美一区二区三区视频 | 中文字幕久热精品在线视频| 成人资源www网在线最新版| 欧美黑人xxxx| 色成人综合网| 色一情一区二区三区四区| av影片在线一区| a级黄色一级片| 久久亚洲二区| 免费黄色三级网站| 一区二区三区中文免费| 国产一级免费av| 精品久久久久久中文字幕大豆网| 在线观看国产亚洲| 日韩一区二区三免费高清| 国产小视频一区| 亚洲国产另类久久精品| 69成人在线| 91精品视频免费| 成人精品毛片| 久久久久久久香蕉| 久久99九九99精品| 性农村xxxxx小树林| 亚洲欧美激情插| 国产精品久久久久久在线| 中文字幕免费精品一区高清| 韩国美女久久| 久久国产精品一区二区三区| 亚洲福利电影| 制服丝袜av在线| 国产亚洲精品aa午夜观看| 国产专区第一页| 亚洲码在线观看| 国产黄色小视频在线| 国产精品综合网站| 欧美激情黄色片| 国产福利精品一区二区三区| 国产精品国产成人国产三级| 夜夜躁狠狠躁日日躁av| 久久精品视频在线| 精品国产鲁一鲁****| 成年丰满熟妇午夜免费视频 | 天天综合天天做天天综合| 日本xxxxwww| 91成人免费观看网站| 亚洲国产一区二区久久| 中文字幕制服丝袜在线| 国产一区欧美二区| 男人天堂av电影| 色欧美日韩亚洲| 最近高清中文在线字幕在线观看| 国产精品视频久久久久| 91综合视频| 亚洲丝袜在线观看| 亚洲高清不卡在线观看| 深夜福利免费在线观看| 国产精品久久9| 好吊妞国产欧美日韩免费观看网站 | www.污污视频| 一个色综合av| 五月婷婷免费视频| 国产精品久久久久9999| 91综合久久| av在线播放网址| 色94色欧美sute亚洲线路一久| av网站在线免费播放| 亚洲a级在线播放观看| 亚洲国产一区二区三区高清| 国产永久免费网站| 亚洲在线免费播放| 男操女在线观看| 亚洲一区二区三区久久 | 69视频在线免费观看| 郴州新闻综合频道在线直播| 久久久999视频| 国产精品久久久久久久久搜平片| www.国产麻豆| 日本精品视频在线| 欧美午夜在线视频| 国产在线免费av| 精品sm捆绑视频| 青青国产精品|