精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

關(guān)于自然語言處理之One Hot模型

人工智能 自然語言處理
顧名思義,單熱表示從一個零向量開始,如果單詞出現(xiàn)在句子或文檔中,則將向量中的相應條目設(shè)置為 1。

[[421481]]

本文轉(zhuǎn)載自微信公眾號「python與大數(shù)據(jù)分析」,作者 一只小小鳥鳥 。轉(zhuǎn)載本文請聯(lián)系python與大數(shù)據(jù)分析公眾號。

最近工作實在有點忙,前陣子關(guān)于梯度和導數(shù)的事情把人折騰的夠嗆,數(shù)學學不好,搞機器學習和神經(jīng)網(wǎng)絡真是頭疼;想轉(zhuǎn)到應用層面輕松一下,想到了自然語言處理,one hot模型是基礎(chǔ)也是入門,看起來很簡單的一個列表轉(zhuǎn)矩陣、詞典的功能,想著手工實現(xiàn)一下,結(jié)果看了一下CountVectorizer,發(fā)現(xiàn)不是那么回事兒,還是放棄了。

顧名思義,單熱表示從一個零向量開始,如果單詞出現(xiàn)在句子或文檔中,則將向量中的相應條目設(shè)置為 1。

對句子進行標記,忽略標點符號,并將所有的單詞都用小寫字母表示,就會得到一個大小為 8 的詞匯表: {time, fruit, flies, like, a, an, arrow, banana} 。所以,我們可以用一個八維的單熱向量來表示每個單詞。在本書中,我們使用 1[w] 表示標記/單詞 w 的單熱表示。

對于短語、句子或文檔,壓縮的單熱表示僅僅是其組成詞的邏輯或的單熱表示。短語 like a banana 的單熱表示將是一個 3×8 矩陣,其中的列是 8 維的單熱向量。通常還會看到“折疊”或二進制編碼,其中文本/短語由詞匯表長度的向量表示,用 0 和 1 表示單詞的缺失或存在。like a banana 的二進制編碼是: [0,0,0,1,1,0,0,1] 。

  1. from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer 
  2. import seaborn as sns 
  3. import matplotlib.pyplot as plt 
  4. import jieba 
  5. import jieba.analyse 
  6.  
  7. # 單熱表示從一個零向量開始,如果單詞出現(xiàn)在句子或文檔中,則將向量中的相應條目設(shè)置為 1。 
  8. # 英文的處理和展示 
  9. corpus = ['Time flies flies like an arrow.''Fruit flies like a banana.'
  10. one_hot_vectorizer = CountVectorizer(binary=True
  11. one_hot = one_hot_vectorizer.fit_transform(corpus).toarray() 
  12. sns.heatmap(one_hot, annot=True, cbar=False, yticklabels=['Sentence 1''Sentence 2']) 
  13. plt.show() 

  1. # 中文的處理和展示 
  2. # 獲取停用詞列表 
  3. def get_stopwords_list(stopwordfile): 
  4.     stopwords = [line.strip() for line in open(stopwordfile, encoding='UTF-8').readlines()] 
  5.     return stopwords 
  6.  
  7. # 移除停用詞 
  8. def movestopwords(sentence): 
  9.     stopwords = get_stopwords_list('stopwords.txt')  # 這里加載停用詞的路徑 
  10.     santi_words = [x for x in sentence if len(x) > 1 and x not in stopwords] 
  11.     return santi_words 
  12.  
  13. # 語料 
  14. corpus = ["小明碩士畢業(yè)于中國科學院計算所,后在日本京都大學深造。"
  15.           "小王本科在清華大學,后在南京計算所工作和深造,后在日本早稻田大學深造"
  16.           "小李本科在清華大學,碩士畢業(yè)于中國科學院計算所,博士在南京大學"
  17. newcorpus = [] 
  18. for str in corpus: 
  19.     orgwordlist = jieba.lcut(str)  # jieba分詞 
  20.     wordlist = movestopwords(orgwordlist)  # 移除停用詞 
  21.     newword = " ".join(wordlist)  # 按照語料庫要求進行空格分隔 
  22.     newcorpus.append(newword)  # 按照語料庫要求轉(zhuǎn)換成列表 
  23. # newcorpus 
  24. # ['小明 碩士 畢業(yè) 中國科學院 計算所 日本京都大學 深造'
  25. '小王 本科 清華大學 南京 計算所 工作 深造 日本早稻田大學 深造'
  26. '小李 本科 清華大學 碩士 畢業(yè) 中國科學院 計算所 博士 南京大學'
  27. one_hot_vectorizer = CountVectorizer(binary=True)  # 創(chuàng)建詞袋數(shù)據(jù)結(jié)構(gòu) 
  28. one_hot = one_hot_vectorizer.fit_transform(newcorpus).toarray()  # 轉(zhuǎn)換語料,并矩陣化 
  29. # 下面為熱詞的輸出結(jié)果 
  30. # one_hot_vectorizer.vocabulary_ 
  31. # {'小明': 4, '碩士': 14, '畢業(yè)': 11, '中國科學院': 0, '計算所': 15, '日本京都大學': 8, '深造': 12, '小王': 6, '本科': 10, '清華大學': 13, '南京': 1, '工作': 7, '日本早稻田大學': 9, '小李': 5, '博士': 3, '南京大學': 2} 
  32. # one_hot_vectorizer.get_feature_names() 
  33. # ['中國科學院''南京''南京大學''博士''小明''小李''小王''工作''日本京都大學''日本早稻田大學''本科''畢業(yè)''深造''清華大學''碩士''計算所'
  34. # one_hot 
  35. # [[1 0 0 0 1 0 0 0 1 0 0 1 1 0 1 1] 
  36. #  [0 1 0 0 0 0 1 1 0 1 1 0 1 1 0 1] 
  37. #  [1 0 1 1 0 1 0 0 0 0 1 1 0 1 1 1]] 
  38. sns.set_style({'font.sans-serif': ['SimHei''Arial']}) 
  39. sns.heatmap(one_hot, annot=True, cbar=False, xticklabels=one_hot_vectorizer.get_feature_names(), 
  40.             yticklabels=['語句1''語句2''語句3']) 
  41. plt.show() 

IDF 表示懲罰常見的符號,并獎勵向量表示中的罕見符號。符號 w 的 IDF(w) 對語料庫的定義為其中 n[w] 是包含單詞 w 的文檔數(shù)量, N 是文檔總數(shù)。TF-IDF 分數(shù)就是 TF(w) * IDF(w) 的乘積。首先,請注意在所有文檔(例如, n[w] = N ), IDF(w) 為 0, TF-IDF 得分為 0,完全懲罰了這一項。其次,如果一個術(shù)語很少出現(xiàn)(可能只出現(xiàn)在一個文檔中),那么 IDF 就是 log n 的最大值

  1. tfidf_vectorizer = TfidfVectorizer()  # 創(chuàng)建詞袋數(shù)據(jù)結(jié)構(gòu) 
  2. tfidf = tfidf_vectorizer.fit_transform(newcorpus).toarray()  # 轉(zhuǎn)換語料,并矩陣化 
  3. # 下面為熱詞的輸出結(jié)果 
  4. # tfidf_vectorizer.vocabulary_ 
  5. '小明': 4, '碩士': 14, '畢業(yè)': 11, '中國科學院': 0, '計算所': 15, '日本京都大學': 8, '深造': 12, '小王': 6, '本科': 10, '清華大學': 13, '南京': 1, '工作': 7, '日本早稻田大學': 9, '小李': 5, '博士': 3, '南京大學': 2} 
  6. # tfidf_vectorizer.get_feature_names() 
  7. # ['中國科學院''南京''南京大學''博士''小明''小李''小王''工作''日本京都大學''日本早稻田大學''本科''畢業(yè)''深造''清華大學''碩士''計算所'
  8. # tfidf 
  9. # [[0.35221512 0.         0.         0.         0.46312056 0.  0.         0.         0.46312056 0.         0.        0.35221512  0.35221512 0.         0.35221512 0.27352646] 
  10. #  [0.         0.35761701 0.         0.         0.         0.  0.35761701 0.35761701 0.         0.35761701 0.27197695 0.  0.54395391 0.27197695 0.         0.21121437] 
  11. #  [0.30443385 0.         0.40029393 0.40029393 0.         0.40029393  0.         0.         0.         0.         0.30443385 0.30443385  0.         0.30443385 0.30443385 0.23642005]] 
  12. sns.heatmap(tfidf, annot=True, cbar=False, xticklabels=tfidf_vectorizer.get_feature_names(), 
  13.             yticklabels=['語句1''語句2''語句3'], vmin=0, vmax=1, cm 

 

責任編輯:武曉燕 來源: python與大數(shù)據(jù)分析
相關(guān)推薦

2021-05-18 07:15:37

Python

2021-05-13 07:17:13

Snownlp自然語言處理庫

2018-02-27 09:32:13

神經(jīng)網(wǎng)絡自然語言初探

2022-04-22 09:00:00

自然語言處理HMMCRF

2022-04-11 09:30:00

自然語言HMM深度學習

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2024-02-05 14:18:07

自然語言處理

2021-05-17 09:00:00

自然語言人工智能技術(shù)

2017-10-19 17:05:58

深度學習自然語言

2023-08-07 08:41:45

自然語言模型因果推理

2024-04-24 11:38:46

語言模型NLP人工智能

2025-05-28 01:50:00

2021-06-28 10:10:42

人工智能AI自然語言

2017-04-17 15:03:16

Python自然語言處理

2020-02-25 12:00:53

自然語言開源工具

2021-11-12 15:43:10

Python自然語言數(shù)據(jù)

2023-05-30 14:39:34

ChatGPT-4NLP

2017-05-05 15:34:49

自然語言處理

2020-02-25 23:28:50

工具代碼開發(fā)

2023-08-04 10:18:15

點贊
收藏

51CTO技術(shù)棧公眾號

欧美在线看片| 国产精品一区二区三区www| 久久久一区二区三区捆绑**| 国产aaa精品| 中文字幕求饶的少妇| 久久亚洲精精品中文字幕| 亚洲成a人v欧美综合天堂下载| 日本一区二区视频| 99视频国产精品免费观看a| 亚洲欧洲视频| 日韩中文字在线| 最新版天堂资源在线| 久久91导航| 亚洲成人av一区二区三区| 日韩免费av电影| 精品人妻av一区二区三区| 毛片一区二区| 色综合久久久888| 国产真人做爰视频免费| 都市激情久久| 欧美久久久久久久久中文字幕| 国产精品一区二区免费在线观看| 91免费在线| 成人午夜激情视频| 国产日韩欧美在线视频观看| 国产成人无码精品| 欧美+日本+国产+在线a∨观看| 亚洲欧美另类国产| 台湾佬美性中文| 日本欧美一区| 五月婷婷久久综合| 91精品国产毛片武则天| 亚洲精品承认| 国产视频一区不卡| 国产亚洲欧美一区二区三区| 国产v在线观看| 久久国产精品72免费观看| 69av成年福利视频| 久久久久成人精品无码| 亚洲国产精品91| 日韩在线中文字幕| 国产精品扒开腿做爽爽| 欧美日韩夜夜| 亚洲精品美女久久久久| 涩视频在线观看| 视频二区欧美| 欧美一区二区日韩一区二区| 天天操天天干天天做| 国产成人午夜性a一级毛片| 色欧美88888久久久久久影院| 欧美精品久久久久久久自慰| 国产精品探花在线| 一区二区三区产品免费精品久久75| 五月天久久狠狠| 国产爆初菊在线观看免费视频网站| 99re这里都是精品| 九九99玖玖| 性xxxxbbbb| 92国产精品观看| 精品亚洲欧美日韩| 亚洲 欧美 自拍偷拍| 99国内精品久久| 精品网站在线看| 久久手机免费观看| 国产日韩亚洲欧美综合| 色综合视频二区偷拍在线| 国产成人天天5g影院在线观看| 国产欧美精品国产国产专区| 亚洲激情电影在线| 麻豆网站在线| 一区二区在线观看免费视频播放| 欧美无砖专区免费| 第一福利在线视频| 色综合天天视频在线观看| 成人在线观看黄| 78精品国产综合久久香蕉| 欧美军同video69gay| 99久久99精品| 国产96在线亚洲| 亚洲免费av电影| 国产又粗又硬视频| 亚洲精品二区三区| 欧美华人在线视频| av资源免费观看| 免费看欧美女人艹b| 91精品视频免费观看| 亚洲精品免费在线观看视频| 2020日本不卡一区二区视频| 亚洲美女搞黄| 欧美xxx黑人xxx水蜜桃| 日韩欧美999| 99re6在线观看| 风间由美中文字幕在线看视频国产欧美| 日韩精品极品在线观看播放免费视频| 国产黄色大片免费看| 综合激情婷婷| 日本一区二区在线免费播放| 国产精品污视频| 97久久精品人人澡人人爽| 色就是色欧美| 国产丝袜精品丝袜| 欧美午夜精品久久久久久孕妇| 美女被艹视频网站| 九色精品国产蝌蚪| 久久成人18免费网站| 97久久久久久久| 国产一区二区三区四| 久久久综合亚洲91久久98| 黄网站视频在线观看| 欧美午夜精品在线| 日韩高清一二三区| 超碰成人久久| 2018日韩中文字幕| 国产女人高潮时对白| 久久久五月婷婷| 欧美又粗又长又爽做受| 亚洲青青一区| 亚洲深夜福利在线| 日本三级欧美三级| 国产一区二区三区香蕉| 色姑娘综合网| 日韩国产激情| 亚洲国产福利在线| 成人在线观看小视频| 日韩综合在线视频| 精品国产乱码久久久久久郑州公司| 国产成人无吗| 欧美日韩国产a| 色欲AV无码精品一区二区久久 | 日韩一区精品| 日韩国产在线看| 国产一级一片免费播放| 狠狠色丁香婷婷综合久久片| 日韩欧美在线一区二区| 午夜日韩成人影院| 国产丝袜高跟一区| 六月丁香在线视频| www.视频一区| 国产a级片网站| caoporn成人| 欧美肥老妇视频| 国产三级伦理片| 亚洲猫色日本管| 波多野结衣免费观看| 国产精品久久久久蜜臀 | 成人免费在线小视频| 国产女人18毛片水真多18精品| 欧美成人精品激情在线观看| 国产男女裸体做爰爽爽| 日韩美女视频19| 中文字幕日韩久久| 欧美在线高清| 国产99午夜精品一区二区三区 | 青草青草久热精品视频在线网站 | 色七七影院综合| 中文字幕一区2区3区| 国产精品―色哟哟| 中文字幕 欧美日韩| 一区二区三区在线| 999精品在线观看| 免费在线播放电影| 亚洲国产黄色片| 在线观看日韩中文字幕| 国产亚洲综合性久久久影院| 亚洲三级视频网站| 欧美日韩有码| 成人综合国产精品| 成人影音在线| 亚洲区中文字幕| 亚洲无码精品国产| 亚洲精品日韩综合观看成人91| 奇米777在线| 亚洲精品日韩久久| 日韩高清dvd| 国产午夜久久av| 性色av一区二区三区| 日本福利午夜视频在线| 精品视频全国免费看| 黑人狂躁日本娇小| 高清shemale亚洲人妖| 日韩网址在线观看| 久久一级电影| 国产精品青青草| 亚洲va中文在线播放免费| 色偷偷av一区二区三区乱| 亚洲精品一区二区三区蜜桃| 色综合天天狠狠| 欧美国产日韩在线观看成人 | 欧美一级片免费看| 激情综合网五月婷婷| 国产日韩精品视频一区| 日日干日日操日日射| 一区二区日韩免费看| 日韩影院一区| 999久久精品| 国产精品美乳在线观看| 不卡av免费观看| 最近中文字幕mv在线一区二区三区四区| 国产精品久久婷婷| 欧美午夜激情在线| 国产性xxxx| 国产欧美日韩在线| 国产一级免费片| 蜜桃视频一区二区三区| 黄页免费在线观看视频| 99久久久久国产精品| 九九九九精品| 欧美激情三级| 国产欧美日韩视频| 中文字幕影音在线| 久久久久久久成人| 免费**毛片在线| 国产婷婷成人久久av免费高清| 国产内射老熟女aaaa∵| 欧美视频日韩视频| 国产综合精品视频| 亚洲香蕉伊在人在线观| 午夜爱爱毛片xxxx视频免费看| www国产亚洲精品久久麻豆| 原创真实夫妻啪啪av| 久久亚洲不卡| 男人日女人下面视频| 欧美午夜影院| 18视频在线观看娇喘| 欧美色图一区| 欧美性色黄大片人与善| 卡通动漫国产精品| 成人精品一二区| 精品中文视频| 91久久国产综合久久91精品网站 | 俄罗斯毛片基地| 久久午夜色播影院免费高清| 特级西西人体4444xxxx| 国产成人免费视频精品含羞草妖精| 午夜国产福利在线观看| 美女免费视频一区二区| 日韩av手机版| 奇米精品一区二区三区在线观看一| 国产免费毛卡片| 国产精品日本| 国产在线观看福利| 久久久久99| 亚洲性生活网站| 日本不卡中文字幕| 色免费在线视频| 久久99久久精品欧美| 国产又黄又猛的视频| 国产一区视频网站| 中文字幕人妻无码系列第三区| 国产一区二区导航在线播放| 波多野结衣免费观看| 国产成a人无v码亚洲福利| www.美色吧.com| av电影天堂一区二区在线观看| 日本69式三人交| 91麻豆精品在线观看| 性少妇bbw张开| 欧美激情一区在线观看| 中文字幕第69页| 亚洲人精品一区| 久久久国产精华液| 精品动漫一区二区三区| 日日骚av一区二区| 在线视频国内自拍亚洲视频| 中文字幕在线日亚洲9| 在线观看91av| 人人妻人人澡人人爽人人欧美一区 | 免费在线激情视频| 日韩经典中文字幕一区| 午夜一级免费视频| 暴力调教一区二区三区| 国产中年熟女高潮大集合| 国产精品视频一二三| 波多野结衣在线网址| 亚洲一区二区三区四区在线| 九九热精品视频在线| 欧美最新大片在线看| 国产女人爽到高潮a毛片| 亚洲第一网站免费视频| 国产色a在线| 欧美风情在线观看| 午夜精品成人av| 亚洲综合日韩在线| 天堂网av成人| 艳母动漫在线免费观看| 亚洲美女视频在线免费观看| 国产又粗又长又大的视频| 粉嫩一区二区三区性色av| 四虎国产精品成人免费入口| 日韩毛片一二三区| 六月丁香婷婷综合| 在线不卡中文字幕| 亚洲欧美日韩成人在线| 久久久久www| 亚洲女同志freevdieo| 成人免费自拍视频| 蜜桃成人av| 日本免费黄色小视频 | 亚洲高清视频免费| 99久久99久久免费精品蜜臀| 情侣偷拍对白清晰饥渴难耐| 精品久久久久久国产91| 国产精品高潮呻吟av| 亚洲欧美日韩国产精品| 三级资源在线| 成人a在线视频| 国产成人一区二区三区影院| 国产手机免费视频| 久久丁香综合五月国产三级网站 | 免费看日本一区二区| 丰满人妻一区二区三区53号| 蜜臀av性久久久久蜜臀av麻豆| 久久久久成人精品无码中文字幕| 最新国产成人在线观看| 艳妇乳肉豪妇荡乳av无码福利| 亚洲精品大尺度| 日韩三级电影视频| 91美女片黄在线观| 日韩毛片视频| 亚洲国产精品毛片av不卡在线| www.欧美.com| 久久综合加勒比| 日韩欧美国产午夜精品| 成人在线视频亚洲| 国产欧美日韩专区发布| 成人精品亚洲| 999在线免费视频| 久久精品一区四区| 国产精品久久久免费视频| 欧美videofree性高清杂交| 国产激情视频在线| 国产日韩欧美自拍| 日韩电影二区| 国产一级做a爰片久久| 国产欧美一二三区| 中文字幕一区二区三区四区欧美| 精品亚洲永久免费精品| 深夜av在线| 精品欧美一区二区三区久久久| 亚洲精品视频啊美女在线直播| 国产性猛交96| 亚洲第一成年网| 天天干天天干天天干| 午夜精品久久久久久久99黑人| 911亚洲精品| 无码日本精品xxxxxxxxx| 丁香婷婷综合五月| 国产在线视频99| 亚洲电影av在线| 国产高清视频色在线www| 国产私拍一区| 麻豆久久婷婷| 国产探花视频在线| 5858s免费视频成人| 日本孕妇大胆孕交无码| 国产一区二区三区免费不卡| 宅男噜噜噜66国产日韩在线观看| 日本少妇毛茸茸| 日本久久一区二区| 成人在线视频成人| 成人中文字幕+乱码+中文字幕| 欧美在线资源| 国产在线观看无码免费视频| 欧美影片第一页| √天堂8在线网| 国内精品视频免费| 日韩中文字幕亚洲一区二区va在线 | 女人18毛片水真多18精品| 91精品国产91久久久久| 久久综合色占| 精品久久久99| 亚洲电影中文字幕在线观看| 日本中文字幕电影在线观看| 国产精品美乳一区二区免费 | 中文字幕一区二区三区四区| av天堂一区二区三区| 97精品国产97久久久久久免费| 久久91成人| 手机在线免费毛片| 午夜在线成人av| av在线天堂| 国产成人精品免费视频大全最热 | 免费av不卡| 国产日韩欧美一区二区| 日本91福利区| 欧美成人免费观看视频| 亚洲欧美国产另类| 成人自拍视频| 国产v亚洲v天堂无码久久久| 亚洲另类色综合网站| 深夜福利视频一区| 91久久精品美女高潮| 亚洲综合国产激情另类一区| 亚洲熟女少妇一区二区| 亚洲国产三级网| 黄页免费欧美| 欧美 日韩 国产 高清| 日韩毛片在线免费观看| 免费黄网站在线观看| 91久久精品国产91久久性色tv|