精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度

發布于 2025-1-8 12:58
瀏覽
0收藏

Bag-of-Words 將文本看作由單詞構成的無序集合,通過統計單詞在文本中出現的頻次來表示文本。因此,Bag-of-Words主要用于文本分類、情感分析、信息檢索等自然語言處理任務中

  • 1. 什么是詞袋模型(Bag of Words)
  • 2. 實現 Bag of Words 的步驟

2.1 文本預處理

2.2 構建詞匯表

2.3 向量化文本(詞袋表示)

2.4 通過文本的向量表示,使用余弦相似度分析句子相似度

  • 3. 統計詞頻,通過評論提升餐廳滿意度

在自然語言處理領域,如何將人類語言轉化為機器能夠理解和處理的結構化數據,是解決文本問題的關鍵。

Bag of Words(簡稱 BoW)是一種經典的文本表示方法,憑借其簡單性和易實現性,在文本分析中被廣泛應用。從情感分析到文檔分類,BoW 都扮演著重要角色

1. 什么是詞袋模型(Bag of Words) 

Bag of Words 的核心思想是將文本看作一個“詞袋”,不關注單詞的順序,僅統計每個單詞在文本中出現的頻率。它將一段文本轉化為一個固定長度的向量,其中每個元素代表詞匯表中一個單詞的出現次數。雖然簡單,但 BoW 能有效地將自然語言處理任務轉化為標準的機器學習問題。

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度-AI.x社區

BoW 的特點是只關注詞匯的頻率,因此它特別適合于情感分析、文本分類、文檔聚類等任務。然而,BoW 也有一些缺點,比如忽略了單詞之間的順序和上下文語義信息,這會導致對語義敏感的任務(如句子生成)性能不足。盡管如此,其簡單高效的特性使其成為入門自然語言處理的理想方法。

2. 實現 Bag of Words 的步驟 

2.1 文本預處理

文本預處理是實現 BoW 的第一步。原始文本通常包含噪聲,例如標點符號、停用詞和大小寫的混亂。清理文本能夠減少噪聲,提高模型的性能。對于中文,還需要進行分詞,因為中文沒有天然的單詞分隔符。

以下是 Python 實現中文分詞和停用詞去除的代碼:

"""
scikit-learn
"""
import jieba
from sklearn.feature_extraction.text import CountVectorizer
import numpy as np

# 客戶評論
reviews = [
    "食物非常美味,配送速度也很快!",
    "配送太慢了,食物已經涼了。",
    "食物很棒,服務也不錯,就是價格稍貴。",
    "從未見過這么差的服務,食物送得又慢又難吃!",
    "這家餐廳的食物真是太美味了,值得推薦!",
    "雖然配送慢,但食物的味道讓我感到驚喜。",
    "食物美味可口,配送速度也有待提高。",
    "我覺得這道菜非常美味,值得再點一次。",
    "配送速度慢得讓人失望,但食物的味道彌補了這一點。",
    "這道菜的味道真是美味無比,令人回味無窮。",
    "雖然等了很久,但食物的美味讓我覺得值得。",
    "每次來這家店,食物的美味總是讓我驚喜。",
    "配送的速度實在太慢,影響了我的用餐體驗。"
]

# 分詞預處理
# 停用詞列表
stop_words = ["了", "的", "也", "從未", "這么", "但", "就是"]

# 分詞與去停用詞
def preprocess_text(corpus):
    processed_corpus = []
    for text in corpus:
        words = jieba.lcut(text)  # 使用 jieba 分詞
        words = [word for word in words if word notin stop_words]  # 去停用詞
        processed_corpus.append(" ".join(words))  # 拼接成字符串
    return processed_corpus

preprocessed_reviews = preprocess_text(reviews)
print("分詞后的評論:")
print(preprocessed_reviews)

運行這段代碼后,我們會得到預處理后的文本,如下所示:

分詞后的評論:
['食物 非常 美味 , 配送 速度 很快 !', '配送 太慢 , 食物 已經 涼 。', '食物 很棒 , 服務 不錯 , 價格 稍貴 。', '從未見過 差 服務 , 食物 送得 又 慢 又 難吃 !', '這家 餐廳 食物 真是太 美味 , 值得 推薦 !', '雖然 配送 慢 , 食物 味道 讓 我 感到 驚喜 。', '食物 美味可口 , 配送 速度 有待 提高 。', '我 覺得 這 道菜 非常 美味 , 值得 再點 一次 。', '配送 速度慢 得 讓 人 失望 , 食物 味道 彌補 這 一點 。', '這 道菜 味道 真是 美味 無比 , 令人 回味無窮 。', '雖然 等 很 久 , 食物 美味 讓 我 覺得 值得 。', '每次 來 這家 店 , 食物 美味 總是 讓 我 驚喜 。', '配送 速度 實在 太慢 , 影響 我 用餐 體驗 。']

2.2 構建詞匯表

接下來需要構建一個詞匯表,包含所有預處理后的評論中出現的唯一單詞。詞匯表是向量化的基礎,每個單詞會被分配一個固定的索引。

以下是構建詞匯表的代碼:

from sklearn.feature_extraction.text import CountVectorizer

# 構建 BoW 模型
vectorizer = CountVectorizer()
bow_matrix = vectorizer.fit_transform(preprocessed_reviews)

# 輸出詞匯表
print("\n詞匯表:")
print(vectorizer.get_feature_names_out())

結果中,??vectorizer.get_feature_names_out()?? 會輸出詞匯表:

詞匯表:
['一次''一點''不錯''從未見過''令人''價格''體驗''值得''再點''味道''回味無窮''太慢''失望''實在'
'已經''彌補''影響''很快''很棒''總是''驚喜''感到''推薦''提高''無比''有待''服務''每次'
'用餐''真是''真是太''稍貴''美味''美味可口''雖然''覺得''這家''送得''速度''速度慢''道菜''配送'
'難吃''非常''食物''餐廳']

2.3 向量化文本(詞袋表示)

利用構建好的詞匯表,我們可以將每條評論轉化為一個稀疏向量。每個向量的長度等于詞匯表的大小,每個元素代表該詞匯在文本中出現的次數。

以下是生成 BoW 矩陣的代碼:

# 輸出 BoW 矩陣
print("\nBoW 矩陣:")
print(bow_matrix.toarray())

運行結果會生成一個稀疏矩陣,例如:

BoW 矩陣:
[[000000000000000001000000000000001000
0010010110]
 [000000000001001000000000000000000000
0000010010]
 [001001000000000000100000001000010000
0000000010]
 [000100000000000000000000001000000000
0100001010]
 [000000010000000000000010000000101000
1000000011]
 [000000000100000000001100000000000010
0000010010]
 [000000000000000000000001010000000100
0010010010]
 [100000011000000000000000000000001001
0000100100]
 [010000000100100100000000000000000000
0001010010]
 [000010000110000000000000100001001000
0000100000]
 [000000010000000000000000000000001011
0000000010]
 [000000000000000000011000000100001000
1000000010]
 [000000100001010010000000000010000000
0010010000]]

每一行是一個評論的 BoW 向量,每一列對應詞匯表中的一個單詞,元素值為該單詞的出現次數。

2.4 通過文本的向量表示,使用余弦相似度分析句子相似度

余弦相似度是衡量兩個向量之間夾角余弦值的指標,可以用于比較文本的內容相似程度

假設兩個向量為 A 和 B,其余弦相似度定義為:

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度-AI.x社區

余弦相似度的值在 [?1,1] 之間:

  • 1 表示兩個向量方向完全一致(文本非常相似)。
  • 0 表示向量正交(無相似性)。
  • -1 表示兩個向量方向完全相反(完全不相似)。

余弦相似度:???人工智能小白到高手:余弦相似度(Cosine Similarity)的簡單理解??

from sklearn.metrics.pairwise import cosine_similarity
# 計算余弦相似度
cos_sim_matrix = cosine_similarity(bow_matrix)
# 熱力圖的繪制
import matplotlib.pyplot as plt
import seaborn as sns

# 設置中文字體
plt.rcParams['font.sans-serif'] = ['SimHei']  # 使用黑體
plt.rcParams['axes.unicode_minus'] = False# 解決負號顯示問題

plt.figure(figsize=(12, 10))
sns.heatmap(cos_sim_matrix, annot=True, cmap='coolwarm', 
            xticklabels=[reviews[i] for i in range(len(reviews))],
            yticklabels=[reviews[i] for i in range(len(reviews))], fmt=".2f", 
            cbar_kws={"shrink": .8})

plt.title("評論之間的余弦相似度熱力圖", fontsize=16)
plt.xlabel("評論", fontsize=14)
plt.ylabel("評論", fontsize=14)

# 調整標簽的字體大小和旋轉角度
plt.xticks(rotation=45, ha='right', fontsize=10)
plt.yticks(rotation=0, fontsize=10)
plt.tight_layout()
plt.show()

矩陣圖中每個單元格表示兩個句子之間的余弦相似度,顏色越深,句子在語義上越相似。

例如,“食物非常美味,配送速度也很快”和“食物美味可口,配送速度也有待提高”交叉處的單元格顏色相對較深,說明它們具有較高的余弦相似度0.50,這意味著它們在語義上較為相似。

入門GPT | 詞袋模型(Bag of Words)輔助提升餐廳滿意度-AI.x社區

通過余弦相似度矩陣,可以進行以下分析:

  • 找出最相似的評論對,例如通過矩陣中非對角線的最大值。
  • 為新評論尋找最相近的現有評論,作為推薦系統的一部分。
  • 根據相似度對評論進行聚類或分類。

3. 統計詞頻,通過評論提升餐廳滿意度 

這些評論混合了正面和負面的反饋,統計矩陣中詞頻最高的詞,可以分析客戶關注的核心問題

# 計算詞頻
word_counts = np.asarray(bow_matrix.sum(axis=0)).flatten()
word_freq = dict(zip(vectorizer.get_feature_names_out(), word_counts))

# 按詞頻排序并輸出前10個詞
sorted_word_freq = sorted(word_freq.items(), key=lambda x: x[1], reverse=True)[:10]

print("\n詞頻最高的前10個詞:")
for word, freq in sorted_word_freq:
    print(f"{word}: {freq}")

通過對生成的 BoW 矩陣計算詞頻,進行分析,我們可以發現一些有趣的現象。

例如,詞匯“美味”、“值得”和“驚喜”在正面評論中出現頻率較高,而“太慢”在負面評論中更常見。這些詞的分布可以幫助我們快速定位客戶滿意和不滿的關鍵點。正面評論中的高頻詞可能表明用戶對食物質量滿意,而負面評論中的詞則表明配送慢是主要問題。

詞頻最高的前10個詞:
食物: 10
美味: 6
配送: 6
值得: 3
味道: 3
速度: 3
太慢: 2
驚喜: 2
服務: 2
雖然: 2

詞袋模型是早期的一種模型,相對簡單,存在兩個主要問題:

第一,它使用高維稀疏向量來表示文本,每個單詞對應詞匯表中的一個維度。這導致模型更適用于高維空間,而且計算效率低。

第二,詞袋模型在表示單詞時忽略了它們在文本中的上下文信息

Bag-of-Words 將文本看作由單詞構成的無序集合,通過統計單詞在文本中出現的頻次來表示文本。因此,Bag-of-Words主要用于文本分類、情感分析、信息檢索等自然語言處理任務中,在需要捕捉詞序信息的任務中表現較差,如機器翻譯和命名實體識別。

本文轉載自 ??AI取經路??,作者: AI取經路

收藏
回復
舉報
回復
相關推薦
99久久久无码国产精品| 99久久.com| 欧美丝袜丝交足nylons| 91亚色免费| 黑人操日本美女| 99精品在免费线中文字幕网站一区 | 亚洲午夜久久久久久久久| 天堂√中文最新版在线| 国产精品看片你懂得| 国产精品免费一区二区三区| 欧美国产日韩在线观看成人 | 欧美va亚洲va国产综合| 亚洲精品中文字幕在线| 黑人精品一区二区三区| 亚洲天堂久久| 中文字幕日韩av| 日本一区二区在线观看视频| 国内在线视频| 中文字幕乱码一区二区免费| 国产成人免费观看| 伊人免费在线观看| 亚洲欧美清纯在线制服| 亚洲免费福利视频| 人妻 丝袜美腿 中文字幕| 懂色aⅴ精品一区二区三区| 欧美激情在线看| 国产伦精品一区二区三区照片 | 日本成人超碰在线观看| 在线观看精品自拍私拍| 无需播放器的av| 毛片激情在线观看| 国产一区二区电影| 欧美黑人性视频| 国产精品嫩草影院俄罗斯| 免费精品一区| 88在线观看91蜜桃国自产| 国产视频九色蝌蚪| 国产在线xxx| 亚洲精品国产一区二区三区四区在线| 亚洲春色综合另类校园电影| 国产一区二区网站| 欧美日本一区二区视频在线观看| 中文字幕视频一区二区在线有码| 日韩精品在线播放视频| 国产激情欧美| 亚洲综合色视频| 偷拍盗摄高潮叫床对白清晰| 调教视频免费在线观看| 成人av网址在线| 亚洲综合国产精品| 国产一级片毛片| 亚洲日本激情| 97视频网站入口| 中文字幕求饶的少妇| 日韩区欧美区| 色av综合在线| 国产欧美高清在线| 日韩福利一区| 亚洲综合激情另类小说区| 免费在线国产精品| 国产成人精品av在线观| 国产美女一区二区三区| 欧美一区二区大胆人体摄影专业网站| 欧美成人短视频| 久久在线视频| 国产丝袜精品视频| 亚洲最大成人网站| 欧美系列电影免费观看| 亚洲а∨天堂久久精品9966 | 国产精品白丝av嫩草影院| 精品日韩在线观看| 一区二区视频观看| 国产精品羞羞答答在线观看| 在线观看国产精品日韩av| 无码一区二区精品| 国产成人一区| 视频一区视频二区国产精品| 特大黑人巨人吊xxxx| 亚洲深夜福利在线观看| 日韩你懂的在线播放| 日韩免费高清在线| 91麻豆精品| 精品视频一区二区三区免费| 制服丝袜中文字幕第一页| 视频一区视频二区欧美| 欧美一区二区三区四区高清| 中文在线字幕观看| 亚洲高清极品| 日韩精品免费在线播放| 欧美a在线播放| 欧美在线视屏| 欧洲美女7788成人免费视频| 又骚又黄的视频| 懂色中文一区二区在线播放| 欧美国产一二三区| 亚洲av成人无码久久精品老人| 国产日本亚洲高清| 欧美日韩国产高清视频| 免费a级在线播放| 亚洲高清在线精品| 少妇人妻在线视频| 欧美成人毛片| 亚洲精美色品网站| 男人av资源站| 久久性天堂网| 国产精品久久久久久久av大片| 在线观看亚洲天堂| 国产在线国偷精品免费看| 欧美大陆一区二区| 高清全集视频免费在线| 亚洲欧美激情小说另类| 免费观看日韩毛片| 欧美影视资讯| 亚洲国产精品资源| 亚洲乱码国产乱码精品精大量| 羞羞答答一区二区| 欧美猛少妇色xxxxx| 国产精品露脸视频| 91蜜桃传媒精品久久久一区二区| 欧美在线播放一区| 成年人视频网站在线| 国产精品午夜在线观看| 国产欧美日韩网站| 免费高潮视频95在线观看网站| 欧美日韩中文在线| 天天碰免费视频| 91麻豆精品一二三区在线| 亚洲欧美激情一区| 日韩免费av片| 国产精品资源网站| 国产精品亚洲天堂| 精品福利在线| 这里只有精品久久| 亚洲怡红院在线观看| 久久婷婷麻豆| 欧美日韩国产精品一区二区| 欧洲不卡av| 亚洲国产综合色| 欧美视频第三页| 色综合一区二区日本韩国亚洲 | 日本视频在线免费观看| 亚洲一区二区视频在线观看| 大肉大捧一进一出好爽视频| 久久综合五月婷婷| 海角国产乱辈乱精品视频| 国产高清不卡视频| 久久久精品一品道一区| 欧美日韩在线免费观看视频| 国产乱子精品一区二区在线观看| 日韩精品一区二区三区中文不卡| 手机av免费看| 欧美激情五月| 国产精品成人一区| 成年人在线免费观看| 亚洲va韩国va欧美va| 久久性爱视频网站| 亚洲精品一二| 亚洲综合中文字幕在线观看| 国产视频精品久久| 在线视频亚洲一区| 欧美波霸videosex极品| 亚洲视频播放| 91偷拍精品一区二区三区| 国产综合在线观看| 欧美吻胸吃奶大尺度电影| 男人的天堂影院| 国产精品普通话对白| 99免费在线观看视频| 国产在线xxx| 日韩三级精品电影久久久| 久久国产一级片| 久久国产婷婷国产香蕉| 欧美成人免费在线| 巨大黑人极品videos精品| 久久久999精品视频| www.97av| 亚洲免费大片在线观看| 伦理片一区二区| 欧美午夜免费影院| 久久精品午夜一区二区福利| 美足av综合网| 日韩欧美中文一区二区| 日韩一区二区视频在线| 欧美激情在线一区二区三区| 玩弄japan白嫩少妇hd| 91蜜臀精品国产自偷在线| 国产成人精品久久| 日韩国产福利| 91精品婷婷国产综合久久竹菊| 国产视频123区| 福利91精品一区二区三区| 免费大片在线观看| 国产精品vip| 日本免费一区二区三区| 久久精品九色| 国产精品88a∨| 国产私拍精品| 欧美视频在线观看一区| 免费人成在线观看| 东方欧美亚洲色图在线| 五月天亚洲视频| 99久久婷婷这里只有精品| 国产在线拍揄自揄视频不卡99| 888av在线| 欧美另类变人与禽xxxxx| 乱老熟女一区二区三区| 99久久精品国产毛片| 日本精品免费在线观看| 亚洲色图网站| 色女人综合av| 亚洲视频分类| 国产伦精品一区二区三区精品视频| 色婷婷av在线| 久久影院中文字幕| 在线免费观看的av网站| 欧美放荡的少妇| 精品视频久久久久| 91在线国内视频| 极品白嫩少妇无套内谢| 野花国产精品入口| 国产91视频一区| 欧美成人自拍| 日韩一区不卡| 精品精品视频| 8090成年在线看片午夜| 免费污视频在线| 久久艳片www.17c.com| 在线免费看黄| 欧美成人aa大片| 国产强被迫伦姧在线观看无码| 亚洲曰韩产成在线| 欧美三级日本三级| 亚洲视频每日更新| 538国产视频| 99久久精品免费看| 亚洲一区二区三区无码久久| 东方欧美亚洲色图在线| 天天天干夜夜夜操| 久久看片网站| 亚洲性生活网站| 日韩在线观看一区二区| 欧美日韩一区二区在线免费观看| 国产欧美日韩综合一区在线播放 | 香蕉视频亚洲一级| 日本欧美在线视频| 这里有精品可以观看| 久久久久女教师免费一区| 你懂的在线观看视频网站| 亚洲国产日韩一区| 国产免费不卡av| 3atv一区二区三区| 特级做a爱片免费69| 亚洲男帅同性gay1069| 老熟妇高潮一区二区三区| 亚洲欧美在线视频| 欧美又粗又大又长| 亚洲国产三级在线| 中文字幕亚洲精品一区| 亚洲免费av高清| 久久午夜无码鲁丝片| 国产精品妹子av| 精品国产欧美日韩不卡在线观看| 日韩毛片精品高清免费| 9999热视频| 亚洲大尺度视频在线观看| 91狠狠综合久久久| 欧美激情综合在线| 人妻人人澡人人添人人爽| 亚洲最新视频在线观看| 91久久国产视频| 欧洲生活片亚洲生活在线观看| 日韩欧美高清在线观看| 一区二区三区欧美在线观看| 久久精品亚洲无码| 色噜噜狠狠一区二区三区果冻| 伊人精品在线视频| 精品国精品国产| 国产在线视频网址| 亚洲精品日韩欧美| 2017亚洲天堂1024| 久久久亚洲欧洲日产国码aⅴ| 小早川怜子影音先锋在线观看| 国产精品扒开腿爽爽爽视频| 国产午夜精品一区在线观看 | www.51色.com| av在线综合网| 日韩av片在线| 国产午夜精品美女毛片视频| av直播在线观看| 99国产精品久久久久| 亚洲欧美精品久久| 亚洲成人免费在线观看| 国产亚洲欧美精品久久久www| 色综合色综合色综合| 国产美女免费视频| 日韩欧美一级精品久久| 国内av一区二区三区| 国产香蕉97碰碰久久人人| 国产视频精选在线| 久久久久久久久久久av| 91成人在线| 成人免费视频在线观看超级碰| 久久亚洲国产精品尤物| 九九九九九九精品| 欧美激情第10页| 久久99久久99精品| 麻豆成人久久精品二区三区小说| 婷婷激情四射五月天| 麻豆91精品91久久久的内涵| 在线观看免费视频国产| 国产精品国产三级国产普通话蜜臀| 日本网站在线播放| 色爱区综合激月婷婷| 中文字幕黄色av| 911精品国产一区二区在线| 国产人妖一区二区| 最近2019年好看中文字幕视频| 天堂在线中文网官网| 成人18视频| 九色精品91| av之家在线观看| 成人精品亚洲人成在线| 国产麻豆天美果冻无码视频| 一区二区三区在线视频观看58 | 日韩电影天堂视频一区二区| 精品9999| 欧洲成人午夜精品无码区久久| 亚洲欧美激情在线| 国产人妻精品一区二区三| 日韩亚洲精品电影| caoprom在线| 成人黄动漫网站免费| 91精品99| 日本成人在线免费观看| 中文字幕一区在线观看| 中文字幕91爱爱| 精品国产凹凸成av人网站| 黄色av网址在线免费观看| 久久久黄色av| 成人香蕉视频| 91久久久久久久久久| 精品在线网站观看| 一本一道久久a久久精品综合| 日韩不卡免费视频| 99riav国产精品视频| 欧美激情一区二区三区四区| 中文字幕免费观看| 亚洲欧美日韩爽爽影院| 欧洲成人综合网| 国产精品久久久久久久天堂第1集| 欧美日本国产| 午夜免费看视频| 欧美国产97人人爽人人喊| 日本学生初尝黑人巨免费视频| 亚洲第一男人天堂| 午夜伦理在线| 91免费国产网站| 国产欧美日韩精品一区二区三区| 亚洲色婷婷久久精品av蜜桃| 日韩专区一卡二卡| 欧美xxxxx精品| 色综合久久久久综合| 黄频网站在线观看| 另类专区欧美制服同性| 亚洲大奶少妇| 少妇高潮流白浆| 免费看黄色91| 亚洲精品视频久久久| 欧美影院一区二区三区| 香蕉视频成人在线| 国产精品日韩在线播放| 五月天综合网站| 国产污在线观看| 亚洲一本大道在线| 毛片在线播放网址| 成人女保姆的销魂服务| 视频一区在线观看| 国产免费一区二区三区视频| 国产欧美日韩不卡免费| 国产精品久久久久久久久久久久久久久久久 | 日韩理论片在线| 夜夜狠狠擅视频| 国产亚洲精品久久| 久久国产精品美女| 久久久免费视频网站| 国产精品高清亚洲| 黄色a在线观看| 国产做受69高潮| av成人app永久免费| 国产第一页视频| 国产午夜亚洲精品理论片色戒| 国产农村妇女毛片精品久久| 88国产精品欧美一区二区三区| 日本a级不卡| 三上悠亚在线一区| 香蕉成人伊视频在线观看| av资源在线观看免费高清| 国产成人女人毛片视频在线| 美女视频一区二区三区| 黑人操日本美女|