精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

入門GPT | 詞的向量表示(Word2Vec和Embedding)

發布于 2025-6-18 06:44
瀏覽
0收藏

在自然語言處理(NLP)領域,我們面臨的第一個挑戰就是如何讓計算機理解人類的語言。

計算機不認識漢字或字母,它們只懂數字。

因此,我們需要一種方法,將詞語轉換成計算機可以處理的數字形式。

1. 什么是詞向量?

我們不能直接把"蘋果"這兩個字輸入到機器學習模型中。模型無法進行任何計算。我們需要先把它變成一組數字。

早期的方法

早期自然語言處理方法,如獨熱編碼和詞袋模型,雖然對某些機器學習任務有用,但并不能捕捉到詞的意義或上下文信息。這意味著潛在的關系,如語境相近性,無法在詞集合中捕捉到。

例如,獨熱編碼無法捕捉到"狗"和"貓"都指的是經常在家庭寵物上下文中討論的動物這類簡單關系。這類編碼通常為簡單的自然語言處理任務提供了基準(例如,電子郵件垃圾郵件分類器),但對于更復雜的任務,如翻譯和語音識別,則缺乏足夠的復雜性。

本質上,這些傳統的自然語言處理方法并不能捕捉詞組之間語法(結構)和語義(意義)的關系,因此它們是以一種非常簡單的方式來表示語言。

現代的方法:分布式表示 (Distributed Representation)

為了解決以上問題,研究者們提出了"分布式表示"的思想。這種方法不再使用稀疏的高維向量(如獨熱編碼),而是用一個稠密的、低維的向量來表示一個詞,這就是詞向量,或者叫詞嵌入(Word embedding)

分布式表示 (Distributed Representation) 是?種表示?法,它將離散的符號(如單詞)映射到連續的向量空間中。在這個空間中,每個維度不是對應單個符號,?是表示符號的某種特征或屬性。分布式表示通過捕獲單詞之間的相似性和關系,能更好地描述和處理?然語?數據。

分布式表示這個概念最早可以追溯到1986年,當時,杰弗?·?頓、?衛·魯梅爾哈特和羅納德· 威廉姆斯在?篇名為《Learning representations by back-propagating errors》(通過反向傳播誤差進?表示學習)的論?中描述了?種通過反向傳播(backpropagation)算法訓練多層神經?絡的?法,這種?法使得神經?絡能夠學到輸?數據的分布式表示。

然?,分布式表示很晚才在NLP領域得到應?。20世紀90年代,約書亞·本吉奧和其他研究?員開始嘗試將神經?絡應?于詞匯和句?表示的學習,推進了神經?絡語?模型的發展,以及后來的Word2Vec等詞嵌?技術的出現。

稀疏向量中,?部分元素的值為0,只有少數元素的值?零。稀疏向量通常?于表示?維數據,其中許多維度的值為零。

詞袋模型就是?種稀疏向量表示。在詞袋模型中,每個?檔??個向量表示,向量的?度等于詞匯表中的詞數量,向量的每個元素表示相應詞在?檔中出現的次數。由于?部分單詞可能不會出現在給定?檔中,因此詞袋模型中的向量通常是稀疏的。?我們常?的One-Hot編碼,當然更是稀疏了,每?個One-Hot編碼中,都有?量的0,?只有?個1。

稠密向量中的元素?部分為?零值。稠密向量通常具有較低的維度,同時能夠捕捉到更豐富的信息。Word2Vec就是?種典型的稠密向量表示。稠密向量能夠捕捉詞與詞之間的語義和語法關系,使得具有相似含義或相關性的詞在向量空間中距離較近。

相比之下,詞向量將單詞表示為多維連續的浮點數,其中語義相似的單詞被映射到幾何空間中的鄰近點。

簡單來說,一個詞向量是一行實數值,其中每個數值捕捉單詞意義的一個維度,而語義相似的單詞具有相似的向量。

這意味著像輪子和發動機這樣的詞應該與汽車有相似的詞向量(因為它們的意義相似),而香蕉則應該相距甚遠。換句話說,語義上相似的詞會在一個鄰近的向量空間中被映射。

將單詞表示為向量的美妙之處在于,它們可以應用于數學運算。例如,我們可以對向量進行加減運算——這里的一個經典例子是通過使用詞向量,我們可以確定:

king - man + woman = queen

我們可以從"king"(即男性)的詞向量中減去一個含義,再加上另一個含義(女性),從而顯示這個新的詞向量(king - man + woman)與"queen"的詞向量最為接近。

詞向量中的數字代表該詞在各個維度上的分布權重。簡單來說,每個維度代表一個含義,詞在該維度上的數值權重反映了其與該含義的相關性。因此,詞的語義是嵌入在向量的各個維度中的。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

那么,我們如何才能得到這種神奇的詞向量呢?這就引出了 Word2Vec。

2. 什么是 Word2Vec?

Word2vec 是自然語言處理(NLP)中用于獲取詞向量表示的技術。這些向量通過周圍詞匯來捕捉詞義信息。word2vec 算法通過建模大規模語料庫中的文本來估算這些表示。一旦訓練完成,此類模型可以檢測同義詞或為不完整句子提供額外詞匯建議。

Word2vec 是在 2013 年由 Mikolov 領導的谷歌研究團隊創建、專利并發布的,基于兩篇論文

《Efficient Estimation of Word Representations in Vector Space》:???https://arxiv.org/abs/1301.3781??

《Distributed Representations of Words and Phrases and their Compositionality》:???https://arxiv.org/abs/1310.4546??

Word2vec 可以使用兩種模型架構來生成詞的分布式表示(distributed representations):CBOW 和 Skip-gram。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

使用 Word2vec 算法創建的嵌入向量相比于早期算法(例如使用 n-grams 和潛在語義分析的算法)具有一些優勢。

Word2vec 將一個詞表示為捕捉詞間關系的高維數字向量。特別是,出現在相似上下文中的詞會被映射到通過余弦相似度衡量的鄰近向量。這表明詞之間的語義相似程度,例如 walk 和 ran 的向量相近,"but"和"however"的向量相近。

這個算法?以前的?法更加?效,能夠輕松地處理?規模的?本數據。因此,Word2Vec迅速流?起來。

截至 2022 年,傳統的 Word2vec 方法被描述為"過時"。

基于Transformer的模型,如 ELMo 和 BERT,在類似于 Word2vec 的詞嵌入模型上增加了多個神經網絡注意力層,已被認為是自然語言處理領域的最先進技術。

3. CBOW (Continuous Bag-of-Words) 連續詞袋模型

CBOW 的目標是根據上下文來預測中心詞

想象一句話:"the quick brown fox jumps over the lazy dog"。我們的任務是根據 ??fox??? 前后各兩個詞(即 ??{quick, brown, jumps, over}???)來預測 ??fox??。

工作原理:

CBOW模型的核心思想是利用周圍的上下文詞匯來預測目標中心詞。

具體來說,首先選擇一個中心詞(Target Word)并定義一個"窗口大小"(Window Size),比如窗口大小為2,那么對于中心詞 ??fox???,它的上下文(Context)就是它前后各2個詞:??{quick, brown, jumps, over}??。

接下來,模型將上下文中所有詞的詞向量提取出來,通過求和或平均的方式將這些上下文詞向量合并成一個綜合的上下文向量,然后將這個綜合向量輸入到神經網絡中,網絡會輸出一個概率分布,表示詞匯表中每個詞作為中心詞的可能性。

訓練過程中,模型不斷調整詞向量的參數,使得根據上下文 ??{quick, brown, jumps, over}??? 預測出 ??fox?? 的概率達到最高,通過這種方式,語義相似的詞會在向量空間中聚集在一起。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

4. Skip-gram (跳字模型)

Skip-gram 的思路和 CBOW 正好相反,它的目標是根據中心詞來預測上下文。

還是用那句話:"the quick brown fox jumps over the lazy dog"。

工作原理:

Skip-gram模型的核心思想是利用中心詞來預測其周圍的上下文詞匯。

具體來說,首先選擇一個中心詞作為輸入,比如 ??fox???,然后定義一個窗口大?。╓indow Size),假設窗口大小為2,那么模型需要預測的上下文就是中心詞前后各2個詞:??{quick, brown, jumps, over}??。

模型將中心詞 ??fox?? 的詞向量輸入到神經網絡中,網絡會為每個可能的上下文位置輸出一個概率分布,分別預測在這些位置上出現各個詞匯的可能性。

訓練過程中,模型不斷調整詞向量的參數,使得根據中心詞 ??fox??? 能夠準確預測出其真實的上下文詞匯 ??{quick, brown, jumps, over}?? 的概率達到最高。

與CBOW不同的是,Skip-gram為每個中心詞-上下文詞對都進行獨立的學習,這使得它能夠更好地處理低頻詞,因為即使是生僻詞也能通過多個上下文位置得到充分的訓練。

入門GPT | 詞的向量表示(Word2Vec和Embedding)-AI.x社區

Word2Vec對整個?然語?處理領域產?了巨?的影響。

后來的許多詞嵌??法,如GloVe和fastText這兩種被?泛應?的詞向量,都受到了Word2Vec的啟發。

如今,Word2Vec已經成為詞嵌?領域的基?。它的出現使得更復雜的NLP任務,如?本分類、情感分析、命名實體識別、機器翻譯等,處理起來更輕松。這主要是因為Word2Vec?成的詞向量能夠捕捉到單詞之間的語義和語法關系。

值得注意的是,Word2Vec本身并不是?個完善的語?模型,盡管CBOW和Skip-Gram模型在訓練過程中學習了單詞之間的關系,但它們并未直接對整個句?的概率分布進?建模。?后來的模型,如基于循環神經?絡、?短期記憶?絡和Transformer的模型,則通過對上下?進?建模,更好地捕捉到了語?結構,從?成為更為強?的語?模型。

本文轉載自??AI取經路??,作者:AI取經路

已于2025-6-18 09:38:28修改
收藏
回復
舉報
回復
相關推薦
日本激情视频网站| 中出视频在线观看| 日本精品600av| 91丝袜国产在线播放| 国产精品亚洲精品| 欧美黄色免费观看| 精品国产乱码久久久久久1区2匹| 91麻豆精品国产91久久久久| 国产原创中文在线观看 | 久久精品免费在线| 久久av免费| 日韩精品一区二区三区四区视频| 亚洲熟妇av一区二区三区| 超碰在线caoporn| 久久久久国产一区二区三区四区 | 青青草原av在线| 久久亚洲道色| 91精品国产综合久久久久久漫画 | 久久都是精品| 成年无码av片在线| 久久久久久久毛片| 国产亚洲精品美女久久| 91麻豆精品国产| 999在线免费视频| 成人超碰在线| 亚洲免费观看高清在线观看| 色播五月综合| 欧美日韩在线精品一区二区三区激情综| 国内外成人在线| 国产精品久久久久高潮| 亚洲欧美综合自拍| 国产欧美另类| 欧美精品福利在线| 日本一级片免费| 青青草97国产精品麻豆| 亚洲精品日韩久久久| 潘金莲一级淫片aaaaa| 在线日韩三级| 欧美日韩国产色站一区二区三区| 成年人视频在线免费| 国模私拍一区二区国模曼安| 夜夜夜精品看看| 亚洲av首页在线| 免费**毛片在线| 国产视频一区在线观看| 欧美一区二区三区在线播放| 三级视频网站在线| av亚洲精华国产精华精华| 国产高清精品一区二区三区| 亚洲av永久无码国产精品久久| 国产又黄又大久久| 亚洲a级在线播放观看| 国产精品一级二级| 激情图片小说一区| 91综合免费在线| 国产麻豆免费视频| 国产精品一区二区无线| 亚洲bt天天射| 成人精品在线播放| 99久久国产免费看| 久久久久久精| 国产视频精品久久| 国产精品免费视频一区| 中文字幕久精品免| 免费影视亚洲| 欧美日韩在线一区| 精品久久久久久久无码| 欧美日韩在线精品一区二区三区激情综合| 日本韩国欧美三级| 亚洲一区日韩精品| 日韩在线成人| 日韩av在线网站| 九色porny自拍视频| 精品久久综合| 久久中文字幕一区| 日本网站免费观看| 日韩精品久久久久久| 国产综合久久久久| 理论片中文字幕| 久久精品视频在线免费观看| 中国一区二区三区| 欧美xxx黑人xxx水蜜桃| 色偷偷88欧美精品久久久| 亚洲一级免费观看| 99精品在免费线中文字幕网站一区| 日韩av在线网址| 大地资源高清在线视频观看| 激情欧美国产欧美| 国产精品h在线观看| 国产日产亚洲系列最新| 99精品视频在线观看免费| 亚洲国产一区二区三区在线播| 成人在线app| 粉嫩老牛aⅴ一区二区三区| 福利在线一区二区三区| 亚洲一区二区三区久久久| 亚洲成人网久久久| 国产福利在线导航| 日韩天天综合| 国产欧美一区二区三区四区| 少妇又色又爽又黄的视频| 欧美国产欧美综合| 日韩精品在线中文字幕| 青青国产精品| 日韩av网站在线| 在线看的片片片免费| 亚洲欧美日韩精品一区二区| 亚洲字幕在线观看| 春暖花开成人亚洲区| 亚洲午夜av在线| 性chinese极品按摩| 欧美黑人巨大videos精品| 日韩中文字幕久久| 国产综合精品视频| 国产成人亚洲综合色影视| 日韩电影免费观看高清完整| 特级毛片在线| 欧美电影一区二区| 久久精品—区二区三区舞蹈| 亚洲人成免费| 97人人澡人人爽| 免费人成在线观看播放视频| 色成年激情久久综合| 亚洲精品激情视频| 欧美国产激情| 国产综合色香蕉精品| 国产黄在线看| 一本到一区二区三区| 大乳护士喂奶hd| 国内视频精品| 91精品天堂| 色爱综合区网| 欧美一级一级性生活免费录像| 国产成人精品视频免费| 日韩va亚洲va欧美va久久| 久久久久一区二区三区| 极品视频在线| 亚洲国产欧美自拍| 日韩三级免费看| 波多野结衣中文字幕一区 | 另类激情视频| 亚洲福利视频在线| 国产在线视频99| 国产91在线|亚洲| 久草视频这里只有精品| 久久久久久亚洲精品美女| 久久视频国产精品免费视频在线| 在线观看免费视频a| 国产精品欧美一级免费| 色噜噜狠狠一区二区| 水蜜桃精品av一区二区| 国产日韩在线观看av| 欧美激情免费| 日韩一区二区电影在线| 久久精品www| 高清不卡一区二区在线| 久操网在线观看| 日韩三区视频| 国产精品海角社区在线观看| 搞黄视频免费在线观看| 欧美中文字幕不卡| 久久高清内射无套| 国产91精品入口| 亚洲自偷自拍熟女另类| 欧美禁忌电影网| 国产欧美日韩免费| 成人看片免费| 亚洲国产三级网| 亚洲不卡视频在线观看| 中文字幕国产一区二区| 精品人妻一区二区三| 伊人蜜桃色噜噜激情综合| 牛人盗摄一区二区三区视频| av在线一区不卡| 日韩三级电影网址| 精品日韩av一区二区| www.国产福利| 午夜精品网站| 精品蜜桃传媒| 国产成人福利夜色影视| 久久国产精彩视频| 日本精品久久久久久| 欧洲亚洲国产日韩| 成年人一级黄色片| 韩日欧美一区二区三区| 国产精品毛片a∨一区二区三区| 亚洲一区影音先锋| 日韩一区二区三区四区五区六区| 国产精品一区二区久久久久| 农村少妇久久久久久久| 日韩欧美第一页| 四虎884aa成人精品| 99久久精品国产毛片| 欧美日韩中文不卡| 在线成人黄色| 老汉色影院首页| 亚洲国产国产| 国色天香2019中文字幕在线观看| 国产精品一区二区小说| 婷婷精品进入| 欧美日韩精品综合在线| 日韩欧美精品一区二区| 麻豆久久久久| 欧美亚洲激情视频| av中文字幕在线播放| 国产婷婷97碰碰久久人人蜜臀| 国产日韩免费视频| 欧洲精品视频在线观看| 国产一级中文字幕| 国产精品情趣视频| aaaaa级少妇高潮大片免费看| 国产美女在线精品| 日韩一级在线免费观看| 激情文学一区| 7777在线视频| 不卡中文一二三区| 麻豆成人在线播放| 国产精品jk白丝蜜臀av小说| 91色精品视频在线| 福利一区和二区| 日韩av电影院| 人成在线免费网站| 欧美大片网站在线观看| 免费看a在线观看| 中文字幕无线精品亚洲乱码一区 | 国产精品色婷婷在线观看| 国产999精品久久久| 蜜桃视频在线观看播放| 欧美激情精品久久久久久久变态| 麻豆系列在线观看| 中文字幕亚洲一区二区三区五十路| 亚洲人成色777777精品音频| 精品久久久久久久久久久院品网| 国产精品一区二区av白丝下载 | 国产精品免费久久久久影院| 在线天堂资源| 97成人超碰免| av福利导福航大全在线| 久久久久久999| 日本无删减在线| 欧美福利小视频| 神马午夜伦理不卡| 超碰91人人草人人干| 黄色免费网站在线观看| 久久视频这里只有精品| 国产色在线观看| 欧美成人精品在线| 五月花成人网| 91精品国产91久久久久| 麻豆国产在线| 日本乱人伦a精品| 午夜激情成人网| 国产精品欧美风情| 欧美一级做a| 亚洲free性xxxx护士白浆| 国产精一区二区| 成人国产一区二区| 国产欧美三级电影| 女女同性女同一区二区三区91| 亚洲人成精品久久久 | 久久国产麻豆精品| 亚洲一区二区三区观看| 国产精品一级片在线观看| 精品无码av一区二区三区不卡| 成人小视频免费在线观看| 香港三级日本三级| 久久精品夜夜夜夜久久| 女人18毛片毛片毛片毛片区二| 椎名由奈av一区二区三区| 精品97人妻无码中文永久在线| 亚洲一区二区三区在线| 亚洲天堂一区在线观看| 欧美又粗又大又爽| 亚洲自拍偷拍另类| 精品国一区二区三区| 亚洲日本在线播放| 中文字幕在线看视频国产欧美| 黄a在线观看| 久久久之久亚州精品露出| av亚洲一区二区三区| 91av免费看| 美女少妇全过程你懂的久久| 一本色道久久99精品综合| 国户精品久久久久久久久久久不卡| 国产免费成人在线| 黄一区二区三区| 亚洲制服丝袜在线播放| 国产精品毛片久久久久久| 日本网站在线免费观看| 欧美日韩高清一区二区三区| 成人毛片在线免费观看| 中文字幕亚洲无线码a| 性xxxxfjsxxxxx欧美| 国产成人aa精品一区在线播放 | 免费观看在线综合色| www.四虎精品| 亚洲国产精品黑人久久久| 久视频在线观看| 欧美羞羞免费网站| 人妻少妇精品无码专区| 日韩视频免费在线观看| 日韩欧美一中文字暮专区| 亚洲aaa激情| 国产欧美日韩精品一区二区免费 | 亚洲国产另类 国产精品国产免费| 永久av在线| 欧美中文在线字幕| 伊人久久影院| 宅男噜噜99国产精品观看免费| 久久电影一区| 久久久老熟女一区二区三区91| 国产精品国产三级国产aⅴ原创| 日本三级视频在线| 日韩亚洲欧美高清| 五月婷婷在线观看| 国产成人激情视频| 欧美一性一交| 高清无码视频直接看| 久久国产精品第一页| 国产一级久久久久毛片精品| 精品久久久久久久久久久久久| 国产91视频在线| www日韩中文字幕在线看| 国产在线|日韩| 欧美日韩精品综合| 国产色综合网| 麻豆精品国产传媒av| 亚洲欧美一区二区三区极速播放 | 亚洲开发第一视频在线播放| 性感少妇一区| 最近中文字幕无免费| 午夜伊人狠狠久久| 黄色成人一级片| 欧美激情乱人伦一区| 麻豆一区在线| 少妇高潮大叫好爽喷水| 国产伦精一区二区三区| 91精品国产闺蜜国产在线闺蜜| 欧美日韩一区二区三区四区五区| 久久久久久女乱国产| 欧美在线观看日本一区| 欧美亚洲色图校园春色| 黄色大片中文字幕| av亚洲精华国产精华精| 在线观看 中文字幕| 日韩av综合中文字幕| 激情国产在线| 久久久久久久久久久久久9999| 国产精品久久久亚洲一区| 人妻少妇精品视频一区二区三区| 懂色av中文一区二区三区天美 | 欧美精品国产白浆久久久久| 拔插拔插海外华人免费| 99在线精品视频| 久久久久99精品成人片三人毛片| 亚洲精选在线观看| 精品欧美一区二区三区在线观看 | 国产精品专区免费| 欧美专区一二三 | 精品久久久久久久久久| 亚洲aaa在线观看| 国产91在线视频| 日韩精品一区二区久久| 性欧美在线视频| 亚洲无人区一区| 亚洲aaaaaaa| 国产日韩av高清| 欧美三级网页| 精品无码人妻一区| 欧美日韩色一区| 四虎亚洲精品| 蜜桃成人在线| 精品一区二区免费在线观看| 强行糟蹋人妻hd中文| 亚洲精品电影在线| 中文字幕日本一区二区| 天堂av免费看| 91一区二区三区在线观看| 少妇久久久久久久| 欧美成人国产va精品日本一级| 激情亚洲另类图片区小说区| 国产成人手机视频| 亚洲蜜臀av乱码久久精品蜜桃| 五月天婷婷社区| 国产精品亚洲精品| 99精品视频免费观看视频| 长河落日免费高清观看| 亚洲第一福利视频| 免费成人黄色网| 妞干网在线视频观看| 国产精品久久久久久亚洲伦| 亚洲黄色在线免费观看| 国产成人在线精品| 国产精品v日韩精品v欧美精品网站| 亚洲国产无码精品| 欧美一卡在线观看| 成人国产激情| 国产特级黄色大片| 亚洲精品欧美在线| 国产中文在线|