精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

Word2vec算法原理詳解

發布于 2025-1-9 12:57
瀏覽
0收藏

        今天我們要講解的算法是Word2vec。Word2vec(word to vector)顧名思義,這是一個將單詞轉換成向量形式的工具。通過轉換,可以把對文本內容的處理簡化為向量空間中的向量運算,計算出向量空間上的相似度,來表示文本語義上的相似度。

        Word2vec主要分為CBOW(Continuous Bag of Words)又叫連續詞袋和Skip-Gram兩種模式,今天我們主要講解的就是CBOW,接下來我們將從頭到尾的詳細講解Word2vec算法流程。

        先來講解一個背景知識:one-hot向量。獨熱向量是指使用N位0或1來對N個狀態進行編碼,每個狀態都有它獨立的表示形式,并且其中只有一位為1,其他位都為0。

        比如我們現在要編碼apple\bag\cat\dog\elephant這五個單詞,我們用5位向量來進行編碼,如下所示:

apple [1 0 0 0 0]

bag [0 1 0 0 0]

cat [0 0 1 0 0]

dog [0 0 0 1 0]

elephant [0 0 0 0 1]

如果我們現在想要編碼其他另外的單詞,那就需要更多位參與編碼,但是這五個單詞的編碼前5位仍然能夠是這樣,只不過后面省略號省略的部分都為0罷了。

Word2vec算法原理詳解-AI.x社區圖片

同時使用獨熱向量形成的特征矩陣會非常的稀疏,占用的空間非常的大。

        而Word2vec就可以解決這個問題,其核心思想是:上下文語境相似的詞,其語義也相似。Word2vec采用的是n元語法模型(n-gram model),即假設一個詞只與周圍n個詞有關,而與文本中的其他詞無關。所以Word2vec就是把這n個詞作為一個目標詞的特征,那么就可以把特征映射到 K 維向量空間,可以為文本數據尋求更加深層次的特征表示 。所以 Word2vec的基本思想是 通過訓練將每個詞映射成 K 維實數向量(K 一般為模型中的超參數),通過詞之間的距離(比如 cosine 相似度、歐氏距離等)來判斷它們之間的語義相似度。

        接下來看一看CBOW的結構。分為三層:輸入層,隱藏層和輸出層。

Word2vec算法原理詳解-AI.x社區圖片

        這里對傳統的神經網絡做了以下一些改造:

1. 首先,對于從輸入層到隱藏層的映射,沒有采取神經網絡的線性變換加激活函數的方法,而是采用簡單的對所有輸入詞向量求和并取平均的方法。比如輸入的是三個4維詞向量:(1,2,3,4),(9,6,11,8),(5,10,7,12),那么我們word2vec映射后的詞向量就是(5,6,7,8)。由于這里是從多個詞向量變成了一個詞向量。

2. 第二個改進就是從隱藏層到輸出的softmax層這里的計算量個改進。為了避免要計算所有詞的softmax概率,word2vec采樣了霍夫曼樹來代替從隱藏層到輸出softmax層的映射。

        說到哈夫曼樹,我們都不陌生,它是一種帶權路徑最短的二叉樹,也叫做最優二叉樹。如下圖,b是哈夫曼樹,他的帶權路徑只有48

Word2vec算法原理詳解-AI.x社區圖片

        哈夫曼樹的構造方法如下圖所示:先用權重最小的兩個作為最底層葉子結點,然后權重次小的,以此類推。保證權重越大的越早被遍歷到,節省時間和空間。同時遍歷葉子結點的路徑我們也可以用哈夫曼編碼表示,例如左節點是0,右節點是1,那么葉子結點c的哈夫曼編碼就是110。

Word2vec算法原理詳解-AI.x社區圖片

        使用霍夫曼樹有什么好處呢?首先,由于是二叉樹,之前計算量為V,現在變成了log2V。第二,由于使用霍夫曼樹是高頻的詞靠近樹根,這樣高頻詞需要更少的時間會被找到,這符合我們的貪心優化思想。

        有了哈夫曼樹,就有了哈夫曼編碼,我們這整個算法的核心就是:即對于給定的上下文,使得預測詞的哈夫曼編碼概率最大。如果你現在感到很疑惑,我來舉個例子:

        假設我們現在的語境是這一個簡單的只有四個單詞的document:{I drink coffee everyday}

我們選coffee作為中心詞,我們要根據單詞"I","drink"和"everyday"來預測一個單詞,并且我們希望這個單詞是coffee。將"I""drink""everyday"的one-hot向量作為輸入層的輸入

Word2vec算法原理詳解-AI.x社區圖片

    最開始輸入層的權重w參數是隨機生成的,接下來將這三個向量x初始乘以初始權重:w*x=v

Word2vec算法原理詳解-AI.x社區圖片

    將向量v求和并平均得到隱藏層的輸出向量c它:

Word2vec算法原理詳解-AI.x社區圖片

        從輸入層到隱藏層的邏輯過程講解完畢,接下來講解隱藏層到輸出層。

        我們在這一層用語料庫中所有的詞根據詞頻(就是哈夫曼中的權重)構建了哈夫曼樹,這樣每個詞 w 都可以從樹的根結點root沿著唯一一條路徑被訪問到,其路徑也就形成了其全局唯一的二進制編碼code,如"010011"。而我們從根結點開始走左子樹還是右子樹的概率是根據邏輯回歸二分類算法判斷的,邏輯回歸算法sigmoid,輸入是負無窮到正無窮,輸出是0到1之前的概率,sigmoid g函數和其導數如下圖所示:

Word2vec算法原理詳解-AI.x社區圖片

那么我們的輸出層的哈夫曼樹就可以表示成下圖:

Word2vec算法原理詳解-AI.x社區圖片

        假設目標詞是足球,那么足球的哈夫曼編碼是1001。這里我們指定負例是1,正例是0,那么我們可以得到上圖的第1次,第2次直到第四次的結果,那么足球的概率就是前面所有結點的概率相乘。d是每個結點的哈夫曼編碼,那么我們目標詞的概率可以寫成如下似然函數p,取對數,d=1就是負例,d=0就是正例:

Word2vec算法原理詳解-AI.x社區圖片

上面就是做了簡單的化簡,log連乘變成連加,log里面的指數放到log前面。接下來就是求這個似然函數的最大值,求極大值,我們都用梯度上升算法,那么下一步就是分別對變量x和c它求偏導數:

Word2vec算法原理詳解-AI.x社區圖片

        求導很簡單,上面有詳細的求導過程,由此我們就得到了參數c它的更新公式,同樣再對x求偏導也可以得到x的更新公式。

        不過我們知道隱藏層的x是上下文詞向量的和,不是上下文單個單詞的詞向量,怎么把這個更新量應用到單個單詞的詞向量上去呢?這里我們采用的是直接將更新量應用到每個詞向量上去:

Word2vec算法原理詳解-AI.x社區圖片

        還有一種提升訓練速度的方法就是負采樣,我們知道對于訓練語言模型來說,softmax層非常難算,畢竟你要預測的是當前位置是哪個詞,那么這個類別數就等同于詞典規模,因此動輒幾萬幾十萬的類別數,算softmax函數當然很費力啦。
        但是,如果我們的目標不在于訓練一個精準的語言模型,而只是為了訓練得到語言模型的副產物-詞向量,那么其實只需要用這里隱含的一個計算代價更小的“子任務”就好啦。想一想,給你10000張寫有數字的卡片,讓你找出其中的最大值,是不是特別費力?但是如果把里面的最大值事先抽出來,跟五張隨機抽取的卡片混到一起,讓你選出其中的最大值,是不是就容易多啦?
        負采樣就是這個思想,即不直接讓模型從整個詞表找最可能的詞了,而是直接給定這個詞(即正例)和幾個隨機采樣的噪聲詞(即采樣出來的負例),只要模型能從這里面找出正確的詞就認為完成目標啦。

        那么我們選擇哪些作為噪音呢?

        word2vec常用的負采樣策略有均勻負采樣、按詞頻率采樣等等。比較常用的采樣方法是一元分布模型的3/4次冪。該方法中,一個詞被采樣的概率,取決于這個詞在語料中的詞頻 ,其滿足一元分布模型(Unigram Model).

Word2vec算法原理詳解-AI.x社區圖片

其中V為整個詞表大小,   f(wi)為詞wi的詞頻。

至于為什么選擇3/4呢?其實是由論文作者的經驗所決定的。

假設由三個詞,,”我“,”和平“,”覬覦“ 權重分別為 0.9 ,0.01,0.003;經過3/4冪后:

我: 0.9^3/4 = 0.92

和平:0.01^3/4 = 0.03

覬覦:0.003^3/4 = 0.012

對于”覬覦“而言,權重增加了4倍;”和平“增加3倍;”我“只有輕微增加。

可以認為:在保證高頻詞容易被抽到的大方向下,通過權重3/4次冪的方式,適當提升低頻詞、罕見詞被抽到的概率。如果不這么做,低頻詞,罕見詞很難被抽到,以至于不被更新到對應的Embedding。

        所以我們可以得到如下公式g,w表示正確的預測詞,u表示錯誤的負采樣,那么1-預測中心詞u的概率還是預測正確的概率,所以我們的目標還是使得g最大化,那么還是求似然函數,并求導:

Word2vec算法原理詳解-AI.x社區圖片

那么求導還是一樣的方式,如下所示,對似然函數求偏導,然后得出更新的步長

Word2vec算法原理詳解-AI.x社區圖片

Word2vec算法原理詳解-AI.x社區圖片

本文轉載自 ??人工智能訓練營??,作者: 小A學習

收藏
回復
舉報
回復
相關推薦
有码中文亚洲精品| 91福利在线免费观看| 国产伦精品一区二区三区四区免费| 国产一级做a爰片在线看免费| 神马久久av| 欧美高清一级片在线| www.av91| 天堂а√在线资源在线| 亚洲免费一区三区| av网站大全在线观看| 欧美影院天天5g天天爽| 国产精品久久久久毛片软件| 99超碰麻豆| 青青视频在线免费观看| 欧美人与动xxxxz0oz| 欧美视频一区二区在线观看| 久久99精品久久久久久青青日本 | 中文在线综合| 色哟哟精品一区| 久久福利一区二区| gogogo高清在线观看免费完整版| 高清久久久久久| 国产精品video| 日本最新中文字幕| 欧美三级网页| 日韩中文综合网| 蜜桃精品成人影片| 999久久精品| 制服丝袜中文字幕亚洲| 亚洲人成无码www久久久| 麻豆电影在线播放| 中文字幕成人网| 免费av在线一区二区| 欧日韩在线视频| 国产综合自拍| 精品电影一区二区三区| 日韩肉感妇bbwbbwbbw| 国产黄大片在线观看| 亚洲激情综合网| 国产精品国产精品国产专区不卡| 日韩久久久久久久久久| 亚洲欧美日韩在线观看a三区| 欧美伦理91i| www色aa色aawww| 久久中文字幕av| 中文字幕欧美精品在线 | 中文字幕巨乱亚洲| 欧美一区二区三区电影在线观看| 天堂在线视频观看| 国产suv一区二区| 成人一区视频| 欧美日韩国产中文字幕| 久久久久久www| av中文在线资源库| 亚洲aaa精品| 久久久久久久久久网| 青青草免费观看免费视频在线| 国产盗摄视频一区二区三区| 91久久久久久国产精品| 久久久久亚洲av成人片| 欧美黄色一区| 欧美日韩电影在线观看| 免费中文字幕视频| 亚洲午夜激情在线| 久久人人爽人人爽人人片av高清| 国产亚洲自拍av| 亚洲激情视频| 全球成人中文在线| 怡红院av久久久久久久| 日韩高清在线电影| 91精品久久久久久久久青青| 国产日韩欧美一区二区东京热| 国内不卡的二区三区中文字幕 | 欧美日韩中出| 337p日本欧洲亚洲大胆色噜噜| 波多野结衣视频播放| 制服诱惑亚洲| 欧美日韩国产一二三| 亚洲网中文字幕| av综合网站| 日韩成人激情在线| 毛片久久久久久| 欧美激情视频一区二区三区在线播放| 欧美激情免费在线| youjizz在线视频| 另类人妖一区二区av| 91嫩草国产在线观看| 蜜桃视频污在线观看| 99re这里只有精品6| 午夜精品福利一区二区| 调教一区二区| 91成人看片片| 不卡的一区二区| 九一成人免费视频| 欧美三区视频| 精品久久久久久久人人人人传媒| 久久久国产精品无码| jiujiure精品视频播放| 欧美成人精品一区| 老熟妇一区二区三区| 国产乱码精品一区二区三区av| 精品无人区一区二区三区| aaa日本高清在线播放免费观看| 一区二区三区国产精品| 在线观看的毛片| av成人app永久免费| 伊人久久免费视频| 香蕉视频一区二区| 久久99精品国产91久久来源| 精品在线不卡| 18网站在线观看| 欧美三级电影网站| 日韩av无码一区二区三区不卡| 99久久精品费精品国产| 97视频免费在线观看| 国产麻豆免费观看| 国产免费久久精品| 精品一区在线播放| 黄色成人影院| 欧亚一区二区三区| 水蜜桃av无码| 欧美特黄a级高清免费大片a级| 国产精品嫩草影院久久久| 天堂在线视频免费观看| 亚洲综合色自拍一区| 亚洲精品在线视频播放| 精品国产欧美日韩| 欧美在线激情网| 天天综合网天天综合| 亚洲精品国产精华液| 亚洲综合欧美在线| 国产最新精品| 国产精品wwww| 国产三级在线观看| 91国产福利在线| 最近中文字幕免费| 性欧美长视频| 久久久一本精品99久久精品| av在线网页| 精品88久久久久88久久久| 国产探花在线播放| 韩国精品一区二区| 中文字幕一区二区三区乱码| yy6080久久伦理一区二区| 亚洲少妇中文在线| 中文字幕免费观看| 国产日本欧美一区二区| 日本一本二本在线观看| 亚洲成在人线免费观看| 中文字幕日韩av电影| 91丝袜一区二区三区| 久久久欧美精品sm网站| 亚洲日本一区二区三区在线不卡| 成人啊v在线| 中文字幕精品网| 在线观看xxxx| 自拍偷拍欧美激情| 69久久精品无码一区二区| 最新精品国产| 国产美女99p| 欧美三级网站| 国产亚洲一区二区在线| 中文在线免费观看| 亚洲欧洲日韩一区二区三区| 在线观看视频你懂得| 在线一级成人| 国产成人啪精品视频免费网| 国产一区二区三区福利| 欧美三级中文字| 国产女人18水真多毛片18精品| 国产人成精品一区二区三| 久久亚洲国产精品日日av夜夜| 国产精品专区免费| 中文字幕久久久| 99精品久久久久久中文字幕| 亚洲综合色婷婷| 中文幕无线码中文字蜜桃| 日韩国产成人精品| 亚洲色图都市激情| 欧美一区 二区| 国产精品专区一| 青草视频在线免费直播 | 婷婷久久综合| 精品国产_亚洲人成在线| 欧洲av不卡| 久久久av网站| 日本电影一区二区在线观看 | 亚洲成人第一区| 久久精品亚洲国产奇米99| 中文字幕在线导航| 欧美日本二区| 日韩片电影在线免费观看| 麻豆精品久久| 日产精品99久久久久久| av免费网站在线观看| 亚洲欧美日本另类| 日本污视频在线观看| 国产欧美综合色| 美女露出粉嫩尿囗让男人桶| 日本欧美加勒比视频| 黄色成人在线免费观看| 成人在线免费视频观看| 国内精品视频免费| 精品伊人久久| 国产精品美女久久久久av超清| 9765激情中文在线| 久久精品国产一区| 久青草国产在线| 精品国产伦一区二区三区观看方式| 亚洲永久精品一区| 性久久久久久久久久久久| 久久国产高清视频| 国内成+人亚洲+欧美+综合在线| 久久国产亚洲精品无码| 精品av导航| 91在线高清免费观看| 日本免费久久| 91精品91久久久久久| 视频一区二区三区国产| 欧美videos中文字幕| 91麻豆一区二区| 在线一区二区三区做爰视频网站| 国产精品a成v人在线播放| 亚洲柠檬福利资源导航| 国产精品麻豆一区| 国产午夜精品久久久久久久| a天堂视频在线观看| 国产高清久久久久| 色综合五月婷婷| 加勒比av一区二区| 人人干人人干人人| 日本不卡123| 日本三区在线观看| 视频一区二区三区中文字幕| 欧美成人一区二区在线观看| 亚洲小说欧美另类婷婷| 亚洲天堂第一区| 综合一区av| 自拍偷拍视频在线| 亚洲精品二区三区| 黄色a级在线观看| 亚洲二区三区不卡| 97超碰人人爱| 最新国产精品久久久| 蜜臀av性久久久久蜜臀av| 亚洲午夜精品一区二区国产 | 免费高清在线观看| 日韩亚洲国产中文字幕| 麻豆传媒在线观看| 九九热99久久久国产盗摄| 综合久久2o19| 欧美激情欧美激情| 99re6在线精品视频免费播放| 久久全国免费视频| 中文字幕乱码在线播放| 国产成人涩涩涩视频在线观看 | 亚洲福利视频在线| 五月婷婷伊人网| 亚洲精品中文字幕女同| 久久精品蜜桃| 色哟哟入口国产精品| 成人免费网站在线观看视频| 欧美大片免费看| 黄频免费在线观看| 国产精品96久久久久久| 国产欧美在线观看免费| 91在线视频精品| 国内精品国产成人国产三级粉色 | 男女网站在线观看| 最新中文字幕亚洲| 亚洲按摩av| 欧美在线激情视频| 日韩精品第二页| 粉嫩av一区二区三区免费观看| 清纯唯美亚洲经典中文字幕| 日韩亚洲欧美精品| 影视亚洲一区二区三区| 91国视频在线| 激情综合色播激情啊| 尤物网站在线观看| 欧美国产成人在线| 国内偷拍精品视频| 日韩欧美在线第一页| 精品欧美一区二区久久久久| 天天综合色天天| 中文区中文字幕免费看| 精品国产凹凸成av人网站| 国产三级视频在线看| 欧美国产日韩一区| 日韩高清不卡| 懂色中文一区二区三区在线视频| 国产毛片一区二区三区 | 美女日韩在线中文字幕| 中文字幕第一页在线视频| 91年精品国产| 真实国产乱子伦对白在线| 欧美性猛交xxxx免费看| av一级黄色片| 一区二区三区视频观看| 黄色在线看片| 国产日韩欧美成人| 日韩欧美影院| 台湾无码一区二区| 毛片av一区二区| 中文字幕丰满孑伦无码专区| 亚洲精品国产视频| 中文字幕乱码人妻二区三区| 亚洲第一偷拍网| а√天堂官网中文在线| 国产福利视频一区二区| 国产香蕉精品| www.国产在线视频| 精品一区二区三区的国产在线播放 | 亚洲精品9999| 亚洲资源av| 免费不卡的av| 怡红院av一区二区三区| 夜夜爽8888| 正在播放国产一区| 羞羞影院欧美| 麻豆视频成人| 国产免费成人| 国产不卡一二三| 一区二区三区成人| av免费在线不卡| 久久激情视频免费观看| 九色成人搞黄网站| 欧美精品一区三区在线观看| 日韩午夜一区| 国产免费一区二区三区最新6| 亚洲欧美色综合| 国产男男gay体育生白袜| 最近更新的2019中文字幕| 九色成人搞黄网站| 亚洲国产日韩综合一区| 日韩成人精品在线观看| 国产美女免费网站| 色久综合一二码| 黄色影院在线播放| 国产精品6699| 日韩.com| 久久久久xxxx| 亚洲乱码国产乱码精品精可以看| 99在线精品视频免费观看软件| 久久成人在线视频| 欧洲大片精品免费永久看nba| 欧美性猛交内射兽交老熟妇| 国产成人午夜99999| 久久久久97国产| 亚洲黄色av女优在线观看| 国产在线美女| 欧美日韩一区综合| 蜜臀91精品一区二区三区 | 日本一区高清| 国产精品a久久久久久| 日韩欧美1区| 亚洲va综合va国产va中文| 成人福利在线看| 国产成人无码精品久在线观看| 91久久免费观看| 国产爆初菊在线观看免费视频网站| 国产精品久久久久久久7电影 | www.成年人视频| 99精品在线观看视频| 特级毛片www| 中文字幕亚洲无线码在线一区| 中文成人在线| 岛国大片在线播放| 久久精品在这里| 国产乱码精品一区二区| 欧美激情欧美激情| 国产不卡一区| 亚洲图片 自拍偷拍| 午夜国产精品一区| www.在线视频.com| 亚洲www永久成人夜色| 国产欧美丝祙| 蜜桃av.com| 亚洲国产精品久久| 全球最大av网站久久| 国产91在线亚洲| 久久久www免费人成精品| 一区二区三区www污污污网站| 久久国产精品久久国产精品| 欧美变态网站| 天堂av2020| 欧美日韩国产精品一区二区三区四区| av片在线看| 国产精品免费在线播放| 美女爽到高潮91| 日本一本高清视频| www亚洲欧美| 台湾佬综合网| aaaaaaaa毛片| 欧美伊人久久久久久久久影院 | 136国产福利精品导航网址| av电影网站在线观看| 精品国免费一区二区三区| 欧美日韩精品免费观看视欧美高清免费大片| 三年中国中文在线观看免费播放 |