精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

除了自然語言處理,你還可以用Word2Vec做什么?

開發 開發工具 自然語言處理
這篇文章的目標是展示我們如何能夠使用一種詞嵌入方法,Word2Vec(2013,Mikolov 等),來把一個具有大量模態的分類特征轉換為一組較小的易于使用的數字特征。

當使用機器學習方法來解決問題的時候,擁有合適的數據是非常關鍵的。不幸的是,通常情況下的原始數據是「不干凈」的,并且是非結構化的。自然語言處理(NLP)的從業者深諳此道,因為他們所用的數據都是文本的。由于大多數機器學習算法不接受原始的字符串作為輸入,所以在輸入到學習算法之前要使用詞嵌入的方法來對數據進行轉換。但這不僅僅存在于文本數據的場景,它也能夠以分類特征的形式存在于其他標準的非自然語言處理任務中。事實上,我們很多人都在苦苦研究這種分類特征過程,那么詞嵌入方法在這種場景中有什么作用呢?

這篇文章的目標是展示我們如何能夠使用一種詞嵌入方法,Word2Vec(2013,Mikolov 等),來把一個具有大量模態的分類特征轉換為一組較小的易于使用的數字特征。這些特征不僅易于使用,而且能夠成功學習到若干個模態之間的關系,這種關系與經典詞嵌入處理語言的方式很相似。

Word2Vec

觀其伴,知其意。(Firth, J. R. 1957.11)

上述內容準確地描述了 Word2Vec 的目標:它嘗試通過分析一個詞的鄰詞(也稱作語境)來確定該詞的含義。這個方法有兩種不同風格的模型:CBOW 模型和 Skip-Gram 模型。在給定語料庫的情況下,模型在每個語句的詞上循環,要么根據當前單詞來預測其鄰詞(語境),要么根據當前的語境來預測當前的詞,前者所描述的方法被稱作「Skip-Gram」,后者被稱作「連續性詞包,continuous bag of words(CBOW)」。每個語境中單詞數目的極限是由一個叫做「窗大小,Window Size」的參數來決定的。

兩種 Word2Vec 結構,其中 w(t) 代表的是當前單詞,w(t-2)..w(t+2) 代表的是語境單詞。(Mikolov 等人. 2013)

因此,如果你選擇了 Skip-Gram 方法,Word2Vec 就會使用一個淺層的神經網絡,也就是說,用一個只具有一個隱藏層的神經網絡來學習詞嵌入。網絡首先會隨機地初始化它的權重,然后使用單詞來預測它的語境,在最小化它所犯錯誤的訓練過程中去迭代調整這些權重。有望在一個比較成功的訓練過程之后,能夠通過網絡權重矩陣和單詞的 one-hot 向量的乘積來得到每一個單詞的詞向量。

注意:除了能夠允許將文本數據進行數字表征之外,結果性嵌入還學習到了單詞之間的而一些有趣的關系,可以被用來回答類似于下面的這種問題:國王之于王后,正如父親之于......?

如果你想了解更多的關于 Word2Vec 的細節知識,你可以看一下斯坦福大學的課程(https://www.youtube.com/watch?v=ERibwqs9p38),或者 TensorFlow 的相關教程(https://www.tensorflow.org/tutorials/word2vec)。

應用

我們在 Kwyk 平臺上(https://www.kwyk.fr/)上提供在線的數學練習。老師給他們的學生布置作業,每次練習完成的時候都會有一些數據被存儲下來。然后,我們利用收集到的數據來評價每個學生的水平,并且給他們量身制作對應的復習來幫助他們進步。對于每一個被解答的練習作業,我們都保存了一系列的標識符來幫助我們區分以下信息:這是什么練習?作答的學生是誰?屬于哪一個章節?....... 除此之外,我們還會根據學生是否成功地解答了這個題目來保存一個分數,要么是 0,要么是 1。然后,為了評價學生的分數,我們必須預測這個分數,并且從我們的分類器中得到學生成功的概率。

正如你所看到的,我們的很多特征都是可以分類的。通常情況下,當模態的數目足夠小的時候,你可以簡單地將 n 模態的分類特征轉換為 n-1 維的啞變量,然后用它們去訓練。但是當模態是成千上萬級別的時候——就像在我們應用中的一些情況一樣——依靠啞變量就顯得沒有效率并且不切實際。

為了解決這個問題,我們通過一個小技巧采用 Word2Vec 把分類特征轉換為數量相當少的可用連續特征。為了闡述這個想法,我們以「exercise_id」為例來說明:exercise_id 是一個分類特征,它能夠告訴我們被解答過的練習題是哪一個。為了能夠使用 Word2Vec,我們提供一個語料庫,也就是將要輸入到我們的算法中的一系列句子。然而,原始的特征只是一個 ID 的列表而已,它本質上并不是語料庫:它的順序完全是隨機的,相近的 ID 也并沒有攜帶著其相鄰的 ID 任何信息。我們的技巧包括把某個老師布置的一次作業看做一個「句子」,也就是一連串的 exercise_id。結果就是,所有的 ID 會很自然地以等級、章節等標簽被收集在一起,然后 Word2Vec 可以直接在這些句子上面開始學習練習的嵌入(exercise embedding,對應于 Word embedding)。

事實上,正是由于這些人為的句子我們才得以使用 Word2Vec,并得到了很漂亮的結果:

 Word2Vec

根據級別著色的練習嵌入(exercise embedding)(用 PCA 方法得到了 3 個主成分,就是圖中的 3 維空間);圖中的 6e, 5e, 4e, 3e, 2e, 1e 以及 tm 是法國學生的水平,與美國的 6th, 7th, 8th, 9th, 10th,11th 和 12th 等價。

如我們所看到的的,結果性嵌入是有結構的。事實上,練習的 3D 投影云是螺旋形的,高級別的練習緊跟在較低級別的后面。這也意味著嵌入成功地學會了區分不同級別的練習題目,并且把練習題目重新分組,具有相似級別的被放在了一起。但是這還不是全部,使用非線性的降維技術之后,我們可以將整個嵌入降維成一個具有相同特征的實值變量。換句話說,我們得到了一個關于練習復雜度的特征,6 年級(6th)最小,隨著練習越來越復雜,這個變量越來越大,直到 12 年級達到該變量的***值。

更有甚者,正如 Mikolov 在英語單詞上做到的一樣,嵌入還習得了練習之間的關系:

嵌入能夠學習到的關系的一些實例

上圖展示了我們的嵌入能夠學習到的關系的一些實例。所以當我們問「一個數字相加的練習之于一個數字相減的練習,正如一個時間相加的練習之于......?」之后,嵌入給出了如下的答案:「一個時間相減的練習」。具體而言,這意味著如果我們提出這個問題:嵌入 [減(數字)Substract(Numbers)] --嵌入 [加(數字),Add(Numbers)],并把它添加到學生練習的嵌入中,其中學生被要求來做時間的加法(例如,小時、分鐘等等),那么與之最接近的一個嵌入就是包含時間減法的練習。

結論

總之,詞嵌入技術在將文本數據轉換成便于機器學習算法直接使用的實值向量時是有用的,盡管詞嵌入技術主要用在自然語言處理的應用中,例如機器翻譯,但是我們通過給出特定的用在 Kwyk 中的例子展示了這些技術在分類特征處理中也有用武之地。然而,為了使用諸如 Word2Vec 這樣的技術,你必須建立一個語料庫——也就是說,一組句子,其中的標簽已經被排列好了,所以其語境也是已經隱式創建好了。上述實例中,我們使用在網站上給出的作業來創建練習的「句子」,并且學習練習嵌入。結果就是,我們能夠得到新的數字特征,這些特征能夠成功地學習練習之間的關系,比它們被打上的那組原始標簽更加有用。

向 Christophe Gabar 致謝,他是我們 Kwyk 的開發人員之一,他提出了把 word2vec 用在分類特征上的思想。

原文:https://medium.com/towards-data-science/a-non-nlp-application-of-word2vec-c637e35d3668

【本文是51CTO專欄機構“機器之心”的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2017-08-04 10:16:52

自然語言處理嵌入機器學習

2018-08-05 07:50:22

自然語言Word2Vec深度學習

2021-05-17 09:00:00

自然語言人工智能技術

2021-05-13 07:17:13

Snownlp自然語言處理庫

2024-10-09 08:00:00

2018-08-08 14:25:17

2020-04-24 10:53:08

自然語言處理NLP是人工智能

2024-02-05 14:18:07

自然語言處理

2022-03-29 09:58:15

自然語言處理人工智能技術

2021-01-21 10:28:16

自然語言NLP人工智能

2020-08-24 07:19:13

主鍵自增數據庫

2017-10-19 17:05:58

深度學習自然語言

2017-03-30 14:52:34

自然語言商業智能

2017-03-28 17:52:58

自然語言處理商業智能

2018-04-04 12:00:00

2021-05-18 07:15:37

Python

2024-04-24 11:38:46

語言模型NLP人工智能

2017-10-19 15:09:10

Word2vecskip-gram模型

2019-07-22 09:13:50

Nginx算法瀏覽器

2022-02-09 10:56:09

ReactJS組件前端
點贊
收藏

51CTO技術棧公眾號

色999日韩欧美国产| 在线一区二区视频| 加勒比在线一区二区三区观看| av大片在线免费观看| 欧美日韩在线网站| 精品日韩一区二区三区| 精品久久久久久久无码| 在线电影福利片| 久久久久久久久久久久久夜| 亚洲在线观看视频网站| 久久久久久在线观看| 91欧美日韩| 日韩av中文字幕在线免费观看| 久久99爱视频| 午夜av不卡| 亚洲三级理论片| 欧美午夜精品理论片a级大开眼界 欧美午夜精品久久久久免费视 | 国产91精品久久久久久久| 日本女人性生活视频| 午夜欧洲一区| 精品国产免费一区二区三区四区 | 国产原创中文在线观看| 男人天堂久久久| 久久久久久免费| 国产免费一区二区三区| 99久久99久久久精品棕色圆| 首页亚洲欧美制服丝腿| 97热精品视频官网| 欧美三根一起进三p| 日本大胆欧美| 亚洲少妇激情视频| 国产熟女高潮一区二区三区| 麻豆国产精品| 在线成人免费视频| 亚洲 激情 在线| 欧美黑人粗大| 福利一区福利二区微拍刺激| 日韩精品在线中文字幕| 国产原厂视频在线观看| 国产精品萝li| 视频在线精品一区| 黄色影院在线播放| 久久综合av免费| 久久久精品动漫| 五月色婷婷综合| 成人黄色网址在线观看| 5g影院天天爽成人免费下载| 99久久婷婷国产一区二区三区| 久久精品国产亚洲一区二区三区| 国产精品精品国产| 91麻豆精品在线| 日韩主播视频在线| 国产成人精品av在线| 中文字幕69页| 日韩va欧美va亚洲va久久| 国产成人一区二区三区小说| 免费无码国产精品| 日韩国产精品久久久久久亚洲| 日韩av大片在线| 中文区中文字幕免费看| 麻豆久久一区二区| 成人淫片在线看| 性欧美18一19性猛交| 国产高清在线观看免费不卡| 亚洲最大成人在线| 亚洲欧美高清视频| 99精品桃花视频在线观看| 欧美另类一区| 在线免费av网站| 亚洲婷婷综合久久一本伊一区| 亚洲小视频在线播放| 色在线视频网| 韩曰欧美视频免费观看| 牛夜精品久久久久久久| 激情综合五月| 日韩精品一区二区视频| 中文幕无线码中文字蜜桃| 成人看的羞羞网站| 欧美成人免费观看| 精品国产乱码一区二区| 日韩国产一区二| 亚洲一区二区三区在线免费观看| 欧美 日韩 国产 精品| 久久久久久亚洲综合影院红桃 | av网站无病毒在线| 亚洲精品日产精品乱码不卡| 国产美女网站在线观看| 成人在线免费av| 日韩欧美不卡一区| 亚欧洲乱码视频| 午夜欧美理论片| 日韩女在线观看| 国产后入清纯学生妹| 91浏览器在线视频| 久久av秘一区二区三区| 漫画在线观看av| 欧美美女直播网站| 国产成人精品无码片区在线| 999精品一区| 91wwwcom在线观看| 国产欧美日韩综合精品一区二区三区| av亚洲精华国产精华精华| 午夜欧美一区二区三区免费观看| 高h视频在线播放| 欧美少妇性性性| 欧产日产国产精品98| 婷婷亚洲最大| 国产精品99久久久久久人| www天堂在线| 亚洲国产精品成人综合| 777av视频| 国产精品久久免费视频| 国产一区二区av| 国产视频91在线| 国产精品资源网站| 亚洲国产精品日韩| 乱人伦视频在线| 日韩欧美区一区二| 激情无码人妻又粗又大| 国产精品毛片一区二区三区| 99国精产品一二二线| 日本不卡视频| 欧美性色黄大片| 强伦人妻一区二区三区| 亚洲精品乱码| 俄罗斯精品一区二区三区| 久草中文在线观看| 欧美色图免费看| 国产高清一区二区三区四区| 国产精品毛片一区二区三区| 国产一区免费观看| 欧美videosex性极品hd| 91精品国产综合久久国产大片 | 日韩毛片视频| 国产成人免费91av在线| 天天av综合网| 午夜国产不卡在线观看视频| 成人欧美精品一区二区| 欧美精品国产一区| 91嫩草免费看| 亚洲图区一区| 欧美videofree性高清杂交| 成人观看免费视频| 国产成人av网站| 天堂а√在线中文在线| 亚洲高清999| 色与欲影视天天看综合网| 国产高清视频免费| 一区二区三区免费在线观看| 麻豆av免费看| 伊人成人网在线看| 激情小说网站亚洲综合网 | 国产精品va| 粉嫩av一区二区三区免费观看| 日本资源在线| 欧美精品一区二区三区蜜桃视频| 国产无套内射又大又猛又粗又爽| 成人av在线一区二区三区| 欧美视频免费看欧美视频| 奇米影视777在线欧美电影观看| 97色在线观看| 电影在线高清| 欧美一区二区视频在线观看2020| 毛片aaaaa| 91在线精品一区二区| 99草草国产熟女视频在线| 日韩在线理论| 97se视频在线观看| 国产激情视频在线看| 亚洲老头同性xxxxx| 久久久久精彩视频| 最新日韩av在线| 成人做爰www看视频软件| 亚洲欧美日韩专区| 亚洲国产欧美一区二区三区不卡| 电影中文字幕一区二区| 久久久久久久电影一区| 欧美高清电影在线| 在线91免费看| 五月天综合在线| 国产区在线观看成人精品| 无尽裸体动漫2d在线观看| 狠狠爱www人成狠狠爱综合网| 久久精品五月婷婷| 成人精品视频在线观看| 91精品国产电影| 欧美a免费在线| 亚洲精品456在线播放狼人| 伊人色综合久久久| 一二三区精品福利视频| 亚洲妇女成熟| 久久九九国产精品怡红院| 人人妻人人玩人人澡人人爽| 欧美亚洲高清一区二区三区不卡| 日韩影院一区二区| 久久伊人中文字幕| 精品人妻一区二区三| 午夜亚洲性色福利视频| 国产盗摄视频在线观看| 你微笑时很美电视剧整集高清不卡| 成人av在线亚洲| 中文字幕在线官网| 欧美大尺度激情区在线播放| 国产一区二区三区福利| 精品国产乱码久久久久久久| 五月激情丁香网| 亚洲v日本v欧美v久久精品| 国产精品视频看看| 久久免费偷拍视频| 欧美夫妇交换xxx| 国模少妇一区二区三区| 人妻无码视频一区二区三区 | 色婷婷av一区二区三区久久| 亚洲 国产 欧美 日韩| 日韩一区和二区| 91高潮大合集爽到抽搐| 色拍拍在线精品视频8848| 久久久久久久黄色| 亚洲图片欧美激情| 国产一区二区三区视频播放| 久久夜色精品国产噜噜av| 麻豆短视频在线观看| 国产一区二区三区四| 999在线免费视频| 香蕉久久夜色精品| 久久综合色视频| 亚洲高清久久| www.avtt| 亚洲视频观看| 日韩精品在线视频免费观看| 影音先锋日韩精品| 欧美h视频在线观看| 成人在线免费小视频| 品久久久久久久久久96高清| 亚洲97av| 欧美性大战久久久久| 婷婷综合福利| 日本不卡在线播放| 亚洲精品中文字幕99999| 精品在线视频一区二区三区| 开心激情综合| 九九九九精品九九九九| 精品女人视频| 精品欧美一区二区久久久伦| 国产精品国产| 激情久久av| 偷拍自拍一区| 欧美一区1区三区3区公司| 国产一区二区三区日韩精品| 日本高清不卡一区二区三| 欧美精品尤物在线观看| 亚洲精品一区二| 偷偷www综合久久久久久久| 国产日本欧美在线| 欧美女人交a| 加勒比成人在线| 国产精品久久国产愉拍| 国产精品wwwww| 麻豆精品视频在线| 日日夜夜精品视频免费观看 | 成人综合色站| 一本色道久久综合亚洲精品酒店| 欧美一区二区三区四区五区六区 | av动漫在线观看| 日韩精品亚洲专区| 怡红院亚洲色图| 国产成人一区在线| 中文字幕丰满孑伦无码专区| 国产精品污www在线观看| 成人涩涩小片视频日本| 亚洲一区视频在线| 亚洲AV无码成人精品区东京热| 欧洲精品在线观看| 久久精精品视频| av在线国产精品| 国产精品亚洲一区| 少妇精品久久久一区二区三区| 亚洲一区二区精品在线观看| 午夜国产欧美理论在线播放 | 成人在线观看免费完整| 亚洲一区二区三区免费视频| 久久国产视频精品| 777xxx欧美| 四虎精品成人影院观看地址| 最近2019中文字幕大全第二页| 日本动漫同人动漫在线观看| 欧美自拍视频在线| 99热这里有精品| 美国av一区二区三区| 国产精品不卡| 青青视频在线播放| 国产一区91精品张津瑜| 亚洲天堂视频一区| 亚洲一区二区偷拍精品| 男操女视频网站| 亚洲精品电影网在线观看| 夜级特黄日本大片_在线| 97视频国产在线| 欧美区一区二区| 视频一区二区三| 99精品免费网| 日本泡妞xxxx免费视频软件| 欧美激情综合五月色丁香小说| 日本在线视频中文字幕| 777午夜精品免费视频| 久色视频在线| 久久全国免费视频| 欧美成a人片免费观看久久五月天| 国产在线资源一区| 中文不卡在线| 波多野结衣xxxx| 91老师片黄在线观看| 久久久久久久9999| 欧美精品色一区二区三区| 免费在线高清av| 国内精品小视频| 精品国模一区二区三区欧美 | www久久99| 日韩成人精品一区| 久草精品在线播放| 99国产精品久久久久久久久久久 | 国产精品久久7| 女人色偷偷aa久久天堂| www.这里只有精品| 国产欧美精品一区二区色综合| 天堂中文在线网| 亚洲国产精品va在看黑人| 日本三级在线观看网站| 亚洲free嫩bbb| 99精品综合| 日本中文字幕观看| 国产精品精品国产色婷婷| 中文字幕无线码一区| 亚洲欧美综合另类中字| 久九九久频精品短视频| 久久久久久99| 国产精品日韩欧美一区| 中文在线一区二区三区| 午夜精品久久久久久久99樱桃| 欧美 日韩 国产 在线| 久久免费视频观看| 麻豆成人入口| 各处沟厕大尺度偷拍女厕嘘嘘| 久久综合久久综合久久综合| 国产成人在线视频观看| 亚洲人成电影网站| 成人精品电影在线| 午夜欧美一区二区三区免费观看| 麻豆freexxxx性91精品| 九九这里只有精品视频| 日韩亚洲欧美成人一区| 金瓶狂野欧美性猛交xxxx| 国产91一区二区三区| 国产精品亚洲综合久久| asian性开放少妇pics| 91九色02白丝porn| 欧美精品hd| www.久久草| 香蕉久久夜色精品国产| 国产真人真事毛片视频| 欧美一区二区三区喷汁尤物| 美洲精品一卡2卡三卡4卡四卡| 精品无人区一区二区三区 | 人妻在线日韩免费视频| 色综合 综合色| 日本在线观看www| 高清国语自产拍免费一区二区三区| 亚洲黄页一区| 亚洲AV无码成人精品区明星换面| 欧美日韩久久久一区| 日韩精品卡一| 欧美日韩一区二区三区在线视频 | 日本在线一区| 国产一区激情在线| 亚洲一区欧美在线| 中文字幕亚洲综合| 网站一区二区| 国产精品69页| 亚洲另类色综合网站| 污视频在线免费| 91精品久久久久| 国产农村妇女精品一区二区| 老司机深夜福利网站| 精品国产精品网麻豆系列| 希岛爱理一区二区三区av高清| 中文字幕日韩一区二区三区| 成人av影院在线| 91好色先生tv| 2020欧美日韩在线视频| 91精品一区国产高清在线gif| 97香蕉碰碰人妻国产欧美| 欧美日韩国产首页| а√天堂中文在线资源8| 亚洲区一区二区三区| 成人av一区二区三区| 国产精品爽爽久久久久久| 日韩av电影手机在线观看| 欧美在线免费| 欧美aaa级片| 亚洲精品白浆高清久久久久久|