精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

一種基于詞尾預測的提高英俄翻譯質量的方法

原創
人工智能
神經網絡翻譯模型受限于其可以使用的詞表大小,經常會遇到詞表無法覆蓋源端和目標端單詞的情況,特別是當處理形態豐富的語言(例如俄語、西班牙語等)的時候,詞表對全部語料的覆蓋度往往不夠,這就導致很多“未登錄詞”的產生,嚴重影響翻譯質量。

【51CTO.com原創稿件】神經網絡翻譯模型受限于其可以使用的詞表大小,經常會遇到詞表無法覆蓋源端和目標端單詞的情況,特別是當處理形態豐富的語言(例如俄語、西班牙語等)的時候,詞表對全部語料的覆蓋度往往不夠,這就導致很多“未登錄詞”的產生,嚴重影響翻譯質量。

已有的工作主要關注在如何調整翻譯粒度以及擴展詞表大小兩個維度上,這些工作可以減少“未登錄詞”的產生,但是語言本身的形態問題并沒有被真正研究和專門解決過。

我們的工作提出了一種創新的方法,不僅能夠通過控制翻譯粒度來減少數據稀疏,進而減少“未登錄詞”,還可以通過一個有效的詞尾預測機制,大大降低目標端俄語譯文的形態錯誤,提高英俄翻譯質量。通過和多個比較有影響力的已有工作(基于subword和character的方法)對比,在5000萬量級的超大規模的數據集上,我們的方法可以成功的在基于RNN和Transformer兩種主流的神經網絡翻譯模型上得到穩定的提升。

研究背景

近年來,神經網絡機器翻譯(Neural Machine Translation, NMT)在很多語種和場景上表現出了明顯優于統計機器翻譯(Statistic Machine Translation, SMT)的效果。神經網絡機器翻譯將源語言句子編碼(encode)到一個隱狀態(hidden state),再從這個隱狀態開始解碼(decode),逐個生成目標語言的譯文詞。NMT系統會在目標端設置一個固定大小的詞表,解碼階段的每一步中,會從這個固定大小的詞表中預測產生一個詞,作為當前步驟的譯文詞。受限于計算機的硬件資源限制,這個詞表往往不會設的很大(一般是3萬-5萬)。并且,隨著詞表的增大,預測的難度也會相應的增加。基于詞(word)的NMT系統經常會遭遇“未登錄詞”(Out of vocabulary, OOV)的問題,特別是目標端是一個形態豐富(Morphologically Rich)的語言時,這個問題會更加嚴重。以“英-俄”翻譯為例,俄語是一種形態非常豐富的語言,一個3-5萬的詞表往往不能覆蓋俄語端的所有詞,會有很多OOV產生。OOV的出現對翻譯質量的影響是比較大的。

針對這個問題,有很多方法嘗試解決。其中一些方法會從翻譯粒度的角度出發(translation granularity),另外還有一些方法嘗試有效的擴展目標端詞表大小。這些方法雖然能有效的將少OOV,但是這些方法并沒有對目標端語言的形態(morphology)進行專門的建模。

對于俄語這種形態豐富的語言,詞干(stem)的個數會比詞的個數少很多,因此很自然的,我們會想到要對詞干和詞尾(suffix)分別進行建模。我們設計實現了一種方法,在解碼時每一個解碼步驟(decoding step)中,分別預測詞干和詞尾。訓練階段,目標語言端會使用兩個序列,分別是詞干序列和詞尾序列。詞干序列和詞尾序列的生成過程如下圖所示:

(詞干序列和詞尾序列的生成,“N”表示詞干和詞本身相同,即這個詞沒有詞尾)

通過這種方式,數據稀疏問題會得到緩解,因為詞干的種類會顯著小于詞的種類,而詞尾的種類只有幾百種。

相關工作

基于子詞(subword)的和基于字符(character)的這兩種方法,從調整翻譯粒度的角度出發來幫助緩解目標端形態豐富語言的翻譯問題。一種基于子詞的方法利用BPE(Byte Pari Encoding)算法來生成一個詞匯表。語料中經常出現的詞會被保留在詞匯表中,其他的不太常見的詞則會被拆分成一些子詞。由于少數量的子詞就可以拼成全部不常見的詞,因此NMT的詞表中只保留常見詞和這些子詞就可以了。還有一種基于字符的NMT系統,源端句子和目標端句子都會表示為字符的序列,這種系統對源端形態豐富的語言可以處理的比較好,并且通過在源端引入卷積神經網絡(convolutional neural network, CNN),遠距離的依賴也可以被建模。上述兩種方式雖然可以緩解數據稀疏,但是并沒有專門對語言的形態進行建模,子詞和字符并不是一個完整的語言學單元(unit)。

還有一些研究工作是從如何有效的擴大目標端詞匯表出發的,例如在目標端設置一個很大的詞匯表,但是每次訓練的過程中,只在一個子表上進行預測,這個子表中包含了所有可能出現的譯文詞。這種方法雖然可以解決未登錄詞的問題,但是數據稀疏問題仍然存在,因為低頻的詞是未被充分訓練的。

神經網絡機器翻譯

本文在兩種主要的神經網絡翻譯系統上驗證了“基于詞尾預測”的方法的有效性,分別是基于遞歸神經網絡的機器翻譯(Recurrent Neural Network Based, RNN-based)和谷歌在17年提出的***的神經網絡翻譯模型(Transformer),詳細介紹可以查看相應論文。RNN-based神經網絡機器翻譯如下圖:

(“Neural Machine Translation by Jointly Learning to Align and Translate”, Bahdanau et al., 2015)

Transformer的結構如下圖:

(“Attention Is All You Need”, Ashish Vaswani et al., 2017)

俄語的詞干和詞尾

俄語是一種形態豐富的語言,單復數(number)、格(case)、陰陽性(gender)都會影響詞的形態。以名詞“ball”為例,“ball”是一個中性詞,因此不會隨陰陽性的變化而變化,但當單復數、格變化時,會產生如下多種形態:

一個俄語詞可以分為兩部分,即詞干和詞尾,詞尾的變化是俄語形態變化的體現,詞尾可以體現俄語的單復數、格、陰陽性等信息。利用一個基于規則的俄語詞干獲取工具,可以得到一個俄語句子中每一個詞的詞干和詞尾。

詞尾預測網絡

在NMT的解碼階段,每一個解碼步驟分別預測詞干和詞尾。詞干的生成和NMT原有的網絡結構一致。額外的,利用當前step生成的詞干、當前decoder端的hidden state和源端的source context信息,通過一個前饋神經網絡(Feedforward neural network)生成當前step的詞尾。網絡結構如下圖:

***,將生成的詞干和詞尾拼接在一起,就是當前step的譯文單詞。

實驗

我們在RNN和Transformer上都進行了實驗,在WMT-2017英俄新聞翻譯任務的部分訓練語料(約530萬)上,效果如下圖:

其中,Subword是使用基于子詞方法作為baseline,Fully Character-based是使用基于字符的NMT系統作為baseline。“Suffix Prediction”是我們的系統。

另外,我們還在電子商務領域的數據上,使用超大規模的語料(5000萬),證明了該方法的有效性,實驗結果如圖:

測試集包括商品的標題(Title)、詳情(Description)和用戶評論(Comment)內容,示例如下:

一些翻譯結果的例子:

***個例子中,標號為1和2的俄語詞的形態代表著這個詞是一個反身動詞(reflexive verb),反身動詞的直接賓語和主語是同一個事物,換句話說,反身動詞的施事者和受事者是同一個事物。從源端句子中可以看出,“return”的施事者是購買商品的人,受事者是某個要退還的商品,因此1和2的譯文詞是錯誤的。3的譯文詞是正確的,它的詞尾代表著它是一個不定式動詞(infinitive verb),這個不定式動詞是可以有賓語的。在第二個例子中,標號1和2代表復數形式,4代表單數。第三個例子中,3代表過去時,1和2代表現在時。上面的例子中,相比于基于子詞和基于字符的模型,我們的模型可以產生更正確的俄語形態。

總結

我們提出了一種簡單、有效的方法來提高目標端是形態豐富語言(例如“英-俄”)的NMT系統的翻譯質量。在解碼階段的每一個步驟中,首先生成詞干,然后生成詞尾。我們在兩種NMT模型(RNN-based NMT和Transformer)上,和基于子詞(subword)和字符(character)的方法進行了對比,證明了方法的有效性。我們使用了大規模(530萬)和超大規模(5000萬)的語料,在新聞和電子商務兩個領域上進一步這種方法可以帶來穩定的提升。在我們的工作中,詞尾在NMT中***被專門的建模。

團隊:iDst-NLP-翻譯平臺

作者:宋楷/Kai Song(阿里巴巴), 張岳/Yue Zhang(新加坡科技設計大學), 張民/Min Zhang (蘇州大學), 駱衛華/Weihua Luo(阿里巴巴)

會議:AAAI-18

【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】

責任編輯:王雪燕 來源: 51CTO
相關推薦

2021-12-09 15:37:50

自動駕駛數據人工智能

2018-12-14 14:30:12

安全檢測布式系測試

2009-06-03 15:38:37

Struts框架RBAC

2024-03-26 09:23:22

自動駕駛軌跡

2018-02-08 08:11:41

2021-06-11 00:11:23

GPS數據協議

2010-03-26 13:34:47

CentOS安裝

2023-07-18 07:23:11

方案payloadrequest

2022-07-07 10:33:27

Python姿勢代碼

2022-06-22 09:44:41

Python文件代碼

2020-12-23 10:10:23

Pythonweb代碼

2017-12-11 10:40:14

2011-02-23 09:35:25

Eclipse遠程調試

2020-12-09 10:15:34

Pythonweb代碼

2023-11-25 20:11:48

APPRFM模型

2018-05-29 09:00:00

LinuxBTFS文件系統

2011-07-04 17:53:48

快速測試

2023-07-06 10:15:38

布隆過濾器優化

2009-12-15 19:18:39

Ruby源代碼

2018-12-29 09:25:05

區塊鏈數據經濟區塊鏈技術
點贊
收藏

51CTO技術棧公眾號

精品久久久久久无码人妻| 亚洲精品二区| youjizz在线视频| 欧美日韩国产在线观看网站| 欧美日韩三级视频| 天堂а√在线中文在线| 偷拍自拍在线| 久久福利资源站| 91国在线精品国内播放| 自拍偷拍你懂的| 国产亚洲成av人片在线观黄桃| 色婷婷精品大在线视频| 成年丰满熟妇午夜免费视频| 免费一级毛片在线观看| 国产麻豆精品视频| 国产97在线视频| 好吊色视频在线观看| 一区二区美女| 精品国产精品网麻豆系列| 九一精品在线观看| 爱搞国产精品| 亚洲人成网站影音先锋播放| 久久一区二区精品| www.中文字幕| 久久er精品视频| 欧美一级淫片videoshd| www青青草原| 欧美艳星介绍134位艳星| 亚洲а∨天堂久久精品9966| 中文字幕在线观看日| 在线人成日本视频| 亚洲综合色噜噜狠狠| 亚洲欧美久久久久一区二区三区| 无码国产精品高潮久久99| 国产精品一区二区黑丝| 国产精自产拍久久久久久| wwwwww国产| 好看的日韩av电影| 另类色图亚洲色图| 青青青手机在线视频| 欧美艳星介绍134位艳星| 亚洲美女动态图120秒| 欧亚乱熟女一区二区在线| 视频二区欧美| 欧美成人性福生活免费看| www.桃色.com| 95精品视频| 正在播放亚洲一区| 天天操狠狠操夜夜操| 啪啪av大全导航福利综合导航| 在线免费亚洲电影| 欧在线一二三四区| 欧美gay视频| 色诱亚洲精品久久久久久| 欧美 日韩 亚洲 一区| wwwww亚洲| 亚洲愉拍自拍另类高清精品| 欧美这里只有精品| 人妖欧美1区| 午夜视频一区在线观看| 无罩大乳的熟妇正在播放| segui88久久综合| 懂色av影视一区二区三区| 波多野结衣家庭教师在线| 三妻四妾的电影电视剧在线观看| 欧美日韩国产综合新一区 | 91亚洲精品久久久| 一区二区视频网| 久久99精品一区二区三区三区| 成人a视频在线观看| 99久久精品国产色欲| 国产白丝网站精品污在线入口| 成人欧美一区二区三区视频| 天堂在线视频免费观看| 久久久影视传媒| 相泽南亚洲一区二区在线播放 | 欧美尺度大的性做爰视频| 青娱乐在线视频免费观看| 亚洲高清资源| 欧美在线视频免费播放| 涩涩视频在线观看| 国产麻豆精品在线| 久久久久久99| 天堂资源在线中文| 亚洲一本大道在线| 红桃av在线播放| 日韩一级特黄| 亚洲国产精品人久久电影| 中文字幕国产专区| 香蕉av一区二区| 97在线免费视频| 在线不卡免费视频| 成人激情黄色小说| 亚洲综合第一| 黄在线观看免费网站ktv| 在线观看免费视频综合| 性高潮久久久久久| 国产日产精品_国产精品毛片| 日韩中文字幕视频在线观看| 国产精品18p| 美女精品自拍一二三四| 国产经典一区二区三区| 成人在线视频成人| 性做久久久久久免费观看| 国产又大又黄又粗又爽| 激情小说一区| 久久亚洲精品网站| 国产免费一区二区三区四区五区| 国产综合色在线视频区| 欧美日韩系列| 麻豆网站免费在线观看| 欧美精品v国产精品v日韩精品 | 综合干狼人综合首页| 欧美成人精品一区二区三区| 久久久久久久久久成人| 成人中文字幕在线| 异国色恋浪漫潭| 日本欧美韩国| 日韩成人在线网站| 欧美精品成人久久| 精品一区二区三区视频| 日本一区二区视频| 三妻四妾的电影电视剧在线观看 | 在线成人精品视频| 小小影院久久| 国产精品狼人色视频一区| 天天干视频在线观看| 亚洲久本草在线中文字幕| 自拍偷拍21p| 国产真实有声精品录音| 69精品小视频| 天天综合网天天综合| 国产精品灌醉下药二区| 三年中国国语在线播放免费| 一区二区三区视频免费观看| 性欧美办公室18xxxxhd| 亚洲精品综合久久| 国产经品一区二区| 久久丫精品国产亚洲av不卡| 97国产成人高清在线观看| 日韩av黄色在线观看| 亚洲人妻一区二区| 亚洲成人黄色影院| 亚洲精品无码一区二区| 欧美日本中文| 高清视频一区| 青春草视频在线观看| 91精品国产福利| 中文字幕亚洲欧美日韩| 激情五月播播久久久精品| 亚洲精品一卡二卡三卡四卡| av成人在线观看| 中文字幕日韩电影| 中文字幕人妻互换av久久| 国产欧美视频在线观看| 精品日韩久久久| 手机在线电影一区| 91视频免费在线| 午夜激情在线| 欧美精品一区二区三区蜜臀| 国产成人愉拍精品久久| 91亚洲精品乱码久久久久久蜜桃| 欧美韩国日本在线| 精品久久影视| 成人情趣片在线观看免费| a级在线观看| 欧美精品一区二区三区四区| 亚洲午夜18毛片在线看| 欧美国产精品v| 亚洲制服中文字幕| 极品av少妇一区二区| 久久久久国产精品视频| 老司机精品视频网| 欧美另类xxx| 五月天婷婷在线播放| 91久久国产最好的精华液| 成年人网站在线观看视频| 国产成人久久精品77777最新版本| 每日在线观看av| 国产成人一区| 95av在线视频| 小早川怜子影音先锋在线观看| 永久555www成人免费| 91精品国产乱码久久| 亚洲午夜久久久久中文字幕久| 黄色正能量网站| 久久福利资源站| 国产原创popny丨九色 | 欧美videossexotv100| 伊人久久综合视频| 国产精品区一区二区三区| 欧美成人精品一区二区综合免费| 丝袜美腿亚洲色图| 日本福利视频在线观看| 国产一区二区三区91| 成人av中文| 成人在线高清| 2019中文字幕在线免费观看| 免费a级毛片在线播放| 日韩精品在线视频观看| 国产精品国产三级国产普通话对白 | 国产福利91精品一区| 精品免费国产一区二区| 欧美日韩日本国产亚洲在线| 亚洲高清精品中出| 奇米影视777在线欧美电影观看| 成人av在线亚洲| 日本综合字幕| 国内精品久久影院| 久操视频在线观看| 一区二区三区天堂av | 国产午夜精品免费一区二区三区| www.97超碰| 欧美日本韩国一区二区三区视频| av资源免费观看| 一区二区三区中文在线观看| 亚洲精品国产精品国自| 26uuu亚洲| 免费黄色在线播放| 久久av老司机精品网站导航| 欧美日韩在线免费播放| 亚洲国产精品一区制服丝袜| 欧美 亚洲 视频| 久久久人成影片免费观看| 视频在线精品一区| 国产传媒欧美日韩成人精品大片| 国产一级特黄a大片99| 欧美欧美在线| 91在线网站视频| 2020国产精品小视频| 国产精品一二区| 国模一区二区| 日本视频久久久| 丝袜美腿一区| 国产91色在线| 神马电影网我不卡| 国产精品 欧美在线| 香蕉视频亚洲一级| 国产999精品久久久| 欧美精品高清| 国产精品久久久精品| 日韩一区二区三区在线免费观看 | www.精品av.com| 免费黄色网页在线观看| 色噜噜亚洲精品中文字幕| 在线视频1区2区| 深夜福利亚洲导航| 麻豆传媒视频在线观看免费| 国产一区二区三区在线看| 国产一级在线观看| 中文字幕九色91在线| 91吃瓜网在线观看| 精品激情国产视频| bt在线麻豆视频| 久久免费精品视频| 日本在线啊啊| 欧美中文字幕视频在线观看| 欧美黑人一区| 国产一区二区丝袜高跟鞋图片| 香蕉久久一区| 超碰97人人人人人蜜桃| 久久久久高潮毛片免费全部播放| 久久国产一区二区| heyzo久久| 亚洲成人动漫在线| 伊人久久大香线蕉综合热线| 日本少妇高潮喷水视频| 日韩中文字幕不卡| 国产欧美精品一二三| 国产盗摄视频一区二区三区| 欧亚乱熟女一区二区在线| 久久精品免费在线观看| 26uuu成人网| 精品日本高清在线播放| 日本欧美www| 日韩精品一区二区三区视频在线观看| 天天干天天插天天操| 亚洲性猛交xxxxwww| 羞羞污视频在线观看| 18一19gay欧美视频网站| 777午夜精品电影免费看| 51国产成人精品午夜福中文下载 | 日韩网站在线免费观看| 老鸭窝毛片一区二区三区| 日韩高清第一页| 成人av电影免费观看| gv天堂gv无码男同在线观看| 夜夜精品视频一区二区| 五月婷婷六月婷婷| 日韩欧美国产综合| 精品三级久久久久久久电影聊斋| 久久国产精品亚洲| 欧美aa视频| 国产福利久久| 日韩精品不卡一区二区| 97干在线视频| 九色|91porny| 女人又爽又黄免费女仆| 一区av在线播放| 精品国产www| 日韩大陆欧美高清视频区| 欧美成人hd| 日本久久久久久久久| 日本精品在线播放| 日本一区视频在线观看免费| 国内精品福利| 国产精品自拍视频在线| 99re免费视频精品全部| 成年人av电影| 欧美日韩高清在线播放| 男女污视频在线观看| 久久久久久久久网站| 日韩毛片网站| 欧洲亚洲一区二区三区四区五区| 黄色精品一区| 一级片黄色免费| 中文字幕va一区二区三区| 成人免费a视频| 精品国产凹凸成av人网站| 黄网站视频在线观看| 国产精品亚洲网站| 国产剧情一区| 精品无码一区二区三区爱欲| 国产精品一级片在线观看| 日本美女黄色一级片| 欧洲国产伦久久久久久久| 九色视频成人自拍| 97精品国产97久久久久久春色| 日韩一级淫片| 日本精品福利视频| 国产在线精品免费| 免费在线观看黄色小视频| 欧美日韩高清影院| 第一福利在线| 国产精品高潮呻吟视频| 久久av综合| 青青在线免费观看视频| 久久精品一区二区三区不卡牛牛| 欧美bbbbbbbbbbbb精品| 亚洲成人久久久久| 丁香花在线观看完整版电影| 成人综合色站| 影音先锋久久久| 日韩www视频| 狠狠躁夜夜躁人人爽超碰91| 三级在线观看| 国产成人精品电影久久久| 国产日产精品_国产精品毛片| 亚洲性生活网站| 欧美激情一区二区三区全黄| 中文字幕欧美人妻精品一区蜜臀 | 欧美日韩亚洲在线| 久久天堂成人| 少妇太紧太爽又黄又硬又爽小说| 欧美午夜片在线观看| 四虎久久免费| 亚洲自拍小视频| 欧美日本在线| 久久久久久中文| 一级日韩一级欧美| 国产亚洲欧美另类中文| 国产原创一区| 国产又粗又大又爽的视频| 高清视频一区二区| 国产精品美女久久久久av爽| 亚洲午夜久久久影院| 先锋影音一区二区| 国产日韩精品一区二区三区| 老熟妇一区二区三区啪啪| 久久精品中文字幕| 97品白浆高清久久久久久| 黄色一级在线视频| 国产拍揄自揄精品视频麻豆 | 欧美三级中文字幕在线观看| 蜜桃视频网站在线| 91麻豆精品秘密入口| 国产日韩欧美一区| 欧洲性xxxx| 精品国产伦一区二区三区观看方式| 九色porny自拍视频在线播放| 日韩福利二区| 国产精品自在欧美一区| av大片在线免费观看| 色噜噜狠狠色综合网图区| 成人台湾亚洲精品一区二区 | 最新日韩一区| 97av中文字幕| 国产亚洲短视频| 亚洲精品久久久狠狠狠爱 | 久久久久久亚洲精品美女| 成年人午夜视频在线观看| 中文欧美字幕免费| 亚洲男人天堂久久| 国产精品高清在线| 国产精品地址| 亚洲精品国产精品国自| 日韩av影视在线| 精品视频在线观看免费观看| 日韩精品视频一区二区在线观看| 亚洲品质自拍视频网站|