精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

谷歌開源首個「方言」數據集:讓機器翻譯更地道

人工智能
研究人員根據博客和教育網站手動收集了20-30個具有地區特色的翻譯術語,并根據來自每個地區的母語志愿者的反饋對翻譯進行過濾和審核。

雖然全中國的人都在說漢語,但具體到各地的方言卻略有不同,比如同樣是小巷的意思,「胡同」一開口就知道是老北京了,而到了南方則叫「弄」。

這種細微的地域性差異反應在「機器翻譯」任務上,就會顯得翻譯結果不夠「地道」,而目前幾乎所有的機器翻譯系統都沒有考慮地區性語言(即方言)的影響。

而在世界范圍內也存在這種現象,比如巴西的官方語言是葡萄牙語,跟歐洲的葡萄牙語之間也有一些地域性差異。

最近谷歌發布了一個全新的,可用于Few-shot Region-aware機器翻譯的數據集和評估基準FRMT,主要解決方言翻譯問題,論文發表在TACL(Transactions of the Association for Computational Linguistics)上。

圖片

論文鏈接:https://arxiv.org/pdf/2210.00193.pdf

開源鏈接:https://github.com/google-research/google-research/tree/master/frmt

該數據集包括從英語到葡萄牙語和中文普通話的兩個地區變體的專業翻譯,源文檔是為了能夠詳細分析感興趣的現象,包括詞匯上不同的術語和干擾術語。

研究人員探索了 FRMT 的自動評估指標,并在區域匹配和不匹配評分情景下驗證了其與專家人工評估的相關性。

最后,為這項任務提出了一些基線模型,并為研究人員如何訓練、評估和比較自己的模型提供指導建議,數據集和評估代碼已開源。

Few-Shot泛化

大多數現代機器翻譯系統都經過數百萬或數十億翻譯樣本的訓練,輸入數據包括英語輸入句及其相應的葡萄牙語翻譯。

然而,絕大多數可用的訓練數據并沒有說明翻譯的地區差異。

鑒于這種數據稀缺性,研究人員將 FRMT 定位為few-shot翻譯的基準,當給定每種語言不超過100個帶標簽的例子時,測量機器翻譯模型識別出指定區域語言變體的能力。

機器翻譯模型需要根據少量標記過的樣本(即范例)中顯示的語言模式,來識別出其他未標記訓練樣本中的相似模式。模型需要通過這種方式進行泛化,從而生成模型中沒有明確指定區域的「地道」翻譯結果。

圖片

比如輸入句子:The bus arrived,再給定幾個巴西葡萄牙語的例子,模型應該能翻譯出「O ?nibus chegou」;如果給的樣例是歐洲葡萄牙語,模型的翻譯結果應該變為「O autocarro chegou」。

機器翻譯的few-shot方法是很有研究價值的,能夠以一種非常簡單的方式來對現有系統中增加對額外區域語言的支持能力。

雖然谷歌目前發表的工作是針對兩種語言的區域變體,但研究人員預測,一個好的方法將很容易適用于其他語言和區域的變體。

從原理上來說,這些方法也適用于其他語言差異現象,例如禮節和風格等。

數據收集

FRMT 數據集包括部分英文維基百科文章,來源于 Wiki40b 數據集,這些文章已經由付費的專業翻譯人員翻譯成不同的地區性的葡萄牙語和漢語。

圖片

為了突出關鍵區域感知的翻譯難題,研究人員使用了三個內容桶(content buckets)來設計數據集:

1. 詞匯 Lixical

詞匯桶主要關注不同地區在詞匯選擇上的差異,例如當把一個帶有單詞「bus」的句子分別翻譯成巴西語和歐洲葡萄牙語時,模型需要能夠識別出「?nibus」與「autocarro」的區別。

研究人員根據博客和教育網站手動收集了20-30個具有地區特色的翻譯術語,并根據來自每個地區的母語志愿者的反饋對翻譯進行過濾和審核。

根據得到的英語術語列表,從相關的英語維基百科文章(例如,bus)中提取出100個句子。再對普通話,重復上述相同的的收集過程。

圖片

2. 實體 Entity

實體桶以類似的方式填充,涉及的人、位置或其他實體與某一特定語言所涉兩個區域之一有著密切聯系。

比如給定一個說明性的句子,如「In Lisbon, I often took the bus.」(在里斯本,我經常坐公共汽車。),為了正確地將其翻譯成巴西葡萄牙語,模式必須能夠識別出兩個潛在的陷阱:

1)里斯本和葡萄牙之間更密切的地理關聯可能會影響模型翻譯的選擇,從而幫助模型判斷出應該翻譯成歐洲葡萄牙語而非巴西葡萄牙語,即選擇「autocarro」而不是「?nibus」。

2)用「巴西利亞」代替「里斯本」可能是一個比較簡單的方式,對于同一個模式,對巴西葡萄牙語本地化其輸出,即便翻譯結果仍然很流暢,但也可能會導致不準確的語義。

3. 隨機 Random

隨機桶用于檢查一個模型是否正確處理了其他不同的現象,包含從維基百科的featured和good)集合中隨機抽取的100篇文章。

圖片

系統性能

為了驗證為 FRMT 數據集收集的翻譯能夠捕獲特定區域的現象,研究人員對數據質量進行了人工評估。

來自每個相應區域的專家標注員使用多維質量度量(MQM)框架來識別和分類翻譯中的錯誤:該框架包括一個分類加權方案,將識別出的錯誤轉換成一個單一的分數,粗略地表示每句話的主要錯誤數量,即數值越小表示翻譯越好。

對于每個地區,研究人員要求 MQM 評分者對來自他們所在地區的翻譯和來自他們語言的其他地區的翻譯進行評分。

例如,巴西的葡萄牙語評分員同時對巴西和歐洲的葡萄牙語譯本都進行了評分,兩個分數之間的差異表明語言現象的普遍性,即該語言變體是否可接受,而并非是另一種語言。

實驗結果發現,在葡萄牙語和漢語中,評分者平均比匹配的譯文中每個句子多發現大約兩個主要錯誤,表明FRMT數據集確實能夠捕獲特定區域的語言現象。

雖然人工評估是確保模型質量的最佳方法,但其往往是緩慢且昂貴的。

因此,研究人員希望找到一個現成的自動度量指標,可以用來評估模型在基準中的性能,研究人員考慮選擇使用 chrF,BLEU 和 BLEURT.

圖片

根據 MQM 評估者對幾個基線模型翻譯結果的評分,可以發現 BLEURT 與人類判斷具有最好的相關性,并且該相關性的強度(0.65 Pearson 相關系數,ρ)與標注者間一致性(0.70組內相關性)相當。

系統性能

文中評估了一些最近發布的、具有few-shot控制能力的模型。

基于 MQM 的人類評估,基線方法都表現出一定的localize葡萄牙語輸出的能力,但是對于中文普通話,大多沒有利用目標地區的知識來生成優秀的當地翻譯結果。

在評估的基準中,谷歌的語言模型 PaLM 模型的性能最佳,為了使用 PaLM 生成針對區域的翻譯,首先將一個有指導意義的提示輸入模型,然后從中生成文本以填充空白。

圖片

PaLM 僅通過一個例子就獲得了很好的結果,在葡萄牙語方面,當增加到10個例子時,質量略有提高,考慮到 PaLM 是在無監督的情況下進行訓練的,這種表現已經非常好了。

研究結果還表明,像 PaLM 這樣的語言模型可能特別擅長記憶流暢翻譯所需的特定區域的詞匯選擇。

圖片

然而,在 PaLM 和人類之間仍然存在顯著的性能差距。

參考資料:

https://ai.googleblog.com/2023/02/frmt-benchmark-for-few-shot-region.html

責任編輯:武曉燕 來源: 新智元
相關推薦

2020-10-11 22:05:22

機器翻譯谷歌AI

2020-04-02 15:51:40

翻譯神經網絡人工智能

2022-05-24 09:57:32

微軟開源AI 驅動

2017-09-05 14:23:22

人工智能機器翻譯神經網絡

2017-04-06 10:40:49

機器學習開源Python庫

2022-05-26 15:00:36

翻譯模型谷歌

2017-08-21 16:00:14

機器學習機器翻譯

2017-03-22 12:39:33

人工智能機器翻譯

2020-05-07 17:03:49

Python編碼開發

2024-06-13 09:05:36

2023-10-12 18:39:57

火山引擎

2021-10-13 18:59:42

AI

2021-10-13 18:57:59

AI

2021-06-17 10:28:42

谷歌開源轉譯器

2015-02-27 09:20:17

Android黑莓谷歌

2015-02-27 09:29:50

Android

2018-08-22 11:42:36

搜狗

2021-10-28 17:52:51

機器翻譯人工智能AI

2019-10-25 16:18:34

機器學習人工智能計算機

2012-02-09 09:49:48

點贊
收藏

51CTO技術棧公眾號

日本免费精品| 蜜桃传媒在线观看免费进入| 蜜桃视频在线一区| 精品国偷自产在线| 日本69式三人交| 欧美韩国亚洲| 亚洲男人天堂av| 黄色国产精品一区二区三区| 在线观看免费观看在线| 日韩午夜av| 久久久精品一区二区三区| 亚洲观看黄色网| 亚洲人成777| 一本色道亚洲精品aⅴ| 日本精品免费视频| 国内在线免费高清视频| 国产99久久久国产精品潘金网站| 国产不卡精品视男人的天堂| 高h视频免费观看| 欧美一站二站| 亚洲国内精品视频| 免费看的av网站| 国产精品99| 亚洲一区二三区| 杨幂一区欧美专区| 男女污污视频在线观看| 成人av网在线| 91在线看网站| 一区二区三区www污污污网站| 一区二区三区福利| 欧美极品在线播放| 国产精品免费在线视频| 精品久久中文| 亚洲欧美日韩一区在线| 中文字幕人妻一区| 久久伊人影院| 欧美精品亚洲二区| 日韩中文字幕a| 国产另类xxxxhd高清| 午夜不卡在线视频| 国产精品视频网站在线观看| 国产理论在线观看| 亚洲色图欧美激情| 91香蕉视频网址| jizz在线观看中文| 国产婷婷色一区二区三区四区 | 久久五月天综合| 亚洲成人黄色av| 久久综合欧美| 亚洲欧美色婷婷| www.自拍偷拍| 亚洲尤物av| 亚洲欧洲日韩国产| 亚洲国产av一区| 国产一区二区电影在线观看| 一本一本久久a久久精品综合小说| 魔女鞋交玉足榨精调教| 久久99蜜桃| 国产亚洲视频在线观看| 91精品国自产在线| 日韩电影免费在线观看| 在线看日韩欧美| 亚洲图片第一页| 久久综合国产| 欧美剧在线观看| 免费一级片在线观看| 国产精品激情| 97色伦亚洲国产| youjizz在线视频| 青青青伊人色综合久久| 成人黄色激情网| 视频免费在线观看| 中文字幕av一区二区三区四区| 日韩免费成人网| 国产69视频在线观看| 日韩a级大片| 亚洲香蕉成视频在线观看| 四虎国产成人精品免费一女五男| 欧美a级成人淫片免费看| 久久国产精品网站| 1级黄色大片儿| 久久久久.com| 亚洲一区二区三区777| 国产xxxx孕妇| www欧美成人18+| 一区精品视频| 密臀av在线| 欧美性感一区二区三区| 国产福利精品一区二区三区| 成人在线视频中文字幕| 亚洲天堂视频在线观看| 丰满少妇被猛烈进入一区二区| 亚洲一级特黄| 国产精品一区二区久久久久| 亚洲第一页综合| 国产欧美精品一区二区色综合朱莉| 精品一区二区成人免费视频| 男人av在线播放| 欧美日韩一区视频| 欧美无人区码suv| 四虎成人精品永久免费av九九| 欧美激情精品久久久久久久变态| 日本a级c片免费看三区| 国产精品99久久久久久似苏梦涵 | 99久久.com| 午夜精品在线视频| 97精品人妻一区二区三区| 丁香五精品蜜臀久久久久99网站| 欧美一级片免费观看| 色网在线观看| 欧美日韩亚洲高清一区二区| 亚洲精品在线视频免费观看| 在线看片不卡| 国产精品吹潮在线观看| 无码精品人妻一区二区| 亚洲精品乱码久久久久久日本蜜臀| 99热成人精品热久久66| 在这里有精品| 久久综合免费视频影院| 无码人妻一区二区三区线| 国产91丝袜在线观看| 亚洲一区二区三区精品在线观看| 欧美a级在线观看| 日韩欧美卡一卡二| 在线视频这里只有精品| 久久久久久婷| 久久久久高清| 1区2区3区在线| 欧美大片免费久久精品三p| 亚洲欧美另类日本| 美洲天堂一区二卡三卡四卡视频 | 性活交片大全免费看| 亚洲国产精品久久久久蝴蝶传媒| 国产精品91视频| 日本韩国一区| 天天影视涩香欲综合网| 东京热av一区| 激情综合自拍| 国产精品乱码| av在线加勒比| 亚洲第一中文字幕在线观看| 精国产品一区二区三区a片| 激情五月激情综合网| 在线电影看在线一区二区三区| 电影一区电影二区| 在线视频精品一| 亚洲图片欧美日韩| 国产日韩欧美精品综合| 午夜视频在线瓜伦| 极品美女一区二区三区| 国产精品wwww| 日本电影在线观看网站| 欧美日本国产一区| 日本高清不卡免费| 国精产品一区一区三区mba桃花| 亚洲精品国产一区| 国产麻豆一区二区三区| 久久九九精品99国产精品| 国产精品一品二区三区的使用体验| 中文字幕中文字幕在线一区| 91日韩精品视频| 欧美国产专区| 国产一区二区三区av在线| 国产免费拔擦拔擦8x高清在线人 | 欧美色图天堂| 日韩av一区二区在线| 91美女免费看| 国产欧美一区二区在线观看| 手机看片一级片| 亚洲欧美在线专区| 国产伦精品一区二区三区视频黑人| 黑人极品ⅴideos精品欧美棵| 亚洲国产成人久久| 欧美一区二区三区网站| 国产精品免费视频一区| 一级淫片在线观看| 伊人精品视频| 日本一区免费观看| 99综合久久| 97精品国产91久久久久久| 激情视频在线观看免费| 欧美精品亚洲二区| 欧美三日本三级少妇99| 欧美国产激情二区三区| 久久久久久久久久久影视| 国产欧美日本| 伊人久久大香线蕉av一区| 97青娱国产盛宴精品视频| 欧洲精品在线视频| 自拍亚洲图区| 亚洲色图第一页| 精品人妻一区二区三区换脸明星| 午夜精品久久久久久不卡8050| 波多野结衣av在线观看| 国产精品一品二品| 国产黄色特级片| 欧美精品观看| 亚洲精品不卡| 偷拍一区二区| 亚洲影视九九影院在线观看| www.com.cn成人| 久久精品久久久久久| 欧美人体大胆444www| 欧美一级二级三级蜜桃| 成人免费毛片视频| 亚洲一区二区三区四区的 | 亚洲一区二区高清| 公肉吊粗大爽色翁浪妇视频| 成人av在线观| 手机看片国产精品| 青青草精品视频| 国产视频一视频二| 午夜国产一区| 一区二区三区国产福利| 免费欧美视频| 黄色91av| 丁香5月婷婷久久| 亚洲一区二区三区四区视频| 精品国模一区二区三区| 91精品国产色综合| 欧美极品少妇videossex| 色综久久综合桃花网| 免费看男男www网站入口在线 | 免费黄色三级网站| 国产乱子伦视频一区二区三区| 精品久久久久av| 99国产精品久久久久久久| 熟妇熟女乱妇乱女网站| 日韩毛片视频| 性欧美大战久久久久久久免费观看| 欧美日韩一区二区三区不卡视频| 国产91精品入口17c| 国产精品美女久久久久人| 国产精品美女久久久免费| 欧美xxx性| 日韩免费在线看| 校园春色亚洲| 18久久久久久| 激情国产在线| 2019av中文字幕| 成人国产电影在线观看| 91精品国产色综合久久不卡98| 国产极品人妖在线观看| 欧美精品福利在线| 男人添女人下部高潮视频在线观看| 欧美精品性视频| 手机在线免费看av| 欧美丰满少妇xxxxx| 国模私拍视频在线播放| 久久久久在线观看| 成入视频在线观看| 4k岛国日韩精品**专区| 中文字幕不卡三区视频| 国产成人啪精品视频免费网| 日本综合久久| 国产日韩专区在线| 日韩免费成人| 国产乱码精品一区二区三区中文 | 久久亚洲电影天堂| 日韩经典av| 韩剧1988免费观看全集| 超碰国产一区| 国产欧美亚洲精品| 韩国一区二区三区视频| 99久久精品久久久久久ai换脸| 51亚洲精品| 久久久久久久久一区| 欧美日韩一区二区三区视频播放| 亚洲欧美在线网| 欧美高清不卡| 日韩欧美在线播放视频| 蜜臀久久99精品久久久久久9| 在线观看日本一区二区| 国产精品亚洲午夜一区二区三区 | 四季av一区二区凹凸精品| 国产日产欧美一区二区| 亚洲电影av| 久久婷婷国产91天堂综合精品| 精品亚洲免费视频| 精品影片一区二区入口| 欧美国产日韩a欧美在线观看| 日韩激情综合网| 午夜av区久久| 亚洲手机在线观看| 亚洲精品在线免费播放| 美国一级片在线免费观看视频| www.久久撸.com| 性欧美18~19sex高清播放| 91精品久久久久久久久久| 激情亚洲另类图片区小说区| 视频在线观看成人| 欧美三级网页| 久久久久久三级| 岛国一区二区在线观看| 免费视频91蜜桃| 亚洲福利一二三区| 中文在线观看av| 亚洲国产精品成人va在线观看| 婷婷视频在线| 欧美专区国产专区| 日韩中文字幕视频网| 日本一区二区久久精品| 狠狠干综合网| 色乱码一区二区三区在线| 99精品欧美一区二区蜜桃免费 | 亚洲妇熟xx妇色黄| 国产精品自偷自拍| 亚洲欧洲日产国码av系列天堂| 人妖欧美1区| 国产精品吹潮在线观看| 日韩中文av| 精品一二三四五区| 久久99精品国产麻豆婷婷| 中文字幕xxx| 亚洲成人激情自拍| 国产成人精品一区二三区四区五区| 亚洲图片在线综合| 色多多在线观看| 国产伦精品一区二区三区高清版 | 九九精品视频在线观看| 久久99国产精品二区高清软件| 久久国产精品-国产精品| 黄色亚洲精品| 天天爽夜夜爽视频| 亚洲欧美视频在线观看| 夜夜狠狠擅视频| 中文字幕在线亚洲| 成人av色网站| 五月天国产一区| 视频一区二区中文字幕| 国产成人无码一区二区在线观看| 亚洲一区在线免费观看| 国产黄频在线观看| 久久99久久亚洲国产| 精品久久亚洲| 男人添女人下部视频免费| 国产主播一区二区三区| 国产精品视频一区二区在线观看| 欧美图区在线视频| 自拍视频在线网| 国产精品女人网站| 日韩片欧美片| a在线观看免费视频| 国产精品久久网站| 亚洲一级片免费看| 久久精品国产亚洲7777| 精品国产鲁一鲁****| 4444在线观看| 粉嫩在线一区二区三区视频| 欧美黄色免费在线观看| 日韩免费在线观看| wwwww亚洲| 精品人伦一区二区三区| 亚洲免费婷婷| 四虎国产精品成人免费入口| 欧美中文字幕一区| 91在线视频| 亚洲一区二区三区xxx视频| 激情久久综合| 国产呦小j女精品视频| 在线观看日韩毛片| 毛片av在线| 福利视频一区二区三区| 午夜综合激情| 精品熟妇无码av免费久久| 欧美精品电影在线播放| 欧美人与性动交α欧美精品济南到| 国产日韩欧美亚洲一区| 日韩精品一级二级 | 欧美午夜在线一二页| 欧美尤物美女在线| 操人视频欧美| 久久国产日本精品| 三级黄色在线观看| 精品成人在线观看| 欧美三区四区| 超级碰在线观看| 99久久精品国产网站| 亚洲精品无码久久久久| 免费91麻豆精品国产自产在线观看 | 岛国毛片在线观看| 亚洲经典中文字幕| 欧美性片在线观看| 宅男一区二区三区| 成人a免费在线看| 免费黄色一级大片| 欧美大片免费看 | 肉大捧一出免费观看网站在线播放 | 免费看污黄网站| 亚洲精品国产高清久久伦理二区| 国精品人妻无码一区二区三区喝尿| 清纯唯美亚洲激情| 欧美电影一区| 亚洲熟女乱综合一区二区三区 | 丰满肉嫩西川结衣av| 日本国产高清不卡| 国色天香一区二区| 中文字幕伦理片| 精品无人区太爽高潮在线播放| 99精品美女视频在线观看热舞|