分音塔CTO張明:深耕旅游行業(yè),運(yùn)用AI技術(shù)解決跨語言溝通問題
原創(chuàng)【51CTO.com原創(chuàng)稿件】二十世紀(jì)三十年代初,法國科學(xué)家G.B.阿爾楚尼提出用機(jī)器來進(jìn)行翻譯想法。時至今日,諸多里程碑事件印證了機(jī)器翻譯的可行性和實(shí)用性,前景的廣闊毋庸置疑。為了更好地利用機(jī)器翻譯解決跨語言溝通的問題,谷歌、百度等國內(nèi)外巨頭相繼成立相關(guān)團(tuán)隊(duì),當(dāng)然也小而美的初創(chuàng)公司深耕細(xì)分行業(yè),集中精力主攻某一場景,如分音塔。
近日,分音塔CTO張明接受了51CTO的專訪,他1999年于新加坡創(chuàng)新科技就職時期,便開始接觸機(jī)器翻譯,所以在這方面有著很多深入獨(dú)到的見解。
張明·分音塔CTO
機(jī)器翻譯三大階段:規(guī)則、統(tǒng)計(jì)算法(SMT)、深度學(xué)習(xí)(NMT)
張明表示,機(jī)器翻譯也和眾多技術(shù)發(fā)展的路線雷同,從技術(shù)角度來看,主要可以分為三大階段:規(guī)則、統(tǒng)計(jì)算法、深度學(xué)習(xí):
規(guī)則
第一階段,是基于規(guī)則的方式。規(guī)則是由語言學(xué)家利用他們對知識、語言的理解進(jìn)行定制,再由計(jì)算機(jī)領(lǐng)域?qū)<襾韺?shí)現(xiàn)規(guī)則。
這樣的方式弊端很明顯,主要是因?yàn)橐?guī)則不可窮舉,那么就沒辦法保證覆蓋到用戶輸入的所有內(nèi)容。當(dāng)用戶輸入的內(nèi)容,與規(guī)則相匹配,翻譯效果會非常好,反之亦然。
SMT
第二階段,是基于統(tǒng)計(jì)算法的方式。隨翻譯領(lǐng)域數(shù)據(jù)的增長,開始對大量的語料資料用統(tǒng)計(jì)方法進(jìn)行建模,逐漸擺脫對語言規(guī)則的依賴。
基于統(tǒng)計(jì)算法的方式實(shí)際上還是有語言學(xué)的原理在其中,整個翻譯過程是如何實(shí)現(xiàn)的,人的認(rèn)知可以進(jìn)行理解和詮釋。
NMT
第三階段,是基于深度學(xué)習(xí)的方式。目前,深度學(xué)習(xí)是一個黑盒應(yīng)用,雖然按照不同模型進(jìn)行翻譯,最終的翻譯效果會提升很多,對于實(shí)現(xiàn)過程如何,以目前人的認(rèn)知,還不能夠進(jìn)行詮釋。
運(yùn)用AI細(xì)分技術(shù) 站在用戶的角度迭代產(chǎn)品
當(dāng)問及為會選擇在2016年成立分音塔,張明表示,隨數(shù)據(jù)、NMT模型的發(fā)展,2015年前后,NMT超越SMT,整個翻譯效果提升非常大。2016年基本上編程N(yùn)MT統(tǒng)一天下,SMT被淘汰,谷歌神經(jīng)機(jī)器翻譯(GNMT)也在這期間問世。機(jī)器翻譯的整體效果能夠在某個場景領(lǐng)域下達(dá)到一個用戶的基本期望值,相關(guān)產(chǎn)品有了落地的可能。
利用AI技術(shù)解決跨語言溝通問題
上文所說的機(jī)器翻譯是純翻譯的設(shè)定,是文本到文本,中文到日文、中文到英文。但分音塔要做的事情是利用AI技術(shù)解決跨語言溝通問題,翻譯只是溝通過程中的一環(huán)節(jié)。
張明介紹,第一代準(zhǔn)兒翻譯機(jī)的落地場景就是把某個人的語音翻譯成對話者能聽懂的語音。這看似簡單的邏輯背后,涉及到語音識別、機(jī)器翻譯、語音合成等AI細(xì)分技術(shù),每個技術(shù)都需要具體不同系的技術(shù)點(diǎn)進(jìn)行處理。
當(dāng)問及這些AI細(xì)分技術(shù)目前哪個處于短板,張明說,無論是技術(shù)角度、還是用戶的市場需求來說,永遠(yuǎn)沒有夠用的情況。就目前來看,還沒有出現(xiàn)能夠全部覆蓋所有的領(lǐng)域的通用平臺,這也是分音塔為什么只選擇深耕旅游行業(yè)的原因。只有把這些AI細(xì)分技術(shù)運(yùn)用到旅游行業(yè)具體場景進(jìn)行優(yōu)化,盡量解決語音識別口語化順滑、吞音等問題,避免由于識別錯誤導(dǎo)致翻譯錯誤逐級被放大、或信息丟失等問題,提高翻譯機(jī)的整體理解率。
站在用戶的角度迭代產(chǎn)品
采訪過程中,張明重點(diǎn)強(qiáng)到分音塔不是一個純技術(shù)的公司,而是做產(chǎn)品、服務(wù)的公司,如何能夠給用戶提供更好的服務(wù)、更好體驗(yàn),才是公司的核心。
準(zhǔn)兒翻譯機(jī)最初沒有設(shè)計(jì)屏幕,目的是小巧便攜。之后為應(yīng)對溝通缺失問題,增設(shè)了屏幕設(shè)計(jì),但是在顯示方面又略顯不足。當(dāng)前我們正在使用的這一代,是觸摸式LED液晶屏,在溝通過程中起到很好的輔助作用。這幾次產(chǎn)品的迭代,都源于用戶的真實(shí)反饋。
緊接著,分音塔會在離線方面做更多探究,因?yàn)樵诼糜螆鼍爸校芏嗟胤绞荳IFI,乃至未來的5G覆蓋不到的。
根據(jù)實(shí)際需求 對后端服務(wù)器進(jìn)行調(diào)整優(yōu)化
當(dāng)問及在服務(wù)用戶過程中,是否對架構(gòu)進(jìn)行調(diào)整,張明坦言,在后端服務(wù)器部署方面初期確實(shí)沒有考慮周全。
在旅游行業(yè),用戶使用翻譯機(jī)一般不會牽扯到高并發(fā)的問題,因?yàn)槌鍪鄣乃蟹g機(jī)不可能同一時間被使用。所以在設(shè)計(jì)后端服務(wù)器時候并沒有過多考慮,只是滿足了當(dāng)時在功能上的正常需求。
但在實(shí)際過程中,高并發(fā)問題雖然不會出現(xiàn),但由于使用翻譯機(jī)的用戶會分布在不同國家,不同地區(qū),傳統(tǒng)寬帶就表現(xiàn)的有些吃力。只能去尋找合適的節(jié)點(diǎn)進(jìn)行部署,盡可能保證用戶在不同國家的訪問速度不會受到影響。
這里值得注意的是,在實(shí)際部署過程中,要結(jié)合重點(diǎn)客戶分布、使用分布地的情況,以及中國人出現(xiàn)最多的幾個國家,如日本、泰國、東南亞地區(qū)等。
采訪最后,張明表示,分音塔未來依然深扎旅游行業(yè),核心還是圍繞吃住行,游娛購這六個方面。分音塔是一個初創(chuàng)公司,可能沒有大公司的資源豐富,沒有大公司的品牌影響力,但是有的是更多的專注,所有的團(tuán)隊(duì)全部集中在旅游領(lǐng)域,真正從用戶需求、市場需求出發(fā),致力為他們提供更好的產(chǎn)品與服務(wù)。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請注明原文作者和出處為51CTO.com】






















