【大咖來(lái)了 第7期】智能導(dǎo)購(gòu)對(duì)話機(jī)器人實(shí)踐
原創(chuàng)【51CTO.com原創(chuàng)稿件】當(dāng)下電商行業(yè)相對(duì)成熟且呈現(xiàn)出諸多形態(tài),如何為終端用戶(hù)提供更好的服務(wù),進(jìn)而提高運(yùn)營(yíng)和企業(yè)的效率,是每個(gè)電商企業(yè)不得不面對(duì)的問(wèn)題,智能導(dǎo)購(gòu)對(duì)話機(jī)器人在這樣的背景下應(yīng)需而生。本期《大咖來(lái)了》直播欄目邀請(qǐng)的是智能一點(diǎn)CTO莫瑜,分享主題為《智能導(dǎo)購(gòu)對(duì)話機(jī)器人實(shí)踐》,深入闡述了智能導(dǎo)購(gòu)對(duì)話機(jī)器人背后的技術(shù)細(xì)節(jié),及實(shí)際研發(fā)過(guò)程中的一些總結(jié)與思考。
智能導(dǎo)購(gòu)對(duì)話機(jī)器人的應(yīng)用場(chǎng)景
什么場(chǎng)景需要智能導(dǎo)購(gòu)對(duì)話機(jī)器人呢?用戶(hù)在夜間購(gòu)物是很難找到人工客服的,此時(shí)智能導(dǎo)購(gòu)機(jī)器人對(duì)提高電商客戶(hù)的成交就起到非常重要的作用。當(dāng)雙11、618等大促時(shí),雖然提前幾個(gè)月去籌備人工客服,來(lái)應(yīng)對(duì)幾十倍甚至上百倍暴增的流量,但效率和資源投入方面都不盡人意,此時(shí)智能導(dǎo)購(gòu)對(duì)話機(jī)器人就派上了用場(chǎng)。
如下圖,為整個(gè)對(duì)話機(jī)器人后臺(tái)的粗略架構(gòu)
當(dāng)智能對(duì)話機(jī)器人通過(guò)不同電商客戶(hù)端接收到用戶(hù)消息后,如能直接回答便會(huì)自動(dòng)回復(fù),超出能力范圍便會(huì)分發(fā)給人工客服。智能對(duì)話機(jī)器人自動(dòng)回答用戶(hù)問(wèn)題的流程是這樣的,首先對(duì)話管理平臺(tái)接收消息,根據(jù)上下文理解用戶(hù)意圖,分發(fā)智能導(dǎo)購(gòu)機(jī)器人,中控模塊收接到智能導(dǎo)購(gòu)機(jī)器人的反饋后做最終仲裁,并把結(jié)果反饋給用戶(hù)。整個(gè)流程看似簡(jiǎn)單,但技術(shù)實(shí)現(xiàn)卻不是易事。
智能導(dǎo)購(gòu)對(duì)話機(jī)器人背后的技術(shù)細(xì)節(jié)
智能導(dǎo)購(gòu)機(jī)器人包含三部分,分別是問(wèn)答機(jī)器人、任務(wù)機(jī)器人和推薦機(jī)器人。問(wèn)答機(jī)器人主要解決不需要通過(guò)多輪交互便可以解決的問(wèn)題,是任務(wù)機(jī)器人的基礎(chǔ)。任務(wù)機(jī)器人通過(guò)跟用戶(hù)多輪的交互,從而幫助用戶(hù)解決某個(gè)需求,比問(wèn)答機(jī)器人更上一層。推薦機(jī)器人基于任務(wù)和問(wèn)答機(jī)器人構(gòu)建,特點(diǎn)在于主動(dòng)和用戶(hù)進(jìn)行交互。
問(wèn)答機(jī)器人
問(wèn)答機(jī)器人一般是基于問(wèn)答庫(kù)構(gòu)建,問(wèn)答庫(kù)中存儲(chǔ)幾萬(wàn)、幾十萬(wàn)甚至更多已知相匹配的問(wèn)題與答案數(shù)據(jù),當(dāng)用戶(hù)輸入的問(wèn)題與庫(kù)中某一個(gè)問(wèn)題語(yǔ)義相同時(shí),便把相應(yīng)答案反饋給用戶(hù)。基于問(wèn)答庫(kù)的問(wèn)答機(jī)器人一般采用基于規(guī)則、統(tǒng)計(jì)學(xué)習(xí)、預(yù)訓(xùn)練模型、小樣本學(xué)習(xí)的技術(shù)方案:
基于規(guī)則和統(tǒng)計(jì)學(xué)習(xí)方式
當(dāng)用戶(hù)消息中包含某個(gè)關(guān)鍵詞,匹配某個(gè)正則表達(dá)式,及符合某個(gè)規(guī)則引擎時(shí),準(zhǔn)確識(shí)別意圖,反饋對(duì)應(yīng)答案。這種方式簡(jiǎn)單可控,但缺少語(yǔ)義理解,不容易維護(hù)。
基于統(tǒng)計(jì)學(xué)習(xí)的方案需要標(biāo)注數(shù)據(jù),像SVM、Deep Semantic Model(深度語(yǔ)義模型)、這些模型會(huì)涉及到人工設(shè)計(jì)特征、深度特征、one-hot(稀疏表達(dá))和embedding(稠密表達(dá))。相比基于規(guī)則的方式,基于統(tǒng)計(jì)學(xué)習(xí)的方案學(xué)到更多語(yǔ)義,但缺點(diǎn)在于需要大量領(lǐng)域知識(shí)、領(lǐng)域相關(guān)標(biāo)注數(shù)據(jù)。
基于預(yù)訓(xùn)練模型和小樣本學(xué)習(xí)
在缺少數(shù)據(jù)標(biāo)注的情況下,可以選擇基于預(yù)訓(xùn)練模型和小樣本學(xué)習(xí)這兩種方式。2018年基于BERT 的Fine tuning發(fā)布,很多問(wèn)題的最佳結(jié)果得到刷新,語(yǔ)義相似度方面也是一樣。
當(dāng)每個(gè)問(wèn)答庫(kù)的數(shù)據(jù)非常少,每一個(gè)意圖場(chǎng)景僅有幾條,可以嘗試使用基于小樣本學(xué)習(xí)方式。
除了,基于問(wèn)答庫(kù)的問(wèn)答機(jī)器人之外,還有一種很重要的基于知識(shí)圖譜的問(wèn)答機(jī)器人:
基于知識(shí)圖譜方式
大部分用戶(hù)咨詢(xún)的問(wèn)題都與商品或活動(dòng)相關(guān),這些問(wèn)題基本上可以建模為知識(shí)圖譜。在電商領(lǐng)域,商品、活動(dòng)數(shù)據(jù)是非常重要的兩部分?jǐn)?shù)據(jù)源,再加之行業(yè)數(shù)據(jù)全部存到數(shù)據(jù)庫(kù)中,就可以查詢(xún)并回答大多數(shù)用戶(hù)的問(wèn)題。
如下圖,為知識(shí)圖譜的構(gòu)建和問(wèn)答模式
客戶(hù)原有的結(jié)構(gòu)化數(shù)據(jù)、從頁(yè)面抽取的半結(jié)構(gòu)化數(shù)據(jù),以及像用戶(hù)評(píng)論等非結(jié)構(gòu)化數(shù)據(jù)是知識(shí)圖譜的三大數(shù)據(jù)源,在此之上構(gòu)建知識(shí)圖譜,結(jié)合知識(shí)圖譜進(jìn)行查詢(xún)之后,放到相應(yīng)的存儲(chǔ)引擎中去,如有些數(shù)據(jù)需要做頻繁查詢(xún),也可放到關(guān)系數(shù)據(jù)庫(kù)中。當(dāng)收到用戶(hù)請(qǐng)求,可以進(jìn)行句法解析把句子轉(zhuǎn)化成查詢(xún)形式,也可以對(duì)問(wèn)題進(jìn)行核心部分提取并查詢(xún)。
任務(wù)機(jī)器人
對(duì)話交互系統(tǒng)是任務(wù)機(jī)器人的核心,包含語(yǔ)義理解、對(duì)話管理、文本生成等模塊,如下圖為比較常用且相對(duì)成熟框架。
語(yǔ)義理解又可以細(xì)分為領(lǐng)域分類(lèi)、意圖識(shí)別和槽值抽取三部分,首先判斷用戶(hù)問(wèn)題屬于哪個(gè)領(lǐng)域,其次理解用戶(hù)意圖,并識(shí)別用戶(hù)意圖后進(jìn)行槽值抽取(獲取對(duì)應(yīng)意圖場(chǎng)景關(guān)聯(lián)的重要參數(shù))。
意圖識(shí)別
意圖識(shí)別是非常重要的模塊,如果意圖識(shí)別失敗或錯(cuò)誤,整個(gè)后續(xù)的交互會(huì)顯得非常古怪。如下圖,為意圖識(shí)別綜合方案。
此組合方案中,基于參數(shù)模型意圖識(shí)別為主,基于上下文、規(guī)則和KNN意圖識(shí)別為輔。使用傳統(tǒng)特征和深度模型特征去融合基于標(biāo)注數(shù)據(jù)做的模型,把模型當(dāng)做分類(lèi)器,輸出是屬于某種意圖場(chǎng)景。每個(gè)意圖都會(huì)有關(guān)心的槽值或參數(shù),實(shí)體抽取主要是基于規(guī)則和序列標(biāo)注相組合的方式,如下圖。
規(guī)則方案適合相對(duì)有規(guī)律或封閉的集合,像地址、郵箱地址、商品鏈接等數(shù)據(jù)。對(duì)于一些開(kāi)放集合,沒(méi)辦法用規(guī)則支持情況下,可采用序列標(biāo)注方式。情感分析也屬于語(yǔ)義理解范疇,如某個(gè)用戶(hù)情緒如何,是正向還是負(fù)面,是否發(fā)生變化。
對(duì)話管理
對(duì)話狀態(tài)管理本身是一個(gè)很復(fù)雜的工作,如果用戶(hù)并沒(méi)有完全遵循交互設(shè)計(jì)的流程進(jìn)行,會(huì)出現(xiàn)意圖偏移的情況。如下圖,為對(duì)話交互設(shè)計(jì)簡(jiǎn)易流程。
當(dāng)用戶(hù)咨詢(xún)的問(wèn)題存在歧義,當(dāng)理解意圖反饋后,用戶(hù)發(fā)起追問(wèn),超出事初預(yù)測(cè)的范疇,遇到這些情況該如何處理?這里就會(huì)應(yīng)用可配置的對(duì)話交互系統(tǒng),智能地和終端用戶(hù)進(jìn)行交互。對(duì)話交互系統(tǒng)可以根據(jù)客戶(hù)描述語(yǔ)言定義的支持所需機(jī)器人的對(duì)話配置。
目前,對(duì)話交互設(shè)計(jì)系統(tǒng)可以做到設(shè)計(jì)和實(shí)現(xiàn)解耦。技術(shù)研發(fā)在完善對(duì)話交互系統(tǒng)的同時(shí),導(dǎo)購(gòu)/領(lǐng)域?qū)<铱梢暂p松地配置定制化機(jī)器人。
推薦機(jī)器人
為什么需要個(gè)性化推薦?原因有二,其一對(duì)話交互有利于信息的獲取,不利于信息的展現(xiàn),其二對(duì)話交互需要細(xì)粒度的個(gè)性化。在電商場(chǎng)景中,推薦機(jī)器人在實(shí)際交互過(guò)程中的使用占比非常大,有些店鋪接近20%的客服請(qǐng)求中含有商品鏈接或推薦需求。
相比傳統(tǒng)推薦系統(tǒng)而言,對(duì)話交互推薦系統(tǒng)可以結(jié)合更加豐富的信息,這些信息真實(shí)自然地存在對(duì)話場(chǎng)景中,就是顯式反饋,可以更多地考慮上下文,如:時(shí)間(早中晚/星期)、地點(diǎn)、情緒、環(huán)境(商家情況)等。智能導(dǎo)購(gòu)中的推薦方式一般可分為四種,分別是熱門(mén)推薦、相關(guān)推薦、主動(dòng)推薦和交互推薦等。
接下來(lái)我們主要介紹相對(duì)比較復(fù)雜的交互推薦方式,下圖為示例。
以推薦奶粉為例,傳統(tǒng)推薦是基于用戶(hù)畫(huà)像,從所有SKU中挑選出最有可能成交的商品進(jìn)行推薦。交互推薦是先推薦某一款,之后進(jìn)一步溝通,雙方信息得以交換。這樣一來(lái),用戶(hù)了解商家信息的同時(shí)商家知曉了用戶(hù)喜好,減少信息不對(duì)稱(chēng),彌補(bǔ)雙方理解上的差異,進(jìn)而更好地服務(wù)這個(gè)用戶(hù)。針對(duì)這部分內(nèi)容,基于具體示例,詳盡闡述交互推薦的流程及建模,請(qǐng)戳(http://aix.51cto.com/activity/10015.html),進(jìn)行觀看。
實(shí)際研發(fā)過(guò)程中的總結(jié)與思考
對(duì)話機(jī)器人領(lǐng)域非常龐大,也有很多新技術(shù)在不斷發(fā)展,實(shí)際用對(duì)話技術(shù)解決業(yè)務(wù)問(wèn)題的過(guò)程中,會(huì)碰到大大小小的問(wèn)題,這里主要分享如下幾點(diǎn):
第一,產(chǎn)品設(shè)計(jì) vs 技術(shù)邊界。要注意權(quán)衡產(chǎn)品設(shè)計(jì)和技術(shù)邊界之間的關(guān)系,考慮在技術(shù)能夠解決問(wèn)題的同時(shí)如何通過(guò)產(chǎn)品巧妙的設(shè)計(jì)、產(chǎn)品流程交互去降低對(duì)技術(shù)的要求,提升客戶(hù)體驗(yàn)。
第二,全自動(dòng) vs 人機(jī)協(xié)同。對(duì)機(jī)器人來(lái)說(shuō),用戶(hù)總期望它的行為/能力與人媲美,現(xiàn)實(shí)中要做到完全全自動(dòng)是很難,采用人機(jī)協(xié)同的方式才能夠給用戶(hù)更好的體驗(yàn)。必須全自動(dòng)的情況下,需要引入交互推薦方式,進(jìn)而使得人跟機(jī)器之間的交互更加順暢。
第三,用戶(hù)參與感 vs 配置易用性。客戶(hù)參與配置機(jī)器人,會(huì)有馴服機(jī)器人的成就感。但配置在易用性方面要多加斟酌,不要太繁瑣,免得客戶(hù)有畏懼心理。
第四,可控 vs 智能。在電商場(chǎng)景,實(shí)際商用對(duì)話系統(tǒng)可控和智能兼得,何時(shí)可控何時(shí)智能,需要做很多方面的權(quán)衡。如推薦交互策略可以基于強(qiáng)化學(xué)習(xí)越智能越好,但對(duì)于整個(gè)對(duì)話系統(tǒng)策略方面,模塊優(yōu)化,仲裁邏輯、交互流程等環(huán)節(jié),需要通過(guò)配置或交互設(shè)計(jì)使得更加可控。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】






































