【W(wǎng)OT2018】推薦搜索會場精彩揭秘,論道智能搜索如何提升業(yè)務(wù)價值
原創(chuàng)【51CTO.com原創(chuàng)稿件】2018年,人工智能作為人類開創(chuàng)未來最耀眼的技術(shù)之一,正在深刻影響著全球產(chǎn)業(yè)結(jié)構(gòu)、商業(yè)模式、城市形態(tài)以及人類生活工作方式。如何讓人工智能技術(shù)為行業(yè)賦能,讓眾多行業(yè)共享科技生產(chǎn)力,是數(shù)字化轉(zhuǎn)型浪潮下的重要課題。作為推動人工智能務(wù)實(shí)創(chuàng)新的年度重要活動,11月30日-12月1日,WOT2018全球人工智能技術(shù)峰會在北京•粵財JW萬豪酒店盛大召開。60+國內(nèi)外人工智能一線精英大咖與千余名業(yè)界專業(yè)人士齊聚現(xiàn)場,分享人工智能的平臺工具、算法模型、語音視覺等技術(shù)內(nèi)容,探討人工智能如何賦予行業(yè)新的活力。
12月1日上午,A會場推薦搜索分論壇召開,三位資深專家受邀出席發(fā)表精彩演講。會后51CTO將專家發(fā)言整理成文,希望他們對于技術(shù)的理解和實(shí)踐中的解決方法能夠?qū)Υ蠹矣兴梃b。
張康 奇虎360人工智能研究院技術(shù)經(jīng)理
深度推薦系統(tǒng)在360的應(yīng)用
張康演講的主要內(nèi)容是分享在360各種場景下,基于深度學(xué)習(xí)推薦系統(tǒng)的應(yīng)用。他表示,最淺顯層次的推薦系統(tǒng)就是通過函數(shù)來建模。如果需要在抽象層次再深入一點(diǎn),就是將簡單的數(shù)學(xué)公式拆分成不同的算法模塊,如召回、排序、策略。最后一個層次是把推薦系統(tǒng)服務(wù)于線上,主要由五大部分組成: ETL(數(shù)據(jù)清洗)、Server模塊、Platform(機(jī)器學(xué)習(xí)訓(xùn)練平臺)、A/B測試、報表。
他認(rèn)為,現(xiàn)實(shí)生活中的深度推薦系統(tǒng),很多論文中80%的內(nèi)容會側(cè)重對模型部分的描寫,只有20%的內(nèi)容留給實(shí)驗(yàn),而事實(shí)上實(shí)驗(yàn)包含豐富內(nèi)容,卻很容易被人忽視。他舉例說道,數(shù)據(jù)分析和清洗、特征設(shè)計和交叉、模型對比、召回策略、重排序策略都有很多內(nèi)容需要去實(shí)踐,而真正傳統(tǒng)意義上的實(shí)驗(yàn)如測評、A/B,實(shí)驗(yàn)分析,其實(shí)是和之前這幾項(xiàng)內(nèi)容相互交接起來的。
深度推薦系統(tǒng)在360的應(yīng)用主要有三個方面:APP推薦(360手機(jī)助手)、常搜詞(360搜索&導(dǎo)航)、個性化消息推送(快視頻)。APP推薦算是他們整個團(tuán)隊在推薦領(lǐng)域的第一次試水,他們最終建立一個多分類模型,引入圖像搜索的方案,預(yù)測用戶安裝是否準(zhǔn)確,最終交給業(yè)務(wù)部門做代理優(yōu)化,反饋也比較好。“常搜詞”,就是用戶經(jīng)常會搜的詞,張康介紹到,360導(dǎo)航每天都有好幾億的PV,因此他們需要進(jìn)行天級離線更新,基于用戶的搜索日志、瀏覽日志進(jìn)行統(tǒng)計特征。經(jīng)過個性化+特征優(yōu)化后,這部分業(yè)務(wù)收入上升5%。
個性化消息推送的出發(fā)條件和時間條件跟用戶的個性化實(shí)時相關(guān),并非每天定時定點(diǎn)推薦,內(nèi)容與用戶行為相關(guān),需要個性化推薦,對于“拉活”的意義非常大。他們先是針對語義、視覺、行為召回做優(yōu)化,后來發(fā)現(xiàn)這樣用戶體驗(yàn)并不好,還需要做召回數(shù)據(jù)流的優(yōu)化、模型的更新、在線服務(wù)的調(diào)整等大量工作。除此之外,還要對視覺領(lǐng)域、語義模型、排序做優(yōu)化。在架構(gòu)上,既要有離線部分實(shí)現(xiàn)倒臺服務(wù)和日志搜集、報表,也要跟業(yè)務(wù)方在線系統(tǒng)做實(shí)時交互,給業(yè)務(wù)有更多的活躍用戶。
王建強(qiáng) Stitch Fix創(chuàng)始人、前Twitter高級技術(shù)主管
Stitch Fix : 基于算法推薦的背水一戰(zhàn)
王建強(qiáng)告訴聽眾,Stitch Fix是一家數(shù)據(jù)驅(qū)動的服裝新零售公司,100%的銷售都源于推薦和算法,其中在亞馬遜的銷售約35%都來自推薦,LinkedIn中50%用戶都來自推薦。Stitch Fix是一個盲盒模式銷售,即用戶收到衣服之前不知道收到的是哪些衣服,“我們會給用戶配送五件衣服,以快遞形式送到用戶家,用戶留下自己喜歡的,免費(fèi)送回其他的衣服。”王建強(qiáng)表示,公司試錯成本比較高,還有雙向物流的支出,正是基于此,算法推薦的準(zhǔn)確性對Stitch Fix是關(guān)乎企業(yè)生存能力的重要指標(biāo)。
據(jù)他介紹,Stitch Fix有四個特點(diǎn)來幫助那些沒有時間逛商場或者不太精通穿搭的職場人士,即推薦的細(xì)顆粒度、低頻、自建庫存、人機(jī)耦合的模式做推薦。其中人機(jī)耦合的效果起到了1+1>2的效果,通過機(jī)器計算實(shí)現(xiàn)對大量庫存SKU篩選和排序,從大規(guī)模數(shù)據(jù)中找到Pattern,減輕了人工的壓力。
王建強(qiáng)在現(xiàn)場舉了一個算法推薦模型的實(shí)際應(yīng)用案例。當(dāng)造型師給用戶推薦衣服的時候,看到的是用戶的相關(guān)數(shù)據(jù),如這位用戶30歲,是一個母親,號碼是超小號,生活在明尼蘇達(dá),美國中西部的一個州。系統(tǒng)會把用戶的風(fēng)格樣式劃分到七個緯度,每個緯度是一到四個打分,造型師會根據(jù)這個打分來判斷用戶的風(fēng)格偏好。最后根據(jù)身材尺寸數(shù)據(jù),造型師就可以比較有把握地給用戶推薦衣服。“在推薦主模型里,我們現(xiàn)在用的模型是混合效應(yīng)模型,之所以選擇混合效應(yīng)模型,有兩個因素,一個原因是,我們團(tuán)隊主要是以統(tǒng)計背景為主。另外一個原因,混合效應(yīng)模型,科技執(zhí)行力會更高一些,精度也更高一些。”
蔣前程 美團(tuán)高級算法技術(shù)專家
美團(tuán)O2O服務(wù)搜索的深度學(xué)習(xí)實(shí)踐
蔣前程表示,美團(tuán)覆蓋了用戶吃住行游購?qiáng)矢鱾€領(lǐng)域,年度活躍買家達(dá)3.1億,正因?yàn)榉?wù)種類多,所以也存在一個困擾就是如何快速地找到用戶想要的內(nèi)容,這就是搜索在美團(tuán)平臺上發(fā)揮的價值。據(jù)了解,服務(wù)搜索大概會覆蓋40%的交易,每天服務(wù)的用戶產(chǎn)品量在億級別。
美團(tuán)搜索平臺與傳統(tǒng)搜索平臺相比,有很多自己的特色和挑戰(zhàn)。蔣前程介紹到,首先用戶個性化需求更高,其次需求場景化,不同場景下數(shù)據(jù)和檢索層面都存在很大不同,再次是美團(tuán)用戶具有非標(biāo)屬性,產(chǎn)品沒有標(biāo)準(zhǔn),即使同一個菜品,不同用戶喜歡也各不相同。此外還有實(shí)時化特點(diǎn),上午在公司和晚上在家里對于美食的需求都不一樣。
那么美團(tuán)如何解決這些挑戰(zhàn)呢?蔣前程表示,總結(jié)起來就是通過兩個路徑——通過智能匹配技術(shù)找到用戶想要的,如何讓用戶更快速地找到,這兩點(diǎn)本質(zhì)其實(shí)就是召回和排序。
智能匹配技術(shù)需要注意兩點(diǎn),一是用戶意圖的匹配,二是周圍度的匹配。蔣前程舉了一個例子,例如在北京南站,用戶對餐飲的需求比較大,但是如果是第一次來北京或者是偶爾出差,那可能對住宿的需求就更多一些。所以即使在同一個地點(diǎn),但是在不同場景下美團(tuán)會呈現(xiàn)不同的內(nèi)容。“在多維度方面,除了傳統(tǒng)的文本匹配,也加入了向量化召回的思路。”蔣前程解釋道,做好用戶匹配之后,即使給用戶推薦一百款內(nèi)容,但是用戶最多看幾個,不滿意就會離開,因此,這就需要通過個性化排序來找到用戶最想要的內(nèi)容。
個性化排序主要有三個層面:召回層、模型層、業(yè)務(wù)層。其中模型層演進(jìn)到如今,已經(jīng)進(jìn)入實(shí)時化和深度學(xué)習(xí)階段。其中實(shí)時化需要通過特征實(shí)時化和在線學(xué)習(xí)來實(shí)現(xiàn)。蔣前程重點(diǎn)講了美團(tuán)深度學(xué)習(xí)的框架,它可以更好地支持非常大規(guī)模的數(shù)據(jù)和模型的在線支持、多種模型定義支持、流式模型訓(xùn)練支持。“最終,美團(tuán)訂單有明顯提升,在各個業(yè)務(wù)線上,我們現(xiàn)在的主體模型都是深度學(xué)習(xí)的模型,也是流式模型,都有非常正向的效果。”蔣前程總結(jié)道。
以上內(nèi)容是51CTO記者根據(jù)WOT2018全球人工智能技術(shù)峰會的《推薦搜索》分論壇演講內(nèi)容整理,更多關(guān)于WOT的內(nèi)容請關(guān)注51cto.com。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請注明原文作者和出處為51CTO.com】







































