數(shù)字化轉(zhuǎn)型浪潮之下,買車也能靠算法優(yōu)化?
原創(chuàng)
近年來,汽車產(chǎn)業(yè)在數(shù)字化轉(zhuǎn)型浪潮的驅(qū)動(dòng)下,不斷進(jìn)行著穩(wěn)步的轉(zhuǎn)型升級(jí)與業(yè)務(wù)重塑。而在此過程中,AI 算法的介入為汽車產(chǎn)業(yè)各業(yè)務(wù)線的經(jīng)營效率提升與價(jià)值平衡起到了極大的幫助。在不久前由 51CTO 舉辦的【T·TALK】全年系列技術(shù)分享活動(dòng)中,大搜車集團(tuán) AI 中心負(fù)責(zé)人 / 資深總監(jiān)張揚(yáng)老師就“AI 算法在汽車行業(yè)數(shù)字化轉(zhuǎn)型中的應(yīng)用”話題進(jìn)行了公開的直播分享,結(jié)合汽車行業(yè)自身特性,重點(diǎn)介紹了 AI 技術(shù)在多場(chǎng)景數(shù)字化中的應(yīng)用以及基于 AI 算法的汽車行業(yè)業(yè)務(wù)優(yōu)化案例。以下為本次分享的核心內(nèi)容整理,希望能為讀者帶來一些收獲。
互聯(lián)網(wǎng)演進(jìn)
1、從消費(fèi)互聯(lián)到產(chǎn)業(yè)互聯(lián)
本次分享,主要想與大家聊一聊 AI 算法以及我在汽車行業(yè)和消費(fèi)互聯(lián)網(wǎng)行業(yè)的一些工作實(shí)踐。在這其中,首先要介紹的是消費(fèi)互聯(lián)網(wǎng)與產(chǎn)業(yè)互聯(lián)網(wǎng)的概念。
結(jié)合自身經(jīng)驗(yàn)來講,我從 2012 年開始負(fù)責(zé)搜狗輸入法的算法團(tuán)隊(duì),對(duì)于搜狗而言,更多的是涉足到消費(fèi)互聯(lián)網(wǎng)上的,大家對(duì)消費(fèi)互聯(lián)網(wǎng)都比較了解,包括衣食住行在內(nèi),每一個(gè)行業(yè)在目前也都有每一個(gè)行業(yè)的劇情。
從 2021 開始,我加入了搜車集團(tuán),投身到了產(chǎn)業(yè)互聯(lián)網(wǎng)行業(yè)。產(chǎn)業(yè)互聯(lián)網(wǎng)的核心其實(shí)同樣是應(yīng)用 AI、云計(jì)算、大數(shù)據(jù)等技術(shù),對(duì)行業(yè)上的一些經(jīng)典應(yīng)用場(chǎng)景進(jìn)行賦能。從狹義角度看,產(chǎn)業(yè)互聯(lián)網(wǎng)主要涉及生產(chǎn)制造領(lǐng)域。而從廣義角度來講,產(chǎn)業(yè)除了生產(chǎn)制造外,還必須經(jīng)過流通、交易、物流及倉儲(chǔ),因此產(chǎn)業(yè)互聯(lián)網(wǎng)也并非完全局限于生產(chǎn)制造的領(lǐng)域。
2、數(shù)智化演進(jìn)
互聯(lián)網(wǎng)的賦能技術(shù),其中所涉及的方法很多都是相通的,包括 AI、大數(shù)據(jù)、云計(jì)算以及現(xiàn)在的區(qū)塊鏈和物聯(lián)網(wǎng)的一些技術(shù)。而這其中的趨勢(shì),可以理解為信息化、數(shù)字化和智能化三個(gè)階段。
信息化,是一個(gè)形式上的變化和差異。數(shù)字化,更多的是商業(yè)模式包括應(yīng)用方式的轉(zhuǎn)變。而在數(shù)字化的一個(gè)更高級(jí)階段,所經(jīng)歷的則是廣泛的應(yīng)用 AI 以及相關(guān)技術(shù)對(duì)數(shù)字化的提速。通過 AI 技術(shù)的賦能,如今各行業(yè)的數(shù)字化進(jìn)程正呈現(xiàn)出指數(shù)加速的趨勢(shì)。

AI 賦能產(chǎn)業(yè)互聯(lián)網(wǎng)
1、典型應(yīng)用場(chǎng)景
接下來,我將以汽車行業(yè)為例介紹產(chǎn)業(yè)互聯(lián)網(wǎng)的算法應(yīng)用。選擇汽車行業(yè)作為具體案例的主要原因有兩個(gè),第一是因?yàn)槠囆袠I(yè)的市場(chǎng)規(guī)模與市場(chǎng)空間比較大,目前中國已是全球規(guī)模最大的汽車消費(fèi)市場(chǎng),不管是新車還是二手車,都擁有著比較大的規(guī)模。
第二,在汽車行業(yè)里涉及到的商品數(shù)量是較少的,這使得技術(shù)更容易實(shí)現(xiàn)。以車型為例,品牌下有不同的車系,車系下有不同的車型,數(shù)目大概是六七萬的規(guī)模。當(dāng)在進(jìn)行 AI 實(shí)踐的時(shí)候,如果需要做知識(shí)圖譜的話,一個(gè)幾億規(guī)模的圖譜和一個(gè)幾萬規(guī)模的圖譜,其中的差異是很大的,會(huì)涉及到工作量以及重復(fù)勞動(dòng)的問題,這會(huì)影響 AI 工作所能提供的技術(shù)高度。
在具體業(yè)務(wù)線的選擇上,本次會(huì)以二手車作為業(yè)務(wù)主線。目前,包括搜車在內(nèi)的國內(nèi)外頭部汽車行業(yè)企業(yè),都是以二手車作為主業(yè)的,這其中也有著幾點(diǎn)重要的原因。首先,二手車是非標(biāo)品。二手車作為一個(gè)商品去買賣的時(shí)候,是一車一況的,其使用情況、折舊情況都有所不同,這就會(huì)造成較大的議價(jià)空間,正因?yàn)橛欣娴尿?qū)使,所以做車輛流通的企業(yè)都傾向于二手車作為主業(yè),不像廣告詞說的那樣,確實(shí)是需要有中間商賺差價(jià)的。
另外,目前中國的二手車交易是逐年增長的,并且有相關(guān)的政策扶持,國家也在促進(jìn)二手車的應(yīng)用和流通。
2、目標(biāo)及需求分析
從 AI 從業(yè)者的角度來講,當(dāng)我們?cè)谧銎嚵魍ǎ绕涫嵌周嚵魍I(lǐng)域業(yè)務(wù)時(shí),是會(huì)遇到一些困難和挑戰(zhàn)的。其中最主要的便是之前所提到過的一車一況,二手車的車況是難以判定的,但是當(dāng)我們將二手車進(jìn)行商品化時(shí),需要去判定車況損耗的情況,比如剮蹭、掉漆、磨損,需要去界定它的狀態(tài)和價(jià)值,這樣才能完成對(duì)它的完全商品化。另外,對(duì)車輛相關(guān)證件的信息化錄入也是必不可少的。這些都是將二手車從一個(gè)線下實(shí)體變?yōu)榫€上可瀏覽頁面所需要做的工作。
其次,因?yàn)槲覀兊闹饕ぷ魇切袠I(yè)賦能,對(duì)于傳統(tǒng) 4S 店以及二手車商而言,它們的店面主要是存在于線下的。對(duì)于一些線上或線下的 C 端客戶而言,它們需要的是快速的匹配,但這其中難免會(huì)存在一些地域差異等影響因素。
最后,在二手車的售后過程中也很容易出現(xiàn)問題,如果顧客接手了事故車,那么顧客后續(xù)的使用包括安全方面是會(huì)存在很大隱患的,這里面也存在很多難以處置的問題。

而搜車所做的,則是為上述問題提供基于 AI 技術(shù)的行業(yè)解決方案,AI 解決的基礎(chǔ)可以理解為 ABC。A 代表 AI,B 代表大數(shù)據(jù),C 代表云計(jì)算。搜車的側(cè)重點(diǎn)主要在交易和營銷領(lǐng)域,從一開始商品的上架,到交易的匹配,再到交易的金融方案與物流售后,每一個(gè)環(huán)節(jié)我們都會(huì)有相應(yīng)的賦能。整體流程可分為前中后三個(gè)階段,其中的定損檢測(cè)和殘值預(yù)測(cè)是二手車特有的,去掉這兩個(gè)步驟,剩余的階段對(duì)于新車交易也是同樣適用的。
基于 AI 技術(shù)的優(yōu)化方案
1、車況檢測(cè)優(yōu)化
本次主要選擇整體流程中的車況檢測(cè)、殘值預(yù)測(cè)與匹配交易三個(gè)環(huán)節(jié),與大家分享 AI 算法在其中的應(yīng)用。首先,是車況檢測(cè)環(huán)節(jié)。做定損檢測(cè)分成五個(gè)環(huán)節(jié),首先對(duì)于車輛的車證進(jìn)行錄入,接下來檢測(cè)師會(huì)對(duì)車輛的外觀和內(nèi)飾做拍照或錄制視頻,AI 算法則會(huì)自動(dòng)識(shí)別視頻或者圖片里的車輛部件及瑕疵。隨后,檢測(cè)師將對(duì)所呈現(xiàn)的瑕疵進(jìn)行核對(duì)及修改。在確認(rèn)信息無誤后,檢測(cè)師會(huì)把數(shù)據(jù)傳輸?shù)皆贫撕笈_(tái)進(jìn)行審核。
在這個(gè)流程中要解決的核心問題,是要提升算法識(shí)別的精確度。而其中主要的困難,在于汽車部件與瑕疵類型的數(shù)目過多且難以區(qū)分。對(duì)此,所做出的提速和效果優(yōu)化分成幾個(gè)維度,一般圖像識(shí)別的任務(wù)會(huì)用 CNN 去抽取基本特征,而后是基于 Transformer 的模型在圖像中進(jìn)行應(yīng)用,并使用 Transformer 的模型做了一些簡(jiǎn)單的調(diào)整。另一方面,基于汽車的圖片,我們構(gòu)建了一個(gè)汽車領(lǐng)域的預(yù)訓(xùn)練的模型,并在流程上做了一些優(yōu)化,使得一張圖里邊能夠識(shí)別盡可能多的缺陷,當(dāng)然這里也有可能誤檢與漏檢,對(duì)此我們做了一些調(diào)整,使得我們后面的提速得到了比較明顯的體現(xiàn)。

2、殘值預(yù)測(cè)優(yōu)化
其次是車輛殘值預(yù)測(cè)環(huán)節(jié),這里的第一個(gè)困難是在于缺乏標(biāo)準(zhǔn),二手車很難用一個(gè)很確切的方式去衡量。它的價(jià)格影響因素很多,有地域因素、車況因素、顏色因素,這是在品牌車型之外的一些需要去考量的目標(biāo)。第二,在所使用的數(shù)據(jù)中,車輛要么作為零售賣出,要么就是批售賣出,不會(huì)同時(shí)存在零售價(jià)和批售價(jià),因此會(huì)存在零售價(jià)和批售價(jià)倒掛的問題。
對(duì)于上述問題,首先需進(jìn)行數(shù)據(jù)層面的優(yōu)化,采用新車與二手車的零售價(jià)、批售價(jià)數(shù)據(jù)進(jìn)行共同考慮。由于國產(chǎn)車與外國品牌車輛的銷售策略不同,因此新車的指導(dǎo)價(jià)與到手價(jià)會(huì)是二手車估價(jià)的一個(gè)重要影響因素。另一方面,是否有足夠的交易數(shù)據(jù)量支撐也是極為重要的一點(diǎn)。而在特征層面,則需要更加全面的特征考量,這其中包括車輛的車型信息、車齡、地域、顏色、過戶次數(shù)、里程數(shù)、車況、新車指導(dǎo)價(jià)、新車到手價(jià)等特征。其次是模型層面,這部分的差異化是比較小的,各企業(yè)都會(huì)利用深度學(xué)習(xí)模型或者樹模型。最后的接口層面,零售、批售對(duì)應(yīng)的價(jià)格以及處置的周期,都是往經(jīng)營分析上面去靠的。
3、匹配交易優(yōu)化
最后一個(gè)環(huán)節(jié),是車輛的匹配與交易,該環(huán)節(jié)存在的困難第一是車輛的購買,C 端是一個(gè)高消費(fèi)但低頻的環(huán)節(jié),用戶的決策周期是比較長的,而車商往往是聚集到線下的。因此,獲取采集它們信息并放到線上去做自動(dòng)的匹配是比較困難的,并且這其中還存在一些地域的差異。對(duì)此的解決的方式是,通過集團(tuán)內(nèi)部資源的整合,盡可能讓交易能夠掛到線上,并綜合考慮物流,盡可能地解決其中的跨地域問題,包括對(duì)一些頂價(jià)策略、一些 bot 策略去做提升。這里的技術(shù)架構(gòu)其實(shí)也是比較經(jīng)典的,就是推薦系統(tǒng)的模型。
而為了更好的賦能匹配與交易環(huán)節(jié),需要對(duì)傳統(tǒng)推薦系統(tǒng)進(jìn)行優(yōu)化,更多的考慮用戶的系統(tǒng)優(yōu)化,并把用戶的推薦系統(tǒng)的系統(tǒng)目標(biāo)與平臺(tái)的營收目標(biāo)結(jié)合起來,基于 MMoE 模型進(jìn)行整合。綜合的考慮用戶使用的滿意度以及平臺(tái)營收的滿意度。采用田忌賽馬的思想,在某些部分進(jìn)行一定程度的舍棄,去降低某些客戶的需求,實(shí)現(xiàn)保證全局收益的最終目標(biāo)。

總結(jié)與展望
無論是消費(fèi)互聯(lián)網(wǎng)還是產(chǎn)業(yè)互聯(lián)網(wǎng),其中都會(huì)應(yīng)用到很多的 AI 技術(shù)。而我們要做的,是根據(jù)業(yè)務(wù)的需求和目標(biāo)選擇合適的模型,以結(jié)果作為技術(shù)應(yīng)用的最終導(dǎo)向,為業(yè)務(wù)目標(biāo)的提升、用戶體驗(yàn)的提升,去選擇最合適的技術(shù)手段。
并且在許多業(yè)務(wù)之中,一些人工的、規(guī)則的,包括一些統(tǒng)計(jì)的簡(jiǎn)單模型,其實(shí)也是有著生存空間的,而且它們所發(fā)揮的作用有時(shí)會(huì)比我們所追求的高大上的算法還要大。最后,在技術(shù)的應(yīng)用方面,希望大家能進(jìn)行更多新的嘗試,這將會(huì)是很有意思的事情。
嘉賓介紹
張揚(yáng),大搜車集團(tuán) AI 中心負(fù)責(zé)人 / 資深總監(jiān)。搜狗輸入法初創(chuàng)成員之一,歷任搜狗輸入法算法負(fù)責(zé)人,前平安人壽 AI Lab 語義問答產(chǎn)品負(fù)責(zé)人,現(xiàn)大搜車集團(tuán) AI 中心負(fù)責(zé)人、資深總監(jiān)。發(fā)表及合作發(fā)表 ACL、EMNLP、IJCAI 等 CCF A/B 類國際 AI 會(huì)議論文 10 篇,國際及國內(nèi)技術(shù)專利 28 項(xiàng)。
此外,更加值得關(guān)注的是,在今年的 4 月 9 日 -10 日,張揚(yáng)老師還將以專題出品人及演講嘉賓的身份出席 WOT 全球技術(shù)創(chuàng)新大會(huì),并在大會(huì)的“算法與 AI 應(yīng)用”專題中為參會(huì)聽眾帶來更多 AI 技術(shù)細(xì)節(jié)層面的內(nèi)容分享。對(duì) AI 算法及產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型感興趣的同學(xué),這將是你不容錯(cuò)過的學(xué)習(xí)與成長機(jī)會(huì)。
目前大會(huì) 8 折購票中,現(xiàn)在購票立減 1160 元,團(tuán)購還有更多優(yōu)惠!感興趣的同學(xué)可掃描下圖二維碼或點(diǎn)擊閱讀原文了解更多參會(huì)信息。任何大會(huì)相關(guān)問題歡迎聯(lián)系票務(wù)小姐姐秋秋:15600226809(電話同微信)




























