滴滴出行構(gòu)建業(yè)務(wù)中臺(tái)應(yīng)對軟件復(fù)雜度的具體對策與實(shí)踐
原創(chuàng)【51CTO.com原創(chuàng)稿件】經(jīng)歷5年發(fā)展,滴滴出行已擁有4.5億用戶、超過2100萬車主,業(yè)務(wù)覆蓋400+城市。在創(chuàng)業(yè)初期,為了快速擁抱業(yè)務(wù),架構(gòu)的建設(shè)在體系化、完善度等方面會(huì)有所不足。隨時(shí)間推移,架構(gòu)在可持續(xù)性、穩(wěn)定性等方面需不斷進(jìn)步。
2017年12月1日,在51CTO主辦的WOTD 2017全球軟件開發(fā)技術(shù)峰會(huì)主會(huì)場上,滴滴出行執(zhí)行總監(jiān)賴春波做了主題為《如何構(gòu)建滴滴出行業(yè)務(wù)中臺(tái)》的精彩演講,從中可以了解到滴滴出行構(gòu)建業(yè)務(wù)中臺(tái)的原因及在過程中遇到的問題和應(yīng)對的策略。在峰會(huì)現(xiàn)場,賴春波老師也接受了我們的專訪,進(jìn)一步交流構(gòu)建業(yè)務(wù)中臺(tái)的一些實(shí)踐經(jīng)驗(yàn)。
賴春波·滴滴出行執(zhí)行總監(jiān)
構(gòu)建業(yè)務(wù)中臺(tái)的原因
2015年末,滴滴出行在短時(shí)間內(nèi)形成了包括快車、出租車、專車、順風(fēng)車、代駕等多業(yè)務(wù)的垂直化架構(gòu)。滴滴啟動(dòng)了中臺(tái)戰(zhàn)略整合業(yè)務(wù)系統(tǒng)。決定構(gòu)建業(yè)務(wù)中臺(tái)主要出于四方面考慮:專業(yè)深度、人力資源、用戶體驗(yàn)、全局打通
專業(yè)深度。由于是多業(yè)務(wù)垂直化的架構(gòu),會(huì)有多個(gè)團(tuán)隊(duì)開發(fā)同樣的架構(gòu),這就需要很多的工程師。每個(gè)團(tuán)隊(duì)都是用最快速的方式構(gòu)建流程,所以技術(shù)很難做深。這樣一來,導(dǎo)致客戶端的流暢度不高,后端不穩(wěn)定,影響可擴(kuò)展性。
人力資源。原則上來說把每個(gè)團(tuán)隊(duì)加到足夠的人,每個(gè)架構(gòu)都能有很好的發(fā)展。但工程師的薪資都非常高,招聘大量工程師來做同樣的架構(gòu),研發(fā)成本高昂。很還有些時(shí)候,愿意花錢,卻招聘不到合適的人。
用戶體驗(yàn)。流暢度、穩(wěn)定性、擴(kuò)展性、界面、交易流程等都是影響用戶體驗(yàn)的重要因素。在當(dāng)時(shí)的組織結(jié)構(gòu)和研發(fā)情況下,會(huì)出現(xiàn)業(yè)務(wù)的顏色各異,交易流程卻相同的問題,很影響用戶的體驗(yàn)。
全局打通。所有業(yè)務(wù)本質(zhì)都是出行,出行本質(zhì)有協(xié)同效應(yīng)。但在各自獨(dú)立發(fā)展情況下,協(xié)同性就完全沒有,在構(gòu)建中臺(tái)過程中,可以逐步把協(xié)同性加起來。
構(gòu)建出行業(yè)務(wù)中臺(tái)在軟件復(fù)雜度上的挑戰(zhàn)
構(gòu)建出行業(yè)務(wù)中臺(tái)并不是只有好處,也一定會(huì)帶來很多問題,***的問題是軟件復(fù)雜度。
從業(yè)務(wù)角度來說,把所有業(yè)務(wù)合并到一個(gè)體系下,本身就是很難的事,再加上滴滴出行是實(shí)時(shí)性O(shè)2O業(yè)務(wù),場景差異很大,而且作為互聯(lián)網(wǎng)公司,不僅很多需求不明確,還會(huì)持續(xù)變化。這種情況下,想要用一套相對穩(wěn)定、相對固定的架構(gòu)去支持所有業(yè)務(wù),十分困難。
從組織角度來說,滴滴出行有多個(gè)事業(yè)部,業(yè)務(wù)涉及400多個(gè)城市,組織和個(gè)人的變化更快。
針對軟件復(fù)雜度的挑戰(zhàn),中臺(tái)的目標(biāo)是:在業(yè)務(wù)多元化發(fā)展的組織中,去構(gòu)建一套工程架構(gòu),構(gòu)建一套組織結(jié)構(gòu)及對應(yīng)的管理機(jī)制,以保證業(yè)務(wù)可持續(xù)的又快又好的發(fā)”。
攻破軟件復(fù)雜度問題的具體對策與實(shí)踐
在談具體對策與實(shí)踐之前,先來看看整個(gè)業(yè)務(wù)中臺(tái)的架構(gòu)設(shè)計(jì),如下圖。
整個(gè)的架構(gòu)設(shè)計(jì)分幾個(gè)邊界的上下文,好處在于把相關(guān)性不強(qiáng)的邏輯拆開,同時(shí)在一個(gè)相關(guān)性下面,通過分層可以去把業(yè)務(wù)進(jìn)行更好的建模。調(diào)度層做為入口去牽引多個(gè)業(yè)務(wù)線,業(yè)務(wù)流程層為調(diào)度層做服務(wù),狀態(tài)智能層用來支持上面兩層。
在對業(yè)務(wù)和產(chǎn)品進(jìn)行更好建模的基礎(chǔ)上,進(jìn)行“五化”:服務(wù)化、異步化、配置化、插件化、數(shù)據(jù)化。
服務(wù)化。服務(wù)化很常見,以下單為例,如下圖:
下單流程能夠調(diào)用很多服務(wù),在多個(gè)層次,以接口層次結(jié)果拆解。這里需要提醒的是服務(wù)化要注意如下三點(diǎn):
- 服務(wù)之間的協(xié)議和規(guī)范要建立好。
- 注意控制力度,力度太小、太大都會(huì)有問題。
- 隨著時(shí)間的發(fā)展,服務(wù)化本身要不斷的演進(jìn)。
異步化。對每個(gè)事件的非核心或不需要實(shí)時(shí)反饋給客戶端的邏輯進(jìn)行拆解,核心的主流程會(huì)變簡潔。對非核心的邏輯在事件上做訂閱之后,進(jìn)行二級處理。以結(jié)束訂單為例,如下圖
結(jié)束訂單的時(shí)候有很多邏輯要做,但是都是通過MysqlBinlog處理或MQ處理。
配置化。服務(wù)化和異步化能解決很多迭代效率的問題,但由于系統(tǒng)、業(yè)務(wù)的復(fù)雜性,各個(gè)業(yè)務(wù)都有些差異,體現(xiàn)在不同的產(chǎn)品線、城市、區(qū)域、時(shí)間等等,配置化核心是對這些進(jìn)行建模,把每個(gè)對象模型化,抽象成ID,在不同的服務(wù)化里把這些可配置的能力進(jìn)行抽象。具體抽象過程,如下圖。
***級抽象采用是類 iptables 的規(guī)則引擎判定產(chǎn)品分類,第二級的規(guī)則引擎,由模塊自定義。所有配置化都是用自生成平臺(tái),要配置什么,自定義配置即可,這個(gè)過程是動(dòng)態(tài)進(jìn)行的。當(dāng)前業(yè)務(wù)中臺(tái)已經(jīng)可以支持上千個(gè)配置點(diǎn),比如不同層次的計(jì)價(jià)規(guī)則不一樣、不同產(chǎn)品線的車樣子不同、不同的場景,如拼車和接送機(jī),管控規(guī)則也不一樣等等。
插件化。配置化解決的是業(yè)務(wù)線差異問題,但遇到邏輯差異較大的情況,就要做插件,統(tǒng)稱為FPI。
在FPI的能力上,不同的團(tuán)隊(duì)可以開發(fā)很多插件,在特定的配置點(diǎn)下,把它的邏輯去進(jìn)行加載。真正業(yè)務(wù)流程到這兒,可以調(diào)起它對應(yīng)的插件做出來。對于一些沒有差異化需求的業(yè)務(wù),可以用開發(fā)的default邏輯,這是更極端的靈活性的體現(xiàn)。
有靈活性的體現(xiàn)后,團(tuán)隊(duì)還可以做一些組織上的調(diào)整,原來看起來,每個(gè)服務(wù)或者平臺(tái)是一個(gè)垂直化的架構(gòu),有些團(tuán)隊(duì)是橫向,是FT,有些FT是接送機(jī)FT,專門做接送機(jī)的事情。
通過插件的形式在每個(gè)系統(tǒng)加載它的插件,它就可以跟著業(yè)務(wù)思考、跟著產(chǎn)品思考這個(gè)業(yè)務(wù)怎么走、這個(gè)產(chǎn)品怎么演化。相對的邏輯是更加專注的,這也帶來很好的組織結(jié)構(gòu)對中臺(tái)的適應(yīng)性。
數(shù)據(jù)化。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)是不得不考慮的問題,所以在業(yè)務(wù)中臺(tái),要實(shí)現(xiàn)全局打通,本質(zhì)是要把數(shù)據(jù)打通。所以制定了離線分析與在線決策的方案,如下圖。
***個(gè)是離線做分析,可以做數(shù)據(jù)血緣、模型訓(xùn)練,同時(shí)可以把它放到在線決策層面,構(gòu)建很好的智能客戶引擎和交易引擎,這個(gè)可以干預(yù),因?yàn)楦深A(yù)可以讓升艙或者多業(yè)務(wù)線的清單成為可能。因?yàn)橛羞@樣的決策,使在線服務(wù)的管控和判決做得更加智能。
數(shù)據(jù)化方面,需要注意三方面:
- 讓數(shù)據(jù)更加規(guī)范和標(biāo)準(zhǔn)化。
- 構(gòu)建完整的數(shù)據(jù)流,從在線到離線,從日志到模型的在線使用。
- 引入機(jī)器學(xué)習(xí)的算法、人工智能的算法去構(gòu)建在線數(shù)據(jù)智能的決策。
這是業(yè)務(wù)中臺(tái)的五個(gè)對策,主要解決傳統(tǒng)的系統(tǒng)架構(gòu)問題,怎么做到高耦合和內(nèi)聚,怎么提高迭代。配置化和插件化解決靈活性問題,把靈活性開放給不同團(tuán)隊(duì)。數(shù)據(jù)化實(shí)際上是中臺(tái)賦能業(yè)務(wù),有中臺(tái)的賦能才能變得更好。
經(jīng)驗(yàn)總結(jié)
***點(diǎn):從***的業(yè)務(wù)孵化中臺(tái)是滴滴出行構(gòu)建業(yè)務(wù)中臺(tái)***經(jīng)驗(yàn),因?yàn)?**的業(yè)務(wù)最復(fù)雜,把最復(fù)雜的業(yè)務(wù)搞定,用最復(fù)雜的業(yè)務(wù)落地別的業(yè)務(wù)會(huì)容易。從快車開始做,逐步整合專車、出租車、代駕等。
第二點(diǎn):穩(wěn)定,中臺(tái)對業(yè)務(wù)有收益,最根本的是保證穩(wěn)定,穩(wěn)定是發(fā)展的前提和基礎(chǔ)。在整個(gè)構(gòu)建中臺(tái)的過程中非常重視穩(wěn)定性,有各種機(jī)制,包括灰度發(fā)布、分層次發(fā)布、流量回放、全鏈路壓測等等,保證代碼的質(zhì)量和系統(tǒng)的穩(wěn)定。
第三點(diǎn):加強(qiáng)溝通,平衡多業(yè)務(wù)的優(yōu)先級。滴滴出行有多個(gè)業(yè)務(wù),有很多大區(qū)和城市,每個(gè)地方都有很多需求,要有一套機(jī)制和資源池,如何保證相應(yīng)每個(gè)業(yè)務(wù)都能按照所對應(yīng)的在公司的重要性的部分資源,要保障它的靈活性和效率,所以要有很多溝通工作,有很多平衡的工作。
第四點(diǎn):中臺(tái)系統(tǒng)要不斷演進(jìn),不能一層不變,要發(fā)現(xiàn)問題、解決問題。業(yè)務(wù)中臺(tái)不是一蹴而就,而是要在發(fā)展過程中不斷的變化,持續(xù)迭代。
第五點(diǎn): “沒有***,只有最合適”!所有中臺(tái)都一定是適合某個(gè)公司特點(diǎn),最合適的中臺(tái)是當(dāng)你深入了解業(yè)務(wù)、產(chǎn)品、系統(tǒng)、組織,而且不僅了解今天在哪里,還要了解過去是怎么演變而來,未來又會(huì)怎么演化。只有當(dāng)了解所有的東西之后,才能做出***的中臺(tái)架構(gòu)的設(shè)計(jì)。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請注明原文作者和出處為51CTO.com】
































