【愛(ài)分析專(zhuān)訪】蔣步星:超越Oracle必須顛覆原有技術(shù)體系,數(shù)據(jù)計(jì)算是第一步
在數(shù)據(jù)可視化的概念興起前,所謂數(shù)據(jù)的展現(xiàn)主要就是報(bào)表,當(dāng)時(shí)中國(guó)各行業(yè)均處于信息化起步階段,而中國(guó)報(bào)表非常復(fù)雜、統(tǒng)計(jì)困難,很多國(guó)際巨頭軟件廠商都無(wú)法解決。
此時(shí),有一家中國(guó)廠商橫空出世,以其***的非線性報(bào)表模型解決了中國(guó)報(bào)表問(wèn)題,實(shí)現(xiàn)對(duì)國(guó)外廠商的超越,這就是蔣步星和他的潤(rùn)乾。
蔣步星曾被稱(chēng)為“數(shù)學(xué)天才”,是中國(guó)***國(guó)際數(shù)學(xué)奧利匹克競(jìng)賽團(tuán)體冠軍成員。從清華畢業(yè)后,先后供職于清華紫光和長(zhǎng)天科技,于2001年創(chuàng)建潤(rùn)乾。最初靠行業(yè)軟件養(yǎng)活團(tuán)隊(duì),但蔣步星一直想做的是通用軟件,不想做集成商賣(mài)別人的產(chǎn)品。
2002年底,蔣步星將報(bào)表工具作為切入點(diǎn),研究了數(shù)千張報(bào)表,依靠深厚的數(shù)學(xué)功底,發(fā)現(xiàn)其中規(guī)律,一舉解決中國(guó)報(bào)表問(wèn)題,大大提升IT人員制作報(bào)表的效率。
蔣步星沒(méi)有因?yàn)閳?bào)表工具的成功而停止腳步,當(dāng)時(shí)有兩條路可以選擇,一條路是向前端發(fā)展,做BI、可視化工具,很多國(guó)內(nèi)廠商選擇這條路,另一條是向后端發(fā)展,解決數(shù)據(jù)計(jì)算問(wèn)題。
蔣步星認(rèn)為,向前端走又會(huì)回到定制化的老路,還是要堅(jiān)持做通用軟件的路線,因此選擇了更難的一條路,做數(shù)據(jù)計(jì)算。
過(guò)去,數(shù)據(jù)計(jì)算主要依賴(lài)Oracle等數(shù)據(jù)庫(kù)產(chǎn)品實(shí)現(xiàn),Hadoop的崛起,試圖去解決大規(guī)模數(shù)據(jù)計(jì)算問(wèn)題,而中小規(guī)模的數(shù)據(jù)計(jì)算問(wèn)題并沒(méi)有得到太多的關(guān)注,還是需要昂貴的數(shù)據(jù)庫(kù)產(chǎn)品來(lái)解決。
蔣步星將這個(gè)方向作為切入點(diǎn),一方面這個(gè)問(wèn)題是客戶剛需,能夠節(jié)省大量成本,另一方面也可以與報(bào)表產(chǎn)品結(jié)合起來(lái),將底層數(shù)據(jù)處理問(wèn)題解決好,有助于提升數(shù)據(jù)展現(xiàn)效果。
經(jīng)過(guò)幾年潛心研發(fā),潤(rùn)乾在2015年發(fā)布數(shù)據(jù)計(jì)算產(chǎn)品——集算器,解決了數(shù)據(jù)計(jì)算在描述和實(shí)施上的效率問(wèn)題。
對(duì)蔣步星而言,集算器只是一個(gè)開(kāi)始,幫助潤(rùn)乾從報(bào)表市場(chǎng)切入到數(shù)據(jù)計(jì)算這個(gè)更大的市場(chǎng),替換Oracle等成為企業(yè)的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)庫(kù),才是***目標(biāo)。
近期愛(ài)分析對(duì)蔣步星進(jìn)行專(zhuān)訪,他分享了自己對(duì)報(bào)表軟件行業(yè)、數(shù)據(jù)計(jì)算行業(yè)的看法,現(xiàn)將精彩內(nèi)容分享。
堅(jiān)持做軟件廠商,不做定制開(kāi)發(fā)
愛(ài)分析:潤(rùn)乾從2001年創(chuàng)立,到現(xiàn)在也是經(jīng)歷了十幾年發(fā)展,都經(jīng)歷了哪些階段?
蔣步星: 2001年初我從長(zhǎng)天出來(lái),2001年-2003年底,這是一個(gè)階段,這個(gè)階段其實(shí)我們?cè)谧鲂袠I(yè)軟件,主要是幫助其他高校做信息系統(tǒng)。
我一直想做通用軟件,這是在長(zhǎng)天、紫光受了刺激,我覺(jué)得我們費(fèi)老勁當(dāng)集成商,***都在賣(mài)Oracle的數(shù)據(jù)庫(kù),打來(lái)打去***都是人家廠商掙錢(qián),我們不停地在出差。所以我們一定要把自己做到廠商的位置去,但找不到方向。
到2002年底,我們感覺(jué)到做報(bào)表工具是一個(gè)挺好的方向,國(guó)外勢(shì)力沒(méi)那么強(qiáng),而且用戶有需求。所以,我們從2002年底開(kāi)始做, 2004年初推出報(bào)表3版本。到2005年,這個(gè)業(yè)務(wù)就已經(jīng)盈虧平衡。
然后我立刻把教務(wù)系統(tǒng)那部分業(yè)務(wù)賣(mài)掉了。我的邏輯鏈在于,一定要做廠商,一定要拿光盤(pán)換支票,不要做定制開(kāi)發(fā),不要到用戶那里做項(xiàng)目,產(chǎn)品永遠(yuǎn)都是標(biāo)準(zhǔn)化的,這樣才能零成本復(fù)制。
2005年至2010年應(yīng)該是報(bào)表業(yè)務(wù)發(fā)展比較好的階段,差不多翻了10倍。2011年至2015年,我們內(nèi)部管理層有業(yè)務(wù)分歧,這使得公司資源消耗比較嚴(yán)重,業(yè)務(wù)基本沒(méi)有增長(zhǎng),而且明顯感到競(jìng)爭(zhēng)對(duì)手發(fā)展起來(lái)了。
2015年底,我們內(nèi)部做了調(diào)整,原來(lái)分歧的聲音消除掉了。2016年相當(dāng)于重建了經(jīng)營(yíng)隊(duì)伍,會(huì)是一個(gè)新階段。
現(xiàn)在,我們把經(jīng)營(yíng)重點(diǎn)主要放在數(shù)據(jù)計(jì)算上了,我們2月份剛做了報(bào)表工具的降價(jià),我降了30倍。公司內(nèi)外要營(yíng)造一個(gè)氣氛,潤(rùn)乾現(xiàn)在要開(kāi)拓新業(yè)務(wù),報(bào)表這個(gè)標(biāo)簽就會(huì)產(chǎn)生障礙,我們現(xiàn)在想做數(shù)據(jù)計(jì)算業(yè)務(wù)。
愛(ài)分析:為什么潤(rùn)乾做報(bào)表這項(xiàng)業(yè)務(wù)時(shí),沒(méi)碰到什么競(jìng)爭(zhēng)對(duì)手?
蔣步星:國(guó)外廠商是不會(huì)做報(bào)表的,幾方面原因:***,中國(guó)市場(chǎng)相對(duì)全球市場(chǎng)太小,國(guó)外廠商不會(huì)專(zhuān)門(mén)為中國(guó)企業(yè)開(kāi)發(fā)相關(guān)產(chǎn)品的,只會(huì)把國(guó)外現(xiàn)成產(chǎn)品拿過(guò)來(lái)用;第二,中國(guó)人的報(bào)表需求非常復(fù)雜。
這個(gè)事情之所以被解決,這是我們擅長(zhǎng)的,也是潤(rùn)乾這公司的基因。我們自己發(fā)明了一套理論體系,研究了幾千張報(bào)表找規(guī)律。
愛(ài)分析:整個(gè)團(tuán)隊(duì)現(xiàn)在有多少人?人員結(jié)構(gòu)是什么樣的?
蔣步星:我們現(xiàn)在有70多人,人員還在擴(kuò)。去年主要是磨合新的經(jīng)營(yíng)團(tuán)隊(duì),磨合差不多了,今年就會(huì)擴(kuò)張團(tuán)隊(duì)。我們應(yīng)該主要是兩部分,研發(fā)和銷(xiāo)售。我們研發(fā)有25人,銷(xiāo)售會(huì)多一些。
愛(ài)分析:下一步如果擴(kuò)團(tuán)隊(duì)的話,會(huì)主要增加哪部分人員?
蔣步星:研發(fā)人員今年可能不會(huì)增加了,售前人員會(huì)增加多一些,因?yàn)槲覀儸F(xiàn)在這個(gè)新產(chǎn)品,需要有足夠技術(shù)背景才能給客戶講清楚。
愛(ài)分析:所以這個(gè)產(chǎn)品在研發(fā)投入上不需要太多人?
蔣步星:坦白地說(shuō),我認(rèn)為做這些事情都不需要很多人。我們現(xiàn)在20多人研發(fā)團(tuán)隊(duì),下半年就可以發(fā)布數(shù)據(jù)庫(kù)產(chǎn)品,另外我們還做了數(shù)據(jù)挖掘產(chǎn)品。主要是我們不需要太多交付人員,交付工作都交給集成商伙伴來(lái)做,這是我們的原則。
報(bào)表工具面向IT人員,更貼近客戶業(yè)務(wù)
愛(ài)分析:相比BI產(chǎn)品,報(bào)表產(chǎn)品會(huì)與客戶的業(yè)務(wù)更加貼近?
蔣步星:有各方面原因,一個(gè)是客戶沒(méi)有那么強(qiáng)烈的分析需求,他也不知道具體分析什么,另一個(gè)是數(shù)據(jù)相對(duì)混亂,不是那么整齊,要做多維分析,數(shù)據(jù)質(zhì)量還是要求很高。還有就是做多維分析要事先建模,但是客戶的業(yè)務(wù)還很不穩(wěn)定時(shí),就沒(méi)辦法事先建模。
但報(bào)表這個(gè)產(chǎn)品,客戶總需要看他。而且中國(guó)人的報(bào)表設(shè)計(jì)得很豐富,一張報(bào)表能反映很多信息。所以,業(yè)務(wù)人員還是樂(lè)意看這個(gè),使用比較簡(jiǎn)單,輸入?yún)?shù)后我想看到的信息都在報(bào)表上有體現(xiàn)。
我見(jiàn)過(guò)很多上BI平臺(tái)的,有可視化、用戶自助出報(bào)表,但其實(shí)用得***,久經(jīng)考驗(yàn)的還是那些固定報(bào)表。·
愛(ài)分析:國(guó)內(nèi)外企業(yè)在使用報(bào)表產(chǎn)品方面有哪些區(qū)別?
蔣步星:國(guó)內(nèi)大部分用戶可以支付得起定制化的成本,花50萬(wàn)就會(huì)有人來(lái)做項(xiàng)目開(kāi)發(fā)了,可以做出非常適合用戶需求的系統(tǒng)。這種場(chǎng)景下,國(guó)外BI廠商的產(chǎn)品就比不上這些定制開(kāi)發(fā)的。
因此,國(guó)內(nèi)用戶更加需要可集成的工具,比如我們做報(bào)表工具,其實(shí)是中間件,并非直接面向終端用戶,需要開(kāi)發(fā)人員二次開(kāi)發(fā)將我們集成進(jìn)去,這時(shí)候集成商就愿意用我們這種產(chǎn)品。
在國(guó)外,由于人工太貴,用戶一般支付不起這種定制開(kāi)發(fā)的費(fèi)用,只能購(gòu)買(mǎi)這種接近成品的軟件,從這個(gè)角度來(lái)看,國(guó)外BI產(chǎn)品就有它合理之處了。
愛(ài)分析:其實(shí),報(bào)表這個(gè)產(chǎn)品一般來(lái)說(shuō)不會(huì)直接面向終端用戶?
蔣步星:是的,終端用戶看報(bào)表,但做報(bào)表的是集成商的程序員,我們其實(shí)是協(xié)助開(kāi)發(fā)商,讓他更快地做報(bào)表。原先程序員寫(xiě)代碼做報(bào)表可能需要一兩周,使用我們的產(chǎn)品可能只需要一天時(shí)間,極大提高效率,而且降低對(duì)程序員的要求。
愛(ài)分析:所以,從收費(fèi)來(lái)說(shuō),我們是跟終端用戶收費(fèi)還是集成商?
蔣步星:我們主要收入還是來(lái)自終端,我們與集成商配合,將產(chǎn)品做到解決方案中。其實(shí),像數(shù)據(jù)庫(kù)這些產(chǎn)品也類(lèi)似,終端用戶可能根本不會(huì)安裝Oracle,但他卻在買(mǎi)單,因?yàn)檫@是整個(gè)解決方案體系中的一個(gè)環(huán)節(jié)。
愛(ài)分析:現(xiàn)在來(lái)看,報(bào)表這塊兒的市場(chǎng)空間應(yīng)該不大,幾個(gè)廠商加起來(lái)也就是幾億規(guī)模?
蔣步星:這個(gè)市場(chǎng)規(guī)模不大有很多原因,***,相比之前,做報(bào)表的廠商更多了,競(jìng)爭(zhēng)更加激烈;第二,移動(dòng)端快速發(fā)展,使得客戶對(duì)報(bào)表的復(fù)雜性要求在弱化。這些是我們必須轉(zhuǎn)型的原因。倒不是說(shuō),市場(chǎng)需求消失了,但市場(chǎng)的增長(zhǎng)在放緩,甚至出現(xiàn)停止增長(zhǎng)。
另外,報(bào)表可以算是可視化的一種基本技術(shù),現(xiàn)在出現(xiàn)了大量開(kāi)源的可視化技術(shù),這就使得從營(yíng)收角度來(lái)看,市場(chǎng)規(guī)模在變小,用戶發(fā)現(xiàn)使用開(kāi)源技術(shù)也能實(shí)現(xiàn)類(lèi)似需求,就不愿意再花錢(qián)購(gòu)買(mǎi)報(bào)表產(chǎn)品了。
做數(shù)據(jù)庫(kù)從數(shù)據(jù)計(jì)算開(kāi)始,替代Oracle計(jì)算能力
愛(ài)分析:數(shù)據(jù)庫(kù)市場(chǎng)是不是仍然以O(shè)racle為主導(dǎo)?
蔣步星:銷(xiāo)售額是這樣的,去“IOE”中, EMC是最容易被去掉,IBM的小型機(jī)除了大型銀行的交易系統(tǒng)外,都可以被替代掉,就是數(shù)據(jù)庫(kù)很難去掉。
Oracle的確做得很好,各個(gè)數(shù)據(jù)庫(kù)的SQL語(yǔ)法不太一樣,那些不同的地方雖然不多,但是很關(guān)鍵。因?yàn)榇罅砍绦蚴菙?shù)據(jù)處理是用數(shù)據(jù)庫(kù)的存儲(chǔ)過(guò)程來(lái)寫(xiě)的,想復(fù)制出完全一樣的幾乎不可能,還不如徹底替換掉,但Oracle的優(yōu)化的確做得很好,不光是國(guó)產(chǎn)數(shù)據(jù)庫(kù),放眼全球也很難比肩的。
愛(ài)分析:用新型Hadoop架構(gòu)開(kāi)發(fā)的數(shù)據(jù)庫(kù)有望超越Oracle么?
蔣步星:其實(shí)我們就是要做數(shù)據(jù)庫(kù),做新型數(shù)據(jù)倉(cāng)庫(kù),我們會(huì)先從做計(jì)算開(kāi)始,做集算器。
我個(gè)人認(rèn)為國(guó)產(chǎn)數(shù)據(jù)庫(kù)沒(méi)什么機(jī)會(huì)超越,國(guó)產(chǎn)數(shù)據(jù)庫(kù)廠商的確有不少優(yōu)秀人才,但Oracle同樣很優(yōu)秀,而且資金雄厚。除非Oracle犯錯(cuò)誤,要不然沒(méi)有機(jī)會(huì)。
但是,就算Oracle犯錯(cuò)誤,頂上來(lái)的也未必國(guó)產(chǎn)數(shù)據(jù)庫(kù),因?yàn)閲?guó)外還有很多巨頭公司,不可能輪到排名10以外的廠商。因此,想超越Oracle必須要顛覆他,跟隨技術(shù)永遠(yuǎn)沒(méi)希望。
想超越Oracle不能再用那個(gè)技術(shù)體系,那個(gè)體系被Oracle做了40多年,怎么可能有機(jī)會(huì)。
Hadoop這邊有一定可能性,但現(xiàn)在說(shuō)還為時(shí)過(guò)早。數(shù)據(jù)庫(kù)功能大體分為兩部分:OLTP,這部分目前還只有關(guān)系數(shù)據(jù)庫(kù)能搞定;另一部分是OLAP,做計(jì)算分析的,這部分Hadoop有一些優(yōu)勢(shì)的。
Hadoop優(yōu)勢(shì)是建立在比較便宜的PC集群上,不像Oracle需要高端機(jī),Hadoop這個(gè)體系相對(duì)要廉價(jià)一些,而且橫擴(kuò)能力強(qiáng),很多用戶都將Hadoop作為未來(lái)方向。
Hadoop如果用來(lái)做AI等迭代式計(jì)算是有優(yōu)勢(shì)的。做數(shù)據(jù)倉(cāng)庫(kù)其實(shí)和傳統(tǒng)數(shù)據(jù)庫(kù)沒(méi)差別,MPP并不了太多機(jī)器,Hadoop做SQL也同樣如此,。
另外,Hadoop設(shè)計(jì)規(guī)模是面向超大集群,而非中小集群規(guī)模,但傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的用戶沒(méi)有那么多數(shù)據(jù),用Hadoop有點(diǎn)殺雞用牛刀。所以,我們也沒(méi)用Hadoop體系,選擇自己做。
愛(ài)分析:那我們做集算器是如何構(gòu)建的?
蔣步星:我們開(kāi)始做報(bào)表,數(shù)據(jù)展現(xiàn)的確很頭疼,我們用非線性報(bào)表模型解決了展現(xiàn)問(wèn)題。但發(fā)現(xiàn)做報(bào)表還是很頭疼,數(shù)據(jù)準(zhǔn)備比展現(xiàn)還麻煩,原始數(shù)據(jù)與報(bào)表數(shù)據(jù)相差很遠(yuǎn),要寫(xiě)很復(fù)雜的運(yùn)算。當(dāng)時(shí)業(yè)界沒(méi)有什么好辦法,大家都是要寫(xiě)程序。
所以,我們打算做產(chǎn)品解決這個(gè)問(wèn)題,數(shù)據(jù)準(zhǔn)備就是數(shù)據(jù)計(jì)算,因此,我們做了一個(gè)數(shù)據(jù)計(jì)算引擎,自己設(shè)計(jì)一套程序語(yǔ)言,能讓寫(xiě)這種計(jì)算比SQL、JAVA更容易一些,開(kāi)始作為報(bào)表工具的輔助模塊。
后來(lái)我們發(fā)現(xiàn),計(jì)算本身就是更大市場(chǎng),比數(shù)據(jù)展現(xiàn)應(yīng)用面廣很多。所以,我們從技術(shù)把計(jì)算引擎獨(dú)立出來(lái),在這個(gè)基礎(chǔ)上我們還可以發(fā)展數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)這些業(yè)務(wù)。
集算器這個(gè)產(chǎn)品就是想替代數(shù)據(jù)庫(kù)的計(jì)算能力,提供不依賴(lài)數(shù)據(jù)庫(kù)的計(jì)算能力。當(dāng)然,這需要一段時(shí)間,目前我說(shuō)服用戶徹底不用數(shù)據(jù)庫(kù)是有難度,所以集算器這個(gè)產(chǎn)品作為計(jì)算引擎出現(xiàn),是不太涉及存儲(chǔ)的,因此原始數(shù)據(jù)還可以放在原先的數(shù)據(jù)庫(kù),集算器只是解決計(jì)算,原先客戶除了數(shù)據(jù)庫(kù)沒(méi)有什么特別好的計(jì)算工具,現(xiàn)在多了一個(gè)選擇,不一定非得用數(shù)據(jù)庫(kù)。
愛(ài)分析:所以集算器與報(bào)表服務(wù)客群是類(lèi)似的?
蔣步星:其實(shí)是一樣的,跟報(bào)表也比較容易集成,因?yàn)楹芏鄷r(shí)候計(jì)算就是為展現(xiàn)而服務(wù)的,而且我們現(xiàn)在都不忌諱集算器可以給競(jìng)爭(zhēng)對(duì)手的報(bào)表產(chǎn)品提供數(shù)據(jù)。
























