從OtterTune的倒下說起
昨天看到天舟發(fā)了一篇文章,提到OtterTune死了。我馬上到OtterTune官網(wǎng)上去看,發(fā)現(xiàn)確實(shí)如此。
這個(gè)在2022年才獲得1200萬美金A輪融資的企業(yè)居然就這么倒下了,確實(shí)讓我感到有些意外。這個(gè)不缺技術(shù),不缺錢的優(yōu)秀團(tuán)隊(duì),做的又是十分有前途的數(shù)據(jù)庫優(yōu)化,商業(yè)模式又是互聯(lián)網(wǎng)化的SAAS服務(wù),為什么會在拿到一筆巨額投資后不到兩年就關(guān)門歇業(yè)了呢?
DJ OT因違反假釋規(guī)定而入獄這句話不知道是否暗示了某種原因,不過我不大看得懂這種美國人的幽默。DJ OT是他們的吉祥物,畫面里是被關(guān)進(jìn)了囚牢,而并不是死去了。這畫面是不是暗示了某種不甘和無奈呢?
圖片
上面是他們的核心團(tuán)隊(duì),中間C位的是卡內(nèi)基美隆的教授Andy,右邊的 應(yīng)該是一個(gè)華裔。我是在搜索MySQL優(yōu)化資料的時(shí)候發(fā)現(xiàn)他們的,因?yàn)樗麄兯龅墓ぷ骱臀覀冇行╊愃疲宜麄兊闹鳡I業(yè)務(wù)與我腦子里未來想干的事情十分類似。
圖片
從上面的圖上可以看出,OtterTUNE的商業(yè)模式還是相當(dāng)牛的,通過下載一個(gè)DOCKER鏡像或者在GitHub上下載開源的客戶端完成部署,從數(shù)據(jù)庫中采集數(shù)據(jù),通過AGENT上傳到AWS的服務(wù)端,通過機(jī)器學(xué)習(xí)訓(xùn)練模型,并存儲到中央資料庫。然后通過計(jì)算引擎分析配置建議,并進(jìn)行自動化巡檢,找到優(yōu)化建議,推送給用戶。
上面的模式幾乎和我前些年對D-SMART SAAS服務(wù)的設(shè)計(jì)如出一轍。唯一不同的是,我們的自動化能力是基于運(yùn)維知識圖譜+專家模型,在一些AI算法的輔助下完成分析,當(dāng)問題無法明確定位時(shí),還有專家的人工介入。而且我們的內(nèi)容不僅限于優(yōu)化推薦,在客戶端已經(jīng)提供了日常監(jiān)控、告警和一些簡單的分析工具。只有遇到復(fù)雜的問題的時(shí)候才需要通過收費(fèi)的云服務(wù)或者遠(yuǎn)程專家服務(wù)來獲取解決方案。
圖片
OtterTune也為數(shù)據(jù)庫建立了健康評分,只不過他們評判健康的維度與我們的健康模型相比簡單了一些。數(shù)據(jù)庫總體、資源、表、索引、查詢這幾個(gè)維度比較簡明,針對中小型數(shù)據(jù)庫系統(tǒng)來說,應(yīng)該還是比較有效的。
不管怎樣,OtterTune的倒下為數(shù)據(jù)庫服務(wù)提供了一個(gè)可參考的反面教材,無論是做SAAS服務(wù)、AIOPS還是傳統(tǒng)的DBA,都可以從這個(gè)失敗的案例中得到啟示。
圖片
在Reddit上我看到了一個(gè)討論帖子,其觀點(diǎn)是“這是一個(gè)一次性工具,你無法在上面構(gòu)建付費(fèi)的服務(wù)”。當(dāng)一個(gè)數(shù)據(jù)庫在進(jìn)行初始化的優(yōu)化后,你只需要管理好其容量,那么這個(gè)數(shù)據(jù)庫將會穩(wěn)定地運(yùn)行10年。如果出現(xiàn)問題,大部分可以通過應(yīng)用側(cè)的修改和優(yōu)化來解決,就不再需要使用OtterTune的服務(wù)了。而且對于MySQL、PG這樣的數(shù)據(jù)庫,在一個(gè)數(shù)據(jù)庫上活動的配置優(yōu)化經(jīng)驗(yàn),大部分可以不做太多調(diào)整就可以用于其他數(shù)據(jù)庫 實(shí)例。因此OtterTune能夠提供的服務(wù)真的就成為一次性服務(wù)了。如此看來,他們作為SAAS服務(wù)的業(yè)務(wù)模式本身就是不成立的。
圖片
分析OtterTune的功能,最核心的能力是通過AI算法,依托各種歷史模板為用戶提供數(shù)據(jù)庫參數(shù)的最佳配置方案。這些確實(shí)都是一次性的功能,一旦調(diào)整到位后,無需經(jīng)常調(diào)整了。
圖片
除此之外,表和索引推薦、SQL審計(jì)規(guī)則是OtterTune的另外一個(gè)技術(shù)亮點(diǎn)。不過用戶對此的付費(fèi)意愿也并不強(qiáng)烈,這些技能在開發(fā)人員側(cè)也很容易構(gòu)建,并非剛需。
前幾天正好有一個(gè)原來的Oracle DBA來電向我咨詢?nèi)绻男腥プ鯬G的數(shù)據(jù)庫服務(wù)有沒有前途。我說如果是年輕人,轉(zhuǎn)行去干PG可能還行,對于一個(gè)40多歲,在Oracle領(lǐng)域干了20多年的DBA來說,似乎比較難找到與現(xiàn)在價(jià)值相匹配的工作。PG的用戶所需要的服務(wù),以及能夠支付的費(fèi)用無法與Oracle服務(wù)相比,今后運(yùn)維PG數(shù)據(jù)庫的方式也與運(yùn)維Oracle完全不同。你現(xiàn)在去轉(zhuǎn)行干PG,可能還干不過那些20多歲的小年輕,你的盈利模式在什么地方呢?
回過頭來反思我們目前正在做的智能化運(yùn)維產(chǎn)品D-SMART,實(shí)際上我們在一些MySQL、PG類數(shù)據(jù)庫為主的客戶側(cè)的使用情況也有與OtterTune類似的地方,在系統(tǒng)剛剛部署的時(shí)候,往往能幫助用戶發(fā)現(xiàn)很多問題。在建議的調(diào)整下,很快這些問題就都解決了。之后這套系統(tǒng)最主要的作用就是監(jiān)控和巡檢了。系統(tǒng)中的一些屠龍絕技往往因?yàn)檎也坏烬垇硗蓝兊脹]有那么大的價(jià)值了。
昨天下午我也就這個(gè)問題和我們團(tuán)隊(duì)的同學(xué)們在討論,我們?nèi)绾尾挪粫呱螼tterTune的死路。那就是真正從數(shù)據(jù)庫運(yùn)維的痛點(diǎn)入手,而不要總是看不起那些能夠解決技術(shù)含量不高,但是實(shí)用性很高的功能。
圖片
最近我們正在V2.7中開發(fā)兩個(gè)日常運(yùn)維常用的工具,其中一個(gè)是殺會話的工具。當(dāng)某個(gè)數(shù)據(jù)庫出現(xiàn)一些性能等方面的問題的時(shí)候,殺會話可能是一個(gè)常用的運(yùn)維動作。不過有些時(shí)候當(dāng)你需要?dú)挼臅r(shí)候突然發(fā)現(xiàn)數(shù)據(jù)庫已經(jīng)無法登錄了,你無法有效地殺掉所需要?dú)⒌臅挘@時(shí)候D-SMART就可以幫助你輕松地幫你分析系統(tǒng)中會話的情況,找到所需要?dú)⒌臅挘⒘⒓礋o風(fēng)險(xiǎn)地殺掉。
圖片
另外一個(gè)是批量運(yùn)維工具,當(dāng)你需要在上百個(gè)類似的數(shù)據(jù)庫中做一個(gè)相同的查詢或者運(yùn)維操作的時(shí)候,批量運(yùn)維工具就十分有用了。開發(fā)運(yùn)維工具不能僅有技術(shù)含量的屠龍刀,每天離不開的切菜刀才是最重要的工具。
OtterTune的成功崛起當(dāng)年給了我們帶來了相當(dāng)大的鼓舞,原來在這個(gè)領(lǐng)域不僅僅是我們一批人在干,在大洋彼岸也有一批和我們有類似想法的人在干類似的事情。OtterTune的倒下也給了我們警示,僅僅在技術(shù)上有一套是不行的,技術(shù)與市場必須找到契合點(diǎn),在市場的推動下,產(chǎn)品和服務(wù)才能做好。






















