大數(shù)據(jù)預(yù)測(cè),是玄學(xué)還是科學(xué)?
如今,我們每個(gè)人都在談?wù)?ldquo;數(shù)據(jù)科學(xué)”,哈佛商業(yè)評(píng)論雜志甚至將數(shù)據(jù)科學(xué)家定義為“21世紀(jì)最性感的職業(yè)”。在這個(gè)大數(shù)據(jù)時(shí)代,究竟什么是數(shù)據(jù)科學(xué)?數(shù)據(jù)科學(xué)家又究竟是怎樣的一群人?他們?cè)趧?chuàng)造著什么令人著迷的東西?DT君將在2018年走訪50位來(lái)自各行各業(yè)的頂尖數(shù)據(jù)科學(xué)家,希望能讓你們了解這些神奇的人和他們神秘事兒,為你們一窺數(shù)據(jù)科學(xué)的未來(lái)與未知。畢業(yè)于北大數(shù)學(xué)院概率統(tǒng)計(jì)專業(yè),在中科院軟件所完成數(shù)據(jù)挖掘方向的計(jì)算機(jī)博士學(xué)位,沈志勇這位一路“根正苗紅”、踩著大數(shù)據(jù)科班道路走出來(lái)的數(shù)據(jù)科學(xué)家說(shuō),如今他更愿做一個(gè)大數(shù)據(jù)技術(shù)的“搬運(yùn)工”——讓大數(shù)據(jù)在各行各業(yè),“燃”燒起來(lái)。
根正苗紅的“數(shù)據(jù)科學(xué)家”
在沈志勇的印象中,記憶最深的莫過(guò)于他經(jīng)歷過(guò)的兩次高考。第一次是在1999年,當(dāng)時(shí)他考入了北京大學(xué)數(shù)學(xué)學(xué)院。第二次,則是在四年前的那個(gè)夏天。
2014年的6月與往常一樣,全國(guó)幾百萬(wàn)考生正在為幾天后 “人生最重要”的一場(chǎng)考試做著最后的準(zhǔn)備;老師和家長(zhǎng)們,則一遍又一遍地為他們查閱著各種“押題”指南,期待有巧合或者奇跡押中真題。
沈志勇坐在辦公室里,也在緊鑼密鼓地準(zhǔn)備著什么。不久,他指導(dǎo)的一個(gè)“大數(shù)據(jù)預(yù)測(cè)高考作文題”的項(xiàng)目面世。這是第一次有人用大數(shù)據(jù)預(yù)測(cè)高考作文題目。

(圖片說(shuō)明:百度預(yù)測(cè)2014年高考作文題目)
幾天后,結(jié)果出來(lái)了。在全國(guó)18卷的語(yǔ)文考試中,他們的預(yù)測(cè)命中了其中12卷的作文命題方向。一時(shí)間,網(wǎng)友開始紛紛感嘆:大數(shù)據(jù)連高考都能預(yù)測(cè),簡(jiǎn)直 “神”了!
“那次頗具普及性質(zhì)的活動(dòng)讓更多人看到了大數(shù)據(jù)的價(jià)值、希望能了解大數(shù)據(jù)。”項(xiàng)目背后的沈志勇現(xiàn)在回憶起那次活動(dòng),覺得它的傳播意義更加鮮明。雖然對(duì)普通人來(lái)說(shuō),這種預(yù)測(cè)很新鮮;但對(duì)沈志勇來(lái)說(shuō),大數(shù)據(jù)已經(jīng)是十多年的“老朋友”了。
本科畢業(yè)于北京大學(xué)數(shù)學(xué)學(xué)院概率統(tǒng)計(jì)系、在中科院軟件所獲取博士學(xué)位、曾在惠普從事數(shù)據(jù)挖掘研究,現(xiàn)任百度云首席數(shù)據(jù)科學(xué)家……從簡(jiǎn)歷上看,沈志勇是一位“根正苗紅”、科班出身的數(shù)據(jù)科學(xué)家。從大二接觸概率統(tǒng)計(jì)開始,沈已經(jīng)在數(shù)據(jù)分析處理這條路上走了近二十年。在他看來(lái),“數(shù)據(jù)科學(xué)家”的概念無(wú)需咬文嚼字糾結(jié)科學(xué)二字,它們本質(zhì)上就是集合工程能力、業(yè)務(wù)能力和理論知識(shí)的數(shù)據(jù)型人才。

(圖片說(shuō)明:2010年,數(shù)據(jù)科學(xué)家Drew Conway發(fā)表了他認(rèn)為的“數(shù)據(jù)科學(xué)技能韋恩圖”,認(rèn)為集合了黑客能力Hacking Skill、業(yè)務(wù)能力 Substantive Expertise和數(shù)理知識(shí)的Math & Statistics Knowledge的人才才是數(shù)據(jù)科學(xué)家。沈認(rèn)為,在實(shí)際操作中,黑客能力更多的是工程能力;數(shù)理知識(shí)意味著知其然而知其所以然的理論能力。)
在大數(shù)據(jù)剛出現(xiàn)的時(shí)候,大家無(wú)法看清這個(gè)龐大復(fù)雜的新興事物。就像美國(guó)心理學(xué)和行為經(jīng)濟(jì)學(xué)教授Dan Ariely當(dāng)年描述的一樣,大數(shù)據(jù)就像青少年的性行為:每個(gè)人都在談?wù)撍菦]有人真正知道那是什么,所以每個(gè)人都聲稱自己正在做這件事兒。

(圖片說(shuō)明:Dan Ariely教授2013年在臉書上諷刺社會(huì)對(duì)大數(shù)據(jù)的狂熱追捧現(xiàn)象。)
沈志勇則認(rèn)為,其實(shí)這件事兒遠(yuǎn)沒有大家想的那么玄。“都說(shuō)把數(shù)據(jù)比作工業(yè)的新石油,從事大數(shù)據(jù)其實(shí)就相當(dāng)于在從事石油開采與冶煉行業(yè)。你要經(jīng)歷探礦(尋找并評(píng)估什么數(shù)據(jù)源有價(jià)值)——采油(數(shù)據(jù)的ETL、預(yù)處理)——冶煉(數(shù)據(jù)建模與分析)——加工(數(shù)據(jù)產(chǎn)品化、可視化)這一系列過(guò)程,最后把數(shù)據(jù)產(chǎn)品和服務(wù)交到用戶手里,燃燒,產(chǎn)生能量,驅(qū)動(dòng)業(yè)務(wù)。”
“但是油田在哪里呢?最后我發(fā)現(xiàn),豐富的原生數(shù)據(jù)油田,主要在業(yè)界。”沈志勇說(shuō)道。也正是意識(shí)到了這一點(diǎn),博士畢業(yè)后他并沒有選擇留在學(xué)校科研院所,而是出走業(yè)界,做真正的“大數(shù)據(jù)”。
大數(shù)據(jù)預(yù)測(cè),是玄學(xué)還是科學(xué)?
在與大數(shù)據(jù)的相關(guān)話題中,人們普遍最感興趣的就是“預(yù)測(cè)”。我們大多相信,未來(lái)是難以把握的,但是一旦這種不確定性被大數(shù)據(jù)“確定”了下來(lái),我們豈不是就能“人定勝天”了?
抱著對(duì)這種美好未來(lái)的期盼,大數(shù)據(jù)火了之后,也有越來(lái)越多的人們開始用它進(jìn)行各種預(yù)測(cè):大數(shù)據(jù)相親、大數(shù)據(jù)求職、大數(shù)據(jù)買房等等,結(jié)果有好有壞,人人參差不齊。不久,相反的聲音也開始出現(xiàn):大數(shù)據(jù)預(yù)測(cè)就和算命沒什么兩樣,說(shuō)到底還是一個(gè)運(yùn)氣罷了。
“算命,其實(shí)是挺大數(shù)據(jù)的一件事兒”,沈志勇打趣說(shuō),“算命也是觀察對(duì)象、尋找規(guī)律,不過(guò)大數(shù)據(jù)的邏輯要更復(fù)雜一些。”沈認(rèn)為,毫無(wú)疑問(wèn),大數(shù)據(jù)預(yù)測(cè)完完全全是科學(xué)的范疇。
其實(shí),我們一直都在進(jìn)行各種預(yù)測(cè):預(yù)測(cè)天氣、預(yù)測(cè)股票等等,大數(shù)據(jù)預(yù)測(cè)與這些并沒有什么本質(zhì)不同。海量的數(shù)據(jù)資源讓很多之前看似“無(wú)法被預(yù)測(cè)”的事情,也能夠被預(yù)測(cè)出來(lái),這就是大數(shù)據(jù)的力量。
沈志勇接著為DT君講了一個(gè)2014年世界杯的預(yù)測(cè)案例。“足球是圓的”,體育比賽一直以來(lái)都以其“不可預(yù)測(cè)性”而著稱。即使是最優(yōu)秀的運(yùn)動(dòng)員,在瞬息萬(wàn)變的賽場(chǎng)上也很難說(shuō)就一定會(huì)贏。“黑馬”的頻頻出現(xiàn)是我們對(duì)體育賽事最津津樂(lè)道的話題之一。但在2014年世界杯比賽中,沈志勇和他的團(tuán)隊(duì)就試圖用大數(shù)據(jù)來(lái)“預(yù)測(cè)”比賽結(jié)果。
包括高盛、微軟、Google在內(nèi)的眾多公司當(dāng)時(shí)都對(duì)比賽進(jìn)行了基于大數(shù)據(jù)分析的預(yù)測(cè),最終結(jié)果是:沈志勇他們團(tuán)隊(duì)的預(yù)測(cè)是最準(zhǔn)確的。他們從淘汰賽開始,100%預(yù)測(cè)對(duì)了每一場(chǎng)比賽的結(jié)果。

(圖片說(shuō)明:2014年世界杯百度預(yù)測(cè)圖片。)
“在這個(gè)預(yù)測(cè)中,我們使用了幾百家家博彩公司的數(shù)據(jù),這個(gè)數(shù)據(jù)源非常重要。”沈志勇笑說(shuō),在他們的預(yù)測(cè)模型中,負(fù)責(zé)模型設(shè)計(jì)的小伙伴考慮了球隊(duì)攻擊力,球隊(duì)防守能力,比賽本身存在的偏置等因素,以此專門開發(fā)了一套 “攻防因子模型”算法刻畫上述因素,對(duì)球隊(duì)進(jìn)行模擬比賽。“我們?cè)陔娔X里進(jìn)行了一萬(wàn)次世界杯,最終給出了這份預(yù)測(cè)。”
用大數(shù)據(jù)來(lái)影響體育比賽其實(shí)已經(jīng)不是新鮮事兒了。地處美國(guó)硅谷的NBA球隊(duì)金州勇士,在訓(xùn)練、戰(zhàn)術(shù)、球員選拔等層面廣泛地運(yùn)用了大數(shù)據(jù)分析,甚至據(jù)此開發(fā)出了一套小球戰(zhàn)術(shù)。在短時(shí)間內(nèi)讓球隊(duì)從聯(lián)盟吊車尾,躍升為總冠軍,引領(lǐng)了整個(gè)聯(lián)盟的籃球風(fēng)潮。
(圖片說(shuō)明:覆蓋NBA場(chǎng)館的6臺(tái)高速攝像機(jī)和背后的SportVU系統(tǒng),能夠每秒鐘追蹤25次球員和籃球的運(yùn)動(dòng),記錄下速度、距離、球員間隔和控球等數(shù)據(jù),用于之后的體育分析,提升球隊(duì)成績(jī)。圖片來(lái)源:視覺中國(guó))
收集數(shù)據(jù)、分析、建模、模擬、總結(jié),這是大數(shù)據(jù)時(shí)代的一種預(yù)測(cè)方法。
沈志勇認(rèn)為,利用大數(shù)據(jù)進(jìn)行預(yù)測(cè)的關(guān)鍵在于“采礦”和“冶煉”。“在海量的信息流里,究竟什么數(shù)據(jù)有用?怎樣才能獲取這些信息?獲取后要如何加工處理?這是都是考驗(yàn)人類智慧的環(huán)節(jié),這也是數(shù)據(jù)科學(xué)家這個(gè)角色的任務(wù)。”
在《黑鏡》第四季第四集中,導(dǎo)演們?cè)O(shè)想了一個(gè)“相親”的大數(shù)據(jù)系統(tǒng)。它會(huì)收集一個(gè)人的所有數(shù)據(jù):包括你的喜好、性格等等,然后在虛擬空間里進(jìn)行模擬配對(duì)。它能感受你的情感、體感,讓這個(gè)“你”在系統(tǒng)中與其他用戶模擬交往1000次,最后給出你的“完美伴侶”。這與沈志勇他們的世界杯預(yù)測(cè)邏輯如出一轍。
差別只在于,我們暫時(shí)還無(wú)法收集這么全面的數(shù)據(jù)罷了。
大數(shù)據(jù)讓我們從海量信息中心尋找相關(guān)性變得可能。有些東西無(wú)法預(yù)測(cè),可能只是因?yàn)槲覀儧]有收集到足夠的數(shù)據(jù)支持。
不過(guò)沈志勇也強(qiáng)調(diào),大數(shù)據(jù)遠(yuǎn)遠(yuǎn)不是萬(wàn)能的,完全隨機(jī)的事件也是無(wú)法預(yù)測(cè)的。“就像彩票”,沈志勇笑道。
除此之外,他還領(lǐng)導(dǎo)團(tuán)隊(duì)做了景點(diǎn)人流量預(yù)測(cè)等很多其他預(yù)測(cè)性項(xiàng)目的建模工作,有些已經(jīng)被政府等機(jī)構(gòu)所采用,作為資源調(diào)度、人力分配等決策的重要參考依據(jù)。實(shí)實(shí)在在地改變了人們的生活。
搬運(yùn)工的小目標(biāo):讓數(shù)據(jù)“燃”起來(lái)
常年浸染在數(shù)據(jù)一線,讓沈志勇始終走在大數(shù)據(jù)研發(fā)的最前沿。但他越來(lái)越發(fā)現(xiàn):在互聯(lián)網(wǎng)以外,還有好多領(lǐng)域和產(chǎn)業(yè)并沒有充分利用大數(shù)據(jù)技術(shù)。在這一層面,大數(shù)據(jù)技術(shù)的發(fā)展與社會(huì)需求是脫節(jié)的。
“隨著技術(shù)發(fā)展和媒體渲染報(bào)道,大數(shù)據(jù)一夜之間從‘專業(yè)技術(shù)’變成了‘顯學(xué)’,引起越來(lái)越多人的討論。但是當(dāng)他們想用的時(shí)候卻不知道該怎么用,如何用。于是人們由期望轉(zhuǎn)為失望,開始說(shuō)大數(shù)據(jù)都是忽悠。”沈志勇總結(jié)自己的經(jīng)驗(yàn)認(rèn)為,與其更追求高精尖的陽(yáng)春白雪,不如讓大數(shù)據(jù)技術(shù)落地到更多行業(yè)和領(lǐng)域中去,幫助它們實(shí)現(xiàn)轉(zhuǎn)型升級(jí)。
大數(shù)據(jù)技術(shù)在互聯(lián)網(wǎng)公司早已是基礎(chǔ)技術(shù)。沈曾經(jīng)負(fù)責(zé)過(guò)一段時(shí)間的音樂(lè)推薦系統(tǒng)。他用了三個(gè)月的時(shí)間,通過(guò)梳理用戶數(shù)據(jù),構(gòu)造新的模型、微調(diào)模型參數(shù)等措施,在不增加任何外部成本的情況下,僅僅通過(guò)優(yōu)化內(nèi)部算法,就讓產(chǎn)品的播放量達(dá)到了翻倍的效果,同時(shí)帶來(lái)了大量的用戶增長(zhǎng)。這讓他第一次嘗到了從科研到實(shí)踐“學(xué)以致用”的樂(lè)趣。緊接著他想,大數(shù)據(jù)技術(shù)的應(yīng)用場(chǎng)景,應(yīng)該不局限于互聯(lián)網(wǎng)行業(yè),應(yīng)該讓它在全行業(yè)都能運(yùn)用起來(lái)。
現(xiàn)在,沈志勇更愿意把自己比喻成一個(gè)大數(shù)據(jù)技術(shù)的“搬運(yùn)工”:“我從兩個(gè)源頭搬運(yùn)東西:一個(gè)是學(xué)術(shù)領(lǐng)域、替他們找到真正適用的場(chǎng)景;另一個(gè)是從互聯(lián)網(wǎng)領(lǐng)域,把從中孵化出來(lái)的大數(shù)據(jù)技術(shù)與資源,搬運(yùn)到其他行業(yè)。”
從“探索者”到“搬運(yùn)工”,對(duì)于沈志勇來(lái)說(shuō),其實(shí)也是一種“取舍”:他放棄了去攀登更高層數(shù)據(jù)科學(xué)的機(jī)會(huì)。“但是必須有人要做這件事兒”,沈志勇說(shuō)。大數(shù)據(jù)初期由研究和技術(shù)人員主導(dǎo)、以技術(shù)為核心,容易造成場(chǎng)景與需求端的脫節(jié)。
“我想做這樣一座橋梁:一頭連接著技術(shù),了解大數(shù)據(jù)技術(shù)是什么,能力的特點(diǎn)怎樣、邊界在哪里;另一頭連接著行業(yè),去了解行業(yè)痛點(diǎn),抽象行業(yè)需求。基于對(duì)供需兩側(cè)的理解,做好頂層設(shè)計(jì),讓大數(shù)據(jù)技術(shù)真正賦能全行業(yè),實(shí)現(xiàn)業(yè)務(wù)升級(jí)。”沈志勇說(shuō)道。
在百度大數(shù)據(jù)實(shí)驗(yàn)室,沈志勇前后探索了大數(shù)據(jù)在近十個(gè)行業(yè)的應(yīng)用思路與實(shí)踐。“金融、醫(yī)療、零售還有智能制造等是我們當(dāng)時(shí)投入最多的幾個(gè)行業(yè)”沈志勇回憶道。
最近,行業(yè)關(guān)于“新零售”的討論一直是行業(yè)熱點(diǎn)。沈志勇和他的伙伴們?cè)缭?5年初就開始了大數(shù)據(jù)技術(shù)在零售行業(yè)應(yīng)用的探索。“零售大數(shù)據(jù)是我做過(guò)很有意思的項(xiàng)目,因?yàn)檫@個(gè)領(lǐng)域和我們的日常生活息息相關(guān)”沈志勇提到。在這個(gè)項(xiàng)目中,沈志勇的團(tuán)隊(duì)打通了線上的互聯(lián)網(wǎng)數(shù)據(jù)和線下購(gòu)物中心的零售數(shù)據(jù),為線下的零售實(shí)體,一方面提供了個(gè)性化的營(yíng)銷手段——“個(gè)性化推薦原本是線上的電商的專屬,我們的技術(shù)讓線下零售實(shí)體也能為用戶提供個(gè)性化的服務(wù)和折扣信息推送”,另一方面基于零售實(shí)體周邊用戶整體互聯(lián)網(wǎng)行為的分析,為零售實(shí)體的招商、運(yùn)營(yíng)和選址等業(yè)務(wù)提供了大數(shù)據(jù)參考。
在醫(yī)療領(lǐng)域,大數(shù)據(jù)也同樣受到了關(guān)注。沈志勇舉了一個(gè)糖尿病研究中應(yīng)用大數(shù)據(jù)的例子,糖尿病的成因有基因的也有生活習(xí)慣,醫(yī)院可以測(cè)得前者,但在生活習(xí)慣的數(shù)據(jù)獲取中,會(huì)受到很多主觀因素的干擾而難以準(zhǔn)確全面的獲取。他們和相關(guān)領(lǐng)域的醫(yī)學(xué)研究人員合作,以地域?yàn)榻Y(jié)構(gòu),分析了飲食習(xí)慣和糖尿病發(fā)病之間的關(guān)系,取得了很多有益的結(jié)果。
問(wèn)起沈志勇在行業(yè)大數(shù)據(jù)探索的第一個(gè)行業(yè),“當(dāng)然是金融了,離錢近,行業(yè)數(shù)據(jù)基礎(chǔ)也好。”他笑著說(shuō),“我們?cè)?jīng)嘗試將大數(shù)據(jù)技術(shù)在金融理財(cái)產(chǎn)品的營(yíng)銷、金融風(fēng)控以及利用另類數(shù)據(jù)做量化投資等方向都做了積極的嘗試”。
此外,沈志勇還提到了和小伙伴們,一起探索如何制造業(yè)、教育、旅游、文娛等多個(gè)領(lǐng)域,通過(guò)大數(shù)據(jù)技術(shù),優(yōu)化資源配置,降低損耗,提升業(yè)績(jī),讓數(shù)據(jù)在這些行業(yè),開采、冶煉出來(lái),“燃”起來(lái),驅(qū)動(dòng)行業(yè)的轉(zhuǎn)型升級(jí)。
關(guān)于AI:你應(yīng)該擔(dān)心,但也不要灰心
大數(shù)據(jù)和人工智能,一前一后成為社會(huì)熱點(diǎn),真有點(diǎn)“你未唱罷我登場(chǎng)”的感覺。隨著各大互聯(lián)網(wǎng)公司在人工智能領(lǐng)域的競(jìng)爭(zhēng)開始進(jìn)入白熱化階段,互聯(lián)網(wǎng)以外的行業(yè)也紛紛加入戰(zhàn)團(tuán)。也有越來(lái)越多的人開始擔(dān)心,人工智能將來(lái)會(huì)不會(huì)搶走自己的工作?
“你應(yīng)該有危機(jī)感,需要擔(dān)心人工智能會(huì)帶給你很大的沖擊。”沈志勇在談到這個(gè)話題時(shí),表情格外嚴(yán)肅。“但是你也不用太悲觀,因?yàn)槿斯ぶ悄軙簳r(shí)不會(huì)真的這么做。”
在沈志勇看來(lái),人工智能真正的價(jià)值在于四個(gè)方面。第一,改變了人機(jī)的交互方式(基于語(yǔ)音交互的智能家居等);第二,賦予機(jī)器類人的識(shí)別、判斷力,讓業(yè)務(wù)流程變得高效(車牌識(shí)別抓違章等);第三,讓非結(jié)構(gòu)化數(shù)據(jù)結(jié)構(gòu)化,為大數(shù)據(jù)提供更多數(shù)據(jù)(圖像、語(yǔ)音、自然文本的理解等);第四,提供人力資源供給側(cè)不足時(shí)的輔助與補(bǔ)充(醫(yī)療、教育、法律、金融等專業(yè)領(lǐng)域的機(jī)器人輔助等)。
關(guān)于第四點(diǎn)沈志勇認(rèn)為,在未來(lái),人工智能不會(huì)去“搶”工作,而是首先去“輔助”工作。在他看來(lái),當(dāng)今社會(huì),人類依然還被看病難、打官司貴、教育資源匱乏等問(wèn)題所困擾,這些本質(zhì)上是醫(yī)療、法律、教育等領(lǐng)域人力供給側(cè)資源的稀缺。在這些高度專業(yè)化領(lǐng)域,往往需要社會(huì)付出大量的時(shí)間去培養(yǎng)一個(gè)相關(guān)人才。比如在現(xiàn)代醫(yī)療體系中,一個(gè)合格的醫(yī)生通常需要5-10年的學(xué)習(xí)時(shí)間才能走進(jìn)病房。人才培養(yǎng)周期實(shí)在太過(guò)漫長(zhǎng)。
(圖片說(shuō)明:醫(yī)療行業(yè)已經(jīng)開始運(yùn)用一些人工智能產(chǎn)品,輔助醫(yī)生進(jìn)行決策。一些圖像視頻技術(shù)已經(jīng)可以幫助醫(yī)生處理大量的X光片診斷處理。圖片來(lái)源:視覺中國(guó))
人工智能會(huì)首先進(jìn)入這些行業(yè),一方面輔助現(xiàn)有專業(yè)人員提高效率,另一方面幫助新從業(yè)者降低職業(yè)門檻。而說(shuō)服醫(yī)院等其他行業(yè)的人們,擁抱大數(shù)據(jù)和人工智能的價(jià)值,就是沈志勇現(xiàn)在每天在做的事情。
聊到最后,DT君問(wèn)沈志勇,做一個(gè)大數(shù)據(jù)技術(shù)的“搬運(yùn)工”,是否意味著放棄探索“更高更強(qiáng)”的人工智能?會(huì)有遺憾嗎?
“其實(shí),在讀博士時(shí)候,我的導(dǎo)師正是研究人工智能的學(xué)者。當(dāng)年正趕上人工智能的第二次衰落,導(dǎo)師跟我說(shuō),這個(gè)研究方向現(xiàn)在不好發(fā)paper(論文)啊。還有一個(gè)方向叫數(shù)據(jù)挖掘,這個(gè)領(lǐng)域非常有前途,不如你考慮一下?”于是,沈志勇就這樣與大數(shù)據(jù)結(jié)下了緣分。十幾年過(guò)去了,他對(duì)大數(shù)據(jù)的考慮愈發(fā)成熟,對(duì)行業(yè)的看法也更加深入。
沈志勇現(xiàn)在認(rèn)為,大數(shù)據(jù)和人工智能并不對(duì)立:“我個(gè)人投入更多的是數(shù)據(jù)驅(qū)動(dòng)的智能。各個(gè)行業(yè)在完成信息化的進(jìn)程中,緊接而來(lái)的是高效的運(yùn)用隨之而來(lái)的數(shù)據(jù)的價(jià)值,讓產(chǎn)業(yè)變得更加“智能”。”
如今,他更加相信數(shù)據(jù)驅(qū)動(dòng)才是普世的方法論。“信息化帶來(lái)數(shù)據(jù),互聯(lián)帶來(lái)數(shù)據(jù)的反饋閉環(huán),反饋閉環(huán)帶來(lái)產(chǎn)品和服務(wù)的高效的優(yōu)化迭代。同時(shí)基于歷史數(shù)據(jù)中的經(jīng)驗(yàn)規(guī)律,做資源的優(yōu)選和撮合,達(dá)到資源的優(yōu)化配置。這是最核心的行業(yè)需求。”
這位大數(shù)據(jù)的“搬運(yùn)工”,硬氣地表示,要讓數(shù)據(jù)真正“燃”燒起來(lái)。
沈志勇博士,百度云首席數(shù)據(jù)科學(xué)家。曾任百度研究院大數(shù)據(jù)實(shí)驗(yàn)室高級(jí)數(shù)據(jù)科學(xué)家。在進(jìn)入百度之前,任惠普中國(guó)研究院研究員。本科畢業(yè)于北大數(shù)學(xué)學(xué)院概率統(tǒng)計(jì)專業(yè),隨后于中科院軟件所獲得計(jì)算機(jī)博士學(xué)位。他是大數(shù)據(jù)分析技術(shù)國(guó)家工程實(shí)驗(yàn)室學(xué)術(shù)委員會(huì)成員,大數(shù)據(jù)流通與交易技術(shù)國(guó)家工程實(shí)驗(yàn)室專家委員,蘇州市人工智能學(xué)會(huì)副理事長(zhǎng)。他還是中國(guó)大數(shù)據(jù)產(chǎn)業(yè)生態(tài)聯(lián)盟,中國(guó)云服務(wù)聯(lián)盟,中國(guó)商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專委會(huì),中國(guó)醫(yī)藥教育協(xié)會(huì)基層醫(yī)藥教育專委會(huì),中國(guó)人才大數(shù)據(jù)聯(lián)盟專委會(huì)等機(jī)構(gòu)的專家委員。























