當計算機視覺遇到硅谷歸來的創業者——專訪格靈深瞳聯合創始人兼CTO趙勇
原創計算機視覺是自二十世紀六十年代中期迅速發展起來的一門新學科。計算機視覺是使用計算機及相關設備對生物視覺的一種模擬,主要任務是通過對采集的圖片或視頻進行處理以獲得相應場景的視覺信息,就像人類和許多其他類生物每天所做的那樣。計算機視覺在工農業生產,安防,地質學,交通,醫學及軍事學等等領域有著極大潛在的應用價值,所以它在國際上越來越受到重視。比爾蓋茨曾說:IT界的下一個大事件是計算機視覺(computer vision)與深度學習(deep learning)的結合。早在前年6月中旬訪問北京時,他到訪的***家創業公司就是一家計算機視覺的公司。這家公司就是格靈深瞳,曾在2014年獲得來自紅杉的數千萬美元B輪融資。坐落在頤和園邊、西山河畔,有一個小橋流水亭臺樓閣的28畝院子。
近日,51CTO的記者有幸采訪了格靈深瞳聯合創始人兼CTO趙勇。趙勇是美國布朗大學計算機工程系的博士,畢業后供職于Google總部研究院任資深研究員,他也是Google Glass最早期的核心研發成員,2013年4月作為聯合創始人創立格靈深瞳。
格靈深瞳聯合創始人兼CTO趙勇
格靈深瞳致力于讓計算機看懂世界,用廣泛的視覺傳感器網絡,構建真實世界的搜索引擎。2013年4月,趙勇作為聯合創始人創立格靈深瞳,作為***技術官,帶領技術團隊成功研發出了“深瞳無人監控安防系統”,一舉解決了傳統安防監控行業“看不見”和“找不到”的行業基本痛點。傳統的安防監控中心,一個保安需要同時看幾十上百路視頻,即使發生了異常事件,能夠被保安看到的概率也是非常小的;而當一件事情發生以后,需要靠人力去大量的硬盤數據里面尋找線索,這是一項極其浩大的工程,耗時特別長,效率特別低,而格靈深瞳的產品可以很好地解決這兩個行業瓶頸。
2014年4月格靈深瞳首款產品“深瞳無人監控安防系統”工程樣機開發完成,并得到國有四大銀行中三家大行的青睞,10月開始在多省市進行全面售前測試。該套系統可以解決傳統安防行業的發展瓶頸,直擊行業痛點,具有巨大的市場潛力和開拓能力。
創立格靈深瞳源于好奇心的驅使
趙勇畢業于美國布朗大學,曾在三菱電器研究所、愛普生實驗室、Nvidia實驗室和惠普實驗室擔任實習研究員。2010年起,供職于谷歌總部研究院任資深研究員。這些公司無疑都是業界的標桿,為何還要走上創業這條充滿艱辛的路?趙勇的回答是:好奇心。就是想嘗試一下重新開始做一個團隊是什么感覺。在談到51CTO的線下中高端技術人學習平臺CTO訓練營的時候,趙勇也談到對CTO這個崗位以及技術管理的理解。首先是三年多的創業經歷讓趙勇感受到了中西方團隊的氛圍的不同。在西方國家的企業,無論是技術層面還是企業文化都比中國的更專業化,而中國企業的人情味更濃。自己也是一直在平衡著這種不同,把西方文化、企業管理比較適合中國的引進進來,同時,不斷學習本土企業文化。
格靈深瞳在做什么
格靈深瞳將計算機視覺和深度學習技術應用于商業領域,自主研發的深瞳技術在人和車的檢測、跟蹤與識別方面居于***水平。目前公司已將其應用到了安防監控和智能交通領域,推出了顛覆行業的突破性產品。
主要技術有:
1.三維計算機視覺
三維計算機視覺和傳統的二維圖像處理技術相比,增加了物體的深度信息,更完整的真實的還原了物體信息,解決了相互遮擋、比例混淆、影隨人動的問題,提高了智能檢測和分析的準確度。
2.深度學習
深度學習是由傳統神經網絡發展的一類機器學習算法。通過類似腦神經網絡的深度學習模型,讓計算機像人一樣在真實世界中吸收、學習和理解復雜的信息,完成高難度的識別任務。
主要產品有:
1.皓目行為分析儀:劃時代意義的安防產品,真正意義上的人工智能。
2.威目車輛特征識別系統:基于深度學習的新一代車輛識別引擎,以在線云服務、離線SDK、軟硬一體的產品形式讓企業級用戶和直接業務部門可以快速應用***的車輛識別技術。
3.威目視圖大數據系統:基于視圖結構化提取的車型、車系、年款等關鍵信息,對套牌車、假牌車的分析進行有力比對;利用人體/人臉結構化識別的信息,對目標嫌疑人員進行快速定位;配合結構化特征信息,對嫌疑車輛/人員實行快速的以圖搜圖應用,大幅提高利用效率。
趙勇透露:“格靈深瞳目前同時進入了三個領域;安全、汽車、醫療。最近剛剛分拆出了多家公司,每個團隊都在各自細分領域里面去做,而它所依賴的核心知識基本上是一致的。”
我們不是微軟Kinect,不是PrimeSense,也不是Asus Xtion。
“我們不是微軟Kinect,不是PrimeSense,也不是Asus Xtion。我們的產品不是傳感器元件本身。事實上,傳感器公司是我們的合作伙伴。我們的傳感器網絡中適配的也不僅僅是一款三維傳感器。因為不同的傳感器能力和適用條件不同,有時候我們需要把多種傳感器集成在一個外殼下。目前,格靈深瞳正在和幾乎全世界所有的三維傳感器公司合作,把這種偉大的技術帶到各種完全不同的應用領域。目前我們的產品線包括適用于微小空間的手勢識別、適用于室內中等空間和室外大空間的行為識別,適用于汽車的全天候路況和駕駛安全識別,以及適用于道路檢測的車輛和行人行為識別。”趙勇告訴記者。
既然格靈深瞳是軟件公司,那和微軟的Kinect,以及PrimeSense主導的OpenNI等人機交互技術有什么區別呢?上述兩種技術解決的問題是在近距離空間里的人為了和面前的計算機之間進行主動交互的姿態識別問題。這樣的技術是專門為了游戲機和電視遙控等客廳場景設計的。而格靈深瞳面對的客戶場景更大,人更多,人們的行為不是為了配合交互而且更加復雜,因此往往要處理人與人之間的重疊遮擋問題。格靈深瞳在人體動作分析方面的技術是專門針對這種現實場景的挑戰而設計的。
計算機視覺和機器視覺的區別
對于這個問題,趙勇表示,計算機視覺是一個更大的領域。其中一個應用領域是在工業,一個例子是質量控制。這時也被稱為機器視覺。所以可以說,計算機視覺是一個更大的領域,機器視覺一般來講是一個比較狹義的概念。
計算機視覺對51CTO的線下中高端技術人學習平臺CTO訓練營來說,也是一個全新的領域。
人工智能一直是一個失敗者,但它必須成功
有人說計算機視覺是人工智能的下一個科技前沿,但趙勇認為“人工智能一直是一個失敗者,但它必須成功。” 人們對人工智能的理解,可能最早要推到二戰的時候,計算機用于去破解敵方的密碼。后來很多理論學家、計算機學家出現,這個領域差不多也興旺過三四次,但最終都銷聲匿跡了。這次是一個新的浪潮,有三個特點:***,技術進入到了實用領域。第二,今天人工智能做的有些事情能力上甚至超過了人。第三,今天的技術已經有了很多行業化的應用,一旦有了商業化的應用后,這個領域獲得的資源就不一樣了,以前都是國家撥經費,現在變成了金融領域的投資,因為大家覺得它可能快成熟了。
人工智能必須要成功,因為我們如果想超越自己的話,就只能靠人工智能的幫助了。
計算機視覺下一個應用
說到計算機視覺未來的應用方向,趙勇認為安全、無人駕駛、醫療、機器人將是計算機視覺接下來的主要應用領域。
我們未來的生活可能每個毛孔里都有人工智能,未來,深瞳技術的開放平臺將不斷把格靈深瞳***的技術提供給廣大合作伙伴,為各行各業帶來最有效的技術解決方案。



















