大數據時代的掘金之道
不久前關于全球最大的全球金融信息服務供應商彭博社泄密客戶數據的消息喧囂塵上,可吊詭的是,本為受害方的華爾街巨頭們似乎并不在意,而看熱鬧不嫌事大的媒體們卻紛紛把矛頭對準彭博社,想要從中挖掘出點什么料來。
這件事最大的裨益其實是告訴我們每一個人:大數據時代已經來臨,信息公開,數據掘金勢不可擋。
據相關權威機構預計,全球數據總量每兩年就會增長一倍,到2020年人類擁有的數據總量將會達到驚人的35萬億GB。一分鐘內全球互聯網傳送數據64萬GB、發布2億400萬封郵件、下載4.7萬個App。Twitter用戶平均每天發布4億條消息。2012年第四季度新浪微博日均活躍人數為2800萬;產生微博超過1億條;產生的數據量為1335GB……
一個普遍被認可的概念是,大數據,或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策更積極目的的資訊。
早在去年3月,美國政府就宣布投資2億美元啟動“大數據研究和發展計劃”,把大數據從商業層面上升到國家戰略層面。據預測,大數據業務每年將為美國醫保帶來3000億美元的價值,而在中國,大數據的潛在市場規模達2萬億元!
美國的海嘯預警系統一個案例一直被廣為稱道,2011年3月11日,日本大地震發生9分鐘后, NOAA(美國國家海洋和大氣管理局)隨即通過對海洋傳感器獲得的實時數據發布了詳細的海嘯預警,并制作了海嘯影響模型。使世界各國對海嘯造成的傷害做到心中有數。
2012年,YouTube實現了40億美元的收入,其根源就在于對大數據的挖掘和應用。YouTube上所有的數據信息都以單部視頻節目為核心,第一次訪問、第一次分享、第一次評論都會完整地展現在用戶面前,同時還會將時間和URL都一一列出。實現了只要用戶想要統計和分析,YouTube會將幾乎所有視頻的數據都如數供出。
可公開的數據具有商業價值。自媒體時代,人們的所有行為暴露在陽光下,小到一日三餐吃了什么,大到買房買車,所有的數據都在網絡中有跡可循。
曾經有一美國男子怒電塔吉特超市:“你們居然向我上高中的女兒郵寄孕婦品廣告,想鼓勵她懷孕嗎?”一周后這父親去電塔吉特道歉,因他女兒真懷孕了。塔吉特通過數據分析發現:女子懷孕后會買許多無香味護手霜、多維元素和鈣片;通過該指數,塔吉特能夠準確預測女顧客懷孕情況,并開始郵寄廣告。
支付寶[微博]最新數據顯示,在過去的一年,全國超過55%的在校大學生已加入淘寶網[微博]上支付的大軍。數據顯示,網上消費能力最強的大學生群體,并非北上廣等一線城市,排名第一的是浙大。數據科學團隊用大數據識別大學生身份,并顯示出女生淘衣服、男生愛數碼,超六成用手機購物。通過數據挖掘,又會讓無數淘寶賣家受惠。
在美國沃爾瑪超市,人們發現了一個特別有趣的現象:尿布與啤酒這兩種風馬牛不相及的商品居然擺在一起,而且這一奇怪的舉措居然使尿布和啤酒的銷量大幅增加了。原來,美國的婦女通常在家照顧孩子,所以她們經常會囑咐丈夫在下班回家的路上為孩子買尿布,而丈夫在買尿布的同時又會順手購買自己愛喝的啤酒。這個發現為商家帶來了大量的利潤。
所有的這一切都是大數據的功勞。
與可公開數據相對應的是隱私數據。但何為隱私數據,并沒有一個嚴格的判斷標準,比如對于普通人而言,衣食住行等等都是個人隱私,非經允許,不能暴露,企業更不可利用此牟利。而彭博社的此次行為之所以被媒體曝光,就是因為其侵犯了客戶隱私權。
但對于公眾人物而言,則沒有任何隱私權。
美國法律規定,上至總統下至政府一般職員,都必須在社會公眾前公布個人財產狀況。這是一條沒有任何人可以凌駕之上的法律,不公布財產者不能進入政府掌握公權。真是因此,每隔四年新一屆內閣提名之時是美國政府道德辦公室最忙碌的時候,所有經總統提名、需要參議院批準的候選人都必須向聯邦政府道德辦公室提交財產申報報告。
據美國白宮新近公布的資料,2012年美國總統奧巴馬家庭財產在180萬美元到近700萬美元之間,相比2010年和2011年小幅縮水。形成鮮明對比的是,美國普通民眾的個人財產數據是嚴格受到保護的,非經允許,擅自公布,必受法律追究。
奧巴馬作為一個借助互聯網粉絲營銷兩次入主白宮的美國總統,推動了美國的信息公開法案,致力于建設“前所未有透明的政府”。在白宮網站上,你甚至可以查到奧巴馬總統私下這個月宴請過哪些客人。
而中國當下缺乏的則是對普通公民數據隱私的保護:你剛買了房,買房的信息就會賣給裝修公司。但政府的信息公開卻做得乏善可陳。




















