1983到2012：大數據發展演進大事記

作者：波波編譯 2013-05-30 16:38:31

近幾年來，大數據一直是公共領域的一個熱詞，但其根源其實早已深植于整部IT發展史中。回溯過去30年，我們就會發現一些在影響著我們收集、管理和分析數據的關鍵事件，這些事件有助于解釋為何大數據今天會如此熱門的原因。

1983

IBM發布***的關系數據庫管理系統DB2，使用結構化查詢語言，很快成為政府部門的主流產品。

1985

面向編程(OOP)語言，如Eiffel開始流行。

1990

用于互聯網搜索的***搜索工具Archie誕生。

1991

萬維網(World Wide Web)利用超文本傳輸協議(HTTP)和超文本標記語言(HTML)逐漸成為信息共享的公共服務。

而Gopher作為互聯網上分布、搜索和提取文檔的TCP/IP應用層協議，可以說是早期Web的一個替代品。Gopher的出現導致了兩個新的搜索程序，即Veronica和Jughead的出現。

1993

W3CCatalog發布，它是萬維網上最早出現的搜索引擎。

1995

Sun發表Java平臺，而Java語言則是1991年發明的。該平臺在數據治理方面獲得最廣泛使用，在Web應用中尤其普及，逐漸取代了面對面的和書面的事務。

1972年開始運行的全球定位系統(GPS)這一年實現了全球運營能力。

1997

NASA阿姆斯研究中心的Michael Cox和David Ellsworth發表了一篇論述虛擬化的論文，探討了計算資源無法即時處理的過大數據集的挑戰。該論文寫道：“我們稱這一問題為大數據問題，”這可能是***提出大數據這一術語。

1998

Carlo Strozzi開發出一個開源關系數據庫，并稱其為NoSQL。十年后，一場開發NoSQL數據庫以處理大型、非結構化數據集的運動開始啟動。

谷歌公司誕生。

2001

萬維網發明人Tim Berners-Lee提出“語義Web”這一術語，夢想著機器與機器交互“會讓在Web上分析所有數據成為可能。”

維基百科發布。

2002

2001年9月11日，紐約遭受恐怖襲擊。DARPA開始研制整體情報識別系統，綜合了生物識別、語言處理、預測模型和數據庫技術，是美國眾多情報機構所進行的新型數據采集和分析努力之一。

2003

根據IDC和EMC的研究，電腦和其他數據系統在這一年中所產生的數字信息量超過了2003年之前歷史上全人類所產生的信息總量。

2005

Apache Hadoop項目這一年誕生，它注定要成為治理大數據的基礎。

美國國家科學基金會建議為“足夠多的高質量數據科學家”創建職業路徑，這些科學家主要處理日益增長的數字信息集合。

2008

連接到互聯網上的設備數量超過了世界人口總量。

2011

IBM的沃森超級計算機每秒可掃描并分析4TB(約2億頁文字量)的數據量，并在美國著名智力競賽電視節目“Jeopardy”上擊敗兩名人類選手而奪冠。

用于NoSQL數據庫的查詢語言UnQL開始研發。

2012

奧巴馬政府發布大數據研發倡議，該倡議涉及美國政府的六個部門的84項計劃。美國國家基金會同時發布了《推進大數據科學和工程的核心方法及技術》。

IDC和EMC估計，2012年將產生2.8ZB的數據，但其中只有3%能夠當做大數據來使用，能分析的數據量則更少。該報告預計，到2020年的數字世界將擁有40ZB的容量，是全世界所有海灘全部沙粒數的57倍!

責任編輯：遺忘者來源：網界網