大數據架構師、開發人員、公司必讀:國外大數據應用的10個項目案例(圖表)
問題導讀
- 大數據如何應用于電力能源項目,帶來效益?
- 數據可視化有哪些應用?
- 是否可以將可視化應用于空氣污染?
- 大數據如何應用于各種(手機)應用?
- 你認為大數據還可以應用于那些場景?
翻譯了意大利大數據應用10個項目案例例,供感興趣的讀者享用:
一、數據分析
案例1:
題目:感測人類行為,預測能源消費
應用領域:能源消費預測模型
項目負責人:Andrey Bogomolov
項目簡介:項目致力于優化意大利Trentino省電力能源生產-輸配-銷售鏈。對于電力生產和輸配商而言,本項目通過限制電力能源生產以減少電力消費,通過銷售終端計劃以減少電力輸配成本;同時,本項目為電力波峰預測提供了借鑒。
本項目主要解決兩個問題:(1)日均電力需求預測。通過意大利Trentino省電網系統,該預測利用人類行為數據——移動通信數據,優化了電力能源生產-輸配鏈,減少了氣候變化的影響。(2)電力波峰預測。
本項目模型建立了高階希爾伯特空間數學模型,利用了Trentino省移動網絡數據,預測了各電網未來一周內的日均電力需求和電力波峰。Leo Breiman隨機預測算法解決了本項目模型的非線性回歸問題。同時,本項目模型擁有較少的狀態空間維度,從而能夠有效地應用于大數據分析。
案例2
題目:利用大數據規劃米蘭
應用領域:城市規劃與監測
項目負責人:David Meyer
項目簡介:項目為米蘭人口、環境及其交互作用提供了動態理解。利用米蘭地區的電信網絡數據,項目建立了人口預測模型,辨識了非常規移民人口,并揭示了米蘭的潛在社會結構。同時,項目利用交通和氣象數據預測了城市空氣質量。
案例3
題目:熵——評價常住居民/移民信息,提升生活品質
應用領域:社會學分析
項目負責人:Michele Tizzoni
項目簡介:項目的主要創新在于對“熵”函數的定義。高熵值單元代表異質性高的區域,對應于旅游熱點或鬧市區;低熵值單元代表以國際電話業務為標準的 高特征區域。電話通信數據可以被有效利用以監測大范圍事件,項目利用“熵”函數得到了傳統分析得不到的信息。一方面,某一時間節點代表高度不確定性的高熵 值揭示了該區域非常規/例外事件的發生;另一方面,針對高度活躍的國際通話業務,項目通過拓撲學分析了該城市國際社區的空間特征。
案例4
題目:基于興趣目標導向的廣告宣傳
應用領域:廣告
項目負責人:Aris Anagnostopoulos
項目簡介:相較于線上廣告,線下廣告面臨著達不到滿意宣傳目標的問題?;谏缃痪W絡信息和人口數據,項目對Tweeter文本內容進行了語義分類,區分了不 同Tweeter用戶對電影、音樂、體育等領域的感興趣程度;利用Tweeter位置的地理標記功能,預測了用戶分布和網絡傳播趨勢。
以某領域的廣告投放為例。首先,線下廣告分類投放不同Tweeter用戶。選擇的廣告投放用戶應對該廣告感興趣,應能使總體效益***化。其次,線下廣告投放至 該領域有影響力的Tweeter用戶。投放的廣告不僅是為了覆蓋該領域更多的用戶,更是為了使該領域有影響力的用戶獲知并傳播該廣告,從而使該廣告達到事 半功倍的效果。
案例5
題目:個性化的導航系統應用
應用領域:移動導航
項目負責人:Antonio Lima
項目簡介:項目為城市交通提供了新的導航系統,有效平衡了個人偏好和公眾興趣。使用者可以利用智能設備個性化的定制城市導航路線,如選擇最短路徑,避免犯罪 區域、污染區域、交通擁堵區域,或者避免日程計劃事件區域等。當地政府也可以針對社區做出限制性規定,如減少學校地區的噪音污染。本項目以城市歷史和實時 數據為基礎,以使用者個人偏好和政府限制規定為依據,向使用者反饋路線信息。
Personalized Routing for Multitudes in Smart Cities
案例6
題目:基于Twitter展現的城市社交網絡幸福度分析
應用領域:社會學分析
項目負責人:Iyad Rahwan
項目簡介:心理幸福度對社會生產、社會創新和違法犯罪均會產生影響,公共社交媒體為衡量區域幸福度提供了參考。項目以Twitter內容為基礎進行了幸福度 分類,研究了米蘭市中心不同區域社交聯系和幸福度之間的關系,制作了米蘭市幸福度空間分布圖。項目研究表明,不幸福區域比幸福區域吸引了更高的通信交流。 該研究有助于了解社會結構和城市心理幸福度之間的關系,有助于創新機制以提升城市心理幸福度。
Misery Loves Company
二、數據可視化
案例7
題目:米蘭城市空氣污染的可視化
應用領域:空氣污染監測
項目負責人:Yhidad Calle
項目簡介:人類是強烈的視覺動物,因此可視化數據是要傳達給他人的最快方法。動態、交互式的可視化有助于人們探索數據。本項目運用了交互式和動態圖形,簡化了數據讀取,方便了對此領域不熟悉的公眾。
可視化的例子。2013年12月,米蘭的幾個主要污染物的強度分布圖——熱圖,其中包含在矩陣中的數值被表示為顏色數據的圖形;徑向堆疊面積圖以24小時為一圈進行編碼,分析了每小時各污染物的累計濃度。
Milan AirPollution Visualization
案例8
題目:空中鳥瞰下的人類行為
應用領域:敘事
項目負責人:Gergely Daroczi
項目簡介:小數據或大數據的難點不是數據量的大小以及如何處理數據,焦點在于“如何把數據轉化為有用的信息”?本項目運用了多種可視化技術,提供了空中鳥瞰下的人類活動。
移動汽車的分布、撥出電話的地理分布、二氧化氮排放及空氣污染、交通事故的位置分布,這些都反映了人類活動。本項目演示文稿旨在反映人類的日?;顒印?/p>
三、應用
案例9
題目:基于Twitter語言的旅游分析
應用領域:旅游
項目負責人:Salih Ergut
項目簡介:對于游客來說,尋找當地熱門的旅游目的地不是一件簡單的事情。旅游指南、博客、旅游網站等提供了該城市的一些信息,但卻很難從這些冗長的信息中發現有用的價值。
游客在旅行時很難在地圖上找到想去的地方。已有的旅游信息更多的是通用的,并沒有反映不同文化的特點。本項目考慮了游客的背景,開發了相應的應用程序,達到了使旅行有趣的目的。
案例10
題目:城市用地使用情況分析
應用領域:城市規劃
項目負責人:Irene Celino
項目簡介:城市規劃的目的是通過土地使用信息規劃城市環境。然而,收集土地信息并予以分類的成本代價較高。人們在生活環境中會留下痕跡,是否可以將這些痕跡數據化并予以監測,從而有效地預測“生活”土地使用情況?
本項目研究致力于:(1)通過大數據分析得到2013年城市用地使用“足跡”;(2)將這些“足跡”與2009年的城市用地使用情況比較;(3)分析2009年-2013年的土地用途偏差。
本項目對認識和監測土地使用情況的變化產生積極的影響。如,為城市規劃提供支持,減少土地普查費用等。
Living Land Use
【本文為51CTO專欄作者“王森豐”的原創稿件,轉載請注明出處】






















