Foursquare的野心:大數據時代“活點地圖”
這還不止,Foursquare 還想要根據過去的“行動歷史”以及朋友的喜好提供未來行動的指引,Foursquare Explore 服務,可以發現身處的城市周邊都有什么值得一去的地方。他們還有怎樣的“地圖”美夢?處理這些數據的工具又是什么?
大野心:精細的“多邊形區域”框架
Foursquare 正在和多個公司合作,為他們提供地理位置信息以及周邊商家評價反饋。同時,他們也通過這些合作伙伴收集更多的地理位置信息——人們對什么地方感興趣,對什么地方不喜歡。Instagram, Bing, Flickr, Quora, Path, Soundtracking, Evernote……都是他們的合作伙伴,導入數據的量級可想而知。
Foursquare 的工程師 David Blackman 日前接受采訪時透露,Foursquare 正在為完善“活點地圖”的框架,讓更多應用和公司能夠在此基礎上反戰自己的“殺手級”服務。而這種框架,就是城市區域中的“多邊形”(polygon shape)——根據“簽到”信息的大數據和地理信息編碼匯總而成的城市區域邊界。舉個例子,不是“廣州”或者“北京”的邊界,而是廣州的“上下九”區域,或者北京的“五道口”區域,他們不僅僅是一路名,一商圈,一行政區域,而是大部分用戶所認為的區域邊界。他用紐約的“布魯克林”作為例子,Foursquare 所呈現的區域,并不是一般的網格狀,而是,通過收集用戶的簽到信息整合的“多邊形邊界”。

本來,他們需要到世界上的每個城市深入每個區域來了解這些細節的邊界。不過通過收集“簽到”(需要輸入地址)信息,或者是用戶查找某地址所用的區域名字信息,他們可以足不出戶地把這個工作交給世界。只要與現有的商家點評服務糟糕的區域識別稍作對比,就能想象到多邊形框架的可怕之處——精準,而且“懂你”。
解密地圖背后的“繪圖工具”
Foursquare 目前有 100 多名員工,而負責地理信息數據的團隊只有 3 人。這個小團隊正在使用什么樣的工具來構建地圖的框架?
其中之一是 Google S2 ,提供地表地理信息數據索引的開源服務。Foursquare 目前的發現周邊商家和去處的服務 Explore 就是基于S2 的開源數據。而用戶的簽到信息,也是會覆蓋在 S2 的地理信息上,方便 Foursquare 進行整合和地理分類。 而為了建立地理編碼信息的數據庫,Foursquare 還在使用 MapReduce 這種大規模數據集的運算模型。David Blackman 稱,他們將 MapReduce 和 S2 結合起來,將世界分成數個模塊,將簽到的地理位置信息與 S2 結合一起,然后分成區域,這樣就有了之前我們提及的“多邊形區域”的模型了。
另外,為了獲取豐富地圖數據——商家、郵政編碼等,Foursquare 還與 TIGER Project 和 Natural Earth 等美國政府官方的地理編碼項目合作。
盡管如此,Foursquare 還是以來用戶提供的大量地理位置數據來完善自己的推薦和地圖內容,早前,Foursquare 曾經把這些數據整合成一個動態的“簽到”地圖:
【編輯推薦】



















