精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

數(shù)據(jù)挖掘技術(shù)在軌跡數(shù)據(jù)上的應(yīng)用實(shí)踐

新聞 大數(shù)據(jù)
每天滴滴都會(huì)為上千萬人提供出行服務(wù),在這一過程中積累了海量軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)來自于公共服務(wù),本文介紹如何利用這些數(shù)據(jù)回饋大眾,改善出行體驗(yàn)。

 每天滴滴都會(huì)為上千萬人提供出行服務(wù),在這一過程中積累了海量軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)來自于公共服務(wù),本文介紹如何利用這些數(shù)據(jù)回饋大眾,改善出行體驗(yàn)。

1. 背景

首先簡(jiǎn)要介紹一下什么是數(shù)據(jù)挖掘。數(shù)據(jù)挖掘(Data Mining)是指從大量數(shù)據(jù)中發(fā)現(xiàn)特定信息和模式的過程,也有很多人將這一過程看作知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database)。數(shù)據(jù)挖掘常用的算法手段有回歸、分類、聚類和模式發(fā)現(xiàn),工程上數(shù)據(jù)挖掘通常和大數(shù)據(jù)技術(shù)聯(lián)系在一起,工業(yè)實(shí)踐中還需要從業(yè)人員對(duì)數(shù)據(jù)中包含的領(lǐng)域知識(shí)有足夠了解。業(yè)界挖掘手段經(jīng)常用在用戶畫像、商業(yè)智能(Business Intelligence)、社群關(guān)系發(fā)現(xiàn)等場(chǎng)景。本文主要分享如何從海量軌跡數(shù)據(jù)中提取關(guān)鍵信息,改善用戶出行體驗(yàn)。滴滴在業(yè)務(wù)運(yùn)營(yíng)過程中,司機(jī)端APP 會(huì)持續(xù)向后臺(tái)上傳位置信息,這些信息被用于分單、司乘碰面、導(dǎo)航、里程計(jì)費(fèi)。每天滴滴都會(huì)為上千萬人提供出行服務(wù),在這一過程中積累了海量軌跡數(shù)據(jù)。這些軌跡數(shù)據(jù)不涉及用戶隱私,主要反應(yīng)了公共道路上的交通狀況和司機(jī)駕駛習(xí)慣。下面我們會(huì)具體介紹兩個(gè)典型場(chǎng)景。

2. 路網(wǎng)更新

作為數(shù)字道路地圖的關(guān)鍵部分,道路交叉口是多條相互連接道路的交匯處,其幾何特征和拓?fù)鋵傩缘木_性在移動(dòng)導(dǎo)航和其他位置服務(wù)中起著重要作用。隨著城市發(fā)展,交叉口的更新越來越頻繁,主要包含掛接關(guān)系變更、新路、形態(tài)變更,這類拓?fù)溴e(cuò)誤如果不能及時(shí)檢測(cè)及更新,會(huì)影響路網(wǎng)匹配、路徑規(guī)劃、導(dǎo)航播報(bào)等基于路網(wǎng)數(shù)據(jù)的地圖服務(wù),產(chǎn)生導(dǎo)航繞路、播報(bào)不合理等用戶體驗(yàn)問題。

▍2.1 技術(shù)挑戰(zhàn)

交叉口拓?fù)涓驴梢猿橄蟪蛇@樣一個(gè)問題:路口范圍內(nèi)的軌跡矢量模式與路網(wǎng)是否匹配?為此,需要解決以下幾個(gè)關(guān)鍵問題:第一,軌跡數(shù)據(jù)包含了大量噪聲,如何進(jìn)行有效去噪;第二,路口位置及范圍如何確定;第三,軌跡矢量模式如何表達(dá)以及如何與路網(wǎng)差分。為了解決以上問題,我們?cè)O(shè)計(jì)出的算法框架如下,包含三個(gè)核心模塊:軌跡質(zhì)量提升,路口影響區(qū)域檢測(cè)和拓?fù)浣Y(jié)構(gòu)校準(zhǔn)模塊。相關(guān)工作發(fā)表在數(shù)據(jù)挖掘與數(shù)據(jù)庫技術(shù)頂級(jí)學(xué)術(shù)會(huì)議 International Conference on Data Engineering (ICDE) 2020上。

▍ 2.2  軌跡質(zhì)量提升原始軌跡數(shù)據(jù)可能受設(shè)備故障、信號(hào)不佳等因素影響導(dǎo)致采集到的定位信息存在漂移甚至異常,我們根據(jù)前后軌跡點(diǎn)的距離和時(shí)間間隔進(jìn)行軌跡段的分割,保證同一軌跡段在時(shí)空上具有連續(xù)性;此外,車輛在路口一般會(huì)因?yàn)榈燃t綠燈或交通擁堵停留,導(dǎo)致在短距離范圍內(nèi)產(chǎn)生大量具有不同方向的位置信息(噪聲),不僅增加了路口檢測(cè)的計(jì)算開銷,還給檢測(cè)精度帶來較大影響。

針對(duì)這一問題,我們基于軌跡點(diǎn)的密度(時(shí)間密度、空間密度)進(jìn)行數(shù)據(jù)過濾,并對(duì)局部自相交軌跡段進(jìn)行分段,最后通過Douglas Peucker算法提取軌跡段關(guān)鍵形狀點(diǎn),在保留軌跡轉(zhuǎn)向特征的同時(shí),對(duì)數(shù)據(jù)實(shí)現(xiàn)了壓縮。因此,通過軌跡分段、去噪、壓縮的預(yù)處理,實(shí)現(xiàn)了對(duì)原始軌跡數(shù)據(jù)的質(zhì)量提升。

▍2.3 交叉口位置及范圍生成

為了檢測(cè)道路交叉口影響區(qū)內(nèi)的詳細(xì)拓?fù)湫畔ⅲ紫刃枰R(shí)別道路交叉口的核心區(qū)域,即路口位置和覆蓋范圍。考慮到不同路口大小不一,并且路口范圍內(nèi)軌跡通常具有減速、轉(zhuǎn)向等特征,我們?cè)O(shè)計(jì)了一套基于四叉樹空間劃分和Mean-shift的自適應(yīng)路口位置檢測(cè)算法。在搜索道路交叉口單元的過程中,將四叉樹的最小邊長(zhǎng)設(shè)置為25米,并從200米大小邊長(zhǎng)開始的層(即從四叉樹底部開始的第四層)搜索道路交叉口單元。由于交叉口中心位置的軌跡往往比路段具有更多的轉(zhuǎn)向與較低的轉(zhuǎn)速,我們對(duì)每個(gè)網(wǎng)格單元中的所有特征點(diǎn)(軌跡壓縮獲得)執(zhí)行速度分析和基于方向的DBSCAN聚類,篩選潛在的道路交叉口網(wǎng)格單元。隨后,鑒于Mean-Shift算法可以在聚類過程中同時(shí)檢測(cè)出密度中心,我們通過該算法,結(jié)合候選交叉口單元內(nèi)的軌跡點(diǎn)識(shí)別路口的中心位置。

不同路口其形狀有較大差異,如何更通用地基于軌跡數(shù)據(jù)確定路口的核心區(qū)范圍?實(shí)質(zhì)上道路交叉口的中心位置附近并不總是具有相對(duì)于路段區(qū)域更多轉(zhuǎn)向行為,例如,環(huán)島和立交橋。本文中我們利用環(huán)狀幾何模型逐層檢測(cè)路口覆蓋范圍。對(duì)于一個(gè)路口而言,越到核心區(qū)邊緣的環(huán)包含的轉(zhuǎn)向點(diǎn)密度越低、速度越大,因此該路口模型適于不同形狀路口的范圍提取。

▍2.4 拓?fù)浣Y(jié)構(gòu)校準(zhǔn)

在路口范圍拓?fù)浣Y(jié)構(gòu)的校準(zhǔn)階段,我們基于檢測(cè)的路口中心位置和核心區(qū)范圍向外擴(kuò)展,獲取交叉路口影響區(qū)內(nèi)的全部軌跡。我們對(duì)這些軌跡進(jìn)行轉(zhuǎn)向簇提取與中心線擬合,并將擬合的轉(zhuǎn)向路徑與基準(zhǔn)路網(wǎng)進(jìn)行地圖匹配。Frechet距離適于評(píng)測(cè)曲線之間的相似性,但是對(duì)于復(fù)雜形狀的路口以及路口鄰接路段間朝向偏差較小的情況,F(xiàn)rechet表現(xiàn)不佳。鑒于此,我們將方向權(quán)重引入軌跡相似性度量中。對(duì)于任意兩條軌跡序列,分別計(jì)算起點(diǎn)與終點(diǎn)間的方向差,并結(jié)合Frechet距離生成軌跡集合的距離矩陣。基于該矩陣結(jié)合DBSCAN聚類實(shí)現(xiàn)路口范圍內(nèi)的轉(zhuǎn)向簇提取。

在提取轉(zhuǎn)向簇后,需要對(duì)各簇軌跡進(jìn)行擬合來得到轉(zhuǎn)向矢量模式。我們采用基于Force Attraction的聚類方法獲取各簇對(duì)應(yīng)的轉(zhuǎn)向路徑,相比如其他依賴點(diǎn)信息的擬合算法如Sweeping等,F(xiàn)orce Attraction方法能夠充分運(yùn)用軌跡線信息,因此對(duì)復(fù)雜轉(zhuǎn)向場(chǎng)景的擬合更加魯棒。Force Attraction方法首先隨機(jī)采樣簇中的一條軌跡作為參考軌跡,隨后使用同簇內(nèi)其余軌跡對(duì)參考軌跡中點(diǎn)的位置進(jìn)行迭代調(diào)整。在調(diào)整過程中,F(xiàn)orce Attraction算法假定任意軌跡點(diǎn)上有吸引力和排斥力作用,通過搜索兩個(gè)力達(dá)到平衡的位置來獲得參考軌跡對(duì)應(yīng)點(diǎn)的新位置。由于隨機(jī)采樣軌跡容易導(dǎo)致擬合得到的中心線不精準(zhǔn),特別是當(dāng)隨機(jī)采樣的參考軌跡遠(yuǎn)離實(shí)際道路中心時(shí),擬合偏差較大。因此,我們引入基于Frechet的采樣策略。具體來說,我們從簇中隨機(jī)采樣k條軌跡作為候選參考軌跡,并分別計(jì)算每個(gè)候選者與該簇的其余軌跡之間的Frechet距離。將具有最小距離和的候選軌跡視為參考軌跡。

在獲得轉(zhuǎn)向路徑后,我們采用經(jīng)典的HMM算法結(jié)合基準(zhǔn)路網(wǎng)進(jìn)行地圖匹配。為加速匹配過程,我們基于每個(gè)路口的轉(zhuǎn)向路徑集生成凸包再與路網(wǎng)空間關(guān)聯(lián)。根據(jù)匹配概率得到低置信度轉(zhuǎn)向路徑,作為需修正拓?fù)淝閳?bào)。

在最終的路口拓?fù)湫?zhǔn)上,為了評(píng)估我們解決方案的有效性,我們基于滴滴實(shí)際軌跡數(shù)據(jù)和路網(wǎng)檢測(cè)兩種類型的錯(cuò)誤拓?fù)洌恨D(zhuǎn)向路徑缺失和轉(zhuǎn)向路徑偏移。根據(jù)我們的評(píng)估,整體的精確率能夠達(dá)到70%,轉(zhuǎn)向路徑缺失和偏移的比例在1 : 5。目前該方法已經(jīng)在滴滴路網(wǎng)更新產(chǎn)線中得到應(yīng)用,下圖為兩個(gè)典型案例(路網(wǎng)為淡灰色線,軌跡分布以深藍(lán)色表示,校正的轉(zhuǎn)向路徑以紅色箭頭線突出顯示。

3. 路線偏移

在網(wǎng)約車業(yè)務(wù)場(chǎng)景中,可能會(huì)出現(xiàn)司機(jī)師傅未能按照導(dǎo)航路線行駛而出現(xiàn)路線偏移的現(xiàn)象,導(dǎo)致此類場(chǎng)景出現(xiàn)的原因可能是路況不佳、路線不合理、道路封閉,也可能是司機(jī)發(fā)現(xiàn)了更好的路線躲避擁堵,或者是對(duì)路線不熟悉,甚至故意繞路等。挖掘此類場(chǎng)景對(duì)于網(wǎng)約車提升地圖用戶體驗(yàn)、避免司乘糾紛、保障司乘安全具有至關(guān)重要的意義。為了解決此類問題,地圖團(tuán)隊(duì)通過全局/局部的起終點(diǎn)(Origin-Destination,簡(jiǎn)稱OD) 約束,基于用戶歷史軌跡行為特征建模,實(shí)時(shí)觀測(cè)目標(biāo)用戶軌跡行為空間分布特征,從而檢測(cè)路線偏移行為。基于用戶軌跡的路線偏移檢測(cè),我們最終構(gòu)建了實(shí)時(shí)觸達(dá)用戶的軌跡安全產(chǎn)品與路網(wǎng)狀態(tài)更新體系。

▍3.1 技術(shù)挑戰(zhàn)

基于OD軌跡路線偏移檢測(cè),通常涉及到路線表征維度多樣性、OD觀測(cè)空間下歷史正常軌跡稀疏性、檢測(cè)實(shí)時(shí)性等建模問題以及TB級(jí)軌跡大數(shù)據(jù)的離線特征存儲(chǔ)更新、在線實(shí)時(shí)查詢等工程問題。雖然在學(xué)術(shù)研究領(lǐng)域,軌跡異常檢測(cè)已經(jīng)形成了相對(duì)成熟的解決方案與不同角度的研究積累,但在實(shí)際工程實(shí)踐會(huì)面臨復(fù)雜多樣的業(yè)務(wù)場(chǎng)景,具體來講:

1.路線表征維度多樣性

用戶軌跡路線可以用一系列有序的GPS點(diǎn)串表征,該方式可以保留最原始的路線信息,但是會(huì)存在軌跡飄點(diǎn)、冗余、無法批量高效建模的問題;也可以基于軌跡匹配道路結(jié)果進(jìn)而通過一系列路段表征路線,該種表征方式最為常見,同時(shí)也會(huì)存在軌跡質(zhì)量、綁路策略而帶來的誤匹問題;還可以將GPS映射到空間瓦片表示,該方式可以有效規(guī)避以上兩類問題,但是無法精確定位路網(wǎng)問題。因此在不同的建模場(chǎng)景中,應(yīng)該采取不同的路線表征維度。左側(cè)藍(lán)色點(diǎn)串GPS軌跡的原始表示,右側(cè)表示軌跡的瓦片表示。

2. OD觀測(cè)空間下歷史正常軌跡稀疏性

由于我們是在OD的空間約束下進(jìn)行軌跡建模,并且需要觀測(cè)在該空間下歷史用戶軌跡分布特征,如果用戶行程起終點(diǎn)下關(guān)聯(lián)的歷史用戶軌跡數(shù)量過少甚至不存在,那對(duì)于軌跡建模來講將是巨大的挑戰(zhàn)。

3. 檢測(cè)實(shí)時(shí)性

在路線偏移的場(chǎng)景下,不管是路網(wǎng)狀態(tài)異常還是訂單狀態(tài)異常,都要求算法能夠?qū)崟r(shí)、精確、可解釋的計(jì)算結(jié)果并觸達(dá)用戶,因此要求我們的算法要能夠?qū)崟r(shí)地對(duì)端上上報(bào)的軌跡點(diǎn)進(jìn)行狀態(tài)判定。

為了解決異常路線偏移檢測(cè)的問題,考慮到不同的產(chǎn)品及業(yè)務(wù)需求,我們?cè)O(shè)計(jì)并完成了以下兩大類檢測(cè)解決方案,下面進(jìn)行簡(jiǎn)單的介紹。

▍3.2 "少而不同"繞路檢測(cè)

該類場(chǎng)景主要是檢測(cè)單一、少數(shù)繞路訂單的異常狀態(tài),該類訂單在OD約束下,與其他正常相同OD下其他正常訂單軌跡空間分布存在明顯的差異,主要表現(xiàn)為連續(xù)地出現(xiàn)離群軌跡點(diǎn),所以可以將我們的任務(wù)轉(zhuǎn)化為實(shí)時(shí)離群軌跡點(diǎn)檢測(cè),檢測(cè)方法可以由以下部分組成:

  • 路線形狀表達(dá)

軌跡路線形狀表達(dá)的目的主要是壓縮軌跡,同時(shí)保證形狀信息和壓縮率;同時(shí)也要平滑軌跡,去除停留點(diǎn)與噪點(diǎn)。我們采用了Minimum Description Length Partition算法對(duì)軌跡進(jìn)行壓縮表示,該算法通過定義角度距離、垂直距離等,拓展了傳統(tǒng)的Douglas-Peucker算法,無需定義閾值,可以自適應(yīng)增量式劃分和壓縮軌跡。

  • 導(dǎo)航特征表達(dá)

在實(shí)際業(yè)務(wù)場(chǎng)景中,除了軌跡路線形狀之外,我們還可以實(shí)時(shí)獲取到用戶導(dǎo)航-偏航狀態(tài)的特征,通過行駛方向與導(dǎo)航起終點(diǎn)方位關(guān)系,可以判定用戶當(dāng)前是否在朝向終點(diǎn)運(yùn)動(dòng)。紅色線條為道路路線,綠色線條為軌跡路線,β1表示A1A2導(dǎo)航起終點(diǎn)夾角為銳角,朝向相近,即朝向終點(diǎn)運(yùn)動(dòng),β2反之。

  • 稀疏OD軌跡Embedding

    為了克服上文中提到的同OD下歷史正常軌跡稀疏性的問題,我們提出了一種基于地理空間關(guān)系學(xué)習(xí)的軌跡Embedding方案。該方案主要是在訂單起終點(diǎn)的約束下,建模軌跡中途經(jīng)點(diǎn)與起終點(diǎn)之間的關(guān)系,由于不涉及到具體特定軌跡,只是建模起終點(diǎn)與途經(jīng)點(diǎn)關(guān)系,因而在可以在一定程度上解決OD空間下稀疏性的問題。Embedding主要更新學(xué)習(xí)過程如下:

其中,地理特征矩陣更新學(xué)習(xí)的過程為:

S1)將行駛的軌跡T={p1, p2, … , pn}根據(jù)坐標(biāo)映射到對(duì)應(yīng)的路網(wǎng)網(wǎng)格中。軌跡可以表示為T={g1, g2, … , gn}其中g(shù)i為行駛軌跡中坐標(biāo)pi在路網(wǎng)中對(duì)應(yīng)的網(wǎng)格。

S2)使用具有固定窗口大小和固定滑動(dòng)步長(zhǎng)的滑動(dòng)窗口,將軌跡T={g1, g2, … , gn}劃分為若干定長(zhǎng)的子軌跡,如滑動(dòng)窗口大小為10,滑動(dòng)步長(zhǎng)為1,則原始軌跡T可被劃分為子軌跡集合T’ = {Tj | Tj={gj, gj+1, … , gj+9}, 1≤i≤n-9}

S3)假設(shè)路網(wǎng)中有N個(gè)互不相同的路網(wǎng)網(wǎng)格,則對(duì)目標(biāo)區(qū)域的所有路網(wǎng)網(wǎng)格隨機(jī)初始化兩個(gè)N d維特征矩陣,特征矩陣中的每一行為一個(gè)特征向量,分別表示對(duì)應(yīng)網(wǎng)格作為起點(diǎn)和終點(diǎn)時(shí)的特征。將兩個(gè)特征矩陣拼接后可以得到一個(gè)N 2d維的特征矩陣,用于表示對(duì)應(yīng)網(wǎng)格作為軌跡途經(jīng)點(diǎn)(既非起點(diǎn)也非終點(diǎn))時(shí)的特征。

S4)將S2)中得到的每條子軌跡T={g0, g1, … , gn} 根據(jù)軌跡點(diǎn)性質(zhì)轉(zhuǎn)化T={S, M1, … , Mj, D},其中S=g0表示子軌跡起點(diǎn),D=gn表示子軌跡終點(diǎn),M1, … , Mj表示子軌跡途經(jīng)點(diǎn)。

S5)在起終點(diǎn)約束的條件下,最大化途徑點(diǎn)M1, … , Mj出現(xiàn)的平均對(duì)數(shù)概率,即可完成在在地理空間約束下的軌跡建模。根據(jù)軌跡點(diǎn)性質(zhì),分別從不同特征矩陣查找軌跡經(jīng)過的路網(wǎng)網(wǎng)格的性質(zhì)。即從起點(diǎn)特征矩陣中查找起點(diǎn)S的特征向量,為d維向量;從終點(diǎn)矩陣中查找終點(diǎn)D的特征向量,為d維向量;從途徑點(diǎn)矩陣中查找途徑點(diǎn)Mj的特征向量,為2d維向量。拼接起點(diǎn)S和終點(diǎn)D的特征向量和,即可得到2d維的起終點(diǎn)特征向量。

S6)通過反向傳播更新起點(diǎn)、途經(jīng)點(diǎn)和終點(diǎn)的特征矩陣,直到模型收斂。此時(shí)即可得到送駕區(qū)域路網(wǎng)網(wǎng)格在地理空間約束下的特征向量。

  • 實(shí)時(shí)離群點(diǎn)檢測(cè)

為了滿足軌跡實(shí)時(shí)異常檢測(cè)需求,需要算法能夠在系統(tǒng)輸入的一定時(shí)間窗口的軌跡之后,完成路形表達(dá)、導(dǎo)航特征提取、軌跡特征Embedding之后,立即給出在該OD空間約束下,當(dāng)前行程軌跡是否處于偏移狀態(tài)以及該狀態(tài)下基于以上特征的支持度【支持度可以定義為在OD約束下,歷史正常路線途徑該瓦片的訂單數(shù)量 / OD約束下總訂單數(shù)量】,借鑒iBOAT自適應(yīng)窗口檢測(cè)在線檢測(cè)思路,類似的,我們提出了一種基于多特征表征的實(shí)時(shí)路線偏移檢測(cè)框架,具體檢測(cè)過程為:當(dāng)偏航發(fā)生時(shí),在一定時(shí)間窗口,獲取目標(biāo)訂單行程軌跡,對(duì)該行程進(jìn)行路形、導(dǎo)航、軌跡特征的表征與判別。下圖中,圖一藍(lán)色為歷史正常用戶實(shí)際軌跡路線,紅色為目標(biāo)用戶軌跡;圖二為iBOAT自適應(yīng)窗口判別示意圖。

▍3.3 “多而不同”封路檢測(cè)

基于“少而不同”的思路針對(duì)極少數(shù)用戶軌跡偏移的異常檢測(cè)主要是為了解決司乘糾紛、軌跡安全等問題;“多而不同”主要是多數(shù)用戶在同OD空間約束下,出現(xiàn)了群體性的路線偏移,該現(xiàn)象往往意味路網(wǎng)的狀態(tài)發(fā)生了變更而導(dǎo)航依舊按照發(fā)生變更前狀態(tài)規(guī)劃,從而導(dǎo)致用戶的集體被迫繞路。因此針對(duì)路網(wǎng)狀態(tài)異常,以道路封閉為例,我們提出了一種基于 Siamese LSTM (孿生長(zhǎng)短期記憶網(wǎng)絡(luò))與LSPD(缺失路段模式檢測(cè)方法)的軌跡時(shí)空模型來解決路網(wǎng)封閉檢測(cè)問題。相關(guān)工作發(fā)表在GIS領(lǐng)域國(guó)際會(huì)議ACM SIGSPATIAL  2019 (International Workshop on Ride-hailing Algorithms, Applications, and Systems)(SIGSPATIAL 2019 RAAS)該模型主要結(jié)構(gòu)如下:

該模型主要分為兩個(gè)模塊,第一個(gè)算法模塊是基于時(shí)間序列流量信息相似性建模,該模型可以引入經(jīng)典的Siamese LSTM網(wǎng)絡(luò),并融合注意力機(jī)制與自定義損失函數(shù),實(shí)時(shí)刻畫歷史同期流量曲線與當(dāng)前流量曲線的相似性,從而在線檢測(cè)流量異常。由于采取了與歷史同期(例如本周一與上周一)的流量序列建模,因而對(duì)流量自然下降及波動(dòng)具備很強(qiáng)的魯棒性。

基于Siamese LSTM流量異常檢測(cè)可以對(duì)全路網(wǎng)空間的流量異常進(jìn)行實(shí)時(shí)檢測(cè),其檢測(cè)的結(jié)果需要更強(qiáng)的證據(jù)佐證道路異常,因此,我們?cè)O(shè)計(jì)了第二個(gè)算法模塊LSPD, 該算法側(cè)重于通過群體用戶行為的異常判別第一個(gè)算法模塊結(jié)果的可解釋性與概率性,主要思想是統(tǒng)計(jì)同OD下路線模式的分布變更,不同于軌跡異常檢測(cè)算法(iBOAT) 在OD場(chǎng)景下關(guān)注“少而不同“的異常軌跡,我們重點(diǎn)關(guān)注“多而不同“的用戶群體性異常行為,例如某時(shí)間段內(nèi)歷史用戶集中出現(xiàn)了繞路事件,則通過我們的LSPD算法模塊可以精確定位到哪些路段可能出現(xiàn)了道路封閉以及發(fā)生發(fā)生該類事件的置信度有多大。

以北京市某處道路封閉事件為例,該道路在下午17時(shí)左右發(fā)生道路封閉,我們的系統(tǒng)在18時(shí)通過Siamese LSTM深度網(wǎng)絡(luò)檢測(cè)出該道路存在明顯的流量異常,異常置信度為0.99,隨后,該事例被系統(tǒng)流轉(zhuǎn)至LSPD檢測(cè)模塊尋求更多的軌跡證據(jù)佐證該道路的確存在道路異常,在該模塊,我們的算法檢測(cè)到在局部起終點(diǎn)(OD)的作用下,用戶的出行方式已經(jīng)發(fā)生了巨大的變化,之前多數(shù)用戶選擇右側(cè)紅色路線,而當(dāng)前狀態(tài)下,用戶多選擇左側(cè)藍(lán)色路線(紅色路線的支持度從30降低到6,而藍(lán)色路線的支持度則由3上升至43),從而被系統(tǒng)整體判別該道路出現(xiàn)了道路異常,即道路封閉。

4. 總結(jié)

在當(dāng)前的工業(yè)實(shí)踐中,數(shù)據(jù)挖掘也常常和一些熱門詞匯聯(lián)席出現(xiàn),比如人工智能、機(jī)器學(xué)習(xí)、大數(shù)據(jù)、數(shù)據(jù)分析、數(shù)據(jù)科學(xué)等,如下圖所示。

相比于其他概念,數(shù)據(jù)挖掘不強(qiáng)調(diào)應(yīng)用何種手段,更強(qiáng)調(diào)目的:從數(shù)據(jù)中提取信息。在這個(gè)意義上講,數(shù)據(jù)挖掘天然是交叉學(xué)科,需要從業(yè)人員具備統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、大數(shù)據(jù)乃至高并發(fā)后臺(tái)服務(wù)、數(shù)據(jù)可視化等復(fù)合技能。另一方面,目前的人工智能技術(shù)水平僅僅達(dá)到刻畫相關(guān)性的階段,尚不能進(jìn)行通用推理或者知識(shí)學(xué)習(xí),所以需要從業(yè)者對(duì)研究的領(lǐng)域具備一定先驗(yàn)知識(shí),并了解如何利用這些知識(shí)從數(shù)據(jù)中提取有高價(jià)值信息。這兩個(gè)特點(diǎn)決定了領(lǐng)域數(shù)據(jù)挖掘的門檻非常高,這影響了數(shù)據(jù)價(jià)值的快速發(fā)掘和落地。筆者所在團(tuán)隊(duì)承擔(dān)了公司內(nèi)部很多挖掘任務(wù),比如安全駕駛行為檢測(cè)、路網(wǎng)挖掘、交通事件、地理畫像、出行模式分析等等,更多的數(shù)據(jù)挖掘任務(wù)因?yàn)榕牌诤唾Y源限制無法快速支持,而需求方因?yàn)楦呒寄荛T檻無法自行對(duì)數(shù)據(jù)進(jìn)行加工和價(jià)值提取。

我們下一步的目標(biāo)是嘗試將軌跡數(shù)據(jù)挖掘能力中臺(tái)化或者平臺(tái)化,能夠?qū)⑺惴ā⒐こ獭⒋髷?shù)據(jù)、可視化等能力開放出來,大幅降低數(shù)據(jù)挖掘成本,使得數(shù)據(jù)的價(jià)值能被最大化利用。實(shí)際上這一挑戰(zhàn)不是我們團(tuán)隊(duì)或者公司獨(dú)有的,互聯(lián)網(wǎng)公司可能會(huì)存在無法以合適的成本從數(shù)據(jù)中提取價(jià)值的問題,導(dǎo)致數(shù)據(jù)挖掘技術(shù)只在少數(shù)高ROI場(chǎng)景下得到應(yīng)用。即將到來的5G和萬物互聯(lián)時(shí)代,這一問題會(huì)更加嚴(yán)重。歡迎對(duì)此感興趣的同學(xué)加入我們,一起研究和探索如何解決這些挑戰(zhàn)。

 

 

責(zé)任編輯:張燕妮 來源: segmentfault
相關(guān)推薦

2009-01-19 16:44:31

數(shù)據(jù)挖掘沃爾瑪應(yīng)用

2016-05-23 15:42:07

數(shù)據(jù)挖掘

2024-06-04 07:29:13

2017-01-19 14:45:34

數(shù)據(jù)挖掘Google再營(yíng)銷

2009-01-18 15:43:29

數(shù)據(jù)挖掘電子商務(wù)WEB

2015-06-11 10:09:04

大數(shù)據(jù)HBase

2015-08-28 10:05:47

數(shù)據(jù)挖掘

2009-01-20 13:51:16

數(shù)據(jù)挖掘知識(shí)發(fā)現(xiàn)方法

2022-09-01 10:10:27

數(shù)據(jù)編排技術(shù)

2011-04-01 12:19:21

SQL Server商業(yè)智能

2024-09-25 10:10:35

2024-09-29 08:40:34

2017-02-24 19:45:58

2011-03-17 12:33:56

面向?qū)ο髷?shù)據(jù)庫電子商務(wù)

2023-09-18 07:16:53

數(shù)據(jù)庫TDengine

2016-12-01 13:44:19

iosandroid

2020-09-21 09:34:20

大數(shù)據(jù)

2018-05-29 09:38:40

大數(shù)據(jù)金融行業(yè)銀行業(yè)

2018-10-24 14:36:59

2015-07-20 17:00:45

VXLAN云數(shù)據(jù)中心
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

色橹橹欧美在线观看视频高清| 国产成人免费观看| 相泽南亚洲一区二区在线播放| 欧美特黄一级片| 国产视频福利在线| 亚洲三级av| 国产欧美一区二区三区在线看蜜臀| 久久中国妇女中文字幕| 91福利视频网站| 51精品国自产在线| 久久五月天婷婷| 久久黄色免费网站| 国产激情综合| 国产精品国产三级国产普通话99 | 欧美在线看片| 欧美三级一区二区| 日韩精品福利视频| 日本免费在线观看视频| 欧美日韩大片免费观看| 午夜精品久久久久久久久久| 国产高清精品一区| 波多野结衣理论片| 国产精品中文字幕亚洲欧美| 色综合久久88色综合天天免费| 美女亚洲精品| av在线亚洲天堂| 欧美久久九九| 日韩欧美激情在线| 青青在线免费观看| 婷婷久久久久久| 中文一区二区| 亚洲欧美日韩直播| 91蝌蚪视频在线观看| 国产精品久久久久一区二区国产| 国产凹凸在线观看一区二区| 欧美精品www| 亚洲男人在线天堂| 在线能看的av网址| 国产欧美一区二区在线| 国产区一区二区三区| 午夜精品久久久久久久久久久久久蜜桃| 久久精品亚洲成在人线av网址| 五月激情六月综合| 日本一区二区在线视频| 一级日韩一级欧美| 欧美精品国产一区二区| 色777狠狠综合秋免鲁丝| 日本黄色三级网站| 九色porny丨首页入口在线| 久久久久久久av麻豆果冻| 国产精品久久久久久搜索| 少妇高潮在线观看| 欧美日韩黑人| 日韩精品一区二区三区视频在线观看 | 欧美又大粗又爽又黄大片视频| 韩国女同性做爰三级| 国产精品99| 一区二区高清视频在线观看| 欧美日韩亚洲免费| 国产精品一区二区三区在线免费观看 | 欧美特级一级片| 精品国内亚洲2022精品成人| 欧美变态tickling挠脚心| 久久久久久久久久久福利| 丝袜美腿美女被狂躁在线观看| 国产成人免费视频网站| 欧洲成人在线观看| 永久免费看黄网站| 国产精品一线天粉嫩av| 亚洲社区在线观看| 一区二区三区四区影院| www.精品国产| 欧美揉bbbbb揉bbbbb| jizz18女人| 性国裸体高清亚洲| 色婷婷久久综合| 久久久精品麻豆| 变态调教一区二区三区| 国产精品视频观看| 久久视频在线观看中文字幕| 99视频免费看| aaa欧美日韩| 亚洲一区二区三区久久| 三级网站在线播放| 日韩午夜一区| 久久国产精品首页| 亚洲欧美日韩第一页| 免费观看不卡av| 精品成人a区在线观看| 污污的视频免费| 欧美亚洲韩国| 午夜av一区二区三区| 韩国日本在线视频| crdy在线观看欧美| 欧美日韩国产天堂| 欧美成人精品欧美一级乱| 欧洲在线视频| 亚洲美女一区二区三区| 亚洲一区在线免费| gogogo高清在线观看免费完整版| 99久久er热在这里只有精品15| 亚洲最大激情中文字幕| 国产一区二区三区中文字幕| 国产99精品在线观看| 欧洲一区二区在线| 久草在线视频网站| 欧美视频在线一区| 妓院一钑片免看黄大片| 日韩欧美久久| 日韩美女在线视频| 中文字幕第20页| 欧美日韩网站| 国产精品一区二区电影| 中文字幕在线观看国产| 男人的j进女人的j一区| 国产成人免费av电影| 亚洲成人第一网站| 国产精选一区二区三区| 97中文在线观看| 91社区在线观看播放| 国产日本欧洲亚洲| 国产无限制自拍| 黄在线观看免费网站ktv| 精品久久久久久亚洲国产300| 国产精欧美一区二区三区白种人| 国产精品成人**免费视频| 日韩黄色高清视频| 亚洲v国产v欧美v久久久久久| 欧美日韩调教| 亚洲最大av在线| bbbbbbbbbbb在线视频| 狠狠综合久久av一区二区小说| 黄色a级片免费| 成人在线tv视频| 亚洲毛片在线观看| 中文字幕一区二区三区手机版| 亚洲永久字幕| 国产免费一区二区三区在线能观看 | 91麻豆精品国产91久久久资源速度| 国产免费看av| 精品久久国产| 国产97免费视| 国产美女主播在线观看| 成人精品亚洲人成在线| 91精品视频大全| 丰满大乳国产精品| 久久久久久麻豆| 91专区在线观看| 99只有精品| 中文字幕日本精品| 精品一级少妇久久久久久久| 老司机一区二区三区| 国产欧美精品va在线观看| 国产精品影院在线| 在线视频一区二区免费| 51自拍视频在线观看| 日韩在线麻豆| 欧美在线视频一二三| 无码精品黑人一区二区三区| 国产精品情趣视频| 15—17女人毛片| 久久成人福利| 98精品在线视频| 97精品人妻一区二区三区在线| 亚洲国产高清不卡| 国产日本在线播放| 国内精品免费| 久久精品欧美视频| 二区视频在线观看| 国产高清在线观看免费不卡| 日韩精品久久一区二区| 福利一区二区免费视频| 在线中文字幕日韩| av无码精品一区二区三区宅噜噜| 亚洲在线视频免费观看| 中文字幕第3页| 亚洲国产精品91| 国产精品高潮粉嫩av| 神马一区二区三区| 欧美性高跟鞋xxxxhd| 中文字幕乱码在线人视频| 亚洲视频免费| 91精品国产高清久久久久久91裸体 | 粉嫩av一区二区三区天美传媒 | 色无极亚洲影院| 欧美中文在线免费| 素人av在线| 亚洲第一精品夜夜躁人人躁 | 亚洲国产日韩av| 久久久精品高清| 欧美福利视频| 免费中文日韩| 国产精品日本一区二区不卡视频| 欧美极品欧美精品欧美视频 | 亚洲免费一区三区| 日韩暖暖在线视频| 亚洲图区一区| 欧美老女人在线| 秋霞网一区二区三区| 久久狠狠一本精品综合网| 一区二区视频国产| av亚洲一区| 国语对白做受69| 懂色av一区二区三区四区| 日本高清不卡一区| 精国产品一区二区三区a片| 国产日韩欧美精品综合| 欧美牲交a欧美牲交aⅴ免费下载| 欧美日韩在线网站| 国产精品我不卡| 欧美24videosex性欧美| 亚洲图片欧美日产| 中文字幕日韩第一页| 亚洲一二三级电影| 秘密基地免费观看完整版中文| 中国成人一区| 成人午夜电影在线播放| 在线成人视屏| y97精品国产97久久久久久| 亚洲综合五月天婷婷丁香| 综合久久国产九一剧情麻豆| 伊人免费视频二| 欧美福利在线| 一区二区三区国产福利| 国产成人三级| 黑人另类av| 免费成人直播| 日韩在线观看免费| 青青青免费视频在线2| 色av一区二区| 国产精品黄色大片| 亚洲一区二区在线观看视频| 中国毛片直接看| 成人小视频免费在线观看| 免费在线观看污网站| 日韩精品91亚洲二区在线观看| 亚洲免费精品视频| 日本99精品| 91久久精品久久国产性色也91| 91tv亚洲精品香蕉国产一区| 欧美怡春院一区二区三区| 麻豆免费在线| 555www成人网| 英国三级经典在线观看| 国内精品久久久久| 丁香花高清在线观看完整版| 欧美激情视频一区| 精品三级久久久久久久电影聊斋| 欧美日本在线播放| 毛片在线免费播放| 欧美在线观看禁18| 中文字幕无线码一区| 欧美色窝79yyyycom| 中文字幕乱码中文字幕| 欧美日韩国产小视频在线观看| 91极品身材尤物theporn| 在线观看欧美黄色| 一级α片免费看刺激高潮视频| 欧美日韩一本到| 国产精品久久欧美久久一区| 欧美一区午夜视频在线观看| 日本在线观看视频网站| 性做久久久久久免费观看欧美| 精品91久久久| 自拍偷在线精品自拍偷无码专区| 日韩在线不卡av| 亚洲精品成人在线| 欧美激情视频二区| 中文字幕一区二区在线播放| 成人在线观看免费完整| 亚洲午夜久久久久久久久电影院| 日韩网红少妇无码视频香港| 色综合一个色综合亚洲| 中文字幕第31页| 91精品国产乱| 图片区 小说区 区 亚洲五月| 亚洲欧美日韩国产成人| av电影在线观看| 欧美日韩福利电影| 69久久久久| 欧美精品免费看| 国产高清自产拍av在线| 国产精品欧美日韩一区二区| 精品视频国内| 91精品久久久久久久久久| 乡村艳史在线观看| 国产精品亚洲一区二区三区| 一区二区三区国产好| 免费h精品视频在线播放| 久久一区二区三区电影| 日韩久久久久久久| 伊人色**天天综合婷婷| 欧美一级在线看| 9国产精品视频| 啊啊啊国产视频| 国产98色在线|日韩| 久久久久亚洲av成人无码电影| 亚洲欧美综合网| 国产成人精品网| 日韩亚洲电影在线| 国产成人三级一区二区在线观看一 | 九九热精品视频国产| 欧洲av不卡| 99久热re在线精品视频| 视频精品一区二区三区| 欧美精品123| 国一区二区在线观看| 亚洲人辣妹窥探嘘嘘| 99r精品视频| 欧美国产日韩在线观看成人| 在线免费不卡电影| 日韩永久免费视频| 亚洲国产精品人人爽夜夜爽| 少妇高潮久久久| 精品国产美女在线| 超碰aⅴ人人做人人爽欧美| 超碰97在线人人| 99国内精品久久久久久久| 亚洲综合第一| 久久xxxx精品视频| 国产精品亚洲一区二区无码| 国产精品成人免费在线| 色老头一区二区| 精品在线小视频| 激情福利在线| 88xx成人精品| 国产精品22p| 黄色网在线视频| 精品一区二区国语对白| 亚洲av无码久久精品色欲| 国产精品萝li| 在线观看免费中文字幕| 亚洲天堂av高清| 男人皇宫亚洲男人2020| 久久久久九九九| 一本久久综合| 97人妻天天摸天天爽天天| 中文字幕免费观看一区| 成人毛片在线播放| 日韩精品一区二区视频| 欧美巨大丰满猛性社交| 加勒比在线一区二区三区观看| 好吊一区二区三区| 中文字幕一区二区人妻电影丶| 亚洲综合丁香婷婷六月香| 亚洲黄色在线播放| 亚洲无限av看| 日韩制服诱惑| 亚洲一区三区在线观看| 激情综合网最新| 丰满少妇高潮久久三区| 精品国产99国产精品| 精品精品导航| 韩国成人一区| 久久人人精品| 第一页在线视频| 国产午夜久久久久| 精品黑人一区二区三区| 在线观看免费高清视频97| 国内高清免费在线视频| 国产乱码精品一区二区三区不卡| 黄色成人在线网址| 插我舔内射18免费视频| 一本大道久久a久久精二百| 国产黄在线观看免费观看不卡| 国产精品久久97| 天天av综合| 中文字幕永久免费| 精品久久久久久国产91| 精品乱码一区二区三四区视频| 国产精品18久久久久久首页狼| 日韩视频在线观看| 无套白嫩进入乌克兰美女| 午夜精品123| 国产一区二区影视| 成人在线视频网站| 精品高清久久| 久久精品国产99久久99久久久| 亚洲一二三区不卡| 国产露出视频在线观看| 亚洲伊人久久大香线蕉av| 亚洲欧洲另类| 麻豆精品国产传媒| 精品欧美aⅴ在线网站| 午夜在线观看视频| 国产精品露出视频| 日韩专区中文字幕一区二区| 26uuu成人网| 国产丝袜一区二区三区| 亚洲毛片在线免费| 五十路熟女丰满大屁股| 国产亚洲va综合人人澡精品| 国产精品一区二区免费视频| 午夜精品一区二区三区在线视 | 国产有色视频色综合| 日韩av一级电影| 欧美特黄一区二区三区| 4438成人网| 亚洲承认视频| 国产欧美日韩网站|