實時分析面臨的12道坎
譯文【51CTO.com快譯】“實時”分析對你和你公司來說意味著什么?
多年來,業務用戶一直要求IT部門提供實時分析功能,可是并非提出要求的每個用戶都果真需要,有的甚至不知道實時分析意味著什么。改用實時分析的高昂成本確實有必要嗎?雖然內存、存儲和帶寬的價格都不斷下降,但是技術整合問題、流程問題和文化問題都需要考慮。
更讓人一頭霧水的是,“實時”方面缺乏標準化定義。“實時”可能指亞秒,也可能指24小時以上的一段時間,這取決于你問的是誰。
像內存計算、Hadoop和Spark這些技術創新都旨在滿足對速度永無止境的要求。可是,許多老大難問題讓公司無法像業務領導人希望的那樣迅速前進。
格雷厄姆·克拉克(Graham Clark)是全球IT解決方案服務提供商NIIT Technologies的數字化服務主管,他在接受采訪時說:“IT部門常常沒有部署用來收集、管理和響應實時數據的平臺。這意味著試圖做出實時[動作]的任何做法都是有缺陷的,甚至是危險的。此外,創建和使用實時分析平臺需要實時的業務理念,這種理念需要滲透到整個企業。”
杰夫·維斯(Jeff Veis)是惠普企業(HPE)旗下惠普企業軟件部門主管大數據平臺營銷的副總裁,他在接受采訪時表示,公司應考慮使用場合作為所有項目的目標,而不是專注于實時分析。“畢竟,它在很大程度上取決于你需要答案有多快,如果業務部門能等待這種洞察力的話,要付出什么樣的代價。”
越來越多的公司在考慮不實施實時分析的成本。如今,響應時間被認為是一種競爭武器;一些觀察人士認為,由于物聯網設備數量激增,這個趨勢會變得更加明顯。然而,加快業務流程帶來了風險,我們考慮潛在好處時也要權衡這些風險。
NYC Data Science Academy的創始人兼***技術官薇薇安·張(Vivian Zhang)在接受采訪時說:“人們可能會走極端,要求實時收集和使用所有的可用數據,但并非所有數據都同等重要。一些數據很重要,一些數據不重要。如果你把太多的干擾或無關信息放入到數據管道,它可能毫無幫助,可能會對公司里面發生的一切產生錯覺。”
簡而言之,別低估了做好實時分析所需要的前提,因為這個過程中許多方面可能會出錯。下面是成功道路上面臨的幾個最常見的障礙。
1. 沒人知道實時的真正含義。
廠商們吹噓實時分析軟件有多好,沒有種種的IT頭痛問題和策略,結果業務主管信以為真。實時分析似乎很簡單。無論誰購買和實施實時分析功能,明白用戶對于實時的認識很明智,因為他們的定義有可能相差懸殊。
NIIT的格雷厄姆·克拉克說:“實時意味著即時,但我們認為實時是盡快。最重要的是,它是客戶需要的那種實時。一家金融服務交易公司可能迷戀于微秒和納秒級響應,尋找廉價機票的顧客可能有兩個月的窗口期。從客戶需求開始入手,再作相應打算。”
2. 業務和IT有分歧。
集中式IT常常成為阻礙進步的瓶頸。同時,影子IT現象引起了碎片化,影子IT是指業務部門不有勞IT部門,就能夠自行做出軟件采購方面的一些決策。因而帶來的問題解決起來可能難度大、成本高、耗時久,牽涉面大。
大數據分析平臺廠商Datameer的市場戰略和情報部門高級主管安德魯·布魯斯特(Andrew Brust)在接受采訪時說:“面臨一道微妙平衡的難題,可能很難解決這個問題。業務部門需要自主權,以便能完成工作,而這種自主權惠及IT部門,因為減少了積壓的工作量。”
“但IT部門必須參與其中,能夠了解和監控業務部門所做的工作,并確認數據和分析的有效性。公司往往發現自己沒有做好這種平衡,不是業務部門的做法不受約束,就是IT部門成為阻礙進步的一大瓶頸。”
3. 事后才想到數據治理。
在合理的治理控制措施沒到位的情況下移動數據會讓貴企業面臨不必要的風險。影子IT常常是罪魁禍首。
商業智能和分析軟件廠商TARGIT的***技術官烏爾里克·佩德森(Ulrik Pedersen)在接受采訪時說:“與任何數據治理策略一樣,數據在進入到整個商業智能實踐之前,必須加以測試和驗證。”
“就實時數據而言,這很難做到,因為在數據送到用戶之前沒時間來清理數據。這就是為什么編寫能夠處理諸多數據問題的查詢至關重要,比如缺失值、缺失記錄、其他數據錄入錯誤,為什么編寫足夠智能化、可處理異常情況的計算方法至關重要。”
4. 迅速獲得洞察力后,迅速行動沒跟上。
你認為需要實時數據。但貴企業到底多久之后才根據提供的洞察力采取行動?當然,一些實時系統包括自動化決策機制。但是在決策支持場景下,人類應對實時信息的能力表明,真正的實時功能并不是那么實用。
數字化體驗公司76Design的總裁馬塞洛·伯茲斯泰恩(Marcelo Burzstein)說:“在我看來,這酷似‘皇帝的新裝’。大多數時候似乎了解情況,而不是響應實際要求。實際上,我發現人們越是了解實時分析和預測方法,比如線性回歸及其他機器學習算法,就越認識到實時分析可能并不是最適合其使用場合的模式。”
5. 技術和文化沒有齊頭并進。
技術創新的步伐總是比企業文化來得快。現有的基礎設施和需要快速移動有時不一致,不是減慢了數據流動,就是帶來了將來會出現的棘手問題。
分析軟件廠商LatentView Analytics的創新和技術主管拉梅什·哈里哈蘭(Ramesh Hariharan)在接受采訪時說:“IT部門已在傳統的數據倉庫和商業智能系統方面投入了巨資,這些系統并不總是支持實時使用場合。另一個原因是用來交付這些功能的流程。企業更關注敏捷性,可能會犧牲擴展性和企業層面的其他考慮因素。”
6. 價值主張轉變。
移動和物聯網需要更快的響應時間,這取決于業務場景。比如說,物聯網分析涉及邊緣的自動化決策,以便降低成本、縮短響應時間。
內存計算平臺廠商ScaleOut軟件公司的***執行官兼創始人威廉·貝恩(Willian Bain)在接受采訪時說:“獲取實時分析的價值需要IT和業務部門的采購員重新考慮分析技術如何整合到關鍵任務型系統。不是將這項技術局限于數據倉庫,作為獨立的實體加以管理,現在它可以直接整合到關鍵任務型系統,比如生產線、物聯網遙測路徑和電子商務網站。”
7. 短視策略。
實時分析僅僅是另一個IT項目,還是說它是一項重要的企業能力?從長遠來看,把它視作需要處理的另一個項目危害很大。不要一開始就搞成本高昂的大項目,需要兩三年時間來實施。需求會不斷變化。
NIIT Technologies的格雷厄姆·克拉克說:“運營實時分析驅動的商業模式,以提供實時預測和實時方案,這是一種全新的思路。普遍的觀念是,可以通過一個項目獲得實時分析的結果,而我們的經驗表明,成功的實時分析是個初始項目,一套長期永遠優化的流程需要跟上。”
8. 高層管理班子沒搞懂。
高層管理班子的任務就是,明白解決了哪些具體的問題,在獲得哪些具體的業務機會,以及那些項目的可量化結果。遺憾的是,高層管理班子常常對于需要什么來實現實時分析抱有不切實際的期望。
LatentView Analytics的拉梅什·哈里哈蘭在接受采訪時說: “高層管理班子應該明白,實時分析不是一蹴而就的,而是建立在整個企業投入于良好的數據基礎設施上。實時分析建立在實時數據收集和數據移動(相當于ETL)的基礎上。手頭有沒有技術通常不是障礙。看待和使用技術的方式才是真正的障礙。”
9. 技術復雜性延長了響應時間。
提供實時信息面臨許多障礙。內存技術廠商在解決響應時間。經過改進的API有助于處理集成問題。 Hadoop和云在解決容量問題。這些是最適合實時分析使用場合的選擇嗎?
惠普企業的杰夫·維斯說:“業務用戶對于實時分析可能抱有的***的不切實際的期望就是,規模以及實時系統的開放功能。由于實時分析必須按準確的時間間隔來執行,為系統引入新的數據源、更多數據或者新的分析工具都會干擾這種時序。公司別指望實時分析有***的規模,也別指望它可以支持***的用戶或***的數據量。”
10.價值沒有得到理解。
任何技術項目要是沒有與某種投資回報率(成本/效益分析)和度量指標聯系起來,注定要失敗。說到實時分析,IT部門往往關注成本,而業務部門往往關注機會。常常忽視了機會成本,即不采取行動的成本。
Datameer的安德魯·布魯斯特說:“高層管理班子應明白,如果等待響應業務現象時間較長,會蒙受多大的損失。對場景進行一番分析,看看更早行動會不會給賬本底線帶來重大的積極影響。如果響應過快有風險,那些同樣應考慮在內。這有助于設定期望和需求,切實地了解項目預算和超支容許范圍。”
11.高層管理班子錯失機會。
實時分析有助于帶來新的商業模式。公司和整個行業正受到創新者的顛覆,他們在使用包括實時分析在內的功能,改變傳統行業的規則。
企業商業智能軟件公司Information Builders的CIO雷多·科托洛夫(Rado Kotorov)說:“許多高層管理人員錯過了Uber革命,這就是為什么他們沒有辦法從概念上思考實時設計支持要求。他們要考慮哪些種類的實時決策可以帶來更多業務。”
12. 明明及時可以,非要實時。
篩查實時系統請求時,IT部門不得不考慮業務部門及客戶的實際時間要求、實施成本和投資回報率。如果實時顯然很重要,比如說可能會瞬間損失數百萬美元或性命,那么決定很顯然。而在不太重要的情況下,要不要實時大有爭論的余地。
惠普企業的維斯說:“決定改用實時分析的關鍵完全取決于業務使用場合。”比如說,如果公司想要一個開放的系統,一個項目能承受不太精確的服務級別,“一種不同的‘及時’分析系統反而比實時分析系統來得更靈活、更省錢。”
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】



























