為什么您企業(yè)新建的數(shù)據(jù)中心不奏效——狀態(tài)調(diào)試不對
數(shù)據(jù)中心的資本項目往往會發(fā)生變數(shù),而相關(guān)的管理執(zhí)行人員又減少了唯一可以阻止這些變數(shù)的進(jìn)程。
對于正在進(jìn)行數(shù)據(jù)中心資本投資項目的IT企業(yè)組織而言,不可否認(rèn),其風(fēng)險是很高的。構(gòu)建新的數(shù)據(jù)中心無疑是一項巨大的投資,但其也可以實現(xiàn)或阻礙企業(yè)組織的IT戰(zhàn)略和能力,從而影響企業(yè)組織為未來多年的整體業(yè)務(wù)績效。
隨著越來越多的企業(yè)組織依賴于主機(jī)托管數(shù)據(jù)中心供應(yīng)商,因而確保這些項目的設(shè)計和建設(shè)能夠滿足您企業(yè)的業(yè)務(wù)需求無疑也是至關(guān)重要的。
對于任何數(shù)據(jù)中心工程項目而言,通常都會牽扯到多家供應(yīng)商、分包商,并會涉及到超過50多個不同的學(xué)科領(lǐng)域,包括諸如數(shù)據(jù)中心的架構(gòu)、電氣設(shè)備、HVAC、管道給排水、燃料泵、網(wǎng)絡(luò)布線等等——故而在建造過程中,如果沒有發(fā)生任何誤差或在施工過程中不存在任何偷工減料,無疑將是相當(dāng)棒的。
而在施工監(jiān)督、規(guī)劃和預(yù)算方面的失效則意味著昂貴的新數(shù)據(jù)中心設(shè)施將無法滿足業(yè)主的要求,最終結(jié)果或?qū)?dǎo)致新建成的數(shù)據(jù)中心設(shè)施性能不佳或靈活性有限。
而對于這些問題的解決可能會延遲數(shù)據(jù)中心建設(shè)項目的工期,而且通常需要花費大量的額外支出。在某些情況下,某些問題仍然將在數(shù)據(jù)中心的使用壽命范圍內(nèi)長期妨礙其正常的健康運轉(zhuǎn),并可能最終需要提前更換設(shè)備。
即使該設(shè)施在其預(yù)期壽命內(nèi)仍然可以繼續(xù)運行,但其運行成本則可能會超出預(yù)期,使得數(shù)據(jù)中心蒙受更多的停機(jī)中斷事故,并且使得數(shù)據(jù)中心業(yè)主不得不引入新的產(chǎn)品和服務(wù)。
鑒于企業(yè)組織在IT基礎(chǔ)設(shè)施項目上投入了大量資金,并且考慮到現(xiàn)如今的整個數(shù)據(jù)中心行業(yè)的成熟度,您可能會認(rèn)為:出現(xiàn)資本項目錯誤的狀況是極為罕見的。
但事實上:您錯了!
數(shù)據(jù)中心項目不斷失敗
諸如Uptime Institute等等這樣的權(quán)威機(jī)構(gòu)往往會對數(shù)據(jù)中心資本項目進(jìn)行評估,以確保在整個數(shù)據(jù)中心的設(shè)計、建造和運營過程中,數(shù)據(jù)中心的業(yè)務(wù)需求和目標(biāo)能夠真正得以實現(xiàn)。
通常,技術(shù)人員在所謂的調(diào)試階段(大多數(shù)IT資本項目出現(xiàn)失敗的核心)之后,會立即進(jìn)入新的數(shù)據(jù)中心站點。
非技術(shù)項目業(yè)主可能會認(rèn)為調(diào)試是一個神秘的,過于工程設(shè)計化的過程,他們可以減少或縮短這一過程,以滿足其他業(yè)務(wù)壓力。但他們這樣做其實是有危險的,因為調(diào)試是決定一個項目成功的最重要的階段。
調(diào)試:
- 驗證設(shè)備和系統(tǒng)是否是按照工程師的設(shè)計進(jìn)行操作運營的
- 為設(shè)施在其整個生命周期內(nèi)應(yīng)如何運行提供了一個基準(zhǔn)
- 為操作運營人員熟悉系統(tǒng)的操作、測試和驗證操作程序,而不會危及關(guān)鍵IT負(fù)載提供***的機(jī)會。
在調(diào)試完成后,該數(shù)據(jù)中心站點應(yīng)該為上線做好準(zhǔn)備了。
然而,在***推出的約200份層級認(rèn)證中,幾乎每份報告都在不同程度上揭示了在層級認(rèn)證過程中所發(fā)現(xiàn)的數(shù)據(jù)中心基礎(chǔ)設(shè)施的一些設(shè)計缺陷,設(shè)備故障或意外問題。事實上,超過70%的數(shù)據(jù)中心建造項目在***輪示范期間未通過層級認(rèn)證評估,需要數(shù)據(jù)中心業(yè)主投入更多時間和資源來解決這些問題。
2016年,在美洲的一個數(shù)據(jù)中心資本項目的層級認(rèn)證期間,其備用電力系統(tǒng)在模擬公用電力公司供電中斷期間出現(xiàn)故障失敗。這是一個預(yù)期的設(shè)計條件——可以說是一處新建數(shù)據(jù)中心最基本的功能。故障發(fā)生的根本原因是緣于針對設(shè)計到備用電力系統(tǒng)中的某個“功能特征”,數(shù)據(jù)中心的所有者并沒有針對該“功能特征”接受培訓(xùn),不具備適當(dāng)?shù)闹R,并且沒有被通知該“功能特征”的存在,從而破壞了數(shù)據(jù)中心的設(shè)計初衷目的。
而在2016年的歐洲的一個層級認(rèn)證項目期間,Uptime Institute發(fā)現(xiàn),數(shù)據(jù)中心對生命安全構(gòu)成了威脅。對電力系統(tǒng)的服務(wù)工作需要在400伏連接放置一個螺絲刀。其他被發(fā)現(xiàn)的故障,歸因于糟糕的保險絲額定值和樓宇監(jiān)控和自動化系統(tǒng)的錯誤。這三個問題中的任何一個都會導(dǎo)致新數(shù)據(jù)中心的服務(wù)中斷。
Uptime Institute的層級標(biāo)準(zhǔn)高級副總裁克里斯·布朗解釋道:“許多數(shù)據(jù)中心業(yè)主依靠層級認(rèn)證作為調(diào)試活動。在我們進(jìn)行認(rèn)證之前,數(shù)據(jù)中心業(yè)主僅僅只進(jìn)行最小的測試,并指望我們能夠為他們調(diào)試該數(shù)據(jù)中心站點,而這一工作并不是層級認(rèn)證所打算做的。”
重點需要注意的是,Uptime Institute的評估是數(shù)據(jù)中心資本項目的***一步,緊接著的便是新數(shù)據(jù)中心的投入運營使用了。所有的數(shù)據(jù)中心資本項目的利益相關(guān)者在評估開始之前就已經(jīng)簽署數(shù)據(jù)中心了。
那么,為什么在調(diào)試階段沒有發(fā)現(xiàn)這些問題呢?
調(diào)試狀態(tài)的問題
調(diào)試活動代表了驗證數(shù)據(jù)中心業(yè)主是否具備嚴(yán)格測試數(shù)據(jù)中心的關(guān)鍵基礎(chǔ)設(shè)施的能力的一個獨特的機(jī)會。但是,這個過程常常被縮短。
Uptime Institute的顧問將負(fù)責(zé)為數(shù)據(jù)中心業(yè)主和項目管理團(tuán)隊調(diào)試故障,但不是調(diào)試代理。
Uptime Institute的高級顧問Ryan Orr表示說:“數(shù)據(jù)中心的業(yè)主對他們的調(diào)試代理所提出的保持低成本和維護(hù)計劃的要求,成為了調(diào)試代理們的一大束縛。”
延遲新建數(shù)據(jù)中心的投產(chǎn)運營,不管其業(yè)主是企業(yè)、托管服務(wù)商還是大規(guī)模躉售商,都不是大多數(shù)企業(yè)組織的選擇。因此,如果在數(shù)據(jù)中心交接日期之前沒有完成調(diào)試,IT就開始正式的遷入的話,那么當(dāng)IT開始遷入時,在許多情況下,可能會使調(diào)試活動難以正常完成。
“調(diào)試工作應(yīng)該始終總是***的一項工作。”Orr說。 “所以,如果有項目延遲的可能,其實任何一個項目都會有這種可能性,那么調(diào)試過程總是是被擠壓犧牲掉了?;蛘呷绻椖砍^了預(yù)算,調(diào)試過程也會被擠壓犧牲掉。一般會將大約需要兩個星期的調(diào)試時間安排被擠壓到僅僅只有三四天,而調(diào)試代理人必須盡其所能地做到***。”
Orr指出了當(dāng)前調(diào)試狀態(tài)所存在的其他幾個問題:
- 太多的企業(yè)組織對假設(shè)和代表性的測試很滿意。例如,一家數(shù)據(jù)中心業(yè)主可以執(zhí)行調(diào)試項目的***階段,但是由于系統(tǒng)的共享,并且數(shù)據(jù)中心業(yè)主不想將實時的IT負(fù)載置于共享基礎(chǔ)設(shè)施的風(fēng)險測試中,因此在后續(xù)階段縮短了調(diào)試時間。
- 承包商和調(diào)試代理之間的不當(dāng)關(guān)系。數(shù)據(jù)中心業(yè)主應(yīng)直接聘請調(diào)試代理。然而,這種情況發(fā)生得似乎越來越少,并引發(fā)了對利益沖突的嚴(yán)重關(guān)切。
- 許多數(shù)據(jù)中心業(yè)主認(rèn)為他們并不需要嚴(yán)格的調(diào)試,因為他們可以依賴基礎(chǔ)設(shè)施的冗余。然而有時候,有冗余固然是一回事,但數(shù)據(jù)中心業(yè)主對于其冗余的具體狀況并未有清晰的了解,除非其經(jīng)過了恰當(dāng)?shù)臏y試。
如何恰當(dāng)?shù)倪M(jìn)行調(diào)試
一套精心策劃和執(zhí)行的調(diào)試程序?qū)⒂兄谠谛陆〝?shù)據(jù)中心建成交付之前很好的驗證該數(shù)據(jù)中心資本投資項目。其也將使得數(shù)據(jù)中心的運營團(tuán)隊能夠處于一個更好的位置在該數(shù)據(jù)中心剩下的使用壽命范圍期限內(nèi)來負(fù)責(zé)管理和運營數(shù)據(jù)中心的關(guān)鍵基礎(chǔ)設(shè)施,并最終確保該數(shù)據(jù)中心設(shè)施實現(xiàn)其全部潛力。在數(shù)據(jù)中心調(diào)試的嚴(yán)格性方面經(jīng)驗不足的建筑施工團(tuán)隊經(jīng)常會低估了調(diào)試所需的時間或?qū)⒄{(diào)試期視為數(shù)據(jù)中心建成完工交付訪問工作延遲的一種緩沖。由于上述兩個原因,數(shù)據(jù)中心業(yè)主或業(yè)主代表應(yīng)注意安排好足夠的時間進(jìn)行調(diào)試,并確保承包商在施工期限范圍內(nèi)的建成交付。建議在制定數(shù)據(jù)中心項目進(jìn)度時,就聘請調(diào)試代理和總承包商,并將他們作為合作伙伴。
此外,數(shù)據(jù)中心資本項目包括對在關(guān)鍵任務(wù)環(huán)境中缺乏經(jīng)驗的團(tuán)隊可能不熟悉的要求;這些要求往往對預(yù)算有影響。
例如,數(shù)據(jù)中心業(yè)主和業(yè)主代表必須仔細(xì)檢查施工投標(biāo),以確保其資金和時間的充足:
- 關(guān)鍵設(shè)備的現(xiàn)場測試
- 借助供應(yīng)商的支持?jǐn)U展4級和5級調(diào)試
- 負(fù)載管理團(tuán)隊在臨界環(huán)境中模擬全部IT負(fù)載
- 用于測試和驗證發(fā)動機(jī)發(fā)電機(jī)系統(tǒng)的柴油燃料
由于經(jīng)驗豐富的團(tuán)隊了解數(shù)據(jù)中心特定調(diào)試的重要性,調(diào)試代理將能夠在調(diào)試過程的早期更有效地工作,進(jìn)而更好的過渡到操作設(shè)置階段。
此外,從項目施工開始到調(diào)試再到建成交付,運營應(yīng)該是數(shù)據(jù)中心項目設(shè)計和施工團(tuán)隊的一部分。包括將操作運營納入到變更管理的范圍讓數(shù)據(jù)中心業(yè)主有機(jī)會在整個企業(yè)范圍內(nèi)共享和學(xué)習(xí)關(guān)于數(shù)據(jù)中心將如何運行的關(guān)鍵信息,包括設(shè)定點,設(shè)備輪換,變更管理,培訓(xùn)和備用庫存。
數(shù)據(jù)中心的資本項目面臨著復(fù)雜的挑戰(zhàn),涉及到多個利益相關(guān)方和承包商,以及需要將跨多個學(xué)科領(lǐng)域的知識匯聚整合在一起。為了確保數(shù)據(jù)中心基礎(chǔ)設(shè)施的投資滿足企業(yè)組織的業(yè)務(wù)需求,項目負(fù)責(zé)人需要選擇合適的合作伙伴,授權(quán)合格的所有者代表,并留出足夠的時間進(jìn)行嚴(yán)格的調(diào)試和第三方認(rèn)證。


























