運維:數據中心防地震概要
不同于季節性的諸如“龍卷風”之類的災害,地震是沒有季節性的隨時可能發生。當涉及到在多地震的國家建立數據中心,我們必須時刻提醒自己兩件事情。
通過一個標準的聯邦緊急事務管理署的報告顯示,美國38個州均有中度地震危險性,60%的美國人口居住在地震風險為中度到高度的地區。當涉及到在多地震的國家建立數據中心,我們必須時刻提醒自己兩件事情:
(1)該數據中心選址是否會受到地震影響
(2)地震可能明天就會發生
圖1:美國地震風險地圖
地震會在不發出任何警告的情況下使得數據中心運行失效,破壞數據中心的建筑及其里面的設備,甚至摧毀數據中心的整個線路。地震最可能的帶來的數據中心運行失敗是緣于地震破壞了數據中心安裝的設備和建筑元素,如地板和天花板。
設備風險
即使是滿足了當前設計建造規格的現代建筑,受到地震影響而導致一些設備無法正常運轉也是常見。在大多數情況下,讓建筑更具彈性,可以相當容易并相對便宜的減輕地震所帶來的約束和影響。
圖2:被毀的計算機和通信機架
比設施受損更厲害的社會影響
即使建筑物和設備抗震,其他相關設備線路線運行失敗也是常見的。例如,許多關鍵設施依托暖通空調系統,采用蒸發冷卻,利用社區供水。如果該供應中斷,即使設備未收到損壞,也可能導致數天或數周不起作用。同樣,對于商業方面也是一樣的:大地震可能造成大面積地區臨時停電,并可能導致因強烈震動帶來的長期中斷。例如,在南加利福尼亞的一次大地震中,大多數客戶預計將斷電超過一周和受損最嚴重的地區供水中斷可能長達幾天或幾個星期。
設施備份可以降低因地震帶來的中斷操作的幾率。但如果備份是位于靠近數據中心主站點的位置,其也可能因為同一地震而不起作用。兩處越是靠近,就越有可能會因為同一原因而運行失效:他們更可能都受到強烈動搖;或兩處的線路都可能受損;或同時發生火災都需要被疏散。在設施備份的接近程度和風險之間明顯需要進行權衡。更近的備份選址可以降低后勤備份成本,但這也意味著更大的共因失效的可能性。取決于兩處數據中心的網站選址,“接近程度”可能為數百英里或更多。
圖3:一次加利福尼亞地震強度分析
運用風險分析
其他造成運行故障的原因可以預見并進行補救。我們甚至可以進行工程風險問題分析。專家可以計算每次地震可能影響設施運行失敗發生的概率,以及地震導致的設備無法正常運轉的特定時長。同樣的計算可以進行假設進行某些修正,如錨設備,增加應急發電機或現場水供應等等。通過估計和假設相關風險,可以更好地做出明智的決策,幫助進行有關的成本和效益的修復。并根據這些問題制定應急計劃。
在加州的一個公用事業機構,其管理部門委托研究在一次地震中失去其所有數據中心的可能性。他們了解到,他們的大部分風險來自地震設備限制不足和地板。過了一段時間,他們修復了一些最危險的元素,并通過針對尚未解決的項目制定工作計劃。修復決定是基于:
(1)臨界性的風險因素
(2)修理的復雜性和費用
(3)建筑物或設備的預計使用壽命,例如,定于明年報廢的則可能不會進行維修,管理可能會帶來失敗的風險
總之,一旦計算出哪種方案更便宜:地震前的修補程序或震后功能損失。通過計算其地震風險,企業可以判斷哪些故障是最有可能的,哪些是***成本效益的解決方案。然后,他們可以修復,并制定應急計劃,以解決剩余的風險。底線是,如果您正在做的業務處在多地震的地區,務必要有地震風險管理知道自己的地震風險。





















