多系統平臺環境下的運行監控管理
【51CTO.com 綜合報道】日立JP1經多年調研發現,企業要確保系統始終提供高效穩定的服務質量并能應對環境變化,IT規范化、自動化、運行監控三大關鍵因素必不可少。其中,運行監控上的應對體現在根據業務制定需求,全面監控整個IT系統。日立JP1希望通過運行管理產品的導入,使系統監控能夠“看見”整個系統的運行情況,隨時發現故障發生的征兆,同時迅速找出故障所在,預測出系統中可能受影響的區域并采取相應措施。另外,通過運行監控與系統化管理經驗的結合,大幅度提高IT系統的自動化運行效率。
日立JP1系統運行管理軟件中,應對運行監控關鍵因素的是性能管理(JP1/PFM)和綜合管理(JP1/IM)產品模塊。性能管理(JP1/PFM)是在包含了多平臺的分散系統上,通過收集數據庫、應用程度和操作系統等運行狀況的數據,進行統一監控,并提供用于分析的數據的一系列產品。通過使用JP1/PFM,企業可以盡早發現業務系統的問題隱患,并根據輸出的報告進行性能分析,從而建立系統資源的投資計劃。“JP1/PFM給我最大印象就是界面直觀簡單但功能細致入微,非常實用和專業。”日立JP1用戶鄭州商業銀行科技開發部總經理姜濤先生如此評價。
|
| 圖1 |
集中監控管理多平臺分散系統,是JP1/PFM的運行管理基礎,也是其性能優勢之一。JP1/PFM可通過GUI監控各種平臺、應用程度的性能,以監控對象為單位收集、管理性能數據,并使監控程序系統化,進而執行統一管理。譬如,針對Windows 2000、Windows Server 2003、Solaris、AIX、HP-UX、Linux等監控對象,JP1/PFM可收集CPU使用率、內存空間、硬盤使用狀況、各程序系統資源使用情況等性能數據;針對Oracle RDBMS(數據庫),JP1/PFM收集的性能數據包括數據庫使用率、SQl信息、參數信息等;而針對SAP R/3(服務器應用程度),則收集Roll領域使用率、響應時間等數據。JP1/PFM將收集到的性能數據保存到獨有的Store數據庫中,用于分析系統的運行狀況,導入后的數據不受保存期限的限制,可以作為參照數據引用,隨時調用進行對比分析。
在數據收集的基礎上,JP1/PFM能夠有效管理操作系統、應用和服務的運行信息,并對各種服務進行監控。借助JP1/PFM,系統可以靈活運行信息,甚至可以確定在什么時間、從哪臺服務器獲取什么樣的運行狀態數據,以幫助管理員及時收集、存儲系統監控和分析所需的數據,有效管理系統,節約監控網絡、服務器和數據庫的時間。此外,JP1/PFM能夠將系統負荷控制在最小范圍內,包括控制監控對象服務器和數據庫的負荷,控制網絡負荷,以及控制服務器資源的消耗。
多數企業都是在系統問題發生后,進行補救處理,而JP1/PFM能夠將隱患消滅在監控對象進入危險狀態之前。當JP1/PFM預測到系統危險,會發出警報提示,通知管理員;當問題發生時,JP1/PFM會根據已定義的警報,自動向系統管理員發送信息,執行特定命令,使系統因故障而停止的時間控制在最小限度。警報信息工具包括發送電子郵件、SNMP、JP1事件、閃爍警報圖標等。為了確保軟件導入后監控管理的即時執行,JP1/PFM提供了預先定義的被稱為“解決方案組合(Solution Set)”的標準模版,能夠向系統管理員提供報告并顯示格式。這些“解決方案組合”定義了判斷監控對象狀態的條件語句的闕值等,可以根據運行環境的情況進行定制,并在安裝完成后立刻順利開始運行。
|
| 圖2 |
對收集到的性能數據進行分析,同樣是系統性能管理的重要職能。JP1/PFM-Analysis可以多角度對數據進行分析,并實現有效監控:
|
| 圖3 |
通過部署JP1/PFM性能管理產品,鄭州商業銀行以很小的投資解決了龐大繁雜的系統管理問題。“系統‘癥狀’一目了然,系統隱患還未升級成錯誤就被發現了,真正做到了‘防患于未然’。現在,我們不僅可以隨時掌控系統運行狀況,更可以通過報表數據對其進行研究和改善,形成系統的良性循環。”姜濤先生非常肯定JP1/PFM給企業帶來的系統運行管理質量的提升。今年7月,中國上市企業將正式實施《企業內部控制基本規范》(即C-SOX),這意味著企業需要具備更完善有效的內部控制體系,而系統運行監控是內部控制的重要途徑。日立JP1一直致力于營造基于企業實際需求,能夠推動企業業務長效發展的IT系統,幫助企業實現透明化管理。伴隨著眾多中國合作企業快速成長的足跡,日立JP1在中國市場的成長步伐也越發堅定有力。
























