機房監控

機房監控

機房監控主要是針對機房所有的設備及環境進行集中監控和管理的,其監控對象構成機房的各個子系統:動力系統、環境系統、消防系統、保全系統、網路系統等。機房監控系統基於網路綜合布線系統,採用集散監控,在機房監視室放置監控主機,運行監控軟體,以統一的界面對各個子系統集中監控。機房監控系統實時監視各系統設備的運行狀態及工作參數,發現部件故障或參數異常,即時採取多媒體動畫、語音、電話、短訊息等多種報警方式,記錄歷史數據和報警事件,提供智慧型專家診斷建議和遠程監控管理功能以及WEB瀏覽等。

基本介紹

  • 中文名:模組化雲架構集群式機房監控
  • 外文名:Modularized&environment Monitoring system of Data Center
  • 對象:針對機房所有的設備
  • 釋義:進行集中監控和管理的
  • 包括:動力系統、環境系統、消防系統
背景和需求,解決方案,動力系統,供配電,柴油發電機組,UPS,直流電源系統,環境系統,空調設備監控,溫濕度監控,圖像視頻監控,漏水監測系統,安防系統,智慧型門禁管理,消防系統監控,防雷系統,網路設備監控,實現的功能,套用範圍,處理措施,新概念,

背景和需求

隨著信息網路技術的不斷發展,各類規模大小不等,設備種類、數量不同的網路設備機房廣泛分布於用戶各分支機構所在地域,由於欠缺與運行網路的規模體系相對稱的運維系統,數量眾多的無人值守機房的物理運行環境狀況、動力配電狀況、設備運行狀況、人員活動狀況以及消防狀況的變化包括可能出現的危急狀況,均無法得到及時的發現和處理,也就很難被有效預見、防範和避免。因此,一套完善的機房監控系統 對於機房環境監控非常重要。可以採用DTP-RE短息報警模組,可以用操作員的手機編髮中文簡訊對模組的管理員、報警簡訊內容、接警手機或小靈通電話號碼進行遠程設定。

解決方案

機房動力環境集中監控系統,傳統的維護模式是以人為基礎,依靠人工輪流值班,人工巡迴查看等手段維護設備存在的弊端,效率低下,不利於人才資源的充分利用。而且缺乏科學性,以前的重大事故有許多是由人為因素造成的,人工維護管理缺乏完整的管理系統,不利於運營企業科學管理的形式。 機機房集中監控管理系統帶來了相當多的好處,其一,節省人力資源,大大緩解了人員緊張的情況,為機房維護改革提供了有力支撐。其二,提高了維護質量,機房維護人員的素質及設備運行環境質量提高,加快故障處理速度,現場告警能在極短的時間內反映到監控中心,為維護班組趕到現場搶得第一時間,為事故後的故障分析提供了手段,避免重大事故的發生,為客觀公正地考察維護人員提供了手段,大大節約了運行維修成本,創造了直接和間接的經濟效益,並最終實現管理的科學化。
機房監控 監控對象有:
動力設備:高,低壓配電屏,整流設備,開關電源,UPS,油機,蓄電池組等
空調機:智慧型空調機,非智慧型空調要,空調新風機等
環境:溫度,濕度,漏水等
圖像:圖像和燈光控制等
消防:煙霧,控制器等
安防:門禁,玻璃破碎,紅外探測等。
適應行業有: 銀行,稅務,政府,海關,廣電,通信,電力,水利,工廠,學校等。。。

動力系統

供配電

機房監控系統監測一級、二級交流配電櫃的主迴路和各分迴路的各種參數。如電壓、電流、頻率、有功功率、功率因數、無功功率、視在功率等;監視各級開關的開關狀態。

柴油發電機組

機房監控系統監測發電機組輸出電壓、電流、頻率(轉速)及水溫、油位、油壓等參數;發電機組運行狀態、燃油閥開關狀態等各種狀態的實時記錄和報警處理;控制發電機組的啟停。

UPS

在UPS(不間斷電源)供應商提供UPS通訊協定的情況下,機房監控系統可以監測協定提供的所有參數和狀態。參數包括輸入輸出電壓、電流、頻率、功率、蓄電池組的電壓、後備時間、溫度等;狀態包括整流器、逆變器、電池、旁路、負載等部件的狀態;顯示和記錄各種參數的變化曲線,並對各種報警狀態進行記錄和報警處理。

直流電源系統

機房監控系統監測輸入市電的狀態,電池電壓及其狀態,顯示和記錄電池電壓、蓄電池溫度的變化曲線,並對各種報警狀態進行實時的記錄和報警處理。

環境系統

空調設備監控

①機房專用精密空調:為智慧型設備,只要具備智慧型接口,就可以全面監控空調的運行參數。根據精密空調供應商提供的通訊協定和遠程監控板,實時監測精密空調的迴風溫度、迴風濕度、冷凍水進出溫度、流量、冷卻水進出溫度及冷凍機、冷凍水泵、冷卻水泵工作電流等參數;監測工作狀態包括壓縮機狀態、風機狀態、加熱器狀態、抽濕器狀態(水冷式空調還可監測到冷卻水塔的補水池液面狀態、冷卻水塔風扇狀態、冷卻水閥門狀態等)等各種工作狀態;顯示和記錄各種參數變化曲線,並對各種報警狀態進行實時的記錄和報警處理。控制空調的啟停、調節溫度和濕度。可通過系統直接設定空調機的各種參數。
②普通空調:通過改裝空調電路,或者利用空調紅外控制器,對其市電狀態、風機狀態、壓縮機狀態以及報警信息處理,根據溫度變化控制空調啟停。

溫濕度監控

通過採集溫濕度感測器所監測的溫度和濕度數據,機房監控系統以直觀的畫面實時記錄和顯示機房各區域的溫濕度數據及變化曲線,以及越界報警信息處理。

圖像視頻監控

圖像監控系統採用視頻組態的概念,將各通道的圖像以控制項組態的方式隨意插入某個界面,對於大型的監控系統而言,以電子地圖的方式來集中管理各個場地的數據和圖像的界面,十分方便。由於將機房監控系統和閉路監控合二為一,因而可以隨意實現動力環境與圖像的聯動控制,一旦有異常事件發生,機房監控系統自動彈出現場圖像畫面,即時錄像並作報警提示和處理。

漏水監測系統

機房漏水檢測是對機房空調或者窗戶等處可能漏水的地方進行監測,它通過採集測漏主機的報警信號監測任何漏水探頭上的漏水情況,一旦發生報警,機房監控系統立即機房切斷上水支管和上水總管的上水電磁閥,徹底封閉水路,斷絕繼續泄水發生,並可以定位檢測具體的漏水系統,同時將報警信息通過簡訊平台傳送到相關管理人員,且在現場有聲光報警產生。

安防系統

智慧型門禁管理

門禁控制器、門禁卡、讀卡器、電控鎖、網路擴展器、門禁管理軟體、管理計算機等構成,機房監控系統實現了對機房的出入控制、進出信息登錄、保全防盜、報警,同時提供了多種形式(RS485、無線modem、撥號、TCP/IP、簡訊、SP)的聯網功能。

消防系統監控

通過採集消防控制器或煙感探測器、溫感探測器的報警信號實時監測火災警狀態,當有火警發生,機房監控系統以直觀的畫面顯示報警信息並作報警通知,採取控制措施如開門開通風設備,啟停其他相關設備。

防雷系統

機房監控系統監測電源防雷器的工作狀態,對防雷器被雷擊或浪涌破壞進行實時的記錄和報警通知。

網路設備監控

為保證組織的安全、穩定、高效運行,保證網路設備的良好運行狀態和設備使用壽命與安全,實現用戶的最大投資效益,就有必要對網路運行環境的電力供應、溫度、濕度、漏水、空氣含塵量等諸多環境變數,UPS、空調、新風、除塵、除濕等諸多設備運行狀態變數,進行24小時實時監測與智慧型化調節控制,以保證網路運行環境的穩定與網路軟硬體資源、設備的安全以及相關信息數據資產的安全,蟻巡運維平台來方便、統一的監控伺服器的運行狀況運維是一台簡單實用的運維設備,只需要接入網路,按嚮導簡單配置,就可以使用。能自動發現需要監控的網路設備、伺服器和服務,主動巡檢網路設備、伺服器和服務的運行狀態,發現業務系統隱患,智慧型預警,保障業務正常運轉。最好的辦法就是採用機房監控系統,一種可以7*24小時實時監控機房環境的解決方案。
通過網路與路由器、伺服器、小型機等建立通訊聯繫,直接從這些網路設備中獲取各種信息,通訊過程採用國際上通用的簡單網路管理協定( SNMP ),無需在網路設備上添加任何應用程式,即可監控機房內伺服器、路由器、工作站及其他網路設備的工作狀態;記錄網路設備的啟停時間、網路流量- 時間曲線;統計通訊繁忙程度、通訊可靠性;對於伺服器非法關機、通訊擁塞或通訊癱瘓等嚴重事件立即給出報警信息,並彈出該網路設備的相應畫面和處理建議,保障網路系統的網路系統的安全可靠性。

實現的功能

1、實時顯示被監控現場監控設備的工作狀態、運行參數;
2、能遠程地對監控現場被監控設備進行開/關機,遠程線上調整監控設備的配置參數;
3、可根據告警確認、禁止和列印的規則,聲光提示各告警,自動處理告警;
4、告警條件、告警等級及告警是否禁止可根據現場情況由系統管理員線上設定和修改;
5、可根據告警類型、等級、時間、位置、禁止等因素按照預定規則自動將告警通知相關人員, 通知方式可包括現場聲光報警、電話、手機簡訊或E-mail等;
6、統計查詢設備的歷史數據、告警記錄、操作記錄等,列印報表;
7、提供多級管理許可權,確保系統安全;
8、有完善方便的維護、查詢和統計功能;
9、自動完成在網路異常時的數據保存與恢復;
10、值班管理:自動排班、交接班日誌、值班統計與事件查詢;
11、系統可對設備故障告警的處理過程提供支持,提供各類設備故障處理的規範流程;
12、能對被監控設備相關的信息進行管理,為電源運行維護人員提供全方位的信息服務。

套用範圍

機房監控分為小型機房,中小型機房,大型機房,聯網機房監控,此平台也廣泛的擴張套用於銀行的ATM機的無人值守,遠程實時監控無人基站等。機房監控系統廣泛套用在各行業領域如通信基站、中大型工廠、重要的政府部門、工商稅務、金融機構、醫院等,採用分散部署、集中監控系統完成全天候、無人值守的監控工作,確保機房設備的穩定運行,提高了機房管理的安全性能和可靠程度,實現了機房的科學管理。

處理措施

為了改變傳統機房環境監控的現狀,需要引入三大新理念加以改善。
對設備內部監控
機房監控的目的在於保護機房內IT系統的正常、有效運行,在事故發生之前偵測出潛在危機,並通過各種方式將警情信息傳送給相關人員及時進行處理。因此,機房監控的核心應該是對IT系統運行狀態的監控,而最直接有效的監控應該是直接對IT設備運行狀態進行監控。
IT設備內部的運行環境,例如伺服器內風扇轉速與CPU溫度等是最直接、最迅速影響IT設備正常運行的因素。有時候即使機房內空調運轉正常,機房整體環境參數值也在預設範圍內,但某伺服器卻因為某種原因出現伺服器內風扇的轉速不正常、CPU過熱。如果只監控機房整體環境,此時機房的管理人員是不會得到這種危險信息的,整個系統就會因為該伺服器潛在危機沒有得到及時處理而意外癱瘓。
多層次的機房監控
完善的機房監控系統應該是能夠實現對從設備運行情況到機櫃微環境再到機房整體環境這樣多層次的監控,並能重點實現對設備內部的監控。
機櫃內的微環境是設備正常運行所需要的物理環境。機櫃微環境參數最能體現設備所處的實際運行物理環境的情況,所以實現對機櫃內微環境的監控也相當重要。機房各個點的環境參數值是不同的,因此機房內整體環境監測的參數不能體現各機櫃微環境參數,更不能體現重要設備內部的環境。也就是說,即使機房整體環境參數正常,IT設備所在處的環境也不一定正常。所以說機房的整體環境監控的重要性次於對設備的監控和對機櫃內微環境的監控。
空調機的運行是為了降低機房內的溫度,使機房內的整體溫濕度保持在一個合適的範圍內,機房各個點的溫度參數值是不同的。空調機出風口的溫度值不能說明機房的整體溫度和機櫃微環境溫度,空調的正常運行不能說明設備就能正常運行。因此對空調的監控不能代表甚至取代對設備的監控。
漏水監測系統是為了監測機房內是否有漏水,以防止因漏水影響設備的正常運行。線式探測器是成線型布置在機房可能漏水的最低處,而實際上點式漏水探測器同樣可以反映機房的漏水情況且比線式探測器經濟實惠、安裝方便、維護簡單。
機房內設備由於非常重要,一般都是採用UPS供電,並且UPS是雙供電,只要對UPS進行監控就能確保設備正常供電並且能反映市電的情況。因此,對電源的有效監控是在不增加任何投資的情況下通過協定實現對UPS的監控,通過監控其電壓、電流、電池使用情況、市電情況來確保設備的正常運行。
中小機房監控管理解決方案概 述
在政府、金融、交通、電信、醫院、教育等行業中廣泛分布著各種中小型業務機房(數據機房),由於各種類型的業務數據直接由這些機房提供支持,機房斷電、系統故障、人為操作不當都有可能造成各種業務的中斷或數據丟失,繼而影響企業業務的停滯和運轉。
如何維護好這些機房,及時發現隱患和排除故障,降低管理成本,提高運維效率?
瑞爾時代一體化機房動力環境監控系統為企業機房的管理與維護提供專業解決方案,通過採用TCP/IP方式,用較低的成本,對機房UPS,配電櫃、溫濕度、空調、漏水、消防、門禁、視頻等實現統一監控管理、實現聲光報警、簡訊報警、電話報警等功能。操作簡單,功能實用,價格低廉,可以不用增加計算機而獨立運行,結構簡單,系統穩定。
保證機房業務連續性
機房的業務連續性需要依靠可靠的動力保障,機房動力設備主要是指市電配電、發電機、UPS、蓄電池等,一體化動環監控系統通過對發電機油位預警,蓄電池狀態監測等手段,協助管理員做好日常維護,一旦市電停電,能順利發揮其備用保障功能,有效預防機房斷電情況的發生,保證機房業務的連續性。
安全可靠,無人職守
機房作為企業核心的業務支撐平台,其安全性非常重要。瑞爾時代動環監控系統通過對機房門禁監控,正確識別非法開門,聯動現場聲光報警,簡訊或電話通知,結合視頻監控,最大程度保障機房防盜安全需求。通過機房溫濕度,煙感,漏水實時檢測,實現機房的環境安全管理要求。
機房監控
及時預警,定位故障
通過對機房動力設備與環境的特點進行深入挖掘和總結,瑞爾時代動環監控系統為為您機房提供專業預警方案和故障監測,防範於未然,把損失降到最低。
降低維護成本,提高維護效率
監控系統幫助維護工作由人工定期巡檢變為主動提醒模式,實現無人職守,大大減少維護工作量,減少診斷設備故障的時間和降低維護人員的技術門檻,提高維護效率。

新概念

為了改變傳統機房環境監控的現狀,需要引入三大新理念加以改善。
對設備內部進行監控
機房監控的目的在於保護機房內IT系統的正常、有效運行,在事故發生之前偵測出潛在危機,並通過各種方式將警情信息傳送給相關人員及時進行處理。因此,機房監控的核心應該是對IT系統運行狀態的監控,而最直接有效的監控應該是直接對IT設備運行狀態進行監控。
多層次的機房監控
完善的機房監控系統應該是能夠實現對從設備運行情況到機櫃微環境再到機房整體環境這樣多層次的監控,並能重點實現對設備內部的監控。
機房監控的預警功能
報警(alarm)是報告事件的發生,是在故障或危害發生之後向管理人員傳送警訊,及時地傳送警訊可以縮短故障修復時間(MTTR),最大程度地保障系統運行。但故障還是不可避免地發生了,影響了系統的正常運行。
預警(alert)則是在故障或危害發生之前向管理人員報告潛在危機,提示相關人員進行處理,是事前的,可以防止事故的發生。有效的預警可以增加系統平均無故障工作時間(MTBF),並可以根據危機情況自動延伸到報警。

相關詞條

熱門詞條

聯絡我們