机房环境动力监控系统功能介绍及设计需求规划和选择

-回复 -浏览
楼主 2020-11-26 10:51:22
举报 只看此人 收藏本贴 楼主

在信息化建设中,机房运行处于信息交换管理的核心位置。机房内所有设备必须时时刻刻正常运转,否则一旦某台设备出现故障,对数据传输、存储及系统运行构成威胁,就会影响到全局系统的运行。如果不能及时处理,更有可能损坏硬件设备,耽误业务系统运转,造成的经济损失是不可估量的。


  一、为什么要用动力环境监控
  在信息化建设中,机房运行处于信息交换管理的核心位置。机房内所有设备必须时时刻刻正常运转,否则一旦某台设备出现故障,对数据传输、存储及系统运行构成威胁,就会影响到全局系统的运行。如果不能及时处理,更有可能损坏硬件设备,耽误业务系统运转,造成的经济损失是不可估量的。

  二、机房环境动力监控介绍
  随着网络信息化和机房房建设发展迅猛,作为机房正常、稳定运行基本保证的空调、电源等设备的运行状况以及机房环境的安全状况也日渐凸显出其重要性。由于许多重要机房是24h不间断运行,而管理人员很难保证时时刻刻对机房情况进行监控,因此通过技术手段实现24h不间断监控显得非常必要。机房环境动力监控系统通过通信和软件的集成,可以实现对机房环境和UPS、机房空调、发电机等设备的集中监视,并实时采集报警信息发送给相关的管理人员。
  机房环境动力监控的监控对象是机房的辅助设备,目前一般没有将服务器、网络等的运行纳入监控范围(有专业的软件可以实现服务器和网络的监控)。
  机房环境动力监控与楼宇自控系统相比较,其特殊性表现在:
  (1)机房规模虽小,但被监控设备类别多、品牌杂、型号多。
  (2)被监控设备应用面窄,大多仅限于机房使用,与楼宇自控的控制对象往往不同。
  (3)机房设备由于安全性要求很高,因此主要以监视为主,控制需求较少,以避免误操作带来的风险。

  三、环境动力监控系统的结构组成
  机房环境动力监控系统由现场传感器和检测设备、通信设备、上位机和软件组成。其中上位机和软件处于核心地位。整个系统主体上是基于PC的(PG-Based)控制结构。机房环境动力监控的特点是以监视为主,采集的数据需要进行处理如报表、各种报警、打印、数据记录等。因此监控软件的核心功能之一就是采集数据。它和采集数据的硬件设备的通信方式主要可归纳为三种。
  (1)标准通信协议。常用的标准协议有:ARCNET,CANBus,DevjceNet,LonWorks,Modbus,Profibus。
  (2)标准的资料交换接口。常用的有:DDE(dynamicdataexchange)、OPC(OLEforProcesscontrol)。使用标准的资料交换接口。
  (3)绑定驱动(nativedriver)。绑定驱动程序是针对特定硬件和目标设计的驱动。

  四、机房动力环境监控系统实现的功能
  监控系统需要实现的主要功能和楼宇自控项目基本相同,概括起来有以下几个主要方面。
  (一)集中实时监视功能
  传统的机房管理采用的是每天定时巡视的制度,比如早晚各一次检查,并且将设备的一些核心运行参数进行人工笔录后存档。这样取得的数据只限于特定时段,工作单调而且耗费人力。而集中实时监控功能可解决此问题。
  比如对于UPS电源的运行,用户一般比较关心负载功率、总体负载率、三相是否平衡等参数。如果没有集中监控,用户需要分别到机房内的配电室,现场查看UPS的相关运行参数。而实时监控系统通过通信采集设备将当前被监视设备的运行参数采集上来,实时显示在监控电脑屏幕上,免去了用户到不同的设备跟前查看数据的麻烦,如果有必要,随时都可以在办公室内查看。
  (二)报警和事件功能
  报警指机房运行中出现异常情况,比如停电事故、漏水事故等。报警的发生意味着机房的运行受到影响,其严重程度可用"优先级"的概念来定义。一般监控系统均可设置几十到上千个优先级以区别报警的严重程度。机房内的报警优先级一般划分为10级即可。
  事件指机房运行中发生的一些正常的状态改变或人为操作。事件不是异常情况,因此不需要像报警一样立即通知用户进行处理。但是往往需要进行记录,以便日后检查。比如修改精密空调的设置温度,这就是一个正常的操作事件,但对修改时间、修改人的这些信息进行记录是有必要的。
  报警功能是机房动力环境监控系统最重要的一项功能,原因在于机房内设备和系统运行的安全性要求很高。报警发生后,系统应对报警事件进行记录,并迅速通知值班人员或管理人员进行处理。报警发生后,一般按以下步骤来进行处理:
  (1)通知。首要的是将报警信息告知给相关人员。
  (2)确认。表明已经知道报警的发生,正在处理。但此时报警仍然存在,没有消失。
  (3)消除。经过处理,故障消失,设备恢复正常,报警也随之消失。报警的通知主要采用以下几种模式来实现。
  1.屏幕显示报警
  这是最基本的方法,但也往往是报警信息最详尽的模式。通过在监控电脑屏幕上显示醒目的图案和文字来告知用户。报警文字是关键的信息,一般至少需要明确指出每次报警的几个关键参数:报警时间、报警设备、故障内容、优先级、紧急解决办法等。其中紧急解决办法是一个很有必要的功能,因为机房内的辅助设备种类多,最基本的紧急解决办法就由专业人员尽速响应和处理,因为报警涉及配电、UPS电源、空调、消防等几个系统,现场值班人员并不能对每种设备都精通,因此能在第一时间给出紧急处理办法是非常必要的,甚至一个故障设备厂家的维护电话号码都能解决大问题。
  屏幕报警的缺点在于,如果监控电脑旁没有人,或者没有人注意,则报警可能被延误。
  这种模式的报警通知面比较小,不能及时传播给专人。这种报警模式如果结合网络传输,会提高效率,后面章节将会予以介绍。
  2.本地语音报警
  当报警发生时,监控系统自动通过扬声器播放报警语音,将报警消息传递给现场人员。其传递消息面比屏幕显示报警要广,但也限于一个房间内。其优点是非常人性化,缺点是传播面仍然不广,而且不能定人传播。
  3.电话拨号报警
  当报警发生时,监控系统自动通过电话网,拨通系统预设的号码,对方接听后,自动播放报警语音,通过电话将报警消息传递给相关人员。
  这种模式的优点是能够实现定人播报。如果和管理责任人结合起来,会有比较好的效果。比如管理UPS和电源系统的人员是A,管理空调系统的人员是B,还有其他几个人C、D、E也帮助进行辅助管理。则当发生UPS故障后,系统直接拨打A的电话,减少了中间环节。但是实现此项功能,监控系统必须具备以下几个能力,否则效果会大打折扣。
  (1)具有线路是否通畅的判断能力。当拨打的电话号码占线,系统自动停止这个号码的拨号。
  (2)具有接听者是否接听的判断能力。当接听者接听后,系统开始播报报警语音。
  (3)具有确认机制。当接听者接听后,需要按下某个预先定义的按键进行确认操作,表明他已明确知道这个报警的内容。
  (4)具有连续重拨的功能。例如,当系统拨打A的手提电话,如果占线或不在服务区,则自动按照系统内预设的顺序(假设是A→B→C→D→E)拨打B的电话。如果B接听了但没有确认,再自动拨打C的电话……直到有人确认为止。
  从上面的电话报警过程来看,电话拨号通知的报警信息要传达到预先指定的人员,并不是一件顺利的过程,因此,确认机制是最为重要的。目前市场上销售的监控系统并不都具有完善的电话报警手段。
  电话报警可通过两种设备实现:语音Modem和电话语音卡。
  4.手机短消息报警
  随着通信业和短信业务的迅猛发展,通过手机短信发送报警信息成了一个有效的手段。其优点在于可以通知很多人,通知面广。但这种方式仍缺少有效的确认机制,仍然无法判断是否真正通知到指定的人"不过其发送面广的优点可以适当弥补这一不足。
  5.E-mail报警
  通过网络,将报警信息以电子邮件的形式发送到个人。但此模式的及时性不好,难以保证让相关人员在第一时间得知消息。
  (三)运行历史数据记录和趋势功能
  对机房的管理者来说,除了系统的报警功能以外,系统的另一个重要的功能就是历史数据和趋势功能。因为机房只是一个存放计算机和网络设备的场所,随着事件的推移,机房内的设备数量、型号等都会发生变化,按照目前的趋势,一般都是越来越多。因此,从机房管理角度,需要能够拥有机房设备运行的历史资料,这样可以通过分析,找出发展趋势、发现故障隐患。从而大幅度提高机房的管理水平。
  历史数据和趋势功能主要实现对机房运行的关键参数进行长期的记录,通过调用、查看历史趋势图,进行一些统计分析等。对于数据的记录,一定要选择"关键参数",而不能什么参数都进行记录,同时应注意参数记录的频率。因此,详细了解用户的需求非常重要。因为,如果记录数据量太大,对基于PC架构运行的监控系统,其存储能力受到比较大的限制。比如,功率参数是一个关键参数,如果每秒记录一次参数值,假设在数据库中占用4个字节,则一年就需要记录31536000次,需要的硬盘容量是126M,而100个参数就需要几十个G的容量,在调用数据时将会非常缓慢,记录数据时因对系统要求很高,也容易造成系统瘫痪。这个问题虽然可以采用实时数据库来解决,但费用昂贵。因此,对于需求的具体分析非常必要。按照机房运行的规律,建议模拟参数记录频率在lOmin以上一次。报警数据则因其量小,发生频率低,应全部记录。这样既可保证资料的相对完善,又极大地减少了数据量。
  (四)用户管理功能
  用户管理主要是对监控系统的使用者进行权限管理,避免末授权的人员随意修改参数设置或者查看。而授权需要进行分级控制,不同级别的用户只能进行自己这个级别内所允许的操作。
  (五)计划安排功能
  通过事件计划表,定时执行一些操作,比如系统资料的备份、下班定时关灯等。该功能在机房内使用不多,但随着机房监控系统的不断完善,可以满足更多的用户需求。
  (六)报表功能
  数据报表在工控系统中是必不可少的一部分,是数据显示、查询、分析、统计、打印的最终体现,是整个控制系统最终结果输出的重要组成部分,是对机房监控过程中系统监控对象的状态的综合记录和规律总结。一般有实时数据报表、历史数据报表(班报表、日报表、月报表等)。用户通过报表的过滤器选项,将自己感兴趣的内容打印出来,便于分析存档。
  (七)远程管理功能
  远程管理主要是指利用目前日益完善的网络资源,使操作人员不再局限在监控主机旁操作,而能够在其他地点对系统进行控制。一般监控主机安装在机房的监控室内,但并不是所有的机房都是24h有人职守。通过远程管理,操作员可以在办公室、外地等地进行管理,消除了地域限制。比如省级机房和地市级机房,如果都设置全职管理员的话,人力资源上浪费较大。而通过网络,可以将监控系统在省里集中监控,地市上不再需要设置专人。当运行有问题时,通过前面的多种报警通知模式,省上和地市均可得到消息,从而可以快速解决问题。
  (八)运行设置和控制功能
  除了主要的监视功能,系统还应具备控制能力。在大多数机房中,控制对象主要是非电源类设备,比如空调、通风、照明等系统。由于电源设备的可靠性要求极高,进行控制操作时(比如开/关机等)很可能因为误操作造成机房瘫痪,因此不进行控制,只进行监视。
  (九)安全冗余功能
  由于机房环境动力监控系统监视着机房的运行,如果自身出现故障,将无法进行监视,降低了管理的安全性。因此,在要求机房有很高的安全管理水平时,往往采取冗余的办法解决自身的可靠性。一般通过以下两种方式实现。根据对可靠性要求的高低和实际故障隐患的大小,两种方式既可同时使用,也可单独采用。
  采控设备的冗余:负责监控计算机与现场被监控设备通信的采控设备承担着双向的数据传输工作,对其备份可以提高传输的可靠性。
  监控计算机的冗余,由于监控系统一般均运行于PC平台的硬件上,而且操作系统以Windows200O和XP为主,因此,计算机硬件、操作系统和监控软件自身的故障都会造成系统停止工作。可以通过局域网的TCP/IP协议将两台装有同样软件的计算机配置成热备份冗余运行,一台为主机,一台为从机。
  相对而言,计算机和软件系统出问题的概率高,对机房内的监控做冗余,建议做计算机的冗余,即采用双机热备份方式。
  双机热备主要是实时数据、报警信息和变量历史记录的热备。主/从机都正常工作时,主机从设备采集数据,并产生报警和事件信息。从机通过网络从主机获取实时数据和报警信息,而不会从设备读取或自己产生报警信息。主/从机都各自记录变量历史数据。同时,从机通过网络监听主机,从机与主机之间的监听采取请求与应答的方式,从机以一定的时间间隔(查询间隔)向主机发出请求,主机应答表示工作正常,主机如果没有作出应答,从机将切断与主机的网络数据传输,转入活动状态,改由下位设备获取数据,并产生报警和事件信息。此后,从机还会定时监听主机状态,一旦主机恢复,就切换到热备状态。通过这种方式实现了热备。当主机正常运行,从机后启动时,主机先将实时数据和当前报警缓冲区中的报警和事件信息发送到从机上,完成实时数据的热备份。然后主/从机同步,暂停变量历史数据记录,从机从主机上将所缺的历史记录文件通过网络拷贝到本地,完成历史数据的热备份。这时可以在主/从机组态王信息窗中看到提示信息"开始备份历史数据"和"停止备份历史数据"。历史数据文件备份完成后,主/从机转人正常工作状态。当从机正常运行,主机后启动时,从机先将实时数据和当前报警缓冲区中的报警和事件信息发送到主机上,完成实时数据的热备份。然后主/从机同步,暂停变量历史数据记录,主机从从机上将所缺的历史记录文件通过网络拷贝到木地,完成历史数据的热备份。这时也可以在主/从机的组态主信息窗中看到提示信息"开始备份历史数据"和"停止备份历史数据"。历史数据文件备份完成后,主/从机转人正常工作状态。
  双机热备的构造思想是主机和从机通过TCP/IP网络连接,正常情况下主机处于工作状态,从机处于监视状态,一旦从机发现主机异常,从机将会在很短的时间之内代替主机,完全实现主机的功能。例如,1/0服务器的热备机将进行数据采集,报警服务器的冗余机将产生报警信息并负责将报警信息传送给客户端,历史记录服务器的冗余机将存储历史数据并负责将历史数据传送给客户端。当主机修复重新启动后,从机检测到了主机的恢复,会自动将主机丢失的历史数据拷贝给主机,同时,将实时数据和报警缓冲区中的报警信息传递给主机,然后从机将重新处于监视状态。这样即使发生了事故,系统也能保存一个相对完整的数据库以及报警信息和历史数据等。

  五、设计需求规划
  不同的机房用户,对机房内的设备数量、型号规格要求不一样,甚至使用习惯都不同,这就造成需求的千差万别,因此很难用固定不变的软件满足所有需求,二次开发是不可避免的。为了成功地进行二次开发,在机房环境动力监控项目的实施过程中,特别需要和用户有良好的技术沟通。
  一般按照如下几个步骤进行环境动力监控的规划和实施。
  (一)确定需要监控的对象
  首先应该明确系统中需要监控的设备和项目。
  (二)确定监控对象的信号类型
  监控对象虽然多,但信号类型只分为三类:开关量信号、模拟量信号、智能设备信号。(1)开关量信号。这类信号只有两个状态,比如配电柜开关只有合闸和分闸两种状态。属于开关量信号的有:配电开关、防雷器状态、新风机、排风机、消防信号。采集到的原始信号需要将其进行数字化转换。在机房环境中,目前主流方法是采用分布式I/O采集模块来实现。由于配电开关只监视,不需要控制,因此需要采用DI输入模块,将开关量状态转化为0、1的数字信号状态。每个模块根据型号和厂家的不同,可以同时检测4~32路开关信号。这里采用8路输入的型号。
  (2)模拟量信号:模拟量是连续变化的信号,采集的过程就是进行模拟到数字信号的转换和传输的过程。模拟量信号转换模块一般有4~8路输入信号,这里我们采用8路输入的模块。上面的监控对象中,房间的温湿度就是典型的模拟信号。
  (3)智能设备:智能设备的检测和数字编码工作由已经内置的单片机自行完成,设备上提供通信接口,监控系统只是与其进行通信连接,将信号传输到监控主机上解码。在上面的需求中,UPS电源、空调、发电机、电量仪、定位漏水控制器属于智能设备。
  需要注意的是,由于设备种类众多,具体的信号类型需要根据具体设备来确定,本例主要针对常见情况,并不代表所有情况。
  (三)确定监控对象的信号采集方法
  信号的采集过程分为几个环节:实际信号一电信号的转换;电信号一数字信号的转换。
  l.UPS电源(包含直流电源)
  UPS电源和直流电源均带有电池,对计算机起到提高电源质量、停电后持续供电的保障。作为机房供电的核心设备,它们的运行安全在某种意义上甚至比不少计算机服务器还高。因为一旦UPS宕机,则整个机房都将瘫痪,业务系统停止工作。所以安全性要求较高的单位如金融、政府、电信等单位元一例外全部采用有热备份的UPS配置。但即便如此,时刻监视UPS的运行状况依然非常必要。通过由UPS厂家提供的通讯协议及智能通讯接口,对UPS进行监控,对UPS内部整流器、逆变器、电池、旁路、负载等各部件的运行状态进行实时监视,一旦有部件发生故障,系统将自动报警。并且实时监视UPS的各种电压、电流、频率、功率等参数,并提供直观的图形界面显示。
  机房环境中对于UPS的监控一律采用只监视,不控制的模式,避免由于监控系统的失误带来的断电风险。
  UPS在机房监控中属于智能设备。目前UPS普遍带有RS232C或RS485接口作为监控接□,一些UPS还支持通过网络访问的SNMP协议接口。由于串行接口更为普及,机房监控系统普遍采用RS232C或RS485串门进行通信,采集设备的运行数据。
  当UPS接口为RS232时,从UPS将数据传送到监控主机的通信线路距离应不超过15m。在大多数机房中,这个距离是无法满足的。于是就需要采用RS232/485转换器,将232信号转换为485信号后传输,这样就可以支持1000m以上的传输距离。满足几乎所有本地机房监控的需求。
  在监控主机一侧,信号线直接接入多串口扩展卡上,从而完成了线路的物理连接。需要注意的是,如果设备侧采用485接□,主机侧也需要采用485接口,两端的电气接口类型应保持一致。
  以上连接模式中,主要需要两种设备:R5232/485转换器和多串口扩展卡。
  RS232/485转换器:建议采用带光电隔离型的,有利于设备的安全。
  多串口扩展卡:用在监控主机上。主机一般自带1~2个RS232C串口,但在监控项目中一般都不够用,因此需要通过扩展卡来扩展本机的串口数量。

  电池部分
  在一个UPS不间断电源系统中,可以说蓄电池是这个系统的支柱,没有电池的UPS只能称作稳压稳频电源。UPS能够实现不间断供电,就是因为有了蓄电池的存在,在市电异常时,逆变器能够直接将蓄电池的化学能转换成交流电能,使负载设备得以连续运行。
  目前,中小型UPS电源广泛使用的是免维护密封铅酸蓄电池,通常占据UPS电源总成本的1/4一1/2之多。不仅如此,长期的维修经验表明,约有50%以上的UPS电源故障与UPS蓄电池有关。UPS蓄电池的故障主要表现为端电压不够、容量不足或瞬间放电电流不满足负载启动要求等。
  一般正常使用的UPS,其蓄电池寿命通常在3一5年,但是目前国内有相当部分UPS蓄电池在投入使用不到1年就开始出现问题,更有甚者,有些进口品牌UPS的国产电池刚买来就失效的情况也时常发生。这一方面是由于蓄电池在制造工艺上存在先天的缺陷,另一方面也是由于缺乏必要维护所造成的。值得注意的是,许多使用UPS的单位由于缺乏必要的、定期的检测维护措施,根本不清楚UPS系统中蓄电池的工作状况,为UPS系统运行留下隐患。ups蓄电池定期测量各块蓄电池的端电压。当各块蓄电池电压差过大时,需要进行均衡充电,并定期对蓄电池进行容量测试,以便检查蓄电池组的性能以及保持蓄电池的活性。在实际运用中,由于各种条件的限制,UPS蓄电池的维护很少有人完全按照标准进行。在国内有95%以上的UPS电池缺乏必要的维护,这为UPS供电系统埋了隐患;一般UPS蓄电池是装在柜子里或放在地板下,测量、拆装都不方便;现在98%以上的UPS蓄电池没有安装监控设备,维护人员通常所能进行的只有每隔一段时间,断开市电让UPS蓄电池放电一段时间,充其量只是能够一定程度上保持电池的活性,而对于电池的性能以及各节蓄电池的容量等重要数据还是无从知晓。如果不能妥善地管理使用蓄电池组,如过度充放电或电池老化等现象都会导致电池损坏或电池容量急剧下降(即便只有一节电池性能恶化,也会严重影响整组电池的性能),从而影响设备的正常供电。因此,及时可靠地对蓄电池组进行巡回检测,对于维护负载设备的正常运转具有十分重要的意义。为此,需要通过在线式电池监测仪、直流电流传感器等设备对UPS蓄电池进行监控,对电池故障进行预警;鉴于温度对蓄电池容量与寿命有很大影响,应使用微型温度传感器对蓄电池的工作温度进行监测。一且蓄电池异常,将自动切换到蓄电池监测画面,并伴随有报警声音和相应的处理提示。
  在线式电池监测仪通常采用分布式结构,每只电池配备一个电池检测模块,每组电池配备一个电池组参数检测模块,每台用户设备(最多两个电池组)配备一台控制器。电池检测模块负责监测电池的运行参数端电压、电池表面温度和电池参数内阻,电池端电压和温度以数模转换并采用过采样算法而获得。内阻采样时模块中的激励单元产生lOHz、2A的恒幅交流信号,经过数字加权滤波算法,滤去千扰信号并算出信号的幅值即是电池的内阻值。由于电池端电压因激励而产生的波动量级在数十微伏至数十毫伏之间且频率很低,与开关电源的纹波和噪声达几百毫伏和几十千赫兹相比,监测系统不会对用户系统产生影响。
  2.空调设备
  机房的特点之一就是设备密集,发热量大。因此,空调对控制机房的温湿度起着决定性作用。当机房温度超过25℃后,一些计算机、网络设备就会发出报警。机房空调停止运行2h左右,机房温度就会从20℃升到30℃以上,此时计算机设备运行可靠性大为降低。对空调运行状态进行监控可以使空调设备稳定运行,保证机房温湿度的稳定、可靠。通常对空调系统采用RS485接口进行数据采集。通过实时监控,能够全面诊断空调运行状况,监控空调各部件(如压缩机、风机、加热器、加湿器、去湿器、滤网等)的运行状态与参数,并能够通过管理软件远程修改空调设置参数(温度、湿度、温度上下限、湿度上下限等),以及对精密空调的重启。监控系统一且监测到有报警或参数超出范围,将自动切换到相关的运行画面,并伴随报警声音和相关处理提示。对重要参数,可作曲线记录,用户能够通过曲线记录直观地看到空调机组的运行情况。空调机组即便有微小的故障,也可以通过系统检测出来,及时采取措施防止空调机组进一步损坏。
  3.漏水检测
  大多数机房的设计采用的是地板下走线方式,强电、弱电、接地线、电缆通常纵横交错。一旦发生地板漏水,管理人员难以及时发现,漏水将威胁着整个机房负载。因此对机房内的漏水状态进行实时的监测是十分必要的,很可能造成电气线路及计算机短路,烧毁设备,中断系统运行,危害极大。因此在规划机房时应避免无关水管经过机房。从实际运行经验来看,机房发生漏水的原因主要有以下几种。
  (1)由于必须的空调系统,机房内不可避免地需要布置空调的上下水管,从而形成隐患。
  (2)由于外墙窗户或外墙穿墙孔洞(如空调孔,电气孔等)密封防水处理不好造成下雨时漏水。
  (3)当机房外走道上或大楼其他地方由于某些原因发生强烈漏水时(如消防爆管),水会通过门、墙角等处涌进机房。
  (4)楼上漏水,造成机房顶部滴漏。
  防止水患应采取主动和被动两种措施,主动措施是在机房规划时就减少漏水隐患;被动措施就是万一发生漏水,能在第一时间发现并采取措施。采用漏水检测系统可实现该目的。
  漏水检测系统分定位和不定位两种。所谓定位式,就是指可以准确报告具体漏水地点的测漏系统。不定位系统则相反,只能报告发现漏水,但不能指明位置。系统由传感器和控制器组成。控制器监视传感器的状态,发现水情立即将信息上传给监控PC。测漏传感器有线检测和面检测两类,机房内主要采用线检测。线检测使用测漏绳,将水患部位围绕起来,漏水发生后,水接触到检测线发出报警。由于活动地板在机房内普遍使用,各种水管在地板下布置,一旦发生漏水,往往无法及时发现。在配置漏水检测线时,如果漏水隐患(通常是水管)在地板下分布范围较厂,建议采用定位式检测,否则难以迅速找到泄漏点。如果隐患范围集中,则建议采用不定位式,简单经济。


  4.配电系统
  配电系统监测主要是对配电柜的运行状况进行监测,其中又分两部分监测内容。
  用电情况监视:主要对配电系统的电压、电流、功率等参数进行监视。当一些重要参数超过危险界限后进行报警。
  配电开关的状态监视:配电开关控制着设备的电源,当其故障跳闸时应尽快发现并快速排除故障。
  配电柜的开关状态一般可采用两种方法来反映:第一种是需要检测的重要开关自身带有辅助触点,可直接采集辅助触点的无源信号(干接点)来反映开关状态;第二种是通过检测开关下端的电压有无来间接判断上面的开关是否合闸。由于辅助触点和开关是机械联动的,显然前一种办法最为直接准确,但需要注意,开关的辅助触点往往是选配件,在供配电设计时最好一并配置。后一种办法在开关前级停电的情况下则会认为开关"分闸",此时就会误报。为此,还需要结合前级电源的有无才能真实反映开关实际状况。从这个例子中可以看到,对被监测设备的了解是关键的一步,只有充分了解被监视设备的特性,才能确定正确的监测方案。
  采用电量仪或电压电流传感器以及模拟量模块能够组成配电参数监测系统。电量仪是集三相相电压、相电流、线电压、线电流、有功、无功、频率、功率因数等参数于一体的智能仪表。将仪表带有的报警功能和智能通讯接口与监控系统相连,监控系统通过分析处理仪表采集的参数,使得管理人员能够非常方便地读取配电系统的电流、电压等运行数据,了解供电质量情况。通过分析配电系统运行参数存有的历史数据和曲线图,分析故障的原因,甚至可以预防很多事故的发生。
  5.发电机
  通过串口通信的方式进行监控,需要发电机的串口通信协议。
  6.机房实际温湿度
  机房内安装的负载设备,其正常运行对环境温湿度有比较高的要求。良好的温湿度控制,对充分发挥计算机系统的性能,延长机器使用寿命、确保数据安全性以及准确性是非常重要的问题。
  计算机设备中,.通常使用了大批的半导体器件、电阻器、电容器等。在计算机加电工作时,环境温度的升高部会对它们的正常工作造成影响。当温度过高时,可能会导致某些元器件不能正常工作甚至完全失去作用,进一步导致计算机设备的故障。因此,必须按照各种设备的要求,把温度控制在设定的范围之内。
  为了确保计算机安全可靠地运行,除严格温度控制之外,还需要把湿度控制在规定的范围之内。一般地讲,相对湿度低于40%时,空气被认为是干燥的;而相对湿度高于80%时,则认为空气是潮湿的;相对湿度为100%时,空气处在饱和状态。
  在相对湿度保持不变的情况下,温度越高,水蒸气压力增大,水蒸气对计算机设备的影响越大。由于水蒸气压力增大,在元器件或由介质材料表面形成的水膜越来越厚,可能造成"导电小路"和飞弧现象,引起设备故障。
  高湿度对电子计算机设备的危害是明显的,而低湿度的危害有时更加严重。在相同的条件下,相对湿度越低,也就是说越干燥,静电电压会越高,影响电子计算机设备的正常工作越明显。实验表明,当计算机机房的相对湿度为30%时,静电电压为5000v,当相对湿度为20%时,静电电压为10000v,而相对湿度降到5%时,则静电电压可高达20000v。
  虽然在精密空调中已经能够读到空调的回风温度参数,但对于较大面积的机房或有多个设备房间的机房(特别是有些还没有做到全部使用精密空调的机房),空调的回风温度并不能准确代表房间内的实际温湿度,而只是一个回风的平均值。因此可能回风温度是合乎标准的,但某些房间或某些区域的实际温度反而超标,也就是温湿度均匀性不好。
  所以在机房的各个重要位置,需要装设温湿度检测模块,记录温湿度曲线供管理人员查询。一旦温湿度超出范围,即刻启动报警,提醒管理人员及时调整空调的工作设置值或调整机房内的设备分布情况。另外,监控系统将记录下机房的温湿度曲线,供机房管理人员参考。管理人员能够根据当地的各季节的温湿度状况进行适时的调整;及时防范因温湿度变化造成不必要的设备损坏;在问题发生后可根据历史曲线轻松找到问题所在,快速解决问题。
  传统的温湿度检测方式为温湿度传感器输出电压或电流信号,通过模拟量采集模块传送至计算机,其电压或电流信号在传输过程中不可避免地受到线材质量、传输距离、电磁干扰等影响,造成不可避免的误差。为确保温湿度检测值不至于受上述因素的影响,应选用总线式温湿度传感器,传感器把检测到的温湿度数据在本地直接转换成数字信号,再传送给系统,最大限度地保证了温湿度检测的准确性。
  通过加装温湿度传感器,采集机房内各个区域的实时温湿度,提供机房关键位置准确的实时温湿度值。管理员通过了解机房实时温湿度状态,调节送风口、合理设定空调的运行参数,尽可能让机房整体的温湿度趋向合理,确保机房设备的安全稳定运行。
  7.通风系统通风系统监控主要包括新风系统和排风系统的监控。
  (1)新风系统。机房内使用的新风机的过滤器过滤级别达到了中效甚至是亚高效,因此比较容易发生堵塞,影响机房的新风供应量。因此,监测系统一般要对过滤器状况进行监视,这可通过压差开关来实现。当过滤器太脏时监测系统发出报警,提醒尽早更换。同时系统对风机的运行状况进行监视,当风机发生故障时及时报警。风机运行状态可通过检测风机电机是否有电来检测,也可通过增加压力传感器来实现。这两个方法中,压力传感器监测最为直接准确。风机故障还可以通过风机电源的有无和压力传感器两者共同作用来检测,或者对风机的热保护继电器状态进行监视。
  新风系统一般还设计有远程启动功能,能在机房之外的区域执行新风机的启动或停止操作。
  新风的联动控制:可以在机房内设置CO2传感器,通过检测机房内CO2的浓度实现风机的联动控制。当浓度超标时,自动启动风机;浓度达标则自动停止。
  (2)排风系统。对排风系统监视的内容和新风系统基本一样,只是排风机的过滤器过滤级别较低,一般不进行特别监视。
  8.防雷系统
  由于机房所具有的特殊功能,防雷系统的工作状况显得尤为重要。一旦防雷模块被损坏,或发生其他故障,机房负载设备将会处于假保护状态,此时一旦发生雷击必然造成非常严重的损失。如果采用的防雷系统具有智能监控接口,可以通过生产厂家提供的通讯协议来实现完美的监控功能;如果采用的防雷系统仅支持开关信号输出,则需要通过开关量采集模块来实现对防雷模块工作情况的实时监测,通常只有开和关两种监测状态。
  9.消防系统
  对消防系统的监控主要是消防报警信号、气体喷洒信号的采集,不对消防系统进行控制。有两种方法实现消防信号的采集:按消防报警控制器厂家的通信协议进行通信采集或者干接点采集。采用通信监控可以检测到每个探头的报警情况,是理想的解决方案。但需要注意的是,在实际项目中,由于消防报警控制器的通信协议不开放,往往无法实施。此时就只能采用于接点采集,但不能具体监视到每个探头,建议按房间进行监视。
  10.视频监控
  数字视频监控系统采用MPEG4视频压缩方式,集多画面测览、录像回放、视频远传、触发报警、云台控制、设备联动于一体,并具备以下特点。
  (1)定制视频组件。在视频系统组件中,视频实时窗口、录像回放窗口、远程接受窗口、球机(云台)控制窗口都作为控件无缝嵌入,操作人员能够自行定义视频窗口的数目、摆放位置、窗口大小、播放器界面等,满足不同的个性化需要。
  (2)报警联动功能。视频系统可由外部的输入信号进行联动,如双鉴探头、门磁或由自身设备支持的"移动报警"功能进行录像。录像时段也可以由操作人员自行设定,任意一路视频均可实现远程传输。视频一旦报警,可同时与其它设备进行联动,输出相应的控制信号。
  (3)web管理。视频系统集成的w乱功能,用户通过远程测览器看到的是与本地监控系统完全一样的组件界面,井能够实现同样的监控功能,保证了界面控制的一致性。
  (4)视频流量控制。远程图像采用MPEG-4压缩方式(视频质量为25帧/秒、352X288分辨率),理想状态下的视频传输每通道约占用250k带宽,视频系统可以通过调整画面质量、每秒帧数或显示分辨率等参数来满足不同带宽的需要。
  11.门禁监控
  在机房区域重要位置安装门禁系统,以便对出入人员进行有效监控管理,出于安全考虑,门禁系统设计时采用控制与读卡分开的结构。门外安装读卡器,室内隐蔽处安装门禁系统控制器,防止有人通过技术手段破坏并非法进入。
  门禁系统由控制器、感应式读卡器、电控锁和开门按钮等组成(联网系统外加通讯转换器)。读卡方式属于非接触读卡方式,持卡人只要将卡在读卡器有效范围内晃动一次,读卡器就能感应到有卡请求验证并将卡中的信息发送到主机,主机将检查卡的有效性,然后决定是否进行开门。
  感应卡为只读属性、不易复制、安全可靠、寿命长(非接触读卡方式减少了感应卡机械磨损)。使用通信转接器与监控系统联网后,监控中心能够实时监控门禁系统的状态,并对门禁系统的历史数据进行处理、查询、报表输出等。
  非接触感应式门禁系统主要优点如下。
  (1)非接触式Ic卡与读写器之间无机械接触,磨损和故障。从而避免了由于接触读写而产生的各种问题。
  (2)非接触式卡表面无裸露的芯片,无需担心芯片脱落、静电击穿、弯曲损坏等问题。
  (3)每张卡均有唯一的序列号。制造厂家在产品出厂前己将序列号固化,不可再更改,序列号具有唯一性。芯片内有几十亿组密码组合,因此复制的可能性极小。
  12.网络设备与应用系统监控
  监控系统主机通过网络与路由器、服务器、小型机等建立通讯联系,直接从这些网络设备中获取各种信息,通讯过程采用国际上通用的简单网络管理协议(SNMP),无需在网络;设备上添加任何应用程序,即可监控机房内服务器、路由器、工作站及其他网络设备的工作状态;记录网络设备的启停时间、网络流量;统计通讯繁忙程度、通讯可靠性;提供网络通讯状况的详尽资料,辅助管理人员预先发现网络问题隐患,保障网络系统的安全可靠性。同时,由于采用的是通用协议,也给系统后期的扩容和升级带来极大方便。
  13.系统通信的监视
  环境动力监控系统也可能发生模块故障或通信故障等问题,因此需要对系统自身的通信情况实时监控,确保系统可靠运行。
  采集模块与智能设备间的通信:可单独设置一个记录上位机和设备间通信成功次数的计数器,在上位机软件中对计算器的读数变化进行判断即可。
  
  (四)确定智能设备的控制参数
  智能设备是监控系统数据采集中的难点。首先应保证设备有通信接口,因为部分设备的通信接口是选购件,用户采购设备时不一定都带有。要得到通信协议,只能通过设备厂家。其次,对协议的分析是最关键的一环,在分析协议前需要对设备进行了解以便能够理解各个参数的含义,重点是了解协议中提供的参数并规划出需要采集的信息。一份完整的协议中有十到数百个参数,可分为报警参数、运行参数、设置调试参数,其中报警和运行参数是主要要采集的,而设置调试参数则往往是厂家工程师进行调试所用,大多数参数对用户并没有多少实际意义,可以不考虑。比如精密空调的设置参数,用户一般只需要了解设置的温湿度和报警上下限值就够了。
  (五)确定系统所要实现的功能
  前面已经介绍了系统常用的功能。在每个具体项目中,需要与用户进行良好的沟通,确认最终要实现的系统功能。
  (六)确定采用的通信解决方案
  这里采用常用的现场采集模块配合RS485通信的模式。模拟量和开关量共用一条总线,其余的智能设备每台占用一条总线。
  (七)确定软件的集成开发平台
  考虑到灵活性和开放性,可以采用组态软件。

  六、环境动力监控通信网络的选择
  目前有4种常用网络结构:串口和485总线、采用现场总线、采用以太网、混合组网。
  (一)串口和R5485总线
  由于PC上有串口,而智能设备的通信口也多是RS232、RS485等方式,因此二者连接的最简单方法就是通过串口通信,具体模式则主要取决于设备的接口规范。当双方都是R5232串口时,如果距离小于l5m,可以直接连接,而如果距离超出限制,就需要通过R5485连接来满足实际距离,这样在两侧都需要增加R5485/32转换器。当被监测设备是RS485接口,则只有PC侧需要转换器。总之,一条485总线需占用一个PC的RS232串口
  (通过R5485/32转换)。虽然理论上每条总线可以带32个设备,但在实际项目中,往往只将数据量小的开关量采集模块和模拟量采集模块挂在同一条485总线上,对于智能设备则通常采用一个设备对应一个串口(485或232)的方式配置,比如一台空调占用一个口。因此,对于智能设备的通信连接,实质上是星型的、一对一的,即使采用了485线路,也仅仅是为了延长通信距离,或者是因为被监测设备的接口是485接口,而没有真正利用到R5485的另一个优点:它是一条可串接多个不同地址码的智能设备总线。原因之一是因为智能设备数据量大,更主要的是接口驱动开发复杂。这种结构带来的问题是需要PC配置较多的串口才能满足端口数的要求,因为常规的PC或工控机均只有1~2个串口,而机房内的智能设备数量往往大于这个数,因此需要通过多串口卡进行扩展。串口卡宜采用PCI接口。扩展后的PC总串口数(含本机自带串口)应大于所需要的数量,保证扩展空间。带来的另一个问题是需要布置较多的线缆。采用基于485网络的现场采控模块的组网方式,就是基于PC控制的模式。
  (二)现场总线
  根据国际电工委员会(IEC)和美国仪表协会(lSA)的定义:现场总线是连接现场智能设备和自动化系统的数字型、双向传输、多分支结构的通信网络,它的关键标志是能支持双向多节点、总线式的全数字通信,具有可靠性高、稳定性好、抗干扰能力强、通信速率快、系统安全、造价低廉、维护成本低等特点。现场总线的标准多达几十种,全世界尚未形成一个统一的标准。在机房监控中常采用的是而Lonworks总线。采用Lonworks总线需要在上位机上安装LON网络接口设备,使上位机具备与Lonworks网络通信的能力。
  与RS485一样,Lonworks也是总线,但RS232、RS485只能代表通信的物理介质层和链路层,如果要实现数据的双向访问,就必须自己编写通信应用程序,但这种程序多数都不能符合IS0/0SI的规范,只能实现较单一的功能,适用于单一设备类型,程序不具备通用性。在R5232或R5485连接的设备网中,如果设备数量超过2台,就必须使用R5485通信,RS485网的设备之间要想互通信息,只有通过"主(master)"设备中转才能实现,这个主设备通常是PC,而这类设备网中只允许存在一个主设备,其余全部是从(slave)设备。
  而现场总线技术是以IS0/0SI模型为基础的,具有完整的软件支持系统,能够解决总线控制、冲突检测、链路维护等问题。现场总线设备自动成网,无主/从设备之分,允许多主存在。在同一个层次上不同厂家的产品可以互换,设备之间具有互操作性。因此,互操作性是Lonworks的最大优势。那么,机房监控中能否实际利用到这个优点呢?从机房监控的特点来看,一些智能设备实际上不能充分利用这个优势,原因是以监视为主的特点造成监控的数据流是从被监测设备流向上位PC机而不是在现场的检测模块间流动。另外,空调设备的控制已经自行解决,对用户而言只是几个参数的人工设置问题,仍然是从PC到空调采控模块的数据传输,不需要与其他模块分享。因此,对此类设备,Lonworks不能发挥主要优点,反而会增大成本,不建议采用。
  (三)以太网组网
  采用以太网是当前的趋势,可以充分利用网络的覆盖面解决布线、远程传送等实际问题。采用以太网组网可以和前面的串口通信、现场总线等混合使用。对于232/485串口,目前基于以太网的转换网关(也叫串口网络通信服务器)实现了PC机上的串口"透明延伸"到现场。因此相关程序不需要改动即可运行。大多数现场总线标准也都已经开发出连接以太网的接口,从而实现现场仍采用现场总线,与PC通信则通过以太网的结构。
  (四)混合组网
  既然各种通信方式各有优缺点,那么根据实际情况将各种网络结构方案组合,就可以综合发挥各种网络结构的优点,提高通信效率,比如需要联动的采用Lonworks,而其他则采用串口通信。

  七、现场采控设备的选择
  (一)常用的现场采控设备
  机房内常用的基于串口网络的现场采控设备是多串口卡、RS485/32转换器、数字输入模块、数字输出模块、模拟输入模块。
  (1)多串口卡。用以扩充PC串口数量。常用的有2、4、8端口的。串口卡选择时应注意选择带浪涌保护功能的光电隔离型产品。串口类型选择应和被监测设备相符,在设备接口未明确是RS232还是485时,可选择带可转换接口类型的产品。
  (2)RS485/32转换器。用以实现RS232的远距离传输或实现485线路和PC串口的连接。建议采用光电隔离型产品。常用的是单路转换器。
  (3)数字输入模块。简称DI,用于采集现场的开关量信号如风机、配电开关的状态信号等,并将其转化为数字信号通过RS485进行传输。
  (4)数字输出模块。简称跃DO,用于开关量控制,比如开灯控制。需要注意的是,这类模块和PLC或DDC不同,它仅仅是将上位机的动作命令输出给被控设备去执行,自身并没有决策控制功能。
  (5)模拟输入模块。简称AI,用于如温湿度模拟信号的采集和传输。模拟量输入有电压和电流型之分。选择时应根据传感器的输出接口形式来确定AI的接口形式,二者要一致,包括信号量程范围。
  (二)根据安装模式选择
  DI、DO、AI等模块分两种安装模式:独立式和组合式。组合式安装模式可以共用底板,共用一个通信接口、一个地址和电源,初期配置不必配满,扩容时只增加功能模块即可。而且组合后的容量很大,可达数百个DI通道和上百个AI通道,适合大容量集中采控。而独立式安装模式每个都有一个通信口,需要单独赋予地址,扩展时只能整个增加,单个模块的容量有限,一般AI仅8路信号,DI仅16个通道,适合分散式采集。
  (三)根据被监测设备的位置布局选择
  相近的设备可以共用一个多路Dl、AI,这样可以节约成本。设备距离较远时则应分别配置模块。
  (四)根据扩展性选择
  对DI、DD、AI等应留有扩展通道,方便扩容和在发生故障时的临时替换。
  (五)根据兼容的通信协议选择
  模块应支持标准的MODBUS协议,便于开发。

  八、环境动力监控系统软件的选择
  (一)常用的环境动力监控系统软件
  目前市场上应用在机房环境的监控系统软件主要分两大类:通用SCADA/HMI软件和专用软件。通用控制软件可以应用在机房、楼宇、工厂等众多领域,一般采取组态的方法来实现每个具体项目监控系统软件的开发。由于需要兼顾各个行业,软件的通用性强,功多,集成性好,开放。其最大的优点在于开放性,用户不必因为软件而被绑定在一个集成商身上,其他集成商也可以维护,风险小。而专用软件则仅仅是针对机房监控应用开发的,功能单一、封闭、二次开发困难,而且只能由原厂商维护。
  SCADA(supervisorycontrolanddataacquisition)系统,即数据采集与监视控制系统,HMI则是人机界面(humanmachineinterface)的简称。HMI广义的解释就是"使用者与机器间沟通、传达及接收信息的一个接口"。在机房里,要搜集机房关键房间、区域的温度、湿度以及电源、空调设备的状态等等的信息,通过一台主控器监视并记录这些参数,并在一些意外状况发生的时候能够加以处理,这便是一个很典型的SCADA/HMI的运用,一般而言,HMI系统必须有几项基本的能力:
  (1)实时的资料显示。把采集的资料经换算后立即显示在屏幕上。
  (2)自动记录资料。自动将资料储存至数据库中,以便日后查看。
  (3)警报的产生与记录。使用者可以定义一些警报产生的条件,比方说温度过度或压力超过临界值,在这样的条件下系统会产生警报,通知作业员处理。
  (4)历史资料趋势显示。把数据库中的资料作可视化的呈现。
  (5)报表的产生与打印。能把资料转换成报表的格式,并能够打印出来。
  (6)图形接口控制。操作者能够透过图形接口直接控制机台等装置。
  (二)选择环境力监控系统软件应把握的原则
  开放性:保证系统可兼容更多的采集设备,能够与更多的应用软件交换数据。其中,对OPC接口的支持非常必要。OPC是用于过程控制的OLE。在传统系统中,解决客户应用程序从数据源(如现场设备、SCADA系统等)读取数据的方法是为不同的客户应用程序编写不同的驱动程序。这种方式存在许多问题,如同一个设备为适应不同的应用程序可能需要多种驱动程序,不同的驱动程序之间存在着不一致性,驱动程序对硬件存在着极大的依赖性等等。为了解决这些问题,一些与微软公司合作的自动化硬件和软件供应商联合制定了一套称为OPC规范的OLE/COM接口协议,以此来提高过程控制申现场设备以及应用程序之间的互操作性。
  可以说OPC是监控软件的现场总线,其基本思想是:每个硬件供应商为其设备开发一个通用的数据接口(即OPCserver),供其他系统读写信息,客户的应用软件也可以通过OPC规范的接口来读写硬件设备的信息。由于硬件供应商通常将硬件驱动程序封装成OPCserver单独出售,这样作为OPC数据客户端的上层应用,可以不包含任何通信接口程序,不必关心底层硬件内部的具体细节,只需遵循OPC数据接口协议,就能够从不同的硬件供应商提供的OPC数据服务器中取得数据。另一个重要的特性就是对主流数据库的支持,没有数据库的支撑,监控软件功能将大打折扣。对数据库的支持以MSSQLserver、ACCESS为主。
  易用性:软件应采用组态的方式进行二次开发,功能强大灵活,简单易用。对开发者来说,可以极大地节约开发时间,而不用为某些要求单独编写程序。对用户前言,许多用户往往缺少专业知识,易用的软件可以使用户快速掌握,甚至可以自行开发一些需要的简单功能。
  扩展性:在选择软件时,软件支持的变量容量是一个关键参数。通常用支持的变量标记名(TAG)数量来衡量。常见的软件容量分为64、128、256、512、1024、3000、无限点。每一个变量点可以表示一个实际参数如电压、电流或温度等。不同品牌的软件对点数的划分有不同的解释,主要有两类计算方法:一是只计算I/O变量;二是对I/O变量和中间变量均计算。I/O变量指监控软件与其他应用程序交换数据用到的变量,比如采集的温湿度、电压、电流、功率值为输人变量(input),控制空调开关机的信号为输出变量(output)。而中间变量则仅在监控软件内部使用,比如内部条件判断变量。在规划设计时,需要针对项目的具体情况,对需要用到的变量数量做出估算,并预留20%左右的变量数以备扩展。
  先进性:监控的作用实质上是两类功能:采集信息以及处理信息。从采集信息角度看,软件应能支持较多的通信协议和接口,比如现场总线、OPC等,以便能支持更多的设备。从处理信息来看,除了要求软件能够实现前面所描述的各种基本功能外,还要求能够提供更多的基于后台数据库的分析工具,帮助用户更好地掌握机房运行规律。


(本文来自书籍的整理,站内发布时间比较早,小编应订阅用户请求进行推送,分享给大家作参考,如需更多的交流或请求,可微信直接留言,或添加主编微信号:masucy,申请加入“绿色数据中心推进联盟服务群”。)

我要推荐
转发到

友情链接