一、概述
银行系统是UPS的最大用户,根据2002年的调查显示,银行系统几乎占了整个UPS销量的40%,在这样高用量的情况下,也培养出大量的人才,许多银行UPS的使用者都有着很高的造诣,这无疑对正确使用设备是非常有益的。银行对UPS用量的如此之多,充分说明了它的重要性,当然也对它的可靠性提出了更高的要求。但任何设备不是绝对可靠的,总是要出故障的,关键是什么样的故障,是先天性的还是后天的,当然银行决不能选择先天不足的产品,而后天的不足也照样会导致损失。因此,为了供电的可靠就要尽量避免这两方面的问题。统计资料显示,由于UPS本身原因造成故障的比例不足30%,由于自然因素和人为的因素而造成故障的比例却占全部故障数的60%~70%。如果能了解造成此类故障的原因并加以避免,就可避免或减少很多损失。其造成人为真实故障或貌似故障的原因可归纳如下(在这里把引起人们恐慌和惊动厂家的一切机器现象统称为“故障”):
1. 怀疑“故障”
所谓怀疑故障,顾名思义,是指由于值机人员缺乏基本的分析能力和没有很好地阅读说明书而导致的误会,而这种误会虽然不是真正故障,但已按真正故障处理,比如责令厂家来人修理或让厂家包赔损失等。比如有一些10kVA以下小容量的UPS,大都没有采用液晶显示,而是用4~5只发光二极管LED竖向排列成“棒”状指示灯…………
二、可靠性与可用性上面谈到导致故障的人为因素,明白了导致故障的原因,就可以采取措施加以避免。UPS设备本身的质量问题是另一个值得重视的问题。为了避免或减少故障,应用在银行系统中的UPS不但要求可靠性高,而且可用性也必须高。
1.可用性的提出
新经济时代的一个明显趋势就是各种规模的数据中心普遍建立,局域网、广域网、互联网等互相联接,形成了无所不达的信息通道。从人们的日常生活到丰富多彩的广义的社会活动、无不对该信息通道形成一定程度的依赖性,如果在信息通道的任一环节出现故障,受影响的不是一个点,而是一条线、一个面,将造成不可估量的损失,比如在银行管理大集中的情况下,几个省的管理系统集中在一起,一旦故障那将是一个无氟骨鸡的局面。权威机构的研究表明,如果一个网站宕机,一个潜在的客户就会在 8 秒钟之内离开,而去访问另一个网站;如果一个路由器宕机,局域网上就可能有几百个用户无法工作;如果一个光纤室宕机,就可能有几千个用户断开网络连接。随着公司、员工、客户和供应商与技术的联系越来越多,也越来越依赖于技术,这些连接的重要性也呈几何级数增加,而维护电子商务的需求也使这种需要更进一步。不管您当前的可用性预期是什么,明天对可用性的预期都会向更高迈进一步。因此,数据中心规划应当包含能够满足未来需要的空间。
二、现代数据中心可用性需考虑的几个主要问题
1.在数据中心影响可用性的因素
在当前的许多数据中心环境下,一般多把正常运行时间定为“五个9”,即 99.999% 的可用性,这相当于每年的宕机时间约为5分钟。一般宕机时间持续一个小时甚至更长,相当于约每 10-20 年发生一次宕机事件。在通常情况下,由于众多数据中心子系统的相互作用,要达到这一目标非常困难。99.999% 的数据中心可用性意味着每个子系统的可用性级别要比这个值高得多。因为所有子系统叠加的宕机时间必须等于或小于 5 分钟。因此对这些因素需要认真考虑,尤其是在确定减少宕机时间所需要的费用时。
在对数据中心初建、升级或审查时,应考虑每个子系统。因为它们对于数据中心的正常运转、宕机时间会产生巨大影响。为数据中心提供的解决方案不要一味求“全”,而是应关注所提供产品的质量。某个子系统的可用性或许能够达到五个9,但由于另外有一些子系统的可用性不高,使整个系统的可用性级别很低。
为了实现总体系统的高可用性,就要按子系统进行可用性“配备”。由于每个子系统实际的可用性级别不同,因此每个子系统的可用性目标也不同。例如,水冷变压器可用性可能非常高,但泵水系统多个活动部件的可用性通常较低。这样一来,变压器的设计可用性标准可能是七个9,而水泵可能限制在六个9等。通过为不同子系统分配可用性级别来设计可用性目标,就能够在把该解决方案应用于数据中心时使总体系统实现可用性目标。