公司动态

联系方式

施耐德电气APC梅兰日兰UPS销售中心
联系人:渠经理
电 话:400-678-3410
销 售:133-7175-8512
地 址:北京市房山区良乡凯旋大街建设路18号-D14697

当前位置: 首页 > 公司动态 > 公司新闻
公司新闻

施耐德数据中心论坛 | 数据中心温升专题(二) 控制数据中心停电后温升有效策略的探讨

在上一期的论坛中我们谈到数据中心制冷系统中断后,数据中心架构及其IT负载对IT设备能够获得的持续运行时间有重大影响。数据中心的一些技术趋势,比如:提高功率密度,提高送风温度,选用“合理配置”的制冷设备,以及采用气流遏制系统,在实际上,都可能会加快数据中心的温升速率。然而,为关键制冷设备配置后备电源,选择具有快速重启功能的设备,保持充足的储备制冷容量,以及部署蓄冷装置都可以有效地应对突发的断电情况。本文将探讨温升预测动态模型的建立,分析影响瞬时温升的主要因素,并提供切实可行的策略来确保断电期间的制冷问题。

一、建立温升预测动态模型
对数据中心在停电后温升情况知之甚少的原因之一就是数据中心设计人员和管理人员缺乏简单的工具来帮助他们预测在紧急情况下的制冷性能情况。然而,施耐德电气最近开发出来的建模工具可以轻松估算数据中心在制冷系统中断后的温升情况。该工具利用的是空气完全混合模型,是将数据中心理想化成一个气流完美混合的单一CRAH或CRAC以及单一的IT负载。因此,在任何给定的时间,它都拥有唯一均匀的数据中心温度,唯一通道内温度以及唯一冷却器的送风温度等。
 
该模型从整体来看是严格正确的——对于某个特殊的位置并不精确——但足以满足本研究对IT设备进风温度的研究。简单的空气完全混合模型的设计参数包括冷冻水的蓄冷量,CRAH风机、冷却水泵和制冷设备与UPS和发电机的连接情况。该模型的构建速度和简易性使我们可以非常容易并且迅速的检讨各种假定场景下的结果。因为我们现在的主要目的是了解一般情况下断电时与温升相关的机理以及如何制定相应的设计策略(而不是针对某一特定的数据中心),空气完全混合模型正是我们的首选工具。下图所示为上文所述的空气完全混合动态模型工具。

1.png

下图所示的是利用传统CFD模型对某个数据中心研究其在制冷中断后的温升情况。出于简单方便的考虑,我们只模拟了制冷中断的场景并且假设在模拟时间段内后备电源或其它电源没有让任何制冷设备得以恢复。为了对完全空气混合模型进行验证,我们在这里提供了两种模型结果的对比。从数据上可以清楚的看到,大约5分钟后,所有位置的温度都达到不可接受的温度范围。此外,由于机柜反复循环自己的内部气流,“冷”通道很快变得比“热”通道还热。虽然CFD模型可以显示出详细的空间温度变化,但是空气完全混合模型也能有效的体现出总体室温随时间的变化。

2.png


二、分析数据中心断电后的温升情况
下表所示为一假想数据中心参数的假设,利用该表中参数,采用空气完全混合模型进行数据中心制冷系统中断后温升的研究。

3.png


下图所示为数据中心断电后一系列温升的变化。从图中可以看出,在断电后,室温迅速上升,而地板通道内的空气温度保持恒定,这是因为此时CRAH机组处于“关闭”状态。1分钟后发电机启动,向CRAH风机和冷冻水水泵供电。这时室温先下降然后再次升高 - 送风温度和地板通道内的温度也与室温一起上升——这是因为管道系统里冷冻水逐渐变热。11分钟后,冷水机组开始冷却冷冻水,并且所有温度开始朝着正常值的方向进行恢复。在这个示例中,室温在断电后在稍微超过允许值的状态维持了约3分钟,然后一直保持在不可接受的高温区域直到17分钟后。

4.png

三、有效的温升控制策略
知道了数据中心在停电后的温升特点,那么我们就可以通过改善设施制冷系统的设计来实现应急情况下较长的运行时间。下文将重点探讨四个有效的控制数据中心温升策略。

1.保持充足的储备制冷容量:正如我们上一期论坛所讨论的,“合理配置”制冷容量的行业技术趋势在正常运行条件下是可行的,但是即使只稍微比负载大一点的制冷容量都可以大幅延长可以用来冷却过热设施的时间。提高制冷系统效率的关键在于随着IT负载的增加应相应扩大制冷机组(比如:冷水机)和制冷分配装置(比如:CRAH)。这样既能提高数据中心的效率,又能保持充足的储备制冷容量。比如,一个设计最大IT负载为1MW的数据中心,在最开始的时候可能只有100kW的IT负载。当冷冻水系统管网按照数据中心最大负载设计规划时,安装的冷水机组可能仅支持250kW总热负荷,或者大约140kW的 IT负载。实际的“过度规划”视冗余要求和组件效率而定。
 
 2.为制冷设备配置后备电源:从温升图中可以看到,第一个温度峰值的发生是因为CRAH的风机和冷冻水水泵不能正常运行,并一直持续到发电机在断电一分钟后启动为负载供电时。这次温升的最大驱动因素是IT功耗和风量的比例。在制冷系统发生故障后,在设施热容量(比如:墙体、通道、服务器等)能够有效吸收热量前,所有的IT功耗都将用来加热空气。温升速率很容易立即达到 5°C/分钟,根据功率密度和房内布局的不同,甚至可能更高。除非CRAH风机和冷冻水水泵接了UPS和/或数据中心的负载非常小,否则,这次温升几乎都会超过磁带供应商所规定的温度梯度变化值或者ASHRAE 热指南中的相关要求。
 
在低负载设施中(比如:20%负载),在发电机启动前,仅将CRAH或CRAC连接到UPS,可以帮助维持适当的制冷气流,防止IT设备热排风直接循环回到IT设备进风口,并且可以帮助将热量转移到设施内具有预冷热容量的物体内。除此之外,如果再将冷冻水水泵连接到UPS,可以在发电机启动前更有效地减缓初次温升的峰值,特别是采用冷冻水式CRAH机组的系统。这时,仅靠冷冻水和管道系统的热容量就能较大程度上延长断电后可用的运行时间。如果是未配置自然冷却盘管的乙二醇DX系统,那么将冷却水泵连接到UPS一般不会发挥作用,因为需要使用发电机电源来重启CRAC。
 
如果制冷机房离数据中心较远,或者冷冻水管网使用双环路系统(用于冗余配置和实现高可用性),管道内会储存大量的冷冻水。如果数据中心位于大型多用途建筑内,数据中心很可能与建筑共用冷水机组,这也可以提供庞大的制冷容量。值得注意的是,数据中心设计者和运营者应当与设施管理人员进行沟通,以确保在紧急情况下数据中心具有最优先权来使用储存的冷冻水。
 
对于以上两种情况,应视风机、冷冻水水泵和后备情况,它们可能需要配置独立的UPS以避免干扰IT设备。如果风机、冷冻水水泵和IT设备使用同一个UPS系统,则应为机械负载配置隔离变压器。

对于UPS位于单独的配电室,配电室有单独的空调系统的情况。如果UPS的支持运行时间较长,比如10~15分钟,设计者往往会忘记配电室的空调系统在断电时的持续制冷,很有可能配电系统的高温导致宕机。因此也需要计算配电室的温升,为空调机组配备UPS。
 
3.使用具有快速重启功能的设备:冷水机重启时间是指从冷水机在断电发生后重新接通电源开始到它能够重新提供额定制冷量的这段时间。所有冷水机都有自我保护功能以免在异常情况下被损坏。
 
 一旦电源恢复,冷水机会检查组件状态,比如控制板、压缩机、润滑油系统以及水系统。如果系统检查结果显示正常,那么冷水机将启动并尽快恢复冷冻水出水温度。整个过程需要几分钟的时间,并且取决于冷水机机组的类型。影响冷水机组重启时间的因素包括冷水机机组的配置、润滑油的压力、控制器重启的时间、诊断检查能力,断电类型及冷水机从启动到满载所需要的时间。
 
冷水机控制系统一般能够撑过时间短于四分之一周期的断电(50Hz系统为5毫秒,60Hz系统为4毫秒)。如果断电时间更长,那么在电源恢复时(市电或发电机电源)则需要重启。重启时间一般为10-15分钟。随着冷水机组技术的进步,一些冷水机组的重启时间可以降低至4-5分钟,缩短了60%。有的甚至缩至2-3分钟,下图所示为启动时间为2-3分钟的施耐德电气风冷冷水机。该冷水机组可以免除控制器硬件初始化的时间和固件初始化时间,具体措施包括:

措施一:当采用双电源输入. 控制器供电和主机(压缩机)供电分开时,将控制器供电连接到UPS。如果冷水机组自带水泵,也可将水泵包含到UPS供电输入上。
措施二:当单路供电输入时,其配置的超级电容,可保证控制器在主供电断电时,仍然处于待机状态。

冷水机快速重启功能不仅对初期的断电至关重要,当ATS(自动转换开关)将电源从发电机切回市电过程中瞬时掉电(100毫秒至1秒)时也非常关键。

5.png


让我们再回到数据中心断电后温升图,第二个温度峰值的发生是因为冷水机需要10分钟的时间进行重启来承担制冷负载。但是,如果重启时间为5分钟,数据中心的温度将只会稍微高出可接受的限值32°C而不是超过41°C。
 
高成本的带快速启动功能的冷水机可能不足以在高密度数据中心里防止不可接受温升的出现。然而,在低密度数据中心,该机组在所有情况下都是非常有用的,它可能在断电期间将温度完全控制在可接受的限值内。此外,它还可以实现在正常运行条件下采用更高的冷冻水和IT温度,同时降低在紧急情况下温度超过可接受限值的风险。通过分析冷水机机组的类型和紧急情况操作功能的重要性,我们需要在投资成本和运营成本之间找到一个平衡点。

 4.使用蓄冷装置度过冷水机重启这段时间:对于冷冻水系统来说,可以利用附加的冷冻水储备制冷直到冷水机重新启动。如果冷冻水系统的冷冻水水泵和CRAH风机接了UPS,以及蓄冷罐选择的足够大,可以将温度在紧急情况下控制在偏离正常运行状况很小的范围内。
 
用于制冷系统的低压蓄冷装置比将冷水机接到UPS的初始成本低得多,甚至可以采用塑料材质的蓄冷装置。蓄冷装置的体积和类型取决于多种因素,包括空间的限制和承重的能力(如果安装在屋顶或抬高的地板上)。尤其建议用于高密度的数据中心,因为即使非常短暂的制冷中断都会造成很大麻烦。
 
蓄冷装置应该考虑内部的温度分层。对于直径较大的蓄冷罐,混合层的高度可以通过利用布水器来控制热回水进入罐内的速度来降低。此外,还应该设置旁通管以便可以在冷水机重启后将蓄冷罐旁通。这样做可以立即将最冷的冷冻水输送到数据中心而不是用于重新冷却蓄冷罐内的水。一般来说,在计算储冷罐容量的时候,应考虑配电室持续制冷对储冷量的影响(当配电室采用与IT机房一样的冷冻水空调时);为了实现冷机重启后的快速制冷,一般可不考虑供回水环路的水容量。

四、温升控制策略效果分析
接下来将讨论利用 “空气完全混合”模型来考虑在市电中断后各种缓解温升策略的相对优缺点。下图所示为数据中心断电时执行各种温升减缓策略后的室温变化状况,“基准线”表示的是假定CRAH风机和冷冻水水泵只接发电机。如果将CRAH风机连接到UPS,在发电机启动前的初始阶段会有一定的温升缓解,因为地板通道内预冷的冷热容可以提供额外的热容量。(需要注意的是空气完全混合模型可能会低估将CRAH或CRAC连接到UPS所起到的作用,因为它没有考虑恰当的气流管理所提供的额外优势,即避免热风容易地再循环到机柜的进风口。)

6.png


如果将CRAH风机和冷冻水水泵都连接到UPS,则可以消除初始的温度峰值,因为管道系统的热容量可以立即发挥作用。如果冷水机的重启时间从10分钟(从系统中断算起为11分钟)缩短到5分钟(从系统中断算起为6分钟),可以更快的恢复到可接受的温度范围,最高室温也将从41°C降至37°C。只单独增加蓄冷装置不会对发电机启动前的初始阶段产生任何作用,因为CRAH风机和冷冻水水泵都没有连接到UPS上。但是,一旦发电机启动,冷冻水的储备可以有效地将数据中心的温度控制在接近可接受限值左右直到(标准的)冷水机能够重启。最后,如果采用以上所有策略,只会在(具有快速启动功能)冷水机重启之前出现少许的温度升高,但不会超过可接受的限值。
 
根据上文的分析,根据数据中心制冷系统的类型,对四种策略进行推荐:

策略1.将CRAH或CRAC风机连接到UPS:目标是降低发电机启动前初次温升的峰值。唯一对风冷式DX系统有效的策略;对水冷式和乙二醇冷却式DX系统可行;对冷冻水式CRAH最好采用下述的策略2。
 
策略2.将CRAH或CRAC风机以及冷冻水水泵连接到UPS:目标是消除发电机启动前初次温升的峰值。对于水冷式和乙二醇冷却式DX系统来说,效果并不比策略1更好;对于冷冻水式CRAH和“多重制冷”式DX CRAC系统来说,效果比策略1好。
 
策略3.使用具有快速启动功能的冷水机组:目标是降低发电机启动后冷水机重启前二次温升的峰值。对冷冻水式CRAH,和采用冷水机的“多重制冷”DX CRAC系统有效。
 
策略4.进行冷冻水的储备:目标是降低发电机启动后冷水机重启前二次温升的峰值。对冷冻水式CRAH,和采用冷水机的“多重制冷”DX CRAC系统有效;对于冷冻水式CRAH系统,如果和策略2结合使用,效果会更好。

五、结论
对于冷冻水CRAH系统,最好的选择是首先确保CRAH风机和冷冻水水泵连接到发电机, 然后增加蓄冷装置来控制冷水机重启期间的温升。对于高密度机房(初始温升峰值较大),则可能有必要将CRAH风机和冷冻水水泵连接到UPS以避免在发电机启动前出现不可接受的高温。对于新建数据中心,采用带快速启动功能的冷水机组可能是上策,但对于改善已有数据中心在紧急情况下的响应,其他策略更为经济。
 
对于DX CRAC系统,第一步也是将所有组件连接到发电机。对于风冷式,乙二醇冷却式和水冷式机组,将CRAC风机连接到UPS,在发电机启动前的初始阶段发挥作用也有可能是可行的。(需要注意的是,对于部分CRAC机组,将风机连接到UPS反而可能会在电源恢复时影响DX系统的启动时间)。对于不配置自然冷却盘管的乙二醇冷却式或水冷式DX机组,将水泵连接到UPS不会带来额外的好处,因为冷却液直到CRAC重启后才能被使用。但对于配置了单独的自然冷却盘管的乙二醇冷却式或水冷式DX机组,将水泵和风机连接到UPS则可以带来好处。当然,也可以利用UPS为整个DX CRAC供电;但需要加大机组型号,而且价格昂贵,并导致正常运行条件下的效率低下。
 
对于带有“多重制冷”功能的DX CRAC系统,通过增加冷冻水盘管来提供制冷量的冗余。制冷量可以来自内部压缩机(通过DX盘管)和外部冷水机(通过冷冻水盘管)。对于这样的系统,将CRAC风机和冷冻水水泵连接到UPS更为有效。因为CRAC能够比冷水机更快的重启,蓄冷也可以发挥作用。

至此,关于数据中心温升的讨论告一段落。接下来我们将进行数据中心气流管理专题的讨论,包括热点产生的根源、气流遏制系统对数据中心能效和可用性的贡献、部署气流遏制系统需要考虑的因素、气流遏制系统常见类型分析等等。敬请关注下一期:施耐德数据中心论坛 | 气流管理专题(一)缺乏气流管理是造成数据中心热点产生根源的探讨。


施耐德SPupsapc.jpg

分享到:
点击次数:  更新时间:2016-03-16 19:29:19  【打印此页】  【关闭