×
模拟电路设计 > 详情

为部署下一代高效数据中心加速:密度规划有了新办法

发布时间:2020-07-01 发布时间:
|

传统的说明数据中心密度的方法可归结为一种粗放、不完整和不明确的方法。这些传统的方法无法提供规划指导来确保能够预见数据中心将来在最新一代的高功率密度 IT 设备下的电源和制冷性能。

本文概述了密度规范的要求,并介绍了制定密度规范的一种新方法。该方法提供了可实施的规范,可让 IT 员工和设备设计者之间明确交流各种要求,并加速了可预见成本效益和电气效益的数据中心的创建。

部署策略

在定义密度规范要求时,必须充分考虑到随时间变化的 IT 负载以及分阶段部署。必须就供电和制冷基础设施随时间的变化作出一些假设。

那种认为现有配电和空气分配系统将随着 IT 负载的变化而改变的想法是不切实际的。修改这些系统(例如修 改使用中的电路或水管)可能需要一组机架甚至整个数据中心的停机,或产生这样的风险。很多资料表明人为错误是造成数据中心停机的主要原因,而对运行中的设备进行修改是造成停机的主要因素。因此,最好的方法是按照行或区域安装供电和制冷分配设备,在该行或区域的工作生命周期内不再对其进行变更或重新配置。

在具体实施此最佳方法时,应采用如下所述的部署策略:

采用标准过道间隔在平面图上安排机架/机柜行列

确定行的设计密度规范,然后构建可支持该密度规范的完整行。

如果要部署的设备符合现有行的设计规范技术参数要求,而且该行有空余位置,则可将设备部署到该行。

如果要部署的设备与有空余位置的行的密度有显著不同,不要为了将设备部署到该行而修改供电或制 冷系统,而是应该建立新的一行以满足更高密度的要求。

随着时间的推移,应该将很少使用的机架行彻底拆除并按照符合当前需求的不同密度规范来重新建立。

由于此策略可将与修改数据中心使用中的机架行有关的人为错误降到最低,因此我们强烈推荐您采用此策略。 此行之有效的策略的确为密度规范设立了一条限制,即机架行系统的供电和制冷分配在安装后就不能改变。

注意,市场上有一些供电和制冷分配产品允许重新配置供电和制冷架构而不会造成停机的风险。例如,APC InfraStruXure 系统可以:

通过添加可热插拔的模块来改变 UPS 功率输出

通过添加可热插拔的机架配电单元来改变机架中的插座类型和容量

通过插入式架装设备来增加补充冷却气流的容量

此类设备提供了一些附加的灵活性,允许在安装之后进行修改,因此特别适用于不适合进行分阶段、分行部署的小型设施。

行或区域内的峰值密度和均值密度

尽管,每个机架具有绝对相同的负载功率可以简化密度规范,但是先前的讨论显示,这是一个不可能实现 的目标,因为在实际安装中几乎不可能做到这一点。事实上,机架密度的范围可能在零(配线架)到 30 kW(高密度刀片式服务器)之间变化。这种变化对有效的密度规范的特性产生了巨大影响。

由不同功率的机架组成的特定机架行或区域中,平均机架功率将低于最高机架功率值。因此,行内的机架功率峰值/均值比实际上往往比一大或等于一。非常有益的做法是考虑多种替换方法来指定机架行的功率密度设计,以便在行内支持具有不同机架功耗的一组机架。

将行内所有机架的功率都设计为峰值。指定行密度的一个方法为,指定行中的任何机架或所有机架的功率和制冷密度容量为机架功率的最大预期峰值。在这种情况下,总制冷容量和功率容量必须按照所有机架都可以达到最大功耗的假设情况来确定其规范。这必然会导致实际功率和制冷容量规模过大,因而导致资金和操作成本 的增加,同时降低了电气效率。如果每机架功耗的峰值/均值比等于一,则上述这些不利之处都可以避免;但是,如果行内的每机架功耗峰值/均值比为 1.5 或更高,则上述问题都会出现,另外,这个规范最糟糕的情况 就是没有考虑到可降低每机架功耗的峰值/均值比的情况,即最大值功率机架产生的负载可能呈分散分布。一般来说,在机架峰值功率最差的情况下指定整体行密度并不是最优选择,除非每个机架的功率峰值/均值比非 常接近1,但是在一般安装中,出现这种情况的几率非常低。

将行内所有机架的功率设计为平均值。指定行密度的另一个方法为,指定所有机架的功率为平均功率密度。和前一个方法一样,这个简单的方法并不令人满意,但导致不满的原因却不尽相同。这个方法要求在任何机架负载可能超过均值时,减少设备直到机架的负载等于或小于均值。此外,这个方法还存在实施上的限制,实际密度低于指定设计密度的机架所产生的未使用的功率和制冷容量并不能给其他机架产生额外的功率和制冷容量。这是因为行的设计仅仅是为了让每个机架的功率和制冷最大能达到平均值。考虑下列情况:某个 IT 操作 人员想要在设计容量为每机架 2 kW 的行中部署一个 4 kW 的刀片式机箱。有人可能会认为从未使用的机架中 引接一个 2 kW 的电源插座(如果可行)至刀片式机箱是一个可行的办法。但是,为这 4 kW 的负载制冷却成 为一个问题,因为制冷系统的设计容量在 2 kW 以下。另外,由于其中一个机架的电源被其他机架占用,因此这个机架也不再可用。

比较上述两种情况的要求,我们可以得知,有效密度规范的一个重要因素为应当指定行内的机架功率峰值/均 值比,并且该比值应当大于 1。如何选择适当的机架功率峰值/均值比取决于实际机架的预期变化。图 1 中显 示了典型数据中心设计的限制和假设这二者的关系:

图 1 显示已安装的 IT 设备中,在三种不同的实际机架功率变化的情况下,机架密度规范的峰值/均值比是如何 影响电源和制冷基础设施的标准总拥有成本 (TCO) 支出的1。数据显示,在所有机架具有相同功耗的情况下, 机架密度峰值/均值比等于一时,TCO 为最佳(最低)。这种效应的解释可归因于指定额外的峰值功率密度容 量会增加功率和制冷分配的支出,但在所有机架都具有相同功耗时不会导致总拥有成本增加。但是,如果实际 安装的机架功率不同,峰值/均值比没有增加时,则会增加总拥有成本。这是因为存在无法使用的功率和制冷容量,同时,指定的 IT 设备需要增加地板空间,二者共同产生了这种效应。结果是,机架密度的峰值/均值比大于 1,在实际安装中可获得最佳的 TCO。

这就引出了有效制定数据中心密度规范的另一个重要因素:在典型的设计中,行内的机架功率密度峰值/均值 比应当大约为 2,如果行内的预期实际机架功率密度峰值/均值比大于 2,建议在机架间分散最大密度的 IT 负 载来限制峰值/均值比,或将无关的负载重新分配到其他行。

基于规则的密度规范

如果某行或某区域中的均值和峰值机架功率密度设计已经指定为经预见可实施的规范,则该规范可行。如果峰值机架功率接近平均值,则可直接实施。但是,如果行内的机架峰值/均值比接近 1.5 或更大,则实施该设计的挑战和成本都将增加。确保只要不超过平均功率值,任何机架都可以在峰值功率的水平上操作,在使用高架地板送风系统的安装中,这样造成的问题可能会成为非常严重的限制。如果在密度规范中允许使用基于规则的 密度部署,可获得的整体均值和峰值功率密度都可以提高。

要理解基于规则的规范所解决的问题,请考虑将机架功率密度的峰值/均值比设定为建议的 2 时,在现有高架 地板制冷系统中安装机架的情况。从电源系统这方面来看,在最大机架密度下,每个机架都必须拥有一定的功 率配额,而机架则通过 PDU 或 UPS 来供电,其额定值为平均机架密度乘以 IT 机架的个数。这个方案实施起 来非常简单。但是,从冷却角度看,每个机架并不具有定义良好的空气分配系统,其额定值为平均机架密度的 两倍。要在密度超过均值时操作机架,必须从邻接的低于均值密度的机架中借用未使用的容量。在使用具有有 限通风容量的高架地板时,这就意味着在行内分散高密度机架会显著降低制冷系统上的局部超负荷。如果规范 具备建立行内高密度机架位置规则的能力,则可以在系统限制范围内获得较高的峰值和平均值密度。

具有简单规则的示例为,机架仅可以超过均值额定功率的量为相邻机架平均功耗低于均值的量。更复杂的规则 可以用来最大化已知安装中可预见的功率密度,并且这些规则可以在功率和制冷管理系统中实施2。

针对未来的增长指定密度选择

很多数据中心并不是一次完全建成,而是随着时间的推移不断扩



『本文转载自网络,版权归原作者所有,如有侵权请联系删除』

热门文章 更多
流水线型ADCMAX1200及其与DSP的接口