绿电供应链

赛尔电气

现代数据中心供电系统现状、问题和发展趋势
来源: | 作者: | 发布时间: 2021-03-10 | 37 次浏览 | 分享到:

  1 现代数据中心供电系统的组成

  现代数据中心最高级别的供电系统的典型架构如图1所示。

图1 现代数据中心的供电系统的典型架构

  图1是典型的现代数据中心最高级别的供电系统架构示意图。严格的故障容错能力使数据中心具有维持有计划运行维护和无计划故障或者运行错误时,不会发生机房运行过程中断的现象。

  交流输入配置了两路能源--主供电电网和完全独立的备用电网或柴油发电机,在主供电电网故障时,柴油发电机有10s~15s的启动时间,转换开关也有百毫秒级的转换时间,在后级UPS支撑下,不会对关键负载设备产生影响。

  UPS系统是完全独立的双总线系统,两个系统中的所有设备包括输入转换开关都是相互隔离和冗余的。

  UPS输出配电也是冗余的,通过两条相互隔离和冗余的线路向双输入负载供电。

  机房照明、安全、空调制冷及其他设备的供电也实现了冗余容错功能。

  2 现代数据中心供电系统存在的问题

  长期以来,业界对供电系统的认识一直停留在电力电子技术层面,很少有权威的专业机构认真地研究用户在使用过程中存在的系统规划设计和方案配置的问题。传统供电系统中存在的问题更多的表现在系统规划设计、供电方案的选择、设备的正确使用等系统工程方面,特别是很多错误的观念和设备厂商的误导,使这些问题更加严重和难以解决。归纳起来有以下六个方面25个问题。

  2.1 过度规划和生命周期成本问题

  ( (1)采用“一次到位”的方式:导致过度规划和设备利用率低下,运行4~5年后负载量增加到设计容量80%左右,而供电设备的实际负载量只达到设计容量的30%左右;

  ( (2)占地空间问题:随着IT设备的小型化,IT设备所占空间与基础设备所占空间的比例有越来越小的趋势,能否压缩整个供电系统所占用的空间成为用户的心声;

  ( (3)装配速度问题:设备采购、方案设计和系统安装都需要时间,通常情况下,数据中心的实际建设时间一般要3~18个月甚至更长的时间;

  ( (4)能源效率问题:对于传统的未刻意做节能设计的数据中心,整个供电系统的能耗占数据中心总能耗的21%,供电系统的效率在75%左右;

  ( (5)服务合同的费用问题:复杂性导致服务合同费用的居高不下,尽管用户实际只用到了70%以下甚至只有10%的容量。用户希望能够降低复杂性,降低服务合同的费用。

  2.2 供电系统的适应性及可扩展性

  ( (1)系统和部件的标准化与规范化:目前大型数据中心供电系统变得越来越复杂,导致现场工程设计工作增大和设计方案的多样性,增加了设计难度、费用和风险;

  ( (2)不可预测的功率密度问题:用电设备的功率密度不断增大和配置不均衡要求电力基础设施尽可能适应这种不断变化而又无法预测的功率密度带来的影响;

  ( (3)如何适应不断变化的其他需求:用户希望适应IT设备升级更换时带来的重量密度不同、安装要求不同、环境要求不同等扩容升级过程中可能被迫中断业务等问题。

  2.3 供电系统可用性的问题

  ( (1)断路器数量增加以及指标离散性问题:断路器选用不当和断路器参数的差异影响着供电系统保护机制,有可能发生局部负载故障而大面积负载掉电的情况;

  ( (2)操作人员人为失误的问题:造成负载宕机的大部分原因是由于供电系统复杂性极高而又缺乏处理这类复杂系统的专业技术人员等原因造成的;

  ( (3)把供电与负载之间的故障点减至最少:用户通常忽略终端配电一级的单路径故障点,例如多级断路器保护、UPS关键负载之间的距离很长;

  ( (4)优化供电布局,减少大面积断电的故障点:一旦宕机发生,希望故障的影响尽量局限在小面积的用电设备,应在集中式和分散式供电布局之间做出选择;

  ( (5)供电系统的谐波干扰问题:谐波不仅会降低输入功率因数、污染电网、增加电网容量和设备配置容量、增大损耗和运行成本,还是系统运行不稳定的一个主要原因;

  ( (6)用户与厂商之间信息共享问题:复杂性使对故障根源的分析变得非常困难。用户希望能够通过统一标准的系统收集数据和比较结果,以及规范校正和处理的措施。

  2.4 设备选用和安装使用问题

  ( (1)采购设备时存在着错误的观念和误导:用户选用设备时,希望减少或避开厂家的误导,客观地选用符合系统要求性能价格比高的产品;

  ( (2)系统设计欠缺造成潜在的质量问题:系统设计不规范、配置不尽合理、传输线布局零乱、系统零地线系统布局不规范等缺欠都会成为系统安全运行的隐患;

  ( (3)缺乏可量化的可靠性衡量指标:平均无故障时间(MTBF)是一个概率指标,因其不可测量验证而不可信,用户选用设备时希望提供可量化的可靠性指标。

  2.5 UPS对供电系统的可管理性问题

  ( (1)UPS输出的分路管理问题:用户对分支电路的超载问题比较关心,用户希望能够获得可管理的输出,希望在机架PDU上能够监控配电插座上每一个插孔的情况;

  ( (2)监控负载机柜的电源状态:用户希望有安装在本地的显示装置以提醒可能发生的故障,希望能够在巡查过程中看到每一个机柜的各个输出插座的电流情况;

  ( (3)线缆管理的问题:随着IT设备被不断地追加安装,再加上2N供电设计,这样就使数据中心的电缆数目大大增加,成为管理和宕机风险方面令管理人员头痛的问题;

  ( (4)预防性故障分析的问题:用户希望电源系统应该具备足够的智能水平以及自我诊断能力,以便能够在故障实际发生之前发现并通知这些潜在故障。

  2.6 可服务性的问题

  ( (1)减少平均维修时间MTTR的问题:系统的易管理性、故障判断、部件更换等都是减小MTTR的关键。用户希望能更准确地解决故障并尽可能地缩短修复时间;

  ( (2)降低系统的复杂性问题:系统的复杂性是维护难度大、容易产生人为失误和系统发生故障时对故障进行定位诊断所需要的时间很长的主要原因;

  ( (3)提高智能管理应用水平:供电设备已经具备的智能管理和通讯管理功能没有得到充分的发挥。权威人士估计对设备的智能管理和通讯功能的应用率大概只有30%;

  ( (4)供应商之间的相互推诿的问题:系统出现问题时,用户希望能得到一种解决方案,减少或消除供应商之间的对责任的相互推诿问题。

  3 数据中心供电系统设计理念的变化

  供电系统的问题普遍存在于已经建成并投入运行的各种规模和用途的数据中心中。问题以各种形式暴露出来,这是供电设备厂商和供电系统设计者必须面对的实际问题。暴露问题,解决问题,在解决问题的同时,数据中心建造技术不断的进步,这是一个渐变的过程。在这个过程中,供电系统设计理念也在发生着变化。

  3.1 研究工作从单台设备向整个供电系统变化

  一个完整的不停电供电系统包括输入变压器、柴油发电机组、瞬态电压浪涌抑制器、电网进线开关柜、转换开关、负载配电柜、隔离或升降压变压器、电池系统、防雷设备、断路器、保险、转插以及成百的连接点和相应的传输线。所有这些在系统中都会形成单路径故障点,电源设备厂商和供电系统设计者意识到,在不断提高关键设备的性能和可靠性的同时,还必须加强对整个供电系统的研究。所研究的问题包括:系统中各种设备与环节的相互匹配问题;系统可用性和冗余配置问题;可修复和降低修复时间问题;各种设备和环节连接技术的研究和连接的规范化问题;供电系统的布局(集中式、区域式、分散式)问题;系统的可维护性和集中管理问题;系统的可扩展性问题等。

  3.2 对系统可靠性的研究向可用性研究变化

  当代数据中心对供电系统的连续性提出了非常高的要求,厂商和用户已经形成这样一个共识:供电设备经过多年发展,在其性能指标已满足IT设备要求的情况下,真正能为用户带来价值的是可用性。可用性定义为:系统在使用过程中,可以正常使用的时间与总时间之比。可用平均无故障工作时间MTBF和平均修复时间MTTR表示,可用性

  。从定义和表达式来看,提高系统可用性的措施不外乎两种,一是提高可靠性MTBF,二是降低故障后的修复时间MTTR。要研究的问题包括:系统可修复和可快速修复设计;设备和系统的冗余可容错技术;设备的模块化可在线热插拔维护和扩容技术;系统的集成一体化;智能管理和与IT系统无缝集成的通讯管理技术等。

  3.3 提高供电系统的“适应性”

  当经济环境的变化周期小于设备的生命周期时,就会对设备的适应性提出要求。由于技术发展和经济环境的不确定性和不可预测性,要求一台设备能够自动而有准备地适应新的需求是根本不可能的。系统要适应的变化包括:经济形势的变化;IT设备技术革新和功率密度的变化;维护人员操作水平的变化;组织管理模式的变化;设备运行场地的变化等。对于供电系统来说,要适应这些变化,需要考虑以下的设计思路:模块化标准化设计;开放式设计;集成化设计;系统可修复性设计等。

  3.4 集成一体化设计理念

  以上讲到的供电系统存在的问题和系统设计理念的变化,导致了供电系统集成化、一体化设计理念的产生,集成一体化设计理念遵循了以下四点原则:各供电设备制造和供应渠道的统一化;各供电设备和环节(包括负载机架)结构的一体化和连接的规范化;各供电设备和环节(包括机架中的PDU)电源状态管理的集中化;各供电设备和环节结构的标准化模块化。

  3.5 系统模块化成为供电系统设计的基本原则

  现代数据中心对机房基础设施可用性的最基本的要求是:“现代数据中心要求机房基础设施必须是一个能连续工作的系统”。但是,任何设备和系统都是要发生故障的,因此,“一个能连续工作的系统必然是可修复和可快速修复的系统”。如何确保系统和组成该系统的设备是可修复和可快速修复?“一个可修复和可快速修复的系统,要求组成该系统的所有子系统必需要具备模块化特征”。

  模块化的定义与特征是:

  l (1)模块是系统中一个具有定义明确的功能和可独立运行的单元;

  l (2)结构上可整体安装、拆卸、更换、移动;

  l (3)相同单元可冗余并机运行。

  一根线缆、一台整机UPS、空调机,它们都具备模块化特征,都是一个模块。

  系统模块化使一切事情变得更加便利、更可预测、更为经济、更易于理解以及更加安全。“系统模块化设计”观念在行业中正在上升到一个新的高度,成为了一种富有创造性并具突出战略意义的设计哲学。

  4 传统UPS设备电路技术的进步

  存在问题是电源技术发展的动力,在新的设计理念指导下,UPS设备在电路技术、系统配置和电气性能等方面都取得了长足的发展和进步,其中最有应用推广价值的新技术、新产品当属无输出变压器UPS(高频机)、模块化UPS、直流输出UPS。

  4.1 无输出变压器UPS(高频机)逐渐成为现代数据中心UPS设备的首选机型

  50年来,随着功率半导体器件和电力电子技术的进步,UPS设备经历了由带多个输出工频变压器到单个输出工频变压器的演变过程,而性能更好的大功率IGBT器件和更先进的控制技术的出现,为UPS设备从根本去掉输出隔离变压器创造了物质条件,使其在高频化、小型化、节能化和绿色环保化方面取得了长足的进展,这就是人们所说的“高频机”。这种机型集中体现了UPS电路技术的进步,代表着UPS技术的发展方向。与传统的带输出变压器的UPS“工频机”相比,它在进一步缩小体积、减轻重量、改善性能、提高效率、降低成本等方面,都取得了明显的改善和进步,特别是它采用了IGBT输入整流技术,从根本上抑制了输入谐波电流的产生,输入功率因数高达0.99,输入谐波降到3%以下,克服了“工频机”输入谐波大的固有缺点,所以逐渐成为现代数据中心UPS设备的首选机型。

  自“高频机”推向市场以来,讨论和争论的焦点是其可靠性问题,设备的可靠性与多种因素有关,包括:电路研制定型水平、器件选用差别、生产工艺水平、质量管理流程等。电路结构变化有个技术成熟的过程,当然还包括所选用的器件性能对新电路结构的适应能力。所以说电路结构的变化对设备可靠性是有影响的,影响大小最终取决于两个主要因素:电路技术成熟程度和器件水平。大批量应用的实践表明,“高频机”技术成熟是毋庸置疑的,当前器件性能水平也完全能够满足新电路结构提出的要求,应该说,当前器件水平能够做多大功率的“工频机”,就可做多大功率的“高频机”。从产品的输出性能指标数据来看,足以说明“高频机”UPS的输出能力和可靠性指标与“工频机”UPS一样,都达到了很高的水平,可靠性已不再是影响“高频机”UPS推广使用的关键问题。

  4.2 模块化是UPS设备的主要发展趋势

  在本文第3.5节中讲到系统模块化成为供电系统设计的基本原则,数据中心供电系统建造中的很多问题都与系统模块化程度有关。供电设备厂商首先把模块化设计理念用在UPS供电系统的设计中,把冗余容错和快速插拔修复技术同时应用到一台UPS中,这就是当前已在市场上广泛推广应用的“模块化UPS”。模块化UPS是可用性级别最高的模块化系统,引领着数据中心基础设施设计建造的理念和方向。

  模块化UPS可以认为是一个具有多重冗余结构的可扩充、可快速修复的模块化系统,图2是其典型的结构示意图。

图2 模块化UPS系统体系结构模型

  从图2可以看出它本质上是一个集成化的N+1冗余并机系统,再加上可快速拔插修复的模块化结构,使其在很多方面具有单机UPS无可比拟的优势。

  l (1)提高可适应性:模块安装和无需现场调试提高部署速度;提高可扩展和重新配置能力;集成化可使空间的配置达到最佳状态;提高了现有设备重复使用的能力;

  l (2)提高可用性:标准化提高可靠性;返回工厂维修提高维修质量降低再故障率;拔插修复最大限度减少平均恢复时间;模块化使系统更容易理解与操作,减少和消除人为错误,加快诊断速度和正确性;提高用户自己进行诊断与更正的可能性;

  l (3)降低总拥有成本:紧密配合当前需求规划、简化部署步骤、减少设计和现场安装工作量、将设计咨询和定制安装服务的需求降到最低等都可降低投资成本;易于学习、减少操作出错几率可降低运维成本;提高设备容量利用率可降低能源成本。

  4.3 直流输出UPS可大幅度提高系统可靠性

  传统的UPS供电系统存在的主要问题是如何有效地提高系统可靠性。可靠性不高是传统的UPS设计理念造成的,而传统设计理念的结症又可归结为备用能源配置方法问题。备用能源(电池)要经过UPS设备中最薄弱环节--逆变器才能向负载供电,这是造成UPS系统可靠性难以有效提高的根本原因。改变备用能源配置方法,由备用能源(电池)直接用直流电压对负载供电,就可大幅度提高UPS系统的可靠性。如图3和图4所示。

  比较图4和图3在可靠性方面的差别表现在以下两点:

  l (1)备用电池与市电+UPS供电系统形成冗余并机系统,高可用的备用电池从根本上隔离了市电和供电系统的故障,可使整个系统的可靠性得到明显地提高;

  l (2)电池的可靠性得到了充分的发挥。在图3中电池供电的可靠性是电池与UPS输出DC/AC逆变器的串联,而在图4中,电池供电的可靠性就等于电池本身的可靠性。

图3 交流输出UPS备用能源配置 图4 直流输出UPS备用能源配置

  从技术革新角度讲,UPS输出直流化改革的难度并不在于直流UPS设备本身,对交流输入电源进行AC/DC变换并形成直流不停电供电系统并不存在技术难关,所用的电路技术都是很成熟的。但是,这种变革不是由供电设备厂商就可完成的,UPS的输出负载是数据中心关键IT设备,要使直流UPS最终在数据中心中推广使用,就需要IT设备厂商直接参与,并对IT设备的开关电源做相应的匹配和适应性的研究工作,包括将开关电源的输入开关、保险、继电保护等交流器件改为直流器件,重新设计DC/DC变换器以适应直流UPS的输入直流电压等,这种变革必然是一个漫长的过程,目前已进入改变观念、技术研发、方案论证和系统试运行阶段,这是一个可喜的开端。

  5 UPS设备的技术变革-从根本上去掉传统的UPS

  从根本上去掉传统的UPS环节,自然就可以根除传统UPS的固有缺欠和问题。

  5.1 组成UPS供电系统的基本能源条件

  组成UPS供电系统需要三种不同功能的能源:

  l (1)连续供电的主输入能源:通常是电网市电,做为主要的连续输入交流能源;

  l (2)连续供电的备用能源:通常是第二路电网市电或者柴油发电机,当主输入能源故障时保证连续输入交流能源;

  l (3)过渡备用能源:具有储能功能的器件和设备,在备用交流能源启动和输入主备交流能源转换期间保证IT设备连续不间断供电。

  5.2 去掉传统双变换UPS的可能性

  传统UPS系统选用蓄电池做为系统过渡能源,并将其配置在交流供电系统中,蓄电池充电需要AC/DC变换,蓄电池供电需要DC/AC逆变,这就决定了传统UPS的结构形式双变换,如图5所示。这种结构形式必然存在的固有问题可概括在两个方面:可靠性低下和谐波污染。

  几十年来,UPS设备厂商把主要的研发工作都投入到解决抑制谐波和提高可靠性上来。

  抑制谐波:6脉冲整流+5次无源滤波;12脉冲整流+11次无源滤波;在UPS输入端配置有源滤波器;研发PFC(IGBT)整流技术;

  提高可靠性:系统集成一体化;模块化;冗余并机技术;提高智能管理功能。

  如果备用蓄电池不放在交流系统中,自然就可去掉系统中最薄弱的环节AC/DC(电池充电)和DC/AC(电池供电)环节,如果不用蓄电池做备用能源,自然也可去掉系统中最薄弱的环节AC/DC(电池充电)和DC/AC(电池供电)环节,这就是对传统UPS进行彻底变革设想的出发点,应运而生的是:机架UPS系统和机械储能UPS系统。

图4 传统双变换UPS产生过程和固有缺欠

  5.3 机架式UPS

  改变蓄电池配置位置,借用IT设备内开关电源完成过渡储能功能。具体做法是:

  l (1)交流输入集中配置,包括输入变压器、油机、ATS转换开关、总配电;

  l (2)IT设备内部去掉传统12V输出开关电源,保留低压DC/DC变换;

  l (3)在机架中配置集中式12V或48V输出开关电源,模块化冗余配置,保证对IT设备的供电质量;

  l (4)在模块化开关电源系统输出端集中配置蓄电池(12或48V),组成不停电供电系统。

  于是,传统UPS系统消失了,不仅供电系统的成本、复杂性、占地面积、效率、维护难度等问题就不复存在了,因去除了高压高功耗的开关电源,IT设备本身也可做优化设计。

  5.4 动态储能UPS

  采用机械储能做过渡能源,组成集成式动态UPS,如图6所示。

  同步交流发电机与市电一起向负载供电,并与电抗器(另接)调整输出电压质量和滤除谐波;感应耦合器是储能装置,当市电中断时,取出感应耦合器内转子上储存的动能驱动发电机继续给负载供电,并及时起动柴油发电机使之达到稳定状态,接替市电向负载提供电能。自由轮离合器在感应耦合器/发电机/柴油机之间起机械通断作用。在市电正常时,柴油机处于停止状态,离合器断开,发电机处于待机状态,市电中断时,柴油机起动,当达到额定转速时,离合器自动接合,由柴油机向负载供电。整个转换时间约为5~10s;当市电恢复时,这种动态UPS会与市电同步,转由市电向负载供电,离合器断开,柴油机与感应耦合器不再有机械连接,逐渐停止运转,回到待机状态。

图5 集成式机械储能动态UPS