您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 3G/4G/5G技术 > 确保边缘计算站点可用性的实用指南
确保边缘计算站点可用性的实用指南版本0第280号白皮书作者:VictorAvelar摘要IT利益相关方现在已经意识到在其经营业务的分布式站点部署计算设施的必要性,因为他们的部分或全部业务是运行在这些分布式站点的。评估这些边缘站点的重要性可以揭示哪些站点更需要提高可用性。施耐德电气在边缘计算环境评估方面的经验显示,有必要采取一系列实际行动,通过改进IT物理基础设施系统来提高IT设备运行的可用性。本白皮书介绍了通过细分的八大关键系统提升可用性的具体方法,包括供电、制冷、物理安全、环境和管理。为本白皮书评分施耐德电气–数据中心科研中心第280号白皮书版本02确保边缘计算站点可用性的实用指南分布式IT设备通常部署在狭窄房间内,机柜里,甚至将其作为办公室的一部分。但是,随着企业规模不断扩大,其对IT边缘计算应用的依赖性将日益增加,因而IT设备宕机会对业务造成更大的影响。我们对某小型食品经销商的采访证实了这种敏感性。随着该食品经销商餐馆客户的不断增加,他们发现没有IT系统的支持根本无法准时、精确地完成订单。这些系统如果宕机,不仅会中断销售计划,甚至还会导致餐馆延误下单。只要有几次无法按时交付,餐馆就会寻找新的食品供应商。下列是本次研究所发现的几例宕机原因:•误拔服务器插头。IT管理人员搞错了塔式服务器的连接线。“乱得像老鼠窝”一样的电源和网络布线,大大增加了这种错误的可能性。后来,双电源成为关键IT设备的标准配置,以避免上述人为失误。•高温导致的服务器故障致使系统强制关机。•在短暂的断电期间,部分IT设备关闭。后来才发现这些设备一直未接入已安装的UPS电源。最可能的原因是机柜后部的布线杂乱无章。•一名清洁工拔掉了服务器插头,插上吸尘器电源。•断电导致同一个分支回路的IT机柜内的系统全部宕机。IT管理人员到达后才发现UPS已经持续发出信号,提示需要更换损坏的电池。对于许多企业尤其是小型企业而言,需要经历一次宕机事件或一系列险肇事件后,才会最终通过投资来提高IT设备的可用性。在许多情况下,这会推动新的IT升级项目。升级项目是评估支持IT系统所需物理基础设施性能的最佳机会。但是,研究表明,IT经理通常没有时间来研究并确定合适的解决方案和部署方案。我们通过两份白皮书阐述了这两种需求。本白皮书提供了有关如何提高这些站点的IT系统可用性的实用指南,而第174号白皮书《部署小型服务器机房和微型数据中心的可行方案》介绍了在一个或多个场所部署微型数据中心的可行方案。此外,还应该执行健康评估,以确保旧设备的现代化改造,如第272号白皮书《数据中心基础设施现代化改造的框架》中所述。在着手提升站点可用性之前,首先要了解需要关注哪些站点。第256号白皮书《为何云计算需要我们反思边缘计算的弹性》,提供了相关指导,旨在帮助确定哪些站点最需要提高可用性。确定站点后,再选出提升哪些方面的可用性对业务最有意义。施耐德电气在边缘计算环境评估方面的经验显示,有必要采取一系列实际行动来提升IT设备运行的可用性。本白皮书提供了一系列方便易用的核对清单,协助您对这些需要提升的项目进行评估。这些需要提升的项目适用于IT负载容量达到10kW的小型服务器机房和微型数据中心。建议打印每小节中的核对清单,然后在对实际站点进行评估的时候,与您认为会有意义的改进项目进行逐项比对。在核对各项清单时,应检查您的选择是否与清单一致。例如,如果制冷系统仅在工作日的上午9点到下午5点运行,那么将钱花在双路电源输入和双路服务器则是不明智的做法。这个时候制冷系统是“最薄弱的环节”,即使服务器电源的可用性再高,仍然会由于热关机而导致宕机。请注意,有许多科学的数学工具和服务可用于量化不同措施对可用性的影响。如果宕机成本相对而言高于定量分析服务的成本,建议进行严谨的定量分析来为您的边缘站点设计提供信息。根据最高优先级对改进措施进行定性排序。这究竟意味着什么?这意味着,与基准线相比,我们认为列表中越靠前的项目,在同样的成本下可以带来的可用性就越高。在本白皮书中,基准线是位于开阔房间地板上的一系列IT设备,它们由市电直接供电,仅需边缘站点提升可用性的可行方案简介施耐德电气–数据中心科研中心第280号白皮书版本03确保边缘计算站点可用性的实用指南要舒适性制冷。例如,在供电方面,我们认为小型机架式UPS(无旁路)即可大幅提高可用性,且需要的资金相对较少。如果需要在添加UPS旁路或安装发电机之间选择,我们认为可以通过添加UPS旁路来获得更高的可用性。这是我们用于所有类别提升的通用逻辑。这些改进措施通过下列系统实现:•电源•制冷•机柜•物理安全•消防•环境•网络连接能力•管理电源可以说,这个子系统最为关键,因为它为包括IT设备和制冷系统在内的所有系统供电。表1提供了UPS和发电机改进可用性的考虑因素。电源核对清单(按优先级由高到低排序)将关键IT负载连接到UPS(N,N+1或2N)-首选锂离子电池,因为与铅酸蓄电池相比,锂离子电池具有更长的使用寿命和更高的能量密度。通过UPS专用供电回路供电,防止其他负载导致断路器跳闸。第48号白皮书《比较各种机架电源冗余配置的可用性》对不同冗余方案的差异进行了量化。2NUPS设备和配电系统是配合双电源负载使用的理想选择,例如服务器和域控制器等。图1为带UPS冗余的单个42U机柜预制集成解决方案示例。确保UPS旁路功能-防止过载或UPS故障时关键负载宕机。如果UPS没有内置旁路(通常为单相UPS),可以添加外部旁路模块(图2),但请注意,此类添加的解决方案无法在UPS过载时不间断地将电源切换到旁路。将关键IT和制冷系统连接到备用发电机-发电机可以显著提高可用性,尤其是在电能质量较差的场所。如需了解有关此主题的指导建议,请参阅第52号白皮书《四步确定小型数据中心是否需要备用发电机》。注意,仍有必要配备UPS,以确保在短时断电期间为关键负载提供不间断电源。在IT机房内预留至少两个用于维护的插座-例如20A(北美)和16A(欧洲),以便于接通电源。机房内没有闲置的插座,会增加人们将未经许可的设备,插入关键IT电源回路插座上的可能性。例如,在IT电源回路上插入吸尘器插头,可能会导致UPS过载以及负载断电。将维护插座连接到发电机(如有)-可以在长时间断电期间将本地制冷设备接入维护插座。将其标记为发电机插座,通常为红色。使用远程开关式机架式配电单元(PDU)-远程打开/关闭各个插座,以重新启动宕机的服务器或关闭未使用的插座,进而防止未经许可的设备通电。将IT负载电源线更换为可锁定的IEC标准电缆-大多数IT设备都配有可拆卸的电源线,防止有人在机柜内进行更换作业时意外宕机(参见图3)。为机架式PDU采用锁定式输入接头-防止意外拔出机架式PDU插头,避免导致其连接的所有负载断电。对于非锁定式接头,可使用塑料拉链式扎带(绑带)进行替代。施耐德电气–数据中心科研中心第280号白皮书版本04确保边缘计算站点可用性的实用指南供电改进措施基准可用性提升UPS冗余1NN+1或2NUPS正常运行时间(带备用电源)110分钟15分钟UPS正常运行时间(无备用电源)110分钟30分钟至2小时取决于市电质量正面背面1采用发电机、燃料电池或其他技术在断电期间供电。用颜色标记冗余电源-使用双UPS和IT设备时,A路和B路馈电电缆和机架式PDU可采用不同的颜色标记,以避免人为失误,例如:人为失误地将A/B两路电线均连接到同一馈电回路(例如,采用蓝色和红色或蓝色和橙色,以方便色盲者识别)。将所有机柜门和配电盘接地-这关乎安全,如果机柜的任何金属外露部分导电,断路器会脱扣断开电源回路。表1UPS正常运行时间和发电机可用性考虑因素图1内置冗余的单机架式微型数据中心示例施耐德电气–数据中心科研中心第280号白皮书版本05确保边缘计算站点可用性的实用指南制冷关于制冷的主要决策是确定哪种制冷系统最能满足您的需求。第68号白皮书《IT配线间和小型机房的制冷策略》提供了基于IT设备电源和目标室温的制冷策略的一般准则。在多数情况下,由于IT机房缺乏专门的制冷支持,从而导致设备过热。这些IT机房通常依赖于舒适性制冷系统(见边栏)。在舒适性制冷下,IT设备的温度很少受自身的恒温器控制,因此通过降低环境温度来帮助IT设备散热,将会对周围的人员产生不良影响。以下改进有助于提高制冷效率。制冷核对清单(按优先级由高到低排序)使用专为全年无休全天候运行而设计的制冷系统-IT设备全年连续运行;因此,制冷系统必须具备相同的能力。将IT设备入口温度设为ASHRAE在2015年发布的《热指南》中建议的18-27°C(64.4-80.6°F)工作温度范围。使用盲板封住未安装设备的空间-如果没有这些盲板,热回风(从机柜后部)返回前部的进风口,导致IT设备出现热点。此措施有助于避免设备热宕机,并减少使用容量过大的空调以至于使空间过冷。如果不将IT设备置于机柜中,通常会出现其中一个服务器的热回风被吹入到另一个服务器的进风口处。配备凝水泵-在制冷系统产生冷凝水的情况下,需要用水泵将冷凝水从IT空间中排出。图2施耐德电气提供的两种旁路开关示例图3可锁定的IECC13和C19电源线楼宇舒适性制冷系统在理想情况下,楼宇的舒适性制冷系统应该全年无休地为IT设备制冷,但实际上,当在温度较低的天气条件下使用供暖系统而关闭空调时,情况并非如此。施耐德电气–数据中心科研中心第280号白皮书版本06确保边缘计算站点可用性的实用指南机柜机柜是IT设备的基础结构,其能够有助于设备冷却,实现有序部署,从而在排除故障时减少人为失误。物理安全因意外事故和失误导致的大部分宕机事件,负有直接责任的因素都是人为因素——包括操作不当、设备标签错误、物件坠落或溢出以及其它不可预见的事故。如果宕机成本显著,则即使对于小型企业或分支机构,物理安全也十分重要。此外,物理安全与网络安全密切相关。如果无关人员获得对IT设备的物理访问权限,则网络安全性会受到严重影响。使用冗余风扇-风扇辅助通风系统应配置多台冗余风扇,以用于容错。使用UPS为制冷风扇供电-风扇消耗功率较少,在断电时,风扇辅助通风系统将持续为IT设备降温。另一种方案是采用发电机(如有)为制冷系统供电。为制冷系统配备双电源输入-一些空调系统配备两根电源线输入,以实现高可用性。最理想的做法是将此功能与配电盘的独立专用配电回路配合使用。机柜核对清单(按优先级由高到低排序)地震区使用螺栓式机柜-可用螺栓固定到防震台上或者直接固定到支撑板上。使用柜门和侧面板可上锁的机柜-避免宕机的最佳方式之一是让未经许可的人员远离IT设备。使用柜门和侧面板可免工具安装的机柜-这项特性可以节省安装时间,并减少螺钉等小物件掉入IT设备内造成意外事故。可拆卸的侧面板简化了线缆管理。使用左右均可开门的铰链式机柜-有时机柜位置受到建筑立柱等的限制,这可能会限制机柜门向左或向右侧开启,从而增加人为失误的可能性。确保壁挂式机柜可承受90千克的重量-IT设备和UPS会给IT机柜增加相当大的重量。合理设计的壁挂式机柜在此重量下不会失效。使用卡入式盲板-卡入式(无需工具)盲板可防止热回风再循环到IT设备的正面。物理安全核对清单(按优先级由高到低排序)对IT机房和IT机柜上锁-这是防止人为失误的重要方法。钥匙只允许发给负责IT设备运行或公共安全的人员。在机柜门上使用传感器-无论是IT机房门还是IT机柜门,传感器都应在门打开时发出警报。将物理安保设备配置UPS电源-这种措施可确保断电时的安全性。对于未安装在IT机柜内的安保设备,可能需要单独的UPS。设置开门警报-如果有人将门打开,管理系统应在编程设置的延时后发出警报。门开启的时间越长,未经许可人员进入的可能性越大。使用配有DCIM的视频监控系统-监控系统应将警报发送到数据中心基础设施管理(DCIM)系统。施耐德电气–数据中心科研中心第280号白皮书版本07确保边缘计算站点可用性的实用指南使用带运动检测的摄像机–由运动检测或警报激发录制并存储视频,可节省存储空间和带宽。这有助于将拍摄到的记录与进入或环境警告进行比对,从而快速分析根本原因(图
本文标题:确保边缘计算站点可用性的实用指南
链接地址:https://www.777doc.com/doc-6776374 .html