热线电话:+86-020-39199006
Language : 中文版
致力于高品质电源产品的推广与技术服务!

新闻中心

如何定义数据中心可用性

* 来源: * 作者: * 发表时间: 2020-01-17 0:45:13 * 浏览: 1
数据中心是一种安全基础结构,可为IT设备提供稳定的电源和适当的环境操作条件。通常,数据中心的运营将面临许多不利因素,因此有充分的理由确保IT设备的电源可用性。在此讨论如何定义数据中心的“可用性”。数据中心是一种安全基础结构,可为IT设备提供稳定的电源和适当的环境操作条件。通常,数据中心的运营将面临许多不利因素,因此有充分的理由确保IT设备的电源可用性。在此讨论如何定义数据中心的“可用性”。在数据中心领域,许多人经常将“可用性”和“可靠性”视为同一事物。同样,对于某些人来说,“冗余”一词似乎也暗示着可用性。可靠性不是可用性。可靠性是系统或组件在指定时间内在指定条件下执行其所需功能的能力。组件可靠性是一种基于统计概率的预测,称为平均故障间隔时间(MTBF),通常以小时(例如100,000小时)表示。组件,设备或子系统的MTBF通常取决于数据中心设施的制造商。系统可用性通常表示为时间的百分比。对于数据中心,它称为“正常运行时间”,并用数字“ 9”来量化。需要说明的是,普通的五个9(即99.999%)是Bell Corporation最初设置的系统可用性参考标准。但是,五个九听起来很不错,但是如果基于每年的8,760小时,五个九仍然意味着每年有5.3分钟的停机时间。甚至六个9秒钟也相当于每年停机32秒。在当今的24/7 IT环境中,这对于组织来说显然是不可接受的,因为IT能力只能承受不到20毫秒的中断。此外,这并不一定意味着一年中只有一次停电。这可能会面临多次停电,尽管每次仅停电几秒钟,但一年的累积停电时间平均为32秒。显然,这将面临灾难性的结果,但这在数学上仍然是统计的,并且满足6 9s的要求。在可用性声明方面,重要的区别是预测值和历史值。对于新的数据中心或其规划设计,它只能作为参考,这可能取决于其冗余设备级别和容错控制系统的复杂性。相反,可用性的历史数字仅代表过去的动手经验。但是,历史数据不能代表未来的表现。具有“ N + 1”冗余设计的数据中心设施可能会连续五年运行,而具有“ 2N +1”冗余设计的数据中心关键负载可能会在运营年内停电。冗余表示已部署其他设备。如果没有主电源或主要设备,则可以为设备提供故障或维护期间所需的电源或冷却设备(定义为“ N”)。但是,此简单说明不能确保将负载无缝或立即转移到辅助设备或其他设备。举一个简单的例子,在市电中断期间,备用发电机启动并可以为负载供电。启动时间通常为10到30秒。显然,这对IT设备没有影响,需要使用具有足够能量储备的UPS提供不间断电源。对于冷却系统,可接受的时间取决于冷却系统的类型。对于低功率密度的设备,它可以持续5到30分钟,而对于功率密度非常高的IT设备,它只能持续15分钟。到60秒。弹性的冗余设备,用于控制电源和冷却设备以支持IT负载。冗余设备本身并不排除瞬时或短暂的中断。人们将容错设计和冗余设备(N + 1,N + 2等)和关键电源路径(N,2N等)结合使用,以在可接受的范围内提供电源和散热(以及网络连接)服务时间范围,使IT设备运行时不会中断电源。尽管拥有高度可靠的设备可以减少系统受伤的可能性如果出现故障,则无法确保更高的可用性。 “可用性”的真正基础是冗余设备,容错设计以及电源和冷却系统的控制和传输时间的重要性。实际上,永远不要将数据中心的可用性固定在设备的预期可靠性上。公司需要采取更全面的方法。 Green Grid正在开发其开放数据中心可用性标准(OSDA)的版本。尽管无意与UptimeInstituteTier4级别的系统直接竞争,但OSDA概念适用于电力设备和冷却系统冗余级别的经典视图,但它在整体方案中还集成了多站点数据复制以增加逻辑应用程序程序的可用性,而不仅仅是维持数据中心基础架构的现状。 OSDA系统也更加灵活,因为它允许不同级别的电源和冷却设备成为冗余,而不是灵活性较低的框架,它确实意识到某些组织(或某些应用程序)可能需要更高的电气冗余,例如2” N + 1”冗余,实际上,仅需要“ N +1”冗余。经过全面开发,OSDA平台和工具集可用于评估多站点数据复制如何提供相同或更高级别的应用程序可用性(这就是为什么首先构建数据中心的原因),规模为1 -10,即使在使用中冗余级别较低的数据中心基础架构也是如此。企业许多公司的管理层都将云计算视为“完美”的解决方案,因为它将消除所有与投资相关的资本和运营成本以及人员成本数据中心和IT硬件。尽管盲目地认为它总是可用的,但是实际上,云计算服务提供商的基本服务还是比较模糊或完全不透明。但是,即使到了今天,许多机构和商业组织仍无法真正决定一种有意义的方法来评估云计算服务的可用性。计算架构已经变得非常活跃并且不断发展,很明显,大多数组织已经放弃了构建或运营自己的数据中心设施的工作。许多企业使用托管服务提供商提供的托管服务,托管服务提供商可以使用基于冗余方法的传统数据中心基础架构方法对其进行评估。结果,托管数据中心和云计算的混合方法已成为当今许多组织的首选策略。许多人对长期实施的“数据中心可用性”行业标准(由UptimeInstitute创始人KenBrill创建的四层分类系统)提出了不同的看法。尽管它仍然是有价值的(也是最基本的)概念和索引,但它仅评估数据中心基础结构的可用性,而不评估IT硬件,软件和数据本身的可用性。在虚拟化和数据复制时代,其基于数据中心的“可用性等级”仅侧重于数据中心设施的电源和散热基础设施的冗余级别。尽管这也很重要,但它不应该是对计算系统和数据可用性中存储因素的评估。因此,在计划和构建整体计算策略时,软件的功能灵活性和应用程序需求应是更重要的因素之一。例如,开放计算项目组织已经提出了对IT硬件的物理,电气和逻辑方面以及电气设备,机械基础设施和建筑物本身的设计进行全面重新思考的需求。这也是开放计算项目成员(例如Facebook,Google和Microsoft)的操作的考虑因素。在许多情况下,它们的设备冗余级别相对较低(例如,对于某些系统为“ N”或N + 1),但是由于其软件故障转移冗余和多站点数据复制,它们的总体可用性很高。尽管这些要求的某些特征与传统的企业组织在根本上是不同的,但是,如果适当使用,则应考虑并采用这些设计,设备和软件策略的某些方面。最后但并非最不重要的一点是,比特币现在被认为是比特币的基础世界的未来货币。大多数和比特币数据中心的运营模式似乎与传统的数据中心设施背道而驰。实际上,其许多数据中心设备未配备UPS,备用发电机,很少或没有冷却设备。他们的目标是在中断电源而不会造成损害的情况下,停止比特币采矿的成本,并在恢复电源后立即开始采矿。结果,与两个完整的电源链数据中心设施所产生的大量额外的初始和运营成本相比,即使是两个电力设施的可用性也更具成本效益。然而,随着越来越多的托管数据中心设施,云服务数据中心和混合解决方案在未来几年中占主导地位,组织需要评估每个整体解决方案的长期成本和风险。在这个不断发展的计算环境中,“可用性”是根据其目的做出的选择,而不是仅依赖具有严格标准的传统Tier 4数据中心设施。