SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 产品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 服务器集群简单化
  • 成功案例
  • 联系我们
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

多云容灾

10月 30, 2021 by Jason Aw Leave a Comment

多云容灾

多云容灾

 

如果这个话题听起来令人困惑,我们明白了。 在我们专家的建议下,我们希望能缓和您的担忧——同时也在之前或之后为您的组织提出一些重要的考虑因素去多云. 对于采用云计算的公司来说,灾难恢复规划是一个常见的困惑点,尤其是当它涉及多个云提供商时。

这足以确保数据保护和灾难恢复(DR) 当所有数据都位于本地时。 但如今,许多公司拥有本地数据以及多个云提供商,这种混合策略可能具有良好的商业意义,但可能会给负责数据保护的人员带来挑战。 在我们深入研究细节之前,让我们定义关键术语。

什么是多云?

多云是利用两个或多个云提供商为组织的 IT 服务和基础架构提供服务。 多云方法通常由主要公共云提供商的组合组成,即亚马逊网络服务 (AWS)、谷歌云平台 (GCP) 和微软 Azure。

组织根据成本、技术要求、地理可用性和其他因素从每个云提供商处选择最佳服务。 这可能意味着公司使用 Google Cloud 进行开发/测试,同时使用 AWS 进行灾难恢复,并使用 Microsoft Azure 处理业务分析数据。

多云不同于混合云,混合云是指混合本地基础设施、私有云服务和公共云的计算环境。

谁使用多个云?

  • 受管制行业 –许多组织在不同的云环境中运行不同的业务运营。 这可能是基于单个云提供商的优势或仅仅是分散 IT 组织的产品优化其 IT 环境的深思熟虑的策略。
  • 媒体和娱乐– 当今的媒体和娱乐领域越来越多地由相对较小的专业工作室组成,这些工作室满足了 Netflix 和 Hulu 等最大玩家不断膨胀的内容制作需求。 多云解决方案使这些团队能够在同一项目上协同工作,从各种公共云访问他们喜欢的制作工具,并简化审批流程,而不会因将大型媒体文件从一个站点移动到另一个站点而出现延迟。
  • 交通与自动驾驶– 联网汽车和自动驾驶项目从各种传感器生成大量数据。 汽车制造商、公共交通机构和拼车公司都积极利用多云创新,将跨多个云的数据可访问性融合在一起,而没有高额出口费用和缓慢传输的风险,同时保持利用最佳的自由每个项目的公共云服务。
  • 能源部门– 采用多云有助于降低与资源查找和钻探相关的大量成本。工程师和数据科学家可以使用机器学习 (ML) 分析来确定值得更多资源来勘探石油的地方,以衡量新项目的环境风险并提高安全性。

多云容灾痛点:

  • 签之前不看。如果客户未能阅读云协议中的细则,他们可能会遇到问题。 云提供商负责其计算机基础设施,但客户负责保护他们的应用程序和数据。 云 SLA 未涵盖应用程序停机的原因有很多。 关键业务工作负载也需要高可用性和灾难恢复保护软件。
  • 制定集中保护政策。必须创建集中保护策略以涵盖所有数据,无论数据位于何处。 每个云提供商都有其独特的访问、创建、移动和存储数据的方式,具有不同的存储层。 创建涵盖跨不同云的数据的灾难恢复计划可能很麻烦。
  • 报告。这对于确保根据管理数据的服务级别协议保护数据非常重要。 鉴于用户启动云资源的速度有多快,确保适当保护每个资源并确定需要纳入 DR 计划的所有数据可能具有挑战性。
  • 测试您的灾难恢复计划。客户必须全面筛选和测试他们的 DR 策略。 多云策略增加了对测试的需求。 一些供应商可能会向客户收取测试费用,这加强了阅读合同细则的必要性。
  • 资源技能集. 在一个云中寻找专家可能具有挑战性;对于多云,您要么需要在每个云中找到专业知识,要么需要在多个云中找到具有重要意义的稀有个体。

克服多云灾难恢复挑战

应对这些挑战要求公司制定涵盖众多问题的数据保护和恢复策略。 试着问自己以下战略问题:

  • 您是否为所有应用程序和数据定义了关键级别? 关键应用程序的几分钟停机时间会使您的组织在最终用户生产力、客户满意度和 IT 劳动力方面损失多少钱?
  • 数据保护和恢复是否由 IT 或应用程序所有者和创建者以自助服务模式处理?
  • 您是否计划使用各种基于云和本地的选项来优化数据?
  • 您打算如何恢复数据? 将数据恢复到基于云的虚拟机还是使用备份映像作为恢复源?

获得正确的多云灾难恢复解决方案

在多云场景中成功保护和恢复数据的最大关键是确保您可以查看所有数据,无论数据如何存储。 公司提供的工具使您能够定义在灾难场景中应该恢复哪些数据和应用程序以及如何恢复——例如,无论是从备份映像还是通过将数据移动到云中新创建的虚拟机。

该工具应该可以帮助您编排恢复场景,重要的是,可以对其进行测试。 如果该工具与您的数据备份工具很好地集成在一起,它还可以让您将备份用作恢复数据的来源,即使数据存储在不同的位置——比如多个云。 我们最近的 SIOS 网络研讨会讨论了同一点;手表在这里如果你有兴趣。SIOS 数据管理员让您可以在灵活、可扩展的云环境中运行关键业务应用程序,例如亚马逊网络服务 (AWS) ,天蓝色, 和谷歌云平台在不牺牲性能、高可用性或灾难保护的情况下。 SIOS DataKeeper 可在AWS 市场以及唯一的 Azure 认证的 WSFC 高可用性软件Azure 市场。

 

转载自SIOS

Filed Under: 服务器集群简单化 Tagged With: 多云

管理主要云中断中的实时恢复

1月 19, 2019 by Jason Aw Leave a Comment

管理主要云中断中的实时恢复

在重大云中断中管理实时恢复

灾难发生,突然停工成为现实。但是,所有客户都可以做的事情是在几乎任何云中断中存活下来。东西发生了。失败 – 无论大小 – 都是不可避免的。不可避免的是延长的停机时间。考虑美国中南部地区的微软Azure云遭遇灾难性失败的那一天。一场严重的雷暴导致了一连串的问题,最终导致整个数据中心崩溃。在一些人称之为“天空中的Azure云天”中,大多数客户都处于离线状态,不仅仅是几秒钟或几分钟,而是一整天。有些人离线超过两天。虽然微软已经解决了导致停电的许多问题,但IT专业人员将长期记住这一事件。这是坏消息。好消息是:Azure客户可以做的事情几乎可以在任何中断中存活。它可能来自单个服务器,无法使整个数据中心脱机。实际上,实现强大的高可用性和/或灾难恢复规定的Azure客户,无论是实时数据复制还是快速自动故障转移,都可以避免数据丢失,并且每当发生灾难时都很少或没有停机时间。另请参阅:Nutanix认为企业云赢得了云计算竞赛

管理云中断

本文介绍了在混合和纯Azure云配置中提供灾难恢复(DR)和高可用性(HA)保护的四个选项。其中两个选项特定于Microsoft SQL Server数据库,这是Azure云中的一个流行应用程序;另外两个选项是与应用程序无关的。这四个选项也可用于各种组合,在表格中进行了比较,包括:

  • Azure站点恢复(ASR)服务
  • 具有存储空间直接的SQL Server故障转移群集实例
  • SQL Server始终在可用性组
  • 第三方故障转移群集软件

RT Insights SIOS_Real-timeRecovery for Cloud Outage_181119

RTO和RPO 101

在描述这四个选项之前,有必要对用于评估DR和HA规定的有效性的两个指标有一个基本的了解:恢复时间目标和恢复点目标。熟悉RTO和RPO的人可以跳过本节。RTO是中断的最大可容忍持续时间。在线事务处理应用程序通常具有最低的RTO,而关键任务应用程序通常具有仅几秒的RTO。RPO是可以容忍数据丢失的最长期限。如果不能容忍数据丢失,则RPO为零。RTO通常会确定所需的HA和/或DR保护的类型。低恢复时间通常需要强大的HA规定来防止日常系统和软件故障,而较长的RTO可以满足基本DR规定,旨在防范更广泛但更不频繁的灾难。与HA和DR规定一起使用的数据复制可能需要在RTO和RPO之间进行潜在的权衡。在低延迟LAN环境中,复制可以是同步的,可以同时更新主数据集和辅助数据集。这使得完全恢复能够自动且实时地发生,从而可以满足最苛刻的恢复时间和恢复点目标(分别为几秒和零),无需权衡。相反,在整个WAN中,强制主要服务器等待辅助服务器确认每个事务的更新完成将对性能产生负面影响。因此,WAN中的数据复制通常是异步的。这可以在容纳RTO和RPO之间进行权衡,这通常会导致恢复时间的增加。原因如下:为了满足零RPO,需要手动过程以确保在故障转移发生之前所有数据(例如来自事务日志)已在辅助设备上完全复制这种额外的工作会延长恢复时间,这就是为什么这样的配置通常用于DR而不是HA。

Azure站点恢复(ASR)服务

ASR是Azure的DR-as-a-service(DRaaS)产品。ASR将物理机和虚拟机复制到其他Azure站点,可能在其他区域,或从本地实例复制到Azure云。该服务可以从系统和站点中断中快速恢复,并通过消除滚动软件升级期间的停机时间来促进计划内维护。与所有DRaaS产品一样,ASR有一些限制,最严重的是无法自动检测和故障转移导致应用程序级停机的许多故障。当然,这就是为什么该服务被定性为DR而不是HA的原因。使用ASR,恢复时间通常为3-4分钟,当然,这取决于管理员能够以多快的速度手动检测和响应问题。如上所述,跨WAN的异步数据复制的需求可以进一步增加RPO为零的应用程序的恢复时间。

具有存储空间直接的SQL Server故障转移群集实例

SQL Server提供了两个自己的HA / DR选项:故障转移群集实例(此处讨论)和Always On Availability Groups(下面讨论)。FCI提供两个优点:该功能可以在较便宜的SQL Server标准版中使用,并且它不依赖于像传统HA集群那样的共享存储。后一个优势很重要,因为云中的共享存储根本不可用 – 来自Microsoft或任何其他云服务提供商。Azure云存储的一个流行选择是Storage Spaces Direct(S2D),它支持广泛的应用程序,它对SQL Server的支持保护整个实例而不仅仅是数据库。S2D的一个主要缺点是服务器必须位于单个数据中心内,这使得该选项适用于某些HA需求,但不适用于DR。对于多站点HA和DR保护,需要通过日志传送或第三方故障转移群集解决方案提供必需的数据复制。

SQL Server始终在可用性组

虽然Always On Availability Groups是SQL Server为HA和DR提供的最强大的产品,但它需要许可更昂贵的Enterprise Edition。此选项可以提供5-10秒的恢复时间和几秒或更短的恢复点。它还提供可读的辅助数据库,用于查询数据库(具有适当的许可),并且不对数据库的大小或辅助实例的数量进行限制。提供HA和DR保护的Always On Availability Groups配置包括三个节点的安排,在单个可用性集或区域中有两个节点,第三个在单独的Azure区域中。一个值得注意的限制是只复制数据库,而不是整个SQL实例,必须通过其他方式进行保护。除了对某些数据库应用程序成本过高之外,这种方法还有另一个缺点。特定于应用程序需要IT部门为所有其他应用程序实施其他HA和DR规定。使用多个HA / DR解决方案可能会大大增加复杂性和成本(用于许可,培训,实施和持续运营),这也是组织越来越倾向于使用与应用程序无关的第三方解决方案的另一个原因。

第三方故障转移群集软件

凭借其与应用程序无关且与平台无关的设计,故障转移群集软件能够为私有,公共和混合云环境中的几乎所有应用程序提供完整的HA和DR解决方案。这包括Windows和Linux。与应用程序无关,无需为不同的应用程序提供不同的HA / DR规定。与平台无关,可以利用Azure云中的各种功能和服务,包括故障域,可用性集和区域,区域对和Azure站点恢复。作为完整的解决方案,该软件至少包括实时数据复制,能够检测应用程序级故障的连续监视,以及用于故障转移和故障恢复的可配置策略。大多数解决方案还提供各种增值功能,使故障转移群集能够在几乎没有数据丢失的情况下提供低于20秒的恢复时间,从而满足几乎所有HA / DR需求。

让它真实

无论是单独运行还是一致运行,所有这四个选项都可以发挥作用,使DR和HA保护的连续性对于各种企业应用程序更有效和更实惠。这包括那些能够容忍一些数据丢失和延长的停机时间的系统,以及那些需要实时恢复以实现5到9个正常运行时间且数据丢失很少或没有数据丢失的系统。为了在现实世界中实现下一次云中断,请确保您选择的任何DR和/或HA规定配置为至少两个节点分布在两个站点上。还要确保了解条款满足每个应用程序的恢复时间和恢复点目标的程度。以及可能存在的任何限制,包括检测所有可能的故障所需的手动过程,以及确保应用程序连续性和数据完整性的方式触发故障转移。

关于Jonathan Meltzer

Jonathan Meltzer是SIOS Technology的产品管理总监。他在软件和SaaS产品的产品管理和营销方面拥有20多年的经验,可帮助客户管理,转换和优化其人力资本和IT资源。从RTinsights转载

Filed Under: 新闻与活动 Tagged With: 多云, 微软天蓝色

最近的帖子

  • 视频:SIOS 优势
  • AWS 中三节点集群的 SIOS DataKeeper 演示
  • 2023 年预测:数据民主化将推动对高可用性的需求
  • 了解业务关键型应用程序高可用性的复杂性
  • Epicure 使用 Amazon EC2 和 SIOS SANLess 集群软件保护关键业务 SQL Server

最热门的帖子

加入我们的邮件列表

Copyright © 2023 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in