SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 产品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 服务器集群简单化
  • 成功案例
  • 联系我们
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

3 节点集群常见问题解答

3月 15, 2023 by Jason Aw Leave a Comment

3 节点集群常见问题解答

3 节点集群常见问题解答

在当今快节奏的商业世界中,高可用性和灾难恢复对于确保操作的连续性和避免停机至关重要。 为实现这一目标,组织越来越多地转向 3 节点集群,这提供了一种提高可靠性和保护免受本地、站点范围甚至区域灾难的方法。 在本文中,我们将深入了解什么是 3 节点集群、您可能需要一个集群的原因,以及可用于在云中设置 3 节点集群的不同集群管理软件解决方案。

什么是 3 节点集群?

3 节点集群是一组三台相互连接的计算机,它们协同工作以提供比单个节点更高的可靠性、可用性和可伸缩性。 该组中至少有一个节点在地理上与其他节点分开,以便在发生灾难时能够继续运行。 3 节点集群中的每个节点都可以执行相同的功能,如果一个节点发生故障,其他节点可以接管以提供不间断的服务。

为什么我需要一个 3 节点集群?

3 节点集群通常用于需要高可用性和灾难恢复的情况。 例如,3 节点集群通常用于保护关键任务应用程序,例如企业资源规划系统以及必须 24/7 全天候可用的数据库。 它们可用于本地数据中心、公共云或两者的组合。

3 节点集群如何工作?

在典型的 3 节点集群中,关键应用程序在主服务器节点 (A) 上运行,并将数据复制到位于附近的次要目标节点 (B) 和位于不同地理位置的第三目标节点 (C)。 集群软件监视 A 上的应用程序环境,如果检测到故障,则将操作故障转移到节点 B。 节点 B 承担主节点的角色,现在必须复制到节点 C 以维护灾难保护。 当操作恢复到节点 A 时,节点需要从 B 切换回 A,A 恢复复制到 C。

设置 3 节点集群需要什么软件?

有各种各样的集群管理软件可用于设置 3 节点集群的可用解决方案。 一些流行的解决方案提供必要的工具和协议来检测故障和执行故障转移。

集群管理软件解决方案的局限性和挑战:

虽然一些集群解决方案可用于设置 3 节点集群,但许多解决方案都有其局限性和需要注意的挑战。 对于那些没有丰富 Linux 经验的人来说,许多基于 Linux 的解决方案很难设置和配置,并且可能不是更复杂和大规模部署的最佳解决方案。 此外,它们可能不提供其他集群管理解决方案中提供的一些高级功能,例如自动故障转移。 在几个流行的基于 Linux 的集群解决方案中,从 A 到 B 的故障转移、从新主 B 到 C 的复制更改以及切换回原始操作都是高度手动的并且容易出错,这使得对关键应用程序的保护可能不可靠。这些解决方案需要专门的技能和知识来诊断和解决集群中可能出现的问题,并且可能不适合大规模部署。

将节点添加到现有的 3 节点集群:

将节点添加到现有集群的过程取决于您使用的集群管理软件。 通常,您需要在新节点上安装软件,然后将其加入现有集群。 您可能还需要配置软件以识别新节点并将其集成到集群的管理和故障转移机制中。

如果 3 节点集群中有多个节点发生故障,会发生什么情况?

如果剩余节点没有必要的资源继续提供服务,这种情况可能会导致服务完全丢失。 为避免这种情况,制定备份计划非常重要,例如在必要时提供额外的节点来接管,或使用基于云的服务来提供额外的资源。

随着对无缝和不间断业务运营的需求不断增长,全面了解这些关键方面可以使您的组织脱颖而出并确保其成功。 从确保数据保护和最大限度地减少停机时间,到提供整体稳健的基础设施,实施高可用性和灾难恢复是对您组织未来的一项宝贵投资。 通过探索当今的高可用性和灾难恢复世界,迎接挑战并迈出迈向更具弹性和效率的未来的第一步!

联系 SIOS今天介绍高可用性和灾难恢复解决方案。

经许可转载自信息系统

Filed Under: 服务器集群简单化

云遣返和 HA

3月 11, 2023 by Jason Aw Leave a Comment

云遣返和高可用性

云遣返和 HA

关于一种称为“云遣返”的现象,媒体的讨论虽然不多,但越来越多。 简单来说,云遣返意味着将您的工作负载从公共云中取出并带回您自己的数据中心。 此举可能会增加对本地设备的需求,例如服务器、存储和网络设备。 它还可能增加对可以轻松管理两者的解决方案的需求本地和基于云的资源。 对于在云中运行关键工作负载的公司,遣返可能会对他们提供高可用性保护的方式产生重大影响。 值得注意的是,云迁移对高可用性市场的影响取决于一些因素,例如组织选择返回本地数据中心的原因,以及其他行业趋势和竞争。 那么,为什么组织会选择离开云?

云遣返的常见原因

成本:在云中运行工作负载可能非常昂贵,而且成本可能无法预测,尤其是当组织的使用模式和要求随时间变化时。 将工作负载调回本地可以帮助组织降低成本,特别是当它们有未使用的容量或可以利用现有基础设施时。 它还可以帮助提高 IT 预算的可预测性。

数据主权:一些组织可能会受到规定其数据存储在哪个国家/地区、谁可以访问这些数据以及如何保护这些数据的法规的约束。 遣返工作负载可以让组织更好地控制他们的数据,并帮助他们遵守数据主权法律和法规。

安全:组织可能对在云中运行工作负载存在安全担忧,尤其是当它们处理敏感数据或受到严格监管要求时。 虽然云有多种安全措施,但配置错误很常见,并可能导致安全问题。 通过消除对云特定知识的需求,遣返工作负载可以让组织更好地控制其安全状况。

潜伏:云提供商可能远离组织的用户,这可能导致更高的延迟和更慢的响应时间。 将工作负载遣返回本地可以帮助组织减少延迟并提高用户的性能。

控制:虽然迁移到云为公司节省了 IT 基础设施管理成本,但这些节省是以控制成本为代价的。 云提供商根据自己的时间表管理和维护 IT 环境。 将数据中心遣返的公司重新获得对其基础设施、升级、更新和维护的完全控制。 .

缺少云提供商的特定服务或功能:组织可能会发现特定服务或功能在公共云中不可用,因此他们可能决定将工作负载遣返回本地。

请注意,可能还有其他因素在起作用,但重要的是要记住,这些原因可能因组织的行业和独特需求而异。

公有云遣返背景下的高可用性

多年来,随着企业涌向基于云的解决方案来满足其计算需求,公共云一直很受欢迎。 但根据最近的 InfoWorld[link to article]文章,随着公司开始将数据和工作负载带回内部或私有云,我们可能会在 2023 年看到转变。 这一举措的一个主要原因是希望获得更高的可用性和对基础架构的控制。

高可用性 (HA)是现代 IT 基础设施的一个重要方面,它确保应用程序和服务即使在硬件故障、软件错误或其他不可预见的事件发生时也能保持可访问性和可操作性。 在公共云环境中,高可用性通常是通过冗余基础设施和自动故障转移机制(例如负载平衡和自动缩放)的组合来实现的。

然而,一些企业可能会发现他们对其云基础设施的控制水平有限,并且他们可能担心数据安全、合规性和供应商锁定。 这些担忧可能导致将工作负载和数据带回本地或私有云的愿望。

混合云模型如何解决问题

解决这些问题的一个潜在解决方案是采用混合云方法,在这种方法中,企业通过将公共云的可扩展性和灵活性与本地或私有云基础设施的控制和安全性结合起来,充分利用两全其美。 混合云架构可以设计为通过在本地和云端的多个位置复制数据和服务来提供高可用性。

实施混合云架构需要仔细规划和设计,重点是确保工作负载和数据的分布方式能够最大限度地提高可用性,同时最大限度地减少延迟和其他性能问题。 一些关键考虑因素包括选择合适的云提供商和本地基础设施,确保数据得到有效复制和同步,以及设计可以处理计划内和计划外中断的故障转移机制。

另一个重要的考虑因素是需要对混合云环境进行有效的监控和管理。 这包括实施自动监控工具来检测和响应中断,确保定期执行和测试备份,以及建立清晰的流程和程序来处理事件和灾难。

SIOS 高可用性解决方案

因此,虽然公有云的采用率多年来一直在上升,但对控制、安全性和可用性的担忧导致一些企业考虑将工作负载和数据迁移到本地或私有云环境。 将公有云的可扩展性和灵活性与本地基础设施的控制和安全性相结合的混合云方法可以有效解决这些问题,同时保持高水平的可用性。 简而言之,确定混合云设置需要认真的准备工作和专业知识。 幸运的是, SIOS 高可用性解决方案已经让你满意了。 我们邀请您详细了解我们的工具和服务,以便您可以自信地驾驭您的混合云之旅。

经许可转载自信息系统

Filed Under: 服务器集群简单化

视频:州、地方政府和教育 (SLED) 的高可用性

3月 7, 2023 by Jason Aw Leave a Comment

视频:州、地方政府和教育 (SLED) 的高可用性

在此视频中,SIOS 客户成功总监 Dave Bermingham 讨论了该公司为州、地方政府和教育 (SLED) 组织提供的高可用性解决方案。

Dave 强调了高可用性对 SLED 组织的重要性,特别提到了紧急服务、财务管理系统、学生信息系统和学习管理系统使用的通信和协作工具,所有这些都需要持续访问。

他强调了高可用性解决方案应具有的关键特性,例如经济高效、可靠、提供冗余、保持高性能水平、检测故障和执行恢复操作、可扩展以及可与现有系统和基础设施集成。

Bermingham 给出了 SIOS 的 SANless 集群解决方案的两个实际应用示例。 第一个例子是他们如何在应用程序和数据中心级别提供高可用性以消除大学入学期间的停机时间。 第二个例子是他们如何与集成商合作以确保呼叫中心 CAD 系统具有高可用性,并能够在多次灾难期间派遣警察、消防或救援队。

重要的是要考虑添加一个高可用性像 SIOS 这样的集群解决方案可以解决应用程序级别的高可用性需求,从而有助于维护应用程序性能。

经许可转载自信息系统

Filed Under: 服务器集群简单化

可能破坏您的高可用性解决方案的 8 个变化

3月 2, 2023 by Jason Aw Leave a Comment

可能破坏您的高可用性解决方案的 8 个变化

可能破坏您的高可用性解决方案的 8 个变化

作为客户体验副总裁,我观察到大多数组织在部署任何可能对其业务的高可用性产生影响的工具或流程时都有意识并谨慎行事。这些公司通常在 HA 方面非常谨慎,包括对任何 HA 集群、DR、安全或备份解决方案变更进行严格的变更审查。大多数公司都明白对这些工具的更改需要仔细考虑和测试,以避免影响整体应用程序可用性和系统稳定性。IT 管理员意识到,即使是他们的 HA 集群中最不起眼的变化,灾难恢复、安全或备份解决方案可能导致重大中断。

然而,其他工作场所和生产力工具的变化往往没有以同样的努力考虑。

可能破坏 HA 解决方案的八个变化:

  1. 遗失文件

您现有的工具通常封装了大量关于公司、决策、集成和整体 HA 架构的文档。随着团队过渡到新工具,这些文档通常会丢失,或者访问受到阻碍或阻碍。

建议改进:将所有现有文档导出和导入到新工具中。使用存档存储和备份在导入前保留数据的完整副本。

  1. 丢失的要求

与丢失的文档类似,在转移工具时,需求往往是最先丢失的东西。

建议改进:记录已知需求,从任何现有生产力工具导出需求相关文档。

  1. 失落的历史和传闻

几乎与文档和需求一样重要的是变更、修订和决策背后的历史。 许多组织将历史信息保存在工作场所和办公生产力工具中。此类信息可能包括围绕先前评估过的工具和解决方案的决策。当这些工作场所工具发生变化或过渡时,这种类型的历史可能会丢失。 现有工具通常也包含很多隐性知识。随着新工具的集成,知识和思想共享消失了。 二十年前,我们的团队迁移了错误跟踪解决方案。这些工具之间的知识差距很大,影响了多个部门,包括现在负责管理、备份和解决问题的 IT 团队。

建议改进:确保在新工具之间充分培训和转移思想共享和知识。 在终止当前工具之前,确保记录当前工具和以前工具的历史、上下文和决策

  1. 丢失访问/访问控制

每个新工具都有一套不同的安全和访问规则。在过渡团队中,通常最终会出现管理员过多、管理员不足或权限限制过多的情况。

建议改进:根据要求和安全规则,提前映射访问和用户控制,并有一个快速解决的过程。

  1. 失去联系

电子邮件和联系人系统迁移很少是无缝的。 即使现有版本之间的升级也会产生影响。从一种工具(Exchange 到 Gmail)迁移的一个缺点可能是失去联系。我们的团队与一位客户合作,该客户曾致电我们的支持团队寻求帮助获取他们的合作伙伴联系信息。他们的电子邮件系统过渡停滞不前,对关键联系人的访问也被延迟。

建议改进:规划联系人迁移和验证。请确保您的 HA 集群的任何关键联系人绝对是经过验证的迁移步骤的一部分。

  1. 破碎的整合

损坏的集成是一个非常常见的项目,它会影响高可用性,监控和报警。随着公司转向更新的生产力工具,现有的集成可能不再有效,需要额外的开发。举个相关的例子,一家以前使用 Skype 进行消息传递的公司转而使用 Slack。许多通过 Skype 传递消息的工具需要调整。 在您的 HA 环境中,仪表板或警报系统之间的集成中断可能意味着无法及时收到关键通知。

建议改进:绘制任何自动化工作流程以帮助识别工具之间的集成点。还要努力确定任何新的要求和整合机会。在概念验证或受控部署阶段规划和测试集成。

  1. 失落的冠军

每个工具集都有拥护者和批评者。支持者可能与您的管理员相同,也可能不同。拥护者的角色在每个组织内发生变化,并且通常随着每种工具的变化而变化,但他们之间的共同点是他们愿意为了自己和他人的利益使用新的生产力工具解决问题、问题或挑战。冠军是第一个发现新功能、发现和报告新问题并帮助新人加入工具集的人。冠军超越了思想份额和历史。通常随着工具集的变化,您的团队将失去冠军。

  1. 生产力损失

新工具,即使是那些与 HA 没有直接关系的工具,也会对您团队的工作效率产生影响。甚至与优先级管理、开发和代码存储库相关的工具也需要提升和入职时间。这段时间通常会转化为生产力损失,这可能会转化为集群的风险。 确保与所有现有工具和新工具相关的流程都得到妥善记录,以便对新工具的更改不会造成混乱、中断流程并导致更大的生产力损失。

建议改进:通过使用培训工具、利用产品拥护者并确保推出的重点是缩短学习曲线来降低生产力损失的风险高可用性解决方案需要捕获需求、识别关键文档、转移思想共享、映射依赖关系、测试和配置适当的访问、确定工具集支持者。 它确保您的新工具实际提高生产力,而不是将您的关键资源从维持正常运行时间中抽离出来。

客户体验副总裁 Cassius Rhue经许可转载自信息系统

Filed Under: 服务器集群简单化

Azure VM 上 SQL Server 的高可用性选项

2月 28, 2023 by Jason Aw Leave a Comment

Azure VM 上 SQL Server 的高可用性选项

Azure VM 上 SQL Server 的高可用性选项

Microsoft Azure 基础架构旨在为您的应用程序和数据提供高可用性。 Azure 提供了多种用于实现高可用性的基础设施选项,包括可用性区域、配对区域、冗余存储以及高速、低延迟的网络连接。 所有这些服务均由服务级别协议 (SLA) 提供支持,以确保您的关键业务应用程序的可用性。 这篇博文将重点介绍在 Azure 虚拟机中运行 SQL Server 时的高可用性选项。

Azure 基础架构

在我们进入 SQL Server 的高可用性选项之前,让我们讨论一下必须到位的重要基础架构。 可用性区域、区域和配对区域是 Azure 基础结构中的关键概念,在规划应用程序和数据的高可用性.

可用区是区域内物理上独立的位置,提供冗余电源、冷却和网络。 每个可用区由一个或多个数据中心组成。 通过将您的资源放置在不同的可用区中,您可以保护您的应用程序和数据免受计划内或计划外维护、硬件故障或自然灾害造成的中断。 在将可用区用于 SQL Server 部署时,您有资格获得 99.99%可用性 SLA对于虚拟机。

区域是 Azure 服务可用的地理位置。 Azure 目前在全球拥有 60 多个区域,每个区域都有多个可用区。 通过将您的资源放置在不同的区域,您可以提供更好的保护,以防止自然灾害或其他重大事件造成的中断。

配对区域是具有独特关系的预定义区域对。 最值得注意的是,当使用地理冗余存储时,成对的区域会相互复制数据。 成对区域的其他好处是区域恢复顺序、顺序更新、物理隔离和数据驻留。 在设计灾难恢复计划时,建议对主要位置和灾难恢复位置使用配对区域。

将可用性区域和配对区域与可用性组和故障转移集群实例等高可用性选项结合使用,您可以创建高度可用、有弹性的 SQL Server 部署,这些部署可以承受各种故障,从而最大限度地减少停机时间。

SQL Server 可用性组和故障转移群集实例

SQL Server 可用性组 (AG) 和 SQL Server 故障转移群集实例 (FCI) 都是 SQL Server 的高可用性 (HA) 和灾难恢复 (DR) 解决方案,但它们的工作方式不同。

AG 是 SQL Server 企业版的一项功能,它通过跨多个服务器(称为副本)复制数据库来提供 HA 解决方案,以确保数据库在发生故障时始终可用。 AG 可用于为单个数据库和多个数据库提供 HA。

SQL Server Standard Edition 支持称为 Basic AG 的东西。 SQL Server 中的基本 AG 存在一些限制。 首先,Basic AG 只支持单个数据库。 如果您有多个数据库,则每个数据库都需要一个 AG 以及关联的 IP 地址和负载平衡器。 此外,Basic AG 不支持只读副本。 虽然 Basic AG 提供了一种为单个数据库实现 HA 的简单方法,但它们可能不适合更复杂的场景。

另一方面,SQL Server FCI 是 Windows Server 故障转移群集 (WSFC),它通过创建使用共享存储的多个服务器(称为节点)的群集来提供 HA 解决方案。 如果发生故障,在一个节点上运行的 SQL Server 实例可以故障转移到另一个节点。

在 SQL Server 2022 Enterprise Edition 中,新的 Contained Availability Groups (CAG) 通过允许用户创建系统数据库到 CAG,然后可以复制,从而解决了一些 AG 限制。 CAG 消除了手动同步 SQL 登录和 SQL 代理作业等内容的需要。

可用性组和故障转移集群实例各有利弊。 AG 具有高级功能,例如可读辅助节点以及同步和异步复制。 但是,AG 需要 SQL Server 的企业版,这可能会导致成本过高,尤其是在您不需要任何其他企业版功能的情况下。

FCI 保护整个 SQL Server 实例,包括所有用户定义的数据库和系统数据库。 FCI 使管理更容易,因为所有更改(包括对 SQL Server 代理作业、用户帐户和密码以及数据库添加和删除所做的更改)都会在所有版本的 SQL Server 上自动协调,而不仅仅是带有 CAG 的 SQL 2022。 FCI 随 SQL Server Standard Edition 提供,这使其更具成本效益。 但是,FCI 需要共享存储,这在跨可用区、区域或混合云配置的环境中部署时会带来挑战。 详细了解 SIOS 软件如何启用SQL 服务器的高可用性.

SQL Server 故障转移群集实例的存储选项

关于跨可用区的 SQL Server 故障转移集群实例的存储选项,有三个选项:Azure 文件共享、带区域冗余存储的 Azure 共享磁盘和 SIOS DataKeeper 集群版。 还有第四个选项,Storage Spaces Direct (S2D),但仅限于单个 AZ 部署,因此基于 S2D 的集群不符合 99.99% SLA 的条件,并且容易受到影响整个 AZ 的故障的影响。

Azure 文件共享

具有区域冗余 (ZRS) 的 Azure 文件共享功能允许你跨 Azure 区域的不同可用性区域存储数据的多个副本,从而提供更高的持久性和可用性。 然后可以将此数据共享为 CIFS 文件共享,并且集群使用 SMB 3 协议连接到它。

Azure 共享磁盘

具有区域冗余存储 (ZRS) 的 Azure 共享磁盘是一种共享磁盘,可以存储 SQL Server 数据以供在群集中使用。 SCSI 持久保留确保只有活动集群节点才能访问数据。 如果主可用区发生故障,备用可用区中的数据将变为活动状态。 使用 ZRS 的共享磁盘仅在美国西部 2、西欧、北欧和法国中部区域可用。

SIOS DataKeeper 集群版

SIOS DataKeeper 集群版是一种存储 HA 解决方案,支持 Azure 中的 SQL Server 故障转移群集。 它在所有区域可用,并且是唯一支持跨可用区故障转移和跨区域故障转移的 FCI 存储选项。 它还支持跨本地到云配置的混合云配置。 DataKeeper 是一种软件解决方案,可使本地附加存储在所有集群节点之间保持同步。 它作为称为 DataKeeper 卷的第三方存储类集群资源与 WSFC 集成。 故障转移集群控制 DataKeeper 卷的所有管理,为最终用户提供无缝体验。 学习更多关于SIOS 数据管理员。

概括

总之,Azure 提供了各种基础结构选项来实现 SQL Server 部署的高可用性,例如可用性区域、区域和配对区域。 通过利用这些选项,结合可用性组和故障转移群集实例等高可用性解决方案,您可以创建高度可用、有弹性的 SQL Server 部署,可以承受各种故障并最大限度地减少停机时间。 在为您的特定需求选择最佳解决方案之前,了解所需的基础架构以及每个选项的优缺点至关重要。 建议咨询 SQL 和 Azure 专家以指导你完成整个过程,并查看 Azure 文档和最佳实践。 通过适当的规划和实施,您可以确保 Azure 上的 SQL Server 部署始终可用于支持您的关键业务应用程序。

联系我们了解更多关于我们的信息高可用性解决方案.

经许可转载自信息系统

Filed Under: 服务器集群简单化

  • « Previous Page
  • 1
  • 2
  • 3
  • 4
  • 5
  • …
  • 76
  • Next Page »

最近的帖子

  • 情况说明书:石油和天然气
  • 视频:适用于 Linux v9.7 的 SIOS LifeKeeper 为 SAP HANA 添加了新的 HA/DR 功能
  • 更好地维护高可用性集群需要考虑的十个问题
  • 视频:HANA 多目标功能演示
  • 我们将 HANA Multitarget 打造成为游戏规则的改变者

最热门的帖子

加入我们的邮件列表

Copyright © 2023 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in