5月 5, 2024 |
更好支持的三个技巧更好支持的三个技巧Betsy 是一辆 1999 款 Amazon Green Ford F-150,这是我购买的第一辆车。我不知道我的卡车是如何得到“贝特西”这个名字的,也不知道为什么它被卡住了,但它确实被卡住了。在超过 17 年的时间里,贝特西做了各种各样的事,从在海滩巡游到在跑道上比赛,拖运大量的园林绿化用品,再到带着我不断壮大的家人穿越东南部。经过很多英里和多年的学习如何保养卡车后,她开始展示磨损情况。在一次下午开车时,我注意到温度计逐渐升至 H(高)。经过几次交谈后,我带贝特西去了当地一家经销商的服务部门,开始了为期一周的自我折磨。 第一次访问时,我匆忙提供了高级细节。 “几分钟后,卡车就开始发热了,”我说。六个小时后,我花了 100 美元取回了我的卡车。技术人员无法重现该问题。因此,我被送回家,并支付了诊断费,并要求如果再次发生这种情况就回来。第二次来时,我匆忙补充说,问题发生在 18 分钟或 14 英里的驾驶时间超过 45 分钟的通勤时间之后。六个小时后,花了大约 375 美元,我取回了我的卡车。技术人员能够用新的细节重现问题,并更换了恒温器和软管。第三次来的时候,技术员的电话提前打来:“先生。”鲁,你需要一个新的散热器。” 这就是这个故事的简短版本。较长的版本包括我未能向服务技术人员解释在第一次和第二次访问之间我已经更换了恒温器。它还忽略了一个事实,即我对散热器液体进行了冲洗和填充,并且很可能在此过程中使软管夹松动。最重要的是,它忽略了这样一个事实:我的邻居(一名机械师)在卡车出现此问题之前告诉我,要更换散热器并进行其他预防性维护。现在,这与更好的客户体验有什么关系呢? 以下是我从自己遭受的磨难中得到的三个教训,它们将改善您的客户体验,而不仅仅是您的下一次汽车服务。 首先,获取并提供所有详细信息。在我第一次访问时,我匆忙向服务技术人员提供了最基本的详细信息。结果,无法实现适当的解决方案。世界上的许多事件发生在最不合时宜的时间,并带来很大的压力和时间限制,但向您的客户体验团队提供尽可能多的详细信息仍然是最佳实践。您什么时候注意到这个问题,或者问题是什么时候发生的?您注意到了什么或者问题的症状是什么?当时还发生了什么其他事情? 考虑您可能提供的任何其他支持详细信息,包括错误消息和错误代码、软件系统日志、客户端日志以及捕获错误情况或症状的任何图片。很多时候我们喜欢认为软件中的事物是不相关的,而事实上它们是非常相关的。 其次,描述你所做的事情(好的或坏的)。当我第二次来的时候,我给自己和技术人员带来了又一次极大的伤害。我没有解释我已经尝试过的所有事情(好的和坏的),并分享解决问题的失败尝试,而是推迟了我的解决方案。如果我告诉大家我已经更换了恒温器,对散热器进行了冲洗和重新填充,也许技术人员会去其他地方寻找问题。当您分享您为解决问题所采取的措施以及您可能采取的措施使问题变得更糟时,它可以帮助您的客户体验团队改进他们的响应,专注于其他问题领域,消除虚假的转移注意力(不相关的问题或事情)伪装成真实问题),并提供整体更出色的体验。 最后,执行之前的建议。在问题出现之前,我的邻居根据他多年的经验和我的卡车的车龄提供了建议。他告诉我更换散热器,进行一些预防性维护,并对卡车的整体健康状况进行例行检查。最有可能的是,您的客户体验团队在其知识库中提供了与您的产品相关的建议以及与企业可用性要求运营相关的多年经验。使用它们进行预防性维护、主动调整,并检查您的可用性环境是否遵守这些最佳实践。但最重要的是,当他们提出建议时,执行它。最后,您将节省大量时间、金钱和麻烦。 第三次访问两天后,新散热器的缺货到达,我更换了散热器。我又继续开着 Betsy 好几年,最后才把它换成了一辆家用 SUV。 经许可转载安全操作系统
|
||||||||||||
4月 30, 2024 |
Udemy 提供 SIOS LifeKeeper for Linux 管理员培训Udemy 提供 SIOS LifeKeeper for Linux 管理员培训SIOS 管理培训以前主要通过预先安排的双月活动进行,现在可以通过 Udemy 按需进行。西奥斯科技宣布推出适用于 Linux 管理员培训的 SIOS LifeKeeper乌德米,一个在线技能市场和学习平台。这一发展突显了 SIOS 致力于通过为全球企业提供全面的高可用性和灾难恢复来促进关键应用程序的可用性(医管局/灾难恢复) 技术培训。 Udemy 的平台提供无与伦比的便利性和灵活性,让学习者可以随时随地访问 SIOS 管理培训。适用于 Linux 的 SIOS LifeKeeper 管理员培训涵盖了确保关键 Linux 应用程序、ERP 和数据库始终可用(即使在出现硬件或软件故障时)所需的关键概念和方法。 SIOS Technology Corp 全球销售与营销副总裁 Margaret Hoagland 表示:“与 Udemy 的合作标志着我们使命的一个重要里程碑,即让所有人都能获得 SIOS HA/DR 专业知识。通过利用 Udemy 的平台,我们可以覆盖更广泛的领域。” IT 专业人士的受众,为他们提供确保组织高可用性和灾难恢复所需的知识和技能。” 未来的学习者可以通过首先在 Udemy (www.udemy.com) 上创建免费帐户并使用其企业电子邮件注册来访问 SIOS LifeKeeper for Linux 管理员培训课程。注册后,他们在网站上提交一份表格SIOS培训现场,使用他们在 Udemy 上注册时使用的同一企业电子邮件来接收课程邀请。 经许可转载安全操作系统 |
||||||||||||
4月 24, 2024 |
SIOS 技术加入 Nutanix Elevate 合作伙伴计划SIOS 技术加入 Nutanix Elevate 合作伙伴计划西奥斯科技公司。宣布其加入Nutanix Elevate 合作伙伴计划,标志着为 Nutanix AHV 环境中的关键应用程序提供易于使用的 HA 集群解决方案的一个里程碑。 授予 SIOS 的 Nutanix Ready 验证称号的完成证明了 SIOS生命守护者和数据管理员与 Nutanix 基础设施的互操作性。作为此次验证的一部分,两家合作伙伴正在合作帮助共同客户从持续创新中受益。 SIOS 的业绩记录包括成功为客户实施 HA 和 DR,在全球安装了 80,000 多个许可证,保护各行业公司的应用程序。 LifeKeeper 和 DataKeeper 产品已完成验证测试,这可以让客户对解决方案的兼容性更有信心。 LifeKeeper for Linux 使 Nutanix 能够为客户提供简单、可靠的 HA,以实现以深厚的 HA 专业知识为后盾的业务关键型应用程序。借助 SIOS 产品,具有本质复杂环境(例如 SAP、HANA、SQL Server 以及在 SUSE Linux、Red Hat Linux、Oracle Linux、Rocky Linux 和 Windows Server 中运行的其他环境)的 Nutanix 客户可以通过实施、维护来节省时间并消除代价高昂的停机时间。 ,并管理稳定、可靠的 HA 环境。 SIOS 全球营销副总裁 Margaret Hoagland 表示:“加入 Nutanix Elevate 合作伙伴计划证明了我们致力于为客户提供强大的 HA 解决方案、扩大我们的覆盖范围并为 Nutanix 用户提供他们所需的可靠性和简单性,以确保不间断的运行其关键应用程序的操作。“ 荣获“Nutanix Ready Validated”称号的 SIOS 产品包括: LifeKeeper for Linux 为最广泛的 Linux 操作系统发行版、版本和平台提供 HA;本地、虚拟和云。 SIOS 的 HA/DR 产品组合包括带宽高效、基于主机的块级复制、应用程序恢复套件 (ARK),以支持 SAP、HANA 和其他流行数据库和应用程序的应用程序感知,以及通用的可定制 ARK。 LifeKeeper for Linux 为应用程序、数据库和存储提供自动监控、问题检测和智能恢复,以确保关键系统和应用程序保持高可用性。 |
||||||||||||
4月 22, 2024 |
分步操作 – OCI 中的 SQL Server 2019 故障转移群集实例 (FCI)分步操作 – OCI 中的 SQL Server 2019 故障转移群集实例 (FCI)介绍如果您在 Oracle 云基础设施 (OCI) 中部署关键业务应用程序,那么了解并利用 OCI 提供的可用性 SLA(服务级别协议)以获得最佳正常运行时间和可靠性至关重要。 OCI 的 SLA 根据您选择的部署策略而有所不同: 跨可用性域部署:当您在同一 OCI 区域内的不同可用性域中部署两个或多个虚拟机 (VM) 时,OCI 提供 99.99% 的可用性 SLA。 跨故障域部署:如果跨故障域部署虚拟机,OCI 提供 99.95% 的可用性 SLA。需要注意的是,并非每个 OCI 区域都有多个可用性域,因此在某些区域,跨故障域部署将是您唯一的选择。 单一虚拟机部署:对于涉及单个虚拟机的部署,SLA 为 99.9%。 此框架意味着 OCI 根据您部署 VM 的方式保证一定级别的外部连接: 请务必注意,SLA 涵盖虚拟机本身的可用性,而不是其上运行的应用程序或服务的可用性。为了确保应用程序可用性,需要采取额外的措施,例如应用程序监视、恢复计划、数据复制和事务复制(对于 SQL Server 等数据库)。策略可能包括负载平衡、集群或数据复制,以有效管理应用程序可用性。 为了满足 OCI 中 99.99% 可用性 SLA 的标准,必须跨多个可用性域部署虚拟机。这篇文章将指导您设计 OCI 基础设施,以促进跨可用性域的 SQL Server 故障转移集群实例,从而确保关键业务应用程序的最大正常运行时间和可靠性。 创建 VCN 和子网 在本指南中,我假设您对 Oracle 云基础设施 (OCI) 有一定的了解并对网络概念有基本的了解。我将通过描述来说明常见的配置任务,并在必要时提供额外的指导来应对 OCI 网络中遇到的一些常见挑战。 从深思熟虑的网络计划开始至关重要。本文档不会涵盖云网络规划的复杂性,因此以下示例应仅被视为多种可能性之一。您的网络配置可能会有很大差异。但是,一个重要的考虑因素是规划至少使用三个可用性域,为每个集群节点分配一个,为文件共享见证分配另一个。集群所需的重要一点是每个可用性域必须位于不同的子网中。 尽管我们没有涵盖跨故障域而不是可用性域的配置,但这同样适用于跨故障域的集群 – 所有节点必须驻留在不同的子网中。 在我们的场景中,我们将在 OCI 中的单个虚拟云网络 (VCN) 内跨三个不同的可用性域设置三个子网。 VCN:10.0.0.0/16
OCI 的用户界面可能会发生变化,但在撰写本文时,在 OCI 控制台中创建新 VCN 和三个子网的过程非常简单。具体细节可以在 OCI 文档或通过其用户界面找到,它会指导您完成 VCN 和子网创建的必要步骤。 创建VCN![]() 在 VCN 中创建三个子网![]() ![]() ![]() 创建 Internet 网关互联网网关是我们的实例访问互联网的方式。在您的网络中,您可能不希望实例能够访问互联网,但在本示例中,我们将启用它并将其添加到我们的默认路由表中。 ![]() 编辑默认安全列表![]() 编辑路由表编辑路由表,以便所有发往 VCN 外部的流量都通过 Internet 网关进行路由。 ![]() 创建网络安全组![]() ![]() ![]() 编辑安全列表![]() ![]() 这些设置允许跨可用性域不受限制的访问,并允许从任何地方进行 RDP 访问。您可以考虑限制哪些 IP 地址可以 RDP 到您的实例,甚至设置一个专门用于从公共网络进行 RDP 访问的“跳转虚拟机”。 编辑 DHCP 选项为了使 Active Directory 正常工作,您必须在 DHCP 选项中将 DC1 设置为主 DNS 服务器,如下所示。在本例中,我们将其设置为 10.0.0.100,这是我们正在配置的域控制器的静态 IP。您还应该将您的域添加到自定义搜索域。在本例中,我们将使用名为 datakeeper.local 的域,稍后我们将在配置域控制器时构建该域。 ![]() 配置虚拟机现在 VCN 已配置完毕,是时候开始配置虚拟机了。在此示例中,我们将使用 Windows Server 2022 和 SQL Server 2019。但是,本文中描述的步骤在所有版本的 Windows Server 和 SQL Server 中几乎相同,因此无论使用哪个版本,您都不应该遇到任何问题。您计划使用的 Windows 或 SQL Server。 在开始之前,制定计划再次很重要。在这种情况下,您需要规划您的服务器名称、IP 地址及其可用区布局。如前所述,每个集群节点和文件共享见证都必须驻留在不同的可用区中。 在示例配置中,我们将在实例 (DC1) 中部署 Active-Directory,该实例也将充当文件共享见证。 AD1 – DC1 (10.0.0.100) AD2 – SQL1 – (10.0.64.100, 10.0.64.101, 10.0.64.102) AD3 – SQL2 – (10.0.128.100, 10.0.128.101, 10.0.128.102) 您可能已经注意到,每个集群节点(SQL1、SQL2)都有三个 IP 地址。第一个地址是实例的私有IP地址。另外两个 IP 地址将作为辅助地址添加到每个实例上。这些 IP 地址包含与 SQL Server FCI 网络名称资源关联的核心群集 IP 地址和虚拟 IP 地址。 当我们配置集群节点时,我们将使用不包含 SQL Server 软件的基本 Windows Server 2022 映像。相反,我们将下载 SQL Server 安装介质并使用永久 SQL Server 许可证,而不是 Marketplace 上提供的“即用即付”许可证。 以下部分说明了配置本示例中使用的三个虚拟机的过程。 在FD1中配置DC1选择实例类型时,您必须根据工作负载适当调整实例类型。这与您调整物理服务器大小以在本地使用时所做的类似,但不同之处在于,如果您首次过度配置或配置不足,或者您的工作负载随着时间的推移增加或减少。 指定实例详细信息时,请确保选择正确的 VCN 和子网以进行正确放置。在第一个屏幕上,您还可以指定要与该实例关联的静态 IP。 ![]() 在 FD2 中配置 SQL1如前所述,此示例使用 Windows Server 2022 的基本安装。稍后将下载 SQL Server 2019 并用于 SQL Server FCI 安装。 ![]() 在 FD3 中配置 SQL2![]() 添加额外的卷集群中的每台服务器都需要至少一个额外的卷。这些卷对于 SQL Server FCI 的存储需求至关重要,并由 SIOS DataKeeper 进行复制。 多卷您可以添加多个卷来分隔数据、日志和备份。 存储类型:多种存储类型可供选择,以满足不同的需求。 附着方法有多种方法可以将存储连接到服务器。 配置示例下面,我们提供了屏幕截图,展示了多种可能的存储配置之一。这是一个实际示例,有助于理解设置过程。此过程应在 SQL1 和 SQL2 上完成。 创建块卷首先,在正确的可用性域中为 SQL1 和 SQL2 创建块卷。 ![]() ![]() 附加卷现在卷已创建,您必须将它们附加到实例。 ![]() ![]() ![]() ![]() 需要记住的要点设置灵活。您可以根据您的具体需求配置一个或多个卷。 考虑适合您的配置的不同存储类型和连接方法。 添加辅助 IP 地址为了使 Windows Server 故障转移群集在 OCI 中正常工作,您必须将群集 IP 地址添加为附加到 SQL1 和 SQL1 的虚拟网络接口 (VNIC) 上的辅助地址。您还记得,我们讨论过在每个集群节点上使用以下 IP 地址。
在 SQL1 和 SQL2 上,编辑附加的 VNIC 以添加辅助地址。 ![]() 创建域为了实现弹性,您应该跨不同的可用区配置多个 AD 控制器,但出于本指南的目的,我们将仅配置一个 AD 控制器。按照下面的屏幕截图在 DC1 上配置 AD。 使用实例详细信息部分中列出的凭据登录。系统将提示您重置密码。 启用 Active Directory 域服务![]() ![]() 将服务器升级为域控制器在开始此过程之前,请在服务器上启用本地管理员帐户并设置密码。如果不这样做,当您尝试升级域控制器时,您将收到此消息。 ![]() 启用管理员帐户并设置密码后,继续进行部署后配置 ![]() ![]() ![]() ![]() ![]() ![]() 在启用 Active Directory 域服务之前,您必须启用本地管理员帐户并使用该帐户登录。 使用您最喜欢的 RDP 程序,使用与实例关联的公共 IP 地址连接到 DC1。添加 Active Directory 域服务角色。 ![]() ![]() ![]() 安装完成后,将此服务器提升为域控制器。 ![]() 出于我们的目的,我们将创建一个新域。 ![]() ![]() ![]() ![]() ![]() ![]() ![]() 重新启动 DC1 并继续下一部分。 将 SQL1 和 SQL2 添加到域 ![]() 准备存储将 SQL1 和 SQL2 添加到域后,使用您创建的域管理员帐户连接到实例以完成其余的配置步骤。您需要做的第一件事是附加并格式化我们添加到 SQL1 和 SQL2 的 EBS 卷,如下所示。 ![]() ![]() ![]() ![]() 配置故障转移集群功能在 SQL1 和 SQL2 上启用故障转移群集功能。 在 SQL1 和 SQL2 上运行此 PowerShell 命令 安装-WindowsFeature-名称故障转移群集-IncludeManagementTools 验证您的集群从 SQL1 或 SQL2 运行此 PowerShell 命令 测试集群-节点 sql1,sql2 根据您使用的 Windows Server 版本,您将看到一些有关网络和可能存储的警告。网络警告可能会告诉您每个集群节点都可以通过单个接口访问。早期版本的 Windows 会警告您缺少共享存储。 您可以忽略这两个错误,因为它们在 OCI 托管的集群中是预期的。只要您没有收到错误,就可以继续下一部分。如果您收到任何错误,请修复它们,然后再次运行验证并继续下一部分。 创建集群接下来,您将创建集群。在下面的示例中,您会注意到我使用了我们计划使用的两个 IP 地址:10.0.64.101 和 10.0.128.101。您可以从任一群集节点运行此 Powershell。 新建集群 -名称 cluster1 -节点 sql1,sql2 -静态地址 10.0.64.101, 10.0.128.101 请注意:不要尝试通过 WSFC GUI 创建集群。您会发现,由于实例使用 DHCP,GUI 不会为您提供为集群分配 IP 地址的选项,而是会分发重复的 IP 地址。 添加文件共享见证为了维持集群仲裁,您需要添加见证人。在 OCI 中,您要使用的见证类型是文件共享见证。文件共享见证必须驻留在与两个群集节点不同的故障域中的服务器上。 在下面的示例中,将在驻留在 FD1 中的 DC1 上创建文件共享见证。 在 DC1 上,创建文件共享并分配集群名称对象 (CNO) 对该文件夹的读写权限。在您创建的文件夹的“共享”和“安全”选项卡上添加 CNO 的权限,在下面的示例中,我创建了一个名为“见证”的文件夹。 ![]() ![]() ![]() 创建文件夹并向 CNO 分配适当的权限后,请在 SQL1 或 SQL2 上运行以下 PowerShell 命令。 设置 ClusterQuorum -Cluster cluster1 -FileShareWitness \\dc1\Witness 当您在 SQL1 或 SQL2 上启动故障转移群集管理器时,您的群集现在应如下所示。 ![]() 创建 SQL Server FCI安装DataKeeper集群版在继续执行后续步骤之前,您需要在 SQL1 和 SQL2 上安装 DataKeeper Cluster Edition。下载安装可执行文件并在两个节点上运行 DataKeeper 安装程序。请参阅SIOS文档有关安装的具体指导。 创建 DataKeeper 卷资源在任一集群节点上启动 DataKeeper UI 并创建 DataKeeper 卷资源,如下所示。 连接到两台服务器,首先是 SQL1,然后是 SQL2 ![]() 如果您已连接到两台服务器并且存储配置正确,则服务器概述报告应如下所示。 ![]() 单击创建作业以启动作业创建向导 ![]() ![]() ![]() ![]() DataKeeper 支持同步和异步复制。对于同一区域内的可用区之间的复制,请选择同步。如果您想跨区域甚至跨云提供商复制,请选择异步 ![]() 这里点击“是”,将DataKeeper Volume资源注册到集群的Available Storage中 DataKeeper 卷 D 现在显示在故障转移群集管理器的可用存储中。 ![]() 在 SQL1 上安装 SQL Server FCI 的第一个节点现在核心集群已创建,并且 DataKeeper 卷资源位于可用存储中,是时候在第一个集群节点上安装 SQL Server 了。如前所述,此处的示例说明了使用 SQL 2019 和 Windows 2022 的群集配置,但无论您尝试部署哪个版本的 Windows Server 或 SQL Server,此示例中描述的所有步骤实际上都是相同的。 按照下面的示例在 SQL1 上安装 SQL Server ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() 您在下面指定的名称是客户端访问点。这是应用程序服务器想要连接到 SQL Server FCI 时将使用的名称。 ![]() ![]() ![]() 在此屏幕上,您将添加我们之前在规划部分中确定的 SQL1 辅助 IP 地址第1部分这个系列的。 ![]() ![]() ![]() 在此示例中,我们将 tempdb 保留在 D 驱动器上。但是,为了获得最佳性能,建议您将 tempdb 放置在非复制卷上。 在 SQL2 上安装 SQL Server FCI 的第二个节点现在是在 SQL2 上安装 SQL Server 的时候了。 ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() 在两个群集节点上安装 SQL Server 后,故障转移群集管理器应如下所示。 ![]() 安装 SQL Server Management Studio在 SQL Server 版本 2016 及更高版本上,您必须作为单独的选项下载并安装 SSMS,如下所示。注意:在 SQL Server 的早期版本中,SQL Server Management Studio (SSMS) 是您可以在 SQL 安装期间选择安装的一个选项。 ![]() 安装 SSMS 后,通过客户端访问点连接到集群。您的 SQL Server FCI 应该如下所示。 ![]() 多子网注意事项在 OCI 中运行 SQL Server FCI 的最大考虑因素之一是群集节点驻留在不同的子网中。 Microsoft 开始通过在 Windows Server 2008 R2 中添加“OR”功能来考虑群集节点可能驻留在不同子网中的事实,如 Microsoft文档。 取自SQL Server 多子网集群 (SQL Server) 文档中描述的重要内容是网络名称资源上的 RegisterAllProvidersIP 概念,在创建 SQL Server FCI 时默认启用该概念。如上所述,启用此功能后,将在 DNS 中使用网络名称资源注册两条 A 记录,每个 IP 地址对应一条记录。 使用“OR”功能,只有与活动子网关联的 IP 地址才会在线,而另一个将显示为离线。如果您的客户端支持将 multisubnetfailover=true 添加到连接字符串,则将同时尝试两个 IP 地址,并且客户端将自动连接到活动节点。这是最简单的,也是多子网集群中客户端重定向的默认方法。 该文档接着说,如果您的客户端不支持 multisubnetfailover=true 功能,则您应该“尝试将每个附加 IP 地址的客户端连接字符串中的连接超时调整为 21 秒。这可确保客户端的重新连接尝试在能够循环访问多子网 FCI 中的所有 IP 地址之前不会超时。” 禁用 RegisterAllProvidersIP 是另一个可行的选项。通过禁用 RegisterAllProvidersIP,您在 DNS 中将只有一条 A 记录。每次集群故障转移时,DNS A 记录都会更新为与名称资源关联的活动集群 IP 地址。 此方案配置的缺点是您的客户端将缓存旧 IP 地址,直到生存时间 (TTL) 到期。为了最大限度地减少重新连接的延迟,建议您更改名称资源上的 TTL。描述了这个过程这里下面显示了将 TTL 设置为 5 分钟的示例。 获取 ClusterResource -名称 sqlcluster |设置 ClusterParameter -名称 HostRecordTTL -值 300 请记住,对 AD 集成 DNS 服务器的更改也可能需要一些时间才能传播到整个林。 概括本技术指南全面概述了在 Oracle 云基础设施 (OCI) 中设置 SQL Server 2019 故障转移集群实例 (FCI)。首先强调了解 OCI 可用性 SLA 的重要性,该 SLA 根据部署策略而有所不同:跨可用性域部署为 99.99%,跨故障域部署为 99.95%,单个虚拟机部署为 99.9%。该指南强调,SLA 涵盖虚拟机可用性,而不是其上运行的应用程序或服务,因此需要采取额外的措施来确保应用程序可用性。 该指南详细介绍了在 OCI 中创建虚拟云网络 (VCN) 和子网的初始步骤,强调需要一个能够容纳至少三个可用性域以实现集群目的的网络规划。每个可用性域必须位于不同的子网中,这一要求也适用于跨故障域的集群。它提供了用于在单个 VCN 内跨不同可用性域设置三个子网的特定配置。 此外,该指南还描述了创建互联网网关以及编辑默认安全列表和路由表以促进跨可用性域的访问和安全的过程。它还介绍了用于 Active Directory 兼容性的 DHCP 选项配置,并概述了使用 Windows Server 2022 和 SQL Server 2019 配置虚拟机的步骤,强调了规划服务器名称、IP 地址和可用区放置的重要性。 然后,该指南深入研究了添加额外卷以满足 SQL Server FCI 存储需求,详细介绍了创建块卷并将其附加到实例的过程。它还指导如何在 OCI 中配置 Windows Server 故障转移群集的辅助 IP 地址。 接下来,本指南介绍了域控制器设置,包括启用 Active Directory 域服务以及将服务器升级为域控制器。它逐步介绍了在 SQL1 和 SQL2 上准备存储和启用故障转移群集功能,以及群集验证和创建过程。 该指南进一步讨论了添加文件共享见证以维护集群仲裁以及安装 DataKeeper Cluster Edition 以进行卷复制。它提供了在群集节点和 SQL Server Management Studio 上安装 SQL Server 的分步方法,以及多子网部署的注意事项。 总之,本指南提供了在 OCI 中部署和配置 SQL Server 2019 FCI 的详细蓝图,涵盖从网络设置和 VM 配置到集群、存储配置和域控制设置等各个方面,确保关键业务应用程序的正常运行时间和可靠性最大化。 经许可转载安全操作系统
|
||||||||||||
4月 15, 2024 |
选择正确的高可用性解决方案的四个技巧选择正确的高可用性解决方案的四个技巧高可用性和勒布朗是有史以来最伟大的 (GOAT) 争论我在黑桃牌上输了。我在卡胡特输了。我在一场篮球比赛中输给了同一个友好的竞争对手布兰登。因此,为了分散他的注意力,我又开始辩论——“勒布朗是有史以来最伟大的!”接下来的紧张气氛充满了来回的咆哮,其中夹杂着一些篮球巨星的名字:迈克尔·乔丹、朱利叶斯·欧文、威尔特·张伯伦、鲍勃·库西、沙克、比尔·拉塞尔、杰里·韦斯特、斯蒂芬·库里、凯文·杜兰特、科比·布莱恩特、魔术师和值得,以及勒布朗。他争辩说:“你怎么能说勒布朗是最伟大的,科比有杀手本能!”我们的口头争论将扩大到有什么要求,是什么让某人成为伟大对话的一部分,甚至是讨论的一部分的候选人。他们是否需要长寿、得分记录、防守能力、其他荣誉和荣誉?他们至少应该获得多少个最有价值球员奖?他们时代的超越又如何呢?怎么样这个或那个,当然,我的朋友布兰登总是很快就添加标题! 如何选择最佳的高可用性解决方案但是,这有什么关系高可用性?很高兴你问了。您多久被要求从众多竞争者中提供或选择最佳可用性或更高可用性的解决方案?您已经确定,因意外应用程序崩溃或生产服务器停机而毁掉的最后一个周末,也是因缺乏自动监控和恢复而毁掉的最后一个周末。但是,在 Microsoft 故障转移集群、SuSE High Availability Extensions、PaceMaker、NEC ClusterPro、vWare HA、SIOS Protection Suite 和 SIOS AppKeeper 等众多知名解决方案中,哪种解决方案最好?我在与史上最伟大的比赛中学到的四件事将帮助您解决高可用性的困境。 医管局的要求首先,有什么要求?如果我想要有史以来最好的纯射手,我会很容易地把斯蒂芬·库里包括在内。如果我想要最令人生畏的身体存在,我会和沙克这样的人一起去。如果我需要最好的队友、助攻王或者全能的优秀球员,那么我认为勒布朗·詹姆斯、魔术师约翰逊、杰里·韦斯特、拉里·伯德都在讨论之中。同样,在开始构建 HA 解决方案之前,请先了解您的需求。是数据复制必需的还是可选的?你需要SQL或者您同样倾向于使用其他数据库?还需要哪些其他应用程序和软件包?您是否需要一个可以引导您进入云的解决方案,但首先它必须驯服遗留系统、vmWare 和物理系统?您是一家全 Windows 应用程序商店,还是两者的混合体?也试着想想你的团队。您的人员流动率是否很高,导致管理多个解决方案变得困难,培训课程是否必不可少,以及现实生活中的人们在支持批判的?您需要易用性还是只注重坚固性?产品、产品和公司的寿命和稳定性在哪里? 其次,你如何确定你的需求的优先级?您将如何根据既定要求优先考虑优秀者?我的朋友布兰登总是很快就给出标题。他总是反驳,勒布朗有多少个冠军?在他的辩论中,头衔才是王道。我通常会讽刺地反驳说,即使是替补席上的第 12 个人也能获得戒指。我要强调的是,罗伯特·霍里是一位出色的大前锋,他拥有的头衔比勒布朗和乔丹还要多。就需求的优先级进行坦率和诚实的对话。当您选择 HA 解决方案时,与 RTO/RPO 相比,易用性、操作系统支持和应用程序支持范围有多重要?哪些功能和要求被认为是必须具备的、应该具备的以及最好拥有的。作为客户体验副总裁,我们曾经遇到过一位客户,他坚持集群软件支持32个节点,尽管他们并没有计划构建超过2个或3个节点的集群。确定列表的优先顺序。 测量灾难恢复的 RPO 和 RTO第三,您如何衡量这些要求?您将如何根据既定要求来衡量伟大人物?篮球统计数据很有趣、信息丰富,但常常具有误导性。布兰登经常提醒我检查得分冠军是如何赢得的,就像我教赢得了多少个冠军一样。我们经常对谁能更好地开始或结束比赛以及如何真正衡量动力、强度和获胜意愿进行讽刺。同样,当您梳理文献时,请仔细研究概念验证细节,确定并定义如何衡量 RPO 和 RTO 等内容。 RTO 是基于客户端重新连接时间还是应用程序重新启动时间?您是否正在测量 RTO故障转移(服务器崩溃)恢复(应用程序崩溃)、手动切换(管理操作),或以上全部?如果应用程序性能对您很重要,那么该衡量标准是什么样的?是读取性能、写入性能还是基于客户端的实际或特征工作负载?想想基准适合什么地方,或者适合吗?另外,请诚实地说明您将数字与什么进行比较。在正常操作和恢复期间测量更快的数据库查询时间很重要,但如果解决方案的其余部分产生了用户体验更高的滞后怎么办? 评估高可用性和灾难恢复最后,继续评价。从朱利叶斯在底线摇晃婴儿入睡,到乔丹从罚球线起跳,再到斯蒂芬·库里在半场线内迈出一步,篮球比赛一直在演变。 “乔丹规则”和“坏小子时代”的狂妄已经被一套有利于并强调技巧、力量和技巧结合的规则所取代。同样,技术格局也在不断变化。当 Solaris 和 MP-RAS 服务器占据主导地位时,进入前十名的解决方案可能无法适应 Linux、Windows 或其他变体的灵活性。利用光纤通道功能的基于 SAN 的解决方案可能已过时云端和无SAN世界。所以,不断评估伟大。持续关注前十名的解决方案如何顺应趋势,或者更好的是,仍然在制造它们。 虽然我与 Brandon 的争论仍在继续,而且很可能在几代人之后,甚至我们的孩子也不会选出赢家,但您可以选择正确的 HA 解决方案来满足您的企业可用性需求。联系 SIOS 代表帮助您了解、确定优先顺序并衡量 SIOS 保护套件超出您要求的能力。 经许可转载安全操作系统 |