服务器集群简单化 Archives - 第73页共100页

Azure Outage Post Mortem第3部分

11月 8, 2018 by Jason Aw Leave a Comment

结束Azure Outage Post-Mortem第3部分

我以前的博客帖子，Azure Outage Post-Mortem – 第1部分和Azure Outage Post-Mortem第2部分，基于来自博客帖子和Twitter的有限信息做出了一些假设。我刚刚参加了Ignite的一次会议，它更明确地说明了实际发生的事情。明天某个时候你应该能够自己查看会话。BRK3075 – 为意外做准备：解决Azure中断官方根本原因分析即将发布。与此同时，这里有一些从会话中收集到的信息。

原因

从死后的蔚蓝停电中，停电不是由先前报道的雷击引起的。相反，由于风暴的性质，电风暴下陷和膨胀。结果，它锁定了第一个数据中心的^冷水机组。在第一次停电期间，他们能够快速恢复冷却器，没有明显的影响。此后不久，第二个数据中心发生了第二次中断，无法正常恢复。这开始了一系列不幸的事件。

第二次停电

在此次停电期间，微软表示“工程师没有正确分类警报 – 冷水机组恢复没有优先考虑”。此时触发了大量警报。不幸的是，冷冻机处于脱机状态并没有得到应有的优先权。关于为何发生这种情况的RCA仍在调查中。微软声称当然有多余的冷却系统。但是，冷却系统未设置为自动故障转移。最近安装的新设备尚未经过全面测试。所以它被设置为手动模式，直到测试完成。45分钟后，环境冷却失败，硬件停机，空气处理人员关闭，因为他们认为发生火灾。工作人员因虚假火警而被疏散。在此期间，数据中心的温度在升高。某些硬件没有正常关闭，导致某些存储和网络损坏。手动重置冷却器并打开空气处理器后，温度开始恢复正常。他们花了大约3小时29分钟才能全面了解数据中心的状态。最大的问题是存储损坏。微软最关心的是数据保护。Microsoft将努力恢复数据以确保不会丢失数据。这当然需要一些时间，这延长了停机的总长度。好消息是没有客户数据丢失。坏消息是，事情似乎需要24-48小时才能恢复正常。这是基于我在Twitter上从抱怨长时间停机的客户那里读到的内容。

假设

每个人都预计这次中断会影响在中南部地区的客户。但他们没想到的是，停电会对该地区产生影响。在会话中，Microsoft讨论了中断的一些扩展范围。

Azure服务管理器（ASM）

这可以控制Azure“Classic”资源，AKA，ARM之前的资源。任何依赖ASM的人都可能受到影响。我不清楚为什么会这样。南中部地区似乎拥有该服务的一些重要组成部分，而这些部分无法使用。

Visual Studio团队服务（VSTS）

同样，似乎许多支持此服务的资源都在中南部地区托管。Azure DevOps此博客文章的工程总监Buck Hodges（@tfsbuck）详细介绍了这次中断。

POSTMORTEM：VSTS 2018年9月4日

Azure Active Directory（AAD）

当中南部地区失败时，AAD按照预期的方式行事，并开始将身份验证请求指向其他地区。随着东海岸开始醒来并上线，身份验证流量开始增加。现在通常AAD会通过自动缩放来处理流量的增加。但是自动缩放依赖于ASM，当然它是离线的。如果没有自动缩放功能，AAD无法处理身份验证请求的增加。令人恼火的情况是Office客户端中的一个错误，这使得它们具有非常积极的重试逻辑，并且没有退避逻辑。这种额外的身份验证流量最终使AAD陷入困境。他们没有时间在Ignite会议期间进一步讨论这个问题。他们将介绍的一个功能是让用户能够在将来手动故障转移存储帐户。因此，如果恢复时间目标（RTO）比（RPO）更重要，则用户将能够在备用数据中心恢复其异步复制的地理冗余存储，如果Microsoft未来再次遭遇延长中断的话。

你现在能做什么

在此之前，您将不得不依赖其他复制解决方案，例如SIOS DataKeeper Azure Sit e Recovery。或者是特定于应用程序的复制解决方案，它能够跨区域复制数据，并能够在您的控件中实施灾难恢复计划。了解有关我们的蔚蓝停电事件的更多信息，经Clusteringformeremortals.com许可转载

Azure Outage Post Mortem第2部分

11月 7, 2018 by Jason Aw Leave a Comment

发生了什么？这是我们的Azure Outage Post Mortem第2部分

我之前的博客文章称，云到云或混合云可以让您与CSP可能遇到的任何问题隔离开来。但是，如果在中南部地区提供可用区，则可以避免由此自然灾害造成的大部分停机时间。微软发布了9月4日南中央停电的初步RCA。整个摘要中最重要的部分如下……

“尽管有现实的冗余，有一些情景，其中一个数据中心的冷却故障会影响受影响的数据中心的客户工作。”

这对你来说代表着什么？

如果您的应用程序都在同一个数据中心运行，那么您将来可能会遇到相同类型的中断。在微软的辩护中，这对你来说真的不应该是新闻。无论您是在Azure，AWS，Google还是自己的数据中心运行，这一直都是如此。未能提前计划将数据复制到不同的数据中心以及制定快速恢复应用程序的计划只是缺乏您的计划。Microsoft未发布确切的可用区位置。如果你相信这张地图发表在这里，你可能会猜到它们可能相距2-10英里。 Azure Datacenters.png 除了最极端的情况之外，在可用区之间复制数据应该足以用于数据保护。某些应用程序（如SQL Server）内置了复制技术。但是，对于广泛的应用程序，操作系统和数据类型，请研究块级复制SANless群集解决方案。SANless集群解决方案传统上用于多站点集群。但是，相同的技术也可以在可用区，区域或混合云中的云中使用，以实现高可用性和灾难恢复。无论是Azure，AWS还是Google，实施跨越可用区的SANless群集都是一个非常简单的过程，只需要合适的工具。作为宰蓝式停电事件的一部分，这里有一些资源可以帮助您入门。循序渐进：在Azure中配置跨越可用区的文件服务器群集如何在Google Cloud Platfo rm中构建SANless SQL Server故障转移群集实例MS SQL Server v.Next在具有复制和高可用性的Linux上#Azure #Cloud #Linux在AWS快速入门中的AWS SANless Linux群集中的#Azure资源管理器（ARM）SAN SANless SQL Server群集中部署Microsoft SQL Server 2014故障转移群集

Azure Outage Post Mortem的教训

如果您在Azure中，则可能还需要考虑Azure站点恢复（ASR）。ASR允许您将整个VM从一个Azure区域复制到另一个区域。ASR将实时复制您的虚拟机，并允许您随时进行无中断的灾难恢复测试。它支持大多数版本的Windows和Linux，并且相对容易设置。您还可以创建具有“多VM一致性”的复制作业。这意味着必须从完全相同的时间点恢复服务器，这些时间点可以放在此一致性组中，并且它们将具有完全相同的恢复点。实质上，如果您在单个区域中构建具有DataKeeper的SANless群集以实现高可用性，则DR有两个选项。一种是您可以将SANless群集扩展到不同区域中的节点，或者可以使用ASR复制一致性组中的两个节点。 ASR

有什么不同？

与ASR的权衡是RPO和RTO不如使用SANless多站点群集那么好。虽然它很容易配置并适用于任何应用程序。小心点如果您的应用程序定期超过10 MBps的磁盘写入活动，ASR将无法跟上。此外，基于Storage Spaces Direct的群集无法使用ASR进行复制，并且在Azure中使用时通常缺乏良好的DR策略。管理磁盘发布后的一段时间，ASR直到大约一年后才完全支持它们。对于许多希望使用ASR的人来说，对托管磁盘的全面支持是一个很大的障碍。幸运的是，从2018年2月开始，ASR完全支持托管磁盘。但是，刚刚引入了另一个问题。随着可用区的引入，ASR再次落后于时代。它们目前不支持已部署在可用区中的VM。

2018-09-25_00-10-24 — 支持矩阵，用于从一个Azure区域复制到另一个Azure区域

无论如何我继续尝试了。似乎可以配置复制，我能够进行测试故障转移。

我使用ASR从中美到东2复制SQL1和SQL3，并进行了测试故障转移。除了没有将VM放置在美国东部的AZ中之外，它似乎也有效。[/ caption]我希望在Ignite会议上找到更多有关此限制的信息。虽然这种限制并不像Managed Disk那样重要。因为可用区尚未广泛使用。因此，希望ASR能够获得对可用区的支持，因为其他区域点亮了可用区，并且它们被更广泛地采用。

了解有关Azure Outage Post Mortem的分析的更多信息，经过Clusteringformeremortals.com的许可转载

Azure Outage Post-Mortem第1部分

11月 6, 2018 by Jason Aw Leave a Comment

Azure Outage Post-Mortem

关于上周发生的Azure Outage，第一次官方Post-Mortems开始出现在微软上面。第一个Azure Outage Post-Mortem专门解决Azure DevOps中断问题（以前称为Visual Studio Team Service或VSTS）。它为我们提供了一些关于中断的广度和深度的额外见解。它证实了停电的原因。它还让我们深入了解了微软在快速恢复在线状态时所面临的挑战。此外，它暗示了微软可能会考虑在未来更好地处理这种情况的一些特性/功能。正如我在上一篇文章中提到的，Azure中推出的新可用区等功能可能会最大限度地减少此次中断的影响。在验尸中，微软确认了我之前所说的内容。

我们正在努力改进处理数据中心故障的主要解决方案是可用区，我们正在探索异步复制的可行性。

其他预防措施

在可用区域跨越更多区域推出唯一的灾难恢复选项之前，您需要跨区域，混合云甚至跨云异步复制。目前可用的基于软件的#SANless群集解决方案将实现此类配置。提供非常强大的RTO和RPO，即使在复制很远的距离时也是如此。借助SaaS / PaaS解决方案，您可以依靠云服务提供商（CSP）来实施具有铁的HA / DR解决方案。在这种情况下，似乎有一个非常重要的缺陷暴露。我们只能希望它能引导所有CSP仔细研究他们的SaaS / PaaS产品。以及解决可能存在的任何HA / DR差距。在此之前，消费者有责任了解风险。他们需要尽其所能来降低延长中断的风险，或者只是在风险得到解决之前选择不使用PaaS / SaaS。

RTO还是RPO？

验尸确实是问题的根源……你更重视什么，RTO或RPO？

我从根本上不想为客户决定是否接受数据丢失。我有客户告诉我他们会花费数据丢失来让一个大型团队再次快速生产，其他客户告诉我他们不希望任何数据丢失，并且等待恢复时间不长。

CSP不可能为客户做出决定。CSP不希望丢失客户数据，除非原始数据完全丢失且无法恢复。在这种情况下，近乎实时的异步副本与您在意外故障中获得的RPO一样好。然而，这次停电是否真的出乎意料而且没有任何警告？现代卫星图像和天气预报的改进给予了公平的警告，该地区将发生重大的天气相关事件。当我写这篇文章时，飓风佛罗伦萨正在美国东南部。如果数据中心位于路径中，请采取主动措施将工作负载移出受影响的区域。主动灾难恢复与反应式灾难恢复的好处很多。没有数据丢失，有足够的时间来解决意外问题。它还包括管理人力资源，使员工可以担心照顾家人，而不是工作。同样，制定主动的灾难恢复将是CSP代表其所有客户做出的艰难决定。跨地区的计划迁移将导致一定程度的停机。这个决定必须由客户掌握。从Azure Outage Post-Mortem中吸取教训，教育您的客户。

Slide 2.png — 飓风佛罗伦萨卫星图像取自新的GOES-16卫星，由Tropical Tidbits提供

得到保护

那么您可以做些什么来保护您的业务关键应用程序和数据？让我们从Azure Outage Post-Mortem中汲取一些教训。采用基于软件的#SANless集群解决方案的跨区域，跨云或混合云模型将大大有助于解决您的HA / DR问题。此外，它还为基于云的IaaS部署提供了出色的RTO和RPO。除应用程序特定解决方案外，还有其他选项。基于软件的块级卷复制解决方案（如SIOS DataKeeper和SIOS Protection Suite）可复制所有数据，并为Linux和Windows平台提供数据保护解决方案。我的大儿子刚刚在罗格斯大学开始他的气象学本科学位。想象一下，人工智能（AI）和机器学习（ML）处理来自NOAA的天气相关数据的那一天。他们可以在暴风雨袭击前两天触发计划的灾难恢复迁移？我想我刚刚为他的硕士论文找到了一个完美的主题。或者更好的是，让他和他在WeatherWatcher LLC的聪明的朋友获得资金，为一家技术创业公司应用AI和ML来安排相关数据以控制主动灾难恢复事件。我认为我们正处于IT分析解决方案的尖端。我们可以应用先进的机器学习技术来减少确保关键应用程序服务交付的时间和精力。 SIOS iQ是该领域领先的解决方案之一。压扁舱口并做好准备。飓风季刚刚开始，我们已经开始疯狂骑行了。如果您想在Twitter @daveberm上讨论您的HA / DR策略，请与我联系。

在Azure跨可用区中配置文件服务器故障转移群集

11月 5, 2018 by Jason Aw Leave a Comment

循序渐进：在Azure跨越可用区中配置文件服务器群集

在本文中，我们将详细介绍在Azure中部署跨越新可用区的双节点文件服务器故障转移群集所需的特定步骤。我将假设您熟悉基本的Azure概念以及基本的故障转移群集概念。我将重点介绍在Azure中跨可用区部署文件服务器故障转移群集的独特之处。如果您的Azure区域尚不支持可用区，则必须使用Fault Domains，如前面的帖子中所述。使用DataKeeper Cluster Edition，您可以获取本地连接的托管磁盘，无论是高级磁盘还是标准磁盘，并在两个或多个集群节点之间同步，异步或混合或同时复制这些磁盘。此外，DataKeeper Volume资源在Windows Server故障转移群集中注册，该资源取代了物理磁盘资源。DataKeeper Volume不是像物理磁盘资源那样控制SCSI-3保留，而是控制镜像方向。它确保活动节点始终是镜像的源。就故障转移群集而言，它的外观，感觉和气味就像物理磁盘一样，其使用方式与物理磁盘资源的使用方式相同。

先决条件

您之前使用过Azure Portal，并且很乐意在Azure IaaS中部署虚拟机。
已获得SIOS DataKeeper的许可证或eval许可证

在Azure中部署文件服务器故障转移群集

要在Azure中构建双节点文件服务器故障转移群集实例，我们假设您具有基于Azure资源管理器的基本虚拟网络。您至少有一个虚拟机已启动并正在运行并配置为域控制器。配置虚拟网络和域后，您将配置两个新虚拟机，它们将充当群集中的两个节点。我们的环境将如下所示：DC1 – 我们的域控制器和文件共享见证SQL1和SQL2 – 文件服务器群集的两个节点。不要让这些名字让你感到困惑。我们正在本指南中构建文件服务器群集。在我的下一篇文章中，我将演示SQL Server群集配置。

配置两个群集节点

使用Azure门户，我们将以完全相同的方式配置SQL1和SQL2。有多种选择可供选择，包括实例大小，存储选项等。本指南并不是在Azure中部署服务器的详尽指南。有一些非常好的资源，每天都有更多的资源。但是，在创建实例时要记住几个关键事项，尤其是在群集环境中。可用区 – SQL1，SQL2驻留在不同的可用区中非常重要。为了本指南的目的，我们假设您使用的是Windows 2016，并将使用Cloud Witness进行群集仲裁。如果使用Windows 2012 R2或Windows Server 2008 R2而不是Windows 2016，则需要在第3个可用区中配置文件共享见证。直到Windows Server 2016才推出Cloud Witness。通过将群集节点放在不同的可用区中，我们确保每个群集节点位于同一区域中的不同Azure数据中心。利用可用区而不是旧的故障域是有益的。它将您与几周前发生的中断类型隔离开来，这些中断使整个中南部地区连续多天。请务必将每个群集节点添加到其他可用区。如果您利用文件共享见证，它应该位于第三个可用区。[/ caption]

静态IP地址

配置每个VM后，您将需要进入设置并更改设置，以使IP地址为静态。我们不希望更改群集节点的IP地址。确保每个群集节点都使用静态IP [/ caption]

存储

就存储而言，您将需要参考Azure虚拟机中SQL Server的性能最佳实践。在任何情况下，您至少需要为每个群集节点添加至少一个额外的托管磁盘。DataKeeper可以在本地存储空间中使用基本磁盘，高级存储甚至多个磁盘。如果您确实要使用本地存储空间，请注意在任何群集配置之前创建存储空间。这是由于故障转移群集和本地存储空间的已知问题。所有磁盘都应格式化为NTFS。

创建群集

假设已按上述方式配置了两个群集节点（SQL1和SQL2）并将其添加到现有域中，我们就可以创建群集了。在创建群集之前，需要启用一些功能。这些功能是.Net Framework 3.5和故障转移群集。需要在两个群集节点上启用这些功能。您还需要启用FIle服务器角色。在两个群集节点上启用.Net Framework 3.5和故障转移群集功能以及文件服务器。[/ caption]一旦启用了该角色和这些功能，您已准备好构建群集。我要向您展示的大多数步骤都可以通过PowerShell和GUI执行。但是，我将建议您在第一步中使用PowerShell创建群集。如果您选择使用故障转移群集管理器GUI来创建群集，您将发现最终会向群集发出重复的IP地址。在不详细介绍的情况下，您会发现Azure VM必须使用DHCP。通过在Azure门户中创建VM时指定“静态IP”，我们所做的就是创建一种DHCP预留。它不完全是DHCP保留，因为真正的DHCP保留会从DHCP池中删除该IP地址。相反，在Azure门户中指定静态IP只是意味着如果在VM请求它时该IP地址仍然可用，Azure将向其发出该IP。但是，如果您的VM处于脱机状态且另一台主机在同一子网中联机，则可能会发出相同的IP地址。

Azure如何实现DHCP的另一个副作用

使用Windows Server Failover Cluster GUI创建群集时，无法指定群集IP地址。相反，它依靠DHCP来获取地址。奇怪的是，DHCP将发出重复的IP地址。通常与请求新IP地址的主机具有相同的IP地址。群集安装将完成，但您可能会遇到一些奇怪的错误。您可能需要从其他节点运行Windows Server Failover Cluster GUI才能使其运行。一旦运行它，您将需要将核心群集IP地址更改为网络上当前未使用的地址。只需通过Powershell创建集群并指定集群IP地址作为PowerShell命令的一部分来创建集群，就可以避免这种混乱。您可以使用New-Cluster命令创建集群，如下所示：

New-Cluster -Name cluster1 -Node sql1，sql2 -StaticAddress 10.0.0.100 -NoStorage

群集创建完成后，您还需要运行以下命令来运行群集验证。您应该会看到有关存储和网络的一些警告，但这在Azure中是可以预期的，您可以忽略这些警告。如果报告任何错误，您需要在继续之前解决这些错误。

测试群集

创建仲裁群集

如果您运行的是Windows 2016或2019，则需要为群集仲裁创建Cloud Witness。如果您运行的是Windows Server 2012 R2或2008 R2，则需要创建文件共享见证。关于证人创建的详细说明可以在这里找到。

安装DataKeeper

创建集群后，就可以安装DataKeeper了。在创建初始群集后安装DataKeeper非常重要，这样可以向群集注册自定义群集资源类型。如果在创建群集之前安装了DataKeeper，则只需再次运行安装并执行修复安装。在创建群集后安装DataKeeper [/ caption]在安装过程中，您可以使用所有默认选项。您使用的服务帐户必须是域帐户，并且位于群集中每个节点上的本地管理员组中。服务帐户必须是每个节点上Local Admins组中的域帐户一旦安装DataKeeper并在每个节点上获得许可，您将需要重新启动服务器。

创建DataKeeper卷资源

要创建DataKeeper Volume Resource，您需要启动DataKeeper UI并连接到这两个服务器。连接到SQL1 [/ caption] 连接到SQL2 [/ caption]连接到每个服务器后，即可创建DataKeeper卷。右键单击Jobs并选择“Create Job”为作业命名和描述。选择源服务器，IP和卷。IP地址是复制流量是否会传播。选择目标服务器。选择你的选择。对于两个VM位于同一地理区域的目的，我们将选择同步复制。对于更长距离的复制，您将需要使用异步并启用一些压缩。通过在上次弹出窗口中单击“是”，您将在故障转移群集中的可用存储中注册新的DataKeeper卷资源。您将在可用存储中看到新的DataKeeper卷资源。

创建文件服务器群集资源

要创建文件服务器群集资源，我们将再次使用Powershell而不是故障转移群集接口。原因在于，再次因为虚拟机配置为使用DHCP，基于GUI的向导不会提示我们输入群集IP地址，而是发出重复的IP地址。为避免这种情况，我们将使用简单的powershell命令创建FIle Server群集资源并指定IP地址

Add-ClusterFileServerRole -Storage“DataKeeper Volume E”-Name FS2 -StaticAddress 10.0.0.101

记下您在此处指定的IP地址。它必须是网络上唯一的IP地址。我们稍后在创建内部负载均衡器时将使用相同的IP地址。

创建内部负载均衡器

以下是Azure中的故障转移群集与传统基础结构的不同之处。Azure网络堆栈不支持免费ARPS，因此客户端无法直接连接到群集IP地址。相反，客户端连接到内部负载平衡器并重定向到活动群集节点。我们需要做的是创建一个内部负载均衡器。这可以通过Azure门户完成，如下所示。如果客户端通过公共Internet连接，则可以使用公共负载均衡器。但假设您的客户端位于同一个vNet中，我们将创建一个内部负载均衡器。需要注意的重要一点是，虚拟网络与群集节点所在的网络相同。此外，您指定的专用IP地址将与用于创建文件服务器群集资源的地址完全相同。此外，由于我们使用的是可用区，因此我们将创建一个区域冗余标准负载均衡器，如下图所示。创建内部负载均衡器（ILB）后，您需要对其进行编辑。我们要做的第一件事就是添加一个后端池。通过此过程，您将选择两个群集节点。接下来我们要做的就是添加一个Probe。我们添加的探针将探测端口59999。此探针确定群集中哪个节点处于活动状态。最后，我们需要一个负载平衡规则来重定向SMB流量，TCP端口445。在下面的屏幕截图中需要注意的重要事项是直接服务器返回已启用。确保你做出改变。

修复文件服务器IP资源

配置的最后一步是在其中一个群集节点上运行以下PowerShell脚本。这将允许群集IP地址响应ILB探测。还要确保群集IP地址和ILB之间没有IP地址冲突。请注意;您需要编辑此脚本以适合您的环境。子网掩码设置为255.255.255.255。这不是一个错误，保持原样。这将创建一个特定于主机的路由，以避免与ILB发生IP地址冲突。

＃定义变量
$ ClusterNetworkName =“” 
＃群集网络名称（在更高的Windows Server 2012上使用Get-ClusterNetwork查找名称）
$ IPResourceName =“” 
#IP地址资源名称 
$ ILBIP =“” 
＃内部负载均衡器的IP地址（ILB）
导入模块FailoverClusters
＃如果您使用的是Windows Server 2012或更高版本：
Get-ClusterResource $ IPResourceName | Set-ClusterParameter -Multiple @ {Address = $ ILBIP; ProbePort = 59999; SubnetMask =“255.255.255.255”; Network = $ ClusterNetworkName; EnableDhcp = 0}
＃如果您使用的是Windows Server 2008 R2，请使用以下命令： 
#cluster res $ IPResourceName / priv enabledhcp = 0 address = $ ILBIP probeport = 59999 subnetmask = 255.255.255.255

创建文件共享

您会发现在故障转移群集管理器中使用文件共享向导不起作用。相反，您只需在活动节点上的Windows资源管理器中创建文件共享。故障转移群集会自动获取这些共享并将其放入群集中。请注意，此配置不支持文件共享的“连续可用性”选项。

结论

您现在应该在Azure中具有可用的文件服务器故障转移群集，该群集跨越可用区。如果您需要DataKeeper评估密钥，请填写http://us.sios.com/clustersyourway/cta/14-day-trial上的表格，SIOS将发送一份发送给您的评估密钥。

快速入门指南：Windows Server 2008 R2中的SQL Server群集在Azure中

11月 4, 2018 by Jason Aw Leave a Comment

快速入门指南：Windows Server 2008 R2中的SQL Server群集在Azure中

Windows Server 2008 R2继续存在于云中。因此，这是一个快速入门指南，适用于在Windows Server 2008 R2上需要SQL Server群集帮助的所有人。是的，Azure确实支持Windows Server 2008 R2和旧版本的SQL Server，包括2008 R2和2012。当然，在SQL 2012之前不会引入Always On Availability Groups，即便如此，由于与该版本相关的一些性能问题，您可能希望避免可用性组。需要支持旧版本的SQL Server或Windows吗？如Azure文档中所述，基于SIOS DataKeeper构建SANless群集。

Windows Server 2008 R2上的SQL Server群集 – 如何完成？

简而言之，这是SQL Server群集在Windows Server 2008 R2上的步骤

在同一可用性集中配置两个群集服务器和一个文件共享见证。这将所有三个法定人数投票放在不同的故障和更新域中。
Azure中的SQL 2008 R2群集有一个修补程序，用于启用AG和FCI使用的侦听器。 https://support.microsoft.com/en-us/help/2854082/update-enables-sql-server-availability-group-listeners-on-windows-serv
安装该更新以及所有其他OS更新。
在每台服务器上配置存储。
格式化NTFS并给出驱动器号。
每个群集节点需要相同的存储。在每台服务器上启用故障转移群集和.Net 3.5 Framework
将服务器添加到域
创建基本群集，但使用POWERSHELL并指定群集IP地址。如果您使用GUI来创建群集，它将会混淆并提供重复的IP地址。通过GUI连接将使您能够从其中一个节点连接到群集。如果连接，则可以通过指定群集资源使用的静态IP地址来解决问题。以下是创建群集的Powershell用法示例
```
New-Cluster -Name cluster1 -Node sql1，sql2 -StaticAddress 10.0.0.101 -NoStorage-
```
将文件共享见证添加到群集
在两个群集节点上安装DataKeeper
创建DataKeeper卷资源并确保它们是可用存储
像往常一样在共享存储群集中将SQL安装到群集中。
配置Azure ILB并运行powershell脚本以更新SQL群集IP资源以侦听探测端口。

所有这些都在SIOS文档页面上完整记录，在Azure中部署DataKeeper Cluster Edition如果您对Azure，AWS或Google Cloud中的SQL Server高可用性或灾难恢复有任何疑问，请访问我们关于群集和其他相关主题的页面。经Clusteringformeremortals.com许可转载