SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 产品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 服务器集群简单化
  • 成功案例
  • 联系我们
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

五大可预防的支持电话(以及如何避免)

10月 28, 2024 by Jason Aw Leave a Comment

Top 5 Preventable Support Calls (And How To Avoid Them)

五大可预防的支持电话(以及如何避免)

作为客户支持组织,我们每天都会收到来自世界各地客户的消息。客户在遇到需要帮助的问题或问题时会打电话或发电子邮件向我们提出案例。有些案例最终成为新问题,而许多案例最终根本不是新问题。客户似乎一次又一次地遇到同样的问题。在从事客户支持工作 20 年并处理了数千个案例之后,我们仍然会看到从未报告过的新问题,这些问题也属于常见类别。这让我们的工作非常有趣!我们注意到的一件事是,客户报告的问题属于常见类别。

以下是客户向我们寻求帮助的五大原因(根本原因):

  1. 网络问题:如何提前规划并避免停机

很多时候,客户需要更改集群中的 IP 地址。有时,更改网络配置的后果是无法实现的,或者事先没有计划好。更改网络后,集群可能会出现意想不到的问题。如果更改的 IP 地址用于 DataKeeper 和 LifeKeeper 配置(例如镜像端点或通​​信路径),则需要更改 DataKeeper 和 LifeKeeper 配置,以便产品能够感知到此更改。

提前计划
如果您知道需要进行网络更改,我们建议您提前规划网络更改。提前规划将避免任何不可预见的问题,并确保您已定义实施更改的步骤。

更新镜像 IP 地址
如果 IP 地址(镜像端点)发生变化,DataKeeper 将无法再使用原始镜像 IP 地址(因为它不再存在),并且无法在服务器之间镜像数据。DataKeeper 需要更新才能使用新的镜像 IP 地址。此场景已记录这里。

  1. 配置问题:常见错误及其解决方法

通常,所报告问题的根本原因最终都是配置问题。客户报告他们的配置无法正常工作,或者从产品 GUI 上看到的产品似乎无法正常工作。通常,配置问题是由于集群环境中的某些东西与原始集群配置不同,或者是由于产品首次安装时设置不正确而导致的。

报告的常见配置问题示例:

  • 一些 DataKeeper 镜像未处于镜像状态

很多时候,客户需要扩展/增加卷。产品的关键要求之一是源卷必须等于或小于目标卷,否则产品将无法将数据从源重新同步到目标卷。虽然这似乎合乎逻辑,但经常被忽视。有时目标卷最终会小于源卷,这导致卷无法达到镜像状态。以下文档和视频解释了扩展卷的过程DataKeeper 卷。

  • DataKeeper 无法连接到群集中的服务器

安装 DataKeeper 时,系统会提示用户输入 DataKeeper 服务要使用的登录凭据。建议使用具有管理员权限的域帐户,大多数客户都会专门为 DataKeeper 创建帐户。必须将使用的域帐户添加到本地系统管理员组。此帐户必须在安装 DataKeeper 的每台服务器上都具有管理员权限。很多时候,帐户未添加到本地系统管理员组,这会阻止 DataKeeper 连接到自身和集群中的其他 DataKeeper 服务器。有关更多详细信息,请参阅位于这里。

大部分时间的配置问题需要对集群进行更改,以使 DataKeeper 或 LifeKeeper 产品再次恢复到工作环境。

我们建议在对集群环境进行更改之前联系支持人员,以便我们帮助确保您朝着正确的方向前进,并为您提供有关该主题的文档和视频。

  1. 升级规划:避免系统中断

升级是系统管理员的常见任务。每当有新版本发布时,总是需要升级系统中的某些内容:操作系统、应用程序软件、系统固件、数据库软件、安全软件等。如果您的系统需要进行多项升级,那么升级工作可能会非常繁重。

许多客户在计划升级 DataKeeper 或 LifeKeeper 时会联系支持人员,并在实际实施升级之前询问问题以确保他们了解升级过程。这正是我们希望看到的。我们确实看到一些客户在执行升级之前没有联系支持人员,从而导致意外问题的情况。许多人认为升级是例行公事;然而,有些升级会造成不兼容并可能导致问题。

升级规划
规划是升级的关键,同时还要了解具体升级需要做什么。在执行升级之前提出问题。确保在升级之前记录您的步骤。不要忘记在升级生产系统之前在测试或 QA 系统上执行升级。这是我们推荐的最佳做法,这样如果您在升级时遇到问题,问题将出现在测试服务器或 QA 服务器上,而不是生产服务器上。

  1. 外部或操作系统相关问题:超越软件的故障排除

什么是外部或操作系统相关问题?当报告的问题超出 DataKeeper 和 LifeKeeper 的范围时,我们将根本原因称为外部或操作系统相关问题。DataKeeper 和 LifeKeeper 使用许多服务器组件,例如:磁盘/卷和网络。如果操作系统无法“看到”磁盘或卷,则 DataKeeper 和 LifeKeeper 也无法“看到”磁盘或卷。乍一看,报告的问题似乎与 DataKeeper 或 LifeKeeper 有关,但是,在分析问题时,它被确定为 DataKeeper 或 LifeKeeper 所依赖的操作系统组件。

例如,为了使 DataKeeper 镜像正常运行,DataKeeper 要求卷对操作系统可见、在线、健康且具有有效的文件系统。如果不满足这些要求,DataKeeper 镜像将无法将数据从一个系统镜像到另一个系统。DataKeeper 将显示镜像处于暂停状态。调试此问题时,磁盘/卷的 Windows 磁盘管理工具显示卷处于脱机状态、不健康状态或为原始设备。纠正此问题后,DataKeeper 可以再次将数据从一个系统镜像到另一个系统。有关更多详细信息,请参阅视频“准备用于 DataKeeper 的存储”,位于这里。

另一个外部或操作系统相关问题的例子是 DataKeeper 卷无法锁定在目标系统上。DataKeeper 故意锁定目标系统上的卷,以防止在目标系统上发生写入。为了让 DataKeeper 锁定目标卷,卷上不能有操作系统页面文件。很多时候,系统在操作系统级别配置为“自动管理页面文件”,有时页面文件最终会被操作系统放置在 DataKeeper 卷上。为了解决这个问题,我们建议更改此操作系统设置。请参阅此链接了解更多详情。

  1. 性能:提高系统和镜像效率

客户还联系我们,希望通过镜像来改善镜像性能和系统性能,因为镜像无法进入镜像状态,或者产品降低了系统性能。第一个问题(镜像无法达到镜像状态)只需调整 DataKeeper 中的注册表项以匹配您的系统配置,使用可调整项(例如 WriteQueueHighWater、WriteQueueHighWaterSynchronous 和 BlockWritesonLimitReached)即可。这些可调整项是几个经常更改的可调整项。请参阅位于以下位置的这些可调整项的文档这里。

第二个问题(系统性能)只是移动 DataKeeper 位图的位置的问题。默认情况下,位图位于 C 驱动器上,可能需要重新定位到更快的驱动器。有关重新定位位图的信息,请参阅文档和视频这里。

系统和产品调优通常是为了最大限度地提高性能。这些变化的例子包括更改产品可调参数以更紧密地匹配客户的环境。有很多因素会影响 DataKeeper 和 LifeKeeper,包括操作系统、网络、存储设备等。DataKeeper 和 LifeKeeper 使用默认设置,可能需要根据客户的特定环境进行调整。我们确实提供验证和健康检查服务,以帮助客户确保实施 HA 最佳实践。访问此链接了解我们产品的详细信息。

我们推荐的关键策略是确保在投入生产之前完成测试,以便尽早发现和解决问题(包括性能问题)。测试通常在进入生产环境之前在测试或 QA 环境中进行。最好尝试在测试/QA 环境中模拟生产环境负载,以确保生产环境能够充分运行。我们建议您阅读我们关于性能的几篇博客,网址为我们的博客特别是在这里。

提前解决这些常见问题,确保您的系统平稳运行。需要专家指导吗?立即联系我们的支持团队帮助您避免将来的支持电话!

经许可转载西欧斯

Filed Under: 服务器集群简单化

确定正确保护级别的重要性

10月 13, 2024 by Jason Aw Leave a Comment

Importance of determining the right level of protection

确定正确保护级别的重要性

 

在此视频中,玛格丽特·霍格兰,全球销售和营销副总裁SIOS 技术讨论了确定应用程序和数据库所需的保护级别以避免停机的重要性。Hoagland 强调了在确定适当的可用性保护级别时考虑停机对 IT 团队、系统和业务流程的影响的重要性,因为公司经常低估中断的影响,即使对于不太重要的应用程序也是如此。

经许可转载西欧斯

Filed Under: 服务器集群简单化

面向托管服务提供商的高可用性和灾难恢复解决方案

10月 4, 2024 by Jason Aw Leave a Comment

High Availability and Disaster Recovery Solutions for Managed Service Providers

面向托管服务提供商的高可用性和灾难恢复解决方案

SIOS Technology 为 MSP 提供适用于 Windows 和 Linux 应用程序的强大 HA 和 DR 解决方案,确保所有环境中的停机时间最短和无与伦比的可靠性。借助 SIOS DataKeeper 和 SIOS LifeKeeper,您可以提升服务质量、降低成本并通过轻松的管理和顶级支持建立持久的客户关系。

下载解决方案简介

经许可转载自西欧斯

 

Filed Under: 服务器集群简单化

使用 SIOS DataKeeper 在 Google Cloud 中实现经济高效的 SQL Server 高可用性

9月 15, 2024 by Jason Aw Leave a Comment

Achieving Cost-Effective SQL Server High Availability in Google Cloud with SIOS DataKeeper

使用 SIOS DataKeeper 在 Google Cloud 中实现经济高效的 SQL Server 高可用性

确保SQL Server 的高可用性部署对于维护 Google Cloud Platform (GCP) 中的业务连续性至关重要。在选择如何实现这一点时,有两个主要选项可供选择:Always On 可用性组和 SQL Server 故障转移群集实例 (FCI)。

Always On 可用性组提供高可用性和灾难恢复的全面解决方案,但它们需要 SQL Server 企业版,这可能是一项重大投资,特别是对于不需要企业版提供的全部功能的企业而言。

SQL Server 故障转移群集实例 (FCI),由 SQL Server Standard Edition 支持,是一种更具成本效益的替代方案。但是,FCI 通常依赖于 SAN 等共享存储解决方案,而 GCP 本身并不提供这种解决方案。缺乏集群感知共享存储对希望在云中部署 FCI 的企业来说是一个挑战。

SIOS DataKeeper 如何应对 GCP 中的 FCI 挑战

SIOS 数据管理提供了一种弥补差距的解决方案,使组织能够在 GCP 中构建无 SAN 集群。这种方法通过在区域内的不同区域之间同步复制数据,消除了对传统共享存储的需求。

SIOS DataKeeper 不仅复制连接到每个云实例的本地磁盘,还将复制的磁盘作为 DataKeeper 卷资源呈现给集群。对于集群来说,此卷显示为共享磁盘,与Windows Server 故障转移群集 (WSFC)。在故障转移期间,DataKeeper 控制镜像方向,确保活动节点保持镜像源,而其他节点成为目标。此设置可在使用 SQL Server Standard Edition 的同时为您的 SQL Server 环境保持数据一致性和高可用性。

在 GCP 中使用 SIOS DataKeeper 的主要优势

  1. 节省成本:通过为 FCI 启用 SQL Server Standard Edition,SIOS DataKeeper 帮助组织避免更高的成本与 SQL Server 企业版相关。
  2. 全面保护:SIOS DataKeeper 跨区域复制整个 SQL Server 实例,为区域级故障提供强大的保护。
  3. 简单性和灵活性:该解决方案简化了在 GCP 中设置和管理无 SAN FCI 的过程,使 IT 团队可以访问它并降低复杂性。

关于 GCP 中经济高效的 SQL Server HA 的最终思考

对于正在运营的企业Google Cloud 中的 SQL Server,找到成本和可用性之间的适当平衡至关重要。虽然 Always On 可用性组功能强大,但价格较高。SIOS DataKeeper 提供了一种实用的替代方案,它支持创建无 SAN 集群,提供必要的高可用性,同时使用 SQL Server Standard Edition 控制成本。

有关如何实施此解决方案的分步指南,我建议阅读全文,涵盖从网络设置到集群配置的所有内容。本指南将帮助您部署高可用性GCP 中的 SQL Server 环境充满信心。

迈出实现经济高效的 SQL Server HA 的下一步

准备好在不花太多钱的情况下增强 Google Cloud 中的 SQL Server 高可用性了吗?探索 SIOS DataKeeper 如何简化您的部署并最大化您的投资。联系我们的团队寻求专家帮助来设置满足您特定业务需求的 SANless 集群。

经许可转载自西欧斯

Filed Under: 服务器集群简单化

ESPN 的“起床”晨间秀如何改善您的高可用性策略

9月 10, 2024 by Jason Aw Leave a Comment

How ESPN’s “Get Up” Morning Show Can Improve Your High Availability Strategy

ESPN 的“起床”晨间秀如何改善您的高可用性策略

ESPN 通常是 NFL 信息的首选来源。该网络以提供多档节目报道每场比赛而闻名,这些节目提供有关球队、比赛、即将到来的赛程和联盟教练的广泛分析、观点和随机信息,以及特定球员的精彩表现。

向 ESPN 学习:通过两个关键问题提高您的高可用性

在 2021 年 9 月 13 日播出的一段节目中,丹·奥洛夫斯基对芝加哥熊队使用新秀四分卫的做法表示遗憾。在这样做的过程中,他顺便提供了两种方法,只需两个问题就可以提高你的高可用性。这两个问题将立即提高您的高可用性来自 ESPN 的 Dan Orlovsky。

第一个问题,我们在这里做什么?

熊队进攻组派出新秀四分卫贾斯汀·菲尔兹上场进行第二次进攻。这位新秀迅速传球,完成 7 码传球。然而,熊队的指挥员并没有继续让这位新秀上场,而是让之前的四分卫迅速将球传给了对方球队。这一战术让丹·奥洛夫斯基不禁问道:“我们在这里做什么?”

好吧,我想你不是新秀四分卫。而且,我希望你不是为熊队效力。但是,如果你对企业的任何部分负责高可用性 (HA)和灾难恢复 (DR)策略,包括聚类,数据保护,数据复制、应用程序编排、治理/遵守和服务水平协议那么奥洛夫斯基的第一个问题就是一个很好的起点。

你在干什么?

  • 您是否希望部署软件和服务或修复已知的可用性问题?
  • 您的团队是否主要关注未来规划,例如迁移到云端,或解决各种不同变化和要求的组合?
  • 您的目标是在满足监管要求的同时节省成本、通过更多可用资源来提高客户获取率,还是优化和改进后端处理?

回答与企业高可用性和灾难恢复 (HA/DR) 策略相关的这个问题将有助于澄清大量与以下方面相关的问题:解决方案和架构您实施的以及与之相关的团队和流程。

第二个问题,我们为什么要这样做?

在对芝加哥熊队使用新秀四分卫的时间和方式发表一系列快速评论后,奥洛夫斯基提出了第二个问题:“我们为什么要这样做?”如果用奥洛夫斯基的话来说,“什么”是让菲尔兹上场打勾并安抚球迷,那么“我们为什么要这样做?”为什么只是打勾,而你可以更多地利用这位充满活力的新秀的能力来获得优势并赢得比赛?为什么不做出让你获得最大成功机会的改变呢。

当然,我们不是熊队的教练,尽管我不介意提出一些建议。但是,这个问题仍然适用于那些参与实施企业可用性的人。让我们回到第一个问题。你对“我们在这里做什么?”的回答是什么?现在,回答“我们为什么要这样做?”的问题。一些可能的原因包括:

  • 提供数据可用性保证
  • 节省业务时间
  • 避免代价高昂的计划外停机,从而节省企业资金
  • 通过自动化监控和恢复节省企业时间和金钱
  • 部署架构以满足严格的服务水平协议 (SLA) 或服务水平目标 (SLO)
  • 将 RTO 和 RPO 降至零
  • 防止去年的灾难再次发生
  • 对冲未知的停机威胁
  • 满足治理要求
  • 检查框
  • 避免因不合规而被罚款
  • 因为管理层这么说

我们为什么要这样做,这是一个在部署高可用性系统之前、期间和之后都需要回答的关键问题。作为客户体验副总裁,我曾与一位客户合作,他的 IT 管理员和数据库管理员对“我们为什么要这样做”有着截然不同的理由。更糟糕的是,执行发起人持有第三种观点。由于没有经过适当审查和沟通的“为什么”,团队很难正确表达需求,当事件发生时,他们为补救而做出的努力往往会引发更多冲突和疑问。

芝加哥熊队在即将到来的第三次进攻中没有取得成功或充分利用他们的年轻四分卫,可能有许多原因,而且关于他们试图用他们的特权和老将四分卫实现什么目标,也有同样多的意见。但是,即使奥洛夫斯基无法帮助熊队球迷澄清原因,他也确实提供了如何立即改善 HA 的框架。那么,您将如何回答这两个问题:我们为 HA 做了什么?我们为什么要这样做?

高可用性解决方案

SIOS 技术公司提供高可用性集群软件它通过集群管理来保护和优化您最重要的应用程序的 IT 基础设施。联系我们立即了解有关我们的专业服务和支持的更多信息。

经许可转载西欧斯

Filed Under: 服务器集群简单化

  • « Previous Page
  • 1
  • …
  • 13
  • 14
  • 15
  • 16
  • 17
  • …
  • 110
  • Next Page »

最近的帖子

  • 指南:在 Azure 中部署多区域和多区域 SQL Server FCI
  • 本地数据中心的高可用性
  • APM 工具和高可用性集群如何提高网络弹性
  • 为云端 SQL Server 高可用性选择合适的存储
  • 在不可预测的世界中制定灾难恢复计划

最热门的帖子

加入我们的邮件列表

Copyright © 2026 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in