SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 产品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 服务器集群简单化
  • 成功案例
  • 联系我们
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

增强业务连续性的最佳滚动升级策略

6月 8, 2025 by Jason Aw Leave a Comment

The Best Rolling Upgrade Strategy to Enhance Business Continuity (1)

增强业务连续性的最佳滚动升级策略

当谈到维持正常运行时间没有什么比如何处理升级更重要。对于许多 IT 专业人士来说,传统方法——将系统离线,一次性升级所有内容,然后祈祷一切顺利——只会让他们熬夜加班,还要接听不明电话。这时,滚动升级就派上用场了。

滚动升级策略允许您逐步升级系统,逐个节点或逐个组件,而无需中断整个环境。这是一种在维护时段和系统更新期间保持业务连续性的有效方法。在本篇博文中,我们将深入分析滚动升级策略的含义、它对高可用性的重要性以及如何正确实施。

了解滚动升级

滚动升级是指分阶段、按顺序(而非一次性)更新系统或应用程序的过程。这允许环境中的其他部分在更新时继续运行。

滚动更新策略的关键组成部分:

  • 增量更新:一次升级一个节点或服务,继续之前验证每个步骤。
  • 分阶段部署:分阶段推出新功能或补丁,以便尽早隔离问题。
  • 回滚功能:如果出现问题,请准备好恢复更改,而不会影响整个系统。

滚动升级在高可用性环境中尤其重要,因为停机时间并非可选项。通过精心规划和执行这些升级,您可以保持系统在线并确保客户满意度。

滚动升级策略对业务连续性的重要性

为什么要关注滚动升级?很简单:滚动升级可以最大程度地减少中断,并最大程度地延长正常运行时间。

  • 最大限度地减少停机时间:您的业务不会因为补丁发布而停止。滚动升级可确保业务持续运行。
  • 增强系统可靠性:升级的每个阶段都包括验证,这有助于在问题升级之前识别并解决问题。
  • 现实世界的影响:对于医疗保健、金融或零售行业的企业来说,即使几分钟的停机时间也可能导致收入损失和声誉受损。

有了完善的滚动升级策略,您不仅可以升级系统,还可以升级弹力。

实施滚动升级的挑战

滚动升级固然好处多多,但也并非没有挑战。成功实施滚动升级需要规划、协调和纪律。

  • 精准调度与沟通:团队必须协调一致,以确保升级过程不会造成意外中断。
  • 版本兼容性:在分阶段升级期间,并非所有组件都能良好协作。请确保您的系统在过渡期间支持运行混合版本。
  • 资源限制:暂存环境、QA 周期和回滚计划都需要时间和人员。

要避免这些陷阱,首先要知道会发生什么,并制定解决这些陷阱的计划。

成功滚动升级策略的最佳实践

正确做法如下:

  1. 了解你的系统:了解您的架构、应用程序依赖关系以及每个组件如何交互。
  2. 使用暂存环境:在将升级部署到生产环境之前,先在实验室环境中进行演练。识别故障点并完善回滚程序。
  3. 细分您的环境:将您的系统划分为可升级的单元(节点、服务、区域),以便您可以一次更新一个。
  4. 严格测试:每个阶段结束后验证功能。冒烟测试、健康检查和监控工具应始终处于活动状态。
  5. 回滚计划:为每个阶段制定经过测试的回滚计划。除非当前阶段稳定,否则请勿向前滚动。
  6. 清晰沟通:向利益相关者告知进度安排、预期影响和升级路径。确保支持、运营和最终用户随时了解情况。
  7. 尽可能实现自动化:使用编排工具和 CI/CD 管道减少人为错误并加速流程。

成功的滚动升级策略不仅关乎技术,更关乎组织。从工程师到高管,每个人都需要达成共识。

实施滚动升级策略

那么,如何开始呢?

  • 评估与规划:确定哪些组件需要升级并评估它们的依赖关系。
  • 工具选择:选择支持分阶段推出的自动化和编排工具(如 Ansible、Jenkins 或 Kubernetes Operators)。
  • 执行:从低风险组件或非关键节点开始。在进入下一阶段之前,请密切监控并验证。
  • 升级后审查:记录经验教训,评估系统性能,并改进下一次流程。

例子:一家零售连锁店采用滚动策略,对数百家门店的 POS 基础设施进行了升级。他们每晚升级五家门店,并在升级前验证升级成功,从而避免了大面积宕机,并实现了全天候运营。

最佳滚动升级策略的优势

如果操作正确,滚动升级的作用将不仅仅是保持灯亮。

  • 提高业务连续性:更新成为例行事务,而不是危险事件。
  • 增强客户体验:没有中断意味着不会丢失交易或服务中断。
  • 面向未来:顺利的滚动升级过程使得采用新技术更快、更安全。

滚动升级不仅仅关乎生存,还关乎在正常运行时间不容商榷的世界中蓬勃发展。

滚动升级策略与解决方案

总结一下:

  • 滚动升级是一种行之有效的方法,可以最大限度地减少停机时间并提高系统可靠性。
  • 挑战是存在的,但只要有正确的规划和工具,就​​可以应对。
  • 最佳实践(例如自动化、细分和清晰的沟通)是成功的关键。

在 SIOS,我们了解正常运行时间的价值。我们的高可用性解决方案支持滚动升级Windows 和 Linux 环境,即使在更新期间也能帮助您保持关键应用程序在线。无论您运行的是SQL 服务器,树液或定制应用程序,SIOS 提供了执行智能、无缝滚动升级策略的工具。

你的升级策略能应对挑战吗?如果没有,或许是时候制定一个更好的计划了。立即申请演示!

作者:Dave Bermingham,SIOS 高级技术布道师

经许可转载SIOS

Filed Under: 服务器集群简单化 Tagged With: 业务连续性

如何不间断地打补丁:HA 带来近乎零的停机时间

6月 3, 2025 by Jason Aw Leave a Comment

如何不间断地打补丁:HA 带来近乎零的停机时间

保护关键系统免受停机和灾难的影响

本白皮书探讨了组织如何通过集成高可用性 (HA) 集群解决方案来克服传统补丁管理相关的停机风险。它解释了 SIOS LifeKeeper 和 DataKeeper 软件如何实现滚动更新流程,从而允许在辅助节点上测试和应用补丁,而无需中断生产系统。这种方法可以最大限度地减少停机时间,降低补丁故障风险,并确保符合 HIPAA 和 PCI DSS 等网络安全法规。

经许可转载SIOS

Filed Under: 服务器集群简单化

SIOS LifeKeeper 演示:滚动更新和故障转移如何在 AWS 中保护 PostgreSQL

5月 27, 2025 by Jason Aw Leave a Comment

SIOS LifeKeeper 演示:滚动更新和故障转移如何在 AWS 中保护 PostgreSQL

 

本周,SIOS Technology 客户成功总监 Dave Bermingham 介绍了 LifeKeeper for Linux 如何为在 AWS 中运行的 PostgreSQL 数据库提供高可用性。

高可用性 (HA)零停机维护一直是企业在云中运行关键任务数据库的终极目标。Dave 最近展示了如何  Linux 版 LifeKeeper解决方案解决了这些挑战PostgreSQL数据库中AWS。该演示主要集中在最大限度地减少计划维护期间的停机时间和自动从计划外故障中恢复,凸显了对弹性云架构日益增长的需求。

经许可转载SIOS

Filed Under: 服务器集群简单化

SIOS 技术将在 Red Hat 峰会、里程碑技术日和 XPerience 日以及 SQLBits 2025 上展示用于关键任务应用程序的高可用性集群软件

5月 18, 2025 by Jason Aw Leave a Comment

SIOS 技术将在 Red Hat 峰会、里程碑技术日和 XPerience 日以及 SQLBits 2025 上展示用于关键任务应用程序的高可用性集群软件

在 SIOS 收集其 2025 年 HA/DR 实践调查报告的见解时,所有从业者都被邀请提供有关高可用性和灾难恢复趋势的意见

加州圣马特奥 – 2025 年 5 月 6 日–SIOS科技公司领先的应用程序高可用性 (HA) 和灾难恢复 (DR) 解决方案提供商 . 今天宣布,将于今年春季在四场领先的技术活动中展示其面向业务关键型应用程序的高可用性集群软件。SIOS 还宣布,将邀请所有 IT 从业者参与其新推出的 2025 年 HA/DR 实践调查,该调查旨在收集有关确保应用程序正常运行时间和数据保护的当前趋势、挑战和策略的见解。

  • 2025 年比荷卢里程碑技术日– 2025 年 5 月 8 日 – 荷兰埃因霍温贝斯特
  • 红帽峰会– 2025 年 5 月 19 日至 22 日,马萨诸塞州波士顿 – 展位号:854
  • 里程碑体验日– 2025 年 6 月 4 日,英国伦敦
  • SQLBits 2025– 2025 年 6 月 18 日至 21 日,英国伦敦 ExCeL

在每场活动中,SIOS 专家都将演示 SIOS LifeKeeper 和 DataKeeper 软件如何为 SQL Server、SAP 和 Oracle 等关键应用程序提供高可用性和灾难恢复功能。与会者将了解 SIOS 集群软件如何确保应用程序正常运行时间、消除数据丢失,并简化跨物理、虚拟、云和混合环境的 HA/DR 操作。

SIOS 集群软件使 IT 团队能够创建高可用性应用环境,而无需共享存储。通过智能应用程序监控、实时数据复制以及自动化故障转移和恢复,SIOS 能够以最低的复杂性和更低的成本确保业务连续性。SIOS 解决方案支持任何基础架构中的 Windows 和 Linux,深受全球企业信赖,可保护关键任务运营。

SIOS 启动调查,收集有关 HA/DR 实践的见解

作为其致力于推进企业弹性战略的一部分,SIOS 正在启动其 2025 年 HA/DR 实践调查,以收集 IT 专业人员为确保应用程序正常运行和数据保护而面临的挑战、优先事项和实际策略的见解。调查结果将汇编成《SIOS 2025 年高可用性和灾难恢复现状报告》,为行业提供宝贵的基准。

欢迎所有从业者参与调查,包括 Red Hat 峰会、Milestone 技术日、Milestone XPerience 日和 SQLBits 的与会者这里。

# # #

关于 SIOS Technology Corp.

SIOS Technology Corp. 的高可用性和灾难恢复解决方案可确保跨物理、虚拟、云和混合云环境运行的关键 Windows 和 Linux 应用程序的可用性并消除数据丢失。SIOS 集群软件对于任何需要高弹性的应用程序的 IT 基础架构都至关重要,它可在不牺牲性能或数据的情况下确保正常运行时间,从而保护企业免受本地故障和区域性中断(无论是计划内还是计划外)的影响。SIOS Technology Corp. 成立于 1999 年,https://us.sios.com) 总部位于加利福尼亚州圣马特奥,在全球设有办事处。

SIOS、SIOS Technology、SIOS DataKeeper、SIOS LifeKeeper 及其相关标识是 SIOS Technology Corp. 及其关联公司在美国和/或其他国家/地区的注册商标或商标。所有其他商标均为其各自所有者的财产。

媒体联系人:

贝丝·温科夫斯基
Winkowski Public Relations, LLC(SIOS)978-649-7189bethwinkowski@US.SIOS.com

经许可转载SIOS

Filed Under: 服务器集群简单化

与高可用性相关的应用程序智能

5月 12, 2025 by Jason Aw Leave a Comment

Application Intelligence in Relation to High Availability

与高可用性相关的应用程序智能

高可用性 (HA) 背景下的应用程序智能是指系统实时了解应用程序的行为和健康状况并做出智能响应以保持持续服务可用性的能力。

什么是应用智能?

那么,什么是应用智能?应用智能涉及监控、分析和响应多种因素。这些因素包括应用程序状态,例如应用程序处于启动状态还是关闭状态。性能指标包括响应时间、错误率、吞吐量和内存使用情况。应用程序依赖项,例如数据库或外部服务。最后,他们会关注用户行为或模式。使用应用程序智能可以更全面地了解应用程序。它使用各种数据点来对应用程序本身的状态(而不仅仅是基础设施)做出明智的决策。让我们以 Web 服务器为例;仅仅知道服务器是否正在运行是不够的,还要知道网站是否可以无错误地访问?响应速度是否很慢?用户是否需要多次刷新才能访问?网站所依赖的数据库是否也正常运行且可访问?以上所有都是应用程序智能衡量成功的因素示例。

LifeKeeper 如何使用应用程序智能

那么,生命守护者如何使用应用智能来增强关键应用的高可用性?让我们来详细分析一下。LifeKeeper 使用特定于应用程序的恢复工具包 (ARK)包含每个应用程序的知识(树液,SQL,PostgreSQL,甲骨文等)。这使得 LifeKeeper 能够处理每个应用程序的启动/关闭过程,监控应用程序及其依赖项的健康状况,并在不损坏任何数据的情况下协调智能故障转移/故障恢复操作。用户可以在 LifeKeeper 中将相关资源按层次结构组合在一起,这使得 LifeKeeper 能够理解不同应用程序组件之间的依赖关系(例如,当服务依赖于 IP 或数据库时)。这确保了 LifeKeeper发生故障转移按照正确的顺序和恢复操作不会破坏应用程序或使其处于不一致或损坏的状态。

此外,LifeKeeper 还会进行深度健康检查,不仅确定服务器是否正常运行,还会进行更详细的检查,例如数据库是否正在接受连接,或者 Web 服务是否返回预期响应。它甚至可以监控某些预期的后台进程是否正在运行。LifeKeeper 还使用特定于应用程序的配置文件来确保跨节点的数据配置一致性,并确保应用程序设置得到正确保存或恢复。最后,LifeKeeper 能够使用自定义脚本进一步微调这些深度检查,以智能地支持不太常见或自主开发的应用程序。

PostgreSQL ARK:应用程序智能的真实示例

为了更深入地了解,我们可以看看 PostgreSQL ARK 如何使用应用程序智能。PostgreSQL ARK 通过了解特定的 PostgreSQL 启动和关闭命令、了解 postgresql.conf 和 pg_hba.conf 等关键配置文件,以及理解数据目录布局和锁定文件行为,使用特定的逻辑来监控、启动、停止和故障转移 PostgreSQL。

PostgreSQL 的智能监控和有序故障转移

此外,它不仅检查 PostgreSQL 是否正在运行,还会检查数据库是否响应查询、正确的数据目录是否可访问以及事务日志中是否存在任何损坏。它使用依赖项跟踪来确保 PostgreSQL 经常依赖的资源可用,例如用于客户端连接的虚拟 IP 以及用于其数据目录的已挂载存储。这确保了 LifeKeeper 在发生故障转移时能够按正确的顺序启动资源,例如先挂载磁盘,启动 IP,然后启动 PostgreSQL,最后验证服务健康状况。

防止裂脑并确保数据完整性

最后,LifeKeeper 使用应用程序智能来避免裂脑(一种多个节点认为自己是“主”节点的现象)场景,避免启动两个具有相同数据目录的活动 PostgreSQL 服务器,并通过在写入仍在进行时不进行故障转移来避免数据损坏。这些都是 LifeKeeper 和各种 ARK 实现应用程序智能的不同方式的示例,旨在使组合产品尽可能具有弹性。

通过智能高可用性增强应用程序的弹性

总之,LifeKeeper 的内置应用程序智能通过了解应用程序的行为方式及其正确运行所需的条件,实现了精确、快速和可靠的故障转移和恢复。

确保应用程序的弹性和不间断的服务—请求演示或者开始免费试用今天体验 SIOS LifeKeeper 如何使用应用程序智能来保护您的关键工作负载。

作者: Cassy Hendricks-Sinke,首席软件工程师,团队负责人

经许可转载SIOS

Filed Under: 服务器集群简单化

  • 1
  • 2
  • 3
  • …
  • 101
  • Next Page »

最近的帖子

  • 增强业务连续性的最佳滚动升级策略
  • 如何不间断地打补丁:HA 带来近乎零的停机时间
  • SIOS LifeKeeper 演示:滚动更新和故障转移如何在 AWS 中保护 PostgreSQL
  • 如何评估我的网卡是否需要更换
  • SIOS 技术将在 Red Hat 峰会、里程碑技术日和 XPerience 日以及 SQLBits 2025 上展示用于关键任务应用程序的高可用性集群软件

最热门的帖子

加入我们的邮件列表

Copyright © 2025 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in