SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 产品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 服务器集群简单化
  • 成功案例
  • 联系我们
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

扩展您的高可用性指标

9月 20, 2020 by Jason Aw Leave a Comment

扩展您的高可用性指标

扩展您的高可用性指标

在技术领域,我们喜欢数据。我们喜欢有关数据的数据以及我们工具可以带来的所有指标和度量。我们围绕分析技术创建了行业,这些产品可以捕获数千个已连接设备的每个细节。我们喜欢指标和措施。在更高可用性空间中的许多情况下,我们喜欢高可用性指标,这些指标告诉我们系统从故障中恢复的速度。我们计算并跟踪检测和修复之间的时间,我们着迷于了解和衡量在灾难,系统故障或磁盘崩溃中会丢失多少事务数据。

具有讽刺意味的是,在高可用性和灾难恢复(HA / DR)系统中,有些指标没有引起足够的重视。

以下是管理环境时应注意的其他八个高可用性指标:

1。  安全警报

可用性不仅涉及应用程序监视和恢复。  公开可用的系统总是受到攻击。  如果您不监视安全警报和警告,则您的应用程序可能会完美运行,而您的知识产权却可以完美无缺地被转移。

2。空闲连接

空闲的连接听起来无害,但它们几乎和南部草坪上的绿叶葛根一样无害。  空闲连接会占用资源,并有可能填满数据库池,拥塞网络和窒息性能。  此外,空闲连接可能表明应用程序层或数据库配置存在问题。

3。长期运行的查询,命令或作业

这不仅适用于数据库查询或作业,还适用于命令和备份。  长时间运行的查询,命令和作业可能表明系统运行状况不佳,磁盘速度降低,CPU或其他资源争用,或者系统,应用程序兼容性或操作系统存在更深层次的问题。

4。磁盘IO

磁盘IO通常是指与磁盘活动有关的系统的输入/输出操作。测量磁盘I / O可以帮助发现瓶颈,给定工作负载的硬件配置不正确,磁盘大小不正确或磁盘布局调整不当。  监视磁盘I / O可以帮助您告诉您长时间运行的查询是否是由于不良的sql语法,不良的应用程序编码或延迟和访问问题引起的。

5,记忆

我们都考虑要使用多少内存,但是内存监视不只是衡量和查看可用内存还是已使用内存。  监视内存可帮助您调查瓶颈,泄漏,识别大小不正确的系统,了解负载,平均负载和峰值。  此外,了解内存密集型模式可以帮助您调整可用性套件,以避免错误的故障。

6。磁盘空间

作为客户体验副总裁,我曾经有过一次很不幸的经历,要在清晨醒来紧急呼叫。  停电后,客户面临停机生产系统。  当他们尝试重新启动系统时,受保护的应用程序无法启动。  快速检查错误日志后,很明显根驱动器已100%充满。  该应用程序无法写入任何文件系统。  磁盘空间监视有多种形式和方法,将其作为度量标准可以防止不必要的问题和增加更多成本的最后一刻争夺。。

7 错误和警报

日志中的错误,警报和恢复消息是要考虑的另一个很好的指标。  您的可用性解决方案可能会使您的客户保持在线状态并感到满意,但也可能掩盖了需要尽快引起您注意的问题。  为FATAL,PANIC和关键ERROR消息添加日志监视可以帮助您确定可用性解决方案经常从中恢复的问题,例如数据库崩溃,应用程序紧急情况或核心转储,或者需要冷重启的致命错误。

8。恢复编号

与监视错误和警报类似,恢复编号可以告诉您很多有关系统可用性的信息。  如果您平均每周要进行一次以上的应用程序恢复,则可能会遇到比正常的可用性保护更多的事情。  尽管恢复成功地重启了您的应用程序或系统,但这些错误甚至真实的恢复中有太多是不健康的。

我们可以监控的HA / DR指标列表以及用于监控它们的工具正在飞速发展。  确保您和您的团队考虑扩展当前的数据捕获和分析,以包括那些可能构成最佳更高可用性系统的数据。

—客户体验副总裁Cassius Rhue

 

 

经SIOS许可转载

Filed Under: 服务器集群简单化

自动恢复在Amazon EC2上运行的Microsoft IIS应用程序

9月 14, 2020 by Jason Aw Leave a Comment

在Amazon EC2上运行的Microsoft IIS应用程序的自动恢复

减少IIS停机时间的更好选择

微软的IIS(Internet信息服务)是当今使用的第四流行的Web服务器,仅次于Apache,Nginx和Cloudflare占有7.8%的市场份额(来源W3Techs.com,8/12/20)。许多IIS客户正在Amazon EC2上运行其IIS应用程序。

IIS是一种多功能,可扩展且高度可配置的Web服务器。IIS包括一些重要功能以确保应用程序正常运行,例如应用程序池和远程管理功能,以允许管理员使用PowerShell远程管理IIS。

确定如何监视和管理IIS应用程序

在管理和监视IIS应用程序时,客户有很多选择。他们要么专注于提高IIS上运行的应用程序的性能,要么监视和解决任何故障。

Microsoft确实包含一些本机功能,以帮助您优化和管理在IIS上运行的应用程序。如果您和您的团队技术娴熟,那么您可以使用PowerShell或其他脚本语言来管理IIS应用程序池。这样做可以使您在达到特定时间或请求阈值时自动回收池和虚拟内存。

但是,如果您的IIS应用程序出现故障,这对您没有帮助。  要监视IIS服务器,您需要使用监视(“ APM”)工具,这些工具可以提醒您任何故障并向您提供有关发生故障的详细信息。  这些包括商业解决方案,例如SolarWinds,AppDynamics,Dynatrace,Datadog和New Relic。  如何决定它们取决于您的要求,其功能的范围和复杂程度以及用户界面和设置过程的简单性。 APM解决方案可以在出现问题以及为什么出现问题时提醒您,但是如果IIS服务器出现故障,它们不能总是帮助您恢复正常运行。

减少IIS停机时间的更好选择

如果您正在寻找一种解决方案,该解决方案不仅可以监视在Amazon EC2上运行的IIS服务器,而且还可以消除停机时间,那么我们建议您查看SIOS AppKeeper监视解决方案。如果应用程序遇到服务中断和停机,AppKeeper会持续监视并自动恢复应用程序,例如在IIS上运行的应用程序。

让我们看看AppKeeper EC2监视解决方案如何帮助减少IIS停机时间:

  • AppKeeper监视您的EC2服务和实例。安装和配置AppKeeper(仅需大约10分钟)后,您可以指定应监视的Amazon EC2实例和服务,以及在遇到系统故障时应采取的措施。
  • 如果您的IIS Web服务器检测到任何系统故障,AppKeeper会提醒您。  您会通过电子邮件或SMS收到警报,并且可以查看失败事件的详细信息以及已采取的措施。

  • 在检测到系统故障后,AppKeeper会启动自动重启服务并在必要时重启实例。您不再需要响应任何警报并解决重新启动之前发生的情况。AppKeeper会自动为您执行此操作。

通过不仅仅管理IIS服务器性能或监视到自动修复,AppKeeper消除了停机时间,并提供了您应得的安心。

如今,数百家公司依靠AppKeeper来保持其云环境正常运行。我们邀请您观看下面的视频,了解安装和使用AppKeeper多么容易。

视频:安装AppKeeper并从AWS EC2故障演示中恢复

如果您喜欢自己所看到的内容,请随时注册AppKeeper的14天免费试用版。

经SIOS许可转载

Filed Under: 服务器集群简单化

如何在Linux环境中为SQL Server提供高可用性

9月 10, 2020 by Jason Aw Leave a Comment

如何在Linux环境中为SQL Server提供高可用性

如何在Linux环境中为SQL Server提供高可用性

如果您的组织在Linux上运行关键业务的Microsoft SQL Server,那么您的IT团队无疑会知道持续保持高可用性,性能和安全性是多么困难。特别困难的是如何通过健壮的复制和自动故障转移来确保高可用性。使用开源软件和易于配置的HA SANless群集解决方案可以提供一种更简单的维护方法,而无需牺牲组织所需的安全性和性能。

Linux的有限高可用性选项

大多数Linux发行版为IT部门提供了两个次等的高可用性选择:要么为SQL Server Enterprise Edition支付更多费用以实施“始终在线”可用性组,要么努力使复杂的“自己动手做”的HA Linux配置正常工作-这可能是异常的很难做到。

使用企业版的问题在于,它破坏了在商品硬件上使用开源操作系统的节省成本的策略。对于数量有限的小型SQL Server应用程序,可能有理由证明其额外费用。但是对于许多数据库应用程序来说,它太昂贵了,无法为Linux提供通用的HA。

使用开源软件(例如Pacemaker和Corosync或SUSE Linux Enterprise High Availability Extension),可以跨Linux环境中运行的所有应用程序提供HA。但是要使完整的软件堆栈正常工作,需要为每个应用程序创建(和测试)自定义脚本,并且即使对所使用的任何软件或硬件进行了很小的更改,这些脚本通常也需要重新测试和更新。SQL Server Standard Edition和Linux不支持的与可用性相关的功能会使这项工作更具挑战性。

在Linux中寻找SQL Server的替代高可用性解决方案

为了使HA具有成本效益并且易于实施,您可能需要考虑两种不同的通用方法。

一种是使用基于存储的系统,该系统通过在冗余且有弹性的存储区域网络(SAN)中复制数据来保护数据。对于主机操作系统而言,这种方法是不可知的,但是它要求从单个供应商处购买整个SAN基础架构,并依靠单独的故障转移规定来提供高可用性。

另一种方法是基于主机的,涉及跨Linux服务器实例创建与存储无关的SANless集群。作为HA覆盖,这些群集能够在私有,公共和混合云中跨LAN和WAN运行。该覆盖图也与应用程序无关,使组织可以在所有应用程序中使用一个通用的HA解决方案。尽管这种方法确实消耗了主机资源,但是它们相对便宜并且在Linux环境中易于扩展。

大多数HA SANless群集选件提供了实时块级数据复制,连续应用程序监视以及可配置的故障转移/故障回复恢复策略的组合,以保护所有关键业务应用程序,包括那些使用标准版中始终启用故障转移群集实例的应用程序SQL Server。

SIOS Technology Corp.为Linux提供了更强大的HA SANless集群解决方案,这些解决方案具有高级功能,旨在使IT人员摆脱支持和优化计算基础架构的复杂性和日常挑战。具有LifeKeeper的SIOS Protection Suite解决方案提供:

  • 持续监控整个Linux应用程序堆栈
  • 借助其应用程序恢复工具包(ARK)进行全面的应用程序保护,可对复杂的应用程序和数据库进行快速,安全的恢复或故障转移
  • 向导驱动的Linux群集设置
  • 配置灵活性,例如使用传统的共享存储群集或软件在无SAN群集配置中同步本地存储

例如,无SAN群集可以处理两个并发故障。在LAN和WAN以及私有,公共和混合云中,基本操作是相同的。

在典型的两节点群集服务器中,#1最初是将数据复制到服务器#的主服务器。它遇到问题,自动触发故障转移到服务器#2,该服务器现已成为主要服务器。

在这种情况下,IT部门可能会开始诊断和修复导致#1服务器故障的任何问题。固定后,它可以接管主要服务器或服务器#2继续以这种能力将数据复制到服务器#1。

使用大多数HA SANless群集配置,故障转移是自动的,并且故障转移和故障回复都可以通过基于浏览器的控制台进行控制。

有关SIOS LifeKeeper和Protection Suite解决方案的更多信息,请访问用于群集服务器环境的SIOS SAN和SANless高可用性群集。

经SIOS许可转载

Filed Under: 服务器集群简单化

如何为SIOS群集软件激活许可证

9月 6, 2020 by Jason Aw Leave a Comment

如何为SIOS群集软件激活许可证

如何为SIOS群集软件激活许可证

这个简短的视频是由SIOS支持团队设计的一系列应用程序可用性“如何做”教程的第一部分。它逐步介绍了开始使用SIOS Protection Suite或SIOS DataKeeper软件所需的简单步骤。  在SIOS文档库中了解如何访问各种支持资源。

如何为SIOS群集软件激活许可证

经SIOS许可转载

Filed Under: 服务器集群简单化

如果我们消除了Apache停机时间该怎么办?

8月 30, 2020 by Jason Aw Leave a Comment

 

通过SIOS AppKeeper Monitoring消除Apache Web服务器的停机时间

通过SIOS AppKeeper Monitoring消除* Apache Web服务器停机

如今,Apache Web服务器是Internet上最受欢迎的Web服务器。  公司正在使用Amazon AWS,Microsoft Azure和Google Cloud Platform等云平台部署基于Apache构建的关键任务,面向客户的应用程序。  因此,您可以打赌他们正在投入大量时间和金钱来监视那些应用程序并试图减少停机时间。但是,如果我们告诉您,当Apache Web服务器停机时,可以通过自动监视和重新启动应用程序来消除手动干预的需要怎么办?

在探讨如何做到这一点之前,让我们先回顾一下,看看公司在监视和管理其Apache Web服务器以及这些关键应用程序方面的选择。

如何监视和保护Apache Web服务器免受不必要的停机

任何使用Apache Web服务器部署应用程序的人都在考虑监视其Web服务器本身的运行状况,或者将该任务外包给第三方。

在监视运行在Amazon Web Services上的云应用程序时,一种流行的选择是使用Amazon CloudWatch。  一些公司甚至通过开发脚本或使用AWS Lambda创建某种程度的自动化来扩展CloudWatch的功能。  但是,使用自定义指标正确配置Amazon CloudWatch并设置AWS Lambda需要一定数量的技术专长,而这可能超出了许多公司。  然后,随着应用程序的发展,维护任何脚本都需要付出成本和精力。

另一个选择是从诸如New Relics,Dynatrace,DataDog或LogicMonitor等供应商那里投资全面的应用程序性能监视(“ APM”)解决方案。如果您要监视的不仅仅是AWS环境,这些方法可能非常合适。APM解决方案非常可配置,可以根据发生的情况为您提供大量数据。

但是,您减少了停机时间吗?可能不是。  您所做的一切都花在了一个系统上,该系统将在Apache Web服务器出现故障时立即提醒您,并在尝试重新运行时使您的数据超载(或“警报风暴”)。

一些公司已决定将监视和管理其应用程序的责任外包给受信任的第三方(通常是“托管服务提供商”或MSP)。作为基本月费的回报,MSP监视应用程序并提供一组核心服务,通常受服务水平协议的约束。收到警报后,他们将进行调查。在某些情况下,这些调查可能需要(昂贵)升级。如果应用程序出现故障,则MSP将控制并重新启动服务或在可能的情况下重新启动实例。  但是这些补救措施通常是额外的费用。

一定有更好的方法。

使用SIOS AppKeeper进行自动监视和重新启动如何消除Apache Webserver的停机时间

根据我们的客户经验,只有三个EC2实例的普通公司每月至少要经历一次停机。  “该站点已关闭!放下一切。找出需要做什么!”您需要做的是减少对这些不必要的消防演习的需求。

SIOS AppKeeper是一项SaaS服务,易于安装和配置并监视Amazon EC2上运行的任何服务和应用程序,例如Apache httpd服务。  当检测到异常时,AppKeeper会自动重新启动服务,如果不起作用,它将重新启动整个实例。无需再通读日志以查明失败的原因,或升级到开发人员以重新启动服务。还是昂贵的外包费用。  AppKeeper提供“设置并忘记”功能,以便您消除停机时间。

如今,数百家公司依靠AppKeeper来保持其云环境运行。我们邀请您观看下面的视频,以演示AppKeeper如何保护Apache Web服务器。  如果您喜欢自己所看到的内容,请随时注册AppKeeper的14天免费试用版。

如果我们消除了Apache停机时间该怎么办

*基于客户数据,AppKeeper解决了85%的应用程序服务故障。因此,十分之九的AppKeeper会发送一封电子邮件,通知客户检测到停机时间并且服务已重新启动或实例自动重新启动。  这比手动重新启动所有文件之前恐慌和挖掘日志文件好吗?

请参阅相关文章:为什么AWS EC2应用程序监控如此困难?

 

经SIOS许可转载

Filed Under: 服务器集群简单化

  • « Previous Page
  • 1
  • …
  • 58
  • 59
  • 60
  • 61
  • 62
  • …
  • 100
  • Next Page »

最近的帖子

  • 在 Nutanix 环境中选择高可用性解决方案的 10 个注意事项
  • 我的服务器是一次性的吗?高可用性软件如何融入云最佳实践
  • 灾难频发世界的数据恢复策略
  • DataKeeper 和棒球:灾难恢复的战略举措
  • SQL Server 停机风险预算

最热门的帖子

加入我们的邮件列表

Copyright © 2025 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in