SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 产品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 服务器集群简单化
  • 成功案例
  • 联系我们
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

Archives for 7月 2020

EC2监控最佳实践:使用SIOS AppKeeper保护Amazon EC2上的NGINX Web服务器

7月 14, 2020 by Jason Aw Leave a Comment

EC2监控最佳实践:使用SIOS AppKeeper保护Amazon EC2上的NGINX Web服务器EC2监控最佳实践:使用SIOS AppKeeper保护Amazon EC2上的NGINX Web服务器

NGINX是一个Web服务器,还可以充当负载平衡器,反向代理等。它们之间,NGINX和Apache一起提供了超过50%的网络流量。  如今,许多公司正在使用Amazon Linux,Red Hat Linux和Ubuntu在Amazon EC2环境上运行其NGINX开源或NGINX Plus Web服务器。

每个人都同意,最佳做法是监视EC2上的NGINX之类的应用程序,并快速响应任何系统异常情况。  用户期望其应用程序能够快速访问并保持正常运行时间。

在Amazon EC2上监视NGINX Web服务器的当前选择

许多公司正在部署Amazon CloudWatch来监视其应用程序,甚至通过开发脚本或使用AWS Lambda来创建某种程度的自动化。  但是,使用自定义指标正确配置Amazon CloudWatch并设置Amazon Lambda需要一定数量的技术专长,而这可能超出了许多公司。  然后,随着应用程序的发展,维护任何脚本都需要付出成本和精力。

另一种选择是部署应用程序性能监视(APM)解决方案,例如New Relic,Dynatrace,Datadog或LogicMonitor中的一种。  APM解决方案很棒。  他们在监视您的所有系统以及查明发生的情况和原因方面做得非常好。  他们创建可以与您的开发团队共享并由您的开发团队解释的日志,以重新创建问题并确保不再发生。  但是事情是这样的:APM解决方案提供了许多您必须分类的数据(将“信号与噪音分离''),并且它们在故障发生时无法恢复。  在减少NGINX Web服务器的停机时间时,APM工具只是解决方案的一部分。

但是有些公司没有内部人员或工具来自己监控EC2环境。这就是为什么他们选择将任务外包给托管服务提供商的原因。  与MSP一起管理环境有一些非常实际的好处,例如,随着环境的扩展而不必雇用更多的员工,或者不必对团队进行新技术培训。  MSP可以提高投资效率,因为它们可以将其投资分散到许多客户。  但是有缺点。  在某些情况下,您可能会陷入高额的固定成本合同,并且如果遇到问题并且必须逐步解决这些问题,成本可能会上升。  而且,您将失去监视环境的团队与负责构建和部署应用程序的团队之间的连续性。

无论您是选择投资APM解决方案还是将其外包给MSP,您都仍然需要考虑在发生故障时以及从故障停机时恢复NGINX Web服务器的速度。  我们想提出另一种选择:使用SOIS AppKeeper进行自动修复。

SIOS AppKeeper:EC2上NGINX Web服务器的自动修复

我们的许多客户都选择使用SIOS AppKeeper来保护其NGINX Web服务器。  尽管他们可以选择标准的应用程序性能监视(APM)解决方案或第三方监视解决方案,但他们选择依靠AppKeeper来自动恢复服务或发生故障的整个EC2实例。  我们将看一下其中的一些原因,并与您分享一个简短的视频,展示AppKeeper如何与NGINX一起使用。

SIOS AppKeeper是一项SaaS服务,易于安装和配置并监视在Amazon EC2上运行的任何应用程序,例如NGINX Web服务器及其“ nginx”,“缓存管理器”和“工作程序”服务。  当检测到异常时,AppKeeper会自动重新启动服务,如果该操作不起作用,它将重新启动整个实例。  无需再仔细阅读痛苦的日志以查明失败的原因,或升级到开发人员以重新启动服务或昂贵的外包费用。  AppKeeper提供了“设置并忘记”功能,因此您可以放心知道NGINX Web服务器正在遵循EC2监视最佳实践并且运行正常,或者如果遇到任何问题将很快重启。

Wistia视频缩略图

如今,数百家公司依靠AppKeeper来保持其云环境正常运行。  我们邀请您观看此快速视频,以演示AppKeeper如何保护NGINX Web服务器。

如果您想亲自尝试SIOS AppKeeper,我们提供14天的免费试用期。  只需单击此处进行注册。

Filed Under: 服务器集群简单化

什么是Amazon CloudWatch?

7月 12, 2020 by Jason Aw Leave a Comment

什么是Amazon CloudWatch

 

什么是Amazon CloudWatch?

您可以使用CloudWatch做什么以及需要考虑的一些障碍

随着AWS在云市场中占据主导地位,许多公司正在使用Amazon AWS将其本地系统迁移到云中。  那么,应该如何管理在AWS环境中运行的系统?

在此博客文章中,我们将介绍AWS提供的监视服务Amazon CloudWatch的功能,以及实现它的挑战以及如何解决它们。

使用Amazon CloudWatch密切监视您的AWS环境

为了确保您拥有稳定的云环境,快速检测异常(“系统损害”)并及时做出响应非常重要。  对于任何迁移到云的组织而言,监视已成为一项重要且必要的任务。  这与管理本地应用程序和基础结构没有什么不同。那么,您应该如何在AWS环境中进行监控?一种选择是使用Amazon CloudWatch,它监视CPU,内存和磁盘使用情况,并在超过预定阈值时通知您。  另外,您可以设置自己的指标来监视各种项目,例如应用程序日志。

关于Amazon CloudWatch的最好之处在于,它是AWS本身提供的一项服务。  它与Amazon EC2和其他AWS服务具有很高的亲和力,因此它可以快速响应频繁的功能扩展和规范更改,并可以轻松支持AWS Auto Scaling,后者会根据负载自动增加或减少资源。  Amazon CloudWatch可根据每种环境的独特情况提供精确的监控。

Amazon CloudWatch实施挑战

尽管Amazon CloudWatch非常适合拥有经验丰富的云工程师和DevOps团队的组织,但一般用户应该注意一些事项。

Amazon CloudWatch可有效监视组织的AWS环境,但它需要一定水平的技能和知识来配置和部署。  尤其是当您设置自己的指标,设置警报或考虑到Auto Scaling时,复杂性会增加。 例如,如果要设置监视,这很容易,但是如果要设置电子邮件,重新启动,自动缩放等,则可能会遇到困难,具体取决于资源情况。

如果您要使用“发生错误时重新启动服务器”之类的指示来自动化恢复过程,则必须首先使用AWS Lambda脚本创建恢复方案,该脚本提供了有关条件和要采取的措施的详细说明。  您的团队对AWS Lambda有多熟悉?

Amazon CloudWatch的主要优点是您可以密切监视您的环境,但是要做到这一点,您必须事先为每个系统正确设计要监视的项目以及何时监视阈值等。  这些设计任务可能会花费很多时间。  当然,您的关键任务系统需要以这种方式进行严密监视,但是这种详细程度和复杂程度并不适合所有系统。对于某些网站,例如内部网站或WordPress服务器,您将希望最大程度地降低运营和人工成本。在这种情况下,我们建议您考虑使用一种更易于操作和管理的工具。

SIOS AppKeeper,用于监视在AWS上运行的操作系统和应用程序服务

对于非关键任务应用,我们建议使用SIOS Technology的SIOS AppKeeper。  AppKeeper易于安装和配置,并可监视在EC2实例上运行的应用程序的服务(进程)。  当检测到错误时,AppKeeper会自动重新启动服务,并在必要时重新启动实例。  即使是初次迁移到云的用户也可以设置AppKeeper来监视其EC2实例并自动恢复,而无需具备复杂的脚本编写技能。

使用AppKeeper,无需选择要监视的单个服务。您只需选择要监视的EC2实例以及要自动执行的操作即可。  您始终可以更详细地了解要监视哪些服务以及如何监视这些服务,但是AppKeeper旨在易于配置。  当检测到错误或从中自动恢复错误时,会记录并存储故障日志,以便以后可以调查故障原因。

使用AppKeeper进行AWS EC2监控

建议您不要根据Amazon SLA和恢复要求清点环境清单,而要使用SIOS AppKeeper监视您想减少运营开销的系统和应用程序,而不是使用Amazon CloudWatch来密切监视AWS环境中的所有内容。

请继续关注未来的博客文章,我们将更详细地比较如何设置CloudWatch和AppKeeper以执行相同的功能。

了解有关SIOS AppKeeper的更多信息

注册免费试用SIOS AppKeeper

 

Filed Under: 服务器集群简单化

测试/质量保证系统是企业可用性的关键部分

7月 8, 2020 by Jason Aw Leave a Comment

测试/质量保证系统是企业可用性的关键部分

测试/质量保证系统是企业可用性的关键部分

“我可以吻你,”这就是三十年前一个朋友向我冲来时对我脱口而出的意思。在前往我们地区最大的乐队比赛之一的途中,她已将簧片放到萨克斯管上。我不知道它们是谁,但是当我看到一堆芦苇在公交车上的座位上时,我把它们捡起来,带他们去了暖身区。热身三分钟后,她的第一个簧片破裂了,当她伸手去拿空口袋进行替换时,她惊慌失措。当我找到我发现它们的管道时,她脱口而出:“我现在可以吻你。”

担任SIOS Technology Corp.客户体验副总裁 在可用性频谱的不同阶段,我与许多企业客户和合作伙伴一起工作感到非常独特和独特。有时,我有机会与最终客户一起解决问题,缓解问题和进行改进。在其他时候,我们的团队会与合作伙伴和客户积极合作,以设计和实现企业可用性,以保护其系统免于停机。最近的一次客户体验使我想起了大约30年前发生的一件事情,当时我的朋友脱口而出:“我可以吻你。”

我和我的团队正在打客户电话。通话从平时的欢愉,介绍和对客户企业环境的概述开始。通话30分钟后,一切进展顺利。他们的体系结构扎实,周到并且有据可查。他们的团队知识渊博,技术精湛,经验丰富。但是随后,客户暗示,由于节省了成本,他们将不打算维护专用的测试/质量系统。我深吸了一口气。  实际上,这更像是呼气,就像是从肠子上冲来的空气一样。我准备做出回应,但在此之前,我的声音就爆发了。  “停机的首要原因是缺乏流程,”合作伙伴代表架构师在与我们的电话中惊呼道。经过短暂的开玩笑,客户同意维护测试/ QA系统,我差点脱口而出:“我可以亲你!”

在许多企业部署的前线(新系统,数据中心迁移和系统更新)中,我在支持和服务部门的团队已经看到许多问题,这些问题可以通过利用测试系统/群集来解决。

测试/质量系统是避免停机的HA策略的重要组成部分。与维护企业部署相关的常见任务(例如补丁,更新和配置更改)存在风险。巨大的风险。

通常在生产中进行测试的风险包括几个严重的潜在灾难性问题: 

  • 数据损坏或无效
  • 受保护的数据泄漏
  • 错误的收入确认(取消的订单等)
  • 重载系统
  • 对其他生产系统的意外副作用或影响
  • 错误率高,可触发警报并呼叫人员
  • 偏斜的分析(流量漏斗,A / B测试结果等)
  • 充满脚本和漫游器活动的不正确流量日志(a)

如果客户尝试在生产中进行风险较大的更改,则结果可能会非常有害。除了上面列出的那些故障之外,还有更多的停机时间风险,应用程序安装损坏,以及在某些情况下不可逆转的损坏。以客户X(在制造业中知名的SAP Enterprise商店)为例。

在从信誉良好的站点上读取紧急通知后,OS管理员迅速将其生产节点更新为可用的最新内核更新。在数小时内,生产节点开始了一系列未启动的崩溃和内核崩溃。他急忙安装了与他的配置不兼容的内核。现有应用程序软件包,设备,文件系统和相关软件包的组合。这导致生产中断,并向多个供应商几次高优先级升级。

将补丁程序应用于测试/ QA或沙箱系统时,可以管理和验证补丁程序和关键修订,以减少生产力损失和计划外停机。在类似生产的环境中测试应用程序使您能够发现无法预料的问题,并在这些问题对您的运营产生不利影响之前进行纠正。产前设计和测试消除了代价高昂的业务中断,改善了客户体验并保护了品牌。

使用测试质量检查系统改善生产可用性和过程

这些是使用测试/质量检查系统可以改善生产可用性和过程的基础知识。 与生产环境类似的受控环境(必须与生产环境尽可能相似)必须具有以下功能:

  1. 测试内核更新和安全更新
  2. 验证设置和配置调整
  3. 重现生产问题并测试软件更新和补丁
  4. 验证应用程序版本兼容性,并减少由于不兼容的更改而导致停机的风险
  5. 提供一个安全的空间来练习和修订上线,维护,中断和其他企业程序活动
  6. 在不影响企业客户的情况下培训新员工和团队成员

如果您具有用于部署关键企业可用性软件的测试/质量检查环境,我现在可以亲吻您。有了这种环境,您的团队就可以“测试,验证和验证(2)”体系结构,业务需求,用户场景,以及与与生产环境最相似的一个系统或一组系统的一般集成-您知道赚钱。当然,您仍然必须安排窗口来维护您的生产系统并对其进行测试,但是要在这之间完成一个安全的缓冲步骤之后。

—客户体验副总裁Cassius Rhue

————-

参考文献:

  1. https://opensource.com/article/19/5/dont-test-production已访问2020年5月4日
  2. https://www.softwaretestingclass.com/system-testing-what-why-how/访问时间:5/4/2020

Filed Under: 服务器集群简单化

案例研究:AWS EC2监控解决方案使一家全球制造公司在迁移到云中时免除了压力。

7月 7, 2020 by Jason Aw Leave a Comment

东京钻石工具制造公司使用SIOS AppKeeper保护重要应用程序

东京钻石工具制造公司成立于1932年。Co.,Ltd.生产用于切割,切片,抛光和钻孔工艺的金刚石工具,涉及范围广泛,例如家用电器,半导体,电子设备,医疗保健和土木工程。尽管它是一家拥有80多年历史的悠久公司,但Tokyo Diamond一直在积极引入新的IT工具。  该公司决定迁移到Amazon AWS和虚拟化,以提高业务改进的速度和效率。SIOS AppKeeper在提供所需的应用程序可用性保护方面发挥了重要作用。东京钻石工具公司迁移到云和AWS的原因之一是2011年的东日本大地震。  尽管总公司的服务器没有受到直接损坏,但宫城县仙台工厂的设备从机架上掉下来,造成了严重损坏。  东京钻石认为需要更好的业务连续性计划。  这是虚拟化其核心系统和使用云环境的主要驱动力。

最初,该公司开始将相对较小的应用程序迁移到云中。  “我们在2011年11月左右开始了迁移。  当时,我们别无选择,只有AWS。” Tokyo Diamond IT系统主管Takuji Kokubo先生说。  他们使用Sony Network Communications的“带有AWS的托管云”云门户自己管理运营。  Kokubo先生是一个自称为“ One Man IT操作”的人,因此效率和自动化对于确保公司IT系统在日本以及新加坡和泰国的平稳运行非常重要。

Takuji Kokubo,东京钻石工具
小久保先生
IT系统主管
东京钻石工具制造厂 有限公司。

迁移到云并确定对恢复解决方案的需求 

Diamond Tools实施了云存储服务Amazon EC2和Amazon S3。他们将其组件,销售支持和视频会议系统移至了AWS。  Diamond Tools的视频会议系统对其日常运营至关重要。  “该工具在与海外地点进行的各种会议中非常频繁地使用。  它每月使用约100次,并且从传统的按需购买即用SaaS系统过渡到AWS,我们每年可以减少多达200万日元的成本,” Kokubo先生说。  以前,包括其他公司在内的太多用户同时连接到系统时,语音质量通常会下降。  然后,小久保先生将收到用户的投诉,但问题无法轻松解决。  在AWS上构建公司特定的视频会议系统可以稳定视频和音频质量并减少投诉。

小久保先生很快就遇到了他们的EC2环境问题。“ EC2作为基础设施是稳定的;但是,有时服务失败。我一直很担心,有一天,在一次海外商务旅行中,我接到一个电话说用户无法访问该系统。  我必须一直随身携带笔记本电脑,才能通过VPN连接到AWS并恢复失败的服务。”小久保先生说。  显然,此过程不可扩展。

在运行组件软件应用程序的实例上经常发生服务故障。  公司的大多数员工每天早晨都使用组件软件应用程序检查日历或预订会议室。Kokubo先生说:“如果遇到问题,许多人会打电话给我,问发生了什么事。” 他通过此经验了解了自己亲自维护系统的风险。

“十年前,一旦出现故障,系统就会停止运行,用户已经习惯了。但是今天,一旦一切停止,我就会收到投诉。现在,系统有望一直处于运行状态,就像水龙头随时流出的水一样。  系统停机时间变得越来越无法接受,” Kokubo先生说。

小久保先生始终认为,当在EC2上运行的一项服务失败时,他必须处理任何问题。  成为唯一能够解决任何问题的人仍然是他的负担。  小久保先生说:“作为一家IT商店,我倾向于认为我的价值在于仅提供帮助台功能。  但这不是很好–我需要考虑在没有我支持的情况下如何使Tokyo Diamond系统正常工作。”

因为他是公司中唯一更多依赖云服务的IT专业人员,所以他知道他需要帮助。“当索尼网络通信告诉我SIOS AppKeeper提供了EC2实例的自动化操作和管理时,我决定在研究细节之前就使用它。如果我们有一种能自动恢复EC2服务的解决方案,那么我就不需要通过随时随地连接到VPN来解决每个问题。”

SIOS AppKeeper是一种云服务,可监视EC2实例并在检测到任何系统损害时自动重新启动服务。  当受监视的服务失败时,SIOS AppKeeper会自动恢复服务,而无需人工干预。

在AWS上运行的应用程序超过10个

Tokyo Diamond继续将其他应用程序迁移到AWS,到2018年6月,AWS上运行了10多个应用程序。“我认为AWS很有用:操作系统会在10分钟内启动,并且可以根据业务灵活地伸缩资源。即使资源不起作用,我们甚至可以删除它。  但是,处理大量数据的核心系统是使用数据中心而非AWS迁移到虚拟环境的。  Kokubo先生说:“我们同时使用AWS和虚拟数据中心来构建系统,具体取决于用途和需求。”

东京钻石公司目前监视员工使用AppKeeper所依赖的三个关键应用程序,包括其群件应用程序,销售人员自动化和他们的视频会议系统。  小久保先生说:“首先,我们对应用程序进行了分类,并决定从其中三个应用程序开始。如果我可以摆脱日常的精神负担,并在商务旅行中省心,则值得付费。”

SIOS AppKeeper使IT人员能够专注于其他任务

Kokubo先生说,他不再需要考虑AppKeeper监视的实例的操作和管理。  AppKeeper运行正常。  它腾出了更多时间专注于虚拟机及其其他AWS应用程序。 小久保先生认为AppKeeper为他带来了这些核心应用程序的安全感。

但是,他确实对SIOS技术开发团队有关于AppKeeper的要求。 “如果没有任何事件,我担心它是否正常运行,否则我可能会忘记如何登录。如果能经常通知我它正在运行,那就更好了。”  自动操作和管理是SIOS AppKeeper的优势;但是,如果什么也没有发生,它可能是不可见的。

话虽如此,小久保先生同意将他从不必对这些应用程序进行故障排除中解放出来是非常有益的。  现在,他可以花更多的时间在管理上,包括发展Diamond Tool的IT战略和规划,安全性以及BCP计划。

尽管今天Diamond Tool使用SIOS AppKeeper来管理和管理三个应用程序,但它计划很快将AppKeeper的覆盖范围扩展到其他应用程序。  这将使小久保先生能够在这些增值活动上花费大量时间。  “即使我们试图雇用系统人员,也很难做到,因为日本的劳动力正在缩减。  未来,我希望系统工具能够取代使用AI(人工智能)的人们,我希望SIOS AppKeeper也能开发类似AI的功能,以自动解决高影响力的故障。”运营管理的实现。

了解有关SIOS AppKeeper的更多信息

注册免费试用SIOS AppKeeper

 

 

Filed Under: 成功案例

  • « Previous Page
  • 1
  • 2

最近的帖子

  • 在 Nutanix 环境中选择高可用性解决方案的 10 个注意事项
  • 我的服务器是一次性的吗?高可用性软件如何融入云最佳实践
  • 灾难频发世界的数据恢复策略
  • DataKeeper 和棒球:灾难恢复的战略举措
  • SQL Server 停机风险预算

最热门的帖子

加入我们的邮件列表

Copyright © 2025 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in