SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 產品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 伺服器集群简单化
  • 成功案例
    • 台灣成功案例
  • 聯繫我們
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

Archives for 7 月 2020

EC2監控最佳實踐:使用SIOS AppKeeper保護Amazon EC2上的NGINX Web服務器

14 7 月, 2020 by Jason Aw Leave a Comment

EC2監控最佳實踐:使用SIOS AppKeeper保護Amazon EC2上的NGINX Web服務器EC2監控最佳實踐:使用SIOS AppKeeper保護Amazon EC2上的NGINX Web服務器

NGINX是一個Web服務器,還可以充當負載平衡器,反向代理等。它們之間,NGINX和Apache一起提供了超過50%的網絡流量。  如今,許多公司正在使用Amazon Linux,Red Hat Linux和Ubuntu在Amazon EC2環境上運行其NGINX開源或NGINX Plus Web服務器。

每個人都同意,最佳做法是監視EC2上的NGINX之類的應用程序,并快速響應任何系統異常情況。  用戶期望其應用程序能夠快速訪問並保持正常運行時間。

在Amazon EC2上監視NGINX Web服務器的當前選擇

許多公司正在部署Amazon CloudWatch來監視其應用程序,甚至通過開發腳本或使用AWS Lambda來創建某種程度的自動化。  但是,使用自定義指標正確配置Amazon CloudWatch並設置Amazon Lambda需要一定數量的技術專長,而這可能是許多公司所無法提供的。  然後,隨著應用程序的發展,維護任何腳本都需要付出成本和精力。

另一種選擇是部署應用程序性能監視(APM)解決方案,例如New Relic,Dynatrace,Datadog或LogicMonitor中的一種。  APM解決方案很棒。  他們在監視您的所有系統以及查明發生的情況和原因方面做得非常好。  他們創建可以與您的開發團隊共享並由您的開發團隊解釋的日誌,以重新創建問題並確保不再發生。  但是事情是這樣的:APM解決方案提供了許多您必須分類的數據(將“信號與噪音分離''),並且它們在故障發生時無法恢復。  在減少NGINX Web服務器的停機時間時,APM工具只是解決方案的一部分。

但是有些公司沒有內部人員或工具來自己監控EC2環境。這就是為什麼他們選擇將任務外包給託管服務提供商的原因。  與MSP一起管理環境有一些非常實際的好處,例如,隨著環境的擴展而不必僱用更多的員工,或者不必對團隊進行新技術培訓。  MSP可以提高投資效率,因為它們可以將其投資分散到許多客戶。  但是有缺點。  在某些情況下,您可能會陷入高額的固定成本合同,並且如果遇到問題並且必須逐步解決這些問題,成本可能會上升。  而且,您將失去監視環境的團隊與負責構建和部署應用程序的團隊之間的連續性。

無論您是選擇投資APM解決方案還是將其外包給MSP,您都仍然需要考慮在發生故障時以及從故障停機時恢復NGINX Web服務器的速度。  我們想提出另一種選擇:使用SOIS AppKeeper進行自動修復。

SIOS AppKeeper:EC2上NGINX Web服務器的自動修復

我們的許多客戶都選擇使用SIOS AppKeeper來保護其NGINX Web服務器。  儘管他們可以選擇標準的應用程序性能監視(APM)解決方案或第三方監視解決方案,但他們選擇依靠AppKeeper來自動恢復服務或發生故障的整個EC2實例。  我們將看一下其中的一些原因,並與您分享一個簡短的視頻,展示AppKeeper如何與NGINX一起使用。

SIOS AppKeeper是一項SaaS服務,易於安裝和配置並監視在Amazon EC2上運行的任何應用程序,例如NGINX Web服務器及其“ nginx”,“緩存管理器”和“工作程序”服務。  當檢測到異常時,AppKeeper會自動重新啟動服務,如果該操作不起作用,它將重新啟動整個實例。  無需再仔細閱讀痛苦的日誌以查明失敗的原因,或升級到開發人員以重新啟動服務或昂貴的外包費用。  AppKeeper提供了“設置並忘記”功能,因此您可以放心知道NGINX Web服務器正在遵循EC2監視最佳實踐並且運行正常,或者如果遇到任何問題將很快重啟。

Wistia視頻縮略圖

如今,數百家公司依靠AppKeeper來保持其云環境正常運行。  我們邀請您觀看此快速視頻,以演示AppKeeper如何保護NGINX Web服務器。

如果您想親自嘗試SIOS AppKeeper,我們提供14天的免費試用期。  只需單擊此處進行註冊。

Filed Under: 伺服器集群简单化

什麼是Amazon CloudWatch?

12 7 月, 2020 by Jason Aw Leave a Comment

什麼是Amazon CloudWatch

 

什麼是Amazon CloudWatch?

您可以使用CloudWatch做什麼以及需要考慮的一些障礙

隨著AWS在雲市場中佔據主導地位,許多公司正在使用Amazon AWS將其本地系統遷移到雲中。  那麼,應該如何管理在AWS環境中運行的系統?

在此博客文章中,我們將介紹AWS提供的監視服務Amazon CloudWatch的功能,以及實現它的挑戰以及如何解決它們。

使用Amazon CloudWatch密切監視您的AWS環境

為了確保您擁有穩定的雲環境,快速檢測異常(“系統損害”)並及時做出響應非常重要。  對於任何遷移到雲的組織而言,監視已成為一項重要且必要的任務。  這與管理本地應用程序和基礎結構沒有什麼不同。那麼,您應該如何在AWS環境中進行監控?一種選擇是使用Amazon CloudWatch,它監視CPU,內存和磁盤使用情況,並在超過預定閾值時通知您。  另外,您可以設置自己的指標來監視各種項目,例如應用程序日誌。

關於Amazon CloudWatch的最好之處在於,它是AWS本身提供的一項服務。  它與Amazon EC2和其他AWS服務具有很高的親和力,因此它可以快速響應頻繁的功能擴展和規範更改,並可以輕鬆支持AWS Auto Scaling,後者會根據負載自動增加或減少資源。  Amazon CloudWatch可根據每種環境的獨特情況提供精確的監控。

Amazon CloudWatch實施挑戰

儘管Amazon CloudWatch非常適合擁有經驗豐富的雲工程師和DevOps團隊的組織,但一般用戶應該注意一些事項。

Amazon CloudWatch可有效監視組織的AWS環境,但它需要一定水平的技能和知識來配置和部署。  尤其是當您設置自己的指標,設置警報或考慮到Auto Scaling時,複雜性會增加。 例如,如果要設置監視,這很容易,但是如果要設置電子郵件,重新啟動,自動縮放等,則可能會遇到困難,具體取決於資源情況。

如果您要使用“發生錯誤時重新啟動服務器”之類的指示來自動化恢復過程,則必須首先使用AWS Lambda腳本創建恢復方案,該腳本提供了有關條件和要採取的措施的詳細說明。  您的團隊對AWS Lambda有多熟悉?

Amazon CloudWatch的主要優點是您可以密切監視您的環境,但是要做到這一點,您必須事先為每個系統正確設計要監視的項目以及何時監視閾值等。  這些設計任務可能會花費很多時間。  當然,您的關鍵任務系統需要以這種方式進行嚴密監視,但是這種詳細程度和復雜程度並不適合所有系統。對於某些網站,例如內部網站或WordPress服務器,您將希望最大程度地降低運營和人工成本。在這種情況下,我們建議您考慮使用一種更易於操作和管理的工具。

SIOS AppKeeper,用於監視在AWS上運行的操作系統和應用程序服務

對於非關鍵任務應用,我們建議使用SIOS Technology的SIOS AppKeeper。  AppKeeper易於安裝和配置,並可監視在EC2實例上運行的應用程序的服務(進程)。  當檢測到錯誤時,AppKeeper會自動重新啟動服務,並在必要時重新啟動實例。  即使是初次遷移到雲的用戶也可以設置AppKeeper來監視其EC2實例並自動恢復,而無需具備複雜的腳本編寫技能。

使用AppKeeper,無需選擇要監視的單個服務。您只需選擇要監視的EC2實例以及要自動執行的操作即可。  您始終可以更詳細地了解要監視哪些服務以及如何監視這些服務,但是AppKeeper的設計使其易於配置。  當檢測到錯誤或從中自動恢復錯誤時,會記錄並存儲故障日誌,以便以後可以調查故障原因。

使用AppKeeper進行AWS EC2監控

建議您不要根據Amazon SLA和恢復要求清點環境清單,而要使用SIOS AppKeeper監視您想減少運營開銷的系統和應用程序,而不是使用Amazon CloudWatch來密切監視AWS環境中的所有內容。

請繼續關注未來的博客文章,我們將更詳細地比較如何設置CloudWatch和AppKeeper以執行相同的功能。

了解有關SIOS AppKeeper的更多信息

註冊免費試用SIOS AppKeeper

 

Filed Under: 伺服器集群简单化

測試/質量保證系統是企業可用性的關鍵部分

8 7 月, 2020 by Jason Aw Leave a Comment

測試/質量保證系統是企業可用性的關鍵部分

測試/質量保證系統是企業可用性的關鍵部分

“我可以吻你,”這就是三十年前一個朋友向我衝來時對我脫口而出的意思。在前往我們地區最大的樂隊比賽之一的途中,她已將簧片放到薩克斯管上。我不知道它們是誰,但是當我看到一堆蘆葦在公交車上的座位上時,我把它們撿起來,帶他們去了暖身區。熱身三分鐘後,她的第一個簧片破裂了,當她伸手去拿空口袋進行替換時,她驚慌失措。當我找到我發現它們的管道時,她脫口而出:“我現在可以吻你。”

擔任SIOS Technology Corp.客戶體驗副總裁 在可用性頻譜的不同階段,我與許多企業客戶和合作夥伴一起工作感到非常獨特和獨特。有時,我有機會與最終客戶一起解決問題,緩解問題和進行改進。在其他時候,我們的團隊會與合作夥伴和客戶積極合作,以設計和實現企業可用性,以保護其係統免於停機。最近的一次客戶體驗使我想起了大約30年前發生的一件事情,當時我的朋友脫口而出:“我可以吻你。”

我和我的團隊正在打客戶電話。通話從平時的歡愉,介紹和對客戶企業環境的概述開始。通話30分鐘後,一切進展順利。他們的體系結構紮實,周到並且記錄良好。他們的團隊知識淵博,技術精湛,經驗豐富。但是隨後,客戶暗示,由於節省了成本,他們將不打算維護專用的測試/質量系統。我深吸了一口氣。  實際上,這更像是呼氣,就像是從腸子上沖來的空氣一樣。我準備做出回應,但在此之前,我的聲音就爆發了。  “停機的首要原因是缺乏流程,”合作夥伴代表架構師在與我們的電話中大聲喊道。經過短暫的開玩笑,客戶同意維護測試/ QA系統,我差點脫口而出:“我可以親你!”

在許多企業部署的前線(新系統,數據中心遷移和系統更新)中,我在支持和服務部門的團隊已經看到許多問題,這些問題可以通過利用測試系統/群集來解決。

測試/質量系統是避免停機的HA策略的重要組成部分。與維護企業部署相關的常見任務(例如補丁,更新和配置更改)存在風險。巨大的風險。

通常在生產中進行測試的風險包括幾個嚴重的潛在災難性問題: 

  • 數據損壞或無效
  • 受保護的數據洩漏
  • 錯誤的收入確認(取消的訂單等)
  • 重載系統
  • 對其他生產系統的意外副作用或影響
  • 錯誤率高,可觸發警報並呼叫人員
  • 偏斜的分析(流量漏斗,A / B測試結果等)
  • 充滿腳本和漫遊器活動的不正確流量日誌(a)

如果客戶嘗試在生產中進行風險較大的更改,則結果可能會非常有害。除了上面列出的那些故障之外,還有更多的停機時間風險,應用程序安裝損壞,以及在某些情況下不可逆轉的損壞。以客戶X(在製造業中知名的SAP Enterprise商店)為例。

在從信譽良好的站點上讀取緊急通知後,OS管理員迅速將其生產節點更新為可用的最新內核更新。在數小時內,生產節點開始了一系列未啟動的崩潰和內核崩潰。他急忙安裝了與他的配置不兼容的內核。現有應用程序軟件包,設備,文件系統和相關軟件包的組合。這導致生產中斷,並向多個供應商幾次高優先級升級。

將補丁程序應用於測試/ QA或沙箱系統時,可以管理和驗證補丁程序和關鍵修訂,以減少生產力損失和計劃外停機。在類似生產的環境中測試應用程序使您能夠發現無法預料的問題,並在這些問題對您的操作產生不利影響之前進行糾正。產前設計和測試消除了代價高昂的業務中斷,改善了客戶體驗並保護了品牌。

使用測試質量檢查系統改善生產可用性和過程

這些是使用測試/質量檢查系統可以改善生產可用性和過程的基礎知識。 與生產環境類似的受控環境(必須與生產環境盡可能相似)必須具有以下功能:

  1. 測試內核更新和安全更新
  2. 驗證設置和配置調整
  3. 重現生產問題並測試軟件更新和補丁
  4. 驗證應用程序版本兼容性,並減少由於不兼容的更改而導致停機的風險
  5. 提供一個安全的空間來練習和修訂上線,維護,中斷和其他企業程序活動
  6. 在不影響企業客戶的情況下培訓新員工和團隊成員

如果您具有用於部署關鍵企業可用性軟件的測試/質量檢查環境,我現在可以親吻您。有了這種環境,您的團隊就可以“測試,驗證和驗證(2)”體系結構,業務需求,用戶場景,以及與與生產環境最相似的一個系統或一組系統的一般集成-您知道賺錢。當然,您仍然必須安排窗口來維護生產系統並在其上執行測試,但是要在這之間完成一個安全的緩衝步驟之後。

—客戶體驗副總裁Cassius Rhue

————-

參考文獻:

  1. https://opensource.com/article/19/5/dont-test-production已訪問2020年5月4日
  2. https://www.softwaretestingclass.com/system-testing-what-why-how/訪問時間:5/4/2020

Filed Under: 伺服器集群简单化

案例研究:AWS EC2監控解決方案使一家全球製造公司在遷移到雲中時免除了壓力。

7 7 月, 2020 by Jason Aw Leave a Comment

東京鑽石工具製造公司使用SIOS AppKeeper保護重要應用程序

東京鑽石工具製造公司成立於1932年。Co.,Ltd.生產用於切割,切片,拋光和鑽孔工藝的金剛石工具,涉及範圍廣泛,例如家用電器,半導體,電子設備,醫療保健和土木工程。儘管它是擁有80多年曆史的悠久公司,但Tokyo Diamond一直在積極引入新的IT工具。  該公司決定遷移到Amazon AWS和虛擬化,以提高業務改進的速度和效率。SIOS AppKeeper在提供所需的應用程序可用性保護方面發揮了重要作用。東京鑽石工具公司遷移到雲和AWS的原因之一是2011年的東日本大地震。  儘管總公司的服務器沒有受到直接損壞,但宮城縣仙台工廠的設備從機架上掉下來,造成了嚴重損壞。  東京鑽石認為需要更好的業務連續性計劃。  這是虛擬化其核心系統和使用雲環境的主要驅動力。

最初,該公司開始將相對較小的應用程序遷移到雲中。  “我們在2011年11月左右開始了遷移。  那時,我們別無選擇,只有AWS。”東京鑽石公司IT系統主管Takuji Kokubo先生說。  他們使用Sony Network Communications的“帶有AWS的託管雲”雲門戶自己管理運營。  Kokubo先生是一個自稱為“ One Man IT操作”的人,因此效率和自動化對於確保公司IT系統在日本以及新加坡和泰國的平穩運行非常重要。

Takuji Kokubo,東京鑽石工具
小久保先生
IT系統主管
東京鑽石工具製造廠 有限公司。

遷移到雲並確定對恢復解決方案的需求 

Diamond Tools實施了雲存儲服務Amazon EC2和Amazon S3。他們將其組件,銷售支持和視頻會議系統移至了AWS。  Diamond Tools的視頻會議系統對其日常運營至關重要。  “該工具在與海外地點進行的各種會議中非常頻繁地使用。  它每月使用約100次,並且從傳統的按需購買即用SaaS系統過渡到AWS,我們每年可以減少多達200萬日元的成本,” Kokubo先生說。  以前,包括其他公司在內的太多用戶同時連接到系統時,語音質量通常會下降。  然後,小久保先生將收到用戶的投訴,但問題無法輕鬆解決。  在AWS上構建公司特定的視頻會議系統可以穩定視頻和音頻質量並減少投訴。

小久保先生很快就遇到了他們的EC2環境問題。“ EC2作為基礎設施是穩定的;但是,有時服務失敗。我一直很擔心,有一天,在一次海外商務旅行中,我接到一個電話說用戶無法訪問該系統。  我必須一直隨身攜帶筆記本電腦,才能通過VPN連接到AWS並恢復失敗的服務。”小久保先生說。  顯然,此過程不可擴展。

在運行組件軟件應用程序的實例上經常發生服務故障。  公司的大多數員工每天早晨都使用組件軟件應用程序檢查日曆或預訂會議室。Kokubo先生說:“如果遇到問題,許多人會打電話給我,問發生了什麼事。” 他通過此經驗了解了自己親自維護系統的風險。

“十年前,一旦出現故障,系統就會停止運行,用戶已經習慣了。但是今天,一旦一切停止,我就會收到投訴。現在,系統有望一直處於運行狀態,就像水龍頭隨時流出的水一樣。  系統停機時間變得越來越無法接受,” Kokubo先生說。

小久保先生始終認為,當在EC2上運行的一項服務失敗時,他必須處理任何問題。  成為唯一能夠解決任何問題的人仍然是他的負擔。  小久保先生說:“作為一家IT商店,我傾向於認為我的價值在於僅提供幫助台功能。  但這不是很好–我需要考慮在沒有我支持的情況下如何使Tokyo Diamond系統正常工作。”

因為他是公司中唯一更多依賴雲服務的IT專業人員,所以他知道他需要幫助。“當索尼網絡通信告訴我SIOS AppKeeper提供了EC2實例的自動化操作和管理時,我決定在研究細節之前就使用它。如果我們有一種能自動恢復EC2服務的解決方案,那麼我就不需要通過隨時隨地連接到VPN來解決每個問題。”

SIOS AppKeeper是一種雲服務,可監視EC2實例並在檢測到任何系統損害時自動重新啟動服務。  當受監視的服務失敗時,SIOS AppKeeper會自動恢復服務,而無需人工干預。

在AWS上運行的應用程序超過10個

Tokyo Diamond繼續將其他應用程序遷移到AWS,到2018年6月,AWS上運行了10多個應用程序。“我認為AWS很有用:操作系統會在10分鐘內啟動,並且可以根據業務靈活地伸縮資源。即使資源不起作用,我們甚至可以刪除它。  但是,處理大量數據的核心系統是使用數據中心而非AWS遷移到虛擬環境的。  Kokubo先生說:“我們同時使用AWS和虛擬數據中心來構建系統,具體取決於用途和需求。”

東京鑽石公司目前監視員工使用AppKeeper所依賴的三個關鍵應用程序,包括其群件應用程序,銷售人員自動化和他們的視頻會議系統。  小久保先生說:“首先,我們對應用程序進行了分類,並決定從其中三個應用程序開始。如果我可以擺脫日常的精神負擔,並在商務旅行中省心,則值得付費。”

SIOS AppKeeper使IT人員能夠專注於其他任務

Kokubo先生說,他不再需要考慮AppKeeper監視的實例的操作和管理。  AppKeeper運行正常。  它騰出了更多時間專注於虛擬機及其其他AWS應用程序。 小久保先生認為AppKeeper為他帶來了這些核心應用程序的安全感。

但是,他確實對SIOS技術開發團隊有關於AppKeeper的要求。 “如果沒有任何事件,我擔心它是否正常運行,否則我可能會忘記如何登錄。如果能經常通知我它正在運行,那就更好了。”  自動操作和管理是SIOS AppKeeper的優勢;但是,如果什麼也沒有發生,它可能是不可見的。

話雖如此,小久保先生同意將他從不必對這些應用程序進行故障排除中解放出來是非常有益的。  現在,他可以花更多的時間在管理上,包括發展Diamond Tool的IT戰略和規劃,安全性以及BCP計劃。

儘管今天Diamond Tool使用SIOS AppKeeper來管理和管理三個應用程序,但它計劃很快將AppKeeper的覆蓋範圍擴展到其他應用程序。  這將使小久保先生能夠在這些增值活動上花費大量時間。  “即使我們試圖僱用系統人員,也很難做到,因為日本的勞動力正在縮減。  未來,我希望系統工具能夠取代使用AI(人工智能)的人們,我希望SIOS AppKeeper也能開發類似AI的功能,以自動解決高影響力的故障。”運營管理的實現。

了解有關SIOS AppKeeper的更多信息

註冊免費試用SIOS AppKeeper

 

 

Filed Under: 成功案例

  • « Previous Page
  • 1
  • 2

最近的帖子

  • 在 Nutanix 環境中選擇高可用性解決方案的 10 個注意事項
  • 我的伺服器是一次性的嗎?高可用性軟體如何適應雲端最佳實踐
  • 災難頻傳世界的資料復原策略
  • DataKeeper 與棒球:災難復原的策略性舉措
  • SQL Server 停機風險預算

最熱門的帖子

加入我們的郵件列表

Copyright © 2025 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in