SIOS SANless clusters

SIOS SANless clusters High-availability Machine Learning monitoring

  • Home
  • 產品
    • SIOS DataKeeper for Windows
    • SIOS Protection Suite for Linux
  • 新闻与活动
  • 伺服器集群简单化
  • 成功案例
    • 台灣成功案例
  • 聯繫我們
  • English
  • 中文 (中国)
  • 中文 (台灣)
  • 한국어
  • Bahasa Indonesia
  • ไทย

擴展您的高可用性指標

20 9 月, 2020 by Jason Aw Leave a Comment

擴展您的高可用性指標

擴展您的高可用性指標

在技術領域,我們喜歡數據。我們喜歡有關數據的數據以及我們工具可以帶來的所有指標和度量。我們圍繞分析技術創建了行業,這些產品可以捕獲數千個已連接設備的每個細節。我們喜歡指標和措施。在更高可用性空間中的許多情況下,我們喜歡高可用性指標,這些指標告訴我們系統從故障中恢復的速度。我們計算並跟踪檢測和修復之間的時間,我們著迷於了解和衡量在災難,系統故障或磁盤崩潰中會丟失多少事務數據。

具有諷刺意味的是,在高可用性和災難恢復(HA / DR)系統中,有些指標沒有引起足夠的重視。

以下是管理環境時應注意的其他八個高可用性指標:

1。  安全警報

可用性不僅涉及應用程序監視和恢復。  公開可用的系統總是受到攻擊。  如果您不監視安全警報和警告,則您的應用程序可能會完美運行,而您的知識產權卻可以完美無缺地被轉移。

2。空閒連接

空閒的連接聽起來無害,但它們幾乎和南部草坪上的綠葉葛根一樣無害。  空閒連接會佔用資源,並有可能填滿數據庫池,擁塞網絡和窒息性能。  此外,空閒連接可能表明應用程序層或數據庫配置存在問題。

3。長期運行的查詢,命令或作業

這不僅適用於數據庫查詢或作業,還適用於命令和備份。  長時間運行的查詢,命令和作業可能表明系統運行狀況不佳,磁盤速度降低,CPU或其他資源爭用,或者係統,應用程序兼容性或操作系統存在更深層次的問題。

4。磁盤IO

磁盤IO通常是指與磁盤活動有關的系統的輸入/輸出操作。測量磁盤I / O可以幫助確定瓶頸,給定工作負載的硬件配置不正確,磁盤大小不正確或磁盤佈局調整不當。  監視磁盤I / O可以幫助您告訴您長時間運行的查詢是否是由於不良的sql語法,不良的應用程序編碼或延遲和訪問問題引起的。

5,記憶

我們都考慮要使用多少內存,但是內存監視不只是衡量和查看可用內存還是已使用內存。  監視內存可幫助您調查瓶頸,洩漏,識別大小不正確的系統,了解負載,平均負載和峰值。  此外,了解內存密集型模式可以幫助您調整可用性套件,以避免錯誤的故障。

6。磁盤空間

作為客戶體驗副總裁,我曾經有過一次很不幸的經歷,要在清晨醒來緊急呼叫。  停電後,客戶面臨停機生產系統。  當他們嘗試重新啟動系統時,受保護的應用程序無法啟動。  快速檢查錯誤日誌後,很明顯根驅動器已100%充滿。  該應用程序無法寫入任何文件系統。  磁盤空間監視有多種形式和方法,將其作為度量標準可以防止不必要的問題和增加更多成本的最後一刻爭奪。。

7 錯誤和警報

日誌中的錯誤,警報和恢復消息是要考慮的另一個很好的指標。  您的可用性解決方案可能會使您的客戶保持在線狀態並感到滿意,但也可能掩蓋了需要盡快引起您注意的問題。  為FATAL,PANIC和關鍵ERROR消息添加日誌監視可以幫助您確定可用性解決方案經常從中恢復的問題,例如數據庫崩潰,應用程序緊急情況或核心轉儲,或者需要冷重啟的致命錯誤。

8。恢復編號

與監視錯誤和警報類似,恢復編號可以告訴您很多有關係統可用性的信息。  如果您平均每週要進行一次以上的應用程序恢復,則可能會遇到比正常的可用性保護更多的事情。  儘管恢復成功地重啟了您的應用程序或系統,但這些錯誤甚至真實的恢復中有太多是不健康的。

我們可以監控的HA / DR指標列表以及用於監控它們的工具正在飛速發展。  確保您和您的團隊考慮擴展當前的數據捕獲和分析,以包括那些可能構成最佳更高可用性系統的數據。

—客戶體驗副總裁Cassius Rhue

 

 

經SIOS許可轉載

Filed Under: 伺服器集群简单化

自動恢復在Amazon EC2上運行的Microsoft IIS應用程序

14 9 月, 2020 by Jason Aw Leave a Comment

在Amazon EC2上運行的Microsoft IIS應用程序的自動恢復

減少IIS停機時間的更好選擇

微軟的IIS(Internet信息服務)是當今使用的第四流行的Web服務器,僅次於Apache,Nginx和Cloudflare佔有7.8%的市場份額(來源W3Techs.com,8/12/20)。許多IIS客戶正在Amazon EC2上運行其IIS應用程序。

IIS是一種多功能,可擴展且高度可配置的Web服務器。IIS包括一些重要功能以確保應用程序正常運行,例如應用程序池和遠程管理功能,以允許管理員使用PowerShell遠程管理IIS。

確定如何監視和管理IIS應用程序

在管理和監視IIS應用程序時,客戶有很多選擇。他們要么專注於提高IIS上運行的應用程序的性能,要么監視和解決任何故障。

Microsoft確實包含一些本機功能,以幫助您優化和管理在IIS上運行的應用程序。如果您和您的團隊技術嫻熟,那麼您可以使用PowerShell或其他腳本語言來管理IIS應用程序池。這樣做可以使您在達到特定時間或請求閾值時自動回收池和虛擬內存。

但是,如果您的IIS應用程序出現故障,這對您沒有幫助。  要監視IIS服務器,您需要使用監視(“ APM”)工具,該工具可以提醒您任何故障並向您提供有關故障原因的詳細信息。  這些包括商業解決方案,例如SolarWinds,AppDynamics,Dynatrace,Datadog和New Relic。  如何決定它們取決於您的要求,其功能的範圍和復雜程度以及用戶界面和設置過程的簡單性。 APM解決方案可以在出現問題以及為什麼出現問題時提醒您,但是如果IIS服務器出現故障,它們不能總是幫助您恢復正常運行。

減少IIS停機時間的更好選擇

如果您正在尋找一種解決方案,該解決方案不僅可以監視在Amazon EC2上運行的IIS服務器,而且還可以消除停機時間,那麼我們建議您查看SIOS AppKeeper監視解決方案。如果應用程序遇到服務中斷和停機,AppKeeper會持續監視並自動恢復應用程序,例如在IIS上運行的應用程序。

讓我們看看AppKeeper EC2監視解決方案如何幫助減少IIS停機時間:

  • AppKeeper監視您的EC2服務和實例。安裝和配置AppKeeper(僅需大約10分鐘)後,您可以指定應監視的Amazon EC2實例和服務,以及在遇到系統故障時應採取的措施。
  • 如果您的IIS Web服務器檢測到任何系統故障,AppKeeper會提醒您。  您會通過電子郵件或SMS收到警報,並且可以查看失敗事件的詳細信息以及已採取的措施。

  • 在檢測到系統故障後,AppKeeper會啟動自動重啟服務並在必要時重啟實例。您不再需要響應任何警報並解決重新啟動之前發生的情況。AppKeeper會自動為您執行此操作。

通過不僅僅管理IIS服務器性能或監視自動修復,AppKeeper消除了停機時間,並提供了您應得的安心。

如今,數百家公司依靠AppKeeper來保持其云環境正常運行。我們邀請您觀看下面的視頻,了解安裝和使用AppKeeper多麼容易。

視頻:安裝AppKeeper並從AWS EC2故障演示中恢復

如果您喜歡自己所看到的內容,請隨時註冊AppKeeper的14天免費試用版。

經SIOS許可轉載

Filed Under: 伺服器集群简单化

如何在Linux環境中為SQL Server提供高可用性

10 9 月, 2020 by Jason Aw Leave a Comment

如何在Linux環境中為SQL Server提供高可用性

如何在Linux環境中為SQL Server提供高可用性

如果您的組織在Linux上運行關鍵業務的Microsoft SQL Server,那麼您的IT團隊無疑會知道持續保持高可用性,性能和安全性是多麼困難。特別困難的是如何通過健壯的複制和自動故障轉移來確保高可用性。使用開源軟件和易於配置的HA SANless群集解決方案可以提供一種更簡單的維護方法,而不會犧牲組織所需的安全性和性能。

Linux的有限高可用性選項

大多數Linux發行版為IT部門提供了兩個次等的高可用性選擇:要么為SQL Server Enterprise Edition支付更多費用以實施“始終在線”可用性組,要么努力使復雜的“自己動手做”的HA Linux配置正常工作-這可能是異常的很難做到。

使用企業版的問題在於,它破壞了在商品硬件上使用開源操作系統的節省成本的策略。對於數量有限的小型SQL Server應用程序,可能有必要證明額外費用的合理性。但是對於許多數據庫應用程序來說,它太昂貴了,無法為Linux提供通用的HA。

使用開源軟件(例如Pacemaker和Corosync或SUSE Linux Enterprise High Availability Extension),可以跨Linux環境中運行的所有應用程序提供HA。但是要使整個軟件堆棧按需工作,需要為每個應用程序創建(和測試)自定義腳本,並且即使對所使用的任何軟件或硬件進行了很小的更改,這些腳本通常也需要重新測試和更新。SQL Server Standard Edition和Linux不支持的與可用性相關的功能會使這項工作更具挑戰性。

在Linux中尋找SQL Server的替代高可用性解決方案

為了使HA具有成本效益並且易於實施,您可能需要考慮兩種不同的通用方法。

一種是使用基於存儲的系統,該系統通過在冗餘且有彈性的存儲區域網絡(SAN)中復制數據來保護數據。對於主機操作系統而言,這種方法是不可知的,但是它要求從單個供應商處購買整個SAN基礎架構,並依靠單獨的故障轉移規定來提供高可用性。

另一種方法是基於主機的,包括在Linux服務器實例之間創建與存儲無關的SANless群集。作為HA覆蓋,這些群集能夠在私有,公共和混合雲中跨LAN和WAN運行。該覆蓋圖也與應用程序無關,使組織可以在所有應用程序中使用一個通用的HA解決方案。儘管這種方法確實消耗了主機資源,但是它們相對便宜並且在Linux環境中易於擴展。

大多數HA SANless群集選件提供了實時塊級數據複製,連續應用程序監視以及可配置的故障轉移/故障回复恢復策略的組合,以保護所有關鍵業務應用程序,包括那些使用標準版中始終啟用故障轉移群集實例的應用程序SQL Server。

SIOS Technology Corp.為Linux提供了更強大的HA SANless集群解決方案,這些解決方案具有高級功能,旨在使IT人員擺脫支持和優化計算基礎架構的複雜性和日常挑戰。具有LifeKeeper的SIOS Protection Suite解決方案提供:

  • 持續監控整個Linux應用程序堆棧
  • 借助其應用程序恢復工具包(ARK)進行全面的應用程序保護,可對複雜的應用程序和數據庫進行快速,安全的恢復或故障轉移
  • 嚮導驅動的Linux群集設置
  • 配置靈活性,例如使用傳統的共享存儲群集或軟件在無SAN群集配置中同步本地存儲

例如,無SAN群集可以處理兩個並發故障。在LAN和WAN以及私有,公共和混合雲中,基本操作是相同的。

在典型的兩節點群集服務器中,#1最初是將數據複製到服務器#的主服務器。它遇到問題,自動觸發故障轉移到服務器#2,該服務器現已成為主要服務器。

在這種情況下,IT部門可能會開始診斷和修復導致#1服務器故障的任何問題。固定後,它可以接管主要服務器或服務器#2繼續以這種能力將數據複製到服務器#1。

使用大多數HA SANless群集配置,故障轉移是自動的,並且故障轉移和故障回复都可以通過基於瀏覽器的控制台進行控制。

有關SIOS LifeKeeper和Protection Suite解決方案的更多信息,請訪問用於群集服務器環境的SIOS SAN和SANless高可用性群集。

經SIOS許可轉載

Filed Under: 伺服器集群简单化

如何為SIOS群集軟件激活許可證

6 9 月, 2020 by Jason Aw Leave a Comment

如何為SIOS群集軟件激活許可證

如何為SIOS群集軟件激活許可證

這個簡短的視頻是由SIOS支持團隊設計的一系列應用程序可用性“如何做”教程的第一部分。它逐步介紹了開始使用SIOS Protection Suite或SIOS DataKeeper軟件所需的簡單步驟。  在SIOS文檔庫中了解如何訪問各種支持資源。

如何為SIOS群集軟件激活許可證

經SIOS許可轉載

Filed Under: 伺服器集群简单化

如果我們消除了Apache停機時間該怎麼辦?

30 8 月, 2020 by Jason Aw Leave a Comment

 

通過SIOS AppKeeper Monitoring消除Apache Web服務器的停機時間

通過SIOS AppKeeper Monitoring消除* Apache Web服務器停機

如今,Apache Web服務器是Internet上最受歡迎的Web服務器。  公司正在使用Amazon AWS,Microsoft Azure和Google Cloud Platform等雲平台部署基於Apache構建的關鍵任務,面向客戶的應用程序。  因此,您可以打賭他們正在投入大量時間和金錢來監視那些應用程序並試圖減少停機時間。但是,如果我們告訴您,當Apache Web服務器停機時,可以通過自動監視和重新啟動應用程序來消除手動干預的需要怎麼辦?

在探討如何做到這一點之前,讓我們先回顧一下,看看公司在監視和管理其Apache Web服務器以及這些關鍵應用程序方面的選擇。

如何監視和保護Apache Web服務器免受不必要的停機

任何使用Apache Web服務器部署應用程序的人都在考慮監視其Web服務器本身的運行狀況,或者將該任務外包給第三方。

在監視運行在Amazon Web Services上的雲應用程序時,一種流行的選擇是使用Amazon CloudWatch。  一些公司甚至通過開發腳本或使用AWS Lambda創建某種程度的自動化來擴展CloudWatch的功能。  但是,使用自定義指標正確配置Amazon CloudWatch並設置AWS Lambda需要一定數量的技術專長,而這可能超出了許多公司。  然後,隨著應用程序的發展,維護任何腳本都需要付出成本和精力。

另一個選擇是從諸如New Relics,Dynatrace,DataDog或LogicMonitor等供應商那裡投資全面的應用程序性能監視(“ APM”)解決方案。如果您要監視的不僅僅是AWS環境,這些方法可能非常合適。APM解決方案非常可配置,可以根據發生的情況為您提供大量數據。

但是,您減少了停機時間嗎?可能不是。  您所做的一切都花在了一個系統上,該系統將在Apache Web服務器出現故障時立即提醒您,並在嘗試重新運行時使您的數據超載(或“警報風暴”)。

一些公司已決定將監視和管理其應用程序的責任外包給受信任的第三方(通常是“託管服務提供商”或MSP)。作為基本月費的回報,MSP監視應用程序並提供一組核心服務,通常受服務水平協議的約束。收到警報後,他們將進行調查。在某些情況下,這些調查可能需要(昂貴)升級。如果應用程序出現故障,則MSP將控制並重新啟動服務或在可能的情況下重新啟動實例。  但是這些補救措施通常是額外的費用。

一定有更好的方法。

使用SIOS AppKeeper進行自動監視和重新啟動如何消除Apache Webserver的停機時間

根據我們的客戶經驗,只有三個EC2實例的普通公司每月至少要經歷一次停機。  “該站點已關閉!放下一切。找出需要做什麼!”您需要做的是減少對這些不必要的消防演習的需求。

SIOS AppKeeper是一項SaaS服務,易於安裝和配置並監視Amazon EC2上運行的任何服務和應用程序,例如Apache httpd服務。  當檢測到異常時,AppKeeper會自動重新啟動服務,如果不起作用,它將重新啟動整個實例。無需再通讀日誌以查明失敗的原因,或升級到開發人員以重新啟動服務。還是昂貴的外包費用。  AppKeeper提供“設置並忘記”功能,以便您消除停機時間。

如今,數百家公司依靠AppKeeper來保持其云環境運行。我們邀請您觀看下面的視頻,以演示AppKeeper如何保護Apache Web服務器。  如果您喜歡自己所看到的內容,請隨時註冊AppKeeper的14天免費試用版。

如果我們消除了Apache停機時間該怎麼辦

*基於客戶數據,AppKeeper解決了85%的應用程序服務故障。因此,十分之九的AppKeeper會發送一封電子郵件,通知客戶檢測到停機時間並且服務已重新啟動或實例自動重新啟動。  這比手動重新啟動所有文件之前恐慌和挖掘日誌文件好嗎?

請參閱相關文章:為什麼AWS EC2應用程序監控如此困難?

 

經SIOS許可轉載

Filed Under: 伺服器集群简单化

  • « Previous Page
  • 1
  • …
  • 58
  • 59
  • 60
  • 61
  • 62
  • …
  • 98
  • Next Page »

最近的帖子

  • 在 Nutanix 環境中選擇高可用性解決方案的 10 個注意事項
  • 我的伺服器是一次性的嗎?高可用性軟體如何適應雲端最佳實踐
  • 災難頻傳世界的資料復原策略
  • DataKeeper 與棒球:災難復原的策略性舉措
  • SQL Server 停機風險預算

最熱門的帖子

加入我們的郵件列表

Copyright © 2025 · Enterprise Pro Theme on Genesis Framework · WordPress · Log in