China
Displaying present location in the site.
淺談高可用集群市場的發展趨勢
一、什么是高可用集群
高可用集群,英文原文為High Availability Cluster,簡稱HA Cluster,是指以減少服務中斷(如因服務器宕機等引起的服務中斷)時間為目的的服務器集群技術。簡單的說,集群(cluster)就是一組計算機,它們作為一個整體向用戶提供一組網絡資源。這些單個的計算機系統就是集群的節點(node)。
高可用集群的出現是為了使集群的整體服務盡可能可用,從而減少由計算機硬件和軟件易錯性所帶來的損失。它通過保護用戶的業務程序對外不間斷提供的服務,把因軟件/硬件/人為造成的故障對業務的影響降低到最小程度。如果某個節點失效,它的備援節點將在幾秒鐘的時間內接管它的職責。因此,對于用戶而言,集群永遠不會停機。高可用集群軟件的主要作用就是實現故障檢查和業務切換的自動化。
只有兩個節點的高可用集群又稱為雙機熱備,即使用兩臺服務器互相備份。當一臺服務器出現故障時,可由另一臺服務器承擔服務任務,從而在不需要人工干預的情況下,自動保證系統能持續對外提供服務。雙機熱備只是高可用集群的一種,高可用集群系統更可以支持兩個以上的節點,提供比雙機熱備更多、更高級的功能,更能滿足用戶不斷出現的需求變化。
二、高可用集群的發展方向
隨著企業信息系統的廣泛應用和深入發展,用戶的核心應用數量越來越多。在這種分布式多應用系統構架下,高可用多節點集群日益被用戶接受和廣泛使用,集群軟件也從Unix平臺的高端應用向基于Linux/Windows的平臺發展。伴隨著企業需求的改變,高可用集群軟件市場也表現出了新的發展方向:
1、應用系統多樣化
高可用集群的應用系統正朝多樣化趨勢發展,不僅局限于一般業務,還表現出一些特殊的應用模式。例如在制造業生產線系統中,通過將生產線計算機系統進行集群構筑,來提高系統整體的高可用性;又如在銀行等需要保障關鍵業務運行的行業,為實現系統宕機時間的最小化,甚至有采用容錯服務器為平臺,配合使用高可用軟件來構筑集群系統的案例,這種硬件+軟件的“超強陣容”,將系統可用性大大提高。
2、用途多樣化
除通常意義上對業務應用的保護外,集群軟件還將被用于越來越多的領域中。這里重點談談在遠程容災方面的應用。
企業為了業務的持續發展,必須規避在各種災難發生時的損失,因此,在遠程容災方面的需求不斷增加。通過集群技術實現的遠程容災方案,其最大的優勢是即使不具備特別的知識,只要對集群的配置有所了解,就能實現災備。此外,有些用戶還會有在較近距離內(如4、5公里左右)兼做大容量數據備份的需求;甚至如果網絡鏈路容許,還可將備份系統建立在異地數據中心進行托管。
3、運行形態多樣化
隨著CPU多核技術的發展,在處理能力提高的同時,利用虛擬化技術進行服務器整合的需求急增。據統計,在一些發達國家,目前VM市場正在以每年50%的速度增長。但是服務器虛擬化后,必須解決作為虛擬機載體的物理服務器發生單點故障的問題,而且由于虛擬服務器的故障往往與重大故障的發生緊密相關,就更要求系統必須具備高于一般服務器之上的可用性,使得高可用性對虛擬平臺的支持成為一種必然。
4、配置及可操作性方面的要求提高
隨著高可用集群技術的發展,高可用集群軟件的功能變得越來越多,帶給客戶更多實惠的同時,也帶來了配置及可操作性方面的復雜性。因此,簡便的配置及可操作性成為一種必然的需求。
三、用戶對高可用集群軟件的選擇
那么,在高可用集群朝多樣化、易操作維護等方向迅速發展的今天,面對市場上品種繁多的集群軟件產品,用戶應該怎樣把握自己的需求,做出正確的選擇呢?下面我們就從用戶實際需求和集群軟件的發展趨勢出發,談談如何選擇一款好的高可用軟件。
對于任何一款高可用集群產品,故障監視都是最核心的功能。監視資源種類的多少和監視層次的深淺,都成為評價一款集群軟件高可用性的重要指標。此外,在集群系統中,服務器之間還需要定期進行相互間的健康狀態檢查,稱之為心跳探測。心跳探測主要通過網絡來進行,包括私網心跳和作為備份方式的公網心跳探測。一款優秀的集群軟件應具有完備的心跳探測機制來避免在高負荷狀態下心跳超時所導致的誤切換。
從產品的適用平臺范圍和易用性上來說,擁有雄厚實力的集群軟件廠家往往能夠應對操作系統和硬件平臺快速發展的現狀,生產出適應更加廣泛多樣的軟硬件平臺或特殊環境的產品,還應讓用戶感到操作維護簡單易行。這都是用戶在采購時需要充分考慮的。
此外根據用戶的不同需求,還可以選擇支持遠程容災、虛擬服務器環境的高可用集群產品。
薈萃NEC技術精華的EXPRESSCLUSTER是一款專業的高可用集群軟件,可提供Windows和Linux平臺上完整的高可用性解決方案。EXPRESSCLUSTER擁有多年優秀的銷售業績和豐富的用戶實踐。根據Fuji Chimera Research Institute Inc. 2007年5月的統計,從2002年起,EXPRESSCLUSTER連續5年保持在日本的高可用軟件市場占有率第一,2006年再次以超過3200個系統的驕人業績穩居第一。全球超過10000個用戶的成功應用驗證,和在中國市場上的優異成績,讓EXPRESSCLUSTER成為最受用戶歡迎的高可用集群軟件之一。近期發布的最新版EXPRESSCLUSTER X系列產品,憑借NEC先進的技術優勢和多年豐富應用中總結的經驗,在故障偵測機制、適用平臺范圍、對遠程容災和虛擬化技術的支持、以及產品的維護操作性等方面,進行了全面系列的功能強化和改善。可以說面對用戶不斷涌現的新需求,NEC已經率先走在了市場前沿。
EXPRESSCLUSTER通過二十多種獨立的監視功能模塊提供全方位實時故障監視,監視對象涵蓋網絡、存儲、服務器、操作系統、應用程序的服務和進程等多種資源,還能監視EXPRESSCLUSTER自身服務狀態和待機服務器上的軟硬件資源的狀態。通過實時掌握整個集群系統的軟硬件資源的狀態,在系統發生故障時,就能準確診斷,并及時進行恢復處理。
除了對應用程序和服務進行常規級別的監視外(所謂常規級別的監視,即進程死活級別的監視),EXPRESSCLUSTER還提供了一系列監視選件產品,如Database Agent、Internet Server Agent、LAN Agent、File Server Agent等,這些監視選件產品定期對應用程序進行實際的訪問處理,探測應用的響應時間,返回結果等狀態,從而實現對應用程序和服務的僵死狀態(Stall)的監視,為用戶的關鍵業務系統提供了更深層次的保護。EXPRESSCLUSTER的監視選件可以支持數據庫服務器、互聯網服務器、文件服務器和應用服務器這幾個領域內的幾乎全部主流應用。此外,我們還支持用戶自行開發的應用監視模塊,提供更高的靈活性。
EXPRESSCLUSTER的網絡心跳通過系統的內核空間進行,不受系統負荷的影響。除了支持網絡心跳外,還可以通過COM口、存儲設備上的特定分區、以及Ping第三方的方式確認服務器的狀態。
在平臺支持方面,EXPRESSCLUSTER支持目前國內幾乎所有主流的Windows和Linux操作系統平臺,如Windows NT/2000/2003、RedHat、Novell SUSE Linux、RedFlag Linux、MiracleLinux、TurboLinux等。其硬件平臺兼容性好,支持IA32、X86_64、IA64、PPC64等硬件平臺,還可以支持容錯服務器、刀片服務器等特殊用途的硬件設備。由于支持平臺廣泛,EXPRESSCLUSTER可被用在多種環境下,例如上文提到的在制造業企業和金融企業的應用,都有實際的成功案例。
在操作維護性上,EXPRESSCLUSTER提供基于B/S結構的標準GUI用戶界面,采用樹狀層級顯示,集群架構清楚明了。支持遠程管理與操作,可在統一的界面下,用統一的方式同時管理多個不同平臺上的集群(Windows與Linux集群均可),還能在日志視圖中顯示系統的詳細信息,便于管理者及時發現集群的各種問題。在發生故障或進行切換時,系統可以自動向管理員發送故障通知郵件。通過外接的網絡報警燈設備,進行聲光方式的故障報警。極大方便了系統管理員。
EXPRESSCLUSTER還提供簡易集群配置工具,預先配置集群的各種參數,當創建集群時只需在構成集群的一臺服務器上讀入集群的配置信息文件,其他的服務器便可自動獲取集群信息并加入到該集群中。這樣,可以同時完成多臺服務器的設置,實現平滑導入,大大方便了系統管理員的操作。
EXPRESSCLUSTER支持虛擬環境。當虛擬計算機上運行的業務發生故障時,EXPRESSCLUSTER可以將其切換到另外一個虛擬計算機。如果虛擬機軟件本身發生故障,或者物理服務器發生故障,EXPRESSCLUSTER還能夠將虛擬計算機整個切換到另外一臺物理服務器上。除此之外,還可以利用虛擬計算機,對物理服務器進行備份。例如,如果希望利用一臺服務器,分別對運行不同操作系統的物理服務器進行備份,利用虛擬技術與EXPRESSCLUSTER相結合,將很容易就可以實現。
EXPRESSCLUSTER在應用方式上的另一個創舉就是將鏡像型集群應用于遠程容災解決方案中。通常的遠程容災解決方案,對網絡環境要求高,實施復雜,實現成本也比較昂貴。而利用EXPRESSCLUSTER鏡像型產品實現的遠程容災解決方案,不但能夠異地備份業務數據,還可以對軟硬件資源進行監視,在主節點發生故障時,自動在備份節點上恢復業務,將業務服務的停止時間控制在最小限度內。并且,EXPRESSCLUSTER還針對單鏈路低帶寬的網絡環境,對鏡像復制功能進行了改造和強化。以前的鏡像型集群,為了保證兩臺服務器上數據的一致性,需要兩臺服務器上的寫操作全部完成后,才可以進行下一步的處理。這樣的處理機制在遠程鏡像結構中,由于網絡延遲和帶寬的局限,會大大影響主服務器上業務的處理效率。而EXPRESSCLUSTER提供一種異步鏡像的方式,可以將本地磁盤的寫操作和遠程鏡像復制分開,回避遠程復制對業務處理效率的影響。
利用EXPRESSCLUSTER鏡像型產品實現遠程容災和數據備份,是一個性價比很高的低成本解決方案。特別是對小規模系統的容災需求,是一個非常好的選擇。
小結
從最簡單的雙機熱備到多節點的高可用集群系統,用戶對于可用性的需求在不斷變化。如今,NEC已經把EXPRESSCLUSTER呈現在您面前,選擇EXPRESSCLUSTER,您就擁有了一個持續穩定的高可用集群系統。