域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)
利用信息系統(tǒng)處理業(yè)務(wù),如何保證在計(jì)劃和意外停機(jī)期間確保業(yè)務(wù)運(yùn)行不間斷?各種自然災(zāi)害和事件突發(fā),如何避免企業(yè)信息系統(tǒng)受到災(zāi)害影響?網(wǎng)絡(luò)災(zāi)難發(fā)生,如何減少數(shù)據(jù)的負(fù)面影響?本文邀請(qǐng)了Coremail論客運(yùn)維高可用方案解決專家,從方案設(shè)計(jì)到部署等方面,結(jié)合某企業(yè)郵件系統(tǒng)部署案例,介紹運(yùn)維高可用解決方案。
郵件系統(tǒng)作為基礎(chǔ)信息系統(tǒng),是企業(yè)員工進(jìn)行工作與交流溝通的重要渠道,企業(yè)依賴郵件系統(tǒng)作為通訊平臺(tái)以支持業(yè)務(wù)運(yùn)行。系統(tǒng)在運(yùn)行中不可避免會(huì)出現(xiàn)計(jì)算機(jī)硬件故障或網(wǎng)絡(luò)等原因,導(dǎo)致不可以訪問(wèn)郵件系統(tǒng),一旦出現(xiàn)這種情況,就需要管理員或郵件系統(tǒng)服務(wù)提供商去緊急處理。在處理過(guò)程中,員工是不能使用郵件系統(tǒng)。對(duì)于所有的企業(yè)來(lái)說(shuō),郵件系統(tǒng)服務(wù)的中斷,不僅影響到企業(yè)員工的正常工作與交流,還可能為企業(yè)帶來(lái)營(yíng)業(yè)損失,甚至影響到服務(wù)品質(zhì)和客戶的滿意度。
而Coremail運(yùn)維高可用解決方案則能很好的解決這一問(wèn)題。在介紹搭建運(yùn)維高可用方案之前,先來(lái)科普一個(gè)最常用的衡量指標(biāo):
RTO:是指恢復(fù)時(shí)間點(diǎn)目標(biāo)(Recovery Time Object),即災(zāi)難發(fā)生后,從IT系統(tǒng)宕機(jī)導(dǎo)致業(yè)務(wù)停頓之刻開始,到IT系統(tǒng)恢復(fù)至可以支持各部門運(yùn)作,業(yè)務(wù)恢復(fù)運(yùn)營(yíng)之時(shí),此兩點(diǎn)之間的時(shí)間段。
RPO:是指恢復(fù)點(diǎn)目標(biāo)(Recovery Point Object),即災(zāi)難發(fā)生后,容災(zāi)系統(tǒng)能把數(shù)據(jù)恢復(fù)到災(zāi)難發(fā)生前時(shí)間點(diǎn)的數(shù)據(jù)。
而用戶的高可用要求越高,需要投入的硬件和軟件成本就會(huì)越高,如何選擇一個(gè)適合企業(yè)又經(jīng)濟(jì)實(shí)惠的高可用解決方案,則需要用戶在方案設(shè)計(jì)之初,提出具體的高可用要求。
本文選取了高可用目標(biāo)RTO為1小時(shí),RPO為15分鐘,并且實(shí)現(xiàn)同城兩個(gè)機(jī)房高可用的方案為例,從方案設(shè)計(jì)到部署執(zhí)行兩個(gè)方面闡述運(yùn)維高可用解決方案。
運(yùn)維高可用解決方案的設(shè)計(jì)是以郵件系統(tǒng)的架構(gòu)為基礎(chǔ),初步可分為五層,針對(duì)不同的分層,相對(duì)應(yīng)的設(shè)計(jì)了不同的解決方案:
1.接入層
該層主要包括DNS智能和負(fù)載均衡調(diào)優(yōu)等。同城雙活分為對(duì)稱雙活與非對(duì)稱雙活,區(qū)別在于兩側(cè)機(jī)房是否同等配置規(guī)模與投入生產(chǎn)。該方式影響接入層的設(shè)計(jì)與負(fù)載均衡。
如果非對(duì)稱雙活設(shè)計(jì),一般不考慮備機(jī)房數(shù)據(jù)中心的DNS的映射,直接將備機(jī)房業(yè)務(wù)SERVER與端口納入主機(jī)房F5 server_pool即可。
對(duì)稱雙活設(shè)計(jì),即兩側(cè)生產(chǎn)規(guī)模高度一致,要完全負(fù)載業(yè)務(wù)峰值壓力。該設(shè)計(jì)可以采用與生產(chǎn)機(jī)房一致的F5負(fù)載均衡設(shè)備與DNS映射。
2.網(wǎng)絡(luò)層
該層主要包括兩機(jī)房間業(yè)務(wù)網(wǎng)絡(luò)打通和數(shù)據(jù)庫(kù)層網(wǎng)絡(luò)打通等。為更高更充分地利用與發(fā)揮同城高可用的架構(gòu)優(yōu)勢(shì),保障生產(chǎn)環(huán)境故障時(shí)的順利切換與承載,同城備機(jī)房采用與生產(chǎn)機(jī)房同等架構(gòu)的網(wǎng)絡(luò)架構(gòu)與 SAN 網(wǎng)絡(luò)架構(gòu)。
網(wǎng)絡(luò)交換機(jī)與SAN 交換機(jī)雙節(jié)點(diǎn)互做冗余。硬件要求網(wǎng)絡(luò)設(shè)備特別是數(shù)據(jù)庫(kù)心跳設(shè)備、SAN 交換機(jī)設(shè)備盡量同廠家同型號(hào),微碼版本保持一致。
3.應(yīng)用層
該層主要包括應(yīng)用服務(wù)器軟硬件部署等。由于應(yīng)用業(yè)務(wù)數(shù)據(jù)傳遞的復(fù)雜性與關(guān)聯(lián)性,為保障應(yīng)用高可用的順利實(shí)現(xiàn),在應(yīng)用雙活改造過(guò)程中,優(yōu)先保障基本業(yè)務(wù)的高可用。可按生產(chǎn)環(huán)境的應(yīng)用系統(tǒng)架構(gòu)配置在備機(jī)房進(jìn)行部署。
后續(xù)根據(jù)業(yè)務(wù)應(yīng)用的需求擴(kuò)展,可以在備機(jī)房進(jìn)行單邊部署配置,降低主生產(chǎn)環(huán)境的業(yè)務(wù)壓力與負(fù)載。其它單機(jī)部署服務(wù)器參仿生產(chǎn)規(guī)模配置進(jìn)行部署設(shè)計(jì)。
使用負(fù)載均衡+智能DNS 技術(shù)實(shí)現(xiàn)應(yīng)用層在數(shù)據(jù)中心之間的并行運(yùn)行,可以提高當(dāng)前系統(tǒng)的高可用性。
4.存儲(chǔ)層
該層主要包括存儲(chǔ)層集成部署等。郵件,用戶數(shù)據(jù)均使用分布式存儲(chǔ),通過(guò)Coremail多活實(shí)時(shí)將數(shù)據(jù)同步到兩側(cè)。
5.數(shù)據(jù)庫(kù)層
該層主要包括數(shù)據(jù)庫(kù)部署等。采用數(shù)據(jù)庫(kù)雙主架構(gòu)。正常情況下,各后端服務(wù)器會(huì)根據(jù)配置,分別訪問(wèn)對(duì)應(yīng)的中心數(shù)據(jù)庫(kù)服務(wù)器。
當(dāng)數(shù)據(jù)庫(kù)中的其中一個(gè)點(diǎn)宕機(jī)時(shí),存儲(chǔ)層訪問(wèn)策略或者數(shù)據(jù)庫(kù)雙主配置的故障轉(zhuǎn)移策略,會(huì)自動(dòng)將正常訪問(wèn)轉(zhuǎn)移至正常數(shù)據(jù)庫(kù)節(jié)點(diǎn)上。
在方案設(shè)計(jì)完成后,接下來(lái)的重點(diǎn)就是部署,如何以經(jīng)濟(jì)高效的方式完成部署是本次案例的關(guān)鍵。圖1則是本次案例的同城雙活部署架構(gòu)圖。
從圖1可以看出,兩個(gè)機(jī)房的數(shù)據(jù)庫(kù)使用物理數(shù)據(jù)庫(kù)復(fù)制軟件實(shí)現(xiàn)了數(shù)據(jù)的同步,兩中心數(shù)據(jù)庫(kù)形成雙主,機(jī)房之間通過(guò)綜合數(shù)據(jù)網(wǎng)提供基礎(chǔ)鏈路承載和互聯(lián)互通。
并且兩個(gè)機(jī)房應(yīng)用服務(wù)器利用F5負(fù)載均衡技術(shù)實(shí)現(xiàn)了雙活,存儲(chǔ)服務(wù)器使用分布式存儲(chǔ)數(shù)據(jù),每臺(tái)存儲(chǔ)服務(wù)器既是計(jì)算節(jié)點(diǎn)也是存儲(chǔ)節(jié)點(diǎn)。
兩個(gè)機(jī)房之間的SAN交換機(jī),利用廣域I/O加速技術(shù)和ISL技術(shù)實(shí)現(xiàn)兩個(gè)機(jī)房交換機(jī)之間的各自互聯(lián)。
當(dāng)然,每一個(gè)企業(yè)都存在不同的設(shè)計(jì)需求,Coremail論客運(yùn)維高可用方案解決專家建議,在方案進(jìn)行部署時(shí)用戶需要依據(jù)用戶自身的具體情況進(jìn)行執(zhí)行,才可達(dá)到最佳執(zhí)行效果。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!