3 伸展集群(Stretched Cluster)雙活數(shù)據(jù)中心
時(shí)間:2022-03-06 15:28:01 | 來(lái)源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-03-06 15:28:01 來(lái)源:行業(yè)動(dòng)態(tài)
伸展集群(Stretched Cluster)將道熵統(tǒng)一存儲(chǔ)平臺(tái)(分布式存儲(chǔ)集群)從一個(gè)數(shù)據(jù)中心(站點(diǎn))擴(kuò)展到兩個(gè)數(shù)據(jù)中心(站點(diǎn)),以實(shí)現(xiàn)更高的可用性和容災(zāi)恢復(fù)。伸展集群通常部署在同一城市或園區(qū)之內(nèi),兩個(gè)數(shù)據(jù)中心之間的距離通常不超過(guò)100公里,且有專用的高速低延遲通信線路相連接。
用戶可以使用拉伸集群來(lái)實(shí)現(xiàn)站點(diǎn)維護(hù)計(jì)劃以及滿足容災(zāi)需求,因?yàn)橐粋€(gè)站點(diǎn)的維護(hù)或意外丟失,無(wú)論是通信故障、意外掉電、火災(zāi)還是其他災(zāi)害,不會(huì)影響集群的整體運(yùn)行。在拉伸集群配置中,兩個(gè)數(shù)據(jù)站點(diǎn)都是活動(dòng)站點(diǎn),同時(shí)提供存儲(chǔ)服務(wù)。如果其中一個(gè)站點(diǎn)發(fā)生故障,存儲(chǔ)服務(wù)將自動(dòng)切換到另一個(gè)站點(diǎn)。
每個(gè)伸展集群由兩個(gè)數(shù)據(jù)中心(站點(diǎn))和一個(gè)仲裁主機(jī)組成。仲裁主機(jī)通常是一臺(tái)1U或2U服務(wù)器,駐留在第三個(gè)地點(diǎn)。它只包含元數(shù)據(jù),不參與用戶數(shù)據(jù)存儲(chǔ)操作。一個(gè)最小的雙活伸展集群包含兩臺(tái)存儲(chǔ)服務(wù)器(每個(gè)站點(diǎn)各一臺(tái))和一臺(tái)仲裁主機(jī)。單個(gè)數(shù)據(jù)中心最大可支持512個(gè)節(jié)點(diǎn)。
兩個(gè)數(shù)據(jù)中心與仲裁主機(jī)形成3個(gè)獨(dú)立的故障域。當(dāng)任何一個(gè)站點(diǎn)出現(xiàn)服務(wù)中斷故障,另外一個(gè)站點(diǎn)與仲裁主機(jī)將自動(dòng)剔除故障站點(diǎn),繼續(xù)提供存儲(chǔ)服務(wù)。當(dāng)故障排除后,集群將新的數(shù)據(jù)自動(dòng)同步到曾出現(xiàn)故障的站點(diǎn)。
當(dāng)兩個(gè)站點(diǎn)之間的網(wǎng)絡(luò)連接丟失時(shí),則必須對(duì)站點(diǎn)的可用性做出選擇,仲裁主機(jī)起到了第三方見(jiàn)證和仲裁的作用。在這種情況下,仲裁主機(jī)通常會(huì)與其中一個(gè)站點(diǎn)形成一個(gè)集群,并屏蔽另一個(gè)站點(diǎn)。當(dāng)被屏蔽站點(diǎn)再次在線時(shí),數(shù)據(jù)會(huì)重新同步,以確保兩個(gè)站點(diǎn)都有所有數(shù)據(jù)的最新副本。
伸展集群使用兩個(gè)數(shù)據(jù)中心之間數(shù)據(jù)同步復(fù)制的策略來(lái)提供跨站點(diǎn)的冗余和故障保護(hù)。每個(gè)站點(diǎn)因此形成一個(gè)獨(dú)立的故障域。每個(gè)數(shù)據(jù)塊至少有兩個(gè)副本,確保每個(gè)故障域(數(shù)據(jù)中心)至少保存一個(gè)數(shù)據(jù)副本。每個(gè)站點(diǎn)由一個(gè)或多個(gè)存儲(chǔ)節(jié)點(diǎn)構(gòu)成,每個(gè)節(jié)點(diǎn)內(nèi)部還具有節(jié)點(diǎn)內(nèi)RAID數(shù)據(jù)保護(hù),比如RAID10、RAID50、或RAID60,稱為本地?cái)?shù)據(jù)保護(hù),當(dāng)硬盤(pán)出現(xiàn)故障時(shí),可通過(guò)節(jié)點(diǎn)內(nèi)的RAID功能實(shí)現(xiàn)數(shù)據(jù)本地恢復(fù),既不占用網(wǎng)絡(luò)帶寬,也不會(huì)引起站點(diǎn)之間數(shù)據(jù)遷移或同步。當(dāng)節(jié)點(diǎn)完全失效時(shí),節(jié)點(diǎn)上的數(shù)據(jù)可自動(dòng)遷移到本站點(diǎn)其余的節(jié)點(diǎn)上。當(dāng)某個(gè)站點(diǎn)增加節(jié)點(diǎn)時(shí),該站點(diǎn)上的數(shù)據(jù)可自動(dòng)遷移部分?jǐn)?shù)據(jù)到新的節(jié)點(diǎn),使得存儲(chǔ)空間的使用在站點(diǎn)內(nèi)更加均衡。
用戶也可以將一個(gè)站點(diǎn)指定為主站點(diǎn)。其他站點(diǎn)將成為輔助站點(diǎn)或備選站點(diǎn)。在無(wú)故障狀態(tài)下,存儲(chǔ)業(yè)務(wù)由主站點(diǎn)提供。只有在主站點(diǎn)不能提供服務(wù)的前提下,業(yè)務(wù)切換到備選站點(diǎn)。在大數(shù)據(jù)分析和AI訓(xùn)練及應(yīng)用中,帶有典型的反復(fù)讀取大量數(shù)據(jù)的特點(diǎn),可以選擇將主站點(diǎn)配置為高性能的全閃存(SSD固態(tài)硬盤(pán))站點(diǎn),輔助站點(diǎn)為混合型(由SSD和HDD構(gòu)成)站點(diǎn),以較低的成本獲得更高的性能。
伸展集群的數(shù)據(jù)中心網(wǎng)絡(luò)采用二層交換機(jī)堆疊技術(shù),即MC-LAG(Multi-Chassis Link Aggregation Group),以滿足接入層、匯聚層的二層跨設(shè)備冗余、以及L3核心交換機(jī)的跨設(shè)備冗余。每臺(tái)存儲(chǔ)服務(wù)器分別連接MC-LAG中的任意兩臺(tái)交換機(jī),任何網(wǎng)口或交換機(jī)出現(xiàn)網(wǎng)絡(luò)故障都不會(huì)導(dǎo)致業(yè)務(wù)中斷,具有極高的可靠性和故障包容能力。根據(jù)數(shù)據(jù)中心的規(guī)模大小,可以選擇是否僅使用匯聚交換機(jī),或使用更高性能的核心交換機(jī)。
基于伸展集群的雙活數(shù)據(jù)中心適用于兩個(gè)站點(diǎn)A、B間的 物理距離不超過(guò)100公里,數(shù)據(jù)網(wǎng)絡(luò)往返時(shí)延RTT(Round-Trip Time) 不超過(guò)5毫秒,網(wǎng)絡(luò)帶寬速度不小于10Gbps。在此前提下,雙活數(shù)據(jù)中心可實(shí)現(xiàn)RTO=0, RPO=0最高級(jí)別的災(zāi)難恢復(fù)能力。當(dāng)兩個(gè)數(shù)據(jù)中心的物理距離超過(guò)100公里以上,建議采用基于異步復(fù)制方法實(shí)現(xiàn)遠(yuǎn)程容災(zāi)與恢復(fù)功能。