三副本vs雙重RAID
時(shí)間:2022-04-13 20:27:02 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-13 20:27:02 來源:行業(yè)動(dòng)態(tài)
:
超融合的核心在于分布式存儲(chǔ),而對(duì)存儲(chǔ)最基本、最首要的要求,就是穩(wěn)定性與數(shù)據(jù)安全性。
以Ceph為代表的三副本分布式存儲(chǔ),采用無中心分布式元數(shù)據(jù)管理的CRUSH算法,將每個(gè)數(shù)據(jù)塊的三個(gè)副本(一主兩從)隨機(jī)保存在三個(gè)存儲(chǔ)節(jié)點(diǎn)上。當(dāng)某個(gè)硬盤損壞時(shí),CRUSH算法可以自動(dòng)再平衡(re-balance)數(shù)據(jù),以最快的速度確保每個(gè)數(shù)據(jù)塊都有三個(gè)副本。
上述三副本工作機(jī)制帶來以下幾個(gè)問題:
- 每次數(shù)據(jù)寫操作需要寫到三個(gè)不同的存儲(chǔ)節(jié)點(diǎn),導(dǎo)致跨節(jié)點(diǎn)網(wǎng)絡(luò)開銷大,以及較大遲延,拉低系統(tǒng)IO整體性能
- 在數(shù)據(jù)再平衡過程中,容易導(dǎo)致重建風(fēng)暴,導(dǎo)致性能下降25%-75%,甚至產(chǎn)生OSD flapping等不穩(wěn)定現(xiàn)象
- 三副本最大可容忍2個(gè)機(jī)械硬盤同時(shí)損壞,當(dāng)系統(tǒng)出現(xiàn)第3個(gè)硬盤故障時(shí),極有可能導(dǎo)致數(shù)據(jù)丟失、系統(tǒng)崩潰
為應(yīng)對(duì)三副本分布式存儲(chǔ)面臨的問題,道熵鐵力士超融合創(chuàng)造性提出了雙重RAID機(jī)制,既保留了Ceph無中心分布式元數(shù)據(jù)管理帶來的高擴(kuò)展性特征,又通過節(jié)點(diǎn)內(nèi)RAID解決了Ceph所面臨的穩(wěn)定性及數(shù)據(jù)安全性的缺陷。其基本原理是:每個(gè)存儲(chǔ)節(jié)點(diǎn)通過存儲(chǔ)虛擬化技術(shù),把節(jié)點(diǎn)上的所有磁盤構(gòu)成一個(gè)具有RAID功能的存儲(chǔ)池,在其上構(gòu)建多個(gè)虛擬卷vOSD,通過CRUSH分布式數(shù)據(jù)管理,產(chǎn)生跨節(jié)點(diǎn)兩副本。這種節(jié)點(diǎn)內(nèi)RAID與跨節(jié)點(diǎn)的網(wǎng)絡(luò)副本相結(jié)合的方式,構(gòu)成了對(duì)數(shù)據(jù)的兩重RAID保護(hù),因此簡稱為雙重RAID機(jī)制。
雙重RAID機(jī)制與三副本相比,具有以下優(yōu)勢:
- 每次數(shù)據(jù)寫操作僅需要寫到兩個(gè)不同的存儲(chǔ)節(jié)點(diǎn),節(jié)約跨節(jié)點(diǎn)網(wǎng)絡(luò)開銷1/3,可顯著降低寫延遲,提升系統(tǒng)IO性能
- 當(dāng)硬盤損壞時(shí),可通過本地(節(jié)點(diǎn)內(nèi))RAID功能對(duì)數(shù)據(jù)實(shí)現(xiàn)修復(fù),無需消耗寶貴的網(wǎng)絡(luò)資源,因此可消除網(wǎng)絡(luò)重建風(fēng)暴。在重建過程中,vOSD仍然保持健康狀態(tài),可避免OSD flapping等不穩(wěn)定現(xiàn)象
- 由于本地RAID的存在,每個(gè)節(jié)點(diǎn)最大可容忍一個(gè)或多個(gè)硬盤故障,仍然保證數(shù)據(jù)安全。隨著節(jié)點(diǎn)數(shù)增加,整個(gè)存儲(chǔ)系統(tǒng)可同時(shí)容忍的最大硬盤故障個(gè)數(shù)隨之增加。因此,其故障容錯(cuò)能力與數(shù)據(jù)安全能力,顯著優(yōu)于三副本機(jī)制