三、云平臺(tái)上穩(wěn)定性和持久內(nèi)存的易用性增強(qiáng)
時(shí)間:2022-04-11 01:24:01 | 來(lái)源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-11 01:24:01 來(lái)源:行業(yè)動(dòng)態(tài)
主機(jī)多平面故障檢測(cè)
當(dāng)計(jì)算集群發(fā)生大規(guī)模故障時(shí),計(jì)算資源急劇收縮,可能存在資源不足的情況,此時(shí)疏散可能給云平臺(tái)造成更大的傷害。另外,計(jì)算節(jié)點(diǎn)上云主機(jī)根據(jù)承載的業(yè)務(wù)不同,有的業(yè)務(wù)應(yīng)用實(shí)例價(jià)值高,有的就可能沒(méi)那么重要。
如何保障高價(jià)值的業(yè)務(wù)優(yōu)先恢復(fù)?
這就需要通過(guò)定義用戶業(yè)務(wù)實(shí)例的優(yōu)先級(jí),然后通過(guò)排隊(duì)、熔斷、限流、降級(jí)重試等策略保障用戶業(yè)務(wù)的可用性,從而保障云平臺(tái)業(yè)務(wù)的穩(wěn)定性。
PMEM設(shè)備虛擬機(jī)離線遷移實(shí)現(xiàn)原理
PMEM設(shè)備虛擬機(jī)離線遷移實(shí)現(xiàn)時(shí)序圖
浪潮云海技術(shù)團(tuán)隊(duì)和英特爾中國(guó)CESG ESS部門(mén)及英特爾中國(guó)OpenStack社區(qū)研發(fā)團(tuán)隊(duì)共同合作,對(duì)持久化內(nèi)存(PMEM)進(jìn)行了深入研究,完善并深度優(yōu)化PMEM設(shè)備虛擬機(jī)的相關(guān)功能,例如支持PMEM設(shè)備虛擬機(jī)離線遷移,支持將已有的PMEM數(shù)據(jù)的虛擬機(jī)遷移到目標(biāo)PMEM服務(wù)器節(jié)點(diǎn)上。
PMEM設(shè)備管理
為了更進(jìn)一步實(shí)現(xiàn)異構(gòu)加速器設(shè)備的管理,浪潮云海技術(shù)團(tuán)隊(duì)編寫(xiě)了PMEM設(shè)備的驅(qū)動(dòng)程序,并將其貢獻(xiàn)到OpenStack Cyborg社區(qū),以支持通過(guò)智能加速器設(shè)備管理項(xiàng)目統(tǒng)一管理PMEM設(shè)備,支持PMEM設(shè)備的自動(dòng)發(fā)現(xiàn)、自動(dòng)上報(bào)、Nova創(chuàng)建虛擬機(jī)智能調(diào)度,更好支持虛擬機(jī)在創(chuàng)建時(shí)請(qǐng)求PMEM設(shè)備。
關(guān)鍵詞:增強(qiáng),平臺(tái),穩(wěn)定