對(duì)于傳統(tǒng)的本地文件系統(tǒng),當(dāng)查找一個(gè)文件時(shí),先由元數(shù)據(jù)區(qū)找到索引,再定位到數(shù)據(jù)區(qū),存在深度目錄的時(shí)候,可能需要在兩種區(qū)域" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 行業(yè)動(dòng)態(tài) > 優(yōu)化的元數(shù)據(jù)索引服務(wù)

優(yōu)化的元數(shù)據(jù)索引服務(wù)

時(shí)間:2022-03-17 06:33:02 | 來源:行業(yè)動(dòng)態(tài)

時(shí)間:2022-03-17 06:33:02 來源:行業(yè)動(dòng)態(tài)

那么,為什么浪潮軟件定義存儲(chǔ)能很好地管理海量數(shù)據(jù)呢?下面我們以文件服務(wù)類型為例來進(jìn)行闡述說明。

對(duì)于傳統(tǒng)的本地文件系統(tǒng),當(dāng)查找一個(gè)文件時(shí),先由元數(shù)據(jù)區(qū)找到索引,再定位到數(shù)據(jù)區(qū),存在深度目錄的時(shí)候,可能需要在兩種區(qū)域做多次查詢和數(shù)據(jù)定向,最后才能定位到所需要的文件。對(duì)于這種低效率的模式,很多成熟的文件系統(tǒng)大多使用類B樹的方式來組織目錄,以避免線性方式查找目錄項(xiàng)來降低文件索引冗余度;此外還有多種技術(shù)(如HASH,元數(shù)據(jù)緩存,C-FFS等)在傳統(tǒng)架構(gòu)上都可以不同程度地給文件索引性能加速,但是在海量數(shù)據(jù)存儲(chǔ)場景下,以上所有努力都會(huì)失靈。

究其原因其實(shí)也很明確:存儲(chǔ)海量數(shù)據(jù)的時(shí)候,一定會(huì)有大量的元數(shù)據(jù)需要存儲(chǔ)。在傳統(tǒng)文件系統(tǒng)的軟件架構(gòu)(包括集中式NAS存儲(chǔ))中,元數(shù)據(jù)為集中式存儲(chǔ)方式,處理元數(shù)據(jù)的服務(wù)(控制器)也為集中式。由于元數(shù)據(jù)被存儲(chǔ)在了少量固定的磁盤上面,不能隨整體容量的增加而任意擴(kuò)展,使得這塊區(qū)域?qū)ν馓峁┑淖x寫性能因被固化而變得十分有限。與此同時(shí),數(shù)據(jù)文件在訪問IO頻繁的時(shí)候,元數(shù)據(jù)索引服務(wù)需要消耗大量CPU和內(nèi)存的資源,而本地文件系統(tǒng)所能依靠的只是本地操作系統(tǒng)上的資源,即使是NAS存儲(chǔ)一般也僅僅可以使用兩個(gè)控制器上的資源。但我們知道,當(dāng)數(shù)據(jù)量達(dá)到數(shù)PB級(jí)時(shí)對(duì)于IO性能的需求會(huì)高出很多,讀寫帶寬基本上需要在幾十GB以上。因此,傳統(tǒng)的集中式元數(shù)據(jù)部署架構(gòu)不管在軟件算法上如何優(yōu)化,面對(duì)海量數(shù)據(jù)也于事無補(bǔ)。

此時(shí),再讓我們來看看浪潮軟件定義存儲(chǔ)是如何應(yīng)對(duì)這一難題的:首先,浪潮軟件定義存儲(chǔ)系統(tǒng)具有良好的Scale-out擴(kuò)展性能:隨著物理節(jié)點(diǎn)的擴(kuò)展,性能、容量也隨之呈線性擴(kuò)展;其次,全局融合的分布式結(jié)構(gòu)設(shè)計(jì)使得擴(kuò)展過程中突破了傳統(tǒng)NAS元數(shù)據(jù)瓶頸制約。

浪潮軟件定義存儲(chǔ)之所以能做到這一點(diǎn),在于打破了傳統(tǒng)文件系統(tǒng)(也包括集中式NAS存儲(chǔ))的元數(shù)據(jù)集中式存儲(chǔ)和管理這一限制,對(duì)浪潮軟件定義存儲(chǔ)集群系統(tǒng)的目錄實(shí)行分而治之,讓集群中所有服務(wù)器來一起存儲(chǔ)和管理元數(shù)據(jù)及數(shù)據(jù),從而實(shí)現(xiàn)負(fù)荷分擔(dān)、負(fù)載均衡。目前其實(shí)現(xiàn)方式主要有三種,各類浪潮軟件定義存儲(chǔ)會(huì)根據(jù)自身交付的場景不同,選擇不同的方式:

第一種,靜態(tài)子樹分區(qū)。以目錄為單位,把各個(gè)目錄或子目錄手工分配給不同節(jié)點(diǎn)去存儲(chǔ),并指定不同的元數(shù)據(jù)服務(wù)節(jié)點(diǎn)/程序去管理。當(dāng)某個(gè)目錄出現(xiàn)訪問過熱的情況下,再由管理員手工進(jìn)行遷移。這種處理方式邏輯最為簡單,也容易實(shí)現(xiàn),但如果數(shù)據(jù)目錄需要頻繁擴(kuò)容,就需要管理員人為頻繁干預(yù)。老一點(diǎn)的網(wǎng)絡(luò)共享文件系統(tǒng)一般采用的是這種方式。

第二種,HASH分區(qū)。通過計(jì)算來分配數(shù)據(jù)、元數(shù)據(jù)存儲(chǔ)的位置。這種方式可以把數(shù)據(jù)和元數(shù)據(jù)自動(dòng)均勻地分布在各個(gè)節(jié)點(diǎn)上,但是突發(fā)性熱點(diǎn)區(qū)域的數(shù)據(jù)訪問可能造成整個(gè)系統(tǒng)內(nèi)部某些元數(shù)據(jù)服務(wù)節(jié)點(diǎn)資源吃緊,從而成為整個(gè)系統(tǒng)的性能瓶頸。這種方式在一些分布式文件系統(tǒng)里得到了應(yīng)用,并在IO均勻分布的業(yè)務(wù)環(huán)境中很適用,如Lustre分布式文件系統(tǒng)。

第三種,動(dòng)態(tài)子樹分區(qū)。大體結(jié)構(gòu)類似上面兩種方式,但它可以通過實(shí)時(shí)監(jiān)控和分析,把熱度數(shù)據(jù)單位動(dòng)態(tài)地調(diào)整到不同的元數(shù)據(jù)服務(wù)節(jié)點(diǎn),從而實(shí)現(xiàn)數(shù)據(jù)索引的動(dòng)態(tài)負(fù)載均衡。

關(guān)鍵詞:索引,服務(wù),數(shù)據(jù)

74
73
25
news

版權(quán)所有? 億企邦 1997-2022 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉