什么是數(shù)據(jù)目錄?
時(shí)間:2022-03-08 04:09:01 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-03-08 04:09:01 來源:行業(yè)動(dòng)態(tài)
圖1
很多人還不清楚什么是數(shù)據(jù)目錄,我來打個(gè)比方,我們用書來比喻數(shù)據(jù)。大家都知道圖書館的圖書目錄,我們過去進(jìn)到圖書館借書,首先就要去查找圖書目錄。如果一個(gè)圖書館如圖1右下角那副照片那么亂的話,相信就連圖書管理員也無法找到想要的書吧?如果一個(gè)企業(yè)的數(shù)據(jù)庫管理得那么亂,那么就連數(shù)據(jù)庫管理員可能也無法找到數(shù)據(jù)了。如果一個(gè)圖書館如圖1右上角那樣的話,那說明這個(gè)圖書館的書,已經(jīng)分門別類擺放整齊了,就像一個(gè)企業(yè)的數(shù)據(jù),結(jié)構(gòu)化的和非結(jié)構(gòu)化的,都分別在數(shù)據(jù)庫里或大數(shù)據(jù)平臺(tái)上,放得整整齊齊了。但是,對于圖書館來說,其主要任務(wù)是為讀者服務(wù)的,書擺放得整齊,需要借書的讀者就能借到他要的書嗎?我們都知道,那是不夠的,因?yàn)槿鄙僖粋€(gè)圖書目錄,就是圖1左邊的小抽屜。那個(gè)小抽屜里放的是一張一張的書卡,書卡上寫了一些什么呢?往往有書的名字、書的簡介、書的作者、書的出版年份,還有書的類別,比如是物理類的還是化學(xué)類的;書的屬性,比如是工具書類的還是文藝書類的;書適合的年級,比如一年級還是三年級;最重要的是書的具體位置,它是在圖書館的哪一排的哪一層的哪一格里。有了這張書卡,我們就可以輕松地找到這本書并借到這本書了。我曾經(jīng)和一個(gè)大型企業(yè)的CIO聊天,這家企業(yè)20年前就建了數(shù)據(jù)倉庫,十年前又建了大數(shù)據(jù)平臺(tái)和數(shù)據(jù)湖,類似數(shù)據(jù)治理的項(xiàng)目都建設(shè)過好幾期了。我問CIO最近企業(yè)在IT方面開展什么項(xiàng)目呢?CIO回答,最近招進(jìn)了好幾個(gè)數(shù)據(jù)科學(xué)家,打算開展AI項(xiàng)目的建設(shè),但是遇到了困難。數(shù)據(jù)科學(xué)家們在工作中,要花70%以上的時(shí)間在尋找數(shù)據(jù),而不是AI 建模。CIO問,為什么我們過去的數(shù)據(jù)治理項(xiàng)目,幫不了這些數(shù)據(jù)科學(xué)家呢?我就告訴這個(gè)CIO, 你們過去的數(shù)據(jù)治理項(xiàng)目,都是面向IT用戶的,不是面向業(yè)務(wù)人員的。如果你真的要幫助數(shù)據(jù)科學(xué)家方便快捷地找到他們要的數(shù)據(jù),你就要建設(shè)真正的數(shù)據(jù)目錄。