Data Fabric 的最佳載體
時間:2022-03-03 19:48:01 | 來源:行業(yè)動態(tài)
時間:2022-03-03 19:48:01 來源:行業(yè)動態(tài)
基于開放的混合云平臺 OpenShift,IBM 將 Intelligent Data Fabric 融入到 Cloud Pak for Data 中,以容器化產(chǎn)品的方式快速向客戶交付??梢哉f,承載了 IBM 企業(yè)級 AI 能力的 Cloud Paks,是 IBM 混合云與 AI 戰(zhàn)略的一個重要支點(diǎn)。在 Cloud Pak for Data 4.0 版本中,整合了 AutoSQL、AutoCatalog、AutoPrivacy、AutoAI 能力,以及 WKC、Watson Knowledge Catalog 等數(shù)倉、數(shù)據(jù)治理和機(jī)器學(xué)習(xí)能力。通過在實驗室環(huán)境中與 Snowflake 的比較,Data Fabric 能夠把查詢的速度提高 8倍以上,成本降低一半。
不過,Data Fabric 并不是 IBM 獨(dú)有的概念,諸如 NetApp、informatica、Talend 等 IT 企業(yè)均推出了針對 Data Fabric 的解決方案,那為什么說 IBM Cloud Pak for Data 應(yīng)該是當(dāng)前業(yè)界應(yīng)對 Data Fabric 功能最完善的數(shù)據(jù)平臺之一呢?首先,其對于 Data Fabric 需要具備的四種能力有著較好的支持,包括數(shù)據(jù)之間的虛擬連接、企業(yè)數(shù)據(jù)目錄、自動化數(shù)據(jù)平臺、自動化安全策略,這也使得上述四大自動化能力之間有著更好的化學(xué)反應(yīng)。
其次,IBM 數(shù)十年來的技術(shù)積累給了 Cloud Pak for Data 更多的底氣,例如容器化的 DB2 云數(shù)倉、數(shù)據(jù)虛擬化技術(shù)的沉淀,以及結(jié)合了機(jī)器學(xué)習(xí)、知識圖譜等能力的 Watson Knowledge Catalog 等等,交付客戶上線之初就能確保在數(shù)據(jù)共享的過程中能符合類似 GDPR 的數(shù)據(jù)隱私保護(hù)要求。同時,IBM 作為一家老牌的專業(yè)數(shù)據(jù)集成的供應(yīng)商,數(shù)據(jù)復(fù)制和數(shù)據(jù)集成的自服務(wù)能力也在日趨完善。
許偉杰是 IBM 中國混合云與 AI 華東及華南大區(qū)的總經(jīng)理,加入 IBM 已有 15年的時間。作為一線的業(yè)務(wù)人員,他深知企業(yè)需求的變化和客戶對 IBM 產(chǎn)品的反饋。前段時間,我和上海某家著名的醫(yī)療大數(shù)據(jù)公司交流。面臨的一個問題是,醫(yī)院一方面不愿意把數(shù)據(jù)開放給某個大數(shù)據(jù)平臺,但另一方面,醫(yī)院又想分析數(shù)據(jù),而單個醫(yī)院的數(shù)據(jù)量又不夠。如果采用了 Data Fabric 架構(gòu),加上 IBM 的區(qū)塊鏈技術(shù),使用類似聯(lián)邦學(xué)習(xí)的概念,是不是就能讓數(shù)據(jù)的讀寫、分析,以及擁有的權(quán)限相互獨(dú)立?這樣就把問題解決了。許偉杰說。