Hadoop和Spark正在變成傳統(tǒng)遺留技術(shù)
時間:2022-04-19 15:54:01 | 來源:行業(yè)動態(tài)
時間:2022-04-19 15:54:01 來源:行業(yè)動態(tài)
Hadoop在大數(shù)據(jù)分析領(lǐng)域發(fā)揮的作用正在逐漸消失。Hadoop市場的增長前景趨于平緩,這也成為Cloudera和Hortonworks在2018年合并的主要原因。
Hadoop的核心用例正在逐漸縮小到面向非結(jié)構(gòu)化數(shù)據(jù)的分布式文件系統(tǒng)、用于批量數(shù)據(jù)轉(zhuǎn)換的平臺、大數(shù)據(jù)治理存儲庫和可查詢的大數(shù)據(jù)存檔。
2019年,Hadoop將試圖把應(yīng)用范圍擴(kuò)展到在線分析處理、商業(yè)智能、數(shù)據(jù)倉庫以及其他開源項目覆蓋的領(lǐng)域。今年年底,很多企業(yè)大數(shù)據(jù)環(huán)境將開始逐步淘汰Hadoop,即使Hadoop重點瞄準(zhǔn)的數(shù)據(jù)湖,也更傾向于采用分布式對象存儲、流計算平臺和大規(guī)??蓴U(kuò)展的內(nèi)存集群。
即使作為Hadoop替代品問世的Apache Spark,在許多以TensorFlow為中心的AI環(huán)境中也開始變成一項遺留技術(shù)。這一趨勢通過數(shù)據(jù)提取/轉(zhuǎn)換/加載進(jìn)入到Spark的部署領(lǐng)域就可以看到,而且隨著Schema on Read架構(gòu)(將數(shù)據(jù)的處理推遲到從數(shù)據(jù)庫讀出后)的出現(xiàn),這種趨勢可能會有所放緩。
關(guān)鍵詞:傳統(tǒng),技術(shù),遺留