03 王者歸來(lái)
時(shí)間:2022-04-19 14:42:01 | 來(lái)源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-19 14:42:01 來(lái)源:行業(yè)動(dòng)態(tài)
CDP,全稱Cloudera Data Platform,是Cloudera和Hortonworks合并后的統(tǒng)一產(chǎn)品線,做了諸多技術(shù)升級(jí),更重要的是其部署形態(tài)發(fā)生了根本性改變CDP是基于云的,而且是混合云。
有人戲稱,Cloudera終于迎來(lái)了Cloud Era。
并且,Cloudera還宣布2022年后停止對(duì)原來(lái)兩條老產(chǎn)品線的支持,全統(tǒng)一到CDP上。很顯然,這種大刀闊斧的革新,表明Cloudera孤注一擲想借CDP王者歸來(lái)。它說(shuō)CDP是一種新的數(shù)據(jù)方法,是世界上第一個(gè)企業(yè)數(shù)據(jù)云產(chǎn)品,對(duì)應(yīng)的市場(chǎng)規(guī)模高達(dá)260億美金,并將在三年后翻倍。
能行嗎?
我們一層一層來(lái)看。
技術(shù)上,首先被大家詬病已久的Mapreduce在Cloudera的產(chǎn)品里早有了很多替代品,比如Spark和Flink;其次,CDP整合了云存儲(chǔ),這意味著HDFS的爭(zhēng)議也能得到解決;最后,CDP在調(diào)度上對(duì)接了K8S,先不說(shuō)可能性很小,哪怕最后K8S完全替換了YARN,CDP也能做到幾乎不受影響。
所以技術(shù)層面,按照Cloudera CPO的說(shuō)法,這叫Hadoop已死,Hadoop萬(wàn)歲。Hadoop里幾十個(gè)項(xiàng)目,是一個(gè)生態(tài),甚至一種哲學(xué),早就超越了十幾年前Mapreduce的范疇,正波浪式的向前蓬勃發(fā)展。
商業(yè)上,Cloudera一方面在2019年7月宣布所有代碼全部開(kāi)源,向紅帽的商業(yè)模式靠攏。另一方面又在部署形態(tài)上做了大幅調(diào)整,改成了混合云。
這又可以分兩層來(lái)說(shuō)。
先說(shuō)第一層,為什么要學(xué)習(xí)紅帽。
實(shí)際上業(yè)界一直有一種說(shuō)法,那就是開(kāi)源軟件的商業(yè)公司里,真正稱得上成功的只有一家,那就是紅帽。紅帽自Linux起家,營(yíng)收一度高達(dá)30多億美金,而且長(zhǎng)期盈利,直到2019年以340億美金的天價(jià)賣給了IBM。
所以Cloudera學(xué)習(xí)紅帽的商業(yè)模式很容易理解,而且紅帽商業(yè)模式里的三個(gè)要點(diǎn),Cloudera也基本都能滿足。
- 深度參與開(kāi)源社區(qū)Cloudera有一百多位Apache committer,在大數(shù)據(jù)方面的技術(shù)實(shí)力無(wú)可爭(zhēng)議。
- 代碼全部開(kāi)源,社區(qū)版激進(jìn),企業(yè)版穩(wěn)定全部開(kāi)源是Cloudera發(fā)表的《我們對(duì)開(kāi)源的承諾》一文的主要內(nèi)容。
- 靠企業(yè)版訂閱產(chǎn)生營(yíng)收,并提供咨詢、支持等服務(wù)CDP,也包括CDH和HDP。
紅帽基于Linux,Linux和Hadoop都是基礎(chǔ)軟件。雖然層次不同,但按照紅帽CEO的說(shuō)法,他們的商業(yè)模式比較適合于復(fù)雜、流行、社區(qū)驅(qū)動(dòng)的基礎(chǔ)軟件上。而大家對(duì)Hadoop最大的指責(zé)就是太復(fù)雜,所以,沒(méi)準(zhǔn)這種復(fù)雜性恰好有其商業(yè)價(jià)值,畢竟太簡(jiǎn)單的也沒(méi)必要找個(gè)商業(yè)公司來(lái)兜底。
然而,學(xué)習(xí)紅帽是否就夠了呢?
紅帽成立于1993年,那會(huì)可沒(méi)有云計(jì)算的威脅。
這就說(shuō)到了商業(yè)上的第二層,也就是CDP所指的混合云。
云在吞噬一切,只不過(guò)這種吞噬是從互聯(lián)網(wǎng)創(chuàng)業(yè)的增量市場(chǎng)開(kāi)始的,但隨著網(wǎng)絡(luò)應(yīng)用的逐漸飽和,這部分市場(chǎng)越來(lái)越小,于是云巨頭不得不把眼光放到傳統(tǒng)IT的存量市場(chǎng)中去。但這些企業(yè)跟要么增長(zhǎng)要么死亡的互聯(lián)網(wǎng)創(chuàng)業(yè)公司不同,他們更關(guān)心穩(wěn)定性、更關(guān)心數(shù)據(jù)安全,他們有自己的機(jī)房,拒絕被云廠商鎖定。
于是混合云應(yīng)運(yùn)而生。
所謂混合云,就是搭建在自建機(jī)房和不同云廠商資源之上的云平臺(tái),這種情況下,不管是自建機(jī)房還是云廠商,提供的僅僅是底層計(jì)算資源,可以根據(jù)使用者的意愿隨便切換,就像水和電一樣,即插即用。
嗯,至少理論上是這樣。
但實(shí)際上混合云市場(chǎng)還處在混戰(zhàn)之中,參戰(zhàn)者至少有三類:一類是公共云廠商,如AWS的Outposts、Azure的Azure Stack和谷歌的Anthos等,他們的混合云往往為了線下資源,終點(diǎn)在云,不在混合;另一類是獨(dú)立混合云供應(yīng)商,如紅帽的Openshift,他們?cè)噲D在各大公共云廠商基礎(chǔ)上搭建一個(gè)通用混合云平臺(tái),終點(diǎn)在混合,不在云;還有一類,就是各開(kāi)源應(yīng)用廠商自己搭建的混合云,如Confluent的Confluent Cloud、Cloudera的CDP、Elastic的Elasticsearch Service等,他們的目標(biāo)也是混合,但更純粹,就是要反過(guò)來(lái)屏蔽云廠商提供的特定開(kāi)源托管產(chǎn)品。
現(xiàn)在討論混合云的最終格局顯得有點(diǎn)太不自量力,我們不妨把問(wèn)題稍微縮小一點(diǎn),那就是在這種混合云的狀態(tài)下,Cloudera的混合企業(yè)數(shù)據(jù)云,是否能做成?
先說(shuō)市場(chǎng),關(guān)于市場(chǎng)分析師有諸多測(cè)算,少的也有幾百億,但我們不妨說(shuō)的簡(jiǎn)單點(diǎn)只要大家還要做大數(shù)據(jù),Hadoop就一直有市場(chǎng)。實(shí)際上我至今都沒(méi)發(fā)現(xiàn)有誰(shuí)在做大數(shù)據(jù)而不用Hadoop的。說(shuō)Hadoop有問(wèn)題,大家都承認(rèn),但說(shuō)他要完,這可有點(diǎn)早??梢?jiàn)范圍之內(nèi),它還看不到有威脅的整體競(jìng)爭(zhēng)對(duì)手。
既然市場(chǎng)成立,那就看Cloudera的競(jìng)爭(zhēng)對(duì)手情況了。
在MapR被收購(gòu)并且Cloudera合并了Hortonworks之后,應(yīng)該沒(méi)必要再討論獨(dú)立供應(yīng)商里誰(shuí)最強(qiáng)的問(wèn)題了,因?yàn)榇鸢甘秋@然的。
至于像Openshift這樣的獨(dú)立混合云,很像云計(jì)算版的聚合平臺(tái),可能長(zhǎng)期存在,但我不認(rèn)為能做大,主要原因還是他們無(wú)法通過(guò)網(wǎng)絡(luò)效應(yīng)增強(qiáng)自己的競(jìng)爭(zhēng)力,因?yàn)榭蛇x的供應(yīng)商太少。而且,他們瞄準(zhǔn)的是PaaS這層,即通過(guò)K8S屏蔽IaaS,所謀甚大,志不在Hadoop。
所以Cloudera的競(jìng)爭(zhēng)對(duì)手只有公共云廠商。
不過(guò)這并不好對(duì)比,從技術(shù)先進(jìn)性上來(lái)說(shuō),Cloudera顯然有優(yōu)勢(shì),如果客戶對(duì)產(chǎn)品有更高要求,那選CDP的可能性要大一些,但從產(chǎn)品模式和市場(chǎng)策略來(lái)說(shuō),云廠商以IaaS高頻打低頻,在搞定了客戶的基礎(chǔ)資源之后,再給客戶推一個(gè)大數(shù)據(jù)平臺(tái),也算順理成章。
于是似乎只能草草得出一個(gè)要看情況的結(jié)論。
但我們不妨跳出來(lái)再看一下。
毛爺爺曾寫過(guò)一篇文章《中國(guó)的紅色政權(quán)為什么能夠存在?》,里邊這樣說(shuō)道:我們只須知道中國(guó)白色政權(quán)的分裂和戰(zhàn)爭(zhēng)是繼續(xù)不斷的,則紅色政權(quán)的發(fā)生、存在并且日益發(fā)展,便是無(wú)疑的了。 那時(shí)中國(guó)處于國(guó)民黨的統(tǒng)治之下,并且共產(chǎn)黨剛剛遭受了重大打擊,很多人開(kāi)始產(chǎn)生悲觀情緒。但毛爺爺指出,國(guó)民黨的統(tǒng)治貌合神離,蔣桂馮閻四大軍閥的背后是不同的帝國(guó)主義訴求,他們之間的斗爭(zhēng)是不可調(diào)和的。所以在他們的斗爭(zhēng)之間,紅色政權(quán)便能產(chǎn)生和發(fā)展。
我發(fā)現(xiàn)這段精彩論述,完全可以套用在CDP要做的混合云身上。
- 公共云廠商之間互相斗爭(zhēng),只要世界上不止有一個(gè)云廠商,那被鎖定的擔(dān)憂就一直存在,混合云的需求也就一直存在。又因?yàn)檫@種擔(dān)憂是針對(duì)云廠商的,所以云廠商提供的混合云天生說(shuō)服力不足。
- CDP的數(shù)據(jù)混合云是一種地方經(jīng)濟(jì),可以脫離統(tǒng)一的大資本主義經(jīng)濟(jì)而獨(dú)立存在。即限定到大數(shù)據(jù)領(lǐng)域,客戶可以只用CDP而不必依賴特定云廠商的某些特定功能。
- CDP的混合云將會(huì)先誕生于經(jīng)過(guò)民主革命訓(xùn)練的地方。也就是說(shuō),那些曾經(jīng)習(xí)慣使用Cloudera產(chǎn)品的用戶,將會(huì)率先遷移到CDP的混合云上來(lái),而Cloudera長(zhǎng)期以來(lái)的客戶都集中在財(cái)富2000里,大多是傳統(tǒng)客戶,正是云計(jì)算10%滲透率以外的地方。是的,云計(jì)算高歌猛進(jìn)了這么多年,滲透率依然只有10%。
- CDP這種混合云的誕生和長(zhǎng)期發(fā)展,需要一支相當(dāng)力量的正式武裝。在開(kāi)源混合云的場(chǎng)景下,這支正式武裝可以理解為商業(yè)公司,言下之意是純社區(qū)建立的混合云無(wú)法長(zhǎng)期存在。所幸,目前開(kāi)源應(yīng)用混合云都是由商業(yè)公司建立的,不管是Confluent、Elastic,還是Cloudera,均不例外。而且,Cloudera這支武裝相當(dāng)有力量,100多名Apache Committer,3000多名員工,看似和云巨頭動(dòng)輒幾萬(wàn)人的規(guī)模差距很大,但限定到大數(shù)據(jù)領(lǐng)域,恐怕很少有公司能達(dá)到這個(gè)規(guī)模和質(zhì)量。
所以,CDP這種企業(yè)數(shù)據(jù)混合云的長(zhǎng)期存在和發(fā)展,便是無(wú)疑的了。
但要問(wèn)在這種情況下Cloudera是否真的能王者歸來(lái),我無(wú)法下斷言。
至于原因,不妨引用一下著名史學(xué)家史華茲的觀點(diǎn):否認(rèn)客觀環(huán)境先驗(yàn)的重要性是絕對(duì)愚蠢的行為,但我的確反對(duì)那種主張形勢(shì)自動(dòng)引起結(jié)果的萬(wàn)物有靈論,任務(wù)完成與否,不僅取決于所用的方法和客觀環(huán)境,也取決于承擔(dān)任務(wù)的那些人的思想、意圖和抱負(fù)。
所以我能做的,只有拭目以待。