他們從5%看到了未來
時(shí)間:2022-03-04 08:12:01 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-03-04 08:12:01 來源:行業(yè)動(dòng)態(tài)
前面提到的聚望,是巴拿馬項(xiàng)目的負(fù)責(zé)人之一。他原本屬于旺旺團(tuán)隊(duì),整個(gè)團(tuán)隊(duì)一起并入釘釘IM,聯(lián)合釘釘和手淘大幾十人團(tuán)隊(duì)一起再次發(fā)起了攻堅(jiān)戰(zhàn)。
還剩不到半年時(shí)間,兩大挑戰(zhàn)擺在聚望團(tuán)隊(duì)的面前。
挑戰(zhàn)一:到底要為手淘打造一個(gè)什么樣的IM平臺(tái)?
雖然第一戰(zhàn)要攻克的是手淘難題,但釘釘?shù)某踔圆粌H是打通淘寶,而是做整個(gè)阿里巴巴的消息技術(shù)平臺(tái),所以他們既要滿足淘寶對(duì)IM的定制化需求,同時(shí)也要建立一套可以支撐所有阿里生態(tài)內(nèi)應(yīng)用的通用技術(shù)架構(gòu)。
搭建一套什么樣的架構(gòu)?實(shí)現(xiàn)哪些功能?哪些功能由淘寶自己的業(yè)務(wù)團(tuán)隊(duì)實(shí)現(xiàn)?這些問題像一重又一重的關(guān)卡擺在巴拿馬團(tuán)隊(duì)面前。
挑戰(zhàn)二由陽凱發(fā)起,陽凱從2010年就開始參與雙11的技術(shù)保障,2018年開始作為釘釘雙11技術(shù)風(fēng)險(xiǎn)的負(fù)責(zé)人,同時(shí)也是雙11釘釘?shù)募夹g(shù)大隊(duì)長,他的核心職責(zé)就一個(gè)詞:保穩(wěn)定。
對(duì)陽凱而言,在雙11這種大考里換新系統(tǒng),這就是最大的不穩(wěn)定因素。一個(gè)新系統(tǒng)要在雙11承擔(dān)5%的流量,還是核心交易消息,我是持懷疑態(tài)度和反對(duì)態(tài)度的。陽凱說。人人都在興奮,但在這場開著飛機(jī)換引擎的戰(zhàn)爭里,總要有人扮演一個(gè)演練失敗的角色,讓風(fēng)險(xiǎn)發(fā)生在事前,而不是雙11中掉鏈子。
因此他幾乎天天給聚望潑冷水,想方設(shè)法地提出可能出現(xiàn)失敗的情況。預(yù)案充分嗎?新系統(tǒng)的性能承壓行不行?為什么一定要在雙11上,不能雙12嗎?
壓力來到聚望帶領(lǐng)的巴拿馬團(tuán)隊(duì)身上。這一次,巴拿馬項(xiàng)目不再打算采用將釘釘集成到淘寶當(dāng)中的方案,而是用釘釘?shù)募夹g(shù)能力和創(chuàng)新能力搭建一套全新的技術(shù)系統(tǒng)IM PaaS平臺(tái)。
對(duì)做了多年旺旺消息技術(shù)的聚望來講,前一套方案是旺旺的升級(jí)版,但也僅僅只是升級(jí)版,要做就做大的。
聚望說:我們希望為所有的業(yè)務(wù)提供一套高可用、高穩(wěn)定性的消息平臺(tái),未來業(yè)務(wù)團(tuán)隊(duì)只考慮業(yè)務(wù)場景的創(chuàng)新,而不用擔(dān)心底層的技術(shù)。
此時(shí)的他,心中也有一個(gè)沒有說出來的想法。從事IM平臺(tái)技術(shù)多年,聚望知道單從技術(shù)上看,IM系統(tǒng)的門檻不高,但一個(gè)獨(dú)立團(tuán)隊(duì)想做到優(yōu)秀,需要投入的人力、資源和時(shí)間,不亞于重做一套釘釘。如果這套消息平臺(tái)做到足夠成熟,未嘗不可能有一天從阿里走出去,成為業(yè)界的的一個(gè)通用IM平臺(tái)。
為阿里打造的消息技術(shù)中臺(tái),釘釘拿出了全部本領(lǐng),在高可用、高穩(wěn)定、高擴(kuò)展的基礎(chǔ)上,釘釘IM PaaS平臺(tái)和存儲(chǔ)團(tuán)隊(duì)合作開發(fā),對(duì)存儲(chǔ)模型進(jìn)行優(yōu)化,支持讀寫擴(kuò)散、異地容災(zāi)、智能流量管理、同步平臺(tái)升級(jí)、消息隊(duì)列升級(jí)、SmartOps平臺(tái)等技術(shù)創(chuàng)新。
對(duì)消費(fèi)者而言,他們并不知道淘寶、千牛、旺旺甚至淘特底層采用同一套消息平臺(tái)。但不管是登錄哪一個(gè)應(yīng)用,釘釘?shù)腎M PaaS平臺(tái)都可以保障多端消息同步。即便重新安裝,所有的數(shù)據(jù)都在。聚望說。
2019年6月,巴拿馬項(xiàng)目各項(xiàng)功能開發(fā)完成,他們特意舉辦了一場showcase表演,南星導(dǎo)演,達(dá)野攝影,聚望策劃,整個(gè)項(xiàng)目組的人在會(huì)議室里都顯得十分興奮。
南星說:那一天就像是一座大橋的左右兩邊合龍,對(duì)釘釘和淘寶而言,都是一個(gè)重要的里程碑。
大橋合龍后,還要經(jīng)過無數(shù)次測試和真正的通行才能宣告成功。2019年雙11,盡管陽凱從9月開始就不斷的向他們發(fā)起挑戰(zhàn),但釘釘IM PaaS非常堅(jiān)決,他們一定要在這一年承接5%的核心交易消息流量。
這一天終于來了。雙11當(dāng)天,光明頂燈火通明,即便是經(jīng)驗(yàn)最豐富的陽凱也因?yàn)镮M PaaS的上線感到無比緊張。消息鏈路某種程度比支付和交易更需要穩(wěn)定,因?yàn)獒斸斶€擔(dān)負(fù)著故障應(yīng)急和內(nèi)部協(xié)調(diào)的責(zé)任,承接5%的核心交易消息聽起來并不多,但放在雙11這一天卻會(huì)影響上千萬人。
假如雙11當(dāng)天,消息系統(tǒng)出問題會(huì)怎么樣?聚望非常嚴(yán)肅地回答:如果消息出問題,最壞的情況下,交易會(huì)下跌20%。
2019年雙11的GMV是2684億,20%是多大的體量,無需贅言。
因此釘釘IM PaaS團(tuán)隊(duì)必須謹(jǐn)慎再謹(jǐn)慎,他們從5萬用戶規(guī)模、100萬用戶規(guī)模、1000萬用戶的規(guī)模,2000萬用戶規(guī)模,做了多次容災(zāi)演練,保障即便雙11真的出現(xiàn)問題,也能從容的從新系統(tǒng)切回老系統(tǒng)。
萬事俱備,但這一夜并不順利。零點(diǎn)之前,按照預(yù)案,聚望團(tuán)隊(duì)為了提高雙11系統(tǒng)的整體性能,撤掉了一些過度占用資源的防御性系統(tǒng),但之后不久,意料之外的攻擊出現(xiàn)了,消息系統(tǒng)遭到了大量運(yùn)營類垃圾消息的沖擊,系統(tǒng)很快就要撐不住了,我們的神經(jīng)更是如此。
聚望立即組織團(tuán)隊(duì)現(xiàn)場寫腳本進(jìn)行攻防,將違規(guī)賬號(hào)從系統(tǒng)出提出進(jìn)行限制。直到熬過零點(diǎn)后的半小時(shí),這激烈的消息系統(tǒng)保衛(wèi)戰(zhàn)才結(jié)束。戰(zhàn)斗結(jié)束后,雖然作戰(zhàn)室內(nèi)沒有人立即說話,但所有人都不約而同的松了口氣。
所有人都知道IM PaaS這一仗,釘釘打贏了。