擁抱風(fēng)險是一個選擇么?
時間:2022-03-25 13:06:01 | 來源:行業(yè)動態(tài)
時間:2022-03-25 13:06:01 來源:行業(yè)動態(tài)
Google在互聯(lián)網(wǎng)分布式系統(tǒng)和軟件領(lǐng)域遙遙領(lǐng)先,分布式系統(tǒng)在很早以前就已經(jīng)運行在Google全球上百萬臺PC服務(wù)器上,Google也從自身實踐運營的系統(tǒng)和軟件中開源了很多云計算、大數(shù)據(jù)和人工智能等領(lǐng)域里的關(guān)鍵技術(shù),特別是基于微服務(wù)和容器的新型應(yīng)用架構(gòu)被奉為互聯(lián)網(wǎng)、云計算和金融科技的標(biāo)準(zhǔn)。
Google分布式系統(tǒng)的運維之道即為Google站點可靠性工程(Site Reliability Engineering, SRE),這也是整個互聯(lián)網(wǎng)、云計算和金融科技的基石,作為全球最大的基于PC服務(wù)器的分布式系統(tǒng),Google SRE僅靠全球約1000人就維護了Google大部分家喻戶曉的商業(yè)應(yīng)用。為了運維世界上現(xiàn)存最大的互聯(lián)網(wǎng)軟件商業(yè)系統(tǒng),Google SRE總結(jié)出了一整套方法論,被奉為互聯(lián)網(wǎng)、云計算以及金融科技的核心理念。
而Google SRE的核心就是擁抱風(fēng)險。Google認為,當(dāng)服務(wù)器數(shù)量超過一定值后,再提高可靠性對于一項服務(wù)及其用戶而言,結(jié)果可能更差而不是更好!過份追求穩(wěn)定性限制了新功能的開發(fā)速度以及將產(chǎn)品交付給用戶的速度,還將極大增加成本。經(jīng)驗表明,可靠性的下一個改進,可能比之前的改進成本增強100倍。為什么會這樣呢?這主要是因為要投入冗余服務(wù)器、網(wǎng)絡(luò)和存儲等設(shè)備以及相應(yīng)的機會成本。
相比之下,銀行業(yè)核心業(yè)務(wù)對于風(fēng)險的容忍度為零。TSB銀行在向新系統(tǒng)遷移的過程中,并沒有進行充分的測試,這種做法非?;ヂ?lián)網(wǎng)化,但結(jié)果就是導(dǎo)致巨額損失以及關(guān)閉近百個分行。而即使是將業(yè)務(wù)數(shù)據(jù)備份到公共云上,后經(jīng)調(diào)查,Capital One也因為一個連接公共云的網(wǎng)絡(luò)防火墻的錯誤配置而導(dǎo)致上億客戶數(shù)據(jù)泄漏。
因此對于那些既想抓住重大歷史發(fā)展機遇,又期望避免重蹈互聯(lián)網(wǎng)金融覆轍的銀行來說,可以選擇兩層架構(gòu):核心系統(tǒng)仍然部署在以小型機和大型機為代表的可靠硬件基礎(chǔ)設(shè)施上,非核心系統(tǒng)可以考慮部署到以PC服務(wù)器為硬件基礎(chǔ)設(shè)施的金融專有云上。實際上,因為金融行業(yè)有專門的監(jiān)管和各類要求,即便是非核心系統(tǒng)也不能隨便放到非金融專有云的公共云上,而是專門面向金融行業(yè)設(shè)計的公共云服務(wù)。
采用兩層架構(gòu)后,銀行就可以在風(fēng)險可控的前提下,實現(xiàn)創(chuàng)新與安全的平衡,用以小型機和大型主機為代表的穩(wěn)態(tài)IT承載銀行核心系統(tǒng),同時以合規(guī)的金融專有云完成非核心業(yè)務(wù)和前端業(yè)務(wù)的互聯(lián)網(wǎng)化,還能實現(xiàn)以DevOps為代表的敏捷開發(fā)與快速迭代,從而分享移動互聯(lián)網(wǎng)與物聯(lián)網(wǎng)的紅利。