分布式、多模型、國(guó)產(chǎn)替代——從星環(huán)科技春季新品發(fā)布看國(guó)產(chǎn)數(shù)據(jù)庫(kù)進(jìn)化
時(shí)間:2023-03-13 10:04:01 | 來(lái)源:電子商務(wù)
時(shí)間:2023-03-13 10:04:01 來(lái)源:電子商務(wù)
近年來(lái),在國(guó)內(nèi)外市場(chǎng)環(huán)境以及技術(shù)更新等多種因素驅(qū)動(dòng)下國(guó)產(chǎn)數(shù)據(jù)庫(kù)呈現(xiàn)出高速發(fā)展態(tài)勢(shì)。一方面,受中美貿(mào)易之爭(zhēng)、Oracle等巨頭在俄停服事件的影響,做大做強(qiáng)國(guó)產(chǎn)基礎(chǔ)軟件成為共識(shí),國(guó)家和各級(jí)地方政府通過(guò)“信創(chuàng)”等一些措施以加速國(guó)產(chǎn)基礎(chǔ)軟件的成長(zhǎng)。另一方面,數(shù)據(jù)爆炸性增長(zhǎng)推動(dòng)了數(shù)據(jù)庫(kù)技術(shù)的快速進(jìn)步和迭代,為國(guó)產(chǎn)數(shù)據(jù)庫(kù)的崛起提供了機(jī)會(huì)。
在此背景下,國(guó)產(chǎn)數(shù)據(jù)庫(kù)軟件紛紛加快了產(chǎn)品更新?lián)Q代的步伐,市場(chǎng)上出現(xiàn)了一批緊跟甚至引領(lǐng)數(shù)據(jù)庫(kù)技術(shù)潮流的數(shù)據(jù)庫(kù)產(chǎn)品。4月19日,星環(huán)科技舉行了2022春季新品發(fā)布會(huì),對(duì)旗下大數(shù)據(jù)與云基礎(chǔ)平臺(tái)、分布式關(guān)系型數(shù)據(jù)庫(kù)、數(shù)據(jù)開發(fā)與智能分析工具的全線產(chǎn)品進(jìn)行升級(jí),多款新產(chǎn)品集中亮相,其中就包括星環(huán)科技的幾款數(shù)據(jù)庫(kù)產(chǎn)品:星環(huán)分布式分析型數(shù)據(jù)庫(kù)ArgoDB 5.0、分布式交易型數(shù)據(jù)庫(kù)KunDB 3.0、星環(huán)分布式圖數(shù)據(jù)庫(kù)StellarDB 4.0等,大量領(lǐng)先的技術(shù)在這些產(chǎn)品中體現(xiàn),分布式、多模型、AP與TP融合、國(guó)產(chǎn)替代成為星環(huán)科技介紹這幾款產(chǎn)品發(fā)布時(shí)的高頻詞匯,而這也正好契合了當(dāng)前國(guó)產(chǎn)數(shù)據(jù)庫(kù)的發(fā)展趨勢(shì)。
01 從數(shù)據(jù)云向融合數(shù)據(jù)云演進(jìn)數(shù)據(jù)上云已經(jīng)成為行業(yè)趨勢(shì)。響應(yīng)這一趨勢(shì),星環(huán)科技于2018年提出了“數(shù)據(jù)云”,今年的新品發(fā)布會(huì)上星環(huán)科技對(duì)“數(shù)據(jù)云”進(jìn)行了延伸,推出了“融合數(shù)據(jù)云”。
根據(jù)星環(huán)科技創(chuàng)始人、CEO孫元浩的解釋,“融合數(shù)據(jù)云”指的是在按數(shù)據(jù)域組織的分布式數(shù)據(jù)云的技術(shù)架構(gòu)基礎(chǔ)上進(jìn)行統(tǒng)籌管理、協(xié)同運(yùn)營(yíng)、服務(wù)融合以形成可協(xié)同一致,自由組合,靈活部署的一種新型數(shù)據(jù)分析模式。
星環(huán)科技創(chuàng)始人、CEO孫元浩與“數(shù)據(jù)云”強(qiáng)調(diào)資源的彈性調(diào)度和統(tǒng)一管控不同,“融合數(shù)據(jù)云”更強(qiáng)調(diào)數(shù)據(jù)的流通和開放共享。具體而言,“融合數(shù)據(jù)云”要實(shí)現(xiàn)三大價(jià)值:第一個(gè)是能夠促進(jìn)數(shù)據(jù)的快速流動(dòng),讓數(shù)據(jù)在數(shù)據(jù)平臺(tái)上以安全可信的方式流動(dòng)到合適的地方、流到需要的人;第二個(gè)是通過(guò)輕量化地構(gòu)建統(tǒng)計(jì)分析和決策智能應(yīng)用,賦能業(yè)務(wù)并實(shí)現(xiàn)業(yè)務(wù)的智能化;第三個(gè)是融合多種數(shù)據(jù)領(lǐng)域,通過(guò)聯(lián)邦分析、多模型數(shù)據(jù)平臺(tái)把數(shù)據(jù)的關(guān)聯(lián)價(jià)值發(fā)展出來(lái)。
“我們要讓數(shù)據(jù)回歸到本源——價(jià)值,要讓大家用起來(lái)。因此要能通過(guò)一種統(tǒng)一的語(yǔ)言、統(tǒng)一的應(yīng)用開發(fā)方式,能夠快速地訪問(wèn)位于不同部署位置的數(shù)據(jù),從而能夠及時(shí)按需產(chǎn)生分析應(yīng)用?!睂O元浩在演講時(shí)表示。
孫元浩舉了一個(gè)例子來(lái)說(shuō)明融合數(shù)據(jù)云的價(jià)值:通過(guò)經(jīng)營(yíng)貸申請(qǐng)人找出潛在客戶。貸款申請(qǐng)人通常是一個(gè)企業(yè)法人,他的關(guān)聯(lián)人可能會(huì)有類似的需求,因此可以找到和申請(qǐng)關(guān)聯(lián)的那些人作為營(yíng)銷對(duì)象。這里的關(guān)聯(lián)人可以是關(guān)聯(lián)企業(yè)的股東、高管或者是他的投資人、上下游企業(yè)的股東等。
要做這件事情需要用到幾類數(shù)據(jù):一類是申請(qǐng)人提交的信息,用以驗(yàn)證他的身份和資產(chǎn),比如房產(chǎn)。第二類是與他相關(guān)聯(lián)的人,以及這些關(guān)聯(lián)人是否潛在違約等信息。這些數(shù)據(jù)有的在數(shù)據(jù)庫(kù),有的在數(shù)據(jù)倉(cāng)庫(kù),有的在圖數(shù)據(jù)庫(kù),傳統(tǒng)方法要生成多個(gè)不同的應(yīng)用程序和不同的SQL語(yǔ)句來(lái)完成這個(gè)工作,而通過(guò)融合數(shù)據(jù)云平臺(tái)構(gòu)造一個(gè)簡(jiǎn)單SQL就可以完成。因?yàn)檫@個(gè)SQL可以屏蔽數(shù)據(jù)庫(kù)、大數(shù)據(jù)平臺(tái)的區(qū)別,屏蔽非結(jié)構(gòu)化數(shù)據(jù)、圖數(shù)據(jù)的區(qū)別,甚至還能調(diào)用圖像識(shí)別的算法,最后找出合適的關(guān)聯(lián)人以支持后面的營(yíng)銷工作。
在“融合數(shù)據(jù)云”中,多模數(shù)據(jù)平臺(tái)是一個(gè)關(guān)鍵支撐技術(shù)。因?yàn)樵诖笾行推髽I(yè)通常會(huì)同時(shí)使用多種不同數(shù)據(jù)庫(kù),而不同的數(shù)據(jù)庫(kù)會(huì)用不同的訪問(wèn)語(yǔ)言、用不同的計(jì)算引擎,由不同的存儲(chǔ)引擎分別處理不同類型的數(shù)據(jù),而多模型數(shù)據(jù)平臺(tái)能屏蔽這些差異,給用戶提供統(tǒng)一的數(shù)據(jù)管理方式,并能把SQL語(yǔ)言解析成不同的查詢語(yǔ)言,來(lái)訪問(wèn)不同結(jié)構(gòu)的數(shù)據(jù)類型??梢哉f(shuō),多模型數(shù)據(jù)平臺(tái)是把方便留給了開發(fā)人員和運(yùn)維人員,而把麻煩留給了自己。而好處也是顯而易見,能有效降低開發(fā)的難度和運(yùn)維的難度,極大提升開發(fā)運(yùn)維效率。
星環(huán)科技于2020年正式推出多模型數(shù)據(jù)平臺(tái),并持續(xù)豐富和完善其能力,今年星環(huán)科技已經(jīng)將支持的數(shù)據(jù)模型增加到10種,存儲(chǔ)引擎達(dá)到9種,從而能更好地滿足不同用戶的需求。
02 打造新一代分布式數(shù)據(jù)庫(kù)在2010年以前,數(shù)據(jù)庫(kù)是屬于關(guān)系型數(shù)據(jù)庫(kù)的時(shí)代。那個(gè)時(shí)候數(shù)據(jù)類型相對(duì)單一,數(shù)據(jù)量也不大,關(guān)系型數(shù)據(jù)庫(kù)是主流,更準(zhǔn)確地說(shuō)是集中式關(guān)系型數(shù)據(jù)庫(kù)。隨著互聯(lián)網(wǎng)的發(fā)展,大數(shù)據(jù)時(shí)代到來(lái),海量的數(shù)據(jù)如洪流一般來(lái)襲,數(shù)據(jù)類型日益復(fù)雜,對(duì)時(shí)效性的要求也是越來(lái)越高,傳統(tǒng)數(shù)據(jù)庫(kù)面臨嚴(yán)峻挑戰(zhàn),而分布式數(shù)據(jù)庫(kù)因具備水平擴(kuò)容、高可用等重要特性,可以滿足高并發(fā)吞吐、海量數(shù)據(jù)存儲(chǔ)、大表瓶頸等數(shù)據(jù)庫(kù)難題,受到市場(chǎng)的青睞。
星環(huán)科技成立于2013年這個(gè)大數(shù)據(jù)最火的年份,業(yè)務(wù)也從大數(shù)據(jù)平臺(tái)起步,從公司成立伊始分布式技術(shù)就是公司的核心競(jìng)爭(zhēng)力,后來(lái)推出的數(shù)據(jù)庫(kù),包括分析型數(shù)據(jù)庫(kù)ArgoDB、交易型數(shù)據(jù)庫(kù)KunDB、圖數(shù)據(jù)庫(kù)StellarDB等也都是基于分布式技術(shù)打造的。
ArgoDB是一款能夠打造高性能湖倉(cāng)集一體化的多模型數(shù)據(jù)庫(kù),可以替代Hadoop+MPP混合架構(gòu),支持標(biāo)準(zhǔn)SQL語(yǔ)法,提供多模分析、實(shí)時(shí)數(shù)據(jù)處理、存算解耦、混合負(fù)載、數(shù)據(jù)聯(lián)邦、異構(gòu)服務(wù)器混合部署等先進(jìn)技術(shù)能力。一個(gè)ArgoDB數(shù)據(jù)庫(kù)就可以滿足數(shù)據(jù)倉(cāng)庫(kù)、實(shí)時(shí)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、OLAP、AETP、聯(lián)邦計(jì)算等各種需求。
ArgoDB 5.0打造了新一代向量化計(jì)算引擎和多模型存儲(chǔ)引擎,在性能上有大幅度的提升,尤其是OLAP分析場(chǎng)景下的性能提升,整體上達(dá)到同類數(shù)據(jù)庫(kù)產(chǎn)品的2-10倍,能幫助用戶更快、更穩(wěn)定地應(yīng)對(duì)復(fù)雜多變的業(yè)務(wù)需求。
ArgoDB5.0還進(jìn)一步加強(qiáng)了多模型數(shù)據(jù)的支持能力和處理能力,通過(guò)一個(gè)數(shù)據(jù)庫(kù)就可以滿足更多數(shù)據(jù)模型處理和不同模態(tài)數(shù)據(jù)關(guān)聯(lián)。除了多模能力方面的增強(qiáng)外,ArgoDB 5.0還引入DP-SQL能力,實(shí)現(xiàn)對(duì)數(shù)據(jù)的隱私保護(hù),同時(shí)加強(qiáng)了數(shù)據(jù)備份功能,強(qiáng)化了數(shù)據(jù)安全保障能力。此外,ArgoDB 5.0進(jìn)一步加強(qiáng)數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)/數(shù)據(jù)集市等業(yè)務(wù)面的技術(shù)革新。
星環(huán)KunDB是一款交易型數(shù)據(jù)庫(kù),能提供完整的關(guān)系型數(shù)據(jù)庫(kù)的能力。KunDB具有業(yè)內(nèi)領(lǐng)先的事務(wù)處理性能、SQL兼容性以及最新的分布式查詢優(yōu)化技術(shù),支持復(fù)雜查詢且性能是MySQL的10倍以上,充分滿足高并發(fā)、大數(shù)據(jù)量的交易型業(yè)務(wù)場(chǎng)景。
KunDB 3.0高度兼容Oracle對(duì)象與語(yǔ)法,基于創(chuàng)新的過(guò)程語(yǔ)言編譯技術(shù),完整支持Oracle PL/SQL語(yǔ)法,大大降低了遷移成本。全新的查詢優(yōu)化器和向量化執(zhí)行引擎使得分析性能在TPCH基準(zhǔn)測(cè)試中較MySQL最高優(yōu)化80倍。在事務(wù)處理能力方面,KunDB3.0采用基于TSO的全新分布式強(qiáng)一致事務(wù)處理框架,事務(wù)處理上限達(dá)300萬(wàn)TPS,較GTM方案提升5倍以上。在容災(zāi)方面,KunDB3.0優(yōu)化了跨機(jī)房容災(zāi)架構(gòu),支持全鏈路高可用、一致性備份恢復(fù)等能力,故障時(shí)可恢復(fù)過(guò)去任意時(shí)間點(diǎn),充分保障數(shù)據(jù)安全。此外,KunDB3.0采用了基于分析引擎增強(qiáng)分布式事務(wù)處理引擎技術(shù)(ATEP),通過(guò)一個(gè)系統(tǒng)就可以同時(shí)提供高性能AP和TP服務(wù)能力,滿足交易與分析混合型業(yè)務(wù)場(chǎng)景。目前,KunDB 3.0擁有替代MySQL、金融級(jí)分布式數(shù)據(jù)庫(kù)、替代Oracle、HTAP業(yè)務(wù)場(chǎng)景等典型的業(yè)務(wù)場(chǎng)景及能力。
除了關(guān)系型數(shù)據(jù)庫(kù)外,星環(huán)科技還有一款圖數(shù)據(jù)庫(kù)產(chǎn)品StellarDB,可以全面替代開源圖數(shù)據(jù)庫(kù)Neo4j。StellarDB脫胎于星環(huán)科技大數(shù)據(jù)平臺(tái),擁有自主知識(shí)產(chǎn)權(quán)。和上一個(gè)版本相比,StellarDB 4.0支持萬(wàn)億邊PB級(jí)數(shù)據(jù)量存儲(chǔ)和近30種算法,在數(shù)據(jù)加載、查詢和算法性能方面提升了2-10倍。同時(shí),StellarDB4.0在功能和易用上也做了極大的提升,新增建圖、批量導(dǎo)入語(yǔ)法,以及對(duì)Array、Decimal高精度數(shù)據(jù)類型的支持,提高用戶建圖和導(dǎo)入效率,滿足復(fù)雜的數(shù)據(jù)類型要求。
03 堅(jiān)持自研,加速國(guó)產(chǎn)替代眾所周知,長(zhǎng)期以來(lái)數(shù)據(jù)庫(kù)市場(chǎng)一直是Oracle、IBM、微軟等國(guó)際巨頭的天下,國(guó)產(chǎn)數(shù)據(jù)庫(kù)存在感很弱。統(tǒng)計(jì)數(shù)據(jù)顯示,國(guó)產(chǎn)數(shù)據(jù)庫(kù)市場(chǎng)占比不到20%。在中美貿(mào)易爭(zhēng)端、中國(guó)科技企業(yè)頻頻被美國(guó)列入實(shí)體名單的背景下,如何做大做強(qiáng)國(guó)產(chǎn)數(shù)據(jù)庫(kù)成為業(yè)界關(guān)注的問(wèn)題。
國(guó)產(chǎn)數(shù)據(jù)庫(kù)要自強(qiáng),根本出路在于要真正掌握核心技術(shù)。而綜觀數(shù)據(jù)庫(kù)市場(chǎng),我們可以看到,以星環(huán)科技為代表的諸多創(chuàng)新型企業(yè)正在借助云原生能力、分布式技術(shù)、多模,結(jié)合自身技術(shù)研發(fā)實(shí)力和廣大合作伙伴與用戶的不斷實(shí)踐,逐步進(jìn)入金融、政務(wù)等市場(chǎng),替代國(guó)外的數(shù)據(jù)庫(kù)產(chǎn)品。
實(shí)際上,星環(huán)科技剛成立時(shí)其產(chǎn)品和解決方案是基于開源Hadoop產(chǎn)品,隨著這些產(chǎn)品和解決方案的落地,星環(huán)科技逐漸感受到Hadoop平臺(tái)的不足,走上了自研之路,自主可控的基礎(chǔ)軟件產(chǎn)品比例逐年增高,如今SQL編譯器層、分布式計(jì)算引擎層、資源調(diào)度層三層已實(shí)現(xiàn)完全自主。
另一方面,為了加速國(guó)產(chǎn)替代的進(jìn)程,星環(huán)科技還在積極做好兼容Oracle、DB2等軟件的工作,為完全取代他們做好準(zhǔn)備。
據(jù)孫元浩介紹,如今星環(huán)科技的產(chǎn)品在絕大多數(shù)應(yīng)用場(chǎng)景都能完整取代國(guó)外產(chǎn)品,而且功能更強(qiáng)大,性能更快。比如,在傳統(tǒng)數(shù)據(jù)庫(kù)領(lǐng)域,星環(huán)KunDB可以完整取代MySQL的所有應(yīng)用場(chǎng)景,能取代Oracle的部分OLTP應(yīng)用場(chǎng)景。相比傳統(tǒng)數(shù)據(jù)庫(kù),KunDB是分布式的和高性能、高可用的,其并發(fā)性能更好,已經(jīng)在不少政府的大數(shù)據(jù)中心和企業(yè)中使用。
而在數(shù)據(jù)倉(cāng)庫(kù)方面,星環(huán)科技的ArgoDB也可以完整地取代Oracle、DB2、Teradata等,如今完成替換的成功客戶已經(jīng)有近千家。同樣,圖數(shù)據(jù)庫(kù)StellarDB可以去取代開源的或者商用版的Neo4j,能處理更大規(guī)模的圖數(shù)據(jù)庫(kù)。
寫在最后在數(shù)據(jù)庫(kù)市場(chǎng),國(guó)產(chǎn)數(shù)據(jù)庫(kù)一直在Oracle、DB2、SQL Server等夾縫中生存,并不容易,但是依然有一些像星環(huán)科技這樣的中國(guó)公司在堅(jiān)守,始終堅(jiān)持技術(shù)自研和不斷創(chuàng)新,正是它們讓我們看到了國(guó)產(chǎn)數(shù)據(jù)庫(kù)的希望。如今,隨著大數(shù)據(jù)時(shí)代的到來(lái),國(guó)產(chǎn)數(shù)據(jù)庫(kù)迎來(lái)了難得的發(fā)展機(jī)遇,尤其是在分布式數(shù)據(jù)庫(kù)賽道,國(guó)內(nèi)特定的環(huán)境促進(jìn)了分布式技術(shù)的快速發(fā)展,有望取得率先突破。國(guó)產(chǎn)數(shù)據(jù)庫(kù)加油!
關(guān)鍵詞:國(guó)產(chǎn),發(fā)布,春季,數(shù)據(jù),進(jìn)化,模型,替代,分布