產(chǎn)業(yè)概覽:關(guān)系型數(shù)據(jù)庫占主流,分布式時(shí)代加速到來數(shù)據(jù)庫是信息系統(tǒng)運(yùn)行的關(guān)鍵基礎(chǔ)。從定義來看,數(shù)據(jù)庫是按照一定的數(shù)據(jù)結(jié)構(gòu)組織、存 儲(chǔ)和管理數(shù)據(jù)的倉庫,在計(jì)算機(jī)中一般由一個(gè)或者一組文件構(gòu)成;從本" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營(yíng)銷資訊 > 電子商務(wù) > 數(shù)據(jù)庫行業(yè)專題研究:信創(chuàng)正當(dāng)時(shí),國產(chǎn)數(shù)據(jù)庫發(fā)展提速

數(shù)據(jù)庫行業(yè)專題研究:信創(chuàng)正當(dāng)時(shí),國產(chǎn)數(shù)據(jù)庫發(fā)展提速

時(shí)間:2023-03-13 09:24:01 | 來源:電子商務(wù)

時(shí)間:2023-03-13 09:24:01 來源:電子商務(wù)

(報(bào)告出品方:華泰證券)

產(chǎn)業(yè)概覽:關(guān)系型數(shù)據(jù)庫占主流,分布式時(shí)代加速到來

數(shù)據(jù)庫是信息系統(tǒng)運(yùn)行的關(guān)鍵基礎(chǔ)。從定義來看,數(shù)據(jù)庫是按照一定的數(shù)據(jù)結(jié)構(gòu)組織、存 儲(chǔ)和管理數(shù)據(jù)的倉庫,在計(jì)算機(jī)中一般由一個(gè)或者一組文件構(gòu)成;從本質(zhì)來看,計(jì)算機(jī)解 決的是數(shù)據(jù)計(jì)算和數(shù)據(jù)處理問題,數(shù)據(jù)庫則是計(jì)算機(jī)應(yīng)用系統(tǒng)中的專門管理數(shù)據(jù)資源的系 統(tǒng);從架構(gòu)上看,數(shù)據(jù)庫作為計(jì)算機(jī)三大基礎(chǔ)軟件(操作系統(tǒng)、數(shù)據(jù)庫、中間件)之一, 向下可充分發(fā)揮硬件算力,向上支撐上層的應(yīng)用需求,是信息系統(tǒng)高效運(yùn)行的關(guān)鍵基礎(chǔ)。

數(shù)據(jù)庫軟件的核心是數(shù)據(jù)庫管理系統(tǒng)。數(shù)據(jù)庫作為基礎(chǔ)軟件,可面向多種應(yīng)用,被多個(gè)用 戶、程序共享,其中數(shù)據(jù)庫管理系統(tǒng)(DataBase Management System,DBMS)負(fù)責(zé)搭 建、處理、維護(hù)數(shù)據(jù)庫的數(shù)據(jù)及數(shù)據(jù)間邏輯關(guān)系,由外部組件集與內(nèi)核組件集共同組成:1) 外部組件集:以數(shù)據(jù)庫配套的獨(dú)立支撐軟件為主,例如數(shù)據(jù)庫驅(qū)動(dòng);2)內(nèi)核組件集:一般 可以分為管理組件、網(wǎng)絡(luò)組件、計(jì)算組件、存儲(chǔ)組件四大模塊。

產(chǎn)業(yè)復(fù)盤:變革與數(shù)據(jù)需求相協(xié)同,發(fā)展邁入后關(guān)系型階段

自 20 世紀(jì) 60 年代以來,數(shù)據(jù)庫行業(yè)隨信息技術(shù)發(fā)展而快速演變,主要經(jīng)歷了三大階段: 1)前關(guān)系型階段(1964-1970):1964 年查爾斯·巴赫曼(Charles Bachman)開發(fā)出第一 個(gè)數(shù)據(jù)庫管理系統(tǒng),網(wǎng)狀數(shù)據(jù)管理系統(tǒng) IDS(Integrated Data Store)初步成型;隨后為解 決阿波羅登月計(jì)劃所需的大量數(shù)據(jù),1968 年 IMS(Information Management System)系 統(tǒng)作為最早商業(yè)化的 DBMS 正式發(fā)布;此階段數(shù)據(jù)庫主要解決了數(shù)據(jù)獨(dú)立存儲(chǔ)、統(tǒng)一管理、 統(tǒng)一訪問的問題,實(shí)現(xiàn)了數(shù)據(jù)與程序分離,但缺乏被廣泛接受的理論基礎(chǔ); 2)關(guān)系型階段(1970-2008):1970 年,員埃德加·科德(Edgar F. Codd)發(fā)表《大型共 享數(shù)據(jù)庫的數(shù)據(jù)關(guān)系模型》,關(guān)系型模型理論被初步提出;隨后關(guān)系型數(shù)據(jù)庫(Relational Database Management System,RDBMS)誕生,國際標(biāo)準(zhǔn)組織將 SQL 作為國際數(shù)據(jù)庫 標(biāo)準(zhǔn)語言,并進(jìn)行標(biāo)準(zhǔn)化,SQL 成為關(guān)系型數(shù)據(jù)庫主流語言并引領(lǐng)變革,Access、MySQL、 PostgreSQL 等大批關(guān)系型數(shù)據(jù)庫誕生,帶動(dòng)關(guān)系型數(shù)據(jù)庫完成了從理論到實(shí)踐的轉(zhuǎn)換; 3)后關(guān)系型階段(2008-至今):隨著 Web 2.0 的到來,數(shù)據(jù)量出現(xiàn)指數(shù)增長(zhǎng),傳統(tǒng)關(guān)系型 數(shù)據(jù)庫無法有效對(duì)應(yīng)日新月異的數(shù)據(jù)類型及業(yè)務(wù)場(chǎng)景,為更有效地處理海量數(shù)據(jù),應(yīng)對(duì)多 樣的數(shù)據(jù)結(jié)構(gòu),NoSQL、NewSQL 等非關(guān)系型數(shù)庫脫穎而出,數(shù)據(jù)庫邁入第三發(fā)展階段。

根據(jù)數(shù)據(jù)結(jié)構(gòu)、架構(gòu)模型、業(yè)務(wù)負(fù)載特征的不同,數(shù)據(jù)庫可劃分為不同類別。為了更清楚 的了解數(shù)據(jù)庫之間的特性差異,數(shù)據(jù)庫產(chǎn)品可依照不同標(biāo)準(zhǔn)進(jìn)行分類,常見的分類依據(jù)包 括數(shù)據(jù)結(jié)構(gòu)、架構(gòu)模型、業(yè)務(wù)負(fù)載特征、部署方式等,其中數(shù)據(jù)結(jié)構(gòu)類型是最常用的標(biāo)準(zhǔn)。 1)根據(jù)數(shù)據(jù)結(jié)構(gòu)類型:可分為關(guān)系型數(shù)據(jù)庫、NoSQL 數(shù)據(jù)庫、NewSQL 數(shù)據(jù)庫; 2)根據(jù)架構(gòu)模型:可分為集中式數(shù)據(jù)庫、分布式數(shù)據(jù)庫; 3)根據(jù)業(yè)務(wù)負(fù)載特性:可分為 OLAP 數(shù)據(jù)庫(分析型數(shù)據(jù)庫)、OLTP 數(shù)據(jù)庫(事務(wù)型數(shù) 據(jù)庫)、HTAP 數(shù)據(jù)庫(混合型數(shù)據(jù)庫)。

按數(shù)據(jù)結(jié)構(gòu)分類:關(guān)系型、NoSQL、NewSQL

數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)類型隨存儲(chǔ)需求變化而不斷拓展。最早的數(shù)據(jù)存儲(chǔ)需求主要來源于結(jié)構(gòu) 化數(shù)據(jù),因此數(shù)據(jù)庫產(chǎn)品多采用關(guān)系型架構(gòu),主流產(chǎn)品包括:Oracle、MySQL、PostgreSQL 等;2000 年以后隨著互聯(lián)網(wǎng)應(yīng)用的快速普及,產(chǎn)生大量非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)需求,NoSQL 數(shù)據(jù)庫快速興起,主流產(chǎn)品包括 Redis、MongoDB 等;后來為解決 NoSQL 數(shù)據(jù)庫缺乏強(qiáng) 一致性及事務(wù)支持的問題,NewSQL 數(shù)據(jù)庫逐步發(fā)展,主流產(chǎn)品包括:Spanner、TiDB 等。

1)關(guān)系型數(shù)據(jù)庫

關(guān)系型數(shù)據(jù)庫是由多個(gè)二維表所組成的集合。關(guān)系型數(shù)據(jù)庫,是指采用了關(guān)系模型來組織 數(shù)據(jù)的數(shù)據(jù)庫,數(shù)據(jù)以行和列的形式進(jìn)行存儲(chǔ),這一系列的行和列被稱為表,一組表組成 了數(shù)據(jù)庫。表格之中每一行通過獨(dú)有的主碼(Primary Key)來區(qū)分彼此,每一列都擁有統(tǒng) 一的數(shù)據(jù)類型,外碼(Foreign Key)通常與主碼(Primary Key)一起使用,用于建立表與 表之間的聯(lián)系,通過匹配外碼以尋找相應(yīng)的行。

關(guān)系型數(shù)據(jù)庫具備 ACID 特性,為主流數(shù)據(jù)庫類型。關(guān)系型數(shù)據(jù)庫嚴(yán)格遵循原子性 Atomicity、 一致性 Consistency、隔離性 Isolation、持久性 Durability(以上簡(jiǎn)稱 ACID 特性),在維護(hù) 數(shù)據(jù)庫完整性、數(shù)據(jù)一致性方面優(yōu)勢(shì)突出,適用于對(duì)數(shù)據(jù)安全性、事務(wù)支持高度要求的應(yīng) 用場(chǎng)景。1)原子性:為避免不同指令之間的沖突,數(shù)據(jù)庫中的事務(wù)執(zhí)行被視為原子不可再 分,指令要么全部成功執(zhí)行,要么失敗而保持原狀;2)一致性:為確保業(yè)務(wù)邏輯一致性, 數(shù)據(jù)庫設(shè)置約束與觸發(fā)器保證數(shù)據(jù)庫完整性,任何事務(wù)看到的數(shù)據(jù)總保持一致;3)隔離性: 數(shù)據(jù)庫通過加鎖,保證事務(wù)之間相互隔離,從而避免臟讀、幻讀等;4)持久性:為避免數(shù) 據(jù)庫丟失等意外事故,數(shù)據(jù)庫所有指令都將會(huì)被永久保存,不會(huì)被回滾。

2)NoSQL(Not Only SQL)數(shù)據(jù)庫

NoSQL 數(shù)據(jù)庫嘗試解決關(guān)系型數(shù)據(jù)庫的擴(kuò)展可用性缺陷。不同于關(guān)系型數(shù)據(jù)庫,NoSQL 數(shù)據(jù)庫只遵守 BASE 模型:基本可用 Basically Avaliable、軟狀態(tài) Soft state、最終一致性 Eventual consistency:1)基本可用:當(dāng)系統(tǒng)出現(xiàn)故障時(shí),NoSQL 數(shù)據(jù)庫不像關(guān)系型數(shù)據(jù) 庫一樣進(jìn)行強(qiáng)制拒絕,而是允許損失部分可用功能或降低響應(yīng)速度,以保證核心功能可用; 2)軟狀態(tài):在處理數(shù)據(jù)過程中,允許數(shù)據(jù)狀態(tài)出現(xiàn)暫時(shí)不一致的情況;3)最終一致性: NoSQL 數(shù)據(jù)庫只追求最終的結(jié)果一致,數(shù)據(jù)處理的過程中暫時(shí)不一致將被允許。NoSQL 數(shù)據(jù)庫解決了關(guān)系型數(shù)據(jù)庫剛性架構(gòu)的拓展性缺陷,NoSQL 的動(dòng)態(tài)架構(gòu)可實(shí)現(xiàn)橫向擴(kuò)展。

NoSQL 數(shù)據(jù)庫更適用于海量數(shù)據(jù)的快速讀寫場(chǎng)景。NoSQL 概念早在 1998 年就已經(jīng)被 Carlo Strozzi 提出,21 世紀(jì)初才進(jìn)入規(guī)?;l(fā)展階段,主要原因在于 2008 年互聯(lián)網(wǎng)進(jìn)入 Web 2.0 時(shí)代,大量非結(jié)構(gòu)化數(shù)據(jù)出現(xiàn),數(shù)據(jù)量呈現(xiàn)指數(shù)型增長(zhǎng),傳統(tǒng)的關(guān)系型數(shù)據(jù)在非 結(jié)構(gòu)化數(shù)據(jù)處理、海量數(shù)據(jù)快速讀寫、數(shù)據(jù)庫擴(kuò)展等方面的劣勢(shì)逐漸暴露,因此,基于 BASE 特性的 NoSQL 架構(gòu)被重新提出并得到快速發(fā)展,MongoDB、Redis、HBase 等 NoSQL 數(shù) 據(jù)庫逐步進(jìn)入大眾視野,并實(shí)現(xiàn)了在電商、社交網(wǎng)絡(luò)、搜索引擎等領(lǐng)域的應(yīng)用落地。

常見 NoSQL 數(shù)據(jù)庫主要包括鍵值型數(shù)據(jù)庫、列族數(shù)據(jù)庫、文檔數(shù)據(jù)庫、圖數(shù)據(jù)庫: (1)鍵值型數(shù)據(jù)庫:適用于內(nèi)容緩存,如會(huì)話、配置文件、參數(shù)等。其擴(kuò)展性高,靈活性 好,大量操作時(shí)性能高,但數(shù)據(jù)無結(jié)構(gòu)化,查詢方法單一; (2)列族數(shù)據(jù)庫:適用于分布式數(shù)據(jù)存儲(chǔ)與管理,將同一列數(shù)據(jù)存在一起,可擴(kuò)展性強(qiáng), 查找速度快,復(fù)雜性低,但功能局限; (3)文檔數(shù)據(jù)庫:適用于存儲(chǔ)文檔數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)靈活,但缺乏統(tǒng)一查詢語法; (4)圖數(shù)據(jù)庫:適用于圖像數(shù)據(jù)、社交網(wǎng)絡(luò)、推薦系統(tǒng),專注構(gòu)建關(guān)系圖譜,支持復(fù)雜的 圖形算法,但只能支持一定的數(shù)據(jù)規(guī)模。

3)NewSQL 數(shù)據(jù)庫

NewSQL 數(shù)據(jù)庫實(shí)現(xiàn)關(guān)系型數(shù)據(jù)庫與 NoSQL 數(shù)據(jù)庫的優(yōu)勢(shì)整合。盡管 NoSQL 數(shù)據(jù)庫處 理數(shù)據(jù)的速度快,常用于處理海量數(shù)據(jù),但 NoSQL 數(shù)據(jù)庫并不遵守 ACID 原則,無法滿足 事務(wù)一致性要求。2011 年,Matthew Aslett 提出 NewSQL(可橫向擴(kuò)展的 OLTP 關(guān)系型數(shù) 據(jù)庫)概念,2012 年谷歌公司發(fā)布 Spanner 與 F1 論文,用原子鐘和 Truetime API 解決分 布式問題,推動(dòng) NewSQL 快速發(fā)展。NewSQL 架構(gòu)旨在整合關(guān)系型數(shù)據(jù)庫與 NoSQL 數(shù)據(jù) 庫的優(yōu)勢(shì):1)保留 NoSQL 數(shù)據(jù)庫對(duì)海量數(shù)據(jù)處理的速度與可擴(kuò)展性;2)采用以 SQL 為 主要接口的關(guān)系數(shù)據(jù)模型,保持傳統(tǒng)關(guān)系型數(shù)據(jù)庫的 ACID 特性。 近年來 NewSQL 數(shù)據(jù)庫快速發(fā)展,主要包括三類發(fā)展路徑:1)基于全新的架構(gòu)設(shè)計(jì),代 表產(chǎn)品為 Google Spanner、SAP HANA;2)基于分片中間件,代表產(chǎn)品為 ScaleArc;3) 基于云服務(wù)商的 DaaS(database-as-a-service)平臺(tái),代表產(chǎn)品為 Amazon Aurora、ClearDB。

關(guān)系型數(shù)據(jù)庫與非關(guān)系型數(shù)據(jù)庫各有千秋。對(duì)比來看,1)關(guān)系型數(shù)據(jù)庫:嚴(yán)格遵守 ACID 原則,具備較強(qiáng)的約束性以及數(shù)據(jù)完整性,利于數(shù)據(jù)庫的管理的同時(shí)也導(dǎo)致數(shù)據(jù)庫難以擴(kuò) 展,在業(yè)務(wù)快速發(fā)展的信息時(shí)代存在一定的成本劣勢(shì);其二維的數(shù)據(jù)結(jié)構(gòu)減少了數(shù)據(jù)的冗 余,但讀取海量數(shù)據(jù)效率不理想;作為傳統(tǒng)數(shù)據(jù)庫,關(guān)系型數(shù)據(jù)庫發(fā)展時(shí)間長(zhǎng),技術(shù)成熟, 學(xué)習(xí)成本低;2)NoSQL 數(shù)據(jù)庫:遵守 BASE 原則,相較于關(guān)系型數(shù)據(jù)庫,更便于擴(kuò)展, 儲(chǔ)存模式簡(jiǎn)單,查詢速度更快;但其極高的可用性在一致性上做出了妥協(xié),使用成本較高 且不利于管理,相關(guān)技術(shù)具備較高的成熟度;3)NewSQL 數(shù)據(jù)庫:在底層解決了事務(wù)一 致性問題,并整合了 NoSQL 在可擴(kuò)展性、可用性上的優(yōu)勢(shì),但 NewSQL 技術(shù)較新,學(xué)習(xí) 成本較高,且目前大多 NewSQL 只適用特定場(chǎng)景,距離普及還需要一定時(shí)間。

按架構(gòu)模型分類:集中式架構(gòu)、分布式架構(gòu)

集中式數(shù)據(jù)庫指將信息存儲(chǔ)、維護(hù)在單個(gè)位置的數(shù)據(jù)庫。集中式數(shù)據(jù)庫利用系統(tǒng)中心的服 務(wù)器統(tǒng)一管理所有資源,對(duì)數(shù)據(jù)進(jìn)行集中儲(chǔ)存及管理,并由一臺(tái)機(jī)器作為服務(wù)器。由于集 中數(shù)據(jù)庫的所有數(shù)據(jù)僅存儲(chǔ)在單個(gè)位置,因此在數(shù)據(jù)訪問、協(xié)調(diào)、管理方面具有突出優(yōu)勢(shì), 同時(shí)相較于其他數(shù)據(jù)庫成本更低,為大多數(shù)企業(yè)最開始的選擇。但隨著數(shù)據(jù)存儲(chǔ)需求的變 化,集中式數(shù)據(jù)庫的缺點(diǎn)逐漸顯現(xiàn):1)難以擴(kuò)展:只能通過提升硬件性能實(shí)現(xiàn)數(shù)據(jù)處理性 能的提升;2)容災(zāi)性差:集中式數(shù)據(jù)庫采用完全共享(Shared-everything)架構(gòu),一旦任 何環(huán)節(jié)發(fā)生系統(tǒng)故障,整個(gè)數(shù)據(jù)庫系統(tǒng)都將無法使用。

常見的集中式數(shù)據(jù)庫架構(gòu),主要包括一主多備、一寫多讀、多寫多讀三類:1)一主多備(備 用不可讀):使用單臺(tái)主機(jī)模式部署,其他備機(jī)為主機(jī)備份數(shù)據(jù),并在主機(jī)宕機(jī)的情況下代 替主機(jī)提供服務(wù);2)一寫多讀:一個(gè)節(jié)點(diǎn)提供寫服務(wù),其他多個(gè)節(jié)點(diǎn)提供讀服務(wù),寫節(jié)點(diǎn) 宕機(jī)時(shí),讀節(jié)點(diǎn)可以代替寫節(jié)點(diǎn)來提供服務(wù);3)多寫多讀:多個(gè)計(jì)算節(jié)點(diǎn)共享存儲(chǔ),每個(gè) 節(jié)點(diǎn)都提供讀寫服務(wù),同時(shí)采用分布式鎖或集中式鎖解決寫沖突。 分布式架構(gòu)逐漸成熟,主要解決集中式架構(gòu)擴(kuò)展性差的問題。不同于既重視數(shù)據(jù)庫統(tǒng)一處 理數(shù)據(jù)的架構(gòu),分布式數(shù)據(jù)庫將數(shù)據(jù)分散在多個(gè)相互連接的節(jié)點(diǎn)上,通過使用多臺(tái)機(jī)器, 將需要處理的數(shù)據(jù)、工作均衡分散到各個(gè)節(jié)點(diǎn)中,各節(jié)點(diǎn)相互連接又能夠獨(dú)立工作,節(jié)點(diǎn) 故障不會(huì)對(duì)其他節(jié)點(diǎn)產(chǎn)生影響。因此,近年來隨業(yè)務(wù)拓展與數(shù)據(jù)體量變大,分布式架構(gòu)成 為眾多企業(yè)的選擇。分布式數(shù)據(jù)庫涵蓋兩大核心技術(shù):1)數(shù)據(jù)的復(fù)制/分區(qū):通過復(fù)制或分 區(qū)實(shí)現(xiàn)數(shù)據(jù)的多節(jié)點(diǎn)存放,復(fù)制包括主從復(fù)制、對(duì)等復(fù)制,分區(qū)包括垂直分區(qū)、水平分區(qū) (即分片);2)分布式事務(wù):通過機(jī)制設(shè)計(jì)保證分布式環(huán)境下事務(wù)的 ACID 特性,包括兩 階段提交(2PC)、三階段提交(3PC)、最大努力通知等解決方案。

分布式數(shù)據(jù)庫技術(shù)路線選擇上,都是以解決數(shù)據(jù)容量擴(kuò)展問題為首要目標(biāo),主流方案包括 三類:1)分庫分表+中間件:下層的單機(jī)數(shù)據(jù)庫提供存儲(chǔ)和執(zhí)行能力,在多個(gè)單機(jī)數(shù)據(jù)庫 上封裝一層中間層補(bǔ)充分布式能力,以統(tǒng)一的數(shù)據(jù)分片規(guī)則管理分布在不同數(shù)據(jù)庫節(jié)點(diǎn)的 數(shù)據(jù);2)共享存儲(chǔ)架構(gòu):計(jì)算節(jié)點(diǎn)獨(dú)立并且共享一個(gè)不帶計(jì)算功能的存儲(chǔ)集群 (Shared-storage),采用存算分離架構(gòu),計(jì)算層和存儲(chǔ)層都可以動(dòng)態(tài)擴(kuò)縮容;3)去中心化 架構(gòu):每個(gè)節(jié)點(diǎn)有獨(dú)立的計(jì)算和存儲(chǔ)功能,采用存算分離架構(gòu),并且節(jié)點(diǎn)之間不共享數(shù)據(jù) (Shared-nothing),分布式集群的每個(gè)節(jié)點(diǎn)都是獨(dú)立節(jié)點(diǎn)。

按業(yè)務(wù)負(fù)載分類:OLAP、OLTP、HTAP

OLAP 為分析型數(shù)據(jù)庫,OLTP 系統(tǒng)為事務(wù)型數(shù)據(jù)庫。按業(yè)務(wù)負(fù)載類型區(qū)分,數(shù)據(jù)庫大致 可以分成兩大類:聯(lián)機(jī)事務(wù)處理 OLTP(On-Line Transaction Processing)、聯(lián)機(jī)分析處理 OLAP(On-Line Analytical Processing):1)OLTP 是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的主要應(yīng)用,主 要是基本的、日常的事務(wù)處理,記錄即時(shí)的增、刪、改、查,例如銀行交易;2)OLAP 是 數(shù)據(jù)倉庫系統(tǒng)的主要應(yīng)用,支持復(fù)雜的分析操作,側(cè)重決策支持,并且提供直觀易懂的查 詢結(jié)果,典型的應(yīng)用就是復(fù)雜的動(dòng)態(tài)報(bào)表系統(tǒng)。

發(fā)展趨勢(shì):數(shù)據(jù)、計(jì)算雙重變化加速分布式數(shù)據(jù)庫時(shí)代到來

數(shù)據(jù)庫的發(fā)展與計(jì)算載體緊密相關(guān)。數(shù)據(jù)庫是計(jì)算機(jī)行業(yè)的基礎(chǔ)核心軟件,所有應(yīng)用軟件 的運(yùn)行和數(shù)據(jù)處理都要與其進(jìn)行數(shù)據(jù)交互。數(shù)據(jù)庫的開發(fā)難度,不僅體現(xiàn)在與其他基礎(chǔ)器 件的適配,更在于如何實(shí)現(xiàn)對(duì)數(shù)據(jù)高效、穩(wěn)定、持續(xù)的管理。從數(shù)據(jù)庫的發(fā)展歷程來看, 計(jì)算架構(gòu)的變化,計(jì)算載體的變化、計(jì)算場(chǎng)景的變化,以及計(jì)算數(shù)據(jù)格式的變化都對(duì)數(shù)據(jù) 庫的發(fā)展帶來一定影響?;蛘哒f,在以上計(jì)算環(huán)境變化下,其需要的數(shù)據(jù)庫類型也發(fā)生了 變化。 從計(jì)算載體來看,數(shù)據(jù)的計(jì)算從原來的大型機(jī)、到小型機(jī)、個(gè)人電腦 PC、互聯(lián)網(wǎng)、移動(dòng)互 聯(lián)網(wǎng)、云計(jì)算,以及未來更多終端的物聯(lián)網(wǎng)智能終端。計(jì)算的載體更加多樣化。 從計(jì)算場(chǎng)景來看,數(shù)據(jù)計(jì)算也從單獨(dú)的單機(jī)計(jì)算,到互聯(lián)網(wǎng)多群體交互的聯(lián)網(wǎng)計(jì)算和云計(jì) 算,以及萬物互聯(lián)的高并發(fā)、低時(shí)延的物聯(lián)網(wǎng)計(jì)算。 從計(jì)算架構(gòu)來看,傳統(tǒng)的 IT 架構(gòu)也正逐步向云架構(gòu)遷移。我們也經(jīng)歷了從 C-S 架構(gòu)到 B-S 架構(gòu),而目前的云原生、分布式計(jì)算架構(gòu)正對(duì)傳統(tǒng)計(jì)算架構(gòu)帶來深刻變革。而新的計(jì)算架 構(gòu)也對(duì)計(jì)算的基礎(chǔ)軟件(操作系統(tǒng)、數(shù)據(jù)庫、芯片等)提出更高的需求。

在以上計(jì)算環(huán)境的變化下,我們看到,聯(lián)網(wǎng)的數(shù)據(jù)也在發(fā)生深刻變化。 數(shù)據(jù)的大小。目前聯(lián)網(wǎng)數(shù)據(jù)量也在高速增長(zhǎng)。通信技術(shù)的發(fā)展帶動(dòng)從 2G 到 3G、4G、5G 的演進(jìn),每代通信技術(shù)之間,聯(lián)網(wǎng)的數(shù)據(jù)規(guī)模也呈現(xiàn)(幾個(gè))數(shù)量級(jí)的增加。對(duì)大容量、 高性能計(jì)算提出更高要求。 數(shù)據(jù)的類型。計(jì)算場(chǎng)景的演變,我們對(duì)數(shù)據(jù)的定義也在發(fā)生變化。圖片、語音、視頻等非 結(jié)構(gòu)化數(shù)據(jù)成為增量數(shù)據(jù)的主要類型。聯(lián)網(wǎng)的數(shù)據(jù)類型也逐步從原來的結(jié)構(gòu)化數(shù)據(jù)到非結(jié) 構(gòu)化數(shù)據(jù)演變,這就對(duì)計(jì)算的并發(fā)性提出了更高的要求。 數(shù)據(jù)的快慢。對(duì)數(shù)據(jù)的高速計(jì)算是計(jì)算機(jī)一直以來的追求。但原有的 IT 架構(gòu)下,計(jì)算速度 的提升存在一定的物理?xiàng)l件限制。經(jīng)典的 IT 架構(gòu)已經(jīng)存在了幾十年的歷史,當(dāng)時(shí)的 IT 架構(gòu) 并沒有完全考慮到目前計(jì)算場(chǎng)景的變化。因此,新的計(jì)算場(chǎng)景下,對(duì)數(shù)據(jù)高速計(jì)算的追求, 需要我們從底層基礎(chǔ)軟件的變革開始。我們看到無論芯片、操作系統(tǒng)還是數(shù)據(jù)庫,都在經(jīng) 歷深刻變革。

全球關(guān)系型數(shù)據(jù)庫市場(chǎng)增速漸趨平穩(wěn)。近年來受數(shù)據(jù)量激增以及數(shù)據(jù)類型不斷豐富影響, 傳統(tǒng)關(guān)系型數(shù)據(jù)庫的流行程度呈下降趨勢(shì),據(jù) DB-Engines 數(shù)據(jù)顯示,近 24 個(gè)月關(guān)系型數(shù) 據(jù)庫的市場(chǎng)流行度下降 8.23pct,市場(chǎng)增速逐步趨于平緩,據(jù) T4.ai 預(yù)測(cè),2018-2022 年全 球關(guān)系型數(shù)據(jù)庫市場(chǎng)規(guī)模復(fù)合增長(zhǎng)率為 6%,較 2012-2017 年的 11%或?qū)⒂兴陆怠7顷P(guān) 系型數(shù)據(jù)庫的市場(chǎng)份額占比快速提升,根據(jù) Gartner 2021 年發(fā)布的《全球數(shù)據(jù)庫管理系統(tǒng) (DBMS)市場(chǎng)報(bào)告》,2021 年全球非關(guān)系型數(shù)據(jù)庫的市場(chǎng)收入達(dá) 148 億美元,占總體數(shù) 據(jù)庫市場(chǎng)的 19%,相較于 2017 年 8%的市場(chǎng)占比,非關(guān)系型數(shù)據(jù)庫的市場(chǎng)份額顯著提升。

全球數(shù)據(jù)量激增,分布式數(shù)據(jù)庫機(jī)遇顯現(xiàn)。隨著智能移動(dòng)手機(jī)普及、云計(jì)算的興起以及互 聯(lián)網(wǎng)的快速發(fā)展,全球數(shù)據(jù)量不斷攀升,據(jù) IDC 數(shù)據(jù)顯示,全球數(shù)據(jù)量已從 2010 年的 1.2ZB 增長(zhǎng)至 2020 年的 59ZB,復(fù)合增長(zhǎng)率高達(dá) 47.63%。據(jù) IDC 預(yù)測(cè),2025 年全球數(shù)據(jù)量將進(jìn) 一步增長(zhǎng)至 175ZB,2020-2025 年復(fù)合增長(zhǎng)率為 24.29%。隨著數(shù)據(jù)量上升,全球數(shù)據(jù)庫規(guī) ??焖僭鲩L(zhǎng),據(jù) Gartner 預(yù)測(cè),2024 年全球數(shù)據(jù)庫市場(chǎng)規(guī)模有望突破千億美元,2018-2024 年復(fù)合增長(zhǎng)率為 13.78%,同時(shí)大數(shù)據(jù)分析、高并發(fā)計(jì)算、非結(jié)構(gòu)化/異構(gòu)數(shù)據(jù)處理的需求日 益顯現(xiàn),分布式數(shù)據(jù)庫兼具拓展性與高可用性,或?qū)⒊蔀閿?shù)據(jù)庫行業(yè)新的增量市場(chǎng)。

在非結(jié)構(gòu)化數(shù)據(jù)與高并發(fā)計(jì)算需求的推動(dòng)下,分布式數(shù)據(jù)時(shí)代加速到來。在計(jì)算、數(shù)據(jù)的 雙重變革下,我們認(rèn)為,數(shù)據(jù)庫行業(yè)的發(fā)展演進(jìn)也將經(jīng)歷重要的技術(shù)變革。在傳統(tǒng)計(jì)算環(huán) 境和數(shù)據(jù)類型方面,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫依然發(fā)揮著重要的作用;但面向未來新的計(jì)算場(chǎng) 景與數(shù)據(jù)需求,數(shù)據(jù)庫產(chǎn)品亟需進(jìn)行技術(shù)升級(jí)以適應(yīng)下游需求的變化,通過統(tǒng)計(jì)國內(nèi)外典 型數(shù)據(jù)庫廠商的技術(shù)路線及產(chǎn)品體系變化,我們判斷,數(shù)據(jù)庫行業(yè)已進(jìn)入以云數(shù)據(jù)庫、分 布式數(shù)據(jù)庫為代表的 3.0 階段。

競(jìng)爭(zhēng)格局:海外數(shù)據(jù)庫先發(fā)優(yōu)勢(shì)突出,國產(chǎn)數(shù)據(jù)庫快速發(fā)展

全球數(shù)據(jù)庫產(chǎn)業(yè)呈現(xiàn)海外廠商主導(dǎo)的典型特征。相較海外廠商來說,國內(nèi)數(shù)據(jù)庫研究起步 較晚,大約是 20 世紀(jì) 90 年代改革開放以后才開始進(jìn)入萌芽階段,該階段數(shù)據(jù)庫研究主要 源自國家的相關(guān)研究計(jì)劃或者大學(xué)科研需求,缺乏實(shí)際的業(yè)務(wù)場(chǎng)景驅(qū)動(dòng),因此數(shù)據(jù)庫技術(shù) 發(fā)展較為緩慢。從全球市場(chǎng)來看,以 Microsoft、Oracle 為代表的海外數(shù)據(jù)庫數(shù)據(jù)庫廠商仍 占據(jù)絕大部分市場(chǎng)份額,處于絕對(duì)領(lǐng)導(dǎo)地位,根據(jù) Gartner 發(fā)布的《2018 年全球數(shù)據(jù)庫研 究報(bào)告》,全球共 14 家企業(yè)入選事務(wù)型數(shù)據(jù)庫魔力四象限(中國僅 1 家入榜),19 家企業(yè) 入選分析型數(shù)據(jù)庫魔力四象限(中國僅 3 家入榜),處于領(lǐng)導(dǎo)者象限的企業(yè)均為海外廠商。

根據(jù) Gartner 發(fā)布的《全球數(shù)據(jù)庫市場(chǎng)份額報(bào)告 2021》,微軟連續(xù)兩年市場(chǎng)占有率排名第一, 2021 年占全球市場(chǎng)份額 24.0%,與 2020 年相比略有下降;亞馬遜云科技 AWS 市場(chǎng)占有 率排名上升,主要受其云數(shù)據(jù)庫產(chǎn)品快速增長(zhǎng)帶動(dòng),2021 年 AWS 云數(shù)據(jù)庫產(chǎn)品同比增長(zhǎng) 42.3%,約為全球云數(shù)據(jù)庫市場(chǎng)增長(zhǎng)率 22.3%的兩倍;Oracle 數(shù)據(jù)庫市場(chǎng)占有率排名略有 下降,2021 年占全球市場(chǎng)份額 20.6%,主要由于 Oracle 云數(shù)據(jù)庫增速遠(yuǎn)低于市場(chǎng)增速。

國產(chǎn)數(shù)據(jù)庫國際影響力快速提升:1)云數(shù)據(jù)庫表現(xiàn)優(yōu)異: 2019 年 OceanBase 數(shù)據(jù)庫打 破數(shù)據(jù)庫基準(zhǔn)性能測(cè)試(TPC-C)世界紀(jì)錄,且于 2019-2021 年連續(xù)三年穩(wěn)居首位;2021 年阿里云、華為云數(shù)據(jù)庫產(chǎn)品分別入選 Gartner《全球云數(shù)據(jù)庫魔力象限報(bào)告》領(lǐng)導(dǎo)者象限、 特定領(lǐng)域者象限;2)非關(guān)系型數(shù)據(jù)庫受國際認(rèn)可:根據(jù) DB-Engines 發(fā)布的數(shù)據(jù)庫管理系 統(tǒng)受歡迎程度排名,2021 年 2 月,智臾科技 DolphinDB 榮登時(shí)序數(shù)據(jù)庫排行第 10 位,2022 年 10 月,智臾科技 DolphinDB、濤思數(shù)據(jù) TDengine、阿里 TSDB,依次位列時(shí)序數(shù)據(jù)庫 排行第 9、13、35 位;2021 年 5 月,歐若數(shù)網(wǎng) Nebula Graph、華為云 GraphBase 、百 度智能云 HugeGraph 圖數(shù)據(jù)庫,依次位列圖數(shù)據(jù)庫排行第 15、28、30 名。

數(shù)據(jù)庫產(chǎn)品包含開源數(shù)據(jù)庫、商業(yè)數(shù)據(jù)庫兩種商業(yè)模式。其中,商業(yè)數(shù)據(jù)庫收費(fèi)方式主要 有兩種:1)本地部署:本地部署的商業(yè)數(shù)據(jù)庫,一般采用 License 訂閱方式收費(fèi),一般按 用戶數(shù)或者按 CPU 數(shù)定價(jià),按年訂閱,以 Oracle 為典型代表;2)公有云部署:公有云部 署的商業(yè)數(shù)據(jù)庫,除了 License 收費(fèi)還可采用 SaaS 收費(fèi)方式,用戶可按用量付費(fèi),按年/ 季度/月收費(fèi),以 Snowflake 為典型代表;開源數(shù)據(jù)庫供用戶免費(fèi)使用,主要商業(yè)模式包括 三種:1)完全開源式:借助基金會(huì)完全托管,以 HBase 為典型代表;2)開源版本和商業(yè) 版本分別運(yùn)營(yíng):通過運(yùn)營(yíng)開源版本社區(qū)積累人才、應(yīng)用場(chǎng)景、市場(chǎng)品牌等,再通過售賣商 業(yè)版本獲取利潤(rùn),以 TiDB 為典型代表;3)先開源后閉源:運(yùn)作前期通過開源社區(qū)優(yōu)化產(chǎn) 品與品牌,之后停止社區(qū)的維護(hù)將產(chǎn)品閉源商業(yè)化,以 Neo4j 為典型代表。

國產(chǎn)數(shù)據(jù)庫:產(chǎn)業(yè)機(jī)遇明朗,國產(chǎn)品牌迅速成長(zhǎng)

國產(chǎn)數(shù)據(jù)庫迎來產(chǎn)業(yè)黃金期,國產(chǎn)替代空間廣闊。國產(chǎn)數(shù)據(jù)庫產(chǎn)業(yè)黃金期加速到來,主要 受三方面因素影響:1)數(shù)據(jù)庫廣泛開源:全球數(shù)據(jù)庫開源趨勢(shì)明顯,據(jù) DB-Engines 數(shù)據(jù) 顯示,2021 年 1 月起開源數(shù)據(jù)庫流行程度反超商業(yè)數(shù)據(jù)庫,數(shù)據(jù)庫開源為國產(chǎn)數(shù)據(jù)庫發(fā)展 提供了良好的技術(shù)生態(tài);2)國產(chǎn)化替代逐步推進(jìn):國產(chǎn)數(shù)據(jù)庫作為信創(chuàng)的關(guān)鍵環(huán)節(jié),隨國 產(chǎn)化替代深入推進(jìn)而受到高度重視,產(chǎn)品、技術(shù)均實(shí)現(xiàn)快速發(fā)展;3)云數(shù)據(jù)庫日益興起: 從全球數(shù)據(jù)庫部署占比來看,云數(shù)據(jù)庫產(chǎn)業(yè)趨勢(shì)明朗,受益于高人口基數(shù)與應(yīng)用軟件繁榮 帶來場(chǎng)景紅利,國產(chǎn)云數(shù)據(jù)庫爆發(fā)巨大的產(chǎn)品優(yōu)勢(shì)。根據(jù)艾瑞咨詢發(fā)布的《中國數(shù)據(jù)庫行 業(yè)研究報(bào)告》,2020 年國產(chǎn)數(shù)據(jù)庫占全國市場(chǎng) 47%,僅存量市場(chǎng)的替換空間已超 130 億。

技術(shù)沉淀疊加信創(chuàng)需求,國產(chǎn)數(shù)據(jù)庫迎來黃金發(fā)展期

國產(chǎn)數(shù)據(jù)庫發(fā)展順應(yīng)國家需求,國產(chǎn)替代加速產(chǎn)業(yè)發(fā)展。1995 年,國家郵電部提出開發(fā)和 建設(shè)“市內(nèi)電話業(yè)務(wù)計(jì)算機(jī)綜合管理系統(tǒng)”,即“九七工程”,在此背景下,國內(nèi)第一批數(shù) 據(jù)庫企業(yè)開始發(fā)展,早期國內(nèi)數(shù)據(jù)庫行業(yè)高度依賴大學(xué)以及國家政府機(jī)關(guān),主要用來滿足 國家部門的使用需求。2009 年以前,國內(nèi)銀行以及企業(yè)高度依賴 IMB、Oracle 等海外廠商 研發(fā)的數(shù)據(jù)庫系統(tǒng),單方向的技術(shù)依賴使國內(nèi)廠商處于被動(dòng)態(tài)勢(shì)。2013 年,棱鏡門事件爆 發(fā),信息安全的自主可控成為國家需求,國內(nèi)企業(yè)積極響應(yīng)國家需求,自主研發(fā)數(shù)據(jù)庫系 統(tǒng)。國產(chǎn)數(shù)據(jù)庫作為國產(chǎn)化替代的重要環(huán)節(jié),在我國信創(chuàng)產(chǎn)業(yè)政策的指引下實(shí)現(xiàn)加速發(fā)展。

總體來看,國產(chǎn)數(shù)據(jù)庫的發(fā)展歷程大致可分為三個(gè)階段: 1)海外壟斷期(1978-2000 年):SQL 體系初建立,美國三巨頭(Oracle,MySQL,SQL Server)相繼初露崢嶸,并逐步統(tǒng)治全球市場(chǎng)。1977 年國內(nèi)召開第一次數(shù)據(jù)庫年會(huì),改革 開放引領(lǐng)浪潮,積極引入國外技術(shù),以三大巨頭為代表的海外數(shù)據(jù)庫于 90 年代席卷中國; 2)國產(chǎn)萌芽期(2000-2009 年):“十五”計(jì)劃期間,國家 863 計(jì)劃設(shè)立“數(shù)據(jù)庫重大專項(xiàng)”, 國內(nèi)研究所與大學(xué)積極投入數(shù)據(jù)庫研究,IT 社區(qū)逐步興起;1999 年,中國首個(gè)數(shù)據(jù)庫“人 大金倉 KingbaseES 數(shù)據(jù)庫系統(tǒng)”誕生,隨后武漢達(dá)夢(mèng)數(shù)據(jù)庫、神通數(shù)據(jù)庫系統(tǒng)等國產(chǎn)數(shù) 據(jù)庫系統(tǒng)相繼面世,打破了 Oracle、IBM 的市場(chǎng)壟斷格局; 3)快速發(fā)展期(2009 年至今):2009 年,阿里巴巴成立阿里云,開始研發(fā)自己的數(shù)據(jù)庫 產(chǎn)品 AliSQL;隨后,華為、騰訊等企業(yè)相繼加入自主研發(fā)隊(duì)伍,推出自有數(shù)據(jù)庫產(chǎn)品;云 計(jì)算時(shí)代與開源社區(qū)的興起,國產(chǎn)數(shù)據(jù)庫實(shí)現(xiàn)彎道超車,基于 NoSQL 等新技術(shù)的數(shù)據(jù)庫產(chǎn) 品加速面世。2019 年,國外廠商神話被打破,螞蟻集團(tuán)的 OceanBase 數(shù)據(jù)庫成功登頂世 界上最權(quán)威的數(shù)據(jù)庫評(píng)測(cè)機(jī)構(gòu) TPC(國際事務(wù)處理性能委員會(huì))排行榜榜首。國產(chǎn)數(shù)據(jù)庫 遜于海外數(shù)據(jù)庫已成為過往,國產(chǎn)自研數(shù)據(jù)庫進(jìn)入百花齊放階段,近年來隨著國產(chǎn)化替代 深入推進(jìn),軟件廠商、集成商、運(yùn)營(yíng)商紛紛入局?jǐn)?shù)據(jù)庫市場(chǎng),我國數(shù)據(jù)庫產(chǎn)業(yè)加速發(fā)展。

經(jīng)過多年技術(shù)研發(fā)和經(jīng)驗(yàn)積累,國產(chǎn)數(shù)據(jù)庫市場(chǎng)份額逐年提升。以人大金倉、南大通用、 神舟通用為代表的國產(chǎn)數(shù)據(jù)庫廠商自 1999 創(chuàng)建以來不斷發(fā)力,逐步打破了海外廠商的壟斷 局面,同時(shí)數(shù)據(jù)庫初創(chuàng)廠商、云廠商等也加速發(fā)力,快速替換海外數(shù)據(jù)庫廠商的市場(chǎng)份額。 根據(jù)智研咨詢數(shù)據(jù)顯示,國產(chǎn)數(shù)據(jù)庫企業(yè)的市場(chǎng)占比已從 2009 年的 4.19%提升至 2017 年 的 16.64%;根據(jù)艾瑞咨詢發(fā)布的《中國數(shù)據(jù)庫行業(yè)研究報(bào)告》,2020 年國產(chǎn)數(shù)據(jù)庫市場(chǎng)占 比已提升至 47.4%,其中傳統(tǒng)數(shù)據(jù)庫廠商占比 7.1%,國產(chǎn)云數(shù)據(jù)庫等新興廠商占比40.3%。 根據(jù) IDC 發(fā)布的《2021 年上半年中國關(guān)系型數(shù)據(jù)庫軟件市場(chǎng)跟蹤報(bào)告》,在傳統(tǒng)部署模式 市場(chǎng)中,華為、阿里、達(dá)夢(mèng)數(shù)據(jù)、人大金倉的市占率分別為 14.7%、5.7%、5.7%、5.0%, 在公有云部署模式市場(chǎng)中,阿里、騰訊、華為的市占率分別為 44.7%、17.4%、7.4%。

關(guān)系型數(shù)據(jù)庫占主流地位,市場(chǎng)競(jìng)爭(zhēng)格局初顯

國產(chǎn)數(shù)據(jù)庫參與廠商包括傳統(tǒng)廠商、初創(chuàng)廠商、云廠商和跨界廠商四類。1)傳統(tǒng)廠商:以 達(dá)夢(mèng)數(shù)據(jù)、人大金倉、南大通用等企業(yè)為代表的傳統(tǒng)數(shù)據(jù)庫廠商,是我國最早參與數(shù)據(jù)庫 研發(fā)、應(yīng)用的企業(yè),在數(shù)據(jù)庫領(lǐng)域具有深厚的技術(shù)沉淀;2)初創(chuàng)廠商:以巨杉、PingCAP、 偶數(shù)科技、星環(huán)科技等企業(yè)為代表的初創(chuàng)廠商,依托于新興的數(shù)據(jù)庫技術(shù)與需求,近年來 實(shí)現(xiàn)蓬勃發(fā)展;3)云廠商:以阿里巴巴、騰訊等企業(yè)為代表的云數(shù)據(jù)庫廠商,得益于互聯(lián) 網(wǎng)業(yè)務(wù)和開源技術(shù)的快速發(fā)展,積極搭建自研云數(shù)據(jù)庫平臺(tái),迅速占領(lǐng)云數(shù)據(jù)庫市場(chǎng)份額; 4)跨界廠商:以中興、浪潮等企業(yè)為代表的跨界廠商,積極布局企業(yè)級(jí)數(shù)據(jù)庫市場(chǎng)。

根據(jù)源代碼來源不同,國產(chǎn)數(shù)據(jù)庫代碼來源可分為三大類: 1)基于開源代碼研發(fā):MySQL 系的巨杉數(shù)據(jù)庫、阿里云數(shù)據(jù)庫,PostgreSQL 系的華為 Gauss 數(shù)據(jù)庫; 2)收購商業(yè)源碼+自研:南大通用收購 IBM 的 Informix 數(shù)據(jù)庫源碼; 3)獨(dú)立自研:以武漢達(dá)夢(mèng)數(shù)據(jù)庫為典型代表。

關(guān)系型數(shù)據(jù)庫占主流,多基于 MySQL 和 PostgreSQL 二次開發(fā)而來。關(guān)系數(shù)據(jù)庫作為 傳統(tǒng)數(shù)據(jù)庫產(chǎn)品,誕生時(shí)間早于非關(guān)系型數(shù)據(jù)庫,產(chǎn)品體系更加成熟,在我國數(shù)據(jù)庫市場(chǎng) 中占據(jù)主流地位。1)從數(shù)據(jù)庫數(shù)量來看:根據(jù)中國信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報(bào)告》, 截至 2021 年 6 月,我國數(shù)據(jù)庫產(chǎn)品共有 135 款,其中關(guān)系型數(shù)據(jù)庫 81 個(gè),占比 60%, 非關(guān)系型數(shù)據(jù)庫 54 個(gè),占比 40%;關(guān)系型數(shù)據(jù)庫中基于開源數(shù)據(jù)庫 MySQL 和 PostgreSQL 進(jìn)行二次開發(fā)的個(gè)數(shù)分別為 23 和 24 個(gè),分別占關(guān)系型數(shù)據(jù)庫比例為 28.40% 和 29.63%,合計(jì)占比為 58.03%。2)從市場(chǎng)份額來看:根據(jù)艾瑞咨詢發(fā)布的《中國數(shù)據(jù)庫 行業(yè)研究報(bào)告》,關(guān)系型數(shù)據(jù)庫市場(chǎng)份額占比約為 90%,非關(guān)系數(shù)據(jù)庫市場(chǎng)份額僅約為 10%。

云數(shù)據(jù)庫產(chǎn)品優(yōu)勢(shì)逐步顯現(xiàn),國產(chǎn)廠商掌握?qǐng)鼍凹t利。國產(chǎn)云數(shù)據(jù)庫廠商的快速發(fā)展主要 獲益于我國的互聯(lián)網(wǎng)場(chǎng)景紅利,過去十年互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)在中國快速發(fā)展,國產(chǎn)廠商 享受了高人口基數(shù)與豐富軟件應(yīng)用場(chǎng)景帶來的場(chǎng)景紅利,積極開拓面向海量、高并發(fā)數(shù)據(jù) 的云數(shù)據(jù)庫產(chǎn)品,并憑借產(chǎn)品優(yōu)勢(shì)與本土化業(yè)務(wù)理解迅速占領(lǐng)國內(nèi)市場(chǎng)。根據(jù) IDC 發(fā)布的 《2021H2 中國關(guān)系型數(shù)據(jù)庫軟件市場(chǎng)跟蹤報(bào)告》,2021H2 公有云關(guān)系型數(shù)據(jù)庫規(guī)模為 8.7 億美元,國產(chǎn)云數(shù)據(jù)廠商的市場(chǎng)份額合計(jì)占比超 68%,國產(chǎn)廠商(阿里、騰訊、華為)分 別位居前五名中的第 1、2、4 位,其中阿里處于絕對(duì)龍頭位置,占總體市場(chǎng)份額的 42.5%。

初創(chuàng)廠商不斷涌現(xiàn),數(shù)據(jù)庫產(chǎn)業(yè)體系日益完善

國產(chǎn)廠商多處在發(fā)展初期,具備較大成長(zhǎng)空間。與老牌海外數(shù)據(jù)庫廠商 50 余年的發(fā)展歷史 相比,多數(shù)國產(chǎn)數(shù)據(jù)庫廠商的成立時(shí)長(zhǎng)在 10 年以內(nèi),根據(jù)中國信通院發(fā)布的《數(shù)據(jù)庫發(fā)展 研究報(bào)告》,2013-2017 年成立的數(shù)據(jù)庫廠商數(shù)量占國內(nèi)廠商總數(shù)比重近 50%。由于多數(shù)國 產(chǎn)數(shù)據(jù)庫廠商成立年限較短,因此在人才儲(chǔ)備與技術(shù)積累等方面,仍與海外廠商存在較大 差距。根據(jù)中國信通院發(fā)布的《數(shù)據(jù)庫發(fā)展研究報(bào)告》,員工人數(shù)小于 300 的國產(chǎn)數(shù)據(jù)庫企 業(yè)占比高達(dá) 84%(Oracle 員工 13,700 名),專利數(shù)量小于 50 的國產(chǎn)數(shù)據(jù)庫企業(yè)占比高達(dá) 77%(Oracle 專利 1.4 萬個(gè)),大部分廠商仍然擁有較大的成長(zhǎng)空間。

初創(chuàng)廠商多基于新興數(shù)據(jù)庫技術(shù),關(guān)注非關(guān)系型數(shù)據(jù)庫細(xì)分賽道。2015-2018 年大批初創(chuàng) 數(shù)據(jù)庫廠商成立,包括費(fèi)馬科技、創(chuàng)鄰科技、歐若數(shù)網(wǎng)、蜀天夢(mèng)圖等圖數(shù)據(jù)庫廠商以及浙 江智臾、濤思數(shù)據(jù)等時(shí)序數(shù)據(jù)庫廠商。據(jù)艾瑞咨詢統(tǒng)計(jì),2015 年前后成立大部分初創(chuàng)廠商 均采用 NewSQL、SQL on Hadoop、NoSQL 等新技術(shù)架構(gòu),主要原因在于新技術(shù)架構(gòu)尚處 于發(fā)展階段,同時(shí)更符合互聯(lián)網(wǎng)、金融、物聯(lián)網(wǎng)等應(yīng)用場(chǎng)景的業(yè)務(wù)需求,為初創(chuàng)廠商實(shí)現(xiàn) 新場(chǎng)景下的“彎道超車”提供了更大的可能。初創(chuàng)廠商紛紛涌入非關(guān)系型數(shù)據(jù)庫細(xì)分賽道, 有望帶動(dòng)基于新技術(shù)架構(gòu)的非關(guān)系數(shù)據(jù)庫快速發(fā)展,據(jù)艾瑞咨詢預(yù)測(cè),2020-2025 年以初 創(chuàng)廠商為代表的新興數(shù)據(jù)庫市場(chǎng)規(guī)模有望實(shí)現(xiàn)高于 10 倍的增長(zhǎng)。 國產(chǎn)數(shù)據(jù)庫的支撐體系不斷完善。數(shù)據(jù)庫支撐體系包括學(xué)術(shù)組織、行業(yè)支撐組織、人才培 訓(xùn)體系三大類:1)學(xué)術(shù)組織支撐:主要包括高校、企業(yè)的學(xué)術(shù)理論研究,以及相關(guān)論文在 學(xué)術(shù)領(lǐng)域的學(xué)術(shù)影響;2)行業(yè)支撐組織:主要包括具備官方背景的研究組織、數(shù)據(jù)庫從業(yè) 人員牽頭發(fā)起的用戶組織、由數(shù)據(jù)庫企業(yè)組建的官方技術(shù)社區(qū)、匯聚數(shù)據(jù)庫整體行業(yè)信息 的第三方技術(shù)社區(qū)等;3)人才培訓(xùn)體系:主要包括高校教育培訓(xùn)、專業(yè)機(jī)構(gòu)培訓(xùn)以及企業(yè) 培訓(xùn)。

學(xué)術(shù)研究與行業(yè)發(fā)展齊頭并進(jìn),學(xué)術(shù)影響逐步提升。2016 年-2020 年,我國成為世界第二 大數(shù)據(jù)庫領(lǐng)域論文產(chǎn)出國,發(fā)文量為 1,141 篇,占全球總發(fā)文量 22.4,僅次于美國的 1,319 篇。學(xué)術(shù)界主要有以 VLDB、ICDE、SIGMOD 為首的數(shù)據(jù)庫領(lǐng)域頂級(jí)會(huì)議,高校及企業(yè)在 三大會(huì)議每年貢獻(xiàn)占比平均為 22.14%、23.74%和 23.81%,占比逐年上升,研究方向多 以圖數(shù)據(jù)庫、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、查詢處理等為主。阿里巴巴、華為、騰訊、螞蟻金服、 等企業(yè)和清華大學(xué)、香港科技大學(xué)、北京大學(xué)、香港中文大學(xué)、香港大學(xué)、浙江大學(xué)等高 校論文紛紛入選三大頂會(huì),顯示我國數(shù)據(jù)庫學(xué)術(shù)水平國際影響力不斷擴(kuò)大。

國內(nèi)廠商重視人才培養(yǎng),加快人才培訓(xùn)體系建立。數(shù)據(jù)庫廠商積極搭建官方社區(qū)、開源社 區(qū)、第三方數(shù)據(jù)庫,與全國開發(fā)者積極進(jìn)行技術(shù)討論與交流,加快技術(shù)發(fā)展,如阿里云開 發(fā)者社區(qū)、PostgreSQL 中文社區(qū)、墨天輪等。同時(shí)企業(yè)廠商積極建立培訓(xùn)機(jī)構(gòu)與認(rèn)證體系, 加強(qiáng)與院校的交流,辦理不同的培訓(xùn)課程與證書考試,為我國數(shù)據(jù)行業(yè)培養(yǎng)相關(guān)儲(chǔ)備人才。

數(shù)據(jù)庫開源實(shí)現(xiàn)人才積累,貢獻(xiàn)長(zhǎng)效技術(shù)動(dòng)力。數(shù)據(jù)庫開源對(duì)于實(shí)現(xiàn)人才積累、生態(tài)拓展、 產(chǎn)品技術(shù)迭代具有重要意義,2014 年 12 月,巨杉數(shù)據(jù)庫 SequoiaDB 正式開源,成為國內(nèi) 最早的開源自研數(shù)據(jù)庫項(xiàng)目,此后 PingCAP TiDB、百度 Roris 和 HugeGraph、華為 Gauss、 螞蟻集團(tuán) OceanBase 等國產(chǎn)數(shù)據(jù)庫紛紛擁抱開源,積極構(gòu)建開源生態(tài)社區(qū),實(shí)現(xiàn)了數(shù)據(jù)庫 開發(fā)人才的快速積累。據(jù) Github 發(fā)布的《2021 年度開發(fā)者報(bào)告》顯示,中國作為全球第二 大開發(fā)者來源(755 萬開發(fā)者,占比 9.76%)正在快速成長(zhǎng),據(jù) Github 預(yù)測(cè),中國有望于 2030 年超越美國,成為全球最大的開發(fā)者來源。

各路資本積極入局,國產(chǎn)數(shù)據(jù)庫市場(chǎng)空間廣闊

各路資本紛紛注入數(shù)據(jù)庫產(chǎn)業(yè),產(chǎn)業(yè)態(tài)勢(shì)明朗。根據(jù)中國信通院統(tǒng)計(jì),自 2013 年至 2021 上半年,數(shù)據(jù)庫企業(yè)累計(jì)完成融資約 42 次,單年融資企業(yè)次數(shù)呈現(xiàn)明顯的上漲趨勢(shì)。根據(jù) 沙利文發(fā)布的《2021 年中國分布式數(shù)據(jù)庫》報(bào)告,2021 年是國產(chǎn)數(shù)據(jù)庫投融資最活躍的 一年,2021 年獲得新一輪融資的企業(yè)就多達(dá) 20 家,千萬級(jí)甚至上億級(jí)融資數(shù)量在 14 輪 以上,其中偶數(shù)科技完成 B+輪融資 2 億元,四維縱橫完成 A 輪融資 1 億元,智臾科技完成 B 輪融資 1 億元。國產(chǎn)數(shù)據(jù)庫的投資方包括紅杉、高瓴、經(jīng)緯、云啟、明勢(shì)等眾多知名投 資機(jī)構(gòu),國產(chǎn)自研數(shù)據(jù)庫產(chǎn)業(yè)趨勢(shì)明朗,有望在資本注入下實(shí)現(xiàn)強(qiáng)勁增長(zhǎng)。

據(jù)中國信通院預(yù)測(cè),中國數(shù)據(jù)庫市場(chǎng) 2020-2025 年復(fù)合增長(zhǎng)率將高達(dá) 23.35%,2025 年市 場(chǎng)規(guī)模有望達(dá)到 688 億元,考慮到目前國產(chǎn)數(shù)據(jù)庫市占率仍處于較低水平(2020 年國產(chǎn)數(shù) 據(jù)庫市場(chǎng)占比不足 50%),未來隨我國數(shù)據(jù)庫市場(chǎng)規(guī)模擴(kuò)大與國產(chǎn)數(shù)據(jù)庫替代加速,國產(chǎn)數(shù) 據(jù)庫有望同步擴(kuò)大存量與增量市場(chǎng),國產(chǎn)數(shù)據(jù)庫市場(chǎng)空間前景廣闊。

廠商梳理:海外廠商、國產(chǎn)廠商各具優(yōu)勢(shì)

觀點(diǎn)一:海外廠商向云化方向深度邁進(jìn),SaaS 模式助推新興廠商加速發(fā)展

分布式云數(shù)據(jù)庫成為海外廠商的發(fā)展共識(shí)。通過總結(jié) Oracle、Microsoft、SAP、MongoDB 等海外傳統(tǒng)數(shù)據(jù)庫廠商以及 AWS、Snowflake、databricks 等新興云數(shù)據(jù)庫廠商的發(fā)展路徑、 技術(shù)演進(jìn)以及現(xiàn)有產(chǎn)品體系,可以看到分布式云數(shù)據(jù)庫已成為海外廠商的發(fā)展共識(shí),各類 云托管、云原生數(shù)據(jù)庫不斷面世,加速數(shù)據(jù)庫產(chǎn)品云化轉(zhuǎn)型。傳統(tǒng)數(shù)據(jù)庫廠商基于原有業(yè) 務(wù)優(yōu)勢(shì),以云托管數(shù)據(jù)庫為主要發(fā)展方向,支持?jǐn)?shù)據(jù)庫產(chǎn)品在公有云、私有云、混合云環(huán) 境下部署;新興廠商多選取云原生路線,Snowflake、databricks 等廠商更是推出專門面向 公有云環(huán)境的數(shù)據(jù)倉(分析型數(shù)據(jù)庫)服務(wù),SaaS 模式助力新興廠商業(yè)績(jī)高增,以 Snowflake 為例,截至 2022 年 7 月 31 日,公司年化付費(fèi)超百萬的客戶為 246 個(gè),同比增長(zhǎng) 112%。

觀點(diǎn)二:開源、分布式兩大技術(shù)趨勢(shì)下,國產(chǎn)數(shù)據(jù)庫有望彎道超車

開源構(gòu)建數(shù)據(jù)庫產(chǎn)業(yè)正反饋循環(huán),主流數(shù)據(jù)庫產(chǎn)品陸續(xù)擁抱開源。數(shù)據(jù)庫開源旨在通過開 放核心代碼,運(yùn)營(yíng)開源社區(qū)以實(shí)現(xiàn)多方共贏,1)對(duì)于社區(qū)開發(fā)者來說,開源數(shù)據(jù)庫提供免 費(fèi)的數(shù)據(jù)庫產(chǎn)品,成本優(yōu)勢(shì)突出;2)對(duì)于數(shù)據(jù)庫廠商來,通過開源社區(qū)可快速獲得產(chǎn)品反 饋,加快產(chǎn)品開發(fā)、提升產(chǎn)品質(zhì)量;3)對(duì)于生態(tài)伙伴來說,開源產(chǎn)品的生態(tài)影響力更強(qiáng), 可以更好地實(shí)現(xiàn)產(chǎn)品兼容。通過梳理國產(chǎn)數(shù)據(jù)庫廠商的發(fā)展歷程,可以看到眾多國產(chǎn)廠商 最早都基于開源數(shù)據(jù)庫構(gòu)建底層代碼,同時(shí)近年來主流數(shù)據(jù)庫產(chǎn)品紛紛擁抱開源,以加速 產(chǎn)品技術(shù)升級(jí),構(gòu)建友好的數(shù)據(jù)庫生態(tài)。典型代表有巨杉數(shù)據(jù)庫 SequoiaDB、華為 Gauss 數(shù)據(jù)庫、阿里云 PolarDB for PostgreSQL 數(shù)據(jù)庫、螞蟻集團(tuán) OceanBase 數(shù)據(jù)庫。

分布式數(shù)據(jù)庫時(shí)代加速到來,國產(chǎn)廠商加速分布式產(chǎn)品布局。分布式數(shù)據(jù)庫可有效解決現(xiàn) 有互聯(lián)網(wǎng)環(huán)境下海量數(shù)據(jù)、高并發(fā)計(jì)算的數(shù)據(jù)需求,成為國產(chǎn)數(shù)據(jù)庫廠商的產(chǎn)品發(fā)展共識(shí)。 傳統(tǒng)國產(chǎn)數(shù)據(jù)庫廠商重點(diǎn)關(guān)注分布式關(guān)系型數(shù)據(jù)庫,主要選擇分庫分表+中間件、原生分布 式兩類技術(shù)路線;新興國產(chǎn)數(shù)據(jù)庫廠商廣泛布局分布式關(guān)系型數(shù)據(jù)庫、NoSQL 數(shù)據(jù)庫、 NewSQL 數(shù)據(jù)庫等多類型分布式數(shù)據(jù)庫,大量非關(guān)系型數(shù)據(jù)庫廠商實(shí)現(xiàn)彎道超車。

海外廠商:云數(shù)據(jù)庫是主要方向,傳統(tǒng)龍頭與新興廠商并駕齊驅(qū)

根據(jù) DB-Engines 發(fā)布的數(shù)據(jù)庫流行度最新排行(2022 年 10 月),全球數(shù)據(jù)庫排名前五名 依次為:Oracle、MySQL、Microsoft SQL Server、PostgreSQL、MongoDB,新興數(shù)據(jù)庫 廠商 Snowflake、Databricks 分別位列 13、20 名。我們選取關(guān)系型數(shù)據(jù)庫代表 Oracle、 Microsoft SQL Server,NoSQL 數(shù)據(jù)庫代表 MongoDB,內(nèi)存數(shù)據(jù)庫代表 SAP,云數(shù)據(jù)庫 代表 AWS、Snowflake、Databricks 作為范例,對(duì)海外數(shù)據(jù)庫廠商的發(fā)展歷程及現(xiàn)有產(chǎn)品 體系進(jìn)行了詳細(xì)梳理。

Oracle:傳統(tǒng)數(shù)據(jù)庫龍頭,加速云數(shù)據(jù)庫轉(zhuǎn)型

Oracle 的數(shù)據(jù)庫產(chǎn)品是公司的起家業(yè)務(wù),技術(shù)積淀深厚。Oracle 的數(shù)據(jù)庫業(yè)務(wù)發(fā)展歷程, 與全球數(shù)據(jù)庫發(fā)展歷史交織在一起,也與 Oracle 整個(gè)公司的發(fā)展綁定在一起。Oracle 的數(shù) 據(jù)庫產(chǎn)品包括兩種:1)Oracle 自有數(shù)據(jù)庫產(chǎn)品 Oracle Database;2)MySQL:2008 年 Sun 以 10 億美元收購 MySQL,2009 年,Oracle 以 74 億美元收購 Sun。

隨著 IT 架構(gòu)、終端設(shè)備形態(tài)的不斷變化和遷移,Oracle 的數(shù)據(jù)庫產(chǎn)品也在不斷更新迭代。 從 Oracle 數(shù)據(jù)庫產(chǎn)品服務(wù)的計(jì)算載體的形態(tài)來看,經(jīng)歷了小型機(jī)與大型機(jī)、客戶機(jī)/服務(wù)器 (PC 與服務(wù)器)、互聯(lián)網(wǎng)架構(gòu)/瘦客戶端、數(shù)據(jù)庫云/大數(shù)據(jù)四個(gè)階段。目前 Oracle 的數(shù)據(jù) 產(chǎn)品已經(jīng)更新到 21c。從以往 Oracle 更新的版本來看,我們可以將其劃分為幾個(gè)不同時(shí)代:

階段一:Oracle 9i 之前,支持傳統(tǒng)的 C-S 架構(gòu)

Oracle 的數(shù)據(jù)庫產(chǎn)品主要解決的是數(shù)據(jù)庫的高可靠性問題(注:衡量數(shù)據(jù)庫產(chǎn)品的核心指 標(biāo)在于五個(gè)方面:高可用性(High Availability)、高性能(High Performance)、高可管理 (High Manageability)、高安全(High Security Ability)、高數(shù)據(jù)服務(wù)能力(High Data Service Ability)五個(gè)領(lǐng)域)。Oracle 數(shù)據(jù)庫核心優(yōu)勢(shì)在于高效、安全、穩(wěn)定等。

階段二:9i-12c,支持互聯(lián)網(wǎng)計(jì)算環(huán)境

從 Oracle 9i 開始,Oracle 引入新的技術(shù) Oracle RAC,RAC 是指 real application clusters, 譯為“實(shí)時(shí)應(yīng)用集群”。RAC 是 Oracle 新版數(shù)據(jù)庫中采用的一項(xiàng)新技術(shù),是高可用性的一 種,也是 Oracle 數(shù)據(jù)庫支持網(wǎng)格計(jì)算環(huán)境的核心技術(shù)。用來在集群環(huán)境下,實(shí)現(xiàn)多機(jī)共享 數(shù)據(jù)庫,以保證應(yīng)用的高可用性。同時(shí)可以自動(dòng)實(shí)現(xiàn)并行處理及負(fù)載均衡,并能實(shí)現(xiàn)數(shù)據(jù) 庫在故障時(shí)的容錯(cuò)和無斷點(diǎn)恢復(fù)。它是 Oracle 數(shù)據(jù)庫支持網(wǎng)絡(luò)計(jì)算環(huán)境的核心技術(shù)。 Oracle RAC 主要支持 Oracle9i、10g、11g、12c 版本,可以支持 24 x 7 有效的數(shù)據(jù)庫應(yīng)用 系統(tǒng),在低成本服務(wù)器上構(gòu)建高可用性數(shù)據(jù)庫系統(tǒng),并且自由部署應(yīng)用,無需修改代碼。 從 Oracle 12c 開始,Oracle 逐步開始推出 Options 產(chǎn)品線,推動(dòng)企業(yè)數(shù)據(jù)中心的整合、數(shù) 據(jù)集中和網(wǎng)格計(jì)算的發(fā)展,強(qiáng)化了數(shù)據(jù)的高可靠性,提升了數(shù)據(jù)庫對(duì)云計(jì)算需求的應(yīng)對(duì)能 力:1)Exadata 數(shù)據(jù)庫一體機(jī)和內(nèi)存選件(In-memory Option)的推出,用來提高性能、 簡(jiǎn)化架構(gòu),提高數(shù)據(jù)庫的速度;2)Oracle 12c 的多租戶和 DBaaS 則讓數(shù)據(jù)庫混合云成為 可能,客戶可以在不同云環(huán)境中進(jìn)行切換。

階段三:12c 之后,支持云計(jì)算環(huán)境,進(jìn)入自治時(shí)代

Oracle 12c 引入了 CDB 與 PDB 的新特性。在 Oracle 12c 數(shù)據(jù)庫引入的多租用戶環(huán)境 (Multitenant Environment)中,允許一個(gè)數(shù)據(jù)庫容器(Container Database,CDB)承載 多個(gè)可插拔數(shù)據(jù)庫(Pluggable Database,PDB)。在 Oracle 12c 之前,實(shí)例與數(shù)據(jù)庫是一 對(duì)一或多對(duì)一關(guān)系(RAC):即一個(gè)實(shí)例只能與一個(gè)數(shù)據(jù)庫相關(guān)聯(lián),數(shù)據(jù)庫可以被多個(gè)實(shí)例 所加載,而實(shí)例與數(shù)據(jù)庫不可能是一對(duì)多的關(guān)系,當(dāng)進(jìn)入 Oracle 12c 后,實(shí)例與數(shù)據(jù)庫可 以是一對(duì)多的關(guān)系。 Oracle 21c 是 Oracle 最新一代數(shù)據(jù)庫,致力于實(shí)現(xiàn)可部署在本地和云端的單一融合數(shù)據(jù) 庫。Oracle 從 19c 開始就致力于提供全球唯一可運(yùn)行在本地和云端的融合數(shù)據(jù)庫,可支持 使用包括 JSON、圖、XML 等在內(nèi)的任何數(shù)據(jù)類型。同時(shí),用戶不必再為不同的工作負(fù)載 而創(chuàng)建不同的數(shù)據(jù)庫,可以在同一個(gè)數(shù)據(jù)庫中運(yùn)行交易型負(fù)載、分析型負(fù)載、物聯(lián)網(wǎng)、區(qū) 塊鏈等,大大減輕 DBA 的工作負(fù)擔(dān),降低維護(hù)成本,進(jìn)一步減少故障點(diǎn),從而保證數(shù)據(jù)庫 系統(tǒng)安全平穩(wěn)運(yùn)行。

Microsoft:兼顧本地、云端兩大數(shù)據(jù)庫應(yīng)用場(chǎng)景

Microsoft數(shù)據(jù)庫產(chǎn)品多為關(guān)系型數(shù)據(jù)庫。Microsoft于1988年推出Microsoft SQL Server, 為企業(yè)提供商業(yè)數(shù)據(jù)管理;1992 年推出 Microsoft Access,為軟件設(shè)計(jì)師與分析師提供便 捷的應(yīng)用開發(fā)軟件;2010 年推出 Microsoft Azure,為用戶提供云端數(shù)據(jù)庫服務(wù),以上三款 產(chǎn)品皆使用關(guān)系型數(shù)據(jù)庫模型。 Microsoft SQL Server 歷經(jīng)多年迭代,目前包括本地、云端兩大產(chǎn)品類別。Microsoft SQL Server 的發(fā)展大致可分為三個(gè)階段: 1)合作創(chuàng)始初期(1988-1995 年):SQL Server 最早由 Microsoft、Sybase、Ashton-Tate 三家公司共同開發(fā),最早于 1988 年推出了 OS/2 版本;隨后 Aston-Tate 退出,1992 年 Microsoft 與 Sybase 共同開發(fā)了基于 Windows 系統(tǒng)的 SQL Server,但在 SQL Server 4 后 Microsoft 與 Sybase 分道揚(yáng)鑣,于 1995 年獨(dú)立完成 SQL Server 6.0 版本的開發(fā);

2)獨(dú)立發(fā)展期(1995-2010 年):自 Microsoft SQL Server 6.0 發(fā)布后,SQL Server 產(chǎn)品 進(jìn)入以Microsoft為單一研發(fā)主體的獨(dú)立發(fā)展期,隨后相繼發(fā)布SQL Server 7.0、SQL Server 2000、SQL Server 2005 等多個(gè)版本;其中,2008 年發(fā)布的 SQL Server 2008 新增了數(shù)據(jù) 壓縮、資源調(diào)控、備份壓縮等功能,保護(hù)了數(shù)據(jù)庫查詢、減少了管理操作所需時(shí)間、增加 了穩(wěn)定性、增強(qiáng)了系統(tǒng)性能優(yōu)化以及預(yù)測(cè)功能等,使其成為了至今為止最強(qiáng)大和全面的 SQL Server 版本; 3)云化轉(zhuǎn)型期(2010 年至今):早在 2008 年 Microsoft 專業(yè)開發(fā)人員大會(huì)上,Microsoft 當(dāng) 時(shí)的首席軟件架構(gòu)師 Ray Ozzie 就宣布推出新云計(jì)算操作系統(tǒng) Microsoft Azure,并推出 Azure 服務(wù)平臺(tái)關(guān)鍵組件之一是 Microsoft SQL 服務(wù);2010 年以 SQL Server 2008 為基 底的云數(shù)據(jù)庫 SQL Azure 正式面世,后改名為 Azure SQL,旨在作為 Azure 云計(jì)算平臺(tái)的 一部分提供的云數(shù)據(jù)庫產(chǎn)品/服務(wù)。

總體來看,Microsoft SQL Server 作為一個(gè)全面的數(shù)據(jù)庫管理平臺(tái),為用戶提供了企業(yè)級(jí)的 數(shù)據(jù)管理,擁有較好的伸縮性與集成度高等優(yōu)點(diǎn),主要包括: 1)本地部署 SQL Server 系列; 2)私有云部署 SQL Server Private Cloud 系列; 4)公有云部署 Azure SQL 系列:Azure SQL Database、Azure SQL Managed Instance、 SQL Server on Azure VM; 其中,Azure SQL Database 支持大多數(shù)本地?cái)?shù)據(jù)庫級(jí)功能,提供最常用的 SQL Server 功 能;Azure SQL Managed Instance 幾乎支持所有的本地實(shí)例級(jí)和數(shù)據(jù)庫級(jí)功能,與 SQL Server 高度兼容,適合用于大部分云遷移方案;SQL Server on Azure VM 能夠輕松直接遷 移 SQL Server 工作負(fù)載,保持 100%的 SQL Server 兼容性和操作系統(tǒng)級(jí)別的訪問權(quán)限。 根據(jù) Gartner 發(fā)布的《2021 年數(shù)據(jù)庫市場(chǎng)份額》,Microsoft 數(shù)據(jù)庫市場(chǎng)份額為 24.0%,位 居全球第一,其中云數(shù)據(jù)庫產(chǎn)品收入增長(zhǎng)率為 39.5%,帶動(dòng)公司數(shù)據(jù)庫產(chǎn)品整體增長(zhǎng)率推 高至 20.9%,略低于市場(chǎng) 22.3%的增長(zhǎng)率。

MongoDB:NoSQL 典型代表,提供文檔型數(shù)據(jù)庫服務(wù)

MongoDB 旨在為 Web 應(yīng)用提供可擴(kuò)展的高性能數(shù)據(jù)存儲(chǔ)解決。MongoDB 于 2007 年成 立,是文檔型的 NoSQL 數(shù)據(jù)庫,數(shù)據(jù)以文檔的形式在 MongoDB 中保存,它使用 BJON 作 為數(shù)據(jù)格式,擁有輕量級(jí)、可遍歷性、高效性三大特點(diǎn),有效應(yīng)對(duì)了傳統(tǒng)關(guān)系型數(shù)據(jù)庫在 面臨高讀寫、高存儲(chǔ)、高擴(kuò)展性與可用性的挑戰(zhàn)。MongoDB 支持 Java、Python、C++等 多類型語言,數(shù)據(jù)從 MongoDB 中讀取出來后,可無需轉(zhuǎn)換直接使用,適用于數(shù)據(jù)量大, 讀寫操作頻繁、數(shù)據(jù)價(jià)值低且對(duì)事務(wù)要求不高的場(chǎng)景。MongoDB 支持在公有云、本地和混 合云環(huán)境中大規(guī)模部署,2019 年最新發(fā)布的 MongoDB 4.2.0 開始支持分布式事務(wù)。

MongoDB 遵從開源協(xié)議提供商業(yè)數(shù)據(jù)庫產(chǎn)品。MongoDB 產(chǎn)品體系主要由企業(yè)級(jí)數(shù)據(jù)庫產(chǎn) 品 MongoDB Enterprise Advanced、云數(shù)據(jù)庫 MongoDB Altas、開源數(shù)據(jù)庫 Community Server、移動(dòng)數(shù)據(jù)庫 MongoDB Realm。1)MongoDB Enterprise Advanced:為企業(yè)級(jí)數(shù) 據(jù)庫平臺(tái),包括商業(yè)數(shù)據(jù)庫服務(wù)器、企業(yè)級(jí)管理工具、圖形用戶界面、分析工具集成等功 能;2)MongoDB Altas:為完全托管的云數(shù)據(jù)庫產(chǎn)品,包括全面系統(tǒng)監(jiān)控、托管備份、恢 復(fù)等功能;3)Community Server:為免費(fèi)下載的開源版本;4)MongoDB Realm:為用 于數(shù)據(jù)密集型網(wǎng)頁的移動(dòng)數(shù)據(jù)庫,可借助 Realm Sync 實(shí)現(xiàn)邊緣設(shè)備數(shù)據(jù)到后端云數(shù)據(jù)庫的 無縫同步。

SAP:專注企業(yè)業(yè)務(wù)流程管理,提供內(nèi)存數(shù)據(jù)庫產(chǎn)品

SAP 作為業(yè)務(wù)流程管理軟件供應(yīng)商,致力于實(shí)現(xiàn)企業(yè)數(shù)據(jù)的高效治理。SAP 成立于 1972 年,最初稱為 System Analysis Program Development,后來縮寫為 SAP。SAP 總部位于 德國,在全球擁有 10 萬多名員工,業(yè)務(wù)范圍遍布 130 多個(gè)國家,擁有超過 2.3 億云用戶。 公司 2010 年發(fā)布的 SAP HANA (Hight-Performance Analytic Applicance)Cloud 產(chǎn)品, 作為統(tǒng)一的數(shù)據(jù)庫即服務(wù) (DBaaS) 平臺(tái),支持針對(duì)所有企業(yè)數(shù)據(jù)的現(xiàn)代應(yīng)用和分析工具, 在擴(kuò)展性、速度與性能上為用戶提供極佳的體驗(yàn)。 SAP HANA 組件包括:1)名稱服務(wù)器(Name Server):將信息傳播到其他組件上;2)預(yù) 處理服務(wù)器(Preprocessor):用于文本數(shù)據(jù)分析;3)統(tǒng)計(jì)服務(wù)器(Statistics Server):用 于檢查和分析 HANA 所有組件的運(yùn)行狀況;4)XS 服務(wù)器(XS Server):用于幫助外部 Java 和 HTML 的應(yīng)用程序訪問 HANA 系統(tǒng);5)索引服務(wù)器(Index Server):用于處理數(shù)據(jù)庫 查詢語句的 SQL/MDX 處理器,它將所有查詢請(qǐng)求分段,并將它們引導(dǎo)到正確的引擎以進(jìn) 行性能優(yōu)化。

AWS:把握分布式浪潮,提供多類型云數(shù)據(jù)庫產(chǎn)品

AWS(Amazon Web Service)把握分布式數(shù)據(jù)庫浪潮,帶動(dòng)云數(shù)據(jù)庫產(chǎn)品快速發(fā)展。AWS 是全球云服務(wù)的先行者,產(chǎn)品覆蓋了彈性計(jì)算、儲(chǔ)存、分析、開發(fā)、網(wǎng)絡(luò)安全、數(shù)據(jù)庫等 多個(gè) 200 多個(gè)方向,業(yè)務(wù)覆蓋全世界 245 個(gè)國家。AWS 云數(shù)據(jù)庫擁有一系列全面的數(shù)據(jù)庫 管理服務(wù),包括針對(duì)運(yùn)營(yíng)用例、分析用例、圖數(shù)據(jù)處理、鍵值以及分類賬等,致力于為用 戶提供適應(yīng)多場(chǎng)景的專用云數(shù)據(jù)庫產(chǎn)品。 AWS 數(shù)據(jù)庫產(chǎn)品多為單一用途的專用云數(shù)據(jù)庫,并為用戶提供云遷移服務(wù)。根據(jù)數(shù)據(jù)庫類 型的不同,AWS 云數(shù)據(jù)庫產(chǎn)品分為八大類:1)關(guān)系型數(shù)據(jù)庫:Amazon Aurora(高性能 托管式關(guān)系數(shù)據(jù)庫)、Amazon RDS、Amazon RedShift(經(jīng)濟(jì)高效的數(shù)據(jù)倉庫);2)鍵值 型數(shù)據(jù)庫:Amazon DynamoDB(托管式 NoSQL 數(shù)據(jù)庫);3)內(nèi)存數(shù)據(jù)庫:Amazon ElastiCache(內(nèi)存中緩存服務(wù))、Amazon MemoryDB for Redis(與 Redis 兼容且持久的 內(nèi)存數(shù)據(jù)庫);4)文檔數(shù)據(jù)庫:Amazon Document DB;5)列族數(shù)據(jù)庫:Amazon Keyspaces (兼容 Cassandra);6)圖數(shù)據(jù)庫:Amazon Neptune;7)時(shí)序數(shù)據(jù)庫 Amazon Timestrea; 8)賬本數(shù)據(jù)庫:Amazon Ledger Database Services(QLDB)。

Amazon Aurora 是 AWS 關(guān)系型云數(shù)據(jù)庫的典型代表,兼容 MySQL 與 PostgreSQL。 Amazon Aurora 是 AWS 從 2014 年開始開發(fā)并提供的云原生關(guān)系型數(shù)據(jù)庫,專門面向云計(jì) 算場(chǎng)景,實(shí)現(xiàn)了傳統(tǒng)企業(yè)數(shù)據(jù)庫的性能、可用性與開源數(shù)據(jù)庫的簡(jiǎn)單性、成本效益的有機(jī) 融合,可與 MySQL 和 PostgreSQL 完全兼容。Amazon Aurora 作為高性能數(shù)據(jù)庫,兼具高 性能和高可擴(kuò)展性、高可用性和持久性、高度安全、完全托管等重要特性,服務(wù)三星 Samsung、 Halliburton、任天堂 Nintendo、A+E Networks 等多類型客戶。

Snowflake:提供數(shù)據(jù)倉庫、數(shù)據(jù)湖等多種產(chǎn)品

Snowflake 滿足并發(fā)性、可擴(kuò)展性、易用性、平臺(tái)中立性需求。公司產(chǎn)品完全基于公有云, 提供包括數(shù)據(jù)倉庫(Data Warehouse)、數(shù)據(jù)湖(Data Lake)在內(nèi)的多種產(chǎn)品,支持非結(jié) 構(gòu)化數(shù)據(jù)、數(shù)據(jù)可視化和分析。公司意在打造綜合性的云數(shù)據(jù)平臺(tái),其數(shù)據(jù)庫可在三大公 有云 AWS、Microsofe Azure 和 Google Cloud Platform 上部署,對(duì)于企業(yè)多云異構(gòu)的復(fù) 雜環(huán)境有適用性、中立性,同時(shí)亦提供數(shù)據(jù)交換功能,解決了過去用戶面臨的投入高、靈 活度低等問題,可吸引中小型客戶。據(jù)公司財(cái)報(bào),截至 2022 年 7 月,公司有 6,808 個(gè)企 業(yè)客戶,同比增長(zhǎng) 36%,包括全球 2,000 強(qiáng)企業(yè)中的 510 家,環(huán)比增加 12 家。

數(shù)據(jù)倉庫滿足多種使用場(chǎng)景需求。數(shù)據(jù)倉庫采取 Shared-nothing 架構(gòu),在節(jié)點(diǎn)之間不共享 任何數(shù)據(jù),此外 Snowflake 基于 Multi-cluster, shared data 的概念,將存儲(chǔ)和計(jì)算分離,解 決了升級(jí)擴(kuò)容時(shí)需要重新分配節(jié)點(diǎn)資源等痛點(diǎn)。在數(shù)據(jù)支持方面,Snowfalke 支持結(jié)構(gòu)化和 半結(jié)構(gòu)化數(shù)據(jù)的組合使用,可以接收 JSON、XML 或 Avro 格式的數(shù)據(jù),并且支持嵌套和重 復(fù)數(shù)據(jù)類型,從而滿足傳統(tǒng)數(shù)據(jù)庫、Hadoop 等半結(jié)構(gòu)化使用場(chǎng)景的使用需求。

Snowflake 數(shù)據(jù)湖產(chǎn)品強(qiáng)調(diào)查詢性能、數(shù)據(jù)管道集成可擴(kuò)展、安全等。Snowflake 數(shù)據(jù)湖 產(chǎn)品在利用內(nèi)置數(shù)據(jù)治理和安全性的同時(shí),實(shí)現(xiàn)快速的數(shù)據(jù)訪問,具備較好的查詢性能, 并且對(duì)數(shù)據(jù)轉(zhuǎn)換進(jìn)行了良好的支持,通過云的模式為客戶省去運(yùn)維成本。在查詢性能方面, 支持即時(shí)和幾乎無限的可擴(kuò)展性和并發(fā)性,此外,通過集成和可擴(kuò)展的數(shù)據(jù)管道,實(shí)現(xiàn)簡(jiǎn) 化數(shù)據(jù)管道開發(fā)以優(yōu)化性能,依靠管道實(shí)時(shí)可靠地?cái)U(kuò)展來處理繁重的數(shù)據(jù)工作量和可擴(kuò)展 的數(shù)據(jù)轉(zhuǎn)換;在安全方面,則提供了安全的數(shù)據(jù)協(xié)作功能。

Snowflake 服務(wù)各行業(yè)客戶。以 hookit 為例,據(jù)公司官網(wǎng),Snowflake 為 hookit 構(gòu)建具有 可擴(kuò)展性的多集群共享數(shù)據(jù)架構(gòu)數(shù)據(jù)庫,提高了 Hookit 的運(yùn)營(yíng)效率。查詢效率提高 30 倍, 每天可自動(dòng)評(píng)估社交帖子 5 億條,數(shù)據(jù)倉庫基礎(chǔ)架構(gòu)成本降低 40%,消除了 88%的內(nèi)部支 持請(qǐng)求,提升了客戶的運(yùn)行效率,使客戶能夠?qū)W⒂诋a(chǎn)品創(chuàng)新。

Databricks:Lakehouse 概念,幫助客戶構(gòu)建統(tǒng)一分析平臺(tái)

Databricks 提出 Lakehouse(湖倉一體)概念。Lakehouse 由數(shù)據(jù)湖 Data Lakes 與數(shù)據(jù) 倉 Data Warehouses 融合而成。普通的數(shù)據(jù)湖在數(shù)據(jù)質(zhì)量、一致性/隔離性、混合處理追加 讀取等方面不如數(shù)據(jù)倉庫。Lakehouse 兼容了數(shù)據(jù)倉庫和數(shù)據(jù)湖的優(yōu)勢(shì),在數(shù)據(jù)湖的低成 本存儲(chǔ)上實(shí)現(xiàn)數(shù)據(jù)倉庫的數(shù)據(jù)結(jié)構(gòu)和管理功能。Lakehouse 功能包括事務(wù)支持、模式執(zhí)行 和治理、商務(wù)智能 BI(Business Intelligence)支持、存儲(chǔ)與計(jì)算分離、開放性、支持多種 數(shù)據(jù)類型、各種工作負(fù)載、端到端流。

Databricks 為客戶提供統(tǒng)一分析平臺(tái)以提升效率。Databricks 通過構(gòu)建統(tǒng)一分析平臺(tái),1) 可以簡(jiǎn)化跨功能團(tuán)隊(duì)的分析工作流程,使用單一平臺(tái)查詢、調(diào)試和探索流式處理和批次數(shù) 據(jù),以及構(gòu)建和部署 ML 模型;2)打造交互式工作空間,促進(jìn)與共享筆記本環(huán)境的合作, 使數(shù)據(jù)科學(xué)家能夠快速實(shí)時(shí)在模型上進(jìn)行重復(fù);3)簡(jiǎn)化管理,使公司無需人工干預(yù)即可完 全自動(dòng)化作業(yè)調(diào)度、監(jiān)控和集群管理。 以 RB 為例,Databricks 為 RB 提供了一個(gè)統(tǒng)一的數(shù)據(jù)分析平臺(tái),該平臺(tái)在數(shù)據(jù)科學(xué)和工程 領(lǐng)域營(yíng)造了可擴(kuò)展的協(xié)作環(huán)境,使數(shù)據(jù)團(tuán)隊(duì)能夠更快地進(jìn)行創(chuàng)新,并為業(yè)務(wù)提供 ML 驅(qū)動(dòng)的 見解。據(jù)公司官網(wǎng),該方案使得公司業(yè)務(wù)可支持量提高 10 倍,數(shù)據(jù)從 80TB 壓縮到 2TB, 降低了運(yùn)營(yíng)成本,24*7 個(gè)任務(wù)的數(shù)據(jù)管道性能提高 2 倍。

國產(chǎn)廠商:傳統(tǒng)廠商積淀深厚,新興廠商聚焦新興技術(shù)

根據(jù)墨天輪發(fā)布的國產(chǎn)數(shù)據(jù)庫流行度最新排行(2022 年 10 月),國產(chǎn)數(shù)據(jù)庫排名前五名依 次為:TiDB、OceanBase、達(dá)夢(mèng)、openGauss、PolarDB。我們選取傳統(tǒng)數(shù)據(jù)庫代表武漢 達(dá)夢(mèng)、人大金倉,云數(shù)據(jù)庫代表 OceanBase,GaussDB,新興數(shù)據(jù)庫代表巨杉數(shù)據(jù)庫、TiDB、 星環(huán)科技KunDB作為范例,對(duì)國產(chǎn)數(shù)據(jù)庫廠商的發(fā)展歷程及現(xiàn)有產(chǎn)品體系進(jìn)行了詳細(xì)梳理。

達(dá)夢(mèng)數(shù)據(jù):背靠中國電子,主攻混合型數(shù)據(jù)庫HTAP

背靠 CEC 中國電子,主攻混合型數(shù)據(jù)庫 HTAP。武漢達(dá)夢(mèng)成立于 2000 年,是中國電子信 息產(chǎn)業(yè)集團(tuán)(CEC)旗下基礎(chǔ)軟件企業(yè),專注于為客戶提供以數(shù)據(jù)庫軟件、集群軟件、云 計(jì)算、大數(shù)據(jù)平臺(tái)為代表的全棧數(shù)據(jù)產(chǎn)品及解決方案,產(chǎn)品涵蓋數(shù)據(jù)庫、云計(jì)算、大數(shù)據(jù) 三大類。在數(shù)據(jù)庫領(lǐng)域,武漢達(dá)夢(mèng)主攻混合型數(shù)據(jù)庫 HTAP,旨在用一種數(shù)據(jù)庫模式處理客 戶所有數(shù)據(jù)庫需求,適合業(yè)務(wù)廣、數(shù)據(jù)量大的綜合型客戶使用,目前已掌握數(shù)據(jù)管理與數(shù) 據(jù)分析領(lǐng)域的核心前沿技術(shù),擁有全部源代碼,具有完全自主知識(shí)產(chǎn)權(quán)。達(dá)夢(mèng)數(shù)據(jù)庫產(chǎn)品 目前已廣泛應(yīng)用于金融、電力、航空、通信、電子政務(wù)等 30 多個(gè)行業(yè)領(lǐng)域。

達(dá)夢(mèng)主推透明分布式數(shù)據(jù)庫(DMTDD)技術(shù)。達(dá)夢(mèng)提出的 DMTDD 技術(shù)包括靈活橫向擴(kuò)展、 完整的 SQL 特性支持、多副本數(shù)據(jù)異地容災(zāi)的特點(diǎn)。結(jié)合了分布式數(shù)據(jù)庫高可擴(kuò)展、高可 用、高并發(fā)處理能力,并支持傳統(tǒng)數(shù)據(jù)庫開發(fā)接口和業(yè)務(wù)開發(fā)框架的技術(shù)架構(gòu)。 (1)靈活橫向擴(kuò)展:DM8 TDD 采用計(jì)算存儲(chǔ)分離的系統(tǒng)架構(gòu),實(shí)現(xiàn)計(jì)算、日志、存儲(chǔ)三 層分離,可實(shí)現(xiàn)各層獨(dú)立擴(kuò)展、按需配置設(shè)備的特點(diǎn)。 (2)完整的 SQL 特性支持:支持多表連接查詢、子查詢、視圖嵌套查詢、遞歸表達(dá)式查 詢等高級(jí)查詢語法。提供存儲(chǔ)過程、觸發(fā)器、Package、序列等高級(jí)功能特性。 (3)多副本數(shù)據(jù)異地容災(zāi):支持異地部署,通過將數(shù)據(jù)副本存儲(chǔ)在不同的容災(zāi)域,實(shí)現(xiàn)數(shù) 據(jù)的異地容災(zāi);日志服務(wù)本身具備副本與容災(zāi)能力,可在每個(gè)數(shù)據(jù)中心分別部署;數(shù)據(jù)庫 服務(wù)在主機(jī)房按需部署,在檢測(cè)到災(zāi)害時(shí),即時(shí)啟動(dòng)。

新一代分布式數(shù)據(jù)庫 DMDPC 具備極致的橫向擴(kuò)展能力。2022 年,達(dá)夢(mèng)數(shù)據(jù)發(fā)布新一代分 布式數(shù)據(jù)庫產(chǎn)品 DMDPC,DMDPC 數(shù)據(jù)庫無狀態(tài)計(jì)算節(jié)點(diǎn),可隨數(shù)據(jù)庫并發(fā)壓力負(fù)載按需 增加或減少節(jié)點(diǎn),具備極致的橫向擴(kuò)展能力。同時(shí) DMDPC 支持分布式事務(wù)(滿足 ACID 規(guī)范)、數(shù)據(jù)分片的多副本容災(zāi)、多機(jī)并行協(xié)同計(jì)算,適用于 HTAP 場(chǎng)景。DMDPC 架構(gòu)包 括三類節(jié)點(diǎn):1)計(jì)劃生成節(jié)點(diǎn) SP:對(duì)外提供分布式數(shù)據(jù)庫服務(wù),也會(huì)分配執(zhí)行帶有匯總 性質(zhì)以及不包含數(shù)據(jù)掃描操作的子任務(wù);2)數(shù)據(jù)存儲(chǔ)節(jié)點(diǎn) BP:訪問數(shù)據(jù)并進(jìn)行簡(jiǎn)單的過 濾、投影以及分組操作;3)元數(shù)據(jù)服務(wù)器節(jié)點(diǎn) MP:獲取 SP、BP 節(jié)點(diǎn)的數(shù)據(jù)字典信息。

新一代分布式數(shù)據(jù)庫 DMDPC 滿足金融、電網(wǎng)、交通、工業(yè)互聯(lián)網(wǎng)等多場(chǎng)景需求。1)金融 系統(tǒng):DMDPC 基于改進(jìn)的多主機(jī) XA 協(xié)議、基于分布式環(huán)境的多版本并發(fā)控制等技術(shù),保 證了分布式數(shù)據(jù)庫對(duì)事務(wù) ACID 規(guī)范的支持,滿足金融核心業(yè)務(wù)系統(tǒng)對(duì)事物強(qiáng)一致性的需求; 2)智慧電網(wǎng):支持同城異地多活,可有效支持電網(wǎng)在全國多地的部署聯(lián)網(wǎng);3)智慧交通: DMDPC 可實(shí)現(xiàn)計(jì)算資源的按需分配,彈性擴(kuò)展、支持 GIS 地理信息存儲(chǔ);4)工業(yè)互聯(lián)網(wǎng): 支持100以上的分布式節(jié)點(diǎn)且采用多種安全加固措施,可支撐工業(yè)互聯(lián)網(wǎng)的數(shù)據(jù)安全需求。

人大金倉:背靠 CETC 中國電子科技集團(tuán),老牌數(shù)據(jù)庫

背靠 CETC 中國電子科技集團(tuán),是成立最早的國產(chǎn)數(shù)據(jù)庫企業(yè)。人大金倉背靠 CETC 中國 電子科技集團(tuán),由中國人民大學(xué)最早一批從事數(shù)據(jù)庫研究的專家于 1999 年發(fā)起創(chuàng)立,先后 承擔(dān)了國家“863”、“核高基”等重大專項(xiàng)。人大金倉專注數(shù)據(jù)庫領(lǐng)域 20 余年,具備出色 的數(shù)據(jù)庫產(chǎn)品研發(fā)和服務(wù)能力,數(shù)據(jù)庫產(chǎn)品廣泛服務(wù)于電子政務(wù)、國防軍工、能源、金融、 電信等 60 余個(gè)重點(diǎn)行業(yè)和關(guān)鍵領(lǐng)域,截至 2021 年,產(chǎn)品累計(jì)裝機(jī)部署超百萬套。

三大數(shù)據(jù)庫產(chǎn)品各具優(yōu)勢(shì),使用多類型應(yīng)用場(chǎng)景。1)KES:KingbaseES 作為人大金倉的 通用型數(shù)據(jù)庫產(chǎn)品,是一款面向大規(guī)模并發(fā)交易處理的企業(yè)級(jí)關(guān)系型數(shù)據(jù)庫,嚴(yán)格支持 ACID 特性,具備遷移簡(jiǎn)單、高度容錯(cuò)、系統(tǒng)自治、兼容性好的突出優(yōu)勢(shì),并提供可覆蓋遷 移、開發(fā)及運(yùn)維管理全使用周期的智能便捷工具;2)KADB:KingbaseAnalyticsDB 采用 shared-nothing 分布式架構(gòu),是一款具有高性能、高擴(kuò)展性能力的 MPP 數(shù)據(jù)庫產(chǎn)品,適用 于數(shù)據(jù)倉庫、決策支持、高級(jí)分析等分析類應(yīng)用場(chǎng)景;3)KSOne :是人大金倉自主研發(fā) 的 HTAP 分布式數(shù)據(jù)庫,擁有高可靠,高安全,彈性伸縮,高效備份恢復(fù)等關(guān)鍵能力,可 以為海量數(shù)據(jù)、海量并發(fā)用戶、高負(fù)載壓力、高連續(xù)性要求的業(yè)務(wù)系統(tǒng)提供強(qiáng)有力支撐。

人大金倉致力于為政務(wù)、能源、國防、金融、電信等國家企事業(yè)單位提供數(shù)據(jù)解決方案。 人大金倉作為國產(chǎn)數(shù)據(jù)庫領(lǐng)軍企業(yè),積極推動(dòng)與產(chǎn)業(yè)鏈上下游伙伴產(chǎn)品的兼容適配,涵蓋 芯片、操作系統(tǒng)、云平臺(tái)、中間件以及上層軟件應(yīng)用,具備來自上下游 1,300 多家公司超 4,000 份兼容認(rèn)證,全面適配國家專用項(xiàng)目相關(guān)產(chǎn)品。人大金倉在部署模式上提供線下部署 與線上云適配兩種形式,云聯(lián)合方案覆蓋主流云廠商。金倉數(shù)據(jù)庫產(chǎn)品廣泛服務(wù)于電子政 務(wù)、國防軍工、能源、運(yùn)營(yíng)商、金融等 60 余個(gè)關(guān)鍵行業(yè),涵蓋國家電網(wǎng)、南方電網(wǎng)、中國 人民銀行、中國銀行、中國郵政、中國移動(dòng)等重點(diǎn)企事業(yè)單位。

阿里 OceanBase:金融級(jí)分布式關(guān)系數(shù)據(jù)庫,核心代碼開源

發(fā)端于阿里內(nèi)部,2021 年正式開源。OceanBase 是由螞蟻金服、阿里巴巴完全自主研發(fā) 的分布式關(guān)系型數(shù)據(jù)庫,始創(chuàng)于 2010 年,應(yīng)用于支付寶全部核心業(yè)務(wù)以及阿里巴巴淘寶業(yè) 務(wù),從 2017 年開始,開始服務(wù)外部客戶。2020 年 6 月 8 日,螞蟻集團(tuán)將自研數(shù)據(jù)庫產(chǎn)品 OceanBase 獨(dú)立進(jìn)行公司化運(yùn)作,同年 9 月,中國工商銀行開始采用螞蟻?zhàn)匝袛?shù)據(jù)庫 OceanBase,其對(duì)公(法人)理財(cái)系統(tǒng)已完成從大型主機(jī)到 OceanBase 分布式架構(gòu)的改 造。2021 年 6 月,OceanBase3.0 版本發(fā)布并正式開源;2022 年 8 月,OceanBase4.0 正 式發(fā)布,成為業(yè)內(nèi)首個(gè)單機(jī)分布式一體化數(shù)據(jù)庫。

OceanBase 是金融級(jí)分布式關(guān)系數(shù)據(jù)庫,具備在線水平擴(kuò)展能力。OceanBase 是一款針 對(duì)特殊巨型復(fù)雜網(wǎng)絡(luò)、超大實(shí)時(shí)更新數(shù)據(jù)場(chǎng)景的分布式實(shí)時(shí)數(shù)據(jù)庫產(chǎn)品,擁有簡(jiǎn)單易用、 性能高的特點(diǎn)。該產(chǎn)品定位是一款分布式關(guān)系數(shù)據(jù)庫,適合于金融、證券等涉及交易、支 付和賬務(wù)等對(duì)高可用、強(qiáng)一致要求較高,同時(shí)對(duì)性能、成本和擴(kuò)展性有需求的金融屬性場(chǎng) 景,以及各種關(guān)系型結(jié)構(gòu)化存儲(chǔ)的 OLTP 應(yīng)用。

OceanBase 產(chǎn)品體系涵蓋四大類:1)分布式數(shù)據(jù)庫:包括社區(qū)版、企業(yè)版、公有云三大 版本,社區(qū)版可免費(fèi)下載,適用于中小企業(yè)開發(fā)者,企業(yè)版適用于追求更高擴(kuò)展能力、穩(wěn) 定性的中大型企業(yè),公有云版適用于阿里云、AWS 等全球主流公有云場(chǎng)景;2)圖數(shù)據(jù)庫: OceanBase TuGraph 構(gòu)建了包含圖存儲(chǔ)、圖計(jì)算、圖學(xué)習(xí)、圖研發(fā)平臺(tái)的完善的圖技術(shù)體 系,適用于金融、工業(yè)、政務(wù)等業(yè)務(wù)場(chǎng)景;3)時(shí)序數(shù)據(jù)庫:OceanBase CeresDB 基于 OceanBase 分布式存儲(chǔ)引擎,用來存儲(chǔ)和管理時(shí)間序列數(shù)據(jù),適用于物聯(lián)網(wǎng) IoT、運(yùn)維監(jiān) 控等業(yè)務(wù)場(chǎng)景;4)工具體系:涵蓋數(shù)據(jù)庫評(píng)估、遷移、開發(fā)、運(yùn)維等工具。

OceanBase 客戶主要集中在銀行、保險(xiǎn)證券、政企、互聯(lián)網(wǎng)。OceanBase 最早應(yīng)用于阿 里集團(tuán)的淘寶、網(wǎng)商銀行、支付寶等業(yè)務(wù)場(chǎng)景,實(shí)現(xiàn)了在互聯(lián)網(wǎng)、金融交易等業(yè)務(wù)上的產(chǎn) 品沉淀,目前下游客戶主要集中在銀行、保險(xiǎn)、證券、政企、互聯(lián)網(wǎng)等領(lǐng)域。以中國工商 銀行為例,面對(duì)工商銀行的 5 級(jí)容災(zāi)要求,OceanBase 結(jié)合不同的副本屬性組合實(shí)現(xiàn)“數(shù) 據(jù)庫同城雙活、異地 RPO=0 的兩地三中心方案”的容災(zāi)部署,實(shí)現(xiàn)了兩地三中心的城市級(jí) 容災(zāi),解決了容災(zāi)標(biāo)準(zhǔn)高、建設(shè)成本高、備機(jī)房資源浪費(fèi)等問題,滿足 7x24 小時(shí)服務(wù)要求, 數(shù)據(jù)庫服務(wù)器資源利用率達(dá)到 75%,降低了整體的投入成本。

華為 GaussDB:AI 原生數(shù)據(jù)庫,擁抱開源生態(tài)

AI 原生&支持異構(gòu)計(jì)算。華為 GaussDB 是一個(gè)企業(yè)級(jí) AI-Native 分布式數(shù)據(jù)庫,可為超大 規(guī)模數(shù)據(jù)管理提供高性價(jià)比的通用計(jì)算平臺(tái),也用于支撐各類數(shù)據(jù)倉庫系統(tǒng)、BI 系統(tǒng)和決 策支持系統(tǒng),為上層應(yīng)用的決策分析提供服務(wù)。GaussDB 采用 MPP(Massive Parallel Processing))架構(gòu),支持行存儲(chǔ)與列存儲(chǔ),提供 PB 級(jí)別數(shù)據(jù)量的處理能力。GaussDB 是 全球首款 AI-Native 數(shù)據(jù)庫,能夠同時(shí)支持 X86、ARM、GPU、NPU 等異構(gòu)計(jì)算,布局全 球 7 大區(qū)域,服務(wù)金融、政企、互聯(lián)網(wǎng)、游戲、汽車等行業(yè)標(biāo)桿客戶超 2,500 家。

GaussDB 包含三大產(chǎn)品線:關(guān)系型數(shù)據(jù)庫、非關(guān)系數(shù)據(jù)庫、數(shù)據(jù)庫生態(tài)工具/中間件。1) 關(guān)系型數(shù)據(jù)庫:包括華為自研的云數(shù)據(jù)庫 GaussDB(for openGauss)、GaussDB(for MySQL)以及非自研的適用于 MySQL、PostergreSQL、SQL Server 的云數(shù)據(jù)庫 RDS;2) 非關(guān)系型數(shù)據(jù)庫:包括華為自研的 GaussDB(for Mongo)、GaussDB(for Cassandra)、 GaussDB(for Influx)、GaussDB(for Redis)以及非自研的文檔數(shù)據(jù)庫服務(wù) DDS;3)數(shù) 據(jù)庫生態(tài)工具/中間件:包括數(shù)據(jù)復(fù)制服務(wù) DRS、管理服務(wù) DAS、數(shù)據(jù)庫和應(yīng)用遷移 UGO 以及分布式數(shù)據(jù)庫中間件 DDM。

openGauss 擁抱開源。2019 年 9 月,華為宣布開源其 GaussDB 數(shù)據(jù)庫,開源后的產(chǎn)品 命名為 openGauss,2020 年 6 月 openGauss 源代碼正式開放并發(fā)布 1.0.0 版本,同年 7 月社區(qū)關(guān)鍵組織開始運(yùn)行。openGauss 內(nèi)核源自 PostgreSQL,代碼自研占比超過 74%, 截至 2022 年 6 月開源社區(qū)用戶超 64 萬,貢獻(xiàn)者約 3,000 人。基于 openGauss 開放生態(tài), 華為進(jìn)一步推出分布式云數(shù)據(jù)庫 GaussDB(for openGauss),該產(chǎn)品具備企業(yè)級(jí)復(fù)雜事務(wù) 混合負(fù)載能力,同時(shí)支持分布式事務(wù)強(qiáng)一致、同城跨 AZ 部署、數(shù)據(jù) 0 丟失,支持 1000+ 的計(jì)算節(jié)點(diǎn)擴(kuò)展能力、4PB 海量存儲(chǔ),擁有云上高可用、高可靠、高安全、彈性伸縮、一 鍵部署等關(guān)鍵能力,現(xiàn)已廣泛適用于金融、政企、互聯(lián)網(wǎng)等關(guān)鍵場(chǎng)景。

GaussDB 適應(yīng)互聯(lián)網(wǎng)、金融、游戲、汽車等多業(yè)務(wù)場(chǎng)景。GaussDB(for openGauss)作 為金融級(jí)分布式數(shù)據(jù)庫,具有高性能、高彈性、AI-Native 自治的典型特性,廣泛應(yīng)用于金 融業(yè)務(wù)場(chǎng)景;GaussDB(for MySQL)數(shù)據(jù)庫提供百萬級(jí) QPS,性能最高可以達(dá)到 MySQL 社區(qū)版本的 7 倍、GaussDB(for Mongo) 性能最高可以達(dá)到 MongoDB 社區(qū)版本的 3 倍, 滿足游戲業(yè)務(wù)場(chǎng)景下彈性伸縮、一鍵回檔、快速開服的業(yè)務(wù)需求;綜合應(yīng)用 RDS 數(shù)據(jù)庫、 DDS 文檔型數(shù)據(jù)庫、數(shù)據(jù)復(fù)制服務(wù) DRS、分布式數(shù)據(jù)庫中間件 DDM 等產(chǎn)品,可構(gòu)建讀寫 分離的分布式架構(gòu),為互聯(lián)網(wǎng)行業(yè)應(yīng)用提供分布式解決方案。

巨杉數(shù)據(jù)庫:自研金融級(jí)分布式數(shù)據(jù)庫的獨(dú)立廠商

專注分布式數(shù)據(jù)庫技術(shù)研發(fā)的自研數(shù)據(jù)庫獨(dú)立廠商。巨杉數(shù)據(jù)庫成立于 2012 年,是一家專 注分布式數(shù)據(jù)庫技術(shù)研發(fā)的自研國產(chǎn)基礎(chǔ)軟件廠商,公司自成立以來,專注數(shù)據(jù)庫產(chǎn)品研 發(fā),堅(jiān)持從零開始打造原生分布式數(shù)據(jù)庫引擎,經(jīng)過多年積累,現(xiàn)已推出分布式數(shù)據(jù)庫 DB (實(shí)時(shí)數(shù)據(jù)湖)、內(nèi)容管理平臺(tái) CM(多模數(shù)據(jù)湖)、湖倉融合平臺(tái) DP(湖倉一體)三大產(chǎn) 品線,廣泛應(yīng)用于金融、政府、能源、電信、交通等領(lǐng)域,企業(yè)用戶總數(shù)超過 1,000 家。

從商用首發(fā)時(shí)間看,巨杉數(shù)據(jù)庫是國內(nèi)最早進(jìn)行商業(yè)化布局的分布式數(shù)據(jù)庫。2012 年, SequoiaDB 巨杉數(shù)據(jù)庫作為獨(dú)立數(shù)據(jù)庫公司開始研發(fā),進(jìn)行原生分布式架構(gòu)布局。2013 年 SequoiaDB v1.0 產(chǎn)品化正式商用并進(jìn)軍企業(yè)級(jí)領(lǐng)域,開始為客戶提供產(chǎn)品及技術(shù)服務(wù)支持。 自研內(nèi)核具有領(lǐng)先性,支持跨結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的多模數(shù)據(jù)處理。巨杉數(shù)據(jù)庫 堅(jiān)持自主打造原生分布式數(shù)據(jù)庫引擎,專注數(shù)據(jù)庫技術(shù)研發(fā),聚焦金融賽道,致力于以金 融行業(yè)為核心,打造安全可靠、高性能,適合全行業(yè)通用的分布式數(shù)據(jù)庫產(chǎn)品。巨杉分布 式數(shù)據(jù)庫 SequoiaDB 基于巨杉自研的原生分布式內(nèi)核,研發(fā)出引擎級(jí)多模及 STP 邏輯時(shí) 鐘協(xié)議分布式數(shù)據(jù)庫技術(shù),能夠?qū)崿F(xiàn)分布式交易與 ACID 的完全兼容,同時(shí)架構(gòu)及功能特性 與傳統(tǒng)數(shù)據(jù)庫完全兼容,提供跨引擎事務(wù)支持和一致性保障。SequoiaDB 支持多種級(jí)別的 容災(zāi)部署形態(tài),如同城雙中心、同城三中心、兩地三中心、三地五中心等,獨(dú)創(chuàng)四級(jí)熔斷 容災(zāi)安全保護(hù)機(jī)制,充分保證數(shù)據(jù)安全,滿足核心交易業(yè)務(wù)的嚴(yán)苛要求。

湖倉一體平臺(tái)為數(shù)據(jù)聯(lián)通提供解決方案。巨杉推出的湖倉融合平臺(tái) SequoiaDP 以分布式數(shù) 據(jù)庫 SequoiaDB、內(nèi)容管理平臺(tái) SequoiaCM 為基礎(chǔ),打破了數(shù)據(jù)湖與數(shù)據(jù)倉庫割裂的體 系,可以為上層應(yīng)用提供“一數(shù)一源”的數(shù)據(jù)基礎(chǔ)設(shè)施。湖倉一體架構(gòu)除了具備多模能力, 兼容多種結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化對(duì)象數(shù)據(jù)引擎以外,還可以提供包括流式 計(jì)算、高性能列存分析引擎、跨引擎數(shù)據(jù) ACID 一致性等能力,支持 Tableau、Power BI、 帆軟、SmartBI 等國內(nèi)外分析工具,解決了獨(dú)立建設(shè)、管理的數(shù)據(jù)庫數(shù)據(jù)互不相通的問題。

助力數(shù)據(jù)庫信創(chuàng)生態(tài)、支撐體系建設(shè)。巨杉數(shù)據(jù)庫積極參與信創(chuàng)生態(tài)建設(shè),根據(jù) 2021 年信 創(chuàng)產(chǎn)業(yè)技術(shù)與應(yīng)用大會(huì),截至 2021 年 3 月,巨杉已經(jīng)與鯤鵬、飛騰、統(tǒng)信、銀河麒麟等產(chǎn) 品完成兼容認(rèn)證,合作伙伴總數(shù)超 50 家,為企業(yè)客戶打開豐富的上下游產(chǎn)品生態(tài)。得益于 引擎級(jí)多模的高度兼容,巨杉數(shù)據(jù)庫現(xiàn)已與近百家企業(yè)的 200+產(chǎn)品完成了兼容測(cè)試與認(rèn)證, 產(chǎn)品對(duì)接時(shí)間平均降低到 15 個(gè)工作日,為企業(yè)客戶打開豐富的上下游生態(tài)。 2019 年,巨杉數(shù)據(jù)庫搭建“巨杉大學(xué)”認(rèn)證與學(xué)習(xí)體系,講師團(tuán)隊(duì)由巨杉數(shù)據(jù)庫官方的數(shù) 據(jù)庫架構(gòu)師、資深分布式技術(shù)專家以及開源社區(qū)技術(shù)大咖共同組成。截至 2021 年 6 月,已 有超 180 家金融機(jī)構(gòu),30 余家知名技術(shù)服務(wù)開發(fā)商參加巨杉大學(xué)計(jì)劃。截至 2020 年底, 經(jīng)過短短 1 年的發(fā)展,巨杉大學(xué)已認(rèn)證工程師超過 1 萬人,網(wǎng)站用戶注冊(cè)數(shù)量超過 5 萬人, 為分布式技術(shù)業(yè)界發(fā)展提供堅(jiān)實(shí)的人才積淀。

PingCAP TiDB:開源分布式關(guān)系型數(shù)據(jù)庫

TiDB 為 PingCAP 自主研發(fā)的一棧式實(shí)時(shí) HTAP 數(shù)據(jù)庫。PingCAP 公司成立于 2015 年, 借鑒 Google Spanner 及 F1 論文的實(shí)現(xiàn),TiDB 在 Github 上開源,從僅有 SQL 層及 KV 層 的 beta 版本到現(xiàn)在已經(jīng)衍生出龐大家族的 6.0 版本,始終圍繞著為用戶提供一棧式 OLTP、 OLAP、HTAP 解決方案的目標(biāo)演進(jìn)。在內(nèi)核設(shè)計(jì)上,TiDB 分布式數(shù)據(jù)庫將整體架構(gòu)拆分 成了多個(gè)模塊,各模塊之間互相通信,組成完整的 TiDB 系統(tǒng)。與傳統(tǒng)的單機(jī)數(shù)據(jù)庫相比, TiDB 的純分布式架構(gòu)擁有良好的擴(kuò)展性且具有豐富的工具鏈生態(tài),覆蓋數(shù)據(jù)遷移、同步、 備份等多種場(chǎng)景。2022 年,TiDB Cloud 正式商用,TiDB 支持本地和云部署兩種方式。

TiDB 適應(yīng)多應(yīng)用場(chǎng)景。依托純分布式架構(gòu)及開源社區(qū),TiDB 持續(xù)擴(kuò)展出豐富的應(yīng)用場(chǎng)景: 1)對(duì)數(shù)據(jù)一致性及高可靠、系統(tǒng)高可用、可擴(kuò)展性、容災(zāi)要求較高的金融場(chǎng)景:TiDB 采 用多副本+Multi-Raft 協(xié)議的方式將數(shù)據(jù)調(diào)度到不同的機(jī)房、機(jī)架、機(jī)器,當(dāng)部分機(jī)器出現(xiàn) 故障時(shí)系統(tǒng)可自動(dòng)進(jìn)行切換; 2)對(duì)存儲(chǔ)容量、可擴(kuò)展性、并發(fā)要求較高的海量數(shù)據(jù)及高并發(fā)的 OLTP 場(chǎng)景:TiDB 采用 計(jì)算、存儲(chǔ)分離的架構(gòu),可對(duì)計(jì)算、存儲(chǔ)分別進(jìn)行擴(kuò)容和縮容,計(jì)算最大支持 512 節(jié)點(diǎn), 每個(gè)節(jié)點(diǎn)最大支持 1000 并發(fā),集群容量最大支持 PB 級(jí)別; 3)Real-time HTAP 場(chǎng)景:TiDB 在 4.0 版本中引入列存儲(chǔ)引擎 TiFlash,結(jié)合行存儲(chǔ)引擎 TiKV 構(gòu)建真正的 HTAP 數(shù)據(jù)庫,在增加少量存儲(chǔ)成本的情況下,可以同一個(gè)系統(tǒng)中做聯(lián)機(jī) 交易處理、實(shí)時(shí)數(shù)據(jù)分析,極大地節(jié)省企業(yè)的成本;

4)數(shù)據(jù)匯聚、二次加工處理的場(chǎng)景:TiDB 通過 ETL 工具或者 TiDB 的同步工具將數(shù)據(jù)同 步到 TiDB,在 TiDB 中直接生成報(bào)表,便于將分散在不同系統(tǒng)中的數(shù)據(jù)匯總,以便決策層 了解公司的整體業(yè)務(wù)狀況及時(shí)做出決策。 “開源社區(qū)”助力“開源商業(yè)化”。PingCAP 擁有豐富的開源社區(qū)活動(dòng),形成開源社區(qū)和自 身研發(fā)的有效協(xié)同。通過開源及免費(fèi)策略,快速擴(kuò)展開發(fā)者及技術(shù)粉絲用戶群體,實(shí)現(xiàn)未 來商業(yè)變現(xiàn)機(jī)會(huì)的長(zhǎng)期積累。據(jù) GitHub,截至 2022 年 8 月,TiDB 項(xiàng)目在 GitHub 上已 總計(jì)獲得超 32,000 顆星,超 1,800 位開源代碼貢獻(xiàn)者,高度活躍的開源社區(qū)為 TiDB 產(chǎn) 品發(fā)展帶來了正向反饋閉環(huán)。TiDB 已廣泛應(yīng)用于互聯(lián)網(wǎng)、游戲、金融、政府等多領(lǐng)域。

星環(huán)科技:專注企業(yè)級(jí)大數(shù)據(jù)服務(wù),布局分布式數(shù)據(jù)庫

布局分布式數(shù)據(jù)庫,搭建數(shù)據(jù)服務(wù)閉環(huán)。星環(huán)科技成立于 2013 年,專注于企業(yè)級(jí)容器云計(jì) 算、大數(shù)據(jù)和人工智能核心平臺(tái)的研發(fā)和服務(wù),目前已形成包括大數(shù)據(jù)與云基礎(chǔ)平臺(tái)(大 數(shù)據(jù)基礎(chǔ)平臺(tái) TDH、數(shù)據(jù)云平臺(tái) TDC)、分布式關(guān)系型數(shù)據(jù)庫(ArgoDB、KunDB)、數(shù)據(jù) 開發(fā)與智能分析工具(大數(shù)據(jù)開發(fā)工具 TDS、智能分析工具 Sophon)在內(nèi)的產(chǎn)品體系。 ArgoDB 與 KunDB 分別為分析型、交易型數(shù)據(jù)庫產(chǎn)品:1)ArgoDB:是一款具備多模型、 聯(lián)邦等特性的高性能分析型分布式數(shù)據(jù)庫,于 2019 年成為全球第四個(gè)通過 TPC-DS 基準(zhǔn) 測(cè)試并經(jīng)過 TPC 官方審計(jì)的數(shù)據(jù)庫產(chǎn)品;2)KunDB:是一款兼容 SQL 標(biāo)準(zhǔn)語言的交易 型分布式數(shù)據(jù)庫,可支持高并發(fā)交易場(chǎng)景的核心業(yè)務(wù)。

ArgoDB 滿足數(shù)據(jù)多模、聯(lián)邦計(jì)算需求。與傳統(tǒng)的 MPP 數(shù)據(jù)庫相比,ArgoDB 具有存算解 耦結(jié)構(gòu),存儲(chǔ)和計(jì)算獨(dú)立按需擴(kuò)縮容,具備更強(qiáng)的可擴(kuò)展性、一致性、平滑適配云原生架 構(gòu)等優(yōu)勢(shì)。2022 年最新發(fā)布的 ArgoDB 5.0 推出新一代的向量化計(jì)算引擎和多模存儲(chǔ)引擎, 分析能力達(dá)到了同類數(shù)據(jù)庫產(chǎn)品 2~10 倍,同時(shí)可提供多模分析,擁有實(shí)時(shí)數(shù)據(jù)處理、AETP 混合負(fù)載、聯(lián)邦計(jì)算、隱私計(jì)算等能力,可一站式滿足湖倉集一體化建設(shè)需求。

KunDB 支持高并發(fā)交易場(chǎng)景的核心業(yè)務(wù)。KunDB 具有業(yè)內(nèi)領(lǐng)先的事務(wù)處理性能,SQL 兼 容性以及最新的分布式查詢優(yōu)化技術(shù),支持復(fù)雜查詢且性能是 MySQL 的 10 倍以上,充分 滿足高并發(fā)、大數(shù)據(jù)量的交易型業(yè)務(wù)場(chǎng)景。升級(jí)后 KunDB 3.0 高度兼容 Oracle 語法及 PL/SQL,基于升級(jí)的 TSO 全新分布式事務(wù)架構(gòu),性能領(lǐng)先主流開源 NewSQL 5 倍以上, 分布式查詢優(yōu)化和向量化執(zhí)行引擎技術(shù)支持 TPCH 復(fù)雜分析,并提供一體化實(shí)時(shí) HTAP, 支持一致性備份恢復(fù)及容災(zāi),全面助力數(shù)據(jù)庫國產(chǎn)化升級(jí)。

星環(huán)科技數(shù)據(jù)庫服務(wù)能源、金融、政府、交通等多業(yè)務(wù)場(chǎng)景。ArgoDB 主要用于構(gòu)建離線數(shù) 據(jù)倉庫、實(shí)時(shí)數(shù)據(jù)倉庫、數(shù)據(jù)集市等數(shù)據(jù)分析系統(tǒng),適用于構(gòu)建能源、物聯(lián)網(wǎng)、政務(wù)等大 數(shù)據(jù)平臺(tái)的業(yè)務(wù)場(chǎng)景。KunDB 適用于對(duì)數(shù)據(jù)具有高并發(fā)讀寫需求,同時(shí)需要 ACID 保證的 交易型場(chǎng)景,如金融、電信、能源等核心業(yè)務(wù)系統(tǒng);也適用于對(duì)數(shù)據(jù)庫有高并發(fā)和大容量 存儲(chǔ)需求的場(chǎng)景,如物聯(lián)網(wǎng)、日志存儲(chǔ)等系統(tǒng)。此外,公司結(jié)合 KunDB 和 ArgoDB 打造了 一體化實(shí)時(shí) AETP技術(shù)(分析增強(qiáng)型交易庫),可以同時(shí)支撐交易與分析混合型的業(yè)務(wù)場(chǎng)景。

(本文僅供參考,不代表我們的任何投資建議。如需使用相關(guān)信息,請(qǐng)參閱報(bào)告原文。)

精選報(bào)告來源:【未來智庫】。

關(guān)鍵詞:數(shù)據(jù),國產(chǎn),發(fā)展,行業(yè),專題,研究

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉