StoneDB 為國產(chǎn)數(shù)據(jù)庫添磚加瓦,基于 MySQL 的一體化實時 HTAP 數(shù)據(jù)庫正式開源!
時間:2023-03-13 11:30:01 | 來源:電子商務
時間:2023-03-13 11:30:01 來源:電子商務
本場開源發(fā)布會全程回放,我們已經(jīng)上傳至本站,錯過的同學可以進入主頁點擊視頻回顧哦~
StoneDB 官方介紹:
StoneDB 是一款支持
行列混存+內(nèi)存計算的 HTAP 數(shù)據(jù)庫。其采用
完全自主研發(fā)的存儲和計算引擎,可將 MySQL 的分析性能
提高100倍;其創(chuàng)新的
一體化 HTAP 架構,打破傳統(tǒng) TP 型數(shù)據(jù)庫能力邊界,為用戶提供一站式 OLTP+OLAP 解決方案。
一句話概括:
StoneDB 一體化實時 HTAP 開源數(shù)據(jù)庫。
下面,讓我們一起來回顧一下本次開源發(fā)布會的內(nèi)容吧~
歸來仍是少年——我們?yōu)槭裁匆鰢a(chǎn)開源數(shù)據(jù)庫
石原子科技CEO-葉健林(自修)可以注意到,我們強調(diào)了兩點,一點是國產(chǎn),一點是開源,當提到為什么我們要做國產(chǎn)開源數(shù)據(jù)庫時,石原子科技CEO葉健林表示,其實考慮的因素是多樣的:
從時代背景來說,面對當前復雜的國際形勢,掐脖子的核心技術很容易受到西方單邊主義激進國家的封鎖,而且我們已經(jīng)被這些發(fā)達國家封鎖過一輪了,由此可見,中國必須要堅持自主創(chuàng)新,在核心技術上實現(xiàn)國產(chǎn)化替代。而數(shù)據(jù)庫作為基礎軟件,必然要走上國產(chǎn)化的道路。
從企業(yè)發(fā)展來說,數(shù)據(jù)庫作為數(shù)字經(jīng)濟的底座,可以說是一條“
長坡厚雪”的賽道,有將近千億規(guī)模的市場空間,在整個大數(shù)據(jù)產(chǎn)業(yè)發(fā)展過程中,國產(chǎn)大數(shù)據(jù)基礎軟件會越來越多,
未來OLAP一定是一個增量市場,石原子作為面向全球、全場景的數(shù)據(jù)庫AP服務商,
我們希望讓客戶的數(shù)據(jù)分析達到“快、好、省”。“數(shù)據(jù)價值在線化,省錢省心更安全”這是石原子的公司使命,也是我們公司創(chuàng)始團隊堅持了七年的夢想,七年磨一劍,我們少年時的夢想,如今依然在追求,這冥冥中給我們一種使命感。
我今天也非常高興的跟大家宣布我們的 StoneDB 正式開源了,這是一款全面兼容MySQL生態(tài)的實時HTAP數(shù)據(jù)庫,也是國內(nèi)首款開源的行列混存+內(nèi)存計算架構的HTAP數(shù)據(jù)庫。針對大多數(shù)中等客戶而言,MySQL仍然是主流選擇,而當這些客戶需要分析功能時,StoneDB優(yōu)勢就有所體現(xiàn)了,StoneDB的分析性能比MySQL快100倍,而且其架構與運維上的設計也會讓客戶整體的成本降低30%以上,StoneDB的核心價值就是讓所有客戶用最小化的代價獲得MySQL 生態(tài)的AP能力,客戶不需要修改業(yè)務的一行代碼。
大家在宣傳上可能還看到我們用了“
真正的HTAP”這句話,我們認為“
真正的HTAP”要滿足以下四個核心特點:
- 同一個數(shù)據(jù)庫系統(tǒng),而不是由多個數(shù)據(jù)庫系統(tǒng)拼接而成。
- 使用了行列混存+內(nèi)存計算的核心技術:無論是Oracle的Heatwave,還是像SQL Server,都是采用這種架構來設計的。
- 同一份數(shù)據(jù)消除了不同數(shù)據(jù)庫之間數(shù)據(jù)遷移的工作和時延。
- 可以同時支持 OLTP 和 OLAP 業(yè)務的負載。
只有具備以上四個特點的數(shù)據(jù)庫,才能真正地稱為“
HTAP”數(shù)據(jù)庫。
那么,我們做HTAP數(shù)據(jù)庫為什么要依靠MySQL生態(tài)來做呢?原因還是因為客戶和市場,不得不承認的一點是,當今MySQL依然是最為流行的開源數(shù)據(jù)庫之一,不僅是表現(xiàn)在統(tǒng)計數(shù)據(jù)上,我們的同學也實地拜訪過很多客戶,其中有大量的客戶在使用MySQL處理關鍵的數(shù)據(jù)邏輯,這些使用MySQL的客戶其實對數(shù)據(jù)實時分析的需求是日益增強的。而HTAP在學術界和工業(yè)界近十年受到了非常多的關注,原生MySQL一直側(cè)重的只是加強事務處理的能力,但是在分析能力上有所欠缺,這讓我們看到了創(chuàng)新和突破的空間。我們認為,HTAP數(shù)據(jù)庫真正的價值就是“簡單、通用”,那些小數(shù)據(jù)量場景尤其是10TB以下的中小型客戶,其實只需要一套數(shù)據(jù)庫系統(tǒng)即可,而對于大數(shù)據(jù)量的場景的客戶,HTAP的性能其實不如單一的OLAP數(shù)據(jù)庫、實時數(shù)倉或者大數(shù)據(jù)平臺的。由此,我們的目標客戶群體也非常明確了。
為什么我們石原子要去開源StoneDB?
我們認為開源的核心價值就是:開源能夠快速的驗證產(chǎn)品、打磨產(chǎn)品,讓更多人使用、獲益、并進一步反哺產(chǎn)品和社區(qū),共創(chuàng)共建產(chǎn)品生態(tài)。開源是與生態(tài)緊密結(jié)合的,越往底層的軟件,越適合開源;越容易形成網(wǎng)絡效應的軟件,越適合開源。僅僅是作為單個數(shù)據(jù)庫開源,其實價值不大,在這里,我也代表石原子科技希望可以同數(shù)據(jù)庫行業(yè)所有友商共同做大國產(chǎn)數(shù)據(jù)庫的開源生態(tài)。
開源是我們非常重要的一個戰(zhàn)略方向,我們也非常清晰地認識到,
僅僅將內(nèi)核代碼貢獻出去不叫開源,而是要形成“三個C”,那就是我們做的開源一定要圍繞我們的核心代碼(Code)、圍繞我們的用戶(Consumer)、圍繞我們的開源社區(qū)(Community),形成一系列的閉環(huán)發(fā)展。開源軟件的商業(yè)化目前來講,大多還是以售賣服務為主,現(xiàn)在來看,大多數(shù)開源軟件的背后其實一個服務行業(yè),我們在初期也是這樣,石原子會基于 StoneDB 的內(nèi)核開源去做好服務,去滿足付費客戶的一系列需求。
這里補充一段小故事,2012年時,我有幸見到了后來數(shù)據(jù)庫圖靈獎的獲得者Michael Stonebraker,老爺子當時和我們分享了他對列式數(shù)據(jù)庫未來的看法和C-store的一些Paper,以及他后面著名的《One Size Fits All》的理論雛形,列式數(shù)據(jù)庫其實算是HTAP發(fā)展過程中一個重要的起點,沒想到10年之后的今天,我又走在了HTAP的探索道路上,StoneDB 數(shù)據(jù)庫當初起名時,我們的團隊討論了很久,最后定了這個名字,其實也有對Stonebraker的一些尊敬意味在里面。
一體化 HTAP 架構填補 MySQL 分析能力空白
StoneDB 首席架構師李浩指出,真正的 HTAP 并不是 TP 系統(tǒng)與 AP 系統(tǒng)的簡單疊加,如今市場的商業(yè)需求,要求HTAP可以同時處理TP和AP負載,并要用更少的技術棧,更簡化的業(yè)務架構,來實現(xiàn)更好的實時性。StoneDB 的架構就是在這樣的要求下產(chǎn)生的全新HTAP數(shù)據(jù)庫。
作為國內(nèi)唯一基于 MySQL 的開源HTAP數(shù)據(jù)庫,StoneDB 亮點眾多:StoneDB 是一款全面兼容 MySQL 的 HTAP 數(shù)據(jù)庫,可以實現(xiàn)從 MySQL 到 StoneDB 的無縫切換,讓用戶以最小化代價獲得AP能力,不需要業(yè)務端一行代碼的修改。為眾多 MySQL 用戶提供【通用、兼容】的一站式AP能力增強方案,相比 MySQL 原生分析能力提升 100 倍以上。
此外其優(yōu)勢還包括:
完全兼容 MySQL
StoneDB完全兼容MySQL,無論是語法還是生態(tài),MySQL用戶均可以無縫切換至StoneDB。
簡化架構和管理
眾多企業(yè)對業(yè)務數(shù)據(jù)進行分析時,都會選擇通過ETL工具將TP數(shù)據(jù)庫中的數(shù)據(jù)導入至AP型數(shù)據(jù)庫進行分析。不僅耗時耗力,而且架構復雜,極易出錯。使用StoneDB無需復雜的ETL,實現(xiàn)Singe Database for OLTP and OLAP 。
真正的實時HTAP
在同一數(shù)據(jù)庫內(nèi)同時支持TP和AP雙引擎,數(shù)據(jù)在TP和AP引擎之間實現(xiàn)無時延同步,提升了數(shù)據(jù)分析的時效性,最大化兌現(xiàn)數(shù)據(jù)的商業(yè)價值。
分析性能強勁
相較于MySQL,StoneDB 提供10-100倍的AP能力。億級多表關聯(lián),急速響應,決策結(jié)果無需等待。
節(jié)約成本
無縫的業(yè)務遷移,無任何學習成本,StoneDB自帶高效壓縮算法,對全量數(shù)據(jù)壓縮,最高40倍壓縮比。
完全開源
核心代碼及相關生態(tài)工具完全開源,遵循 GPL-2.0 開源協(xié)議,自主可控,產(chǎn)品快速迭代演進。
開源地址:
https://github.com/stoneatom/stonedbStoneDB V2.0 架構圖展望未來,為進一步提升 StoneDB 性能,同時也為了減少 AP 負載在執(zhí)行時對TP負載的影響,李浩表示,將在后續(xù)推出基于 in-memory column store 引擎的全新架構。該版本基于 MySQL 8.0 構建,可以 AP 負載的全內(nèi)存計算。數(shù)據(jù)加載的方式,由 InnoDB 并行加載至 in-memory column store 中。同時,提供導入行為的監(jiān)控能力,基于代價的新查詢引擎,以及并行查詢和向量化等技術也將會得到持續(xù)的迭代。
“快好省”標桿案例鼓舞市場
本次發(fā)布會上,首席運營官馬駿對 StoneDB 數(shù)據(jù)庫在 CRM 系統(tǒng)、智慧醫(yī)院產(chǎn)品、智能園區(qū)大屏等三個典型場景的應用進行了分享。
StoneDB在這些應用場景中,體現(xiàn)出了極其優(yōu)秀的性能:
- 在 CRM 系統(tǒng)的私有化部署中,為用戶節(jié)省了 52% 的成本;業(yè)務吞吐量(DTU)提升 68%;技術運維難度下降 50%。
- 在智慧醫(yī)院場景下,復雜查詢的平均執(zhí)行時間從秒級下降到毫秒級;核心數(shù)據(jù)節(jié)點故障恢復時間從分鐘級到秒級,同時節(jié)省成本 36%。
- 在智慧園區(qū)大屏系統(tǒng)中,StoneDB 實現(xiàn)了存儲+計算成本降低 72%;數(shù)據(jù)分析時間從分鐘級降到秒級。
歡迎數(shù)據(jù)庫同行、開源愛好者、創(chuàng)業(yè)企業(yè)關注 StoneDB 的社區(qū)網(wǎng)站:
http://stonedb.io。
也歡迎大家關注 StoneDB 的開源代碼倉庫:
https://github.com/stoneatom/stonedb。
開源是很多科技企業(yè)創(chuàng)新、崛起,突破壟斷的關鍵。作為國內(nèi)首款基于 MySQL 的一體化實時 HTAP 開源數(shù)據(jù)庫,StoneDB 會不斷迭代升級,讓產(chǎn)品更加完善,同時也會依靠開源社區(qū)的力量,在國產(chǎn)數(shù)據(jù)庫中闖出自己的一片天空~
添加小助理:StoneDB_2022 ,加入社區(qū)交流群公眾號:StoneDB
官網(wǎng):
https://stonedb.io/Github:
https://github.com/stoneatom/stonedbSlack:
https://stonedb.slack.com/join/shared_invite/zt-1ba2lpvbo-Vqq62DJcxViyxCZmp7Rimw#/shared-invite/email
關鍵詞:數(shù)據(jù),正式,國產(chǎn)