國產(chǎn)分布式數(shù)據(jù)庫服務(wù)商有哪些?
時間:2023-03-31 02:42:01 | 來源:電子商務(wù)
時間:2023-03-31 02:42:01 來源:電子商務(wù)
利益相關(guān)。以一個案例切入,在西門子案例中,SIEMENS DE&DS DSM 團隊開發(fā)的一套面向設(shè)備制造商的數(shù)字化解決方案——SIMICAS? OEM 設(shè)備遠程運維套件,就因為數(shù)據(jù)庫性能問題不得不進行數(shù)據(jù)架構(gòu)升級。在它們的 1.0 系統(tǒng)中,使用的是 Flink + Kafka + PostgreSQL + Redis 的架構(gòu),落地之后,主要遇到了兩大挑戰(zhàn),一個是部署繁瑣,一個是應(yīng)用復(fù)雜。
具體來說,因為引入了 Flink 和 Kafka,導(dǎo)致系統(tǒng)部署時非常繁瑣,服務(wù)器開銷巨大;同時為了滿足大量數(shù)據(jù)的存儲問題,PostgreSQL 中不得不做分庫分表操作,應(yīng)用程序較為復(fù)雜。如何降低系統(tǒng)復(fù)雜度、減少硬件資源開銷,幫助客戶減少成本,成為了研發(fā)團隊的核心任務(wù)。
在確定選擇跟數(shù)據(jù)類型匹配的分布式時序數(shù)據(jù)庫(Time Series Database) TDengine 作為系統(tǒng)的數(shù)據(jù)庫后,其在 SIMICAS? OEM 2.0 版本中移除了Flink、Kafka 以及 Redis,新系統(tǒng)的數(shù)據(jù)流如下:
先說下上面這個案例里的數(shù)據(jù)庫主角,一款高性能、分布式、支持 SQL 的時序數(shù)據(jù)庫——TDengine ,可以讓大量設(shè)備、數(shù)據(jù)采集器每天產(chǎn)生的高達 TB 甚至 PB 級的數(shù)據(jù)能得到高效實時的處理,對業(yè)務(wù)的運行狀態(tài)進行實時的監(jiān)測、預(yù)警,從大數(shù)據(jù)中挖掘出商業(yè)價值。TDengine 能被廣泛運用于物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、車聯(lián)網(wǎng)、IT 運維、能源、金融等領(lǐng)域。 官網(wǎng):TDengine | 時序數(shù)據(jù)庫_開源時序數(shù)據(jù)庫_實時數(shù)據(jù)庫 - 濤思數(shù)據(jù)
1、為什么選擇分布式?
眾所周知,TDengine 是陶建輝老師在2016年底啟動和參與研發(fā)的產(chǎn)品。起初,在瞄準時序數(shù)據(jù)庫這個賽道的他,調(diào)查和研究了很多在市場上已經(jīng)很成熟的同類型產(chǎn)品,例如 InfluxDB、OpenTSDB 和TimeScale 等。所以有很多人都會問他,既然這個賽道已經(jīng)相對成熟了,為什么還要選擇迎難而上呢?又怎么才能讓自己的產(chǎn)品脫引而出?這就引出了 TDengine 產(chǎn)品最重要的一個特性—分布式。
從 2016 年底到現(xiàn)在,大部分時序數(shù)據(jù)庫都不是分布式的,換句話說,它們不支持水平擴展。即便是 InfluxDB,也只有企業(yè)版支持集群,開源版是不支持的。而傳統(tǒng)實時數(shù)據(jù)庫更是沒有一個支持水平擴展,最多是雙機熱備。但是隨著物聯(lián)網(wǎng)、車聯(lián)網(wǎng)的高速發(fā)展,IT 基礎(chǔ)設(shè)施規(guī)模的增大,數(shù)據(jù)的采集量越來越大,單機是沒有辦法解決問題的,底層數(shù)據(jù)庫必須具有水平擴展能力。
很多企業(yè)使用的是開源時序數(shù)據(jù)庫的單機版,后續(xù)為了應(yīng)對海量數(shù)據(jù)的處理,只好自己投入人力物力,在單機版的基礎(chǔ)上,開發(fā)自己的 Proxy,對數(shù)據(jù)進行分片處理。對于數(shù)據(jù)寫入,這種方法簡單而且有效。但是對于查詢,往往牽涉多個節(jié)點,那么 Proxy 就要做各種查詢的聚合,導(dǎo)致開發(fā)的工作量很大。因此,整個 TDengine 的設(shè)計從第一天起,就是支持分布式的。為了便于更多使用開源版本的用戶用得更好,在 2020 年 8 月,我們將 TDengine 的分布式版本開源了。
至此,聰明的你可以看出,單純說一款分布式數(shù)據(jù)庫的好壞是不準確的,優(yōu)秀的團隊肯定是從使用場景出發(fā),為用戶解決最根本的痛點。
2、關(guān)于產(chǎn)品設(shè)計的思考
“做好一款純粹的產(chǎn)品”,一直是整個團隊努力的目標。Jeff 自己也說,我不想把 TDengine 做成一款萬能的基礎(chǔ)工具,TDengine 只需要在時序數(shù)據(jù)庫的領(lǐng)域持續(xù)深耕,將用戶提出的痛點和難點作為每一次的技術(shù)突破,將自己打造成行業(yè)的標準,這才能鍛造出一款好的產(chǎn)品,成就一個優(yōu)秀的團隊。除了分布式的特點,TDengine 還在高性能、易運維、零學(xué)習(xí)成本等方面都有很好的數(shù)據(jù)表現(xiàn)。
感興趣的伙伴可以看看以下文章,關(guān)于產(chǎn)品架構(gòu)設(shè)計以及性能對比測試
3、團隊
盡管人員還未滿百人,但濤思數(shù)據(jù)的團隊成員還是很“niubility”的,不僅有來自中科大、卡內(nèi)基梅隆、密歇根、馬里蘭、復(fù)旦、浙大、清華、北大、哈工大的研究生及博士生們,還有來自硅谷的研發(fā)小伙伴,一些員工在入職濤思之前,甚至是某國際一線公司里舉重若輕的首席科學(xué)家、某公司CTO或技術(shù)專家。與優(yōu)秀的人為伍,你也會變得越來越優(yōu)秀!
濤思數(shù)據(jù)收獲了來自思否、墨天輪、開源中國等頒發(fā)的多項榮譽
關(guān)鍵詞:服務(wù),分布,數(shù)據(jù),國產(chǎn)