國產(chǎn)數(shù)據(jù)庫,不存在“贏家通吃”丨IT 國產(chǎn)化國慶特別專題

? 《IT國產(chǎn)化特別策劃》之?dāng)?shù)據(jù)庫篇
作者:徐九丨發(fā)布自:思否編輯部
?
引言:
?
數(shù)據(jù)庫作為中國技術(shù)科技發(fā)展的 35 項“卡脖子”技術(shù)之一,長期以來被 Oracle、IBM、微軟等美國巨頭占據(jù)。在中美貿(mào)易戰(zhàn)及云計算等新技術(shù)變革背景下,國產(chǎn)數(shù)據(jù)庫的發(fā)展在近一兩年備受矚目。
而這幾年國產(chǎn)數(shù)據(jù)庫的進(jìn)步也是有目共睹的,尤其是隨著國內(nèi)移動互聯(lián)網(wǎng)的迅猛發(fā)展,給很多國產(chǎn)新型數(shù)據(jù)庫的應(yīng)用創(chuàng)造了全球獨(dú)一無二的場景,也被稱為是我國最容易實(shí)現(xiàn)彎道超車的一項技術(shù)。
?
那么國產(chǎn)數(shù)據(jù)庫發(fā)展現(xiàn)狀如何?技術(shù)方面有了哪些突破?又存在哪些問題、面臨哪些挑戰(zhàn)?
?
一、國產(chǎn)數(shù)據(jù)庫的現(xiàn)狀

圖片來源:老魚筆記
國產(chǎn)數(shù)據(jù)庫的發(fā)展最初源于國家的引導(dǎo)、支持和扶植,在最開始的階段,國產(chǎn)數(shù)據(jù)庫的研發(fā)始于高校,而隨著互聯(lián)網(wǎng)的發(fā)展,互聯(lián)網(wǎng)企業(yè)以及越來越多的創(chuàng)業(yè)企業(yè)紛紛也參與到了數(shù)據(jù)庫的建設(shè)中來,讓國產(chǎn)數(shù)據(jù)庫進(jìn)入到了一個百花齊放、百家爭鳴的時代。
?
按照主流的分類方式,國產(chǎn)數(shù)據(jù)庫目前主要分為三種:

1、傳統(tǒng)國產(chǎn)數(shù)據(jù)庫
我們剛才說到,國產(chǎn)數(shù)據(jù)庫的研發(fā)始于高校,這一批中發(fā)展最好的幾家分別是人大金倉、武漢達(dá)夢、神州通用、南大通用,被稱為國產(chǎn)數(shù)據(jù)庫四小龍。
這幾大數(shù)據(jù)庫公司直到現(xiàn)在仍然是國產(chǎn)數(shù)據(jù)庫的重要參與力量,也屬于國產(chǎn)數(shù)據(jù)庫領(lǐng)域的“國家隊”。
1、人大金倉
?
人大金倉成立于 1999 年,其企業(yè)級通用數(shù)據(jù)庫 KingbaseES 是入選國家自主創(chuàng)新產(chǎn)品目錄的唯一數(shù)據(jù)庫軟件產(chǎn)品,也是國家級、省部級實(shí)際項目中應(yīng)用最廣泛的國產(chǎn)數(shù)據(jù)庫產(chǎn)品。
2、武漢達(dá)夢
?
武漢達(dá)夢成立于 2000 年,其前身是華中科技大學(xué)數(shù)據(jù)庫與多媒體研究所。目前主要應(yīng)用于我國國防軍事、公安、電力、電信、審計、交通、電子政務(wù)、稅務(wù)、國土資源、制造業(yè)、消防、電子商務(wù)等20多個行業(yè)及領(lǐng)域,裝機(jī)量超過10萬套。
3、神州通用
?
神舟通用是國家“核高基”重大科技項目之?dāng)?shù)據(jù)庫產(chǎn)品的核心研制單位,通過了國家軟件企業(yè)認(rèn)證資格、高新技術(shù)企業(yè)認(rèn)證、ISO9001認(rèn)證、涉及國家秘密的計算機(jī)信息系統(tǒng)集成資質(zhì)認(rèn)證。目前與浙江大學(xué)、北航、北京大學(xué)、中科院軟件所等高校和科研院所均開展了深度合作。
4、南大通用
?
南大通用成立于2004年,是南開大學(xué)下屬天津南開創(chuàng)元信息技術(shù)有限公司的控股子公司。南大通用的核心競爭力是數(shù)據(jù)處理以及數(shù)據(jù)安全技術(shù),不斷開發(fā)科技含量高、附加值較大、市場急需的具有自主品牌的軟件產(chǎn)品,為我國電子政務(wù)、電子商務(wù)、信息安全等領(lǐng)域提供基礎(chǔ)產(chǎn)品支撐和專業(yè)服務(wù)。

2、頭部科技企業(yè)數(shù)據(jù)庫產(chǎn)品
雖然數(shù)據(jù)庫是一項需要時間沉淀的技術(shù),但大部分傳統(tǒng)的數(shù)據(jù)庫基本都是基于幾十年前傳統(tǒng)的技術(shù)架構(gòu)設(shè)計,隨著互聯(lián)網(wǎng)和大數(shù)據(jù)的發(fā)展,很多已經(jīng)不再適應(yīng)現(xiàn)在更復(fù)雜的應(yīng)用需求和更新、更強(qiáng)大的硬件環(huán)境,這也讓一些頭部的互聯(lián)網(wǎng)公司和云技術(shù)廠商順勢躋身進(jìn)入了這一戰(zhàn)場。
這其中,阿里巴巴的OceanBase、PolarDB,騰訊的 TDSQL、TBase等,華為的 GaussDB,都憑借著自身的云平臺,開始布局?jǐn)?shù)據(jù)庫市場;
除了云廠商外,很多傳統(tǒng)的頭部科技企業(yè)也參與到了數(shù)據(jù)庫的核心技術(shù)攻關(guān)中,這其中就包括中興、浪潮等。中興推出了 GoldenDB,而浪潮則是推出了K-DB。
另外,很多大型國企數(shù)據(jù)庫公司,比如:中國移動、國家電網(wǎng)等巨頭公司,也都成立了數(shù)據(jù)庫產(chǎn)品公司研究開源數(shù)據(jù)庫如何支撐內(nèi)部業(yè)務(wù)系統(tǒng)。
?

3、新興獨(dú)立數(shù)據(jù)庫創(chuàng)業(yè)產(chǎn)品
當(dāng)然,既然國產(chǎn)數(shù)據(jù)庫進(jìn)入到了一個百花齊放、百家爭鳴的時代,那么就不存在一個數(shù)據(jù)庫通吃的情況。不同的場景需要不同類型的數(shù)據(jù)庫產(chǎn)品,來滿足特定的場景需求,這也給了很多新興的獨(dú)立數(shù)據(jù)庫創(chuàng)業(yè)企業(yè)以發(fā)展機(jī)會。
在2011年之后,我國涌現(xiàn)出了很多新興的數(shù)據(jù)庫公司,以下為墨天輪發(fā)布的2020年國產(chǎn)數(shù)據(jù)庫名錄:


?
從名單可以看出,我國的國產(chǎn)數(shù)據(jù)庫產(chǎn)品類型多樣,正在逐漸形成一個成熟、全面的數(shù)據(jù)庫生態(tài)。很多新興的獨(dú)立數(shù)據(jù)庫創(chuàng)業(yè)企業(yè),也已經(jīng)取得了很不錯的成績。
PingCAP 是國內(nèi)開源的新型分布式數(shù)據(jù)庫公司,公司旗下的產(chǎn)品 TiDB 是目前國內(nèi)最火的分布式 HTAP 數(shù)據(jù)庫之一。自稱“TiDB 親爹之一”的黃東旭,是一名受到開源文化和自由軟件運(yùn)動的影響很深的開源信徒,這也讓 TiDB 通過開源方式獲取全球用戶的信任,可能是在國際上影響力最大的國產(chǎn)開源數(shù)據(jù)庫。
時序數(shù)據(jù)庫 TDengine 1.0 版本在開源后,連續(xù)一周都排在 GitHub 全球趨勢榜第一,兩個月內(nèi)便拿到 10000 個 star。從性能方面來看,單純從寫入速度上考慮,在多客戶端連接同步寫入的速度 TDengine 遠(yuǎn)遠(yuǎn)高于同等條件下的 MySQL, Cassandra, InfluxDB 和 Open TSDB 以及 ClickHouse,是 Open TSDB 和 MySQL 最大寫入速度的 150 倍。
巨杉數(shù)據(jù)庫 SequoiaDB 則定位于金融級分布式數(shù)據(jù)庫,自 2011 年起自研原生分布式引擎,基于計算存儲分離架構(gòu),提供 I/O 互不干擾 HTAP 能力,已連續(xù)三年入選 Gartner 數(shù)據(jù)庫報告。獨(dú)特的引擎級多模設(shè)計,基于同一份數(shù)據(jù)可支持MySQL、PostgreSQL、MongoDB、SparkSQL兼容協(xié)議的跨引擎事務(wù)一致性。
還有很多優(yōu)秀的企業(yè)和產(chǎn)品我們無法一一舉例,但毫無疑問,目前國產(chǎn)數(shù)據(jù)庫處在發(fā)展最佳時機(jī),創(chuàng)新的商業(yè)模式以及豐富的應(yīng)用場景推動了數(shù)據(jù)庫進(jìn)入百家爭鳴的時代。
?
二、國產(chǎn)數(shù)據(jù)庫的技術(shù)發(fā)展
?
技術(shù)領(lǐng)域是非常容易形成壟斷的。目前,國外商業(yè)數(shù)據(jù)庫如 Oracle 等在國內(nèi)市場占據(jù)著極高的市場份額,國產(chǎn)數(shù)據(jù)庫可能仍然不到 10% 的份額。
我們必須承認(rèn),目前數(shù)據(jù)庫產(chǎn)品與國外標(biāo)桿數(shù)據(jù)庫的差距依然較大,但近幾年也不斷的發(fā)展迭代,并在這個過程中取得了一定的成績:
- 2018 年 5 月,星環(huán)通過 TPC-DS,這是國產(chǎn)數(shù)據(jù)庫首破 OLAP 的 benchmark 世界紀(jì)錄。2019 年初,阿里云 AnalyticDB 也通過 TPC-DS;
?
- 2019 年 5 月,華為正式面向全球推出了 GaussDB 數(shù)據(jù)庫,其 GaussDB OLTP 數(shù)據(jù)庫已在招商銀行綜合支付交易系統(tǒng)和工商銀行內(nèi)成功上線投產(chǎn);
- 2019 年 8 月,騰訊云發(fā)布 CynosDB 商業(yè)化版本,智能數(shù)據(jù)庫診斷系統(tǒng) DBbrain。11月,宣布開源 TBase 數(shù)據(jù)庫,TDSQL 數(shù)據(jù)庫落地張家港農(nóng)商銀行新一代核心業(yè)務(wù)系統(tǒng);
?
- 2019 年 9 月,華為云在 HC 大會上發(fā)布了 GeminiDB、TaurusDB 和 GaussDB OLTP 上云;
?
- 2019 年 9 月,阿里云推出 POLARDB Box,這是業(yè)內(nèi)首次推出基于云原生數(shù)據(jù)庫的一體機(jī)。11 月,Gartner 公布 2019 年全球數(shù)據(jù)庫魔力象限評選結(jié)果,阿里云進(jìn)入“挑戰(zhàn)者”象限,并連續(xù)兩年作為唯一的中國企業(yè)進(jìn)入該榜單;
?
- 2019 年 10 月,螞蟻金服 OceanBase 登頂 TPC-C,這是國產(chǎn)數(shù)據(jù)庫首破 OLTP 的 benchmark 世界紀(jì)錄;
?
- 2019 年 10 月,中興 GoldenDB 成功幫助中信銀行替換 DB2,換“心”后的中信銀行信用卡核心交易系統(tǒng)對外投產(chǎn),這是全國性股份制商業(yè)銀行的首例;
?
- 2019 年 10 月,巨杉數(shù)據(jù)庫作為唯一中國企業(yè)入圍 Gartner Peer Insights 2019 年度評選,并位居第三。11 月,連續(xù)第三年入選 Gartne r數(shù)據(jù)庫推薦報告;
?
- 2020 年 05 月,TPC 官網(wǎng)公布,由螞蟻金服自主研發(fā)的分布式關(guān)系數(shù)據(jù)庫OceanBase,在 TPC-C 基準(zhǔn)測試中打破由自己保持的世界紀(jì)錄;
- 2020 年 5月,全國人大代表、合肥工業(yè)大學(xué)應(yīng)用數(shù)學(xué)研究所所長檀結(jié)慶,對于數(shù)據(jù)庫領(lǐng)域的國產(chǎn)化提出了建議,他呼吁擴(kuò)大國產(chǎn)數(shù)據(jù)庫金融領(lǐng)域試點(diǎn)。還援引易鯨捷貴陽銀行與貴陽農(nóng)商銀行核心交易系統(tǒng)數(shù)據(jù)庫國產(chǎn)化試點(diǎn)項目;
- 2020 年 6 月,華為兌現(xiàn)了去年 HDC 大會上的承諾,openGauss 終于正式亮相,源代碼開放、社區(qū)成立。
?
毫無疑問,過去的一兩年中,無論是技術(shù)的創(chuàng)新迭代還是在世界級舞臺上的發(fā)聲,國產(chǎn)數(shù)據(jù)庫都取得了具有里程碑意義的進(jìn)展,甚至有媒體宣稱“國產(chǎn)數(shù)據(jù)庫們的春天來了”。
不可否認(rèn),國產(chǎn)數(shù)據(jù)化進(jìn)入了一個飛速發(fā)展的時代,但數(shù)據(jù)庫產(chǎn)品的研發(fā)是一個大投入,長周期,對技術(shù)要求很高的領(lǐng)域。我國的數(shù)據(jù)庫行業(yè)雖然上了發(fā)展的快車道,但仍存在很多客觀的問題,亟待解決。
?
三、國產(chǎn)數(shù)據(jù)庫存在的客觀問題
?
華東師范大學(xué)副校長周傲英教授在談及中國數(shù)據(jù)庫發(fā)展時,曾經(jīng)這樣說道:
數(shù)據(jù)庫一直都是中國的切膚之痛,從六五(指第六個五年計劃)開始,我們就在立項,我們要做自己的數(shù)據(jù)庫,但我們一直沒有弄明白,為什么我們做不出來自己的數(shù)據(jù)庫,后來到了互聯(lián)網(wǎng)時代,我們一下子醒悟過來了,就是生態(tài)。 這之中既包含用戶生態(tài),更包含技術(shù)生態(tài),前者是我們要將國內(nèi)數(shù)據(jù)庫市場空間做大,后者是我們要形成合力,因?yàn)閿?shù)據(jù)庫要解決的問題是綜合性的,只有一起才能將這個事情做好。
雖然,國產(chǎn)數(shù)據(jù)庫取得了極為耀眼的成績,但這并不代表國產(chǎn)數(shù)據(jù)庫就很完美,一些亟待解決的問題依然存在。
?
從用戶的角度看國產(chǎn)數(shù)據(jù)庫,主要存在幾個方面的問題:
- 行業(yè)標(biāo)準(zhǔn)
-?產(chǎn)品生態(tài)
- 技術(shù)硬實(shí)力
?
首先,是標(biāo)準(zhǔn)問題。百家爭鳴、百花齊放是一件好事,但在一項技術(shù)的發(fā)展初期則也代表著統(tǒng)一標(biāo)準(zhǔn)的缺失。那么多的數(shù)據(jù)庫產(chǎn)品,我要如何做選擇?在現(xiàn)階段來說并沒有一個客觀的評判標(biāo)準(zhǔn)。此外行業(yè)也沒有一套成熟的服務(wù)體系,應(yīng)急處理和售后方面作為服務(wù)商仍有很多的提高空間。
其次,是產(chǎn)品的生態(tài)問題。國產(chǎn)數(shù)據(jù)庫除了追求技術(shù)迭代外,也應(yīng)該關(guān)注產(chǎn)品的生態(tài)發(fā)展。與周邊上下游產(chǎn)品的兼容性、配套軟件&工具支持、開發(fā)者關(guān)系等等,都是一項產(chǎn)品能最終獲得市場份額的重要因素。大部分國產(chǎn)數(shù)據(jù)庫目前主要的關(guān)注點(diǎn),仍在于相關(guān)產(chǎn)品本身,還未來得及開始關(guān)注產(chǎn)品生態(tài)和用戶生態(tài)的建設(shè)。
最后,是技術(shù)硬實(shí)力的問題。目前國產(chǎn)的關(guān)系型數(shù)據(jù)庫,大部分源自或者借鑒開源 MySQL、PostgreSQL 數(shù)據(jù)庫及其變種,或收購商業(yè)源碼(例如Informix)+自研的方式;大數(shù)據(jù)平臺,多源自或直接整合開源大數(shù)據(jù)生態(tài)組件;純自研的國產(chǎn)數(shù)據(jù)庫還是少數(shù),數(shù)據(jù)庫種類不夠豐富,尤其 NoSQL 這塊。數(shù)據(jù)庫是應(yīng)用軟件的核心,發(fā)展技術(shù)硬實(shí)力才是硬道理。
最后
標(biāo)題寫到《國產(chǎn)數(shù)據(jù)庫,不存在“贏家通吃”》,現(xiàn)階段其實(shí)可以拆開來解讀 —— 即不存在贏家,也不存在通吃。國產(chǎn)數(shù)據(jù)庫要的不是跑贏友商,而是要發(fā)揮各自的特點(diǎn)和優(yōu)勢,爭取早日在全球市場占有一席之地。
而每一位數(shù)據(jù)庫領(lǐng)域的開發(fā)者和從業(yè)者,都將成為推動國內(nèi)數(shù)據(jù)庫產(chǎn)品發(fā)展的中堅力量,讓國產(chǎn)化走的更好、更穩(wěn)、更快一點(diǎn)。用 TiDB 設(shè)計者黃東旭老師的一句話來做本文的結(jié)尾:
“我的一個人生理念,就是沒有解決不了的問題。我相信這個世界是在往好的方向發(fā)展,而我也真的可以讓這個世界不斷變得更好一點(diǎn)。”

