登录 用户注册
工业APP开发工具
工业APP运行工具
云平台服务
资讯活动

中国跨过数据库这座大山了吗?

发布时间:2019-08-01 来源:金属加工

数据库是一款被许多人忽视的IT软件产品,它通过将计算机科学和易于人类理解认知的数据管理方式完美的衔接在了一起,自上世纪50年代以来,逐渐影响并改变了世界。如同计算机技术的发展一样,我国数据库产业的起步较晚。那么现在,在数据库方面,中国已经发展到了怎样的程度?

数据库是一款被许多人忽视的IT软件产品,它通过将计算机科学和易于人类理解认知的数据管理方式完美的衔接在了一起,自上世纪50年代以来,逐渐影响并改变了世界。


可以毫不夸张的讲,数据库的重要性丝毫不亚于芯片、操作系统等。如果没有数据库,就没有企业的根本。


但和很多软件产品一样,数据库最早也是国外进步的产物,20世纪60年代国外就有了商业数据库,但直到80年代国内才拥有第一批成型的数据库人才。


那么现在,在数据库方面,中国已经发展到了怎样的程度?


如同计算机技术的发展一样,我国数据库产业的起步较晚。


1977年11月,中国科技大学在黄山主办了第一次数据库技术研讨会,标志着中国数据库软件产业正式踏上了发展的正轨,其后历经三十多年的发展,中国数据库软件产业相继经历了外企垄断期、国产萌芽期、互联网革命期,最终在目前的云数据崛起期有了和世界主流数据库企业的一战之力。


技术苏醒期


1978年,高考的恢复让无数青年回归大学校园,作为我国最早开设“数据库系统概论”这门课程的教师,萨师煊在中国人民大学的黑板上率先写下了“数据库”3个字,从此启蒙一个古老国家在新领域开始开拓新的篇章。


当然,不只是萨师煊教授,包括中国人民大学的王珊教授、国防科技大学的阳国贵教授等许许多多的国内学界泰斗也在此时共同推动数据库技术在中国大地的生根发芽。时至今日,由他们编写的教材仍然是国内高校学习数据库的必读书籍之一。


但在当时,刚刚从农场、工厂乃至热带森林中返校的第一批学生懵懵懂懂,他们望着手上油印的讲义,似乎还很难明白这是一个怎样的产物。不光是这群年轻人,彼时的中国大陆,听说过这个名词的人,也不过是极少数顶尖的计算机科学家。


与此同时,已过而立之年仍一事无成的Ellison正在为美国中情局做一个数据项目,思维跳跃且敏锐的他发现关系型数据库存在的商机。几个月后,Oracle 1.0 诞生了,并在短短十几年间,成长为世界级的巨人。


话说回来,尽管国内的数据库产业人才起步相较美国晚了二十年,但由萨师煊教授等学术泰斗所培育起来的星星之火一直在一点一点的寻找机会形成燎原之势。20世纪80年代,这批中国数据库的第一代学生将数据库广泛带入学校、企业以及科研机构,由他们在全国各地埋下数据库的种子。


一方面,80年代,刚刚改革开放的我国百废待兴,在军事领域陆续上马了一大批重要的军工项目。可以想见,在八十年突飞猛进的国家科技成果进步中,包括中国第一枚洲际导弹、第一代超级计算机、第一个正负电子对撞机、国产歼击机,甚至国产大型驱逐舰等的建设里一定有第一代中国数据库人身影。


另一方面,中国信息技术建设于80年代开始和世界接轨。由于自己造不出来,彼时的市场基本处于引进状态。80 年代初期,我国开始尝试引进 dBase II。dBase是第一个在个人电脑上被广泛使用的单机版数据库系统,由Ashton-Tate公司发表于CP/M 与 DOS时期,随后,这个产品在 SQL 时代迅速被其他产品打败。


外企垄断期


时光流逝,迈过80年代,进入到了90年代。这世纪末的十年,也是外企在中国赚取高额红利的十年。任何大的成功一定离不开时代背景,Oracle等企业能够在中国市场大获成功,一定与彼时的时代背景密不可分。因此,我们先来讲讲当时的时代背景。


众所周知,2018-2019这两年最重要的国际事件之一当属于中美贸易战,但其实,早在1989年,美对中的制裁已早有先例。


1989-1993年,时值国际形势风云变幻,中美关系已走出蜜月期,开始变得日发严峻。1989 年 6 月 5 日下午,美国总统布什(即老布什)宣布了三项制裁措施:

(1)暂停中美间一切军售和商业性武器出口;(2)暂停中美两国间军事领导人的互访;(3)同意重新研究中国留美学生要求延长逗留时间的请求。


在美国的带动下,西方国家纷纷效仿开始制裁中国。彼时,弱小的中国毫无还手之力。尽管面对如此危机,党和政府经过研究最终决定:在美国和西方的巨大压力下保持极大克制,继续坚持改革开放路线。由于政府坚定地将国内的发展和改革开放作为自己的主要方向,之后的92南巡也就显得那么顺其自然。再然后,中国改革开放涌起了新一轮热潮,大量欧美企业瞄准中国市场,开启了外资与中国市场结合的黄金十年。


在这一背景下,大量美国的数据库科技公司组团进入中国。


1989 年,Oracle 进入中国市场,靠代理开卖 Oracle,1992 年甲骨文在北京设立独资公司。

1991 年 12 月,Sybase (塞贝斯)进入中国大陆,随后投资 230 万美元正式设立赛贝斯软件。

1992 年,IBM 正式进入中国, 并启动“发展中国”大战略, 协助中国全面开放。一同带来的还有 DB2 和 informix(英孚美软件公司)系列产品。

1992 年 10 月,Microsoft 在北京设立代办处…


由于当时国内几乎没有能够称之为对手的科技企业,因此,核心数据库的应用主要解决的是有且能用的问题,至于是否国产、安不安全、可控与否并不是最关键的考虑因素。而在这其中,最大名鼎鼎的莫过于Oracle甲骨文公司。


1989年,我国已经坚持改革开放相当长的一段时间,沉睡的巨人正在逐步苏醒,中国大陆似乎遍地黄金。此时,来自台湾的冯星君发现,在当时的中关村购买一套盗版Oracle软件只需要2500元人民币,而在美国,一套正版的Oracle DOS版则要卖1700美元。看到此情此景,冯星君决定:与其让盗版商卖 Oracle,倒不如我自己卖


之后,他说服Oracle在美国的老板,准许他在中国把一套Oracle DOS版的价格卖到和盗版一样,但是却多了培训、服务、手册等增值产品。就凭这些,他只用了 3 个月时间就卖出了 5000 套Oracle DOS,一举扫平中关村的盗版,让Oracle在中国站稳了脚。在此之后,Oracle在中国大陆开始闯荡天地,终于凭借“九七工程”一统江湖。


当时,我国电信行业的业务量正以平均每年45~50%的速度递增,而计费方式是脱机读带、人工整理,长途、国际业务甚至需要2~3个月才能结算出来,因而引入先进的数据库并搭建起一套完整的服务系统,就成为了迫在眉睫的任务。


“1995年5月,邮电部电信总局提出开发和建设"市内电话业务计算机综合管理系统",即"九七工程",并于同年7月下发了一系列的技术和业务规范,要求全国县以上的邮电局在1997年底前实施"九七工程"。

九七工程的7大系统


1997年,Oracle顺利地拿下东三省邮电管理局5期工程的大单,一举奠定其江湖地位,同时也给Informix、SYBASE、CA、Digital等业界几大厂商造成了沉重的打击。


中国数据库的行业格局就在这一时期形成了:金融行业用IBM DB2、Informix数据库;在电信行业,则是Oracle的天下。


当然,整个90年代,我国自主的数据库研发一刻也未停歇。“十五”(第十个五年计划)期间,国家对相关产业的经费投入源源不断,并在国家863计划中专门设立“数据库重大专项”。终于,在大众的共同努力下,第一批国产数据库厂商陆续出炉。


国产萌芽期


凡有果必有因,在20世纪末至21世纪初的这段时间里,中国大陆上风起云涌。一方面,借助国家863、973专项和研究机构的资金及人才投入,达梦、人大金仓、神州通用、南大通用等第一批国内自主研发关系型数据库的企业接连诞生;另一方面,随着腾讯、阿里、百度等的相继成立,我国互联网科技公司逐渐翻开了新的一页。


作为国内数据库产业鼻祖之一,王珊教授带领研发的人大金仓是我国第一批数据库厂商的领路人。自其于1999年创办开始,我国数据库厂商开始不断涌现。


但十几年过去,目前这批国产数据库占比仍不到整个市场的10%,究其原因,内因与外因并存。


从外部来看,主要是由于金融、电信、航空等重要关键客户并没有广泛、批量的采用这些国产产品。在国产数据库出现之时,国内对数据库的相关市场需求已经迸发,国产产品接不住。以银行为例,银行的数据库系统庞大,比起价格等隐私,不能出错是其中更重要的考量因素。


因此,出现了这样一个死循环:产品初期需要不断的试错和验证的机会——客户没有时间和办法陪着试错和成长——没有客户,生态就更差,更没有办法进行产品的投入和迭代。


当然,对于一个20年都没能发展起来的科技企业,其内在制约一定占据更主要的地位。国内产品在它们的研发思路上,大都模仿Oracle,想要开发一个全兼容的数据库,这也是很多政府客户的要求,但在别人跑过的路上追赶,想要超越何其之难。


与此同时,国外出现了一些另辟蹊径的数据库小厂商。例如,以多线程代替多进程开发的Sybase、开发出位图索引的Express Way、推出多维关系模型理论的RedBrick等,它们都以其创新得到市场的尊重。


倘若单单依靠这一类自主研发的数据库产品来支撑我国的数据库产业基本是不可能的,同时期,世界尖端产品仍在不断迭代,且其速度更快、质量更高,直线超车希望渺茫,弯道超车可以一试。恰好,我国互联网企业发展起来了。


从1999年开始,我国互联网企业逐步兴起。相比当时的其他行业,互联网企业的一大特点就是数据多,且越来越多。因此,互联网企业对数据库的要求更强烈、更迫切,与此同时,Oracle数据库的致命缺点也暴露无疑:贵!


不仅仅是Oracle软件贵,维持Oracle数据库所标配的IBM小型机、EMC存储硬件等的价格可都不菲。在当时,一台小型机大约需要500万,而每两台小型机需要配有300万的EMC存储。


昂贵的费用压得互联网企业喘不过气,想要发展壮大就必须走一条更具有性价比的路。在这一诉求下,当时的互联网明星企业——美国雅虎率先使用MySQL数据库,在全世界引发了一股新潮流。


于是,星星之火,开始燎原。


互联网革命期


在中国,随着淘宝与支付宝用户数量激增,阿里每年需要为以Oracle为首的IOE系统支付数以亿元计的使用费。不仅仅是账单“巨额”,其性能也难以保证。据说,阿里2009年有 16 个节点,但每天早上 CPU 都跑到 98%——花巨资购买的 Oracle 产品+服务也没办法支撑阿里成长的速度。2009年起,阿里咬牙开始“去IOE“,即放弃Oracle,使用开源MySQL。


阿里此举一定是有超然的决心的,要知道,如今早已成习惯的双十一购物狂欢也是起步于2009年。当时的网购用户虽不及现今,但也一亿有余。从当年的双十一开始,阿里开始逐步构建自己的数据库。


2013年5月17日,随着内部的最后一台小型机下线,Oracle被完全清除出淘宝核心系统,淘宝天猫所有的数据库都从Oracle替换成了自主开源的AliSQL。而在2013年的双十一中,淘宝更是55秒就突破1亿交易额,单日销售额超过美国三大网购节37亿美元之和。这其中,AliSQL功不可没。此后,Oracle在阿里内部进入倒计时,2014 年阿里在支付宝交易中替换掉了 Oracle。2016 年支付宝总账全面用 OceanBase 替换 Oracle。


从阿里开始,开源MySQL在国内互联网公司逐步开始取代了Oracle的江湖地位。此后,包括新浪、腾讯、百度、网易、小米、京东等一众现今赫赫有名的国内互联网企业均是MySQL的用户与贡献者,并诞生出一批MySQL领军人物。


中国互联网的开源数据大军,从MySQL开始开枝散叶,此后,包括PostgreSQL、Redis、MongoDB和HBase等开源社区也开始一起寻找中国数据库发展的新方向。


不只是国内的互联网公司逐步用国产的数据库代替Oracle的地位。有传闻称,达梦、人大金仓、神通、南大等一批数据库元老也在这一批开源数据库浪潮中受到启发、快速发展。


但在国外,事情也总是往不可控的方向发展着。2008年,Sun宣布收购MySQL AB,但造化弄人,Sun收购MySQL后不久就陷入困境,一天内股价下跌23%,不得已,终被Oracle收购。从此,MySQL也落入Oracle之手,事实上的垄断形成,带给数据库行业巨大震动。


值得庆幸的是,在此前的收购中,MySQL之父Monty并没有跟随,而是离职开发出新的一支MariaDB,再之后,阿里、腾讯也都先后赞助了MariaDB。


另一方面,2013年,棱镜门事件爆发,国产数据库终于迎来出头之日。此后,达梦、金仓、神通、南大等一批国产数据库企业得到了广泛关注,其产品也开始被广泛应用于央企、国家财政、军事等专用领域。


云数据库崛起期


在阿里轰轰烈烈去IOE的进程中,收获也是相当巨大的,其最大的两项成果分别是来自阿里云的Polar DB和蚂蚁金服的OceanBase。


如果说蚂蚁金服的金融数据库OceanBase为阿里提供的是一个“镇海神针”,那么Polar DB就是其披荆斩棘的“大刀阔斧”。Polar DB是国内首个自研企业级关系型云数据技术框架,从拥有它的那一天起,阿里云在竞争世界一流数据库的战场上拿到了入场券。


Polar DB具有很强的分布式云产品属性,通过将计算与存储分离,从而尽可能的提升效率。通俗来讲,就是在云上将数据存储共享,将读写分开进行,为数据库打开全新思路。


据Gartner发布的报告显示,现如今的数据库市场早已发生了翻天覆地的变化,阿里云目前已经位居全球数据库市场份额第三,年增速115%,增速远超AWS的74%和Oracle的66%。


此外,在亚马逊 re:Invent大会上, CEO Andy Jassy曾调侃,曾经的王者Oracle,现在在全球云计算市场份额太低,不算真正的对手。亚马逊真正需要注意的对手是微软、阿里和谷歌。


值得庆幸的是,在云时代,中国终于没有落伍,而云时代的数据库厂商,也终于不只有阿里云一家。

从上表可以看出,这一批国内参与云数据库的企业实力可都不菲。除了互联网大企业背景和ICT巨头厂商,也不乏有创业型企业。


前段时间,涛思数据创始人陶建辉宣布将TDengine开源,将团队耗费两年多时间写下的10多万行C语言代码放在开源社区GitHub上,无私分享给全球开发者,一度冲到GitHub综合趋势排名第一。


而对于阿里来讲,自研通用型数据库恐怕也将是未来的趋势。虎嗅在《中国数据库40年历史:隐秘的江湖与恩怨》一文中曾讲到,阿里云正在自行研发一款通用数据库,初步命名极地DB。阿里云的这款自研数据库产品在通用场景下性能可以达到MySQL的数倍,而成本只有MySQL的一半左右。一旦阿里云推出自研通用云数据库,华为云,腾讯云等国内二线云计算玩家也许就会在自研通用云数据库上加快步伐,但能否有这个建设能力,那就见仁见智了。


展望未来


尽管在云数据库方面,中国企业逐步打开一条道路,但目前中国企业级关键应用仍有大量都跑在Oracle上。这些刚需型企业可能不大关注所用产品究竟是自研或者国产,它们更核心的需求是能不能用、好不好用。


从整个市场来看,短期内Oracle的市场份额确实很难撼动,但随着物联网的进一步发展,凭借国内的海量数据与处理需求,必将培育起一大批云和新型数据库企业的迅猛发展。在未来市场的倾斜下,数据库终有一天将不再是横亘在中国企业面前的一座大山。


另外,我们也要感谢过去三十多年来我国数据人的努力与贡献,以及在末微之势下的不离不弃,向中国数据库行业的先驱和从业者致敬!


来源:物联网智库  作者:田小腰

相关资讯
用户反馈
微信公众号

航天云网

工业互联网观察

微博

工业互联网观察

关注

咨询建议