国产数据库发展简史与趋势
谈及数据库的发展历史,就不得不提及三位数据库领域的开拓者,分别是Frank、Micheal和Jim Gray,他们为数据库理论奠定了坚实的基础,都获得了图灵奖。早在1972年,Micheal最早提出了Ingres数据库,于2014年获得图灵奖,Ingres数据库最后分化衍⽣为Sybase与Postgres两部分。其中Postgres数据库有⼤量分析函数,适⽤于分析型事务,尤其是OLAP。1972年,埃⾥森在硅⾕开发了Oracle数据库,再到1983年IBM开发了DB2数据库,同年Tdata诞⽣,直到1995年MySQL数据库诞⽣。⽽如今的Oracle于2009年收购了MySQL,这样⼀来就同时拥有了Oracle和开源的MySQL两套数据库,MySQL的创始⼈在离开后⼜开发了⼀套数据库MariaDB,现在国内有很多银⾏,像亿联银⾏等新的银⾏都在使⽤MariaDB。
在此先回顾⼀下OLTP数据库的发展历程。2003-2006年,⾕歌发布了⼏篇关于分布式关系型数据库的论⽂,以此为基础2012年开发了⾕歌F1作为内部⾃⽤数据库;2014年CockroachDB研发分布式关系型数据库,2017年国内的刘奇团队也成功开发了PingCAP数据库;到了2015年,阿⾥巴巴的OcenaBase经过内部多年打磨最终对外推出使⽤。
然后是OLAP数据库的发展历程。OLAP最早为数据库⼀体机,由IBM Netezza、Oracle Exadata、Teradata应⽤于⾼端存储上,对于硬件要求⾮常⾼。到2000年后MPP数据库⼤规模应⽤,成功实现了软硬件分离,数据不再需要存储在专有服务器上。2006年到2008年期间,随着Hadoop的⼤规模普及出现第三代分析型数据库,数据存储与HDFS之上,能够存储、计算分离、实现各节点间的访问,具
有很强的扩展性能。之后在Handoop的基础上进⼀步完善优化数据库性能,称之为最新⼀代数据仓库,代表的有HAWQ、Hive、Impala等。
⾸先,由于MPP和Hadoop各有优劣势,于是有创业公司尝试把MPP和Hadoop结合在⼀起使⽤。例如偶数科技利⽤了Hadoop的海量结构化和⾮结构化的特性,同时⼜利⽤了MPP实时性的优势。
第⼆个趋势是数据库都在从集中式逐渐转到分布式。Gartner的报告中指出以下三点原因:第⼀点,随着数据量的增加,硬件性能的瓶颈,尤其是摩尔定律的限制,传统的集中式架构完全⽆法满⾜客户的要求,不论是数据库还是整个应⽤软件,都有从集中式转分布式的趋势;第⼆点,由于数据库设计的理论存在CAP理论,即数据库的⼀致性、可⽤性、容错性三者不可兼得,那么未来数据库⼀定是⼀个分散的市场,每家的数据库⼀定是各有侧重点;第三点,随着业务的发展变化,未来交易型数据库和分析型数据库会逐渐融合,AP和TP在融合,所以HTAP必定是数据库的⼀个未来的发展⽅向。
第三个发展趋势是从SQL到NoSQL。Oracle、MySQL、SQLServer⼤部分是⼆位表结构,使⽤SQL语⾔,但是随着数据量的爆发式增长,像影⾳、⽂档、流媒体⼤幅度增加,Gartner认为数据未来⼀定是从SQL到NoSQL的⽅向发展,包括:⽂档数据库、健值数据库、图数据库和时序数据库。
**第四是关于NoSQL的发展趋势,根据DB Engines第三⽅的统计,图数据库是发展最快的,搜索数据库紧随其后,第三是⽂档数据库,第四是健值数据库。**在图数据库领域有两家明星公司——硅⾕的Tigergraph和Neo4j,Tigergraph上⼀轮估值三亿美⾦,由百度华创投资;还有就是⽂档数据库,代表性公司MongD已经是上市公司,估值92亿美⾦,收⼊2.6亿,可以看到在这个领域存在能够实现国产替代的机会。
对数据库发展进⾏总结和回顾:⾸先,做数据库⾏业需要长时间的积累,例如Oracle从1978年开始⾄今已有40多年的历史,才发展成如今的规模;第⼆,做数据库⼀定要有⼀个⽣态,⾃从X86替换⼩型机,DB2的市场份额逐渐下降以及软硬件分离的趋势,导致Intel、微软的操作系统得以普遍应⽤,在此⽣态下才有Oracle、MySQL发展壮⼤的机会;第三,做数据库需要长时间的持续性投⼊,要⼏⼗年如⼀⽇,例如蚂蚁⾦服的Oceanbase、华为的⾼斯、腾讯的TBASE都做了很⼤的投⼊。
关于数据库⾏业的探讨:第⼀,在数据库领域,国产数据库发展还⽐较缓慢,在党政军领域应⽤较多,⽽在⾦融机构领域应⽤较少。国产数据库长期被Oracle、IBM、MySQL这类产品挤压,随着中美贸易战的升级、国家⿎励软件国产化,国产软件将会越来越被重视,这将是⼀⼤转变契机;第⼆,在国产数据库的OLTP领域,华为、阿⾥、腾讯等⼚商有技术优势和资⾦优势,同时也有⽣态和渠道的优势;第三,创业公司进⼊OLTP领域门槛⾮常⾼,⽽在
OLAP领域,建⽴新⼀代数字据仓库以及NoSQL数据库⽅⾯,未来会涌现更多的创业公司,这块可能是很多投资机构接下来要重点关注的⽅向。
数据库的研发与应⽤场景密切相关。今天,中国数字经济规模已经达到32万亿,相当于GDP的1/3,涌现了⼤量新零售、新⾦融、新制造等数字业务场景,⽽这些场景从创新程度、创新规模和⽤户体量来看,都居世界前列。
常见mpp数据库
随着消费互联⽹向产业互联⽹的推进,消费互联⽹的数据库技术也在向产业和企业互联⽹场景演化,特别是⼯业互联⽹、车联⽹、物联⽹等⼤规模产业和企业互联⽹,都为数据库创新提供了前所未有的机遇。
近期⼜逢《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》发布,其中第六部分是“加快培育数据要素市场”,这标志着中央给“数据”以新的历史定位,不再视其为信息化的产物,⽽是上升到了⽣产要素的重要地位。
数据要素的新定位,将为中国数据库技术发展释放政策红利,数据库与数据分析将是长期看好的创业投资领域。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。