数据库未来发展趋势(更新版)
数据库诞生于20世纪60年代,经历近十年蝶变,到了70年代,IBM提出了商用的关系型数据库,此后,这种商用数据库经过包括Honeywell、IBM、微软等主流厂商的迭代更新,逐渐推广于市场。随着数据化趋势的发展和大数据时代的到来,数据库逐渐从灯光边缘来到舞台中心,成为了大数据时代最为重要的基础设施之一。自商业化后,长期以来,商用关系型数据库始终处于本地化部署阶段,直到2010年以后,数据库逐渐发展出了以下三大新趋势:第一,数据库的多元化。随着人们的需求逐渐多元化,一些非关系型的数据库得到了蓬勃发展,可以适应更多应用场景。第二,数据库上“云”。随着云技术、通讯和网络技术的大发展,数据库逐渐从本地部署向云上转化。第三,数据库的开源。最早的数据库是以闭源为主,后来逐渐有更多开源的数据库入场。
第一个发展趋势是数据库的多元化。当下,关系型数据库仍然是市场主流。什么是关系型数据库?最常见的就是我们常用的excel,非常直观地用二维的行列来排布数据。非关系型数据库即储存形式不是二维结构的数据库,从实时性来看,数据库还分为两类:一个是事务性的数据库,特点是要求有互动行为,对于响应的时间要求比较高;另一种是非事务性数据库,单纯把这些数据储存在里面,后续再进行分析。
关系数据库中的数据,彼此之间的关系一目了然,理解起来轻而易举。由于它的储存性能比较好,所以有易于维护、便于理解、使用方便等优点。但它有几点问题:一点数据库的灵活性较差,数据只能以规定的形式来填取,一旦一个数据库成型之后,想更改它的形式非常困难;二是它的数据储存方式非常讲究数据关系,对海量数据的处理非常不友好。
随着数据行业的大发展,数据要求的应用场景越来越多,出现了不以二维结构而是其他一些关系来储存数据的数据库,这些统称为非关系型数据库。它们的特点是格式灵活。由于不通过关系处理数据,所以它的响应速度和性能比较优秀。
但是非关系型数据库也有一些问题:第一,它的逻辑比较难,比如图数据库就是以图形或者网络作为储存的结构,以网络结构勾结起数据之间的关系,在理解和学习上需要投入较高成本;第二,不适合进行复杂操作,由于不是通过强关系性来储存,在调取复杂查询的时候,需要从一个表跳到另外一个表,再跳到后一个,以此类推,效率比关系型数据库要低。
常见的非关系型数据库包括键值数据库、文档型数据库、时序数据库和图数据库。
数据库是软件吗以Redis键值数据库为例,经典应用场景是微博上的发帖功能,因为微博是个超大规模应用,
经常会出现高并发的状态,所以适用键值数据库。其他的数据库也都有自己特定的应用场景。
关系型数据库有一个比较权威的评价社区叫做“DB-Engines”。作为一种比较成熟的数据库形式,关系型数据库还衍生出了诸如分布式数据库、云关系数据库等分支形式。但该类数据库近年发展面临挑战,在2022年8月受关注程度最高的前20个数据库产品中,非关系型数据库占了9个,相关技术更是发展迅速,正逐渐取得市场认可。
第二个发展趋势是云数据库。通常来说,传统的本地数据库是把数据库以及DBMS这些软件都部署在本地的服务器上。云数据库就是把数据库和大部分的DBMS管理软件、总环管理系统放在了云端。它主要有两种模式:一个就是通过虚拟机映象在云上独立运行,数据库实际上是一种比较常见的私有云形式;另外一种就是将数据库的硬件系统和DBMS的大部分功能都交由云数据库厂商来提供,而用户只需获得访问权限,通过网络去访问数据库的服务。随着云计算技术以及通讯技术的发展,云数据库已经步入了商业化进程。根据统计,本地数据库每年的增长只有4%左右,而云数据库每年的平均增长大概为16%。
据统计,截至2021年,全球本地化部署的和云数据库系统的DBMS的收入情况方面,Oracle
常年处于霸主地位,2019年之前一直保持第一。但继2020年微软凭借微软云的增长夺走魁首之位后,2021年,亚马逊也凭借亚马逊云AWS超过Oracle跃居第二。国内有三个厂商进入排名榜单,分别是位列第7的阿里云和位列第9的华为云以及第12的腾讯云。传统本地部署数据库的占比排名都有所下滑,新兴云数据库厂商排名上升。这是云数据库的大势所趋。
为什么会有这样的发展趋势?因为本地部署的数据库存在一些不足之处:最突出的一个缺点就是成本高。数据库跟仓库有一定的相通之处,用仓库来打比方,本地化部署的数据库其实相当于厂商租用仓库的用地,这是一笔投入;还要在里面安装各种的货架、服务设施,这是初始投入;同时还需要为这样的一个数据中心配备员工,为一些系统在使用的时候提供电力系统,整体来说初期投入很大、决策很重,而且后续的运营也需要持续投入,成本比较高。第二点是可靠性需要冗余,需要额外的部署储存作为备用。第三点是扩容和迭代比较困难,数据库本身是本地部署的数据库,有硬件系统和软件系统,硬件系统要扩容的话要买更多的服务器。另外一点就是因为老系统用着比较舒服,导致没有那么强的动力去更新发展,导致在扩容和迭代方面比较困难。
相比之下,云数据库就有不少优势。它最大的特点是服务器硬件和维护服务是云数据库厂商
提供的,初始成本投入比较小,而且不需要提供太多的维护。由于冗余的备份都是由云数据库厂商来提供服务,因此这一方面的成本又进一步下降。既能满足需求又成本低,就逐渐产生了数据库上云的大趋势。但云数据库也有的一些问题,其中最大的问题就是其成熟程度。本地化的数据库,从商业化到现在经历了近50年的发展,有大量的功能和代码的丰富积累,功能比较完善,而云数据库厂商由于业态、业务形式都比较新颖,因此它的工艺积累不如已经成熟的本地化部署方案。而且在升级和迭代方面,其系统的兼容性也不如本地化部署。
第三个发展趋势是数据库开源。首先,什么是闭源数据库?大家所熟知的一些商业化数据都是闭源的,源代码对于这些厂商来说属于商业机密,不对客户开放。开源数据库正相反,其数据库代码向公众开放。
它有几个特点:第一,由于开源的授权费没有商业化数据库那么高,成本相对来说要低一些。第二,也是最重要的一点,它的源代码完全公之于众,客户在使用的时候能够清晰地看到里面数据的情况,对数据的流向、指令了如指掌,不用担心数据库里面是否存在“走后门”的情况,可以满足自主化和信息安全的需求。第三,由于传统的商业数据库集中度比较高,对于用户来说是比较强势的一方,它本身不提供额外的定制化开发,仅由第三方服务商
提供应用层面的二次开发;而开源数据库不仅可以自行开发,还可以在DBMS代码层面直接进行开发。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论