简述关系型数据库和⾮关系型数据库
当前数据库分为关系型数据库和⾮关系型数据库
关系型数据库
关系型数据库:指采⽤了关系模型来组织数据的数据库。
关系模型指的就是⼆维表格模型,⽽⼀个关系型数据库就是由⼆维表及其之间的联系所组成的⼀个数据组织。
关系模型中常⽤的概念:
关系:⼀张⼆维表,每个关系都具有⼀个关系名,也就是表名
元组:⼆维表中的⼀⾏,在数据库中被称为记录
属性:⼆维表中的⼀列,在数据库中被称为字段
域:属性的取值范围,也就是数据库中某⼀列的取值限制
关键字:⼀组可以唯⼀标识元组的属性,数据库中常称为主键,由⼀个或多个列组成
关系模式:指对关系的描述。其格式为:关系名(属性1,属性2, … … ,属性N),在数据库中成为表结构
关系型数据库的优点:
1.容易理解:⼆维表结构是⾮常贴近逻辑世界的⼀个概念,关系模型相对⽹状、层次等其他模型来说更容易理解
2.使⽤⽅便:通⽤的SQL语⾔使得操作关系型数据库⾮常⽅便
3.易于维护:丰富的完整性(实体完整性、参照完整性和⽤户定义的完整性)⼤⼤减低了数据冗余和数据不⼀致的概率
简述数据库系统的特点关系型数据库存在的问题
1.⽹站的⽤户并发性⾮常⾼,往往达到每秒上万次读写请求,对于传统关系型数据库来说,硬盘I/O是⼀个很⼤的瓶颈
2.⽹站每天产⽣的数据量是巨⼤的,对于关系型数据库来说,在⼀张包含海量数据的表中查询,效率是⾮常低的
3.在基于web的结构当中,数据库是最难进⾏横向扩展的,当⼀个应⽤系统的⽤户量和访问量与⽇俱增的时候,数据库却没有办法像web server和app server那样简单的通过添加更多的硬件和服务节点来扩展性能和负载能⼒。当需要对数据库系统进⾏升级和扩展时,往往需要停机维护和数据迁移。
4.性能⽋佳:在关系型数据库中,导致性能⽋佳的最主要原因是多表的关联查询,以及复杂的数据分析类型的复杂SQL报表查询。为了保证数据库的ACID特性,必须尽量按照其要求的范式进⾏设计,关系型数据库中的表都是存储⼀个格式化的数据结构。
数据库事务必须具备ACID特性,ACID分别是
Atomic原⼦性,Consistency⼀致性,Isolation隔离性,Durability持久性。
当今⼗⼤主流的关系型数据库
Oracle,Microsoft SQL Server,MySQL,PostgreSQL,DB2,
Microsoft Access, SQLite,Teradata,MariaDB(MySQL的⼀个分⽀),SAP
⾮关系型数据库
⾮关系型数据库:指⾮关系型的,分布式的,且⼀般不保证遵循ACID原则的数据存储系统。
⾮关系型数据库结构
⾮关系型数据库以键值对存储,且结构不固定,每⼀个元组可以有不⼀样的字段,每个元组可以根据需要增加⼀些⾃⼰的键值对,不局限于固定的结构,可以减少⼀些时间和空间的开销。
优点
1.⽤户可以根据需要去添加⾃⼰需要的字段,为了获取⽤户的不同信息,不像关系型数据库中,要对多表进⾏关联查询。仅需要根据id取出相应的value就可以完成查询。
2.适⽤于SNS(Social Networking Services)中,例如facebook,微博。系统的升级,功能的增加,往往意味着数据结构巨⼤变动,这⼀点关系型数据库难以应付,需要新的结构化数据存储。由于不可能⽤⼀种数据结构化存储应付所有的新的需求,因此,⾮关系型数据库严格上不是⼀种数据库,应该是⼀种数据结构化存储⽅法的集合。
不⾜:
只适合存储⼀些较为简单的数据,对于需要进⾏较复杂查询的数据,关系型数据库显的更为合适。不适合持久存储海量数据
⾮关系型数据库的分类
⾮关系型数据库都是针对某些特定的应⽤需求出现的,因此,对于该类应⽤,具有极⾼的性能。依据结构化⽅法以及应⽤场合的不同,主要分为以下⼏类:
1、⾯向⾼性能并发读写的key-value数据库:
key-value数据库的主要特点是具有极⾼的并发读写性能
Key-value数据库是⼀种以键值对存储数据的⼀种数据库,类似Java中的map。可以将整个数据库理解为⼀个⼤的map,每个键都会对应⼀个唯⼀的值。
主流代表为Redis, Amazon DynamoDB, Memcached,
Microsoft Azure Cosmos DB和Hazelcast
2、⾯向海量数据访问的⾯向⽂档数据库:
这类数据库的主要特点是在海量的数据中可以快速的查询数据
⽂档存储通常使⽤内部表⽰法,可以直接在应⽤程序中处理,主要是JSON。JSON⽂档也可以作为纯⽂本存储在键值存储或关系数据库系统中。
主流代表为MongoDB,Amazon DynamoDB,Couchbase,
Microsoft Azure Cosmos DB和CouchDB
3、⾯向可扩展性的分布式数据库:
这类数据库的主要特点是具有很强的可拓展性
普通的关系型数据库都是以⾏为单位来存储数据的,擅长以⾏为单位的读⼊处理,⽐如特定条件数据的获取。因此,关系型数据库也被成为⾯向⾏的数据库。相反,⾯向列的数据库是以列为单位来存储数据的,擅长以列为单位读⼊数据。
这类数据库想解决的问题就是传统数据库存在可扩展性上的缺陷,这类数据库可以适应数据量的增加以及数据结构的变化,将数据存储在记录中,能够容纳⼤量动态列。由于列名和记录键不是固定的,并且由于记录可能有数⼗亿列,因此可扩展性存储可以看作是⼆维键值存储。主流代表为Cassandra,HBase,Microsoft Azure Cosmos DB,
Datastax Enterprise和Accumulo
CAP理论
关系型与⾮关系型数据库的⽐较
1.成本:Nosql数据库简单易部署,基本都是开源软件,不需要像使⽤Oracle那样花费⼤量成本购买使⽤,相⽐关系型数据库价格便宜。
2.查询速度:Nosql数据库将数据存储于缓存之中,⽽且不需要经过SQL层的解析,关系型数据库将数据存储在硬盘中,⾃然查询速度远不及Nosql数据库。
3.存储数据的格式:Nosql的存储格式是key,value形式、⽂档形式、图⽚形式等等,所以可以存储基础类型以及对象或者是集合等各种格式,⽽数据库则只⽀持基础类型。
4.扩展性:关系型数据库有类似join这样的多表查询机制的限制导致扩展很艰难。Nosql基于键值对,数据之间没有耦合性,所以⾮常容易⽔平扩展。
5.持久存储:Nosql不使⽤于持久存储,海量数据的持久存储,还是需要关系型数据库
6.数据⼀致性:⾮关系型数据库⼀般强调的是数据最终⼀致性,不像关系型数据库⼀样强调数据的强⼀致性,从⾮关系型数据库中读到的有可能还是处于⼀个中间态的数据,
Nosql不提供对事务的处理。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。