NOSql数据库的优缺点分析
Nosql介绍
redis是nosql数据库吗Nosql的全称是Not Only Sql,这个概念早起就有⼈提出,在09年的时候⽐较⽕。Nosql指的是⾮关系型数据库,⽽我们常⽤的都是关系型数据库。就像我们常⽤的mysql,oralce、sqlserver等⼀样,这些数据库⼀般⽤来存储重要信息,应对普通的业务是没有问题的。但是,随着互联⽹的⾼速发展,传统的关系型数据库在应付超⼤规模,超⼤流量以及⾼并发的时候⼒不从⼼。⽽就在这个时候,Nosql应运⽽⽣。
Nosql和关系型数据库的区别
1.存储⽅式
关系型数据库是表格式的,存储在表的⾏和列中。他们之间很容易关联协作存储,提取数据很⽅便。⽽Nosql数据库则与其相反,他是组合在⼀起。通常存储在数据集中,就像⽂档、键值对或者图结构。
2.存储结构
关系型数据库对应的是结构化数据,数据表都预先定义了结构(列的定义),结构描述了数据的形式和内容。这⼀点对数据建模⾄关重要,虽然预定义结构带来了可靠性和稳定性,但是修改这些数据⽐较困难。
⽽Nosql数据库基于动态结构,使⽤与⾮结构化数据。因为Nosql数据库是动态结构,可以很容易适应数据类型和结构的变化。
3.存储规范
关系型数据库的数据存储为了更⾼的规范性,把数据分割为最⼩的关系表以避免重复,获得精简的空间利⽤。虽然管理起来很清晰,但是单个操作设计到多张表的时候,数据管理就显得有点⿇烦。⽽Nosql数据存储在平⾯数据集中,数据经常可能会重复。单个数据库很少被分隔开,⽽是存储成了⼀个整体,这样整块数据更加便于读写
4.存储扩展
这可能是两者之间最⼤的区别,关系型数据库是纵向扩展,也就是说想要提⾼处理能⼒,要使⽤速度更快的计算机。因为数据存储在关系表中,操作的性能瓶颈可能涉及到多个表,需要通过提升计算机性能来克服。虽然有很⼤的扩展空间,但是最终会达到纵向扩展的上限。⽽Nosql数据库是横向扩展的,它的存储天然就是分布式的,可以通过给资源池添加更多的普通数据库服务器来分担负载。
5.查询⽅式
关系型数据库通过结构化查询语⾔来操作数据库(就是我们通常说的SQL)。SQL⽀持数据库CURD操作
的功能⾮常强⼤,是业界的标准⽤法。⽽Nosql查询以块为单元操作数据,使⽤的是⾮结构化查询语⾔(UnQl),它是没有标准的。关系型数据库表中主键的概念对应Nosql中存储⽂档的ID。关系型数据库使⽤预定义优化⽅式(⽐如索引)来加快查询操作,⽽Nosql更简单更精确的数据访问模式。
6.事务
关系型数据库遵循ACID规则(原⼦性(Atomicity)、⼀致性(Consistency)、隔离性(Isolation)、持久性(Durability)),⽽Nosql数据库遵
循BASE原则(基本可⽤(Basically Availble)、软/柔性事务(Soft-state )、最终⼀致性(Eventual Consistency))。
由于关系型数据库的数据强⼀致性,所以对事务的⽀持很好。关系型数据库⽀持对事务原⼦性细粒度控制,并且易于回滚事务。⽽Nosql数据库是在CAP(⼀致性、可⽤性、分区容忍度)中任选两项,因为基于节点的分布式系统中,很难全部满⾜,所以对事务的⽀持不是很好,虽然也可以使⽤事务,但是并不是Nosql的闪光点。
7.性能
关系型数据库为了维护数据的⼀致性付出了巨⼤的代价,读写性能⽐较差。在⾯对⾼并发读写性能⾮
常差,⾯对海量数据的时候效率⾮常低。⽽Nosql存储的格式都是key-value类型的,并且存储在内存中,⾮常容易存储,⽽且对于数据的 ⼀致性是 弱要求。Nosql⽆需sql的解析,提⾼了读写性能。
8.授权⽅式
关系型数据库通常有SQL Server,Mysql,Oracle等。主流的Nosql数据库有Redis,Memcache,MongoDb。⼤多数的关系型数据库都是付费的并且价格昂贵,成本较⼤,⽽Nosql数据库通常都是开源的。
Redis、Memcache、MongoDb的优缺点
Redis优点
⽀持多种数据结构,如 string(字符串)、 list(双向链表)、dict(hash表)、set(集合)、zset(排序set)、hyperloglog(基数估算)
⽀持持久化操作,可以进⾏aof及rdb数据持久化到磁盘,从⽽进⾏数据备份或数据恢复等操作,较好的防⽌数据丢失的⼿段。
⽀持通过Replication进⾏数据复制,通过master-slave机制,可以实时进⾏数据的同步复制,⽀持多级复制和增量复制,master-slave机制是Redis进⾏HA的重要⼿段。
单线程请求,所有命令串⾏执⾏,并发情况下不需要考虑数据⼀致性问题。
⽀持pub/sub消息订阅机制,可以⽤来进⾏消息订阅与通知。
⽀持简单的事务需求,但业界使⽤场景很少,并不成熟。
Redis缺点
Redis只能使⽤单线程,性能受限于CPU性能,故单实例CPU最⾼才可能达到5-6wQPS每秒(取决于数据结构,数据⼤⼩以及服务器硬件性能,⽇常环境中QPS⾼峰⼤约在1-2w左右)。
⽀持简单的事务需求,但业界使⽤场景很少,并不成熟,既是优点也是缺点。
Redis在string类型上会消耗较多内存,可以使⽤dict(hash表)压缩存储以降低内存耗⽤。
Memcache优点
Memcached可以利⽤多核优势,单实例吞吐量极⾼,可以达到⼏⼗万QPS(取决于key、value的字节⼤⼩以及服务器硬件性能,⽇常环境中QPS⾼峰⼤约在4-6w左右)。适⽤于最⼤程度扛量。⽀持直接配置为session handle。
Memcache缺点
只⽀持简单的key/value数据结构,不像Redis可以⽀持丰富的数据类型。
⽆法进⾏持久化,数据不能备份,只能⽤于缓存使⽤,且重启后数据全部丢失。
⽆法进⾏数据同步,不能将MC中的数据迁移到其他MC实例中。
Memcached内存分配采⽤Slab Allocation机制管理内存,value⼤⼩分布差异较⼤时会造成内存利⽤率降低,并引发低利⽤率时依然出现踢出等问题。需要⽤户注重value设计。
MongoDB优点
更⾼的写负载,MongoDB拥有更⾼的插⼊速度。
处理很⼤的规模的单表,当数据表太⼤的时候可以很容易的分割表。
⾼可⽤性,设置M-S不仅⽅便⽽且很快,MongoDB还可以快速、安全及⾃动化的实现节点(数据中⼼)故障转移。
快速的查询,MongoDB⽀持⼆维空间索引,⽐如管道,因此可以快速及精确的从指定位置获取数据。
MongoDB在启动后会将数据库中的数据以⽂件映射的⽅式加载到内存中。如果内存资源相当丰富的话,这将极⼤地提⾼数据库的查询速度。
⾮结构化数据的爆发增长,增加列在有些情况下可能锁定整个数据库,或者增加负载从⽽导致性能下降,由于MongoDB的弱数据结构模式,添加1个新字段不会对旧表格有任何影响,整个过程会⾮常快速。
MongoDB缺点
不⽀持事务。MongoDB占⽤空间过⼤ 。
MongoDB没有成熟的维护⼯具。
Redis、Memcache、MongoDB的区别
性能
三者的性能都⽐较⾼,总的来讲:Memcache和Redis差不多,要⾼于MongoDB。
便利性
memcache数据结构单⼀。
redis丰富⼀些,数据操作⽅⾯,redis更好⼀些,较少的⽹络IO次数。
mongodb⽀持丰富的数据表达,索引,最类似关系型数据库,⽀持的查询语⾔⾮常丰富。
存储空间
redis在2.0版本后增加了⾃⼰的VM特性,突破物理内存的限制;
可以对key value设置过期时间(类似memcache)。
memcache可以修改最⼤可⽤内存,采⽤LRU算法。
mongoDB适合⼤数据量的存储,依赖操作系统VM做内存管理,吃内存也⽐较厉害,服务不要和别的服务在⼀起。
可⽤性
redis,依赖客户端来实现分布式读写;主从复制时,每次从节点重新连接主节点都要依赖整个快照,⽆增量复制,因性能和效率问题,所以单点问题⽐较复杂;不⽀持⾃动sharding,需要依赖程序设定⼀
致hash 机制。⼀种替代⽅案是,不⽤redis本⾝的复制机制,采⽤⾃⼰做主动复制(多份存储),或者改成增量复制的⽅式(需要⾃⼰实现),⼀致性问题和性能的权衡。
Memcache本⾝没有数据冗余机制,也没必要;对于故障预防,采⽤依赖成熟的hash或者环状的算法,解决单点故障引起的抖动问题。
mongoDB⽀持master-slave,replicaset(内部采⽤paxos选举算法,⾃动故障恢复),auto sharding机制,对客户端屏蔽了故障转移和切分机制。
可靠性
redis⽀持(快照、AOF):依赖快照进⾏持久化,aof增强了可靠性的同时,对性能有所影响。
memcache不⽀持,通常⽤在做缓存,提升性能。
MongoDB从1.8版本开始采⽤binlog⽅式⽀持持久化的可靠性。
⼀致性
Memcache 在并发场景下,⽤cas保证⼀致性。
redis事务⽀持⽐较弱,只能保证事务中的每个操作连续执⾏。
mongoDB不⽀持事务。
数据分析
mongoDB内置了数据分析的功能(mapreduce),其他两者不⽀持。
应⽤场景
redis:数据量较⼩的更性能操作和运算上。
memcache:⽤于在动态系统中减少数据库负载,提升性能;做缓存,提⾼性能(适合读多写少,对于数据量⽐较⼤,可以采⽤sharding)。
MongoDB:主要解决海量数据的访问效率问题。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论