MySQL与PostgreSQL相⽐哪个更好?
⽹上已经有很多拿PostgreSQL与MySQL⽐较的⽂章了,这篇⽂章只是对⼀些重要的信息进⾏下梳理。在开始分析前,先来看下这两张图:MySQL
MySQL声称⾃⼰是最流⾏的开源数据库。LAMP中的M指的就是MySQL。构建在LAMP上的应⽤都会使⽤MySQL,如WordPress、Drupal等⼤多数php开源程序。MySQL最初是由MySQL AB开发的,然后在2008年以10亿美⾦的价格卖给了Sun公司,Sun公司⼜在2010年被Oracle 收购。Oracle⽀持MySQL的多个版本:Standard、Enterprise、Classic、Cluster、Embedded与Community。其中有⼀些是免费下载的,另外⼀些则是收费的。其核⼼代码基于GPL许可,由于MySQL被控制在Oracle,社区担⼼会对MySQL的开源会有影响,所以开发了⼀些分⽀,⽐如: MariaDB和Percona。
PostgreSQL
PostgreSQL标榜⾃⼰是世界上最先进的开源数据库。PostgreSQL的⼀些粉丝说它能与Oracle相媲美,⽽且没有那么昂贵的价格和傲慢的客服。最初是1985年在加利福尼亚⼤学伯克利分校开发的,作为Ingres数据库的后继。PostgreSQL是完全由社区驱动的开源项⽬。它提供了单个完整功能的版本,⽽不像MySQL那样提供了多个不同的社区版、商业版与企业版。PostgreSQL基于⾃由的BSD/MIT许可,组织可以使⽤、复制、修改和重新分发代码,只需要提供⼀个版权声明即可。
MySQL与PostgreSQL的对⽐
MySQL的背后是⼀个成熟的商业公司,⽽PostgreSQL的背后是⼀个庞⼤的志愿开发组。这使得MySQL的开发过程更为慎重,⽽PostgreSQL的反应更为迅速。这样的两种背景直接导致了各⾃固有的优点和缺点。
PostgreSQL相对于MySQL的优势
1)不仅仅是关系型数据库
除了存储正常的数据类型外,还⽀持存储:
array,不管是⼀位数组还是多为数组均⽀持
json(hStore)和jsonb,相⽐使⽤text存储接送要⾼效很多
json和jsonb之间的区别
jsonb和json在更⾼的层⾯上看起来⼏乎是⼀样的,但在存储实现上是不同的。
json存储完的⽂本,json列会每次都解析存储的值,它不⽀持索引,但你可以为查询创建表达式索引。
jsonb存储的⼆进制格式,避免了重新解析数据结构。它⽀持索引,这意味着你可以不使⽤指定的索引就能查询任何路径。
当我们⽐较写⼊数据速度时,由于数据存储的⽅式的原因,jsonb会⽐json稍微的慢⼀点。json列会每次都解析存储的值,这意味着键的顺序要和输⼊的时候⼀样。但jsonb不同,以⼆进制格式存储且不保证键的顺序。因此,如果你有软件需要依赖键的顺序,jsonb可能不是你的应⽤的最佳选择。使⽤jsonb的优势还在于你可以轻易的整合关系型数据和⾮关系型数据, PostgreSQL对于mongodb这类的基于⽂档的数据库是个不⼩的威胁,毕竟如果⼀个表中只有⼀列数据的类型是半结构化的,没有必要为了迁就它⽽整个表的设计采⽤schemaless的结构。
2)⽀持地理信息处理扩展
PostGIS 为PostgreSQL提供了存储空间地理数据的⽀持,使PostgreSQL成为了⼀个空间数据库,能够进⾏空间数据管理、数量测量与⼏何拓扑分析。在功能上,和MYSQL对⽐,PostGIS具有下列优势:
O2O业务场景中的LBS业务使⽤PostgreSQL + PostGIS有⽆法⽐拟的优势。
3)可以快速构建REST API
PostgREST 可以⽅便的为任何 PostgreSQL 数据库提供完全的 RESTful API 服务。
4)⽀持树状结构
⽀持R-trees这样可扩展的索引类型,可以更⽅便地处理⼀些特殊数据。MySQL 处理树状的设计会很复杂, ⽽且需要写很多代码, ⽽PostgreSQL 可以⾼效处理树结构。
5)有极其强悍的 SQL 编程能⼒
⽀持递归,有⾮常丰富的统计函数和统计语法⽀持。
MySQL:⽀持 CREATE PROCEDURE 和 CREATE FUNCTION 语句。存储过程可以⽤ SQL 和 C++ 编写。⽤户定义函数可以⽤SQL、C 和 C++ 编写。
PostgreSQL:没有单独的存储过程,都是通过函数实现的。⽤户定义函数可以⽤ PL/pgSQL(专⽤的过程语⾔)、PL/Tcl、PL/Perl、PL/Python 、SQL 和 C 编写。
6)外部数据源⽀持
可以把 70 种外部数据源 (包括 Mysql, Oracle, CSV, hadoop …) 当成⾃⼰数据库中的表来查询。Postgres有⼀个针对这⼀难题的解决⽅案:⼀个名为“外部数据封装器(Foreign Data Wrapper,FDW)”的特性。该特性最初由PostgreSQL社区领袖Dave Page四年前根据SQL标准SQL/MED(SQL Management
of External Data)开发。FDW提供了⼀个SQL接⼝,⽤于访问远程数据存储中的远程⼤数据对象,使DBA可以整合来⾃不相关数据源的数据,将它们存⼊Postgres数据库中的⼀个公共模型。这样,DBA就可以访问和操作其它系统管理的数据,就像在本地Postgres表中⼀样。例如,使⽤FDW for MongoDB,数据库管理员可以查询来⾃⽂档数据库的数据,并使⽤SQL将它与来⾃本地Postgres表的数据相关联。借助这种⽅法,⽤户可以将数据作为⾏、列或JSON⽂档进⾏查看、排序和分组。他们甚⾄可以直接从Postgres 向源⽂档数据库写⼊(插⼊、更细或删除)数据,就像⼀个⼀体的⽆缝部署。也可以对Hadoop集或MySQL部署做同样的事。FDW使Postgres可以充当企业的中央联合数据库或“Hub”。
7)没有字符串长度限制
⼀般关系型数据库的字符串有限定长度8k左右,⽆限长 TEXT 类型的功能受限,只能作为外部⼤数据访问。⽽PostgreSQL的 TEXT 类型可以直接访问,SQL语法内置正则表达式,可以索引,还可以全⽂检索,或使⽤xml xpath。MySQL 的各种text字段有不同的限制,要⼿动区分 small text, middle text, large text… PostgreSQL 没有这个限制,text 能⽀持各种⼤⼩。
8)⽀持图结构数据存储
9)⽀持窗⼝函数
窗⼝函数提供跨⾏相关的当前查询⾏集执⾏计算的能⼒。仅当调⽤跟着OVER⼦句的聚集函数,作为窗⼝函数;否则它们作为常规的聚合函数。窗⼝也是⼀种分组,但和 group by 的分组不同。窗⼝,可以提供分组之外,还可以执⾏对每个窗⼝进⾏计算。可以相像成是group by 后,然后对每个分组进⾏计算,⽽不像Group by ,只是单纯地分组。MySQL 不⽀持 OVER ⼦句, ⽽PostgreSQL⽀持。OVER ⼦句能简单的解决 “每组取 top 5” 的这类问题。MySQL⽀持的SQL语法(ANSI SQL标准)的很⼩⼀部分。不⽀持递归查询、通⽤表表达式(Oracle的with 语句)或者窗⼝函数(分析函数)。
10)对索引的⽀持更强
PostgreSQL 的可以使⽤函数和条件索引,这使得PostgreSQL数据库的调优⾮常灵活,mysql就没有这个功能,条件索引在web应⽤中很重要。对于索引类型:
MySQL:取决于存储引擎。MyISAM:BTREE,InnoDB:BTREE。
PostgreSQL:⽀持 B-树、哈希、R-树和 Gist 索引。
查看mysql索引InnoDB的表和索引都是按相同的⽅式存储。也就是说表都是索引组织表。这⼀般要求主键不能太长⽽且插⼊时的主键最好是按顺序递增,否则对性能有很⼤影响。PostgreSQL不存在这个问题。
索引类型⽅⾯,MySQL取决于存储引擎。MyISAM:BTREE,InnoDB:BTREE。PostgreSQL⽀持 B-
树、哈希、R-树和 Gist 索引。
11)集⽀持更好
Mysql Cluster可能与你的想象有较⼤差异。开源的cluster软件较少。复制(Replication)功能是异步的并且有很⼤的局限性。例如,它是单线程的(single-threaded),因此⼀个处理能⼒更强的Slave的恢复速度也很难跟上处理能⼒相对较慢的Master。
PostgreSQL有丰富的开源cluster软件⽀持。plproxy 可以⽀持语句级的镜像或分⽚,slony 可以进⾏字段级的同步设置,standby 可以构建
WAL⽂件级或流式的读写分离集,同步频率和集策略调整⽅便,操作⾮常简单。
另外,PostgreSQL的主备复制属于物理复制,相对于MySQL基于binlog的逻辑复制,数据的⼀致性更加可靠,复制性能更⾼,对主机性能的影响也更⼩。对于WEB应⽤来说,复制的特性很重要,mysql到现在也是异步复制,pgsql可以做到同步,异步,半同步复制。还有mysql 的同步是基于binlog复制,类似oracle golden gate,是基于stream的复制,做到同步很困难,这种⽅式更加适合异地复制,pgsql的复制基于wal,可以做到同步复制。同时,pgsql还提供stream复制。
12)事务隔离做的更好
MySQL 的事务隔离级别 repeatable read 并不能阻⽌常见的并发更新, 得加锁才可以, 但悲观锁会影响性能, ⼿动实现乐观锁⼜复杂. ⽽PostgreSQL 的列⾥有隐藏的乐观锁 version 字段, 默认的 repeatable read 级别就能保证并发更新的正确性, 并且⼜有乐观锁的性能。
13)对于字符⽀持更好⼀些
MySQL ⾥需要 utf8mb4 才能显⽰ emoji 的坑, PostgreSQL 没这个坑。
14)对表连接⽀持较完整
对表连接⽀持较完整,MySQL只有⼀种表连接类型:嵌套循环连接(nested-loop),不⽀持排序-合并连接(sort-merge join)与散列连接(hash join)。PostgreSQL都⽀持。
15)存储⽅式⽀持更⼤的数据量
PostgreSQL主表采⽤堆表存放,MySQL采⽤索引组织表,能够⽀持⽐MySQL更⼤的数据量。
16)时间精度更⾼
MySQL对于时间、⽇期、间隔等时间类型没有秒以下级别的存储类型,⽽PostgreSQL可以精确到秒以下。
17)优化器的功能较完整
MySQL对复杂查询的处理较弱,查询优化器不够成熟,explain看执⾏计划的结果简单。性能优化⼯具与度量信息不⾜。
PostgreSQL很强⼤的查询优化器,⽀持很复杂的查询处理。explain返回丰富的信息。提供了⼀些性能视图,可以⽅便的看到发⽣在⼀个表和索引上的select、delete、update、insert统计信息,也可以看到cache命中率。⽹上有⼀个开源的pgstatspack⼯具。
18)序列⽀持更好
MySQL 不⽀持多个表从同⼀个序列中取 id, ⽽ PostgreSQL 可以。
19)对⼦查询⽀持更好
对⼦查询的⽀持。虽然在很多情况下在SQL语句中使⽤⼦查询效率低下,⽽且绝⼤多数情况下可以使⽤带条件的多表连接来替代⼦查询,但是⼦查询的存在在很多时候仍然不可避免。⽽且使⽤⼦查询的SQL语句与使⽤带条件的多表连接相⽐具有更⾼的程序可读性。⼏乎任何数据库的⼦查询 (subquery) 性能都⽐ MySQL 好。
20)增加列更加简单
MySQL表增加列,基本上是重建表和索引,会花很长时间。PostgreSQL表增加列,只是在数据字典中增加表定义,不会重建表.
MySQL相对于PostgreSQL的优势
1)MySQL⽐PostgreSQL更流⾏
流⾏对于⼀个商业软件来说,也是⼀个很重要的指标,流⾏意味着更多的⽤户,意味着经受了更多的考验,意味着更好的商业⽀持、意味着更多、更完善的⽂档资料。易⽤,很容易安装。第三⽅⼯具,包括可视化⼯具,让⽤户能够很容易⼊门。
2)回滚实现更优
innodb的基于回滚段实现的MVCC机制,相对PG新⽼数据⼀起存放的基于XID的MVCC机制,是占优的。新⽼数据⼀起存放,需要定时触发VACUUM,会带来多余的IO和数据库对象加锁开销,引起数据库整体的并发能⼒下降。⽽且VACUUM清理不及时,还可能会引发数据膨胀。
3)在Windows上运⾏更可靠
与PostgreSQL相⽐,MySQL更适宜在Windows环境下运⾏。MySQL作为⼀个本地的Windows应⽤程序
运⾏(在 NT/Win2000/WinXP下,是⼀个服务),⽽PostgreSQL是运⾏在Cygwin模拟环境下。PostgreSQL在Windows下运⾏没有MySQL稳定,应该是可以想象的。
4)线程模式相⽐进程模式的优势
MySQL使⽤了线程,⽽PostgreSQL使⽤的是进程。在不同线程之间的环境转换和访问公⽤的存储区域显然要⽐在不同的进程之间要快得多。
进程模式对多CPU利⽤率⽐较⾼。进程模式共享数据需要⽤到共享内存,⽽线程模式数据本⾝就是在进程空间内都是共享的,不同线程访问只需要控制好线程之间的同步。
线程模式对资源消耗⽐较少。所以MySQL能⽀持远⽐PostgreSQL多的更多的连接。但PostgreSQL中有优秀的连接池软件软件,如pgbouncer和pgpool,所以通过连接池也可以⽀持很多的连接。
5)权限设置上更加完善
MySQL在权限系统上⽐PostgreSQL某些⽅⾯更为完善。PostgreSQL只⽀持对于每⼀个⽤户在⼀个数据库上或⼀个数据表上的 INSERT、SELECT和UPDATE/DELETE的授权,⽽MySQL允许你定义⼀整套的不同的数据级、表级和列级的权限。对于列级的权限, PostgreSQL 可以通过建⽴视图,并确定视图的权限来弥补。MySQL还允许你指定基于主机的权限,这对于⽬前的PostgreSQL是⽆法实现的,但是在
很多时候,这是有⽤的。
6)存储引擎插件化机制
MySQL的存储引擎插件化机制,使得它的应⽤场景更加⼴泛,⽐如除了innodb适合事务处理场景外,myisam适合静态数据的查询场景。7)适应24/7运⾏
MySQL可以适应24/7运⾏。在绝⼤多数情况下,你不需要为MySQL运⾏任何清除程序。PostgreSQL⽬前仍不完全适应24/7运⾏,这是因为你必须每隔⼀段时间运⾏⼀次VACUUM。
8)更加试⽤于简单的场景
PostgreSQL只⽀持堆表,不⽀持索引组织表,Innodb只⽀持索引组织表。
索引组织表的优势:表内的数据就是按索引的⽅式组织,数据是有序的,如果数据都是按主键来访问,那么访问数据⽐较快。⽽堆表,按主键访问数据时,是需要先按主键索引到数据的物理位置。
索引组织表的劣势:索引组织表中上再加其它的索引时,其它的索引记录的数据位置不再是物理位置,⽽是主键值,所以对于索引组织表来说,主键的值不能太⼤,否则占⽤的空间⽐较⼤。
对于索引组织表来说,如果每次在中间插⼊数据,可能会导致索引分裂,索引分裂会⼤⼤降低插⼊的性能。所以对于使⽤innodb来说,我们⼀般最好让主键是⼀个⽆意义的序列,这样插⼊每次都发⽣在最后,以避免这个问题。
由于索引组织表是按⼀个索引树,⼀般它访问数据块必须按数据块之间的关系进⾏访问,⽽不是按物理块的访问数据的,所以当做全表扫描时要⽐堆表慢很多,这可能在OLTP中不明显,但在数据仓库的应⽤中可能是⼀个问题。
总结
MySQL从⼀开始就没有打算做所有事情,因⽽它在功能⽅⾯有⼀定的局限性,并不能满⾜⼀些先进应⽤程序的要求。MySQL对某些功能(例如引⽤、事务、审计等)的实现⽅式使得它与其他的关系型数据库相⽐缺少了⼀些可靠性。对于简单繁重的读取操作,使⽤PostgreSQL可能有点⼩题⼤做,同时性能也⽐MySQL这样的同类产品要差。除⾮你需要绝对的数据完整性,ACID遵从性或者设计复杂,否则PostgreSQL对于简单的场景⽽⾔有点多余。
如何你确定只在MySQL和PostgreSQL中进⾏选择,以下规则总是有效的:
如果你的操作系统是Windows,你应该使⽤MySQL。
当绝对需要可靠性和数据完整性的时候,PostgreSQL是更好的选择。
如果需要数据库执⾏定制程序,那么可扩展的PostgreSQL是更好的选择。
你的应⽤处理的是地理数据,由于R-TREES的存在,你应该使⽤PostgreSQL。
如果你对数据库并不了⼗分了解,甚⾄不知道事务、存储过程等究竟是什么,你应该使⽤MySQL。blog.csdn/hj7jay/article/details/65434955
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论