达梦数据库的性能优化--688IT编程网

达梦数据库的性能优化

“棱镜门”、“微软XP系统停摆”的接踵而至给我国信息安全敲响了警钟，也加速了国内 “去IOE”运动的进程。达梦数据库作为连续5年国产数据库市场占有率第一的高性能、高可靠性、高安全性、高兼容性大型关系型数据库管理系统，已成功替代了Oracle，在电力、金融、电子政务、教育等行业领域得到了广泛的应用，逐渐成为国家信息化建设的重要基础平台。为了更好地支撑业务应用，有效管理和利用信息时代不断产生并急剧膨胀的数据，对达梦数据库的优化显得尤为重要。

一、数据库参数优化

1. 优化内存

公共内存池

公共内存池提供了一组内存申请/释放接口，为系统中需要动态分配内存的模块提供服务。

SQL>select * from v$dm_ini where para_name like '%MEM%POOL%';

行号 PARA_NAME PARA_VALUE

---------- --------------- ----------

1 MEMORY_POOL 40

2 MEMORY_BAK_POOL 4

3 N_MEM_POOLS 4

MEMORY_POOL决定了以M为单位的公共内存池的大小，上例中40M； N_MEM_POOLS决定把内存池划分为几个独立的单元，以减少并发访问的冲突，提升并发效率；MEMORY_BAK_POOL表示系统保留的备用内存量，当常规的内存申请都失败时，从这个备用内存里分配，然后在上层模块中进行必要的容错处理。

可以在v$sysstat中查看当前公用内存池的使用情况：

SQL>select * from v$sysstat where name like '%MEM%';

行号 ID CLASSID NAME STAT_VAL

-------- -------- ----------- --------------- --------------------

1 26 3 MEMORY USED BYTES 25831296

这里的STAT_VAL给出的是已经使用的字节数。正常情况下，应该小于配置的池大小，否则系统不得不从池外向操作系统申请/释放内存，造成效率低下，并可能把操作系统的内存搞得很零碎。

系统缓冲区BUFFER

为了加速数据访问，系统开辟了一个缓冲区，使用LRU算法存放经常访问的数据页，逐步淘汰不用的数据页。

使用下列参数，可配置基本的系统缓冲区的大小：

SQL>select * from v$dm_ini where para_name like '%BUFFER%';

行号 PARA_NAME PARA_VALUE

---------- ------------ ----------

1 HUGE_BUFFER 8

数据库优化sql语句2 BUFFER 4000

3 MAX_BUFFER 8000

4 BUFFER_POOLS 1

其中HUGE_BUFFER 是专门用于列存表的缓存区，BUFFER是用户行存表的系统缓冲区。

BUFFER表示初始的系统缓冲区大小，单位为M。通常情况下，如果物理数据量大于物理内存，则应该把BUFFER调到物理内存的三分之二比较合适。

当BUFFER_POOLS = 1时，系统支持缓冲区的自动扩展。MAX_BUFFER表示最多能扩到多大。在自动扩展后，如果系统的压力在一段时间内比较低，系统又会自动收缩缓冲区。

系统缓冲区是一个共享资源，受一个mutex保护，在一个时间点，只允许一个线程可以持有这个资源。在高并发情况下，这个限制将极大降低并发效率，因此，可以配置BUFFER_POOLS把一个大的系统缓冲区分割为多个小的部分，每一个小的部分作为临界资源，这样只要所访问的数据页不在同一个子池里，就不会发生冲突，从而提升并发性能。注意，如果配置了BUFFER_POOLS > 1, 则MAX_BUFFER参数就失效了，最大可用的缓冲区由BUFFER参数决定。

系统缓冲区RECYCLE

这是DM新引入的缓冲区，专门用于缓冲临时表空间。RECYCLE的淘汰算法与BUFFER完全一样，但是它有独立的HASH表， LRU和更新链。引入 RECYCLE的目的是防止某些复

杂查询的中间结果挤占大量的BUFFER空间,降低BUFFER的命中率，从而增加额外的 IO操作。

使用RECYCLE的场景主要有：

◆ 大表的散列连接，在内存达到HJ_BUF_SIZE时使用

◆ 排序，大数据量的排序操作，

◆ 蓄水池操作符，如:NTTS, SPL, HTAB等，这些操作符需要把数据收集在一起

◆ 临时表数据

◆ MAL系统中，堆积的邮件

◆ 并行查询中，堆积的消息

◆ 大字段的临时数据

RECYCLE的配置可以从V$DM_INI查到，单位M

SQL>select * from v$dm_ini where para_name = 'RECYCLE';

行号 PARA_NAME PARA_VALUE

---------- --------- ----------

1 RECYCLE 64

2. 利用缓存

DM的缓存机制，可以避免系统重复的SQL解析工作，比如对于非常耗时的SQL语句解析，极大提升系统性能。SQL缓存池的大小用CACHE_POOL_SIZE来设置，缺省为10M。

如果应用程序对SQL语句都是先准备，再绑定参数，然后反复执行，那么就不需要计划缓存了。在这样理想的模式下，每一种SQL语句都使用不同的语句句柄，并在应用程序启动之后不久就进行了准备，执行时使用相应的语句句柄，并给定不同的参数。但是这个理想模式要求有良好的应用设计，有限或很少的SQL语句形式，限制太多。因此DM数据库系统提供了计划缓存机制。

计划缓存由USE_PLN_POOL参数控制，当USE_PLN_POOL = 0，禁止计划缓存；当USE_PLN_POOL = 1,SQL语句需要完全匹配，才能使用计划。比如:

Selct * from t1 where id = 1;　

Select * from t1 where id = 2;

虽然这两个语句很相似，计划也基本上一样，但是因为常量不同，不能重用计划。因此使用精确匹配，会造成大量类似重复的计划。精确匹配一般应该使用在语句非常复杂，查询很耗时的分析型场景。这类场景语句中，常量取值的不同对计划的影响很大。

688IT编程网

达梦数据库的性能优化

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

688IT编程网

达梦数据库的性能优化

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林 重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

随机森林重要性