浅析数据库系统中SQL语句的优化技术
    摘要:sql语句的优化是将性能低下的sql语句转换成目的相同的性能优异的sql语句。人工智能自动sql优化就是使用人工智能技术,自动对sql语句进行重写,从而到性能最好的等效sql语句。
  关键词:人工智能;自动优化;sql语句优化
  一个数据库系统的生命周期可以分成:设计、开发和成品三个阶段。在设计阶段进行数据库性能优化的成本最低,收益最大。在成品阶段进行数据库性能优化的成本最高,收益最小。数据库的优化通常可以通过对网络、硬件、操作系统、数据库参数和应用程序的优化来进行。最常见的优化手段就是对硬件的升级。根据统计,对网络、硬件、操作系统、数据库参数进行优化所获得的性能提升,全部加起来只占数据库系统性能提升的40%左右,其余的60%系统性能提升来自对应用程序的优化。许多优化专家认为,对应用程序的优化可以得到80%的系统性能的提升。应用程序的优化通常可分为两个方面:源代码和sql语句。由于涉及到对程序逻辑的改变,源代码的优化在时间成本和风险上代价很高,而对数据库系统性能的提升收效有限。
  1.1为什么要优化sql语句
  第一、sql语句是对数据库进行操作的惟一途径,对数据库系统的性能起着决定性的作用。
  第二、sql语句消耗了70%至90%的数据库资源。
  第三、sql语句独立于程序设计逻辑,对sql语句进行优化不会影响程序逻辑。
  第四、sql语句有不同的写法,在性能上的差异非常大。
  第五、sql语句易学,但难精通。
  优化sql语句的传统方法是通过手工重写来对sql语句进行优化。dba或资深程序员通过对sql语句执行计划的分析,依靠经验,尝试重写sql语句,然后对结果和性能进行比较,以试图到性能较佳的sql语句。这种传统上的作法无法出sql语句的所有可能写法,且依赖于人的经验,非常耗费时间。
  1.2 sql优化技术的发展历程
  第一代sql优化工具是执行计划分析工具。这类工具针对输入的sql语句,从数据库提取执行计划,并解释执行计划中关键字的含义。
  第二代sql优化工具只能提供增加索引的建议,它通过对输入的sql语句的执行计划的分析,来产生是否要增加索引的建议。
  第三代sql优化工具不仅分析输入sql语句的执行计划,还对输入的sql语句本身进行语法分析,经过分析产生写法上的改进建议。
  1.3人工智能自动sql优化
  人工智能自动sql优化出现在90年代末。目前在商用数据库领域,lecco technoloy limited(灵高科研有限公司)拥有该技术,并提供使用该技术的自动优化产品lecco sql expert,它支持oracle、sybase、ms sql server和ibm db2数据库平台。该产品针对数据库应用的开发和维护阶段提供的模块有:sql语法优化器、pl/sql集成化开发调试环境(ide)、扫描器、数据库监视器等。其核心模块sql 语法优化器的工作原理为:①输入一条源sql语句;②“人工智能反馈式搜索引擎”对输入的sql语句,结合检测到的数据库结构和索引进行
重写,产生n条等效的sql语句输出;③产生的n条等效sql语句再送入“人工智能反馈式搜索引擎”进行重写,直至无法产生新的输出或搜索限额满;④对输出的sql语句进行过滤,选出具有不同执行计划的sql语句;⑤对得到的sql语句进行批量测试,出性能最好的sql语句。
  2 lecco sql expert自动优化实例sql语句优化方式
  2.1假设我们从源代码中抽取出这条sql语句(也可以通过内带的扫描器或监视器获得sql语句):
  select count(*)
  from employee
  swheresexists (select 'x'
  from department
  swheresemp_dept=dpt_id
  and dpt_name like 'ac%')
  and emp_id in (select sal_emp_id
  from emp_sal_hist b
  swheressal_salary > 70000)
  按下“优化”按钮后,经过10几秒,sql expert就完成了优化的过程,并在这10几秒的时间里重写产生了2267 条等价的sql语句,其中136条sql语句有不同的执行计划。
  接下来,我们可以对自动重写产生的136条sql语句进行批运行测试,以选出性能最佳的等效sql语句。按下“批运行” 按钮,在“终止条件” 页选择“最佳运行时间sql语句”,按“确定”。
  经过几分钟的测试运行后,我们可以发现sql124的运行时间和反应时间最短。运行速度约有22.75倍的提升(源sql语句运行时间为2.73秒,sql124运行时间为0.12秒)。现在我们就可以把sql124放入源代码中,结束一条sql语句的优化工作了。
  2.2“边做边学式训练”提升sql开发水平
  lecco sql expert不仅能够到最佳的sql语句,它所提供的“边做边学式训练”还能够教开发人员和数据库管理员如何写出性能最好的sql语句。lecco sql expert的“sql比较器”可以标明源sql和待选sql间的不同之处。
  以上面优化的结果为例,为了查看源sql语句和sql124在写法上有什么不同,我们可以按下“比较器” 按钮,对sql124和源sql语句进行比较。“sql 比较器”将sql124相对于源sql语句的不同之处以蓝颜表示了出来。如果选择“双向比较”复选框,“sql 比较器”可以将两条sql语句的不同之处以蓝表示。当然,我们也可以从源语句和重写后的sql 语句中任选两条进行比较。
  从比较的结果可以看到,重写后的sql124把第一个exists改写成了in;在字段dpt_id上进行了合并空字符串的操作,以诱导数据库先执行子查询中的

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。