优化案例CASEWHEN进行SQL改写优化--688IT编程网

优化案例CASEWHEN进⾏SQL改写优化

导读

今天给⼤家分享⼀个通过SQL改写⽽独辟蹊径的SQL优化案例

待优化场景

发现SLOW QUERY LOG中有下⾯这样⼀条记录：

...# Query_time: 59.503827 Lock_time: 0.000198 Rows_sent: 641227 Rows_examined: 13442472 Rows_affected: 0...select uid,sum(power) powerup from t1 where date>='2017-03-31' and

UNIX_TIMESTAMP(STR_TO_DATE(concat(date,' ',hour),'%Y-%m-%d %H'))>=1490965200 and

UNIX_TIMESTAMP(STR_TO_DATE(concat(date,' ',hour),'%Y-%m-%d %H'))<1492174801 and aType in (1,6,9) group by uid;

实话说，看到这个SQL我也忍不住想骂⼈啊，究竟是哪个脑残的XX狗设计的？

竟然把⽇期时间中的 date 和 hour 给独⽴出来成两列，查询时再合并成⼀个新的条件，简直⽆⼒吐槽。

sql优化的几种方式

吐槽归吐槽，该⼲活还得⼲活，谁让咱是DBA呢，SQL优化是咱的拿⼿好戏不是嘛~

SQL优化之路 SQL优化思路

不厌其烦地再说⼀遍SQL优化思路。

想要优化⼀个SQL，⼀般来说就是先看执⾏计划，观察是否尽可能⽤到索引，

以及是否产⽣了临时表（Using temporary）或者

是否需要进⾏排序（Using filesort），

想办法消除这些情况。

SQL性能瓶颈定位

毫⽆疑问，想要优化，先看表DDL以及执⾏计划：

CREATE TABLE `t1` ( `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT, `date` date NOT NULL DEFAULT '0000-00-00', `hour` char(2) NOT NULL DEFAULT '00', `kid` int(4) NOT NULL DEFAULT '0', `uid` int(11) NOT NULL DEFAULT '0', `aType` tinyint(2) NOT NULL DEFAULT '0', `src` t

inyint(2) NOT NULL DEFAULT '1', `aid` int(11) NOT NULL DEFAULT '1', `acount` int(11) NOT NULL DEFAULT '1', `power` decimal(20,2) DEFAULT '0.00', PRIMARY KEY (`id`,`date`), UNIQUE KEY `did` (`date`,`hour`,`kid`,`uid`,`aType`,`src`,`aid`)) ENGINE=InnoDB

AUTO_INCREMENT=50486620 DEFAULT CHARSET=utf8mb4/*!50500 PARTITION BY RANGE COLUMNS(`date`) (PARTITION p2******* VALUES LESS THAN ('2017-03-17') ENGINE = InnoDB, PARTITION p2******* VALUES LESS THAN ('2017-03-18') ENGINE = jr@imysql[myDB]> EXPLAIN select uid,sum(power) powerup from t1 where date>='2017-03-31' and UNIX_TIMESTAMP(STR_TO_DATE(concat(date,' ',hour),'%Y-%m-%d

%H'))>=1490965200 and UNIX_TIMESTAMP(STR_TO_DATE(concat(date,' ',hour),'%Y-%m-%d %H'))<1492174801 and aType in (1,6,9) group by uidG*************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 partitions: p2*******,p2*******,....all partition type: ALLpossible_keys: did key: NULL key_len: NULL ref: NULL rows: 25005577 filtered: 15.00 Extra: Using where; Using temporary; Using filesort

明显的，这个SQL效率⾮常低，全表扫描、没有索引、有临时表、需要额外排序，什么倒霉催的全赶上了。

优化思考

这个SQL是想统计符合条件的power列总和，虽然 date 列已有索引，但WHERE⼦句中却对 date 列加了函数，⽽且还

这个SQL是想统计符合条件的power列总和，虽然 date 列已有索引，但WHERE⼦句中却对 date 列加了函数，⽽且还是 date 和 hour 两列的组合条件，那就⽆法⽤到这个索引了。

还好，有个聪明伶俐的妹⼦，突发起想（事实上这位妹⼦本来就擅长做SQL优化的~），可以⽤ CASE WHEN ⽅法来改造下SQL，改成像下⾯这样的：

select uid,sum(powerup+powerup1) from( select uid, case when concat(date,' ',hour) >='2017-03-24 13:00' then power else '0' end as powerup, case when concat(date,' ',hour) < '2017-03-25 13:00' then power else '0' end as powerup1 from t1 where date>='2017-03-24' and date <'2017-03-25' and aType in (1,6,9)) a group by uid;

是不是很有才，直接把这个没办法⽤到索引的条件给⽤CASE WHEN来改造了。看看新的SQL执⾏计划：

*************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 partitions:

p2******* type: rangepossible_keys: did key: idx2_date_addRedType key_len: 4 ref: NULL rows: 876375 filtered: 30.00 Extra: Using index condition; Using temporary; Using filesort

看看这个SQL的执⾏代价：

+----------------------------+---------+| Variable_name | Value |+----------------------------+---------+| Handler_read_first | 1 || Handler_read_key | 1834590 || Handler_read_last | 0 || Handler_read_next | 1834589 || Handler_read_prev | 0 || Handler_read_rnd | 232276 || Handler_read_rnd_next | 232277 |+----------------------------+---------+

及其SLOW QUERY LOG记录的信息：

# Query_time: 6.381254 Lock_time: 0.000166 Rows_sent: 232276 Rows_examined: 2299141 Rows_affected: 0# Bytes_sent: 4237347 Tmp_tables: 1 Tmp_disk_tables: 0 Tmp_table_sizes: 4187168# InnoDB_trx_id: 0# QC_Hit: No Full_scan: No Full_join: No Tmp_table: Yes Tmp_table_on_disk: No# Filesort: Yes Filesort_on_disk: No

Merge_passes: 0# InnoDB_IO_r_ops: 0 InnoDB_IO_r_bytes: 0 InnoDB_IO_r_wait: 0.000000# InnoDB_rec_lock_wait: 0.000000 InnoDB_queue_wait: 0.000000# InnoDB_pages_distinct: 9311

看起来还不是太理想啊，虽然不再扫描全表了，但毕竟还是有临时表和额外排序，想办法消除后再对⽐看下。

有个变化不知道⼤家注意到没，新的SLOW QUERY LOG记录多了不少信息，这是因为⽤了Percona分⽀版本的插件才⽀持，这个功能确实不错，甚⾄还能记录Profiling的详细信息，强烈推荐。

我们新建个 uid 列上的索引，看看能除临时表及排序后的代价如何，看看这个的开销会不会更低。

yejr@imysql[myDB]> ALTER TABLE t1 ADD INDEX idx_uid(uid);yejr@imysql[myDB]> EXPLAIN select uid,sum(powerup+powerup1) from( select uid, case when concat(date,' ',hour) >='2017-03-24 13:00' then power else '0' end as powerup, case when concat(date,' ',hour) < '2017-03-25 13:00' then power else '0' end as powerup1 from t1 where date>='2017-03-24' and date <'2017-03-25' and aType in (1,6,9)) a group by uidG*************************** 1. row *************************** id: 1 select_type: SIMPLE table: if_date_hour_army_count partitions: p2*******,p2*******... type: indexpossible_keys: did,idx_uid key: idx_uid key_len: 4 ref: NULL rows: 12701520 filtered: 15.00 Extra: Using where

看看添加索引后SQL的执⾏代价：

+----------------------------+---------+| Variable_name | Value |+----------------------------+---------+| Handler_read_first | 1 || Handler_read_key | 1 || Handler_read_last | 0 || Handler_read_next | 1834589 || Handler_read_prev | 0 ||

Handler_read_rnd | 0 || Handler_read_rnd_next | 0 |+----------------------------+---------+

及其SLOW QUERY LOG记录的信息：

# Query_time: 5.772286 Lock_time: 0.000330 Rows_sent: 232276 Rows_examined: 1834589 Rows_affected: 0# Bytes_sent: 4215071 Tmp_tables: 0 Tmp_disk_tables: 0 Tmp_table_sizes: 0# InnoDB_trx_id: 0# QC_Hit: No

Full_scan: Yes Full_join: No Tmp_table: No Tmp_table_on_disk: No# Filesort: No Filesort_on_disk: No

Merge_passes: 0# InnoDB_IO_r_ops: 0 InnoDB_IO_r_bytes: 0 InnoDB_IO_r_wait: 0.000000# InnoDB_rec_lock_wait: 0.000000 InnoDB_queue_wait: 0.000000# InnoDB_pages_distinct: 11470

0.000000 InnoDB_queue_wait: 0.000000# InnoDB_pages_distinct: 11470

我们注意到，虽然加了 uid 列索引后的SQL扫描的data page更多了，但执⾏效率其实是更⾼的，因为消除了临时表和额外排序，这从 Handlerread% 的结果中也能看出来，很显然它的顺序I/O更多，随机I/O更少，所以虽然需要扫描的data page 更多，实际上效率却是更快的。

后记

再想想这个SQL还有优化空间吗，显然是有的，那就是把数据表重新设计，将 date 和 hour 列整合到⼀起，这样就不⽤费劲的拼凑条件并且也能⽤到索引了。

最后安利下，知数堂培训马上推出 SQL开发优化课程，由业界资深SQL优化专家郑⽼师授课。

该课程关键字：MySQL、Oracle、SQL调优、EXPLAIN、DBMS_XPLAN、OPTIMIZER TRACE、SQL改写、NESTED LOOP、OUTER JOIN、HASH JOIN、ERD图、HINT、SORT MERGE、Materialized View、ROWNUM。

学完本课程，⽆论您是DBA⼯程师、运维⼯程师，还是开发⼯程师，抑或系统架构师、技术主管，都将⼤幅增强您的职场实⼒，加薪50%轻轻松松。此外，我们也会将优秀的学员直接推向各⼤⼀线互联⽹公司。

本周四晚上郑⽼师还会再进⾏⼀次公开课分享，讲讲GROUP BY的⽤法及堵门优化技巧。

有兴趣的同学可以扫码加⼊知数堂QQ 579036588关注课程进展。

不再加原创

喜欢就转发

打赏可勾搭

688IT编程网

优化案例CASEWHEN进行SQL改写优化

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符回溯引用和前后查匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式选择题

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

688IT编程网

优化案例CASEWHEN进行SQL改写优化

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

利用正则表达式实现文本数据提取与处理

正则表达式零宽断言详解

文本匹配规则

excel中使用正则

1-31正则表达式

anki之高级筛选

BUAA_OO_2021_第一单元总结

insert语句递增写法

sublime text 3在行前插入递增数字序号的方法

字符串只允许数字和英文的正则

powerbuilder 正则表达式

Shell脚本编写的高级技巧利用正则表达式进行字符串匹配

JAVA正则表达式的三种模式:贪婪,勉强和占有的讨论

go regexp匹配规则

oracle regexp_substr 实现原理

基本的元字符 回溯引用和前后查 匹配模式

elasticsearch query dsl正则

oracle sql正则表达式

GA-设置目标

仅匹配全角片假名的正则表达式

最新文章

java正则表达式 选择题

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

vue数字相加小数点变长-概述说明以及解释

vue validate 正则验证小数长度

标签列表

java正则表达式选择题

非零金额正则表达式

基本的元字符回溯引用和前后查匹配模式

java正则表达式选择题

非零金额正则表达式