sqlleftjoin之后数据量增加了_⽆语,这8种常见的SQL错误⽤
法,你竟然还在⽤?...
1、LIMIT 语句
分页查询是最常⽤的场景之⼀,但也通常也是最容易出问题的地⽅。⽐如对于下⾯简单的语句,⼀般 DBA 想到的办法是在 type, name, create_time 字段上加组合索引。这样条件排序都能有效的利⽤到索引,性能迅速提升。
好吧,可能90%以上的 DBA 解决该问题就到此为⽌。但当 LIMIT ⼦句变成 “LIMIT 1000000,10” 时,程
序员仍然会抱怨:我只取10条记录为什么还是慢?
要知道数据库也并不知道第1000000条记录从什么地⽅开始,即使有索引也需要从头计算⼀次。出现这种性能问题,多数情形下是程序员偷懒了。
在前端数据浏览翻页,或者⼤数据分批导出等场景下,是可以将上⼀页的最⼤值当成参数作为查询条件的。SQL 重新设计如下:
在新设计下查询时间基本固定,不会随着数据量的增长⽽发⽣变化。
2、隐式转换
SQL语句中查询变量和字段定义类型不匹配是另⼀个常见的错误。⽐如下⾯的语句:
其中字段 bpn 的定义为 varchar(20),MySQL 的策略是将字符串转换为数字之后再⽐较。函数作⽤于表字段,索引失效。
上述情况可能是应⽤程序框架⾃动填⼊的参数,⽽不是程序员的原意。现在应⽤框架很多很繁杂,使⽤⽅便的同时也⼩⼼它可能给⾃⼰挖坑。
3、关联更新、删除
虽然 MySQL5.6 引⼊了物化特性,但需要特别注意它⽬前仅仅针对查询语句的优化。对于更新或删除需要⼿⼯重写成 JOIN。
⽐如下⾯ UPDATE 语句,MySQL 实际执⾏的是循环/嵌套⼦查询(DEPENDENT SUBQUERY),其执
⾏时间可想⽽知。
执⾏计划:
重写为 JOIN 之后,⼦查询的选择模式从 DEPENDENT SUBQUERY 变成 DERIVED,执⾏速度⼤⼤加快,从7秒降低到2毫秒
执⾏计划简化为:
4、混合排序
MySQL 不能利⽤索引进⾏混合排序。但在某些场景,还是有机会使⽤特殊⽅法提升性能的。
执⾏计划显⽰为全表扫描:
由于 is_reply 只有0和1两种状态,我们按照下⾯的⽅法重写后,执⾏时间从1.58秒降低到2毫秒。
5、EXISTS语句
MySQL 对待 EXISTS ⼦句时,仍然采⽤嵌套⼦查询的执⾏⽅式。如下⾯的 SQL 语句:
执⾏计划为:
去掉 exists 更改为 join,能够避免嵌套⼦查询,将执⾏时间从1.93秒降低为1毫秒。
新的执⾏计划:
6、条件下推
外部查询条件不能够下推到复杂的视图或⼦查询的情况有:
聚合⼦查询;
含有 LIMIT 的⼦查询;
UNION 或 UNION ALL ⼦查询;
输出字段中的⼦查询;
如下⾯的语句,从执⾏计划可以看出其条件作⽤于聚合⼦查询之后
确定从语义上查询条件可以直接下推后,重写如下:
执⾏计划变为:
7、提前缩⼩范围
exists的用法
先上初始 SQL 语句:
数为90万,时间消耗为12秒。
由于最后 WHERE 条件以及排序均针对最左主表,因此可以先对 my_order 排序提前缩⼩数据量再做左连接。SQL 重写后如下,执⾏时间缩⼩为1毫秒左右。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。