DISTINCT选取多个字段,只DISTINCT⼀个字段的解决办法此⽂是根据原作者所著加上⾃⼰的理解总结出来的,如果有什么问题欢迎各位提出⼀起交流探讨。先贴出原⽂如下:
某前台,简化后如下
products_name,products_viewed FROM `products_description`
ORDER BY products_viewed DESC,products_name 0,20;
该语句经常⼤批量出现在慢⽇志中!
初步看改语句,⾮常简单,根据products_viewed(产品被查看次数)倒序排序,再根据products_name(产品名字)排序!在
products_viewed和products_name上分别建⽴有索引!
但是感觉products_name排序怪怪的!
explain后发现
+----+-------------+----------------------+------+---------------+------+---------+------+-------+----------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+----------------------+------+---------------+------+---------+------+-------+----------------+
| 1 | SIMPLE | products_description | ALL | NULL | NULL | NULL | NULL | 764370 | Using filesort |
+----+-------------+----------------------+------+---------------+------+---------+------+-------+----------------+
改语句做竟然全表扫描!
mysql的order by语句,如果在where条件中没有合适的索引选择时,将会选择order by col中的索引作为条件,但是如果是多个order by组合,将会导致放弃使⽤索引!
和开发以及需求沟通,发现通过名字排序是可以不需要的!
我们去掉order by后⾯的 products_name!
再次explain后发现已经能够使⽤索引:
explain SELECT products_name,products_viewed FROM `products_description`
ORDER BY products_viewed LIMIT 0,20;
+----+-------------+----------------------+-------+---------------+-----------------+---------+------+------+-------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+----------------------+-------+---------------+-----------------+---------+------+------+-------+
| 1 | SIMPLE | products_description | index | NULL | products_viewed | 5 | NULL | 20 | |
+----+-------------+----------------------+-------+---------------+-----------------+---------+------+------+-------+
再次对⽐两次profiling(过程省略),发现第⼀次损坏⼤量io和cpu时间Sorting result上!因为该语句为前台语句,有⼤量查询,优化后,页⾯打开速度明显提升!
注意:
1. order by m,n 不要轻易写这种语句,⼀般的order by前⾯的m才是order by的重点,后⾯的n为配⾓,如果没有必要,尽量去掉
2. 参考我的另⼀篇
以上是原作者的所写,原⽂链接在此:
之后我发现order by 后⾯的如果是前⾯select语句没有查询的话,会出现某些⽆法预料的结果。现将我两次查询的结果贴在下⾯,暂时还不知道出现这种情况的原因。
第⼀次查询,select了order by 后⾯的字段,结果截图如下:
第⼆次查询,order by 后⾯的字段并没有跟在select
后⾯,结果截图如下:两次查询的结果完全不同,使⽤DISTINCT 语句并没有出现预期出现的结果:即取出唯⼀的第⼀列数据A 以及跟此列相关联的列数据B 。⽽不是将A 、B 两列数据都是DISTINCT 。查阅相关论坛终于发现可以⽤select A ,B ,count(*) from tablename group by A having B>=1 来实现需求。但是问题⼜来了,这样查询的速度⽐较慢,因为涉及分类计数等,我⽤下⾯的SQL 语句查询两张20w 级别的表,执⾏⼀次所需的时间为6s 左右。所查询的相关列都已建⽴索引。
后来想到数据库应该只执⾏查,存取数据的功能,其余交给后台来执⾏,于是建⽴了⼀张新表,伪外键的形式解决了问题。SQL 如下:为进⼀步增加查询速度,可建⽴索引:
CREATE TABLE relation AS (select `litigationinfo`.`org-name` AS A, max(`litigationinfo`.`release-time`) AS B,count(DISTINCT `litigationinfo`.`org-name`) 1
ALTER TABLE `relation` ADD PRIMARY KEY ( `A` ) ;2ALTER TABLE `relation` ADD INDEX relation_index_2 ( `B` )
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论