Mysql慢SQL分析及优化--688IT编程网

Mysql慢SQL分析及优化

为何对慢SQL进⾏治理

从数据库⾓度看：每个SQL执⾏都需要消耗⼀定I/O资源，SQL执⾏的快慢，决定资源被占⽤时间的长短。假设总资源是100，有⼀条慢SQL占⽤了30的资源共计1分钟。那么在这1分钟时间内，其他SQL 能够分配的资源总量就是70，如此循环，当资源分配完的时候，所有新的SQL执⾏将会排队等待。

从应⽤的⾓度看：SQL执⾏时间长意味着等待，在OLTP应⽤当中，⽤户的体验较差

治理的优先级上：master数据库->slave数据库

⽬前数据库基本上都是读写分离架构，读在从库（slave）上执⾏，写在主库（master）上执⾏。

由于从库的数据都是从主库上复制过去的，主库等待较多的，会加⼤与从库的复制时延。

执⾏次数多的SQL优先治理

如果有⼀类SQL⾼并发集中访问某⼀张表，应当优先治理。

Mysql执⾏原理

绿⾊部分为SQL实际执⾏部分，可以发现SQL执⾏2⼤步骤：解析，执⾏。

以com_query为例，dispatch_command会先调⽤alloc_query为query buffer分配内存，之后调⽤解析

解析：词法解析->语法解析->逻辑计划->查询优化->物理执⾏计划

sql语句优化方式检查是否存在可⽤查询缓存结果，如果没有或者缓存失效，则调⽤mysql_execute_command执⾏

执⾏：检查⽤户、表权限->表上加共享读锁->取数据到query cache->取消共享读锁

影响因素

如不考虑MySQL数据库的参数以及硬件I/O的影响，则影响SQL执⾏效率的因素主要是I/O和CPU的消耗量

总结：

数据量：数据量越⼤需要的I/O次数越多

取数据的⽅式：数据在缓存中还是在磁盘上；是否可以通过索引快速寻址

数据加⼯的⽅式：排序、⼦查询等，需要先把数据取到临时表中，再对数据进⾏加⼯；增加了I/O，且消耗⼤量CPU资源

解决思路

1. 将数据存放在更快的地⽅：如果数据量不⼤，变化频率不⾼，但访问频率很⾼，此时应该考虑将数据放在应⽤端的缓存当中或者Redis这样的缓存当中，以提⾼存取速度。如果数据不做过滤、关

联、排序等操作，仅按照key进⾏存取，且不考虑强⼀致性需求，也可考虑选⽤NoSQL数据库。

2. 适当合并I/O：分别执⾏select c1 from t1与select c2 from t1，与执⾏select c1,c2 from t1相⽐，后者开销更⼩。合并时也需要考虑执⾏时间的增加。

3. 利⽤分布式架构：在⾯对海量的数据时，通常的做法是将数据和I/O分散到多台主机上去执⾏。

案例 (mysql数据⾼CPU问题定位和优化)

开启慢查询

## 开关

slow_query_log=1

## ⽂件位置及名字

slow_query_log_file=/data/mysql/slow.log

## 设定慢查询时间

long_query_time=0.4

## 没⾛索引的语句也记录

log_queries_not_using_indexes

vim /etc/myf

slow_query_log=1

slow_query_log_file=/data/mysql/slow.log

long_query_time=0.1

log_queries_not_using_indexes

mysql> select @@long_query_time; # 默认⼗秒才记录慢⽇志

mysql> show variables like 'slow_query_log%';

mysql> show variables like 'long%';

mysql> show variables like '%using_indexes%';

查询⼀张没有索引的100w数据的表

五⼗个并发查询⼗t100w表,

mysqlslap --defaults-file=/etc/myf \

--concurrency=50 --iterations=1 --create-schema='oldboy' \

--query="select * from oldboy.t_100w where k2='FGCD'" engine=innodb \

--number-of-queries=10 -uroot -pZHOUjian.22 -verbose

mysqlslap: [Warning] Using a password on the command line interface can be insecure.

Benchmark

Running for engine rbose

Average number of seconds to run all queries: 26.447 seconds

Minimum number of seconds to run all queries: 26.447 seconds

Maximum number of seconds to run all queries: 26.447 seconds

Number of clients running queries: 50

Average number of queries per client: 0

查看系统资源消耗

mysql查看连接线程

1 . 通过 show processlist; 或 show full processlist; 命令查看当前执⾏的查询，如下图所⽰：

“Sending data”官⽹解释：

The thread is reading and processing rows for a SELECT statement, and sending data to the client.

Because operations occurring during this state tend to perform large amounts of disk access (reads), it is often the longest-running state over the lifetime of a given query.

状态的含义，原来这个状态的名称很具有误导性，所谓的“Sending data”并不是单纯的发送数据，⽽是包括“收集 + 发送数据”。

体现在:

1.没有使⽤索引

3.返回的⾏数太多，需要频繁io交互

Copying to tmp table，Copying to tmp table on disk：官⽹解释：

Copying to tmp table The server is copying to a temporary table in memory. Copying to tmp table on disk The server is copying to a temporary table on disk. The temporary result set has become too large

整体来说⽣成临时表内存空间，落磁盘临时表，临时表使⽤太

体现在多表join，buffer_size设置不合理，alter algrithem copy等⽅式

Sorting result：

For a SELECT statement, this is similar to Creating sort index, but for nontemporary tables.

结果集使⽤⼤的排序，基本上SQL语句上order by 字段上没有索引

上述的情况⼤量堆积，就会发现CPU飙升的情况，当然也有并发量太⾼的情况。

优化⽅向:

1.添加索引，组合索引，坚持2张表以内的join⽅式这样查询执⾏成本就会⼤幅减少。

2.隐私转换避免，系统时间函数的调⽤避免

3.相关缓存⼤⼩设置：join_buffer_size，sort_buffer_size，read_buffer_size ,read_rnd_buffer_size ，tmp_table_size。

在紧急情况下，⽆法改动下，通过参数控制并发度，执⾏时间 innodb_thread_concurrency ，max_execution_time都是有效的临时控制⼿段。

查看慢⽇志

mysql> show variables like 'slow_query_log%';

+---------------------+----------------------+

| Variable_name | Value |

+---------------------+----------------------+

| slow_query_log | ON |

| slow_query_log_file | /data/mysql/slow.log |

+---------------------+----------------------+

2 rows in set (0.00 sec)

分析慢⽇志

[root@master1 ~]# mysqldumpslow -s c -t 10 /data/mysql/slow.log

Reading mysql slow query log from /data/mysql/slow.log

Count: 50 Time=27.10s (1354s) Lock=0.42s (20s) Rows=270.0 (13500), root[root]@localhost

select * from oldboy.t_100w where k2='S'

Count: 3 Time=0.68s (2s) Lock=0.00s (0s) Rows=262.0 (786), root[root]@localhost

select * from t_100w where k2='S'

Died at /usr/bin/mysqldumpslow line 167, <> chunk 53.

加索引

alter table t_100w add index idx(k2);

[root@master1 ~]# mysqlslap --defaults-file=/etc/myf --concurrency=50 --iterations=1 --create-schema='oldboy' --query="select * from oldboy.t_100w where k2='FGCD'" engine=innodb --number-of-queries=10 -uroot -pZHOUjian.22 -mysqlslap: [Warning] Using a password on the command line interface can be insecure.

Benchmark

Running for engine rbose

Average number of seconds to run all queries: 0.075 seconds

Minimum number of seconds to run all queries: 0.075 seconds

Maximum number of seconds to run all queries: 0.075 seconds

Number of clients running queries: 50

Average number of queries per client: 0

五千个并发查询⼀百t100w表,

[root@master1 ~]# mysqlslap --defaults-file=/etc/myf --concurrency=5000 --iterations=1 --create-schema='oldboy' --query="select * from oldboy.t_100w where k2='FGCD'" engine=innodb --number-of-queries=100 -uroot -pZHOUjian.22 -mysqlslap: [Warning] Using a password on the command line interface can be insecure.

Benchmark

Running for engine rbose

Average number of seconds to run all queries: 6.285 seconds

Minimum number of seconds to run all queries: 6.285 seconds

Maximum number of seconds to run all queries: 6.285 seconds

Number of clients running queries: 5000

Average number of queries per client: 0

优化⽅向和注意点

cpu优化⽅向

对于MySQL硬件环境资源，建议CPU起步8核开始，SSD硬盘；

索引，合理设计表结构，优化SQL。

读写分离，将对数据⼀致性不敏感的查询转移到只读实例上，分担主库压⼒。

对于由应⽤负载⾼导致的 CPU 使⽤率⾼的状况，从应⽤架构、实例规格等⽅⾯来解决。

使⽤ Memcache 或者 Redis缓存技术，尽量从缓存中获取常⽤的查询结果，减轻数据库的压⼒。

mysql性能测试优化⽅向

系统参数：磁盘调度算，SHELL资源限制,numa架构，⽂件系统ext4，exfs

刷新mysql log相关刷新参数：临近页（innodb_flush_neighbors）

死锁检查机制（innodb_deadlock_detect），

双1刷新：sync_binlog，innodb_flush_log_at_trx_commit

并发参数: innodb_buffer_pool_instances, innodb_thread_concurrency 等

因为⼀些服务器的特性，导致cpu通道和内存协调存在⼀些问题，导致cpu性能上去得案例也存在

不⾛索引的情况(开发规范)

1.没有查询条件，或者查询条件没有建⽴索引

select * from tab; 全表扫描。

select * from tab where 1=1;

在业务数据库中，特别是数据量⽐较⼤的表。

是没有全表扫描这种需求。

1、对⽤户查看是⾮常痛苦的。

2、对服务器来讲毁灭性的。

（1）

select * from tab;

SQL改写成以下语句：

select * from tab order by price limit 10 ; 需要在price列上建⽴索引

（2）

select * from tab where name='zhangsan' name列没有索引

改：

1、换成有索引的列作为查询条件

2、将name列建⽴索引

2.查询结果集是原表中的⼤部分数据，应该是25％以上

查询的结果集，超过了总数⾏数25%，优化器觉得就没有必要⾛索引了。

假如：tab表 id，name id:1-100w ，id列有(辅助)索引

select * from tab where id>500000;

如果业务允许，可以使⽤limit控制。

怎么改写？

结合业务判断，有没有更好的⽅式。如果没有更好的改写⽅案

尽量不要在mysql存放这个数据了。放到redis⾥⾯。

3.索引本⾝失效，统计数据不真实

索引有⾃我维护的能⼒。

对于表内容变化⽐较频繁的情况下，有可能会出现索引失效。

⼀般是删除重建

现象:

有⼀条select语句平常查询时很快，突然有⼀天很慢，会是什么原因

select? --->索引失效,，统计数据不真实

DML ? --->锁冲突

4.查询条件使⽤函数在索引列上，或者对索引列进⾏运算，运算包括(+，-，*，/，! 等)

例⼦：

错误的例⼦：select * from test where id-1=9;

正确的例⼦：select * from test where id=10;

算术运算

函数运算

⼦查询

5.隐式转换导致索引失效.这⼀点应当引起重视.也是开发中经常会犯的错误.

这样会导致索引失效. 错误的例⼦：

mysql> alter table tab add index inx_tel(telnum);

Query OK, 0 rows affected (0.03 sec)

Records: 0 Duplicates: 0 Warnings: 0

mysql>

mysql> desc tab;

+--------+-------------+------+-----+---------+-------+

+--------+-------------+------+-----+---------+-------+

| id | int(11) | YES | | NULL | |

+--------+-------------+------+-----+---------+-------+

3 rows in set (0.01 sec)

mysql> select * from tab where telnum='1333333';

+------+------+---------+

| id | name | telnum |

+------+------+---------+

| 1 | a | 1333333 |

+------+------+---------+

1 row in set (0.00 sec)

mysql> select * from tab where telnum=1333333;

+------+------+---------+

| id | name | telnum |

+------+------+---------+

| 1 | a | 1333333 |

+------+------+---------+

1 row in set (0.00 sec)

mysql> explain select * from tab where telnum='1333333';

+----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+

+----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+

| 1 | SIMPLE | tab | ref | inx_tel | inx_tel | 63 | const | 1 | Using index condition |

+----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+

1 row in set (0.00 sec)

mysql> explain select * from tab where telnum=1333333;

+----+-------------+-------+------+---------------+------+---------+------+------+-------------+

+----+-------------+-------+------+---------------+------+---------+------+------+-------------+

+----+-------------+-------+------+---------------+------+---------+------+------+-------------+

1 row in set (0.00 sec)

mysql> explain select * from tab where telnum=1555555;

+----+-------------+-------+------+---------------+------+---------+------+------+-------------+

+----+-------------+-------+------+---------------+------+---------+------+------+-------------+

+----+-------------+-------+------+---------------+------+---------+------+------+-------------+

1 row in set (0.00 sec)

mysql> explain select * from tab where telnum='1555555';

+----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+

+----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+

| 1 | SIMPLE | tab | ref | inx_tel | inx_tel | 63 | const | 1 | Using index condition |

+----+-------------+-------+------+---------------+---------+---------+-------+------+-----------------------+

1 row in set (0.00 sec)

mysql>

6.<> ，not in 不⾛索引（辅助索引）

EXPLAIN SELECT * FROM teltab WHERE telnum <> '110';

EXPLAIN SELECT * FROM teltab WHERE telnum NOT IN ('110','119');

mysql> select * from tab where telnum <> '1555555';

+------+------+---------+

| id | name | telnum |

+------+------+---------+

| 1 | a | 1333333 |

+------+------+---------+

1 row in set (0.00 sec)

mysql> explain select * from tab where telnum <> '1555555';

单独的>,<,in 有可能⾛，也有可能不⾛，和结果集有关，尽量结合业务添加limit

or或in 尽量改成union

EXPLAIN SELECT * FROM teltab WHERE telnum IN ('110','119');

改写成：

EXPLAIN SELECT * FROM teltab WHERE telnum='110'

UNION ALL

SELECT * FROM teltab WHERE telnum='119'

7.like "%_" 百分号在最前⾯不⾛

EXPLAIN SELECT * FROM teltab WHERE telnum LIKE '31%' ⾛range索引扫描

EXPLAIN SELECT * FROM teltab WHERE telnum LIKE '%110' 不⾛索引

%linux%类的搜索需求，可以使⽤elasticsearch+mongodb 专门做搜索服务的数据库产品

建⽴外键的规则

1. ⽗⼦表中建⽴外键的字段数据类型需要⼀致

2. 关联⽗表时，⽗表的字段需要为⽗表

3. 如果⽗表为联合主键需要从第⼀个字段开始关联

4. 书写问题

5. 存储引擎只有innodb才⽀持外键，其他不⾏，否则外键建⽴不成功

建⽴有外键的⽗⼦表中不允许使⽤truncate table 只能使⽤delete进⾏删除数据；⽗⼦表写⼊数据时，如果想给⼦表中的外键写⼊数据，需要保证写⼊的数据在⽗表的主键列拥有该数据才能进⾏添加是否添加失败，⽤来保证数据的⼀致性；外键在进⾏建⽴的过程中需要重新写⼀⾏进⾏添加，不能跟在数据类型的后⾯进⾏建⽴。

⾃增

# ⾃增，如果为某列设置⾃增列，插⼊数据时⽆需设置此列的值，默认将⾃增（表中只能有⼀个⾃增列）

create table tb1(

id int auto_increment primary key,

age int not null

)

show variables like '%auto_increment_%';

auto_increment_increment | 1 # 每次按照指定的数量⾃增

auto_increment_offset | 1 # ⾃增量的初始量

set auto_increment_increment=2;

创建表定义⼀对多关系

create table student(

id1 int auto_increment primary key,

name varchar(12) not null,

age int not null,

phone char(11)

);

create table student2(

id int auto_increment primary key,

class_id int,

foreign key(class_id) REFERENCES student(id1)

);

添加主键

alter table 表名 add primary key(列名);

alter table students add id int not null auto_increment, add primary key (id);

删除主键

alter table 表名 drop primary key;

# 删除主键属性，保留原值和列

alter table 表名 modify 列名int, drop primary key;

数据库注意事项

1、重要的sql必须被索引，例如：

1）select、update、delete语句的where条件列；

2）order by、group by、distinct字段

2、mysql索引的限制：

1）mysql⽬前不⽀持函数索引

2）使⽤不等于（！=或者<>）的时候，mysql⽆法使⽤索引，单独的>,<,in 有可能⾛，也有可能不⾛，和结果集有关，尽量结合业务添加limitor或in 尽量改成union

3）过滤字段使⽤单⾏函数 (如 abs (column)) 后, MYSQL⽆法使⽤索引。

4） join语句中join条件字段类型不⼀致的时候MYSQL ⽆法使⽤索引

5）使⽤ LIKE 操作的时候如果条件以通配符开始 (如 ‘%abc…’)时, MYSQL⽆法使⽤索引。

6）使⽤⾮等值查询的时候, MYSQL ⽆法使⽤ Hash 索引。

7）BLOB 和 TEXT 类型的列只能创建前缀索引

3、mysql常见sql规范：

1）SQL语句尽可能简单⼤SQL语句尽可能拆成⼩SQL语句，MySQL对复杂SQL⽀持不好。

2）事务要简单，整个事务的时间长度不要太长，SQL结束后及时提交。

3）限制单个事务所操作的数据集⼤⼩，不能超过 10000 条记录

4）禁⽌使⽤触发器、函数、存储过程。

5）降低业务耦合度，为scale out、sharding留有余地

6）避免在数据库中进⾏数学运算（数据库不擅长数学运算和逻辑判断）

7）避免使⽤select *，需要查询哪⼏个字段就select这⼏个字段，避免buffer pool被⽆⽤数据填充。

8）条件中使⽤到OR的SQL语句必须改写成⽤IN()（OR的效率⽐IN低很多）

9）IN()⾥⾯的数据个数建议控制在 500 以内，可以⽤exist代替in，exist在某些场景⽐in效率⾼，尽量不使⽤not in。

10）limit分页注意效率。 limit越⼤，效率越低。可以改写limit，例如：select id from test limit 10000,10 可以改写为 select id from test where id > 10000 limit 10 11）当只要⼀⾏数据时使⽤LIMIT 1 。

12）获取⼤量数据时，建议分批次获取数据，每次获取数据少于 10000 条，结果集应⼩于 1M

13）避免使⽤⼤表做 JOIN，使⽤group by分组、⾃动排序

14）SQL语句禁⽌出现隐式转换，例如：select id from test where id=’1’，其中 id 列为 int 等数字类型。

15）在SQL中，尽量不使⽤like，且禁⽌使⽤前缀是%的like匹配。

16）合理选择union all与union

17）禁⽌在OLTP类型系统中使⽤没有where条件的查询。

18）使⽤ prepared statement 语句，只传参数，⽐传递 SQL 语句更⾼效；⼀次解析，多次使⽤；降低SQL注⼊概率。

19）禁⽌使⽤ order by rand().

20）禁⽌单条 SQL 语句同时更新多个表。

21）不在业务⾼峰期批量更新或查询数据库，避免在业务⾼峰期alter表。

22）禁⽌在主库上执⾏ sum,count 等复杂的统计分析语句，可以使⽤从库来执⾏。

688IT编程网

Mysql慢SQL分析及优化

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

688IT编程网

Mysql慢SQL分析及优化

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林算法的改进方法

基于随机森林算法的风险预警模型研究

Python中的随机森林算法详解

随机森林发展历史

如何使用随机森林进行时间序列数据模式识别(八)

随机森林回归模型原理

如何使用随机森林进行时间序列数据模式识别(六)

如何使用随机森林进行时间序列数据预测(四)

如何使用随机森林进行异常检测(六)

随机森林算法和grandientboosting算法 -回复

随机森林方法总结全面

随机森林算法原理和步骤

随机森林的原理

随机森林 重要性

随机森林算法

机器学习中随机森林的原理

随机森林算法原理

使用计算机视觉技术进行动物识别的技巧

基于crf命名实体识别实验总结

transformer预测模型训练方法

最新文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

随机森林结合直接正交信号校正的模型传递方法

标签列表

随机森林重要性