mysql硬解析_MySQL笔记--688IT编程网

mysql硬解析_MySQL笔记

MySQL使⽤原则：

⾃⼰扛住的⾃⼰扛，扛不住的使⽤中间件，⽐如：Redis；

最佳的单表存储量是千万级别，超过这个级别采取分表分布的⽅式来存储表。

MySQL体系架构

MySQL语句在数据库的执⾏过程：

经过parser进⾏词法解析和语法解析；

解析之后经过优化器⽣成执⾏计划，MySQL不缓存执⾏计划(也叫做硬解析)；

执⾏计划进⼊执⾏器执⾏，到存储引擎中数据；

返回数据。

MySQL包括核⼼层(mysqld)和存储引擎层，前者在内存和CPU中执⾏，后者在硬盘中，指的是不同的存储⽅法，最主要的两种是InnoDB 和MyISAM

MySQL⼀次读取数据为16K，每个16K叫做page(页)，

InnoDB

包括主键索引和辅助索引(⼜叫K值索引，⼆级索引)，主键索引的叶⼦节点存放的就是记录，辅助键索引叶⼦结点存放的是索引字段和主键，通过索引字段查对应的记录，根据该记录中的主键去主键索引对应的记录。

建表时，如果没有声明主键，InnoDB会通过第⼀个⾮空且唯⼀的字段建⽴主索引，没有的话，会建⽴隐藏列(6字节)。

索引是⼀颗B+树，所有的叶⼦节点是⼀个双向链表，在插⼊数据维护索引时，可能会出现页分裂的情况。

根据辅助索引查询数据时，如果需要查询除主键索引外的数据，那么需要回表(辅助索引到主键索引的过程)，但是如果只查主键，就不需要回表。

联合索引

多个字段联合建⽴索引。

最左前缀原则

当你定义了联合索引时，在执⾏查时，只有where字句出现的字段与联合索引出现的顺序⼀致，才能使⽤上索引。

⽀持事务。

表在存储引擎中被存放到两个⽂件，.idb⽂件存放的实际数据，.frm⽂件存放的是表的定义，由于系统中⽂件⼤⼩有限制，因此表存储的数据量有限制。

innodb buffer pool - 数据和索引都能缓存，MyISAM只能缓存索引。

MySQL查询数据时取表中16K的数据放到Innodb buffer pool做查询，满⾜查询条件的数据留下，继续扫描直到扫描了全表，同时，也存储了索引。

相关参数：

innodb_buffer_pool_size - innodb buffer pool在内存⾥的⼤⼩；

innodb_buffer_pool_instance - innodb buffer pool被分为⼏块，⼀般设置成16或者32。

innodb buffer pool使⽤LRU(Least Recent Used，最近最少使⽤)算法存储缓存在内存中的数据，默认页的⼤⼩是16K。

查询机制：

如果要查询到数据所在页不在Buffer Pool中，把该页从磁盘加载到Buffer Pool中的缓存页时，将该缓存页包装成节点塞到链表的头部；

如果该页在Buffer pool中，则直接把该页对应的LRU链表节点移动到链表的头部。sort命令排序

LRU链的前半部分称为热端，后半部分称为冷端。

缓存页直接放在热端带来的问题是，访问极少使⽤的表后，对应的页会放置在热端，造成原本频繁访问的数据被淘汰，后期再访问时存在⼤量磁盘IO，因此为了优化这⼀问题，在LRU中设置了midpoint，默认情况下新缓存页第⼀次插⼊到LRU列表的5/8处，再次查询时再放到LRU链表头部。

update机制

事务：对数据做修改，以commit或者rollback结束的过程。

假设当前有个⽤户对某条数据进⾏更新，执⾏如下语句：update emp set name=JACK where empno=7369;，随后⼜来⼀个⽤户读取同⼀条数据，select * form emp where empno=7369;，数据库默认不执⾏commit，其流程如下：

读线程io_read_thread从存储引擎的*.idb⽂件中到该⾏数据，并读取到innodb buffer pool中，并将修改前的数据写到UNDO中；

写线程io_write_thread对innodb buffer pool中的数据进⾏修改，此时，事务未进⾏commit时，该条数据在innodb buffer pool和存储引擎中的数据会不⼀致，在innodb buffer pool中的是否在事务中字段会存储是，UNDO字段中会存放该条数据前镜像的地址**；

后⼀个⽤户此时读数据时，读线程在innodb buffer pool中到该条数据后，根据事务字段判断该条数据处于事务未提交状态，然后根据UNDO字段到数据存储在ibdata1⽂件(存储被修改前的数据)中的地址，并去读取。

UNDO⽂件(保证⼀致性)的作⽤：

事务未提交时作⼀致性读取；

事务回滚后从UNDO中回更新前的数据。

数据库软件设计的原则

内存读优于磁盘读；

⽇志先⾏(先记再改)。

log buffer

log buffer在内存中，记录下对数据库的update、delete和insert操作，由log thread(只有1个)执⾏；

commit后，log buffer会写到磁盘中，存在ib_logfile0和ib_logfile1⽂件中，这两个⽂件称作redo log，当两个⽂件都写满之后，接下来数据库只能进⾏读，⽆法执⾏其他操作，这时的数据库状态叫做hung住。

写到磁盘的条件：1)达到1/2满；2)超过1M⼤⼩；3)commit(相关的参数：inndb_flush_log_at_trx_commit，这个参数=0时，表⽰log buffer每秒落⼀次盘；=1时表⽰每次commit就落盘，默认是1；)；满⾜上述三个条件中的任意⼀个log buffer都会写⼊到磁盘中；

解决系统因为redo⽇志⽆法覆盖造成hung住的解决⽅案：

调整redo⽇志⼤⼩；

调整redo⽇志⽂件数量。

MySQL启动时会进⾏实例恢复，即重做redo⽇志。

redo⽇志不能归档，即ib_logfile0和ib_logfile1⽂件写满后⽆法复制到其他⽂件中。

change buffer

在innodb buffer pool中，⽤来缓存⽤户在innodb buffer pool对数据进⾏修改且未提交的数据；

⽬的是减少落盘时磁头在不同盘块间的移动次数(即随机访问的次数)；

不适合马上写马上读的操作；

唯⼀索引不能使⽤change buffer。

表连接

驱动表：表连接时，需要全表扫描的表，让⾮驱动表⾛索引。栗⼦：select * from t1 join t2 on(t1.a=t2.1); //其中t1是驱动表

Index Nested-Loop Join(Index NLJ，嵌套循环连接)：⾮驱动表⾛索引，优化的⽅向；

Simple Nested-Loop Join(Simple NLJ)：⾮驱动表不⾛索引，select * from t1 straight_join t2 on(t1.a=t2.b);

Block Nested-Loop Join(BNLJ)：即当连接的表都不存在索引时，在作连接时，会将驱动表整块表或者分块放进join buffer中，由于驱动表存放在内存中，因此在作全表扫描时，能够加快表的连接；

Batched Key Access:Index Nested-Loop Join 和 MRR的结合；

表连接的⽅式使⽤选择：Index NLJ -> BNLJ -> Simple NLJ，除了Simple NLJ，其他的表连接⽅式都会⽤到join buffer;

辅助索引范围扫描的优化⽅式：Multi rang read(MRR)，存储在分配给⽤户的buffer中，即在对辅助索引进⾏范围查询时，每查到⼀个数据不直接进⾏回表，⽽是将所有满⾜条件的数据放到MRR buffer中，按照主键索引进⾏排序，然后再根据排序的结果返回到主键索引中进⾏查。

SQL语句 -- 考题

select length("开⼼⽣活") - 返回存储字符串的字节数；

select char_length("开⼼⽣活") - 返回字符串的字符数，与本地客户端的字节编码⽅式(character_set_client = utf8 or latin1)有关；

每个⽤户都会有⾃⼰的join、sort、multi range的buffer；

select concat和select concat_ws的区别：前者将所有字符串连接在⼀块，后者第⼀个参数是其它参数的分隔符，分隔符的位置放在要连接的两个字符串之间，如果分隔符为 NULL，则结果为 NULL。函数会忽略任何分隔符参数后的 NULL 值，但是CONCAT_WS()不会忽略任何空字符串；

user()和current_user()的区别：

获取当前的⽇期：CURDATE()，获取当前时间：CURTIME()，获取当前⽇期时间：NOW()。

where字句中!=、is null、is not null在MySQL5.7.21版本中不⾛索引；

utf8编码⽤3个字节存储字符。

常见字符串函数：

instr(string, substring): 返回substring第⼀次出现在string的起始位置，如果不存在substring返回0。

strcmp(string1,string2): 两个字符串相同时，返回0；string1在字典中⽐string2靠后，返回1；否则返回-1。

left(string, numstr): 返回字符串左边的numstr个字符；

right(string,numstr): 返回字符串右边的numstr个字符；

lpad(string, len, padstring): 如果string的字符数量⼤于len，那就从string截取len个字符返回，如果string的字符数量⼩于len，那就在string的前边添加padstring直到string有len个字符返回；

rpad(string, len, padstring): 与lpad作⽤相反，在右边补充字符。

substring(string, pos, length): 返回string中pos位置开始的len个字符，MySQL从1开始数。

substring_index:

trim

常见的DATE and TIME运算：

类型：DATE、TIME、DATETIME；

函数：NOW()、CURDATE()、CURTIME()；

DATE_ADD()、DATE_SUB()。

常见的Numeric函数：

ROUND(): 四舍五⼊；

TRUNCATE():

ceiling(x)：对x进⾏向上取整。

系统参数：

所有创建的⽤户都在mysql库中的user表中；

select user();: 获取当前真正连接数据库的⽤户；

select current_user();

创建⽤户时，需要指定⽤户名、密码和客户端IP地址create user user_name@ip_address identified by pwd;

聚合函数：

GROUP BY:

HAVING:

LIMIT:

GROUP_CONCAT()

Union 与 union all

temporary buffer: group by，union，distinct

唯⼀索引和普通索引的区别：只有普通索引能使⽤change buffer，普通索引适合于频繁写⼊，但不常常读取。

MySQL没有函数索引和索引跳跃扫描；

执⾏计划中通过type判断查询⾛不⾛索引。

key_len的算法：索引列类型if：1)int不能为空时=4；能为空时=5；2)varchar(20)，由于加上变长，key_len=22；3)datetime=8；4)date=3。

sync_binlog、innodb_flush_log_at_trx_commit：两个值都设为1时，称作双1模式。

⽤户访问数据库，如果需要sort，在内存中会⽣成⼀块私⼈的sort buffer，从innodb buffer pool中取数据，放到sort buffer中排序。

索引

索引是什么？

索引的出现是为了提⾼数据查询的效率，就像书的⽬录⼀样。

有哪些索引，适⽤于对哪⼀列进⾏索引？

常见的索引模型

哈希表：1)适合于单个数据进⾏精确查询，以及插⼊速度快；2)不适合范围查询，以及不适合做更新。

有序数组：根据索引对数据进⾏排序，1)范围查询速度快；2)插⼊和更新满，因为数组是连续存储的，因此在插⼊和更新时需要移动元素。适⽤于历史表。

⼆叉搜索树：由于分⽀数量为2，导致树较⾼，增加了查询数据时磁盘IO的次数，在数据库中不常使⽤。

N叉搜索树(MySQL使⽤，也叫B+树)：树根的数据块总是放在内存中，每⼀个索引在InnoDB中对应⼀棵B+树。

常见的索引

主键索引

唯⼀索引：由于索引定义了唯⼀性，查到第⼀个满⾜条件的记录后，就会停⽌继续检索。

普通索引：查到满⾜条件的第⼀个记录后，需继续查下⼀个记录，直到碰到第⼀个不满⾜条件的记录。

前缀索引：即当要建⽴索引的字段长度太长时，从左往右截取⼀定长度的字符串建⽴索引，但是需要满⾜截取下来的⼦串区分度较⼤，栗⼦：如果对订单号建⽴前缀索引时，由于订单前⾯⼏位通常以⽇期开头，此时区分度较⼩，可以将订单号反转。

索引设计原则

选择度越⼤，越适合建索引，选择度是指：对于⼀个表，随机抽出N⾏，在这N⾏中，对于索引列⽽⾔如果存在n个不同的值，我们称n/N为该列的选择度。MySQL通过收集统计信息来计算选择度，统计信

息存储在.frm⽂件中，⼿动收集统计信息语句：analyze table 表名;，查看统计信息语句：show index from 表名;；

执⾏计划的阅读

使⽤EXPLAIN命令查看SQL语句的执⾏计划，但是语句不会被执⾏；

执⾏计划的关键字段：

type: 值是range表⽰索引范围扫描(在sql语句的where字句表⽰范围查)，值是ALL表⽰全表扫描，值是ref表⽰等值索引扫描(等号查)；

possible_keys：所有查询时可能⽤到的索引；

key: 查询实际使⽤的索引；

key_len: 所使⽤索引的长度；

ref:

rows: 要查的⾏数，从统计信息⽽来。

filtered:

Extra: 值是Using index表⽰当前查询⽤到了索引覆盖优化。

复制表中的所有数据到新表中：create table t_new as select * from t;

where字句中如果是数学表达式、带函数的列、!、<>和not in(都表⽰不等于)、is null就⾛不了索引。

null和任何值做运算结果必然是null。

MySQL中的锁

undo保证事务的⼀致性，commit和rollback保证事务的原⼦性，锁保证隔离性，redo⽇志保证持久性。

全局锁

整个数据库只能读，不能写。Flush tables with read lock(FTWRL)，适⽤于数据库进⾏备份时使⽤全局锁。

表级锁

包括表锁和元数据锁。

表锁

lock table t read;: 给表t加读锁，此时表t只允许读，不允许写；

unlock tables;: 释放锁；

lock table t write;: 给表t加写锁，此时表t不允许读和写。

元数据锁(⽣产常⽤)

所有的SQL语句对表进⾏操作时，会对表加MDL锁(Metadata lock，元数据锁)，此时⽆法对表的结构进⾏修改(⽐如增加或者减少列)，因为修改表结构需要。

688IT编程网

mysql硬解析_MySQL笔记

发表评论

推荐文章

java正则表达式选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

688IT编程网

mysql硬解析_MySQL笔记

发表评论

推荐文章

java正则表达式 选择题

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

工龄小数点提取

非零金额 正则表达式

提取文本中数字的函数

热门文章

excel文字递增函数公式

数字递增公式

notepad 正则变量运算

C++regex库常用函数及实例

js正则表达式之前瞻后顾与非捕获分组

indesign正则数字和英文之间的空格

C#匹配中文字符串的4种正则表达式分享

PHP正则表达式匹配中文字符

匹配中文汉字的正则表达式介绍

Python正则表达式如何进行字符串替换

orcl中用正则表达式

sql正则表达式excel

dataframe正则表达式

postgress sql正则

el-upload accept 正则表达式

半小时 正则表达式

判断科学计数法的正则

根据url判断静态资源的方法

Java正则表达式-匹配正负浮点数

替换模糊匹配正则-hive

最新文章

一种基于正则表达式的DBC文件解析及报文分析方法[发明专利]

能被5整除的十进制整数的正规表达式

大于0小于等于1的正则表达式

linux grep 26个字母

java pattern 正则表达式

掌握文本编辑器中的搜索和替换技巧

标签列表

java正则表达式选择题

非零金额正则表达式

半小时正则表达式