史上最全⼤⼚Mysql⾯试题总结
今天跟⼤家分享下⼤⼚Mysql⾯试题的知识。
1 MySQL的复制原理以及流程
基本原理流程,3个线程以及之间的关联;
主:binlog线程——记录下所有改变了数据库数据的语句,放进master上的binlog中;
从:io线程——在使⽤start slave 之后,负责从master上拉取 binlog 内容,放进⾃⼰的relay log中;
从:sql执⾏线程——执⾏relay log中的语句;
2 MySQL中myisam与innodb的区别,⾄少5点
(1)、问5点不同;
1>.InnoDB⽀持事物,⽽MyISAM不⽀持事物
2>.InnoDB⽀持⾏级锁,⽽MyISAM⽀持表级锁
3>.InnoDB⽀持MVCC, ⽽MyISAM不⽀持
4>.InnoDB⽀持外键,⽽MyISAM不⽀持
5>.InnoDB不⽀持全⽂索引,⽽MyISAM⽀持。
(2)、innodb引擎的4⼤特性
插⼊缓冲(insert buffer),⼆次写(double write),⾃适应哈希索引(ahi),预读(read ahead)
(3)、2者selectcount(*)哪个更快,为什么
myisam更快,因为myisam内部维护了⼀个计数器,可以直接调取。
3 MySQL中varchar与char的区别以及varchar(50)中的50代表的涵义
(1)、varchar与char的区别
char是⼀种固定长度的类型,varchar则是⼀种可变长度的类型
(2)、varchar(50)中50的涵义
最多存放50个字符,varchar(50)和(200)存储hello所占空间⼀样,但后者在排序时会消耗更多内存,因为order by col采⽤fixed_length计算col长度(memory引擎也⼀样(3)、int(20)中20的涵义
是指显⽰字符的长度
但要加参数的,最⼤为255,⽐如它是记录⾏数的id,插⼊10笔资料,它就显⽰00000000001 ~~~00000000010,当字符的位数超过11,它也只显⽰11位,如果你没有加20表⽰最⼤显⽰宽度为20,但仍占4字节存储,存储范围不变;
(4)、mysql为什么这么设计
对⼤多数应⽤没有意义,只是规定⼀些⼯具⽤来显⽰字符的个数;int(1)和int(20)存储和计算均⼀样;
4 问了innodb的事务与⽇志的实现⽅式
(1)、有多少种⽇志;
错误⽇志:记录出错信息,也记录⼀些警告信息或者正确的信息。
查询⽇志:记录所有对数据库请求的信息,不论这些请求是否得到了正确的执⾏。
慢查询⽇志:设置⼀个阈值,将运⾏时间超过该值的所有SQL语句都记录到慢查询的⽇志⽂件中。
⼆进制⽇志:记录对数据库执⾏更改的所有操作。
中继⽇志:
事务⽇志:
(2)、事物的4种隔离级别
计算机基础知识资料
隔离级别
读未提交(RU)
读已提交(RC)中国期刊数据库是什么
可重复读(RR)
串⾏
(3)、事务是如何通过⽇志来实现的,说得越深⼊越好。
事务⽇志是通过redo和innodb的存储引擎⽇志缓冲(Innodb log buffer)来实现的,当开始⼀个事务的时候,会记录该事务的lsn(log
sequence number)号; 当事务执⾏时,会往InnoDB存储引擎的⽇志的⽇志缓存⾥⾯插⼊事务⽇志;当事务提交时,必须将存储引擎的⽇
志缓冲写⼊磁盘(通过innodb_flush_log_at_trx_commit来控制),也就是写数据前,需要先写⽇志。这种⽅式称为“预写⽇志⽅式”
5 MySQL binlog的⼏种⽇志录⼊格式以及区别
Statement:每⼀条会修改数据的sql都会记录在binlog中。
优点:不需要记录每⼀⾏的变化,减少了binlog⽇志量,节约了IO,提⾼性能。(相⽐row能节约多少性能与⽇志量,这个取决于应⽤的SQL情况,正常同⼀条记录修改缺点:由于记录的只是执⾏语句,为了这些语句能在slave上正确运⾏,因此还必须记录每条语句在执⾏的时候的⼀些相关信息,以保证所有语句能在slave得到和在m 使⽤以下函数的语句也⽆法被复制:mysql面试题sql
LOAD_FILE()
UUID()
USER()
FOUND_ROWS()
SYSDATE() (除⾮启动时启⽤了 --sysdate-is-now 选项)
同时在INSERT …SELECT 会产⽣⽐ RBR 更多的⾏级锁
2.Row:不记录sql语句上下⽂相关信息,仅保存哪条记录被修改。
优点:binlog中可以不记录执⾏的sql语句的上下⽂相关的信息,仅需要记录那⼀条记录被修改成什么了。所以rowlevel的⽇志内容会⾮常清楚的记录下每⼀⾏数据修改缺点:所有的执⾏的语句当记录到⽇志中的时候,都将以每⾏记录的修改来记录,这样可能会产⽣⼤量的⽇志内容,⽐如⼀条update语句,修改多条记录,则binlog中每3.Mixedlevel: 是以上两种level的混合使⽤,⼀般的语句修改使⽤statment格式保存binlog,如⼀些函数,statement⽆法完成主从复制的操作,则采⽤row格式保存bin 6 MySQL数据库cpu飙升到500%的话他怎么处理?
1、列出所有进程  show processlist,观察所有进程 ,多秒没有状态变化的(⼲掉)
2、查看超时⽇志或者错误⽇志 (做了⼏年开发,⼀般会是查询以及⼤批量的插⼊会导致cpu与i/o上涨,当然不排除⽹络状态突然断了,,导致⼀个请求服务器只接受到⼀半,7 sql优化各种⽅法
(1)、explain出来的各种item的意义;
select_typededecms套站
表⽰查询中每个select⼦句的类型
type
表⽰MySQL在表中到所需⾏的⽅式,⼜称“访问类型”
possible_keys
指出MySQL能使⽤哪个索引在表中到⾏,查询涉及到的字段上若存在索引,则该索引将被列出,但不⼀定被查询使⽤
key
显⽰MySQL在查询中实际使⽤的索引,若没有使⽤索引,显⽰为NULL
key_len
表⽰索引中使⽤的字节数,可通过该列计算查询中使⽤的索引的长度
ref
表⽰上述表的连接匹配条件,即哪些列或常量被⽤于查索引列上的值
Extra
包含不适合在其他列中显⽰但⼗分重要的额外信息
(2)、profile的意义以及使⽤场景;
查询到 SQL 会执⾏多少时间, 并看出 CPU/Memory 使⽤量, 执⾏过程中 Systemlock, Table lock 花多少时间等等
8 备份计划,mysqldump以及xtranbackup的实现原理
(1)、备份计划;
这⾥每个公司都不⼀样,您别说那种1⼩时1全备什么的就⾏
(2)、备份恢复时间;
这⾥跟机器,尤其是硬盘的速率有关系,以下列举⼏个仅供参考
20G的2分钟(mysqldump)
80G的30分钟(mysqldump)
111G的30分钟(mysqldump)
288G的3⼩时(xtra)
3T的4⼩时(xtra)
逻辑导⼊时间⼀般是备份时间的5倍以上
(3)、xtrabackup实现原理
在InnoDB内部会维护⼀个redo⽇志⽂件,我们也可以叫做事务⽇志⽂件。事务⽇志会存储每⼀个InnoDB表数据的记录修改。当InnoDB启动时,InnoDB会检查数据⽂件
9 mysqldump中备份出来的sql,如果我想sql⽂件中,⼀⾏只有⼀个insert….value()的话,怎么办?如果备份需要带上master的复制点信息怎么办?
--skip-extended-insert
[root@helei-zhuanshu ~]# mysqldump -uroot -p helei --skip-extended-insert
Enter password:
KEY `idx_c1` (`c1`),
KEY `idx_c2` (`c2`)
) ENGINE=InnoDB AUTO_INCREMENT=51 DEFAULT CHARSET=latin1;
/*!40101 SET character_set_client = @saved_cs_client */;
--
-- Dumping data for table `helei`
--
LOCK TABLES `helei` WRITE;
/*!40000 ALTER TABLE `helei` DISABLE KEYS */;
INSERT INTO `helei` VALUES (1,32,37,38,'2016-10-18 06:19:24','susususususususususususu');
INSERT INTO `helei` VALUES (2,37,46,21,'2016-10-18 06:19:24','susususususu');css样式使用
INSERT INTO `helei` VALUES (3,21,5,14,'2016-10-18 06:19:24','susu');
10 500台db,在最快时间之内重启
puppet,dsh
11 innodb的读写参数优化
(1)、读取参数
global buffer pool以及 local buffer;
(2)、写⼊参数;
innodb_flush_log_at_trx_commit
innodb_buffer_pool_size
(3)、与IO相关的参数;
innodb_write_io_threads = 8
innodb_read_io_threads = 8
innodb_thread_concurrency = 0
(4)、缓存参数以及缓存的适⽤场景。
query cache/query_cache_type
并不是所有表都适合使⽤query cache。造成query cache失效的原因主要是相应的table发⽣了变更
第⼀个:读操作多的话看看⽐例,简单来说,如果是⽤户清单表,或者说是数据⽐例⽐较固定,⽐如说商品列表,是可以打开的,前提是这些库⽐较集中,数据第⼆个:我们“⾏骗”的时候,⽐如说我们竞标的时候压测,把query cache打开,还是能收到qps激增的效果,当然前提⽰前端的连接池什么的都配置⼀样。⼤部分情况第三个:⼩⽹站或者没有⾼并发的⽆所谓,⾼并发下,会看到很多 qcache 锁等待,所以⼀般⾼并发下,不建议打开query cache
12 你是如何监控你们的数据库的?你们的慢⽇志都是怎么查询的?
监控的⼯具有很多,例如zabbix,lepus,我这⾥⽤的是lepus
13 你是否做过主从⼀致性校验,如果有,怎么做的,如果没有,你打算怎么做?
主从⼀致性校验有多种⼯具 例如checksum、mysqldiff、pt-table-checksum等
14 你们数据库是否⽀持emoji表情,如果不⽀持,如何操作?
如果是utf8字符集的话,需要升级⾄utf8_mb4⽅可⽀持
15 你是如何维护数据库的数据字典的?
这个⼤家维护的⽅法都不同,我⼀般是直接在⽣产库进⾏注释,利⽤⼯具导出成excel⽅便流通。
16 表中有⼤字段X(例如:text类型),且字段X不会经常更新,以读为为主,请问
拆带来的问题:连接消耗 + 存储拆分空间;不拆可能带来的问题:查询性能;
1、如果能容忍拆分带来的空间问题,拆的话最好和经常要查询的表的主键在物理结构上放置在⼀起(分区) 顺序IO,减少连接消耗,最后这是⼀
个⽂本列再加上⼀个全⽂索引来尽量抵消连接消耗
2、如果能容忍不拆分带来的查询性能损失的话:上⾯的⽅案在某个极致条件下肯定会出现问题,那么不拆就是最好的选择
17 MySQL中InnoDB引擎的⾏锁是通过加在什么上完成(或称实现)的?为什么是这样⼦的?
InnoDB是基于索引来完成⾏锁
例: select * from tab_with_index where id = 1 for update;
python中exec的用法for update 可以根据条件来完成⾏锁锁定,并且 id 是有索引键的列,如果 id 不是索引键那么InnoDB将完成表锁,,并发将⽆从谈起
18 开放性问题:据说是腾讯的
⼀个6亿的表a,⼀个3亿的表b,通过外间tid关联,你如何最快的查询出满⾜条件的第50000到第50200中的这200条数据记录。
1、如果A表TID是⾃增长,并且是连续的,B表的ID为索引

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。