云计算⼯程师⾯试题集锦,云计算⾯试题及答案
云计算现在发展前景很好,很多⼈都会选择云计算。但是学完云计算如何⾯试成功也是重要的⼀环。这次在本⽂就为⼤家带来云计算⾯试及答案,希望能够对⼤家⼯作的征程有所助益。
从互联⽹公司的⾯试过程来看,求职者必须注意以下⼏点:
1、计算机⽹络和数据库的相关知识是所有互联⽹公司基础知识考察的重要⽅⾯,上述也给出了不少⾯试题,很多公司的题⽬都很相像,这也基本给出了重点。
2、性格测试被越来越多的互联⽹公司纳⼊考察范围,有些问题看起来似乎是正常考察,但很多时候可以看出⼀个⼈的性格,公司基本都更喜欢乐观向上、态度积极的求职者。
3、如果基础⾯试没问题,多数互联⽹公司的⼈⼒会让求职者打印半年或⼀年的⼯资流⽔,所以各位求职者在薪资这件事上⼤可以直接说出历史数据和期望数据,是不可取的。
下⾯给⼤家分享⼀些实⽤的⾯试题:
1MySQL的复制原理以及流程
基本原理流程,3个线程以及之间的关联;
(1)主:binlog线程——记录下所有改变了数据库数据的语句,放进master上的binlog中;
(2)从:io线程——在使⽤start slave 之后,负责从master上拉取 binlog 内容,放进 ⾃⼰的relay log中;
(3)从:sql执⾏线程——执⾏relay log中的语句;
2MySQL中myisam与innodb的区别,⾄少5点
(1)、问5点不同:
1>.InnoDB⽀持事物,⽽MyISAM不⽀持事物
2>.InnoDB⽀持⾏级锁,⽽MyISAM⽀持表级锁
3>.InnoDB⽀持MVCC, ⽽MyISAM不⽀持
4>.InnoDB⽀持外键,⽽MyISAM不⽀持
5>.InnoDB不⽀持全⽂索引,⽽MyISAM⽀持。
(2)、innodb引擎的4⼤特性:
插⼊缓冲(insert buffer);
⼆次写(double write);
⾃适应哈希索引(ahi);
产生一个随机数预读(read ahead)。
(3)、2者selectcount(*)哪个更快,为什么
myisam更快,因为myisam内部维护了⼀个计数器,可以直接调取。
3MySQL中varchar与char的区别以及varchar(50)中的50代表的涵义
(1)、varchar与char的区别
char是⼀种固定长度的类型,varchar则是⼀种可变长度的类型。
(2)、varchar(50)中50的涵义
最多存放50个字符,varchar(50)和(200)存储hello所占空间⼀样,但后者在排序时会消耗更多内存,因为order by col采⽤
fixed_length计算col长度(memory引擎也⼀样)。
(3)、int(20)中20的涵义
是指显⽰字符的长度
但要加参数的,最⼤为255,⽐如它是记录⾏数的id,插⼊10笔资料,它就显⽰00000000001 ~~~00000000010,当字符的位数超过11,它也只显⽰11位,如果你没有加那个让它未满11位就前⾯加0的参数,它不会在前⾯加0
20表⽰最⼤显⽰宽度为20,但仍占4字节存储,存储范围不变;
(4)、mysql为什么这么设计
对⼤多数应⽤没有意义,只是规定⼀些⼯具⽤来显⽰字符的个数;int(1)和int(20)存储和计算均⼀样。
4问了innodb的事务与⽇志的实现⽅式
(1)、有多少种⽇志:
错误⽇志:记录出错信息,也记录⼀些警告信息或者正确的信息。
查询⽇志:记录所有对数据库请求的信息,不论这些请求是否得到了正确的执⾏。
慢查询⽇志:设置⼀个阈值,将运⾏时间超过该值的所有SQL语句都记录到慢查询的⽇志⽂件中。
⼆进制⽇志:记录对数据库执⾏更改的所有操作。
教你10秒内学会如何转笔中继⽇志。
事务⽇志。
(2)、事物的4种隔离级别
隔离级别
读未提交(RU)
读已提交(RC)
可重复读(RR)
串⾏
(3)、事务是如何通过⽇志来实现的,说得越深⼊越好。
事务⽇志是通过redo和innodb的存储引擎⽇志缓冲(Innodb log buffer)来实现的,当开始⼀个事务的时候,会记录该事务的lsn(log sequence number)号; 当事务执⾏时,会往InnoDB存储引擎的⽇志。
的⽇志缓存⾥⾯插⼊事务⽇志;当事务提交时,必须将存储引擎的⽇志缓冲写⼊磁盘(通过innodb_flush_log_at_trx_commit来控制),也就是写数据前,需要先写⽇志。这种⽅式称为“预写⽇志⽅式”。
5问了MySQL binlog的⼏种⽇志录⼊格式以及区别
(1)、binlog的⽇志格式的种类和分别;
(2)、适⽤场景;
(3)、结合第⼀个问题,每⼀种⽇志格式在复制中的优劣。
1.Statement:每⼀条会修改数据的sql都会记录在binlog中。
优点:不需要记录每⼀⾏的变化,减少了binlog⽇志量,节约了IO,提⾼性能。(相⽐row能节约多少性
能 与⽇志量,这个取决于应⽤的SQL情况,正常同⼀条记录修改或者插⼊row格式所产⽣的⽇志量还⼩于Statement产⽣的⽇志量,但是考虑到如果带条 件的update操作,以及整表删除,alter表等操作,ROW格式会产⽣⼤量⽇志,因此在考虑是否使⽤ROW格式⽇志时应该跟据应⽤的实际情况,其所 产⽣的⽇志量会增加多少,以及带来的IO性能问题。)
缺点:由于记录的只是执⾏语句,为了这些语句能在slave上正确运⾏,因此还必须记录每条语句在执⾏的时候的 ⼀些相关信息,以保证所有语句能在slave得到和在master端执⾏时候相同 的结果。另外mysql 的复制,像⼀些特定函数功能,slave可与master上要保持⼀致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).
使⽤以下函数的语句也⽆法被复制:
LOAD_FILE()
UUID()
USER()
FOUND_ROWS()
SYSDATE() (除⾮启动时启⽤了 --sysdate-is-now 选项)
同时在INSERT …SELECT 会产⽣⽐ RBR 更多的⾏级锁
2.Row:不记录sql语句上下⽂相关信息,仅保存哪条记录被修改。
numberformatexception:null什么意思优点: binlog中可以不记录执⾏的sql语句的上下⽂相关的信息,仅需要记录那⼀条记录被修改成什么了。所以rowlevel的⽇志内容会⾮常清楚的记录下 每⼀⾏数据修改的细节。⽽且不会出现某些特定情况下的存储过程,或function,以及trigger的调⽤和触发⽆法被正确复制的问题
缺点:所有的执⾏的语句当记录到⽇志中的时候,都将以每⾏记录的修改来记录,这样可能会产⽣⼤量的⽇志内容,⽐ 如⼀条update语句,修改多条记录,则binlog中每⼀条修改都会有记录,这样造成binlog⽇志量会很⼤,特别是当执⾏alter table之类的语句的时候,由于表结构修改,每条记录都发⽣改变,那么该表每⼀条记录都会记录到⽇志中。
3.Mixedlevel: 是以上两种level的混合使⽤,⼀般的语句修改使⽤statment格式保存binlog,如⼀些函数,statement⽆法完成主从复制的操作,则 采⽤row格式保存binlog,MySQL会根据执⾏的每⼀条具体的sql语句来区分对待记录的⽇志形式,也就是在Statement和Row之间选择 ⼀种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。⾄于update或者delete等修改数据的语句,还是会记录所有⾏的 变更。
6问了下MySQL数据库cpu飙升到500%的话他怎么处理?
(1)、没有经验的,可以不问;
(2)、有经验的,问他们的处理思路。
mysql面试题大全列出所有进程 show processlist 观察所有进程 多秒没有状态变化的(⼲掉)
查看超时⽇志或者错误⽇志 (做了⼏年开发,⼀般会是查询以及⼤批量的插⼊会导致cpu与i/o上涨,当然不排除⽹络状态突然断了,导致⼀个请求服务器只接受到⼀半,⽐如where⼦句或分页⼦句没有发送,当然的⼀次被坑经历)
7sql优化
(1)、explain出来的各种item的意义;
select_type
表⽰查询中每个select⼦句的类型
type
表⽰MySQL在表中到所需⾏的⽅式,⼜称“访问类型”
possible_keys
指出MySQL能使⽤哪个索引在表中到⾏,查询涉及到的字段上若存在索引,则该索引将被列出,但不⼀定被查询使⽤
key
显⽰MySQL在查询中实际使⽤的索引,若没有使⽤索引,显⽰为NULL
key_len
表⽰索引中使⽤的字节数,可通过该列计算查询中使⽤的索引的长度
ref
表⽰上述表的连接匹配条件,即哪些列或常量被⽤于查索引列上的值
Extra
包含不适合在其他列中显⽰但⼗分重要的额外信息。
(2)、profile的意义以及使⽤场景;
查询到 SQL 会执⾏多少时间, 并看出 CPU/Memory 使⽤量, 执⾏过程中 Systemlock, Table lock 花多少时间等等。
8备份计划,mysqldump以及xtranbackup的实现原理
(1)、备份计划;
这⾥每个公司都不⼀样,您别说那种1⼩时1全备什么的就⾏
(2)、备份恢复时间;
这⾥跟机器,尤其是硬盘的速率有关系,以下列举⼏个仅供参考
20G的2分钟(mysqldump)
80G的30分钟(mysqldump)
111G的30分钟(mysqldump)
288G的3⼩时(xtra)
3T的4⼩时(xtra)
逻辑导⼊时间⼀般是备份时间的5倍以上
(3)、xtrabackup实现原理
在InnoDB内部会维护⼀个redo⽇志⽂件,我们也可以叫做事务⽇志⽂件。事务⽇志会存储每⼀个InnoDB表数据的记录修改。当InnoDB启动时,InnoDB会检查数据⽂件和事务⽇志,并执⾏两个步骤:它应⽤(前滚)已经提交的事务⽇志到数据⽂件,并将修改过但没有提交的数据进⾏回滚操作。
9mysqldump中备份出来的sql,如果我想sql⽂件中,⼀⾏只有⼀个insert…value()的话,怎么办?如果备份需要带上master的复制点信息怎么办?
–skip-extended-insert
[root@helei-zhuanshu ~]# mysqldump -uroot -p helei --skip-extended-insert
Enter password:
KEY idx_c1 (c1),
KEY idx_c2 (c2)
)
ENGINE=InnoDB AUTO_INCREMENT=51 DEFAULT CHARSET=latin1;
/*!40101 SET character_set_client = @saved_cs_client */;
– Dumping data for table helei
LOCK TABLES helei WRITE;
/*!40000 ALTER TABLE helei DISABLE KEYS */;
INSERT INTO helei VALUES (1,32,37,38,‘2016-10-18 06:19:24’,‘susususususususususususu’);
INSERT INTO helei VALUES (2,37,46,21,‘2016-10-18 06:19:24’,‘susususususu’);
INSERT INTO helei VALUES (3,21,5,14,‘2016-10-18 06:19:24’,‘susu’);
10500台db,在最快时间之内重启
puppet,dsh
11innodb的读写参数优化
(1)、读取参数
global buffer pool以及 local buffer;
(2)、写⼊参数;
innodb_flush_log_at_trx_commit
innodb_buffer_pool_size
(3)、与IO相关的参数;
随机数字表法软件下载innodb_write_io_threads = 8
innodb_read_io_threads = 8
innodb_thread_concurrency = 0
spring boot项目结构(4)、缓存参数以及缓存的适⽤场景。
query cache/query_cache_type
并不是所有表都适合使⽤query cache。造成query cache失效的原因主要是相应的table发⽣了变更
第⼀个:读操作多的话看看⽐例,简单来说,如果是⽤户清单表,或者说是数据⽐例⽐较固定,⽐如说商品列表,是可以打开的,前提是这些库⽐较集中,数据库中的实务⽐较⼩。
第⼆个:我们“⾏骗”的时候,⽐如说我们竞标的时候压测,把query cache打开,还是能收到qps激增的效果,当然前提⽰前端的连接池什么的都配置⼀样。⼤部分情况下如果写⼊的居多,访问量并不多,那么就不要打开,例如社交⽹站的,10%的⼈产⽣内容,其余的90%都在消费,打开还是效果很好的,但是你如果是qq消息,或者聊天,那就很要命。
第三个:⼩⽹站或者没有⾼并发的⽆所谓,⾼并发下,会看到 很多 qcache 锁 等待,所以⼀般⾼并发下,不建议打开query cache。
12你是如何监控你们的数据库的?你们的慢⽇志都是怎么查询的?
监控的⼯具有很多,例如zabbix,lepus,我这⾥⽤的是lepus。
13你是否做过主从⼀致性校验,如果有,怎么做的,如果没有,你打算怎么做?
主从⼀致性校验有多种⼯具 例如checksum、mysqldiff、pt-table-checksum等。
14你们数据库是否⽀持emoji表情,如果不⽀持,如何操作?
如果是utf8字符集的话,需要升级⾄utf8_mb4⽅可⽀持。
15你是如何维护数据库的数据字典的?
这个⼤家维护的⽅法都不同,⼀般是直接在⽣产库进⾏注释,利⽤⼯具导出成excel⽅便流通。
16你们是否有开发规范,如果有,如何执⾏的
有,开发规范⽹上有很多了,可以⾃⼰看看总结下。
17表中有⼤字段X(例如:text类型),且字段X不会经常更新,以读为为主,请问
(1)、您是选择拆成⼦表,还是继续放⼀起;
(2)、写出您这样选择的理由。
答:拆带来的问题:连接消耗 + 存储拆分空间;不拆可能带来的问题:查询性能;
如果能容忍拆分带来的空间问题,拆的话最好和经常要查询的表的主键在物理结构上放置在⼀起(分区) 顺序IO,减少连接消耗,最后这是⼀个⽂本列再加上⼀个全⽂索引来尽量抵消连接消耗。
如果能容忍不拆分带来的查询性能损失的话:上⾯的⽅案在某个极致条件下肯定会出现问题,那么不拆就是最好的选择。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论