2021大厂技术面100道MySQL经典面试题分享(持续更新)

资料整理:
Linuxc/c++后台开发方向技术文章资料电子书整理
2021-2000道大厂面经/面试题整理(腾讯、字节、阿里、百度、京东等)

MySQL经典面试题

  • 1. MySQL 索引使用有哪些注意事项呢?
  • 2. MySQL 遇到过死锁问题吗,你是如何解决的?
  • 3. 日常工作中你是怎么优化SQL的?
  • 4. 说说分库与分表的设计
  • 5. InnoDB与MyISAM的区
  • 6. 数据库索引的原理,为什么要用 B+树,为什么不用二叉树?
  • 7. 聚集索引与非聚集索引的区别
  • 8. limit 1000000 加载很慢的话,你是怎么解决的呢?
  • 9. 如何选择合适的分布式主键方案呢?
  • 10. 事务的隔离级别有哪些?MySQL的默认隔离级别是什么?
  • 11. 什么是幻读,脏读,不可重复读呢?
  • 12. 在高并发情况下,如何做到安全的修改同一行数据?
  • 13. 数据库的乐观锁和悲观锁。
  • 14. SQL优化的一般步骤是什么,怎么看执行计划(explain),如何理解其中各个字段的含义。
  • 15. select for update有什么含义,会锁表还是锁行还是其他。
  • 16. MySQL事务得四大特性以及实现原理
  • 17. 如果某个表有近千万数据,CRUD比较慢,如何优化。
  • 18. 如何写sql能够有效的使用到复合索引。
  • 19. mysql中in 和exists的区别。
  • 20. 数据库自增主键可能遇到什么问题。
  • 21. MVCC熟悉吗,它的底层原理?
  • 22. 数据库中间件了解过吗,sharding jdbc,mycat?
  • 23. MYSQL的主从延迟,你怎么解决?
  • 24. 说一下大表查询的优化方案
  • 25. 什么是数据库连接池?为什么需要数据库连接池呢?
  • 26. 一条SQL语句在MySQL中如何执行的?
  • 27. InnoDB引擎中的索引策略,了解过吗?
  • 28. 数据库存储日期格式时,如何考虑时区转换问题?
  • 29. 一条sql执行过长的时间,你如何优化,从哪些方面入手?
  • 30. MYSQL数据库服务器性能分析的方法命令有哪些?
  • 31. Blob和text有什么区别?
  • 32. mysql里记录货币用什么字段类型比较好?
  • 33. Mysql中有哪几种锁,列举一下?
  • 34. Hash索引和B+树区别是什么?你在设计索引是怎么抉择的?
  • 35. mysql 的内连接、左连接、右连接有什么区别?
  • 36. 说说MySQL 的基础架构图
  • 37. 什么是内连接、外连接、交叉连接、笛卡尔积呢?
  • 38. 说一下数据库的三大范式
  • 39. mysql有关权限的表有哪几个呢?
  • 40. Mysql的binlog有几种录入格式?分别有什么区别?
  • 41. InnoDB引擎的4大特性,了解过吗
  • 42. 索引有哪些优缺点?
  • 43. 索引有哪几种类型?
  • 44. 创建索引有什么原则呢?
  • 45. 创建索引的三种方式
  • 46. 百万级别或以上的数据,你是如何删除的?
  • 47. 什么是最左前缀原则?什么是最左匹配原则?
  • 48. B树和B+树的区别,数据库为什么使用B+树而不是B树?
  • 49. 覆盖索引、回表等这些,了解过吗?
  • 50. B+树在满足聚簇索引和覆盖索引的时候不需要回表查询数据?
  • 51. 何时使用聚簇索引与非聚簇索引
  • 52. 非聚簇索引一定会回表查询吗?
  • 53. 组合索引是什么?为什么需要注意组合索引中的顺序?
  • 54. 什么是数据库事务?
  • 55. 隔离级别与锁的关系
  • 56. 按照锁的粒度分,数据库锁有哪些呢?锁机制与InnoDB锁算法
  • 57. 从锁的类别角度讲,MySQL都有哪些锁呢?
  • 58. MySQL中InnoDB引擎的行锁是怎么实现的?
  • 59. 什么是死锁?怎么解决?
  • 60. 为什么要使用视图?什么是视图?
  • 61. 视图有哪些特点?哪些使用场景?
  • 62. 视图的优点,缺点,讲一下?
  • 63. count(1)、count(*) 与 count(列名) 的区别?
  • 64. 什么是游标?
  • 65. 什么是存储过程?有哪些优缺点?
  • 66. 什么是触发器?触发器的使用场景有哪些?
  • 67. MySQL中都有哪些触发器?
  • 68. 超键、候选键、主键、外键分别是什么?
  • 69. SQL 约束有哪几种呢?
  • 70. 谈谈六种关联查询,使用场景。
  • 71. varchar(50)中50的涵义
  • 72. mysql中int(20)和char(20)以及varchar(20)的区别
  • 73. drop、delete与truncate的区别
  • 74. UNION与UNION ALL的区别?
  • 75. SQL的生命周期?
  • 76. 一条Sql的执行顺序?
  • 77. 列值为NULL时,查询是否会用到索引?
  • 78. 关心过业务系统里面的sql耗时吗?统计过慢查询吗?对慢查询都怎么优化过?
  • 79. 主键使用自增ID还是UUID,为什么?
  • 80. mysql自增主键用完了怎么办?
  • 81. 字段为什么要求定义为not null?
  • 82. 如果要存储用户的密码散列,应该使用什么字段进行存储?
  • 83. Mysql驱动程序是什么?
  • 84. 如何优化长难的查询语句?有实战过吗?
  • 85. 优化特定类型的查询语句
  • 86. MySQL数据库cpu飙升的话,要怎么处理呢?
  • 87. 读写分离常见方案?
  • 88. MySQL的复制原理以及流程
  • 89. MySQL中DATETIME和TIMESTAMP的区别
  • 90. Innodb的事务实现原理?
  • 91. 谈谈MySQL的Explain
  • 92. Innodb的事务与日志的实现方式
  • 93. MySQL中TEXT数据类型的最大长度
  • 94. 500台db,在最快时间之内重启。
  • 95. 你是如何监控你们的数据库的?你们的慢日志都是怎么查询的?
  • 96. 你是否做过主从一致性校验,如果有,怎么做的,如果没有,你打算怎么做?
  • 97. 你们数据库是否支持emoji表情存储,如果不支持,如何操作?
  • 98. MySQL如何获取当前日期?
  • 99. 一个6亿的表a,一个3亿的表b,通过外间tid关联,你如何最快的查询出满足条件的第50000到第50200中的这200条数据记录。
  • 100. Mysql一条SQL加锁分析

1. MySQL 索引使用有哪些注意事项呢?

可以从三个维度回答这个问题:索引哪些情况会失效,索引不适合哪些场景,索引规则

索引哪些情况会失效

  • 查询条件包含or,可能导致索引失效
  • 如何字段类型是字符串,where时一定用引号括起来,否则索引失效
  • like通配符可能导致索引失效。
  • 联合索引,查询时的条件列不是联合索引中的第一个列,索引失效。
  • 在索引列上使用mysql的内置函数,索引失效。
  • 对索引列运算(如,+、-、*、/),索引失效。 索引字段上使用(!= 或者 < >,not in)时,可能会导致索引失效。
  • 索引字段上使用is null, is not null,可能导致索引失效。
  • 左连接查询或者右连接查询查询关联的字段编码格式不一样,可能导致索引失效。
  • mysql估计使用全表扫描要比使用索引快,则不使用索引。

索引不适合哪些场景

  • 数据量少的不适合加索引
  • 更新比较频繁的也不适合加索引
  • 区分度低的字段不适合加索引(如性别)

索引的一些潜规则

  • 覆盖索引
  • 回表
  • 索引数据结构(B+树)
  • 最左前缀原则
  • 索引下推

2. MySQL 遇到过死锁问题吗,你是如何解决的?

我排查死锁的一般步骤是酱紫的:

  • 查看死锁日志show engine innodb status;
  • 找出死锁Sql
  • 分析sql加锁情况
  • 模拟死锁案发
  • 分析死锁日志
  • 分析死锁结果

3. 日常工作中你是怎么优化SQL的?

可以从这几个维度回答这个问题:

  • 加索引
  • 避免返回不必要的数据
  • 适当分批量进行
  • 优化sql结构
  • 分库分表
  • 读写分离

4. 说说分库与分表的设计

分库分表方案,分库分表中间件,分库分表可能遇到的问题
分库分表方案:

  • 水平分库:以字段为依据,按照一定策略(hash、range等),将一个库中的数据拆分到多个库中。
  • 水平分表:以字段为依据,按照一定策略(hash、range等),将一个表中的数据拆分到多个表中。
  • 垂直分库:以表为依据,按照业务归属不同,将不同的表拆分到不同的库中。
  • 垂直分表:以字段为依据,按照字段的活跃性,将表中字段拆到不同的表(主表和扩展表)中。

常用的分库分表中间件:

  • sharding-jdbc(当当)
  • Mycat
  • TDDL(淘宝)
  • Oceanus(58同城数据库中间件)
  • vitess(谷歌开发的数据库中间件)
  • Atlas(Qihoo 360)

分库分表可能遇到的问题

  • 事务问题:需要用分布式事务啦
  • 跨节点Join的问题:解决这一问题可以分两次查询实现
  • 跨节点的count,order by,group by以及聚合函数问题:分别在各个节点上得到结果后在应用程序端进行合并。
  • 数据迁移,容量规划,扩容等问题
  • ID问题:数据库被切分后,不能再依赖数据库自身的主键生成机制啦,最简单可以考虑UUID
  • 跨分片的排序分页问题(后台加大pagesize处理?)

5. InnoDB与MyISAM的区

  • InnoDB支持事务,MyISAM不支持事务
  • InnoDB支持外键,MyISAM不支持外键
  • InnoDB 支持MVCC(多版本并发控制),MyISAM 不支持
  • select count(*) from table时,MyISAM更快,因为它有一个变量保存了整个表的总行数,可以直接读取,InnoDB就需要全表扫描。
  • Innodb不支持全文索引,而MyISAM支持全文索引(5.7以后的InnoDB也支持全文索引)
  • InnoDB支持表、行级锁,而MyISAM支持表级锁。 InnoDB表必须有主键,而MyISAM可以没有主键
  • Innodb表需要更多的内存和存储,而MyISAM可被压缩,存储空间较小,。
  • Innodb按主键大小有序插入,MyISAM记录插入顺序是,按记录插入顺序保存。
  • InnoDB存储引擎提供了具有提交、回滚、崩溃恢复能力的事务安全,与 MyISAM 比 InnoDB写的效率差一些,并且会占用更多的磁盘空间以保留数据和索引
  • InnoDB属于索引组织表,使用共享表空间和多表空间储存数据。MyISAM用.frm、.MYD、.MTI来储存表定义,数据和索引。

6. 数据库索引的原理,为什么要用 B+树,为什么不用二叉树?

可以从几个维度去看这个问题,查询是否够快,效率是否稳定,存储数据多少,以及查找磁盘次数,为什么不是二叉树,为什么不是平衡二叉树,为什么不是B树,而偏偏是B+树呢?

为什么不是一般二叉树?

如果二叉树特殊化为一个链表,相当于全表扫描。平衡二叉树相比于二叉查找树来说,查找效率更稳定,总体的查找速度也更快。

为什么不是平衡二叉树呢?

我们知道,在内存比在磁盘的数据,查询效率快得多。如果树这种数据结构作为索引,那我们每查找一次数据就需要从磁盘中读取一个节点,也就是我们说的一个磁盘块,但是平衡二叉树可是每个节点只存储一个键值和数据的,如果是B树,可以存储更多的节点数据,树的高度也会降低,因此读取磁盘的次数就降下来啦,查询效率就快啦。

那为什么不是B树而是B+树呢?

  • 1)B+树非叶子节点上是不存储数据的,仅存储键值,而B树节点中不仅存储键值,也会存储数据。innodb中页的默认大小是16KB,如果不存储数据,那么就会存储更多的键值,相应的树的阶数(节点的子节点树)就会更大,树就会更矮更胖,如此一来我们查找数据进行磁盘的IO次数有会再次减少,数据查询的效率也会更快。
  • 2)B+树索引的所有数据均存储在叶子节点,而且数据是按照顺序排列的,链表连着的。那么B+树使得范围查找,排序查找,分组查找以及去重查找变得异常简单。

7. 聚集索引与非聚集索引的区别

  • 一个表中只能拥有一个聚集索引,而非聚集索引一个表可以存在多个。
  • 聚集索引,索引中键值的逻辑顺序决定了表中相应行的物理顺序;非聚集索引,索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。
  • 索引是通过二叉树的数据结构来描述的,我们可以这么理解聚簇索引:索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点,只不过有一个指针指向对应的数据块。
  • 聚集索引:物理存储按照索引排序;非聚集索引:物理存储不按照索引排序;

何时使用聚集索引或非聚集索引?
2021大厂技术面100道MySQL经典面试题分享(持续更新)_第1张图片

8. limit 1000000 加载很慢的话,你是怎么解决的呢?

方案一:如果id是连续的,可以这样,返回上次查询的最大记录(偏移量),再往下limit

select id,name from employee where id>1000000 limit 10.

方案二:在业务允许的情况下限制页数:
建议跟业务讨论,有没有必要查这么后的分页啦。因为绝大多数用户都不会往后翻太多页。

方案三:order by + 索引(id为索引)

select id,name from employee order by id  limit 1000000,10
SELECT a.* FROM employee a, (select id from employee where 条件 LIMIT 1000000,10 ) b where a.id=b.id

方案四:利用延迟关联或者子查询优化超多分页场景。(先快速定位需要获取的id段,然后再关联)

9. 如何选择合适的分布式主键方案呢?

  • 数据库自增长序列或字段。
  • UUID。
  • Redis生成ID
  • Twitter的snowflake算法
  • 利用zookeeper生成唯一ID
  • MongoDB的ObjectId

10. 事务的隔离级别有哪些?MySQL的默认隔离级别是什么?

  • 读未提交(Read Uncommitted)
  • 读已提交(Read Committed)
  • 可重复读(Repeatable Read)
  • 串行化(Serializable) Mysql默认的事务隔离级别是可重复读(Repeatable Read)

11. 什么是幻读,脏读,不可重复读呢?

  • 事务A、B交替执行,事务A被事务B干扰到了,因为事务A读取到事务B未提交的数据,这就是脏读
  • 在一个事务范围内,两个相同的查询,读取同一条记录,却返回了不同的数据,这就是不可重复读
  • 事务A查询一个范围的结果集,另一个并发事务B往这个范围中插入/删除了数据,并静悄悄地提交,然后事务A再次查询相同的范围,两次读取得到的结果集不一样了,这就是幻读。

12. 在高并发情况下,如何做到安全的修改同一行数据?

要安全的修改同一行数据,就要保证一个线程在修改时其它线程无法更新这行记录。一般有悲观锁和乐观锁两种方案~
使用悲观锁
悲观锁思想就是,当前线程要进来修改数据时,别的线程都得拒之门外~ 比如,可以使用select…for update ~

select * from User where name=‘jay’ for update

以上这条sql语句会锁定了User表中所有符合检索条件(name=‘jay’)的记录。本次事务提交之前,别的线程都无法修改这些记录。

使用乐观锁
乐观锁思想就是,有线程过来,先放过去修改,如果看到别的线程没修改过,就可以修改成功,如果别的线程修改过,就修改失败或者重试。实现方式:乐观锁一般会使用版本号机制或CAS算法实现。

13. 数据库的乐观锁和悲观锁。

悲观锁:
悲观锁她专一且缺乏安全感了,她的心只属于当前事务,每时每刻都担心着它心爱的数据可能被别的事务修改,所以一个事务拥有(获得)悲观锁后,其他任何事务都不能对数据进行修改啦,只能等待锁被释放才可以执行。

乐观锁:
乐观锁的“乐观情绪”体现在,它认为数据的变动不会太频繁。因此,它允许多个事务同时对数据进行变动。实现方式:乐观锁一般会使用版本号机制或CAS算法实现。

14. SQL优化的一般步骤是什么,怎么看执行计划(explain),如何理解其中各个字段的含义。

  • show status 命令了解各种 sql 的执行频率
  • 通过慢查询日志定位那些执行效率较低的 sql 语句
  • explain 分析低效sql 的执行计划(这点非常重要,日常开发中用它分析Sql,会大大降低Sql导致的线上事故)

15. select for update有什么含义,会锁表还是锁行还是其他。

select for update 含义

select查询语句是不会加锁的,但是select for update除了有查询的作用外,还会加锁呢,而且它是悲观锁哦。至于加了是行锁还是表锁,这就要看是不是用了索引/主键啦。 没用索引/主键的话就是表锁,否则就是是行锁。

16. MySQL事务得四大特性以及实现原理

  • 原子性: 事务作为一个整体被执行,包含在其中的对数据库的操作要么全部被执行,要么都不执行

  • 一致性:指在事务开始之前和事务结束以后,数据不会被破坏,假如A账户给B账户转10块钱,不管成功与否,A和B的总金额是不变的。

  • 隔离性:
    多个事务并发访问时,事务之间是相互隔离的,即一个事务不影响其它事务运行效果。简言之,就是事务之间是进水不犯河水的。

  • 持久性:表示事务完成以后,该事务对数据库所作的操作更改,将持久地保存在数据库之中。

事务ACID特性的实现思想

  • 原子性:是使用 undo log来实现的,如果事务执行过程中出错或者用户执行了rollback,系统通过undo log日志返回事务开始的状态。
  • 持久性:使用 redo log来实现,只要redo log日志持久化了,当系统崩溃,即可通过redo log把数据恢复。
  • 隔离性:通过锁以及MVCC,使事务相互隔离开。
  • 一致性:通过回滚、恢复,以及并发情况下的隔离性,从而实现一致性。

17. 如果某个表有近千万数据,CRUD比较慢,如何优化。

分库分表
某个表有近千万数据,可以考虑优化表结构,分表(水平分表,垂直分表),当然,你这样回答,需要准备好面试官问你的分库分表相

你可能感兴趣的:(mysql,redis,数据库,c++,linux)