2020校招学习之路分享----MySQL面试总结

文章目录

  • 零:前言
  • 一:索引相关
      • 1. 什么是索引?
      • 2. 索引是个什么样的数据结构呢?
      • 3. Hash索引和B+树所有有什么区别或者说优劣呢?
      • 4. 上面提到了B+树在满足聚簇索引和覆盖索引的时候不需要回表查询数据,什么是聚簇索引?
      • 5. 非聚簇索引一定会回表查询吗?
      • 6. 在建立索引的时候,都有哪些需要考虑的因素呢?
      • 7. 联合索引是什么?为什么需要注意联合索引中的顺序?
      • 8. 创建的索引有没有被使用到?或者说怎么才可以知道这条语句运行很慢的原因?
      • 9. 那么在哪些情况下会发生针对该列创建了索引但是在查询的时候并没有使用呢?
      • 10 索引的好处和坏处
      • 11 什么时候使用索引呢?
      • 12.索引的类型
      • 13.MyISAM 索引与 InnoDB 索引的区别?
      • 14.补充(进大厂的同学需观看)
  • 二:事务相关
      • 1. 什么是事务?
      • 2. ACID是什么?可以详细说一下吗?
      • 3. 同时有多个事务在进行会怎么样呢?(并发情况下事务问题)
      • 4. 怎么解决这些问题呢?MySQL的事务隔离级别了解吗?
      • 5. Innodb使用的是哪种隔离级别呢?
      • 6. 对MySQL的锁了解吗?
      • 7. MySQL都有哪些锁呢?像上面那样子进行锁定岂不是有点阻碍并发效率了?
      • 8.InnoDB对死锁的处理
      • 9.乐观锁和悲观锁
  • 三:表结构设计
      • 1. 为什么要尽量设定一个主键?
      • 2. 主键使用自增ID还是UUID?
      • 3. 字段为什么要求定义为not null?
      • 4. 如果要存储用户的密码散列,应该使用什么字段进行存储?
  • 四:存储引擎相关
      • 1. MySQL支持哪些存储引擎?
      • 2.说一下MySQL的引擎(了解即可)
      • 3.InnoDB和MyISAM有什么区别?
      • 4.补充(面试中碰到的一些细节问题,透露给大家)
  • 五:零散问题常问知识点总结
      • 1. 说一说三个范式
      • 2.反模式
      • 3. MySQL中的varchar和char有什么区别.
      • 4.关系型数据库和非关系型数据库的区别
      • 5.一条sql语句如何在mysql中执行
      • 6.聊一聊MySQL的查询优化
      • 7.优化distinct
      • 8.SQL语言包括哪几部分?每部分都有哪些操作关键字?
      • 9.完整性约束包括哪些?
      • 10.介绍一下mysql的三种删除操作
      • 11.还有一些高频小问题
  • 六:零散基础问题(有些不重要,看看即可)
      • 1. varchar(10)和int(10)代表什么含义?
      • 2.什么是视图
      • 3. MySQL的binlog有有几种录入格式?分别有什么区别?
      • 4. 超大分页怎么处理?
      • 5. 关心过业务系统里面的sql耗时吗?统计过慢查询吗?对慢查询都怎么优化过?
      • 6. 什么是存储过程?有哪些优缺点?
      • 7.什么是触发器
  • 题外话

零:前言

先向大家道个歉,因为个人碰到了一些不开心的事情加上实习在学新东西所以延期更新此篇了。本文主要受众为开发人员(后台开发),所以不涉及到MySQL的服务部署等更加详细的操作和原理内容;照顾到某些原理基础差的同学,部分内容杨妈妈会啰嗦一些解释清楚,所以内容较多,大家准备好耐心和瓜子矿泉水.。

之前相信大家已经系统的学习了一下MySQL,也有一些实际操作经验,但是笔试代码能力过关了却不代表面试可行, 因为面试的知识点需要串联起来且有一部分的原理内容扩展, 因此为大家写了面试篇应付面试(任何涉及到数据操作的公司都会有mysql面试的环节,只是面试占比不同,希望大家好好学习)
此文不会事无巨细的从select的用法开始讲解mysql,主要针对的是开发人员需要知道的一些MySQL的知识点,主要包括索引,事务,优化等方面,以在面试中高频的问句形式给出答案.,还有一点很重要: 基础较差的同学先要记住,有了一定基础之后一定要花费一点时间把某些原理搞清楚,可以上mysql官网查看一些原理的基础。

一定要知道,记住背下来的一定会在面试中露馅,一定要花点时间去搞清楚不理解的地方,基础差的同学就先记住,面试问道不回了的如实说自己没有深入研究或者老师没有讲自己以为不重要没有深入学习

还有,这是我个人的思路理解,大家面试时根据个人的思路来回答就行啦

一:索引相关

.是一个比较高频的面试方向,希望大家好好理解

1. 什么是索引?

类似于书籍的目录,索引就是一种数据结构,可以帮助我们快速的进行数据的查找.

2. 索引是个什么样的数据结构呢?

索引的数据结构和具体存储引擎的实现有关, 在MySQL中使用较多的索引有Hash索引,B+树索引等,而我们经常使用的InnoDB存储引擎的默认索引实现为:B+树索引.

3. Hash索引和B+树所有有什么区别或者说优劣呢?

首先要知道Hash索引和B+树索引的底层实现原理:
(我先叙述我个人理解,不要死记硬背,一定要理解,这里面试官很容易深问)

hash索引底层就是hash表,进行查找时,调用一次hash函数就可以获取到相应的键值,之后进行回表查询获得实际数据.B+树底层实现是多路平衡查找树.对于每一次的查询都是从根节点出发,查找到叶子节点方可以获得所查键值,然后根据查询判断是否需要回表查询数据.

那么可以看出他们有以下的不同:

hash索引进行等值查询更快(一般情况下),但是却无法进行范围查询.
因为在hash索引中经过hash函数建立索引之后,索引的顺序与原顺序无法保持一致,不能支持范围查询.而B+树的的所有节点皆遵循(左节点小于父节点,右节点大于父节点,多叉树也类似),天然支持范围.

hash索引不支持使用索引进行排序,原理同上.
hash索引不支持模糊查询以及多列索引的最左前缀匹配.原理也是因为hash函数的不可预测.AAAA和AAAAB的索引没有相关性.
hash索引任何时候都避免不了回表查询数据,而B+树在符合某些条件(聚簇索引,覆盖索引等)的时候可以只通过索引完成查询.
hash索引虽然在等值查询上较快,但是不稳定.性能不可预测,当某个键值存在大量重复的时候,发生hash碰撞,此时效率可能极差.而B+树的查询效率比较稳定,对于所有的查询都是从根节点到叶子节点,且树的高度较低.
因此,在大多数情况下,直接选择B+树索引可以获得稳定且较好的查询速度.而不需要使用hash索引.

4. 上面提到了B+树在满足聚簇索引和覆盖索引的时候不需要回表查询数据,什么是聚簇索引?

在B+树的索引中,叶子节点可能存储了当前的key值,也可能存储了当前的key值以及整行的数据,这就是聚簇索引和非聚簇索引. 在InnoDB中,只有主键索引是聚簇索引,如果没有主键,则挑选一个唯一键建立聚簇索引.如果没有唯一键,则隐式的生成一个键来建立聚簇索引.

当查询使用聚簇索引时,在对应的叶子节点,可以获取到整行数据,因此不用再次进行回表查询.

5. 非聚簇索引一定会回表查询吗?

不一定,这涉及到查询语句所要求的字段是否全部命中了索引,如果全部命中了索引,那么就不必再进行回表查询.

举个简单的例子,假设我们在员工表的年龄上建立了索引,那么当进行select age from employee where age < 20的查询时,在索引的叶子节点上,已经包含了age信息,不会再次进行回表查询.

6. 在建立索引的时候,都有哪些需要考虑的因素呢?

建立索引的时候一般要考虑到字段的使用频率,经常作为条件进行查询的字段比较适合.如果需要建立联合索引的话,还需要考虑联合索引中的顺序.此外也要考虑其他方面,比如防止过多的所有对表造成太大的压力.这些都和实际的表结构以及查询方式有关.

7. 联合索引是什么?为什么需要注意联合索引中的顺序?

MySQL可以使用多个字段同时建立一个索引,叫做联合索引.在联合索引中,如果想要命中索引,需要按照建立索引时的字段顺序挨个使用,否则无法命中索引.

具体原因为:

MySQL使用索引时需要索引有序,假设现在建立了"name,age,school"的联合索引,那么索引的排序为: 先按照name排序,如果name相同,则按照age排序,如果age的值也相等,则按照school进行排序.

当进行查询时,此时索引仅仅按照name严格有序,因此必须首先使用name字段进行等值查询,之后对于匹配到的列而言,其按照age字段严格有序,此时可以使用age字段用做索引查找,以此类推.因此在建立联合索引的时候应该注意索引列的顺序,一般情况下,将查询需求频繁或者字段选择性高的列放在前面.此外可以根据特例的查询或者表结构进行单独的调整.

8. 创建的索引有没有被使用到?或者说怎么才可以知道这条语句运行很慢的原因?

MySQL提供了explain命令来查看语句的执行计划,MySQL在执行某个语句之前,会将该语句过一遍查询优化器,之后会拿到对语句的分析,也就是执行计划,其中包含了许多信息. 可以通过其中和索引有关的信息来分析是否命中了索引,例如possilbe_key,key,key_len等字段,分别说明了此语句可能会使用的索引,实际使用的索引以及使用的索引长度.

9. 那么在哪些情况下会发生针对该列创建了索引但是在查询的时候并没有使用呢?

使用不等于查询,
列参与了数学运算或者函数
在字符串like时左边是通配符.类似于’%aaa’.
当mysql分析全表扫描比使用索引快的时候不使用索引.
当使用联合索引,前面一个条件为范围查询,后面的即使符合最左前缀原则,也无法使用索引.
以上情况,MySQL无法使用索引.

10 索引的好处和坏处

先说一下索引的好处:
提高数据的检索速度,降低数据库IO成本;索引会降数据排好序,降低了数据排序的成本;通过使用索引可以在查询的过程中优化使用隐藏器提高系统的性能。
再来索引的缺点:
创建索引和维护索引需要消耗时间,且由数据量决定,数据量很大时间更长;索引会占用一定的物理空间,若建立聚簇索引会更大,对数据进行增删改需要维护索引占用一定空间和效率。

11 什么时候使用索引呢?

不适用场景:在查询很少或参考的字段(属性),数据量比较小,修改性能远远大于检索性能时,
使用 场景:全表扫描效率更高时;中大型的表查询;增删改操作较少,查询操作较多时。

12.索引的类型

索引,都是实现在存储引擎层的。主要有六种类型:

1、普通索引:最基本的索引,没有任何约束。
2、唯一索引:与普通索引类似,但具有唯一性约束。
3、主键索引:特殊的唯一索引,不允许有空值。
4、复合索引:将多个列组合在一起创建索引,可以覆盖多个列。
5、外键索引:只有InnoDB类型的表才可以使用外键索引,保证数据的一致性、完整性和实现级联操作。
6、全文索引:MySQL 自带的全文索引只能用于 InnoDB、MyISAM ,并且只能对英文进行全文检索,一般使用全文索引引擎。

13.MyISAM 索引与 InnoDB 索引的区别?

  • InnoDB 索引是聚簇索引,MyISAM 索引是非聚簇索引。
  • InnoDB 的主键索引的叶子节点存储着行数据,因此主键索引非常高效。
  • MyISAM 索引的叶子节点存储的是行数据地址,需要再寻址一次才能得到数据。
  • InnoDB 非主键索引的叶子节点存储的是主键和其他带索引的列数据,因此查询时做到覆盖索引会非常高效。

14.补充(进大厂的同学需观看)

MySQL的索引原理比较深,想要去BAT大厂的同学需要看一下相关原理,这里给大家介绍一下我观看的链接http://blog.codinglabs.org/articles/theory-of-mysql-index.html
https://blog.csdn.net/tongdanping/article/details/79878302

二:事务相关

1. 什么是事务?

理解什么是事务最经典的就是转账的例子,比较基础,相信大家也都了解,这里就不再说一边了.

事务是一系列的操作,他们要符合ACID特性.最常见的理解就是:事务中的操作要么全部成功,要么全部失败.但是只是这样还不够的.

2. ACID是什么?可以详细说一下吗?

A=Atomicity
原子性,就是上面说的,要么全部成功,要么全部失败.不可能只执行一部分操作.
C=Consistency
系统(数据库)总是从一个一致性的状态转移到另一个一致性的状态,不会存在中间状态.
I=Isolation
隔离性: 通常来说:一个事务在完全提交之前,对其他事务是不可见的.注意前面的通常来说加了红色,意味着有例外情况.
D=Durability
持久性,一旦事务提交,那么就永远是这样子了,哪怕系统崩溃也不会影响到这个事务的结果.

3. 同时有多个事务在进行会怎么样呢?(并发情况下事务问题)

多事务的并发进行一般会造成以下几个问题:
脏读: A事务读取到了B事务未提交的内容,而B事务后面进行了回滚.
不可重复读: 当设置A事务只能读取B事务已经提交的部分,会造成在A事务内的两次查询,结果竟然不一样,因为在此期间B事务进行了提交操作.
幻读: A事务读取了一个范围的内容,而同时B事务在此期间插入了一条数据.造成"幻觉".

4. 怎么解决这些问题呢?MySQL的事务隔离级别了解吗?

MySQL的四种隔离级别如下:
未提交读(READ UNCOMMITTED)
这就是上面所说的例外情况了,这个隔离级别下,其他事务可以看到本事务没有提交的部分修改.因此会造成脏读的问题(读取到了其他事务未提交的部分,而之后该事务进行了回滚).

这个级别的性能没有足够大的优势,但是又有很多的问题,因此很少使用.

已提交读(不可重复读)(READ COMMITTED)
其他事务只能读取到本事务已经提交的部分.这个隔离级别有 不可重复读的问题,在同一个事务内的两次读取,拿到的结果竟然不一样,因为另外一个事务对数据进行了修改.

REPEATABLE READ(可重复读)
可重复读隔离级别解决了上面不可重复读的问题(看名字也知道),但是仍然有一个新问题,就是 幻读,当你读取id> 10 的数据行时,对涉及到的所有行加上了读锁,此时例外一个事务新插入了一条id=11的数据,因为是新插入的,所以不会触发上面的锁的排斥,那么进行本事务进行下一次的查询时会发现有一条id=11的数据,而上次的查询操作并没有获取到,再进行插入就会有主键冲突的问题.

SERIALIZABLE(可串行化)
这是最高的隔离级别,可以解决上面提到的所有问题,因为他强制将所以的操作串行执行,这会导致并发性能极速下降,因此也不是很常用.

5. Innodb使用的是哪种隔离级别呢?

InnoDB默认使用的是可重复读隔离级别.(mysql默认的隔离级别,串行化没必要)

6. 对MySQL的锁了解吗?

当数据库有并发事务的时候,可能会产生数据的不一致,这时候需要一些机制来保证访问的次序,锁机制就是这样的一个机制.

就像酒店的房间,如果大家随意进出,就会出现多人抢夺同一个房间的情况,而在房间上装上锁,申请到钥匙的人才可以入住并且将房间锁起来,其他人只有等他使用完毕才可以再次使用.

7. MySQL都有哪些锁呢?像上面那样子进行锁定岂不是有点阻碍并发效率了?

从锁的类别上来讲,有共享锁和排他锁.
共享锁: 又叫做读锁. 当用户要进行数据的读取时,对数据加上共享锁.共享锁可以同时加上多个.
排他锁: 又叫做写锁. 当用户要进行数据的写入时,对数据加上排他锁.排他锁只可以加一个,他和其他的排他锁,共享锁都相斥.

用上面的例子来说就是用户的行为有两种,一种是来看房,多个用户一起看房是可以接受的. 一种是真正的入住一晚,在这期间,无论是想入住的还是想看房的都不可以.

锁的粒度取决于具体的存储引擎,InnoDB实现了行级锁,页级锁,表级锁.

  • 共享锁/读锁:互不阻塞,优先级低
  • 排他锁/写锁:阻塞其他锁,优先级高,即确保在一个事务写入时不受其他事务的影响。
  • 锁粒度:锁定的数据量越少(粒度越小),并发程度越高,但相应的加锁、检测锁、释放锁用的系统开销也随之增大。
  • 锁策略:锁开销与数据安全性之间的平衡 主要两种:1 表锁:锁住整张表,读锁互不阻塞,写锁阻塞其他所有读写锁(同一张表)。开销最小。2 行级锁:对每一行数据(记录)加锁,开销大,并发程度高。

8.InnoDB对死锁的处理

此处死锁与OS死锁类似,多个事务互相持有对方所有要申请资源的锁不释放,造成环路死锁。MySQL InnoDB引擎检测到死锁循环依赖后,回滚持有最少行级锁的事务

9.乐观锁和悲观锁

先介绍一个乐观锁:
它指的是对数据被外界(包括本系统当前的其他事务,以及来自外部系统的事务处理)修改持保守态度, 因此,在整个数据处理过程中,将数据处于锁定状态。悲观锁的实现,往往依靠数据库提供的锁机制(也只有数据库层提供的锁机制才能真正保证数据访问的排他性,否则,即使在本系统中实现了加锁机制,也无法保证外部系统不会修改数据)。
在悲观锁的情况下,为了保证事务的隔离性,就需要一致性锁定读。 读取数据时给加锁,其它事务无法修改这些数据。修改删除数据时也要加锁,其它事务无法读取这些数据。
再来说一下乐观锁:
相对悲观锁而言,乐观锁机制采取了更加宽松的加锁机制。悲观锁大多数情况下依靠数据库的锁机制实现,以保证操作最大程度的独占性。但随之而来的就是数据库性能的大量开销,特别是对长事务而言,这样的开销往往无法承受。
而乐观锁机制在一定程度上解决了这个问题。乐观锁,大多是基于数据版本( Version )记录机制实现。何谓数据版本?即为数据增加一个版本标识,在基于数据库表的版本解决方案中,一般是通过为数据库表增加一个 “version” 字段来实现。读取出数据时,将此版本号一同读出,之后更新时,对此版本号加一。此时,将提交数据的版本数据与数据库表对应记录的当前版本信息进行比对,如果提交的数据版本号大于数据库表当前版本号,则予以更新,否则认为是过期数据。

三:表结构设计

1. 为什么要尽量设定一个主键?

主键是数据库确保数据行在整张表唯一性的保障,即使业务上本张表没有主键,也建议添加一个自增长的ID列作为主键.设定了主键之后,在后续的删改查的时候可能更加快速以及确保操作数据范围安全.

2. 主键使用自增ID还是UUID?

推荐使用自增ID,不要使用UUID.(如果看过我之前的笔试内容应该懂)

因为在InnoDB存储引擎中,主键索引是作为聚簇索引存在的,也就是说,主键索引的B+树叶子节点上存储了主键索引以及全部的数据(按照顺序),如果主键索引是自增ID,那么只需要不断向后排列即可,如果是UUID,由于到来的ID与原来的大小不确定,会造成非常多的数据插入,数据移动,然后导致产生很多的内存碎片,进而造成插入性能的下降.
总之,在数据量大一些的情况下,用自增主键性能会好一些.
关于主键是聚簇索引,如果没有主键,InnoDB会选择一个唯一键来作为聚簇索引,如果没有唯一键,会生成一个隐式的主键.

3. 字段为什么要求定义为not null?

MySQL官网这样介绍:
NULL columns require additional space in the rowto record whether their values are NULL. For MyISAM tables, each NULL columntakes one bit extra, rounded up to the nearest byte.
null值会占用更多的字节,且会在程序中造成很多与预期不符的情况.

4. 如果要存储用户的密码散列,应该使用什么字段进行存储?

密码散列,盐,用户身份证号等固定长度的字符串应该使用char而不是varchar来存储,这样可以节省空间且提高检索效率.

四:存储引擎相关

1. MySQL支持哪些存储引擎?

MySQL支持多种存储引擎,比如InnoDB,MyISAM, Memory,Archive等等.在大多数的情况下,直接选择使用InnoDB引擎都是最合适的,InnoDB也是MySQL的默认存储引擎.

2.说一下MySQL的引擎(了解即可)

因为这个我个人没有理解,没有深入研究,大家自行百度吧就。

3.InnoDB和MyISAM有什么区别?

2020校招学习之路分享----MySQL面试总结_第1张图片

4.补充(面试中碰到的一些细节问题,透露给大家)

为什么 SELECT COUNT() FROM table 在 InnoDB 比 MyISAM 慢?
对于 SELECT COUNT() FROM table 语句,在没有 WHERE 条件的情况下,InnoDB 比 MyISAM 可能会慢很多,尤其在大表的情况下。因为,InnoDB 是去实时统计结果,会全表扫描;而 MyISAM 内部维持了一个计数器,预存了结果,所以直接返回即可。
说说InnoDB的4大特性(华为二面时问到的,我也不会但是给大家百度了一下)

  • 插入缓冲(insert buffer)
  • 二次写(double write)
  • 自适应哈希索引(ahi)
  • 预读(read ahead)

五:零散问题常问知识点总结

1. 说一说三个范式

第一范式: 每个列都不可以再拆分(属性不可分). 第二范式: 非主键列完全依赖于主键,而不能是依赖于主键的一部分(主键依赖性). 第三范式: 非主键列只依赖于主键,不依赖于其他非主键(传递依赖性

2.反模式

范式可以避免数据冗余,减少数据库的空间,减轻维护数据完整性的麻烦。然而,通过数据库范式化设计,将导致数据库业务涉及的表变多,并且可能需要将涉及的业务表进行多表连接查询,这样将导致性能变差,且不利于分库分表。因此,出于性能优先的考量,可能在数据库的结构中需要使用反模式的设计,即空间换取时间,采取数据冗余的方式避免表之间的关联查询。至于数据一致性问题,因为难以满足数据强一致性,一般情况下,使存储数据尽可能达到用户一致,保证系统经过一段较短的时间的自我恢复和修正,数据最终达到一致
需要谨慎使用反模式设计数据库。一般情况下,尽可能使用范式化的数据库设计,因为范式化的数据库设计能让产品更加灵活,并且能在数据库层保持数据完整性。

3. MySQL中的varchar和char有什么区别.

这个大家如果仔细观看了我之前的文章很容易就答出来,但是还是总结一下吧,给新来的小盆友。
char是一个定长字段,假如申请了char(10)的空间,那么无论实际存储多少内容.该字段都占用10个字符,而varchar是变长的,也就是说申请的只是最大长度,占用的空间为实际字符长度+1,最后一个字符存储使用了多长的空间.
在检索效率上来讲,char > varchar,因此在使用中,如果确定某个字段的值的长度,可以使用char,否则应该尽量使用varchar.例如存储用户MD5加密后的密码,则应该使用char.

4.关系型数据库和非关系型数据库的区别

很简单的啦,这里制作一个表格方便大家直观了解
2020校招学习之路分享----MySQL面试总结_第2张图片

5.一条sql语句如何在mysql中执行

这一个问题比较热门(研发的需要了解一下,这是我实习公司数据库程序员面试的时候问的),给大家一个github的大佬的链接
https://github.com/Snailclimb/JavaGuide/blob/master/docs/database/%E4%B8%80%E6%9D%A1sql%E8%AF%AD%E5%8F%A5%E5%9C%A8mysql%E4%B8%AD%E5%A6%82%E4%BD%95%E6%89%A7%E8%A1%8C%E7%9A%84.md
还有我个人的理解:

  • 客户端发送查询到服务器;
  • 服务器检查查询缓存query 大小写敏感的哈希查找,常数时间)。如果命中,返回缓存中的结果,否则下一步;
  • 解析语句,生成执行计划;(SQL解析,预处理,优化器生成执行计划);
  • 根据执行计划,根据存储引擎的不同调用API,执行查询(一棵指令树);
  • 结果返回客户端

6.聊一聊MySQL的查询优化

这个不是常考点,但是挺有意思的,就给大家放在这里了。给一个大佬的链接:https://www.jianshu.com/p/ab958a4823d1

7.优化distinct

distinct在所有列上转换为group by,并与order by结合使用

8.SQL语言包括哪几部分?每部分都有哪些操作关键字?

SQL语言包括数据定义(DDL)、数据操纵(DML),数据控制(DCL)和数据查询(DQL)四个部分。
数据定义:Create Table,Alter Table,Drop Table, Craete/Drop Index等
数据操纵:Select ,insert,update,delete,
数据控制:grant,revoke
数据查询:select

9.完整性约束包括哪些?

实体完整性、域完整性、参照完整性、用户定义的完整性(比较基础,就不详细解释了)

10.介绍一下mysql的三种删除操作

就是三个关键字:drop、deete、truncate
区别:

  • delete和truncate只删除表的数据不删除表的结构。
  • 速度的话,是drop>truncate>delete
    drop和truncate都是dll,操作立即生效,不能回滚,操作不触发trigger。delete是dml,事务提交之后才会生效,如果有相应的trigger,执行的时候也会触发。

使用场景:
不再需要表时,用drop;
删除部分数据,用带where的delete;
保留表而删除所有数据时用truncate;

11.还有一些高频小问题

像如何只显示查询数据的前十行啊、null的具体含义啊、左外连接和内联区别啊,大家只需仔细观看我之前的笔试总结就会拉,一定要仔细观看哦

六:零散基础问题(有些不重要,看看即可)

1. varchar(10)和int(10)代表什么含义?

varchar的10代表了申请的空间长度,也是可以存储的数据的最大长度,而int的10只是代表了展示的长度,不足10位以0填充.也就是说,int(1)和int(10)所能存储的数字大小以及占用的空间都是相同的,只是在展示时按照长度展示.

2.什么是视图

视图是一个虚表,它的行列数据是从别的基础表中获得的,某几个字段可能来自于基础表A,某几个字段可能来自于基础表B。操作视图的时候,实际上操作的就是基础表。视图整个的建立和删除不影响基础表,而对视图内容的删除、增加、修改直接影响基本表。当视图来自于多个基本表时,不允许删除和增加数据。视图在物理上是不存在的,数据库系统没有专门的位置为视图存储数据,视图的数据来源于查询语句。

视图的作用:

提高了sql语句的复用性,就像一个函数;对数据库进行了重构,却不影响程序的运行;针对不同用户来说,提高了安全性能;

3. MySQL的binlog有有几种录入格式?分别有什么区别?

有三种格式,statement,row和mixed.
statement模式下,记录单元为语句.即每一个sql造成的影响会记录.由于sql的执行是有上下文的,因此在保存的时候需要保存相关的信息,同时还有一些使用了函数之类的语句无法被记录复制.
row级别下,记录单元为每一行的改动,基本是可以全部记下来但是由于很多操作,会导致大量行的改动(比如alter table),因此这种模式的文件保存的信息太多,日志量太大.
mixed. 一种折中的方案,普通操作使用statement记录,当无法使用statement的时候使用row.
此外,新版的MySQL中对row级别也做了一些优化,当表结构发生变化的时候,会记录语句而不是逐行记录.

4. 超大分页怎么处理?

超大的分页一般从两个方向上来解决.
数据库层面,这也是我们主要集中关注的(虽然收效没那么大),类似于select * from table where age > 20 limit 1000000,10这种查询其实也是有可以优化的余地的. 这条语句需要load1000000数据然后基本上全部丢弃,只取10条当然比较慢. 当时我们可以修改为select * from table where id in (select id from table where age > 20 limit 1000000,10).这样虽然也load了一百万的数据,但是由于索引覆盖,要查询的所有字段都在索引中,所以速度会很快. 同时如果ID连续的好,我们还可以select * from table where id > 1000000 limit 10,效率也是不错的,优化的可能性有许多种,但是核心思想都一样,就是减少load的数据.
从需求的角度减少这种请求….主要是不做类似的需求(直接跳转到几百万页之后的具体某一页.只允许逐页查看或者按照给定的路线走,这样可预测,可缓存)以及防止ID泄漏且连续被人恶意攻击.
解决超大分页,其实主要是靠缓存,可预测性的提前查到内容,缓存至redis等k-V数据库中,直接返回即可.

在阿里巴巴《Java开发手册》中,对超大分页的解决办法是类似于上面提到的第一种.

5. 关心过业务系统里面的sql耗时吗?统计过慢查询吗?对慢查询都怎么优化过?

在业务系统中,除了使用主键进行的查询,其他的我都会在测试库上测试其耗时,慢查询的统计主要由运维在做,会定期将业务中的慢查询反馈给我们.
慢查询的优化首先要搞明白慢的原因是什么? 是查询条件没有命中索引?是load了不需要的数据列?还是数据量太大?
所以优化也是针对这三个方向来的,
首先分析语句,看看是否load了额外的数据,可能是查询了多余的行并且抛弃掉了,可能是加载了许多结果中并不需要的列,对语句进行分析以及重写.
分析语句的执行计划,然后获得其使用索引的情况,之后修改语句或者修改索引,使得语句可以尽可能的命中索引.
如果对语句的优化已经无法进行,可以考虑表中的数据量是否太大,如果是的话可以进行横向或者纵向的分表.

6. 什么是存储过程?有哪些优缺点?

存储过程是一些预编译的SQL语句。1、更加直白的理解:存储过程可以说是一个记录集,它是由一些T-SQL语句组成的代码块,这些T-SQL语句代码像一个方法一样实现一些功能(对单表或多表的增删改查),然后再给这个代码块取一个名字,在用到这个功能的时候调用他就行了。2、存储过程是一个预编译的代码块,执行效率比较高,一个存储过程替代大量T_SQL语句 ,可以降低网络通信量,提高通信速率,可以一定程度上确保数据安全

但是,在互联网项目中,其实是不太推荐存储过程的,比较出名的就是阿里的《Java开发手册》中禁止使用存储过程,我个人的理解是,在互联网项目中,迭代太快,项目的生命周期也比较短,人员流动相比于传统的项目也更加频繁,在这样的情况下,存储过程的管理确实是没有那么方便,同时,复用性也没有写在服务层那么好.

7.什么是触发器

触发器是监听某种情况,触发某种操作。
创建触发器有四元素:一个监听地点(table)、一个监听事件(insert、update、delete)、一个触发时间(before、after)、一个触发事件(insert、delete、update)。
触发器是数据库对象之一,与函数非常类似,需要声明、执行。但是触发器的执行是由事件来触发的。
当表发生更改时,需要自动进行一些处理,比如每增加一条学生的记录,学生的总数就需要同时改变,这时候就要执行一次计算学生总数的操作。
触发器的操作包括创建触发器、查看触发器及删除触发器。

题外话

没错,大家熟悉的卑微小编环节又来了,因为编写量和个人生活问题,时间很紧凑,给大家总结的有一些缺陷但是相对还是不错的,MySQL的篇章到此为止,如果喜欢,就给小编点个赞各一个关注哦!之后的计算机基础知识会免费分享个大家,但是最为重要的算法和数据结构的总结因为个人是买了众多资料,花费大量时间总结,所以将开放权限给关注我的人,或者支付一定C币,大家如果觉得可以关注一下就行啦,免费给粉丝观看的呢

你可能感兴趣的:(mysql,mysql,数据库)