柚几哥哥

MySQL 大厂面试题总结（2023最新版）

文章目录

- 1、索引
- - 1.1 简介
  - 1.2 索引的数据结构为什么是B+Tree和HASH？
  - - 1.2.1 二叉树
    - 1.2.2 红黑树
    - 1.2.3 B-Tree
    - 1.2.4 B+Tree(B-Tree变种)
    - 1.2.5 Hash
  - 1.3 索引的类型
  - - 1.3.1 MySQL的存储引擎
    - - 1.3.1.1 InnoDB存储引擎索引实现(聚集)
      - 1.3.1.2 MyISAM存储引擎索引实现(非聚集)
    - 1.3.1.3 联合索引
  - 1.4 索引使用的情况
  - 1.4.1 EXPLAIN关键字
  - 1.5 索引失效的情况
  - - 1.5.1 为什么主键要设置成自增的？
    - 1.5.2 建表上的优化
    - 1.5.3 索引失效的案例
- 2、建表规约（阿里巴巴开发手册）
- - 2.1【强制】表达是与否概念的字段，必须使用 is_xxx 的方式命名，数据类型是 unsigned tinyint（1 表示是，0 表示否）。
  - 2.2【强制】表名、字段名必须使用小写字母或数字，禁止出现数字开头，禁止两个下划线中间只出现数字。数据库字段名的修改代价很大，因为无法进行预发布，所以字段名称需要慎重考虑。
  - 2.3【强制】表名不使用复数名词。
  - 2.4【强制】禁用保留字，如 desc、range、match、delayed 等，请参考 MySQL 官方保留字。
  - 2.5【强制】主键索引名为 pk_字段名；唯一索引名为 uk_字段名；普通索引名则为 idx_字段名。
  - 2.6【强制】小数类型为 decimal，禁止使用 float 和 double。
  - 2.7【强制】如果存储的字符串长度几乎相等，使用 char 定长字符串类型。
  - 2.8【强制】varchar 是可变长字符串，不预先分配存储空间，长度不要超过 5000，如果存储长度大于此值，定义字段类型为 text，独立出来一张表，用主键来对应，避免影响其它字段索引效率。
  - 2.9【强制】表必备三字段：id, gmt_create, gmt_modified。
  - 2.10【推荐】表的命名最好是遵循“业务名称_表的作用”。
  - 2.11.【推荐】库名与应用名称尽量一致。
  - 2.12【推荐】如果修改字段含义或对字段表示的状态追加时，需要及时更新字段注释。
  - 2.13【推荐】字段允许适当冗余，以提高查询性能，但必须考虑数据一致。冗余字段应遵循：
  - 2.14【推荐】单表行数超过 500 万行或者单表容量超过 2GB，才推荐进行分库分表。
  - 2.15【参考】合适的字符存储长度，不但节约数据库表空间、节约索引存储，更重要的是提升检索速度。
- 3、索引规约（阿里巴巴开发手册）
- - 3.1【强制】业务上具有唯一特性的字段，即使是组合字段，也必须建成唯一索引。
  - 3.2【强制】超过三个表禁止 join。需要 join 的字段，数据类型保持绝对一致；多表关联查询时，保证被关联的字段需要有索引。
  - 3.3【强制】在 varchar 字段上建立索引时，必须指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度。
  - 3.4【强制】页面搜索严禁左模糊或者全模糊，如果需要请走搜索引擎来解决。
  - 3.5【推荐】如果有 order by 的场景，请注意利用索引的有序性。order by 最后的字段是组合索
  - 3.6【推荐】利用覆盖索引来进行查询操作，避免回表。
  - 3.7【推荐】利用延迟关联或者子查询优化超多分页场景。
  - 3.8【推荐】SQL 性能优化的目标：至少要达到 range 级别，要求是 ref 级别，如果可以是 consts最好。
  - 3.9【推荐】建组合索引的时候，区分度最高的在最左边。
  - 3.10【推荐】防止因字段类型不同造成的隐式转换，导致索引失效。
  - 3.11【参考】创建索引时避免有如下极端误解：
- 4、SQL语句（阿里巴巴开发手册）
- - 4.1【强制】不要使用 count(列名)或 count(常量)来替代 count(*)，count(*)是 SQL92 定义的标准统计行数的语法，跟数据库无关，跟 NULL 和非 NULL 无关。
  - 4.2【强制】count(distinct col) 计算该列除 NULL 之外的不重复行数，注意 count(distinct col1, col2) 如果其中一列全为 NULL，那么即使另一列有不同的值，也返回为 0。
  - 4.3【强制】当某一列的值全是 NULL 时，count(col)的返回结果为 0，但 sum(col)的返回结果为NULL，因此使用 sum()时需注意 NPE 问题。
  - 4.4【强制】使用 ISNULL()来判断是否为 NULL 值。
  - 4.5【强制】代码中写分页查询逻辑时，若 count 为 0 应直接返回，避免执行后面的分页语句。
  - 4.6【强制】不得使用外键与级联，一切外键概念必须在应用层解决。
  - 4.7【强制】禁止使用存储过程，存储过程难以调试和扩展，更没有移植性。
  - 4.8【强制】数据订正（特别是删除或修改记录操作）时，要先 select，避免出现误删除，确认无误才能执行更新语句。Java 开发手册
  - 4.9【强制】对于数据库中表记录的查询和变更，只要涉及多个表，都需要在列名前加表的别名（或表名）进行限定。
  - 4.10【推荐】SQL 语句中表的别名前加 as，并且以 t1、t2、t3、...的顺序依次命名。
  - 4.11【推荐】in 操作能避免则避免，若实在避免不了，需要仔细评估 in 后边的集合元素数量，控制在 1000 个之内。
  - 4.12 【参考】因国际化需要，所有的字符存储与表示，均采用 utf8 字符集，那么字符计数方法需要注意。
- 5、什么是Buffer Pool
- - 1.1 基本概念
  - 1.2 大小
  - 1.3 作用：
  - 1.4 如何判断一个页是否在BufferPool中缓存？
- 6、InnoDB如何管理Page页
- - 6.1 Page页分类
  - 6.2 通过三种链表结构来维护和管理
  - - 6.2.1 free list：表示空闲缓冲区，
    - 6.2.2 flush list：表示需要刷新到磁盘的缓冲区，
    - 6.2.2 lru list：表示正在使用的缓冲区
- 7、为什么写缓冲区，仅适用于非唯一普通索引页？
- - 7.1 change Buffer 基本概念
  - 7.2 作用
  - 7.3 change Buffer 的更新流程
  - 7.4 写缓冲区，仅适用于非唯一普通索引页，为什么？
- 8、MySQL为什么改进LRU算法？
- - 8.1 普通LRU算法：
  - 8.2 普通LRU算法的优缺点
  - 8.3 改进LRU算法
  - 8.4 冷数据区的数据什么时候会被转到热数据区呢？
- 9、使用索引一定可以提升效率吗？
- - 9.1 本质
  - 9.2 索引的优缺点
  - - 优点：
    - 缺点：
    - 创建索引的原则：
- 10、索引有哪几种类型？
- - 10.1 普通索引
  - 10.2 唯一索引
  - 10.3 主键索引
  - 10.4 复合索引（组合索引）
  - 10.5 全文索引
- 11、什么是索引下推？
- - 11.1 引入前
  - 11.2 引入后
- 12、什么是自适应哈希索引？
- - 12.1 本质
  - 12.2 特性
- 13、为什么LIKE以"%"开头索引会失效？
- - 13.1 场景：
  - 13.2 解决%出现在左边索引失效的方法，使用覆盖索引
  - 13.3 like失效的原因
- 14、InnoDB与MyISAM的区别
- - 14.1 事务和外键
  - 14.2 锁机制
  - 14.3 索引结构
  - 14.4 并发处理能力
  - 14.5 存储文件
  - 14.6 InnoDB适用场景
  - 14.7 MyISAM适用场景
- 15、说一说三个范式？
- 16、MySQL的事务
- - 16.1 ACID事务的特性
  - 16.2 并发事务带来了哪些问题？
  - 16.3 MySQL的四种隔离级别
- 17、MySQL视图
- - 17.1 为什么要使用视图？什么是视图？
  - 17.2 视图有哪些特点？
  - 17.3 视图的使用场景
  - 17.4 视图的优缺点
  - - 17.4.1 优点：
    - 17.4.2 缺点：
- 18、大表数据查询优化思路

1、索引

1.1 简介

索引是帮助MySQL高效获取数据的排好序的数据结构，相当于目录

每一个节点对应了一条数据，一个内存地址

1.2 索引的数据结构为什么是B+Tree和HASH？

1.2.1 二叉树

二叉树（Binary Tree）是有限个节点的集合，这个集合可以是空集，也可以是一个根节点和两颗不相交的子二叉树组成的集合，其中一颗树叫根的左子树，另一颗树叫右子树。所以二叉树是一个递归地概念。

只有左子节点和右子节点，每次出现自增会一直往右延伸，变成链表。
高度会特别高，和磁盘做交互效率较慢，
索引按页来查询，每页相当于这里一排

1.2.2 红黑树

属于二叉树的一种，多了自平衡，层级会很高（树的深度会很深）交互会较频繁

而且每次自平衡，会有自身的一个重新排序，插入效率较低
红黑树的特性
（1）每个节点或者是黑色，或者是红色。
（2）根节点是黑色。
（3）每个叶子节点（NIL）是黑色。
（4）如果一个节点是红色的，则它的子节点必须是黑色的。[注意：这里叶子节点，是指为空(NIL)的虚节点！]
（5）从一个节点到该节点的子孙节点的所有路径上包含相同数目的黑节点。

1.2.3 B-Tree

叶节点具有相同的深度，叶节点的指针为空
所有索引元素不重复
节点中的数据索引从左到右递增排列节点中的数据索引从左到右递增排列
可以将数字看成自增的主键id，data相当于除主键之外的其他数据
每次加载一页的时候，需要把一整行数据(主键+其他数据)都加载到内存中，但我们其实不需要data
相对来说耗费IO和内存空间

1.2.4 B+Tree(B-Tree变种)

非叶子节点不存储data，只存储索引(冗余)，可以放更多的索引
叶子节点包含所有索引字段
叶子节点用指针连接，提高区间访问的性能
和内存交互的时候只需要将叶子结点的索引存储在内存中，
一个数字8b，指针4b，一页16K相当于16384b，可以存储1365+个
与数据库交互最多三次就能检索到你需要的数据在磁盘的哪个位置

1.2.5 Hash

对索引的key进行一次hash计算就可以定位出数据存储的位置
很多时候Hash索引要比B+ 树索引更高效，时间复杂度O1
仅能满足 “=”，“IN”，不支持范围查询（比如时间范围查询）
hash冲突问题

1.3 索引的类型

1.3.1 MySQL的存储引擎

1.3.1.1 InnoDB存储引擎索引实现(聚集)

表数据文件本身就是按B+Tree组织的一个索引结构文件
聚集索引-叶节点包含了完整的数据记录
为什么建议InnoDB表必须建主键，并且推荐使用整型的自增主键？（减少二级索引查找一级索引的过程）
我们设计完主键之后，会自动生成主键索引树Primary Key（哪怕没有设置主键，Mysql会自己找一个没有重复的字段作为主键）
为什么非主键索引结构叶子节点存储的是主键值？(一致性和节省存储空间)
我们在数据库中创建的索引都是二级索引，会通过我们创建的索引字段，找到一个id（一级索引的id），在通过这个id在主键索引中找数据（回表）

1.3.1.2 MyISAM存储引擎索引实现(非聚集)

MyISAM索引文件和数据文件是分离的(非聚集)

一个文件专门存储索引在另一个文件中的位置，检索较慢

1.3.1.3 联合索引

索引最左前缀原理：第一优先根据索引设置的时候字段顺序排序

1.4 索引使用的情况

1.4.1 EXPLAIN关键字

EXPLAIN SELECT	* FROM`user`WHERE id = 1

字段名	含义
id	sql的执行顺序
select_type	查询难度
table	表名
type	const(常量)、eqref(通过主键索引查找)、ref(通过非主键索引查找)、range(范围查询)、ALL(全表扫描)
possible_keys	可能用到的索引
key	真实用到的索引
key_len	索引的长度（用来判断索引的效率）
rows	行（索引扫的行数）

1.5 索引失效的情况

1.5.1 为什么主键要设置成自增的？

UUID：随机插入，所有索引在B+数中位置都需要重新排序，导致分裂，效率越来越慢，数据碎片化。

自增：在B+数的最后面存储，仅会影响到它的父节点。

1.5.2 建表上的优化

设计表字段类型
不同的int有不同的表示范围
根据表对应的业务场景，主键自增的趋势，用所占磁盘空间最小的类型
数字：

id一般使用bigint，如果仅需要表示几种状态，可以用tinyint（表示范围更小，占得空间也越小）

除了varchar，其他类型设置长度其实没有意义，所占内存是定长的
文字：

char和varchar的区别：char为定长，varchar是可变的

针对大量的文字时使用text/longtest类型存储，优化策略：垂直分表，将Test字段单独分出去，关联主表
时间：

datetime：都可以显示时分秒，占用空间更多

timestamp：都可以显示时分秒，占用空间更少，缺陷有默认数据范围，只能存放1979-2050年的数据

1.5.3 索引失效的案例

针对联合索引，要遵循最左前缀原则，
查询条件按照索引设置时字段的顺序
范围查询要在精准查询之后
使用like模糊查询时，尽量将%写在右侧

2、建表规约（阿里巴巴开发手册）

2.1【强制】表达是与否概念的字段，必须使用 is_xxx 的方式命名，数据类型是 unsigned tinyint（1 表示是，0 表示否）。

说明：任何字段如果为非负数，必须是 unsigned。

注意：POJO 类中的任何布尔类型的变量，都不要加 is 前缀，所以，需要在设置从 is_xxx 到

Xxx 的映射关系。数据库表示是与否的值，使用 tinyint 类型，坚持 is_xxx 的命名方式是为了明确其取值含

义与取值范围。

正例：表达逻辑删除的字段名 is_deleted，1 表示删除，0 表示未删除。

2.2【强制】表名、字段名必须使用小写字母或数字，禁止出现数字开头，禁止两个下划线中间只出现数字。数据库字段名的修改代价很大，因为无法进行预发布，所以字段名称需要慎重考虑。

说明：MySQL 在 Windows 下不区分大小写，但在 Linux 下默认是区分大小写。因此，数据库名、表名、

字段名，都不允许出现任何大写字母，避免节外生枝。

正例：aliyun_admin，rdc_config，level3_name

反例：AliyunAdmin，rdcConfig，level_3_name

2.3【强制】表名不使用复数名词。

说明：表名应该仅仅表示表里面的实体内容，不应该表示实体数量，对应于 DO 类名也是单数形式，符合

表达习惯。

2.4【强制】禁用保留字，如 desc、range、match、delayed 等，请参考 MySQL 官方保留字。

2.5【强制】主键索引名为 pk_字段名；唯一索引名为 uk_字段名；普通索引名则为 idx_字段名。

说明：pk_ 即 primary key；uk_ 即 unique key；idx_ 即 index 的简称。

2.6【强制】小数类型为 decimal，禁止使用 float 和 double。

说明：在存储的时候，float 和 double 都存在精度损失的问题，很可能在比较值的时候，得到不正确的

结果。如果存储的数据范围超过 decimal 的范围，建议将数据拆成整数和小数并分开存储。

2.7【强制】如果存储的字符串长度几乎相等，使用 char 定长字符串类型。

2.8【强制】varchar 是可变长字符串，不预先分配存储空间，长度不要超过 5000，如果存储长度大于此值，定义字段类型为 text，独立出来一张表，用主键来对应，避免影响其它字段索引效率。

2.9【强制】表必备三字段：id, gmt_create, gmt_modified。

说明：其中 id 必为主键，类型为 bigint unsigned、单表时自增、步长为 1。gmt_create, gmt_modified

的类型均为 datetime 类型，前者现在时表示主动式创建，后者过去分词表示被动式更新。Java 开发手册

2.10【推荐】表的命名最好是遵循“业务名称_表的作用”。

正例：alipay_task / force_project / trade_config

2.11.【推荐】库名与应用名称尽量一致。

2.12【推荐】如果修改字段含义或对字段表示的状态追加时，需要及时更新字段注释。

2.13【推荐】字段允许适当冗余，以提高查询性能，但必须考虑数据一致。冗余字段应遵循：

1）不是频繁修改的字段。
2）不是唯一索引的字段。
3）不是 varchar 超长字段，更不能是 text 字段。

正例：各业务线经常冗余存储商品名称，避免查询时需要调用 IC 服务获取。

2.14【推荐】单表行数超过 500 万行或者单表容量超过 2GB，才推荐进行分库分表。

说明：如果预计三年后的数据量根本达不到这个级别，请不要在创建表时就分库分表。

2.15【参考】合适的字符存储长度，不但节约数据库表空间、节约索引存储，更重要的是提升检索速度。

正例：无符号值可以避免误存负数，且扩大了表示范围。

对象	年龄区间	类型	字节	表示范围
人	150 岁之内	tinyint unsigned	1	无符号值：0 到 255
龟	数百岁	smallint unsigned	2	无符号值：0 到 65535
恐龙化石	数千万年	int unsigned	4	无符号值：0 到约 43 亿
太阳	约 50 亿年	bigint unsigned	8	无符号值：0 到约 10 的 19 次方

3、索引规约（阿里巴巴开发手册）

3.1【强制】业务上具有唯一特性的字段，即使是组合字段，也必须建成唯一索引。

说明：不要以为唯一索引影响了 insert 速度，这个速度损耗可以忽略，但提高查找速度是明显的；另外，

即使在应用层做了非常完善的校验控制，只要没有唯一索引，根据墨菲定律，必然有脏数据产生。

3.2【强制】超过三个表禁止 join。需要 join 的字段，数据类型保持绝对一致；多表关联查询时，保证被关联的字段需要有索引。

说明：即使双表 join 也要注意表索引、SQL 性能。

3.3【强制】在 varchar 字段上建立索引时，必须指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度。

说明：索引的长度与区分度是一对矛盾体，一般对字符串类型数据，长度为 20 的索引，区分度会高达 90%

以上，可以使用 count(distinct left(列名, 索引长度))/count(*)的区分度来确定。

3.4【强制】页面搜索严禁左模糊或者全模糊，如果需要请走搜索引擎来解决。

说明：索引文件具有 B-Tree 的最左前缀匹配特性，如果左边的值未确定，那么无法使用此索引。

3.5【推荐】如果有 order by 的场景，请注意利用索引的有序性。order by 最后的字段是组合索

引的一部分，并且放在索引组合顺序的最后，避免出现 file_sort 的情况，影响查询性能。

正例：where a=? and b=? order by c; 索引：a_b_c

反例：索引如果存在范围查询，那么索引有序性无法利用，如：WHERE a>10 ORDER BY b; 索引 a_b 无

法排序。

3.6【推荐】利用覆盖索引来进行查询操作，避免回表。

说明：如果一本书需要知道第 11 章是什么标题，会翻开第 11 章对应的那一页吗？目录浏览一下就好，这

个目录就是起到覆盖索引的作用。

正例：能够建立索引的种类分为主键索引、唯一索引、普通索引三种，而覆盖索引只是一种查询的一种效

果，用 explain 的结果，extra 列会出现：using index。

3.7【推荐】利用延迟关联或者子查询优化超多分页场景。

说明：MySQL 并不是跳过 offset 行，而是取 offset+N 行，然后返回放弃前 offset 行，返回 N 行，那当

offset 特别大的时候，效率就非常的低下，要么控制返回的总页数，要么对超过特定阈值的页数进行 SQL

改写。

正例：先快速定位需要获取的 id 段，然后再关联：

SELECT a.* FROM 表 1 a, (select id from 表 1 where 条件 LIMIT 100000,20 ) b where a.id=b.id

3.8【推荐】SQL 性能优化的目标：至少要达到 range 级别，要求是 ref 级别，如果可以是 consts最好。

说明：

1） consts 单表中最多只有一个匹配行（主键或者唯一索引），在优化阶段即可读取到数据。
2） ref 指的是使用普通的索引（normal index）。
3） range 对索引进行范围检索。

反例：explain 表的结果，type=index，索引物理文件全扫描，速度非常慢，这个 index 级别比较 range

还低，与全表扫描是小巫见大巫。

3.9【推荐】建组合索引的时候，区分度最高的在最左边。

正例：如果 where a=? and b=?，a 列的几乎接近于唯一值，那么只需要单建 idx_a 索引即可。

说明：存在非等号和等号混合判断条件时，在建索引时，请把等号条件的列前置。如：where c>? and d=?

那么即使 c 的区分度更高，也必须把 d 放在索引的最前列，即建立组合索引 idx_d_c。

3.10【推荐】防止因字段类型不同造成的隐式转换，导致索引失效。

3.11【参考】创建索引时避免有如下极端误解：

1）索引宁滥勿缺。认为一个查询就需要建一个索引。
2）吝啬索引的创建。认为索引会消耗空间、严重拖慢记录的更新以及行的新增速度。
3）抵制惟一索引。认为惟一索引一律需要在应用层通过“先查后插”方式解决。

4、SQL语句（阿里巴巴开发手册）

4.1【强制】不要使用 count(列名)或 count(常量)来替代 count()，count()是 SQL92 定义的标准统计行数的语法，跟数据库无关，跟 NULL 和非 NULL 无关。

说明：count(*)会统计值为 NULL 的行，而 count(列名)不会统计此列为 NULL 值的行。

4.2【强制】count(distinct col) 计算该列除 NULL 之外的不重复行数，注意 count(distinct col1, col2) 如果其中一列全为 NULL，那么即使另一列有不同的值，也返回为 0。

4.3【强制】当某一列的值全是 NULL 时，count(col)的返回结果为 0，但 sum(col)的返回结果为NULL，因此使用 sum()时需注意 NPE 问题。

正例：可以使用如下方式来避免 sum 的 NPE 问题：

SELECT IFNULL(SUM(column), 0) FROM table;

4.4【强制】使用 ISNULL()来判断是否为 NULL 值。

说明：NULL 与任何值的直接比较都为 NULL。

1） NULL<>NULL 的返回结果是 NULL，而不是 false。
2） NULL=NULL 的返回结果是 NULL，而不是 true。
3） NULL<>1 的返回结果是 NULL，而不是 true。

反例：在 SQL 语句中，如果在 null 前换行，影响可读性。

select * from table where column1 is null and column3 is not null;

而ISNULL(column)是一个整体，简洁易懂。从性能数据上分析，ISNULL(column)执行效率更快一些。

4.5【强制】代码中写分页查询逻辑时，若 count 为 0 应直接返回，避免执行后面的分页语句。

4.6【强制】不得使用外键与级联，一切外键概念必须在应用层解决。

说明：（概念解释）学生表中的 student_id 是主键，那么成绩表中的 student_id 则为外键。如果更新学生表中的 student_id，同时触发成绩表中的 student_id 更新，即为级联更新。外键与级联更新适用于单机低并发，不适合分布式、高并发集群；级联更新是强阻塞，存在数据库更新风暴的风险；外键影响数据库的插入速度。

4.7【强制】禁止使用存储过程，存储过程难以调试和扩展，更没有移植性。

4.8【强制】数据订正（特别是删除或修改记录操作）时，要先 select，避免出现误删除，确认无误才能执行更新语句。Java 开发手册

4.9【强制】对于数据库中表记录的查询和变更，只要涉及多个表，都需要在列名前加表的别名（或表名）进行限定。

说明：对多表进行查询记录、更新记录、删除记录时，如果对操作列没有限定表的别名（或表名），并且

操作列在多个表中存在时，就会抛异常。

正例：

select t1.name from table_first as t1 , table_second as t2 where t1.id=t2.id;

反例：在某业务中，由于多表关联查询语句没有加表的别名（或表名）的限制，正常运行两年后，最近在某个表中增加一个同名字段，在预发布环境做数据库变更后，线上查询语句出现出 1052 异常：Column ‘name’ in field list is ambiguous。

4.10【推荐】SQL 语句中表的别名前加 as，并且以 t1、t2、t3、…的顺序依次命名。

说明：

1）别名可以是表的简称，或者是根据表出现的顺序，以 t1、t2、t3 的方式命名。
2）别名前加 as使别名更容易识别。

正例：

select t1.name from table_first as t1, table_second as t2 where t1.id=t2.id;

4.11【推荐】in 操作能避免则避免，若实在避免不了，需要仔细评估 in 后边的集合元素数量，控制在 1000 个之内。

4.12 【参考】因国际化需要，所有的字符存储与表示，均采用 utf8 字符集，那么字符计数方法需要注意。

说明：
```
SELECT LENGTH("轻松工作")； 
```

返回为 12

SELECT CHARACTER_LENGTH("轻松工作")；

返回为 4
如果需要存储表情，那么选择 utf8mb4 来进行存储，注意它与 utf8 编码的区别。

【参考】TRUNCATE TABLE 比 DELETE 速度快，且使用的系统和事务日志资源少，但 TRUNCATE

无事务且不触发 trigger，有可能造成事故，故不建议在开发代码中使用此语句。

说明：TRUNCATE TABLE 在功能上与不带 WHERE 子句的 DELETE 语句相同。

5、什么是Buffer Pool

1.1 基本概念

缓冲池，也称BP。

由缓存数据页（Page）和对缓存数据页进行描述的控制块组成，

控制块中存储着对应缓存页的的所属的表空间、数据页的编号、以及对应缓存页在Buffer Pool中的地址等信息。

1.2 大小

默认128M，以Page页为单位，Page页默认大小16K

控制块的大小约为数据页的5%，大概800字节

1.3 作用：

缓存表数据与索引数据，减少磁盘IO，提升性能。

1.4 如何判断一个页是否在BufferPool中缓存？

Mysql中有一个哈希表数据结构，它使用表空间号+数据页号，作为一个key，然后缓冲页对应的控制块作为value。

当需要访问某个页的数据时，先从哈希表中根据表空间号+页号看看是否存在对应的缓冲页。
有，则直接使用；没有，则从free链表中选出一个空间的缓冲页
再将磁盘中对应的页加载到该缓冲页的位置。

6、InnoDB如何管理Page页

6.1 Page页分类

BP底层采用链表数据结构管理Page。

在InnoDB访问表记录和索引时会在Page页中缓存，减少磁盘OP操作，提升效率。

free page ：空闲page，未被使用
clean page：被使用page，数据没有被修改过
dirty page：脏页，被使用page，数据被修改过，Page页中的数据和磁盘的数据产生了不一致

6.2 通过三种链表结构来维护和管理

6.2.1 free list：表示空闲缓冲区，

管理free page
把所有空闲的缓冲页对应的控制块作为一个个节点，放在一个链表中，称之为free链表
基结点：free链表中一个基节点是不记录缓存页信息（单独申请空间），它里面就存放了free链表的头节点的地址，尾结点的地址，还有free链表里当前有多少个节点。

6.2.2 flush list：表示需要刷新到磁盘的缓冲区，

管理dirty page，内部page按修改时间排序
InnoDB引擎为了提高处理效率，在每次修改缓存页后，并不是立刻把修改刷新到磁盘上，而是在未来的某个时间点进行刷新非操作，所以需要使用flush链表存储脏页，凡是被修改过的缓冲页对应的控制块都作为节点加入到flush链表
flush链表的结构与free链表的结构相似

6.2.2 lru list：表示正在使用的缓冲区

管理clean page和dirty page，缓冲区以midpoint为基点，
前面链表称为new列表区，存放经常访问的数据，站63%；
后面的链表称为old区，存放使用较少的数据，占37%。

7、为什么写缓冲区，仅适用于非唯一普通索引页？

7.1 change Buffer 基本概念

写缓冲区，针对二级索引（辅助索引）页的更新优化措施。

7.2 作用

在进行DML操作(更新操作)时，如果请求的辅助索引（二级索引）没有在缓冲池中时，

并不会立刻将磁盘页加载到缓冲池，而是在change Buffer记录缓冲变更，

等未来数据被读取时，再将数据合并恢复到DB中。

7.3 change Buffer 的更新流程

7.4 写缓冲区，仅适用于非唯一普通索引页，为什么？

如果在索引设置唯一性，进行修改时，InnoDB必须要做唯一性校验，因此必须查询磁盘（IO操作）。
直接将记录查询到BufferPool中，然后再缓冲池修改，不会再ChangeBuffer中操作。

8、MySQL为什么改进LRU算法？

8.1 普通LRU算法：

LRU = Least Recently Used （最近最少使用）：末尾淘汰法，新数据从链表头部加入，释放空间时从末尾淘汰。

最近被访问的数据，则其未来被访问的概率较大。

当要访问某个页时，如果不在Buffer Pool，需要把该页加载到缓冲池，并且把该缓冲页对应的控制块作为节点添加到LRUL链表的头部。
当要访问某个页时，如果在Buffer Pool中，则直接把该页对应的控制块移动到LRU链表的头部。
当需要释放空间时，从最末尾淘汰。

8.2 普通LRU算法的优缺点

优点：

所有最近使用的数据都在链表头部，最近未使用的数据都在链表尾部，保证热数据能最快获取到。

缺点：

如果发生全表扫描（比如：没有建立合适的索引 or 查询时使用 select * 等），则有很大可能将真正的热数据淘汰掉。
由于MySQL中存在预读机制，很多预读的页都会被放到LRU链表的表头。如果这些预读的页都没有用到，会导致很多尾部的缓冲页很快被淘汰掉。

8.3 改进LRU算法

将链表分为new和old两个部分，加入元素时并不是从表头加入
而是从中间midpoint位置插入（从磁盘中新读的数据放在冷数据区的头部），
如果数据很快被访问，那么page就会向new列表头部移动，
如果数据没有被访问，会逐步将old尾部移动，等待淘汰。

8.4 冷数据区的数据什么时候会被转到热数据区呢？

如果该数据页在LRU链表中存在的时间超过1s，就将其移动到链表头部（指整个LRU链表的头部）

如果该数据页在LRU链表中存在的时间短于1s，其位置不变（由于全表扫描有一个特点，它对某个页的频繁访问总耗时会很短）

1s这个时间是由参数innodb_old_blocks_time控制的。

9、使用索引一定可以提升效率吗？

9.1 本质

索引就是排好的序，帮助我们进行快速查找的数据结构。

一种将数据库中的记录按照特殊形式存储的数据结构。通过索引，能够显著的提高数据查询的效率，从而提升服务器的性能。

9.2 索引的优缺点

优点：

提高数据检索的效率，降低数据库IO成本。
通过索引列对数据进行排序，降低数据排序的成本，降低CPU消耗。

缺点：

创建索引和维护索引要耗费时间，这种时间成本随着数据量的增加而增加。
索引需要站用物理空间，除了数据表占用数据空间之外，每个索引还要占用一定的物理空间。
当对表中的数据进行正删改操作的时候，索引也要动态的维护，降低了数据的维护速度。

创建索引的原则：

在经常需要搜索的列上创建索引，可以加快搜索的速度。
在作为主键的列上创建索引，强制该列的唯一性和组织表中数据的排列结构。
在经常用连接的列上，这些列主要是一些外键，可以加快连接的速度。
在经常需要根据范围进行搜索的列上创建索引，因为索引已经排序，其指定的范围是连续的
在经常需要排序的列上创建索引，因为索引已经排序，这样查询可以利用索引的排序，加快排序查询时间
在经常使用在WHERE子句中的列上面创建索引，加快条件的判断速度
复合索引一般不超过5个字段

10、索引有哪几种类型？

10.1 普通索引

最基本的索引类型，基于普通字段建立，没有任何限制。

CREATE INDEX <索引名称> ON TABLENAME (字段名);
ALTER TABLE TABLENAME ADD INDEX [索引名称](字段名);
CREATE TABLE TABLENAME ([...],INDEX [索引名称](字段名));

10.2 唯一索引

与普通索引类似，不同点：索引字段的值必须唯一，允许空值。

CREATE UNIQUE INDEX <索引名称> ON TABLENAME (字段名);
ALTER TABLE TABLENAME ADD UNIQUE INDEX [索引名称](字段名);
CREATE TABLE TABLENAME ([...],UNIQUE [索引名称](字段名));

10.3 主键索引

一种特殊的唯一索引，不允许有空值。创建或修改时追加主键约束即可，每个表只能有一个主键。

CREATE TABLE TABLENAME ([...],PRIMARY KEY [索引名称](字段名));
ALTER TABLE TABLENAME ADD PRIMARY KEY [索引名称](字段名);

10.4 复合索引（组合索引）

用户可以在多个列上建立索引，可以代替多个单一索引，所需开销更小。

CREATE INDEX <索引名称> ON TABLENAME (字段名1,字段名2...);
ALTER TABLE TABLENAME ADD INDEX [索引名称](字段名1,字段名2...);
CREATE TABLE TABLENAME ([...],INDEX [索引名称](字段名1,字段名2...));

注意事项：

何时使用复合索引，要根据where条件建索引，注意不要过多使用索引，过多使用会对更新操作效率有很大影响。
如果表已经建立了（col1,col2）就没有必要再单独建立（col1）；如果现在有（col1）索引，查询又需要col1和col2条件，可以建立（col1,col2）复合索引，对于查询有一定提高。

10.5 全文索引

查询操作在数据量较小时，可以使用like模糊查询，但是对于大量的文本数据检索，效率很低。如果使用全文索引，查询速度会比like快很多倍。

MySQL5.6以前，近MyISAM存储引擎支持全文检索，
MySQL5.6之后MyISAM和InnoDB都支持。

CREATE FULLTEXT INDEX <索引名称> ON TABLENAME (字段名);
ALTER TABLE TABLENAME ADD FULLTEXT [索引名称](字段名);
CREATE TABLE TABLENAME ([...],FULLTEXT KEY [索引名称](字段名));

全文索引方式有自然语言检索 IN NATURAL LANGUAGE MODE和布尔检索 IN BOOLEAN MODE两种

和常用的like模糊查询不同，全文索引有自己的语法格式，使用 match 和 against 关键字，比如

SELECT * FROM user WHERE MATCH(NAME) AGAINST('aabb');

-- * 表示通配符，只能在词的后面
SELECT * FROM user WHERE MATCH(NAME) AGAINST('aa*' IN   BOOLEAN   MODE );

注意事项：

全文索引必须在字符串、文本字段上建立。

全文索引字段必须在最小字符和最大字符之间才会有效。（innodb：3-84；myisam：4-84）

11、什么是索引下推？

简称ICP，Mysql5.6版本推出，用于优化查询。

11.1 引入前

需求：查询user表中“名字是张开头的，年龄为10岁的所有记录”。

SELECT * FROM user WHERE name LIKE "张%" AND age = 10;

根据最左前缀原则该语句在搜索索引树的时候，只能匹配到名字开头为张的记录，
从该记录开始逐个回表，到主键索引上去找出响应的记录，再对比age这个字段的值是否符合。

11.2 引入后

MySQL5.6引入索引下推，可以在索引遍历的过程中，对索引中包含的字段先做判断，过滤掉不符合条件的记录，减少回表次数。
支持ICP之后，MySQL会在取出索引的同时，判断是否可以进行WHERE条件过滤，再进行索引查询。

12、什么是自适应哈希索引？

12.1 本质

自适应Hash索引简称AHI，是InnoDB的三大特性之一，

另外两大特性是Buffer Pool简称BP、双写缓冲区（Doublewrite Buffer）。

12.2 特性

自适应即我们不需要自己处理，当InnoDB引擎根据查询统计发现某一查询满足hash索引的数据结构特点，就会给其建立一个hash索引；
hash索引底层的数据结构是散列表（Hash表），其数据特点就是比较适合在内存中使用，自适应Hash索引存在于InnoDB架构中（不存在与磁盘架构中），见下面的架构图；
自适应hash索引只适合搜索等值的查询，如
```
SELECT * FROM TABLE WHERE index_col = 'xxx';
```
而对于其他查找类型，如范围查找，是不能使用的。

AHI是针对B+树Serch Path的优化，因此所有会涉及到Serch Path的操作，均可使用此Hash索引进行优化。
减少B+树从叶子结点–>根节点定位，可以根据索引的键值，快速定位。
根据索引键值（前缀）快速定位到叶子节点满足条件记录的Offset，减少了B+树Search Path的代价，将B+树从Root节点至Leaf节点的路径定位，优化为Hash index的快速查询。
InnoDB的自适应Hash索引是默认开启的，可以通过配置下面的参数设置进行关闭。
```
innodb_adaptive_hash_index = off;
```
自适应Hash索引使用分片进行实现的，分片数可以使用配置参数设置。
```
innodb_adaptive_hash_index_parts = 8;
```

13、为什么LIKE以"%"开头索引会失效？

13.1 场景：

设置了一个联合索引

13.2 解决%出现在左边索引失效的方法，使用覆盖索引

通过使用索引覆盖type = index，并且extra = Using index，从全表扫描变成了全索引扫描。

13.3 like失效的原因

%号在右：由于B+树的索引顺序，是按照首字母的大小进行排序，%号在右的匹配又是匹配首字母。所以可以在B+树上进行有序的查找，查找首字母符合要求的数据。
%号在左：是匹配字符串尾部的数据，尾部的字母是没有顺序的，所以不能按照索引顺序查询，因此索引失效。
两个%%号：这个是查询任意位置的字母满足条件即可，只有首字母时进行索引排序的，其他位置的字母都是相对无序的，所以查找任意位置的字母是用不上索引的。

14、InnoDB与MyISAM的区别

14.1 事务和外键

InnoDB：支持事务和外键，具有安全性和完整性，适合大量insert和update操作。

MyISAM：不支持事务和外键，提供告诉存储和检索，适合大量select操作。

14.2 锁机制

InnoDB：支持行级锁，锁定指定记录。基于索引来加锁实现。

MyISAM：支持表级锁，锁定整张表。

14.3 索引结构

InnoDB：使用聚集索引（聚簇索引），索引和记录在一起存储。

MyISAM：使用非聚集索引（非聚簇索引），所以你和记录分开。

14.4 并发处理能力

InnoDB：读写阻塞可以与隔离级别有关，可以采用多版本并发控制（MVCC）来支持高并发。

MyISAM：使用表锁，会导致写操作并发率低，读之间并不阻塞。

14.5 存储文件

InnoDB：表对应两个文件，一个.frm表结构文件，一个.ibd数据文件。最大支持64TB。

MyISAM：表对应三个文件，一个.frm表结构文件，一个MYD表数据文件，一个.MYI索引文件。从MySQL5.0开始默认限制时256TB。

14.6 InnoDB适用场景

需要事务支持（具有较好的事务特性）
行级锁定对高并发有很好的适应能力
数据更新较为频繁的场景
数据一致性要求较高
硬件设备内存较大，可以利用InnoDB较好的缓存能力来提高内存利用率，减少磁盘IO

14.7 MyISAM适用场景

不需要事务支持
并发相对较低（锁定机制问题）
数据修改相对较少，以读为主
数据一致性要求不高

15、说一说三个范式？

（1）第一范式：每个列都不可以再拆分；

（2）第二范式：非主键列完全依赖于主键，而不能只依赖主键的一部分；

（3）第三范式：非主键列只依赖于主键，而不依赖于其他非主键。

16、MySQL的事务

16.1 ACID事务的特性

原子性：要么全部成功，要么全部失败。

一致性：数据库总是从一个一致性的状态转移到另一个一致性的状态，不会存在中间状态。

隔离性：一个事务在完全提交之前，对其他事务是不可见的。

持久性：一旦事务提交了，那么就永远都不会改变了。

16.2 并发事务带来了哪些问题？

（1）脏读：一个事务对数据进行了修改，还未提交到数据库；另一个事务使用了未修改的数据，依据这个脏数据所做的操作可能是不正确的。

（2）丢失修改：两个事务同时访问并修改同一个数据，那么第一个事务修改的结果就会被丢失。

（3）不可重复读：在一个事务内多次读取同一数据。在这个事务结束之前，另一个事务进修改了数据，那么第一个事务两次读取的数据就会不一样了。

（4）幻读：发生在一个事务读取了几行数据，接着另一个并发事务插入了一些数据，在随后的查询中，第一个事务就会发现多了一些原本不存在的数据。

16.3 MySQL的四种隔离级别

（1）读未提交

（2）读已提交

（3）可重复度

（4）可串行化

17、MySQL视图

17.1 为什么要使用视图？什么是视图？

为了提高复杂SQL语句的复用性和表操作的安全性。
一种虚拟表，在物理上是不存在的，其内容与真实的表相似，包含一系列带有名称的列和行数据。
视图并不在数据库中以储存的数据值形式存在。行和列数据来自定义视图的查询所引用基本表，并且在具体引用视图时动态生成。

17.2 视图有哪些特点？

视图的列可以来自不同的表，是表的抽象和在逻辑意义上建立的新关系。
视图是由基本表(实表)产生的表(虚表)。
视图的建立和删除不影响基本表。
对视图内容的更新(添加，删除和修改)直接影响基本表。
当视图来自多个基本表时，不允许添加和删除数据。

17.3 视图的使用场景

重用SQL语句；
简化复杂的SQL操作。在编写查询后，可以方便的重用它而不必知道它的基本查询细节；
使用表的组成部分而不是整个表；
保护数据。可以给用户授予表的特定部分的访问权限而不是整个表的访问权限；
更改数据格式和表示。视图可返回与底层表的表示和格式不同的数据。

17.4 视图的优缺点

17.4.1 优点：

查询简单化。视图能简化用户的操作
数据安全性。视图使用户能以多种角度看待同一数据，能够对机密数据提供安全保护
逻辑数据独立性。视图对重构数据库提供了一定程度的逻辑独立性

17.4.2 缺点：

性能。数据库必须把视图的查询转化成对基本表的查询，如果这个视图是由一个复杂的多表查询所定义，那么，即使是视图的一个简单查询，数据库也把它变成一个复杂的结合体，需要花费一定的时间。
修改限制。当用户试图修改视图的某些行时，数据库必须把它转化为对基本表的某些行的修改。事实上，当从视图中插入或者删除时，情况也是这样。对于简单视图来说，这是很方便的，但是，对于比较复杂的视图，可能是不可修改的
这些视图有如下特征：1.有UNIQUE等集合操作符的视图。2.有GROUP BY子句的视图。3.有诸如AVG\SUM\MAX等聚合函数的视图。 4.使用DISTINCT关键字的视图。5.连接表的视图（其中有些例外）

18、大表数据查询优化思路

优化shema、sql语句+索引；
第二加缓存，memcached, redis；
主从复制，读写分离；
垂直拆分，根据你模块的耦合度，将一个大的系统分为多个小的系统，也就是分布式系统；
水平切分，针对数据量大的表，这一步最麻烦，最能考验技术水平，要选择一个合理的sharding key, 为了有好的查询效率，表结构也要改动，做一定的冗余，应用也要改，sql中尽量带sharding key，将数据定位到限定的表上去查，而不是扫描全部的表；
数据库层面,这也是我们主要集中关注的(虽然收效没那么大),类似于select * from table where age > 20 limit 1000000,10这种查询其实也是有可以优化的余地的. 这条语句需要load1000000数据然后基本上全部丢弃,只取10条当然比较慢. 当时我们可以修改为select * from table where id in (select id from table where age > 20 limit 1000000,10).这样虽然也load了一百万的数据,但是由于索引覆盖,要查询的所有字段都在索引中,所以速度会很快. 同时如果ID连续的好,我们还可以select * from table where id > 1000000 limit 10,效率也是不错的,优化的可能性有许多种,但是核心思想都一样,就是减少load的数据.
从需求的角度减少这种请求…主要是不做类似的需求(直接跳转到几百万页之后的具体某一页.只允许逐页查看或者按照给定的路线走,这样可预测,可缓存)以及防止ID泄漏且连续被人恶意攻击.

你可能感兴趣的:(MySQL,面试题,mysql,数据结构,java)

运维面试题（七） a_j58 运维
1.statefulset用来管理有状态的应用程序，有状态是什么意思？每一个pod都有一个固定的网络标识符，在整个生命周期中不会改变。每个实例都可以拥有自己的持久化存储卷，即使容器被删除并重新创建，存储卷仍然存在。StatefulSet确保了Pod按照顺序启动、更新和终止。2.主键是什么，它与索引有什么关系？主键确保表中每一行数据都可以被唯一标识，避免数据重复。主键通常会自动创建一个唯一索引，加快
深夜惊魂：当监控告警“撒谎”时，SRE 如何逆风翻盘？ YAMLMaster kubernetes 运维开发 devops 容器云原生
Yorkshire,England引言我们这一篇也是含金量十足，如果面试官让你说个你处理过的比较有意思的案例，可以跟他讲讲，让他也见见世面。好吧，我们直接开始，最后有相关的群，有兴趣可以加入。开始一、故障场景深度还原时间：2025年1月3日02:00（GMT+8）环境：•数据库集群：MySQL8.0.35，通过KubeBlocks部署（3节点，跨AZ）•监控架构：•Prometheus-Opera
云原生工程师必修课：如何揪出“假忙真闲”的应用元凶 YAMLMaster 面试题 kubernetes 运维开发 devops
Tagamanent,Spain引言这是一个再经典不过的面试题了，希望大家能学到精髓。开始介绍在分布式系统和高并发场景中，高负载（HighLoad）与低使用率（LowUtilization）的共存矛盾是运维和开发者的常见挑战。这种问题往往隐蔽性强，传统监控指标难以直接定位根因。本文从系统层、应用层、架构层多维度拆解，提供一套完整的排查与优化方法论。核心概念厘清•负载（Load）：系统当前待处理任务
k8s运维设置Pod实现JVM内存根据容器内存动态调整风行無痕 K8S kubernetes jvm 容器
一、实现方式推荐方案：利用JVM容器感知特性，按比例动态分配。适用场景‌：动态根据Pod内存限制自动分配堆内存，无需硬编码参数Java要求：Java8u191+或Java11+Java8u191+或Java11+支持通过-XX:InitialRAMPercentage替代-Xms，根据容器内存限制自动计算堆内存。在容器环境变量中配置-XX:MaxRAMPercentage=75.0，使JVM根据容
基于Redis分布锁+事务补偿解决数据不一致性问题 yiridancan 并发编程 Redis 分布式 redis 数据库缓存
基于Redis的分布式设备库存服务设计与实现概述本文介绍一个基于Redis实现的分布式设备库存服务方案，通过分布式锁、重试机制和事务补偿等关键技术，保证在并发场景下库存操作的原子性和一致性。该方案适用于物联网设备管理、分布式资源调度等场景。代码实现importjava.util.HashMap;importjava.util.Map;importorg.slf4j.Logger;importorg
Linux------Redis(软件安装，Linux下和Windows下)，NoSQL（简单了解） .墨迹. Linux redis 大数据 java
文章目录NoSql1.历史1.单机MySql2.Memcached(缓存)+MySql+垂直拆分(读写分离)3.分库分表+水平拆分+MySql集群4.如今最近的年代5.为什么要使用NoSQL2.什么是NoSQL1.NOSQL2.特点3.3v+3高3.NoSQL的四大分类1.kv键值对：2.文档型数据库（bson和json一样）：3.列存储数据库：4.图关系型数据库Redis1.初始redis1.简
MySQL密码修改的全部方式一篇详解 1加1等于 MySQL mysql 数据库
本文将详细介绍多种修改MySQL密码的方式。本文目录一、alteruser语句操作步骤二、setpassword操作步骤三、直接修改mysql.user表操作步骤一、alteruser语句当你以root用户或者拥有足够权限的用户登录MySQL时，可以使用ALTERUSER语句来修改密码。这种方式适用于MySQL5.7及以上版本，简单直接，且符合MySQL的标准操作规范。操作步骤首先，使用以下命令登
Java并发实战——CountDownLatch优化商品详情页数据加载 1加1等于 Java并发 java 开发语言多线程
本文将结合电商场景比如优化商品详情页数据加载，深入探讨CountDownLatch的工作原理及实际应用。本文目录1.简介2.商品详情页数据加载优化实战3.CountDownLatch的优势4.其他应用场景5.使用误区1.简介CountDownLatch是Java并发包java.util.concurrent中的一个同步工具类。允许一个或多个线程等待，直到其他一组线程完成一系列操作。CountDow
Java进阶——常用类及常用方法详解 1加1等于 Java java
本文将深入探讨Java常用类的核心知识点以及在日常工作中的使用场景。本文目录一、String类1.不可变性2.字符串常量池3.比较字符串二、日期时间常用类1.Java8引入2.时间计算三、Math数值处理四、Optional空值处理五、异常处理类六、枚举类一、String类1.不可变性String类是不可变的，这意味着一旦创建就不能被修改。在进行字符串拼接时，需要注意性能问题。//不推荐：会创建多
Java进阶——数组超详细整理 1加1等于 Java java 数据结构
数组是一种基础且重要的数据结构，广泛应用于各种场景，本文将深入探讨Java数组的相关知识点，并结合实际场景展示其应用。本文目录一、数组声明与初始化1.声明方式2.初始化方法3.长度特性二、内存管理三、数组遍历与操作1.遍历方式2.数组填充四、多维数组五、数组工具类Arrays六、数组与集合的转换1.数组转集合2.集合转数组总结一、数组声明与初始化1.声明方式数组的声明有两种方式：int[]prod
基于跳表实现的轻量级KV存储引擎项目总结码云笔记后端 KV存储
项目介绍KV存储引擎众所周知，非关系型数据库redis，以及levedb，rockdb其核心存储引擎的数据结构就是跳表。本项目就是基于跳表实现的轻量级键值型存储引擎，使用C++实现。插入数据、删除数据、查询数据、数据展示、数据落盘、文件加载数据，以及数据库大小显示。在随机写读情况下，该项目每秒可处理啊请求数（QPS）:24.39w，每秒可处理读请求数（QPS）:18.41w项目存储文件main.c
硬核项目 KV 存储，轻松拿捏面试官！程序员老舅 C++Linux后端 KV存储 C++C++后端开发 Redis 内存索引 C++数据结构
硬核项目KV存储，轻松拿捏面试官！在简历上如何写这个项目？项目概述基于Bitcask模型，兼容Redis数据结构和协议的高性能KV存储引擎设计细节采用Key/Value的数据模型，实现数据存储和检索的快速、稳定、高效存储模型：采用Bitcask存储模型，具备高吞吐量和低读写放大的特征持久化：实现了数据的持久化，确保数据的可靠性和可恢复性索引：多种内存索引结构，高效、快速数据访问并发控制：使用锁机制
mysql的数据如何进kafka_MySQL数据实时增量同步到Kafka IT巫师
一、go-mysql-transfergo-mysql-transfer是一款MySQL实时、增量数据同步工具。能够实时解析MySQL二进制日志binlog，并生成指定格式的消息，同步到接收端。go-mysql-transfer具有如下特点：1、不依赖其它组件，一键部署2、集成多种接收端，如：Redis、MongoDB、Elasticsearch、RabbitMQ、Kafka、RocketMQ，不
微服务即时通讯系统的实现（客户端）----（2） Smile丶凉轩项目微服务架构云原生
目录1.将protobuf引入项目当中2.前后端交互接口定义2.1核心PB类2.2HTTP接口定义2.3websocket接口定义3.核心数据结构和PB之间的转换4.设计数据中心DataCenter类5.网络通信5.1定义NetClient类5.2引入HTTP5.3引入websocket6.小结7.搭建测试服务器7.1创建项目7.2服务器引入http7.3服务器引入websocket7.4服务器引
StarRocks中优雅处理JSON与列表字段的初步示例 t.y.Tang 数据库 mysql json
StarRocks是一种兼容MySQL语法,自带对JSON,ARRAY等格式支持的数据库.文章目录一StarRocks是什么？与MySQL有何关系？二JSON格式的好处三JSON数组字段的应用和缺点四实例:StarRocks处理JSON数组的方法示例表结构场景1:筛选包含特定事件的用户场景2:提取数组中的嵌套字段场景3:展开数组为多行(UNNEST)场景4:复杂条件过滤(结合`$`索引)五,性能优
微服务即时通信系统---（五）框架学习 YangZ123123 微服务即时通信系统学习微服务算法
目录ODB介绍安装build2安装odb-compiler安装ODB运行时库安装mysql和客户端开发包安装boostprofile库安装总体打包安装总体卸载总体升级头文件包含和编译时指明库ODB常见操作介绍类型映射ODB编程类与接口介绍mysql连接池对象类mysql客户端操作句柄类mysql事务操作类针对可能为空的字段封装的类似于智能指针的类型针对查询结果所封装的容器类和条件类mysql操作句
Vue——Vue-cli脚手架+前端路由 pdsu_zhao Vue Vue学习之旅 vue v-router v-resource vue-cli ES6
Vue-cli是Vue的脚手架工具可以进行目录结构、本地调试、代码部署、热加载、单元测试1、MVVM框架View——ViewModel——Model（视图）（通讯）（数据）“DOM”“观察者vue实例”“Javascript”注意：交互为双向的特点：（1）针对具有复杂交互逻辑的前端应用；（2）提供基础的架构抽象；（3）通过Ajax数据持久化，保证前端用户体验。2、什么是Vue.js它是一个轻量级M
AsyncHttpClient使用说明书有梦想的攻城狮 netty学习专栏 Java asynchttpclient 异步处理 netty
[[toc]]AsyncHttpClient（AHC）是一个高性能、异步的HTTP客户端库，广泛用于Java和Scala应用中，特别适合处理高并发、非阻塞的HTTP请求。它基于Netty或Java原生的异步HTTP客户端实现，支持HTTP/1.1和HTTP/2协议，适用于微服务、API调用、爬虫等场景。1.核心特性特性说明异步非阻塞基于事件驱动模型，避免线程阻塞，支持高并发（如每秒数千请求）。HT
vue面试题合集（强烈推荐）前端念初前端 javascript
2022最新Vue面试题1、Vue的最大的优势是什么？（必会）2、Vue和jQuery两者之间的区别是什么？（必会）3、MVVM和MVC区别是什么？哪些场景适合？（必会）4、Vue数据双向绑定的原理是什么?（必会）5、Object.defineProperty和Proxy的区别（必会）6、Vue生命周期总共分为几个阶段？（必会）7、第一次加载页面会触发哪几个钩子函数？（必会）8、请说下封装Vue组
Linux 内核数据结构解析--哈希链表 Black8Mamba24 Linux内核数据结构
一、Hash表的基本定义1.1Hash的概念散列表（Hashtable，也叫哈希表）,是一种数据结构，可以用于存储Key-Value键值对。也就是说，通过Key来映射到具体的Value。通常用于查找。将Key映射到Value的函数叫做Hash函数，而存储Key-Value的表叫做Hash表。Hasn表常用数组来存储。1.2常用的Hash函数1.3常用的处理碰撞的方法如果说存储空间是无线的，那只要定
Java的包结构 MingDong523 笔记
Java的包结构类就相当于文件夹(目录)。包结构的作用一般有以下两个方面第一个就是Java的包是根据Java文件的功能和性质来区分，方便区分和查找另一个就是重复的文件名可以存在于不同的包(文件夹)里。当我们选择去创建Java包时有两种创建方式，其中一种就是手动创建，手动创建包太过繁琐，不推荐。而另一种就是使用代码去创建(打包语句package)，当我们使用打包语句时要注意一下几点1.在写packa
Java中String类型的20个方法 MingDong523 笔记
根据长度来使用的方法：返回类型：int方法签名：String.length()作用：用来计算String中字符的个数根据数组来使用的方法：返回类型：byte类型的数组byte[]方法签名：String.getBytes()作用：将String类型转换成byte类型的数组返回类型：char类型的数组char[]方法签名：String.toCharArray()作用：将String类型转变成char类
深度剖析linux内核万能--双向链表,Hash链表模版 Engineer-Bruce_Yang C语言-算法与数据结构编程 C语言在开发中的应用
我们都知道，链表是数据结构中用得最广泛的一种数据结构，对于数据结构，有顺序存储，数组就是一种。有链式存储，链表算一种。当然还有索引式的，散列式的，各种风格的说法，叫法层出不穷，但是万变不离其中，只要知道什么场合用什么样的数据结构，那就行了。那么，标题说的内核万能链表，其实就是内核链表，它到底和我们平常大学学的数据结构的链表有什么不同呢？？内核链表，是在linux内核里的一种普遍存在的数据结构，比如
2021-最新Web前端经典面试试题及答案-史上最全前端面试题(含答案)---React篇圆白菜和大白菜前端 react 大前端 react
★★★React事件绑定原理★★★React中的setState缺点是什么呢★★★React组件通信如何实现★★★类组件和函数组件的区别★★★请你说说React的路由是什么？★★★★★React有哪些性能优化的手段？★★★★Reacthooks用过吗，为什么要用？★★★★虚拟DOM的优劣如何？实现原理？★★★★React和Vue的diff时间复杂度从O(n^3)优化到O(n)，那么O(n^3)和O
数据结构——链表专项 seven——seven linux mailbox之线程邮箱数据结构链表算法
数据结构的总结1.定义一组用来保存一种或者多种特定关系的数据的集合（组织和存储数据）程序的设计：将现实中大量而复杂的问题以特定的数据类型和特定的存储结构存储在内存中，并在此基础上实现某个特定的功能的操作；程序=数据结构+算法高内聚，低耦合2.数据与数据之间的关系数据的逻辑结构：数据元素与元素之间的关系集合：关系平等线性结构：元素之间一对一的关系（表，队列。栈。。。）树型结构：元素之间一对多的关系（
Linux内核中的数据结构与算法（三）哈希链表木木0o0欧尼 Linux 链表数据结构 linux
四，哈希链表谈到链表就不得不谈Linux内核中另外一个重要的结构，哈希链表。讨论这个结构前，你需要对哈希的最基本的概念要清楚哦，由于我们已经讲过Linux内核中的普通链表的结构，这里我们对比他们的区别来了解哈希链表会直观一些。Linux链表认为双指针表头双循环链表对于HASH表来说过于浪费，因而设计了一套用于HASH表的hlist的数据结构，单指针表头双循环链表。hlish表头仅有一个指向首节点的
数据结构-----队列磨十三数据结构算法 linux
顺序队列（Queue）一、队列核心概念1.基本特性先进先出（FIFO）：最早入队的元素最先出队操作限制：队尾（Rear）：唯一允许插入的位置队头（Front）：唯一允许删除的位置2.顺序队列结构typedefintDATATYPE;typedefstructqueue{DATATYPE*ptr;//存储空间基地址inttlen;//队列总容量inthead;//队头索引inttail;//队尾索引
深入浅出：序列化与反序列化的全面解析进击的小白菜一些开发常识开发语言开发常识
文章目录1.引言2.什么是序列化？2.1为什么需要序列化？3.什么是反序列化？3.1反序列化的重要性4.序列化与反序列化的实现4.1JSON(JavaScriptObjectNotation)4.2XML(eXtensibleMarkupLanguage)4.3ProtocolBuffers(Protobuf)4.4MessagePack5.安全性考虑6.性能优化7.结论附录：常见问题解答Q1:什
Java高频面试之集合-13 牛马baby 面试职场和发展 java 哈希算法 HashMap
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：为什么hash函数能降哈希碰撞？哈希函数通过以下核心机制有效降低碰撞概率，确保不同输入尽可能映射到不同的哈希值：一、设计原理与数学基础均匀分布（UniformDistribution）目标：使任意输入经过哈希计算后，结果在输出空间中均匀分布。数学方法：利用模运算、位操作等，确保输入变化时哈希值的变化无规律。示例：#简单哈
Java高频面试之集合-08 牛马baby java 面试 python
hello啊，各位观众姥爷们！！！本baby今天来报道了！哈哈哈哈哈嗝面试官：详细说说CopyOnWriteArrayListCopyOnWriteArrayList详解CopyOnWriteArrayList是Java并发包（java.util.concurrent）中提供的线程安全列表，基于“写时复制”（Copy-On-Write）机制实现。它适用于读多写少的高并发场景，如事件监听器列表、配置
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&