面试杂谈(面试需知):自增主键用完了怎么办

自增主键用完了怎么办


前言

今天博主将为大家分享面试杂谈(面试需知):自增主键用完了怎么办,不喜勿喷,如有异议欢迎讨论!转载自:大佬孤独烟https://www.cnblogs.com/rjzheng/p/10669043.html

面试官:“用过mysql吧,你们是用自增主键还是UUID?”
你:“用的是自增主键”
面试官:“为什么是自增主键?”
你:“因为采用自增主键,数据在物理结构上是顺序存储,性能最好,blabla…”
面试官:“那自增主键达到最大值了,用完了怎么办?”
你:“what,没复习啊!!” (然后,你就可以回去等通知了!)


正文

我们先明白一点,在mysql中,Int整型的范围如下

类型 最小值 最大值 存储大小
Int(有符号) -2147483648 2147483648 4 bytes
Int(无符号) 0 4294967295 4 bytes

我们以无符号整型为例,存储范围为0~4294967295,约43亿!我们先说一下,一旦自增id达到最大值,此时数据继续插入是会报一个主键冲突异常如下所示

//Duplicate entry '4294967295' for key 'PRIMARY'

那解决方法也是很简单的,将Int类型改为BigInt类型,BigInt的范围如下

类型 最小值 最大值 存储大小
BigInt(有符号) -9223372036854775808 9223372036854775808 8 bytes
BigInt(无符号) 0 9223372036854775808*2 8 bytes

就算你每秒1000000条数据,跑100年,单表的数据也才(你的系统难道可以怼几百年)

10000*24*3600*365*100=3153600000000000

这数字距离BigInt的上限还差的远,因此你将自增ID设为BigInt类型,你是不用考虑自增ID达到最大值这个问题!
然而,如果你在面试中的回答如果是

你:“简单啊,把自增主键的类型改为BigInt类型就好了!”

接下来,面试官可以问你一个更坑坑坑坑的问题!(一会你就明白为什么坑了)

面试官:“你在线上怎么修改列的数据类型的?”
你:“what!我还是回等通知吧!”


怎么改

方式一:使用mysql5.6+提供的在线修改功能

所谓的mysql自己提供的功能也就是mysql自己原生的语句,例如我们要修改原字段名称及类型。

mysql> ALTER TABLE table_name CHANGE xxxxx;

那么,在mysql5.5这个版本之前,这是通过临时表拷贝的方式实现的。执行ALTER语句后,会新建一个带有新结构的临时表,将原表数据全部拷贝到临时表,然后Rename,完成创建操作。这个方式过程中,原表是可读的,不可写。

在5.6+开始,mysql支持在线修改数据库表,在修改表的过程中,对绝大部分操作,原表可读,也可以写。
那么,对于修改列的数据类型这种操作,原表还能写么?

面试杂谈(面试需知):自增主键用完了怎么办_第1张图片

如图所示,对于修改数据类型这种操作,是不支持并发的DML操作!也就是说,如果你直接使用ALTER这样的语句在线修改表数据结构,会导致这张表无法进行更新类操作(DELETE、UPDATE、DELETE)。因此,直接ALTER是不行滴!

方式二:借助第三方工具

业内有一些第三方工具可以支持在线修改表结构,使用这些第三发工具,能够让你在执行ALTER操作的时候,表不会阻塞!比较出名的有两个

  • pt-online-schema-change,简称pt-osc
  • GitHub正式宣布以开源的方式发布的工具,名为gh-ost

以pt-osc为例,它的原理如下

  1. 创建一个新的表,表结构为修改后的数据表,用于从源数据表向新表中导入数据。
  2. 创建触发器,用于记录从拷贝数据开始之后,对源数据表继续进行数据修改的操作记录下来,用于数据拷贝结束后,执行这些操作,保证数据不会丢失。
  3. 拷贝数据,从源数据表中拷贝数据到新表中。
  4. rename源数据表为old表,把新表rename为源表名,并将old表删除。
  5. 删除触发器。

然而这两个有意(KENG)思(B)的工具,居然。。。居然。。。唉!如果你的表里有触发器和外键,这两个工具是不行滴!

方式三:改从库表结构,然后主从切换(了解)

此法就极其麻烦,需要专业水平的选手进行操作。因为我们的mysql架构一般是读写分离架构,从机是用来读的。我们直接在从库上进行表结构修改,不会阻塞从库的读操作。改完之后,进行主从切换即可。唯一需要注意的是,主从切换过程中可能会有数据丢失的情况!


心里暗怼面试官

其实答完上面的问题后,这篇文章差不多完了。但是,这是一个很有意(KENG)思(B)的问题,为什么呢?

假设,你的表里的自增字段为无符号的Int类型的,也就是说,你的字段范围为0~4294967295 。

一切又那么刚好,你的自增ID是从0开始的,也就是说,现在你的可以用的范围为0~4294967295 。注意:表中真实的数据ID,肯定会出现一些意外,ID不一定是连续的。

真实生产环境表中的真实id必然会出现断续的情况。

好,那这会你的自增主键id的数据范围为0~4294967295 ,也就是单表42亿条数据!考虑id会出现断续,真实数据顶多30亿条吧。

来来来面试官老哥,都单表30亿条了,还不分库分表?你一旦分库分表了,就不能依赖于每个表的自增ID来全局唯一标识这些数据了。那分库分表了,再用int型的ID会不会出现主键冲突呢?不会呀。。因为我们一般是逻辑主键。不带业务含义。分库分表后重新生成

因此在实际中,你根本等不到自增主键用完到情形!

装13回答

面试官:“那自增主键达到最大值了,用完了怎么办?”
你:“这问题没遇到过,因为自增主键我们用BigInt类型,一般达不到最大值,我们就分库分表了,所以不曾遇见过!”


到这里面试杂谈(面试需知):自增主键用完了怎么办,分享完毕了,快去试试吧!


最后

  • 更多参考精彩博文请看这里:《陈永佳的博客》

  • 喜欢博主的小伙伴可以加个关注、点个赞哦,持续更新嘿嘿!


你可能感兴趣的:(MySql系列,杂记随笔系列)