最近,业务方反馈有个别用户信息插入失败,报错提示类似"Incorrect string value:"\xF0\xA5 ..... "   看这个提示应该是字符集不支持某个生僻字造成的。


下面是在虚拟机里复现的场景:


step1、模拟原始表结构字符集环境:

use test;

CREATE TABLE `t1` (

  `id` int(10) NOT NULL AUTO_INCREMENT,

  `real_name` varchar(255) CHARACTER SET utf8 DEFAULT '' COMMENT '姓名',

  `nick` varchar(100) COLLATE utf8mb4_unicode_ci DEFAULT '' COMMENT '昵称',

  PRIMARY KEY (`id`)

) ENGINE=InnoDBAUTO_INCREMENT=10 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci COMMENT='会员卡';


step2、插入生僻字(使用sqlyog模拟):

1、先模拟线上环境,设置下字符集:

MySQL生僻字插入失败的处理方法_第1张图片

2、插入生僻字(生僻字可以参考:http://www.qqxiuzi.cn/zh/hanzi-unicode-bianma.php?zfj=kzb&ks=24E20&js=257E3)


MySQL生僻字插入失败的处理方法_第2张图片

我们尝试插入王(在word里面按住alt,输入152964)。可以看到插入失败了。



step3、修改real_name的字符集:

use test;

alter table t1 change real_name real_name  varchar(255) CHARACTER SET utf8mb4 DEFAULT '' COMMENT '姓名' ;

 

如果是线上大表的话,可以使用pt-osc来处理,命令如下:

pt-online-schema-change -uroot -h localhost --alter=" change real_name real_name  varchar(255) CHARACTER SET utf8mb4 DEFAULT '' COMMENT '姓名' " D=test, t=t1 --no-check-replication-filters --alter-foreign-keys-method=auto --recursion-method=none --quiet --charset=utf8mb4 --dry-run

 

pt-online-schema-change -uroot -h localhost --alter=" change real_name real_name  varchar(255) CHARACTER SET utf8mb4 DEFAULT '' COMMENT '姓名' " D=test, t=t1 --no-check-replication-filters --alter-foreign-keys-method=auto --recursion-method=none --quiet --charset=utf8mb4 --execute

 

step4、再次插入实验:

1、先设置下字符集:

MySQL生僻字插入失败的处理方法_第3张图片


2、再次插入,可以看到插入成功了。

MySQL生僻字插入失败的处理方法_第4张图片


在命令行里面查询也是没有乱码了:

MySQL生僻字插入失败的处理方法_第5张图片