由于需要实现emoji表情评论的功能,所以数据库需要支持emoji表情的存储,根据查询的资料最终实现了该功能,现将实现的过程以及过程遇到的一些问题记录下来,供大家参考和交流。
mysql的utf8编码的一个字符最多3个字节,但是一个emoji表情为4个字节,所以utf8不支持存储emoji表情。但是utf8的超集utf8mb4一个字符最多能有4字节,所以能支持emoji表情的存储。下面介绍了关于如何修改mysql数据库的编码格式变为utf8mb4的具体方法。
Linux系统中MySQL的配置文件为my.cnf。(注:有空把mysql默认编码改为utf8的实现过程也记录下来)
Winows中的配置文件为my.ini。
1.修改mysql的配置文件
找到/etc/mysql路径下的my.cnf文件,通过vi命令打开该文件并进行编辑,需添加如下所示配置:
[client]
default-character-set=utf8mb4
[mysqld]
character-set-client-handshake = FALSE
character-set-server = utf8mb4
collation-server = utf8mb4_unicode_ci
init_connect=’SET NAMES utf8mb4'
[mysql]
default-character-set=utf8mb4
修改完毕之后,通过wq保存退出
2.修改database/table和column的字符集
进入mysql中,按下述所示进行命令的执行:
1) 修改database的字符集:
ALTER DATABASE 数据库名 CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
示例:
ALTER DATABASE xxxdb CHARACTER SET = utf8mb4 COLLATE = utf8mb4_unicode_ci;
2) 步骤1)执行完成之后,需要执行use 数据库名,指明当前需要进行字符集修改的数据库;示例:use xxxdb;
3)修改table的字符集:
ALTER TABLE 表名 CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
示例:
ALTER TABLE user_comments CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
4) 修改column的字符集:
ALTER TABLE 表名 CHANGE 字段名 字段名 该字段原来的数据类型 CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
示例:
ALTER TABLE user_comments CHANGE content content TEXT CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
上述修改完毕,exit退出mysql
3.重启mysql
这里重启的时候我一开始用的是service mysql restart,最后发现这条命令并不管用,重启没有成功,导致后面查看字符集的时候,并没有达到想要的字符集的状态。
所以采用下面的方法才可以正确的重启mysql.
3.1停止msql的运行
通过/etc/init.d/mysql执行stop命令
3.2启动mysql
通过/etc/init.d/mysql执行start命令
4.检查字符集:
进入mysql中,用SHOW VARIABLES WHERE Variable_name LIKE 'character\_set\_%' OR Variable_name LIKE 'collation%';命令查看字符集的情况
上述步骤实现之后便可成功使用emoji表情存储进mysql数据库的功能了。
————————————————————————————————————————————————————————————————
由于mysql数据库是需要备份和还原的,所以带有emoji表情的.sql文件的导入和导出的时候需要注意执行时的编码格式,以下为导入与导出的具体操作:
5.带有emoji表情的sql文件的导入与导出(主要为windows中的导出)
(若是在服务端的代码中的导出为:mysqldump –default-character-set-utf8mb4 –u 用户名 –p 数据库名 > 导出该文件的物理路径;导入的命令不需要指明编码格式,只需要正常的执行命令便可)
5.1导出
在进行把后缀名为.sql的文件,且文件数据中包含emoji表情的数据,进行备份导出的时候,此时不要使用第三方软件进行导出,而是使用命令行的形式执行该导出动作,其主要原因是使用第三方导出该文件时,由于其默认的导出的编码格式为utf-8,该编码格式最多只支持3个字节,而一个emoji表情有4个字节,这将导致emoji表情的数据变成乱码。所以在本地导出的时候具体操作步骤如下:
一、 打开cmd,先找到mysqldump这个执行文件所在的路径;
二、 在路径后输入mysqldump –default-character-set-utf8mb4 –u 用户名 –p 数据库名 > 导出该文件的物理路径,按“Enter”,即可完成导出功能,在导出的物理路径中即可找到已被导出的该文件。
5.2导入
把linux系统中的.sql文件导入到本地的时候,不要使用Navicat Premium来进行导入,而是使用如下所示的命令行中的source .sql文件的物理路径,来进行如下的导入。
6.1使用的laravel框架如果出现表情插入数据库中为问号
需要修改
在laravel的数据库配置文件`config/databases.php`中设置mysql连接的编码
'mysql' => [
'driver' => 'mysql',
'host' => env('DB_HOST', 'localhost'),
'port' => env('DB_PORT', '3306'),
'database' => env('DB_DATABASE', 'forge'),
'username' => env('DB_USERNAME', 'forge'),
'password' => env('DB_PASSWORD', ''),
'charset' => 'utf8mb4', //重点
'collation' => 'utf8mb4_unicode_ci', //重点
'prefix' => 'FN_',
'strict' => false,
'engine' => null,
],