Hive建表语句的中文注释乱码问题

问题描述:

在刚开始学Hive时,遇到这样的问题,在Datagrip中建表加注释

Hive建表语句的中文注释乱码问题_第1张图片

 但desc dwt_visitor_topic查看表后发现注释部分(comment)出现乱码,如图所示:

Hive建表语句的中文注释乱码问题_第2张图片

解决:

Hive元数据库的字符集默认为Latin1,由于其不支持中文字符,故若建表语句中包含中文注释,会出现乱码现象。如需解决乱码问题,须做以下修改

1)修改Hive元数据库中存储注释的字段的字符集为utf-8

登录mysql,输入用户密码

mysql -uroot -p123456

切换元数据库

use metastore;

设置字段注释

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

设置表注释

alter table TABLE_PARAMS modify column PARAM_VALUE mediumtext character set utf8;

退出mysql

exit;

重启MySQL服务

sudo systemctl restart mysqld

2)修改hive-site.xml中JDBC URL,如下


 
 javax.jdo.option.ConnectionURL
jdbc:mysql://hadoop102:3306/metastoreuseSSL=false&useUnicode=true&characterEncoding=UTF-8

现在启动Hive服务后再创建表显示就一切正常了,创建个表测试效果如下:

Hive建表语句的中文注释乱码问题_第3张图片

注意:在修改之前创建的仍然乱码没有办法,只有在修改后创建的表显示才不会乱码 

你可能感兴趣的:(hive,大数据,hadoop)