Hive注释乱码问题

在HIVE中建表的时候,有时候难免要表中文注释,然而如果不经过配置,会导致desc某个表名的时候,直接以?的方式返回。
因此也来解决一下HIVE中文注释乱码的问题。由于HIVE的元数据是存在于MYSQL上的,因此需要在MYSQL上进行元数据的候。

当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1 default。
alter database hive character set latin1;
为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。
1.修改字段注释字符集

修改mysql-hive数据库当中的COLUMNS_V2表
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

2.修改表注释字符集

修改mysql-hive数据库当中的TABLE_PARAMS表
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

3.修改分区表参数,以支持分区键能够用中文表示

修改mysql-hive数据库当中的PARTITION_PARAMS与PARTITION_KEYS表
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;

如果以上修改还不成功,需要在hive-site.xml修改mysql对于hive的编码为utf8

4.修改相关表相关字段编码

alter table INDEX_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

你可能感兴趣的:(hive,乱码,大数据-Hive)