Hive中文注释乱码问题的解决

Hive 中建表的时候,有时候难免要表中文注释,然而如果不经过配置,会导致desc某个表名的时候,直接以?的方式返回。

因此也来解决一下hive中文注释乱码的问题。由于HIVE的元数据是存在于MySQL上的,因此需要在mysql上进行元数据的候。

因此也来解决一下这个问题。

当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1 default。
alterdatabase test_zw character set latin1;

从另外在用的hive mysql 元数据复制一张表进行测试。

create table COLUMNS_V2 select * from hive.COLUMNS_V2

use test_zw ;

select * from COLUMNS_V2;

Hive中文注释乱码问题的解决_第1张图片

insert into COLUMNS_V2  VALUES(100,'测试','codeid','int',0);

alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

insert into COLUMNS_V2  VALUES(101,'测试','codeid','int',0);
select * from COLUMNS_V2 where CD_ID=101;

Hive中文注释乱码问题的解决_第2张图片
默认创建mysql 数据库 字符集 好像就是latin1,一般不需要修改,如果不是修改 


为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。修改清单如下 

修改字段注释字符集
alter tableCOLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
修改表注释字符集
alter tableTABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
修改分区表参数,以支持分区键能够用中文表示。
alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;

提示: 修改后只对以后增加的有效,以前插入的乱码依旧。

你可能感兴趣的:(hive)