5.Hive表字段Comment中文乱码

5.1 问题

  • 默认Hive中创建有中文注释的表时,无论是在Hive CLI还是Hue中该注释显示都会是乱码。如使用以下建表语句:
create  external table test_table
(
s1  string comment 'abc',
s2  string comment '你好啊'
)
row format  delimited fields terminated by '#'
stored  as textfile location '/lilei/test_table';
  • 在Hive CLI中查看如下:


    • 在Hue中显示也会一样乱码。

5.2 解决

  • 这个问题是因为mysql中的元数据库表COLUMNS_V2中的字段COMMENT编码问题导致的,需要设置为utf-8,如下所示:


  • 在mysql中设置该字段的编码为utf-8,如下所示:
mysql  –u root –p
use  metastore;
alter  table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;FLUSH  PRIVILEGES;
  • 注意Hive元数据这个数据库应使用utf-8创建
    • 如:create database metastore defaultcharacter set utf8;
    • 回到Hive中重现create一张表,查看该表的注释,中文注释会显示正常。
  • 查看以前的表
    • 发现依旧显示为乱码。
    • 需要修改以前的表的comment才能显示正常,在Hive CLI中执行,命令如下:
ALTER  TABLE test_table1 change column s2 s2 STRING COMMENT '我很好';

大数据视频推荐:
腾讯课堂
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

你可能感兴趣的:(5.Hive表字段Comment中文乱码)