Hive表设置支持中文注释、中文表数据导入

问题

1、创建表的时候,comment说明字段包含中文,表成功创建成功之后,中文说明显示乱

create table student_score(
stu_id string comment '学生id',
stu_name string,
courses string,
scores string 
); 

Hive表设置支持中文注释、中文表数据导入_第1张图片

  • 这是因为在MySQL中的Hive元数据不支持中文,故出现乱码。

2、加载中文数据到表中,结果出现乱码

hive> insert into student_score values 
    > ("1001", "张三","语文,数学,英语,历史,地理", "88,87,94,86,84"),
    > ("1002", "李四", "语文,数学,英语,历史,地理", "78,89,75,79,68"),
    > ("1003", "王五", "语文,数学,英语,历史,地理", "98,97,91,93,92"),
    > ("1004", "朱六", "语文,数学,英语,历史,地理", "66,63,64,67,68");

Hive表设置支持中文注释、中文表数据导入_第2张图片

解决

  • 由于Hive元数据(表的属性、字段定义等)都是存储在Mysql中,故我们需要到Mysql中Hive库中进行一些表进行设置操作。

1、 进入Mysql并切到Hive库下:

  • 进入Mysql终端

Hive表设置支持中文注释、中文表数据导入_第3张图片

  • 切到Hive库
use hive;

2、执行以下 5 条 SQL 语句

(1)修改表字段注解和表注解

  • 表字段注解
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
  • 表注解
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

(2)修改分区字段注解

alter table PARTITION_PARAMS  modify column PARAM_VALUE varchar(4000) character set utf8;
alter table PARTITION_KEYS  modify column PKEY_COMMENT varchar(4000) character set utf8;

(3)修改索引注解

alter table  INDEX_PARAMS  modify column PARAM_VALUE  varchar(4000) character set utf8;

3、修改 metastore 的连接 URL

  • 修改hive-site.xml中的参数
[root@master conf]# vim hive-site.xml
 <property>
                <name>javax.jdo.option.ConnectionURL</name>
                <value>jdbc:mysql://master:3306/hive?createDatabaseIfNotExist=true&useSSL=false&useUnicode=true&characterEncoding=UTF-8
                <description>JDBC connect string for a JDBC metastore</description>
        </property>

Hive表设置支持中文注释、中文表数据导入_第4张图片

验证

  • 删除之前建的表
 drop table student_score;
  • 重新建
create table student_score(
stu_id string comment '学号',
stu_name string comment '姓名',
courses string comment '各个科目',
scores string comment '各个分数'
) comment '学生成绩表';

Hive表设置支持中文注释、中文表数据导入_第5张图片

  • 说明中文注释问题已经解决了

但但中文数据导入乱码问题还没有解决

  • 笨办法是可通过utf-8转码解决
    参考

你可能感兴趣的:(Hadoop,#,Hive,hive)