23.Kudu表插入中文字符

23.1 问题情况

  • 使用Impala JDBC向Kudu表中插入中文字符,插入的中文字符串乱码,中文字符串被截断。
    测试环境:
    • CDH5.12.0
    • Kudu1.4.0
    • ImpalaJDBC41_2.5.35
  • 使用ImpalaJDBC代码进行测试,测试代码
static String JDBC_DRIVER = "com.cloudera.impala.jdbc41.Driver";
static String CONNECTION_URL = "jdbc:impala://ip-172-31-10-118:21050/default";

public static void main(String[] args) {
    Connection con = null;
    ResultSet rs = null;
    PreparedStatement ps = null;

    try {
        Class.forName(JDBC_DRIVER);
        con = DriverManager.getConnection(CONNECTION_URL);
        String insertsql = "insertinto my_first_table values(46, '测试中文字符')";

        ps = con.prepareStatement(insertsql);
        ps.execute();
        ps.close();

        ps = con.prepareStatement("select* from my_first_table order by id asc");
        rs = ps.executeQuery();
        while (rs.next()) {
            System.out.println(rs.getLong(1) + "\t" +rs.getString(2));
        }

    } catch (Exception e) {
        e.printStackTrace();
    } finally {
        try { // 关闭rs、ps和con
            rs.close();
            ps.close();
            con.close();
        } catch (SQLException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }

    }
}
  • 向Kudu表中分别插入测试数据,如“测试”,“测试中文”,“测试中文字符”
String insertsql = "insert into my_first_table values(44, '测试')";
String insertsql = "insert into my_first_table values(45, '测试中文')";
String insertsql = "insert into my_first_table values(46, '测试中文字符')";
  • 如下是按测试顺序插入的数据


23.2 问题解决

  • 修改程序中插入语句,将插入字符串的单引号修改为双引号
String insertsql = "insert into my_first_table values(51, \"测试中文字符\")";
String insertsql = "insert into my_first_table values(52, \"测试中文\")";
String insertsql = "insert into my_first_table values(53, \"测试\")";
  • 修改后重新向Kudu中插入测试数据:“测试中文字符”,“测试中文”,“测试”
    使用Hue查询显示如下:


  • 使用Cloudera官网最新的JDBC驱动,插入中文字符时也有上述问题
    • 下载地址:https://downloads.cloudera.com/connectors/impala_jdbc_2.5.38.1058.zip
  • 通过Impala-shell插入中文字符串正常
[172.31.10.118:21000] > insert into my_first_table values(66,'插入中文字符');
Modified 1 row(s), 0 row error(s) in 0.11s
[172.31.10.118:21000] > select * from my_first_table where id=66;
+----+--------------+
| id | name         |
+----+--------------+
| 66 | 插入中文字符 |
+----+--------------+
Fetched 1 row(s) in 0.21s
[172.31.10.118:21000] >

[172.31.10.118:21000] > insert into my_first_table values(77, "测试中文字符");
Modified 1 row(s), 0 row error(s) in 0.11s
[172.31.10.118:21000] > select * from my_first_table where id=77;
+----+--------------+
| id | name         |
+----+--------------+
| 77 | 测试中文字符 |
+----+--------------+
Fetched 1 row(s) in 0.18s
[172.31.10.118:21000] > 

大数据视频推荐:
腾讯课堂
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

你可能感兴趣的:(23.Kudu表插入中文字符)