Hive实战(三)特定分割符\u0003

create table temp.tmp_test_serp(
id string,
name string,
password string
)row format delimited fields terminated by '\003'

Hive实战(三)特定分割符\u0003_第1张图片
Hive实战(三)特定分割符\u0003_第2张图片

使用java编写一个特定分割符\u0003的txt文件。

	    int splitChar = 3;
        String splitString1 = String.valueOf((char)splitChar);
        System.out.println(splitChar+"的字符串形式表示为"+splitString1);
        serpTest.writeFile(userList,filePath,splitString1);

完整版的读取mysql生成特定分隔符的文件

由于hive由java编写,所以row format delimited fields terminated by 后也可以使用java的方式输入特殊字符,
比如用java的转义字符——反斜杠()+0+八进制数字可以代表任意ASCII码,或者用\u + 四位数字可以代表任意Unicode字符。

比如hive创建表格的默认分隔符为SOH字符,ASCII码中的序号为1,所以可以用’\001’表示。

详情可参考Java官方说明:http://docs.oracle.com/javase/specs/jls/se8/html/jls-3.html#jls-OctalNumeral

不过需要注意的时,目前hive似乎只支持一个字符作为分隔符,不支持多个字符作为分隔符,如果row format delimited fields terminated by后面跟多个字符,比如

row format delimited fields terminated by ‘…’

系统只会使用一个点(.)作为分隔符。

你可能感兴趣的:(java)