hive外部表测试

1. 在hadoop上创建用于存放与hive外部表关联的路径

hadoop fs -mkdir /bigdata/output/MM_XK_USER1/train/zjs/test_external

2. 创建hive外部表

beeline

create external table tb_test_external(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' location '/bigdata/output/MM_XK_USER1/train/zjs/test_external';

3. 创建第一个测试文件文件

vi 1.txt

1|test1
2|test2
3|test3

通过hadoop的命令行把文件上传到指定路径下

hadoop fs –put 1.txt /bigdata/output/MM_XK_USER1/train/zjs/test_external/

4. 使用beeline查询外部表验证数据是否已经加载

beeline

select * from tb_test_external;


报错:

not a RCFile and has magic of 1|t

因为系统默认使用的是RCFile格式,不能识别text格式的文件,所以在建表时需要指定文件的格式:STORED AS TEXTFILE

重新创建表:

drop table tb_test_external;

create external table tb_test_external(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '|' STORED AS TEXTFILE location '/bigdata/output/MM_XK_USER1/train/zjs/test_external';

再次查询

select * from tb_test_external;

结果如下:

tb_test_external.id|tb_test_external.name

1                  |test1

2                  |test2

3                  |test3

5.创建另一个文本文件并上传到上传到指定路径下

vi 2.txt

4|test4
5|test5
6|test6


hadoop fs –put 2.txt /bigdata/output/MM_XK_USER1/train/zjs/test_external/

6. 再次在beeline客户端中执行查询验证新的文件中的数据是否自动加载到了hive表中

beeline

select * from tb_test_external;

tb_test_external.id|tb_test_external.name

1                  |test1

2                  |test2

3                  |test3

4                  |test4

5                  |test5

6                  |test6

参考链接:

hive外部表

HADOOP基本操作命令

Hive表与外部表

Hive:ORC File Format存储格式详解

你可能感兴趣的:(hive,外部表)