大数据培训分析师

1、登录伪分布式系统

2、将文件保存在不同的目录中,提高查询的速度,分区假设有一个目录,下边有多个目录,每个目录使用state=1,state=2,state=3如果只查询state=1,只需要查询相应的分区就行,不需要全文查询

3、

    

sqoop import \

--connect jdbc:mysql://localhost/dualcore \

--username training --password training \

--fields-terminated-by '\t' \

--table suppliers \

--hive-import


sqoop import \

--connect jdbc:mysql://localhost/dualcore \

--username training --password training \

--fields-terminated-by '\t' \

--table employees \

--hive-import

分区表下有很多根据分区字段设置的分区目录

分区字段放在表结构的最后分区字段可以有多个

嵌套分区

    区域   邮编   进行划分



你可能感兴趣的:(hadoop)