HIVE创建分区表并将csv文件导入

1. 创建分区表:

CREATE TABLE IF NOT EXISTS first_table(

    user_id STRING,

    salary decimal(10, 2),

) PARTITIONED by (part_yearly STRING)

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\,';

2. 将csv文件导入:

LOAD DATA LOCAL INPATH '/home/user_salary.csv' 
OVERWRITE INTO TABLE first_table
PARTITION (part_yearly ='1234')

3. 查询结果:

SELECT *

FROM first_table

LIMIT6.

注意:

1.保证你的分区表与之前的表没有重名,否则无法创建;

2.保证你的CSV文件没有表头。这点很重要,尤其如果你的csv文件来自于python或者R. 

参考文献:

https://stackoverflow.com/questions/19320611/hadoop-hive-loading-data-from-csv-on-a-local-machine

https://stackoverflow.com/questions/49555189/how-to-create-table-in-partition-data-in-hive

https://stackoverflow.com/questions/19781609/how-do-you-remove-the-column-name-row-when-exporting-a-pandas-dataframe

你可能感兴趣的:(SQL语言)