Excel文件导入hive

Hive导入Excel数据应该先转化为linux系统能够读取的txt格式文件,然后导入到hdfs文件系统中,再从hdfs文件中 用load命令导入进hive

其次要注意,excel导出的CSV文件是以逗号分割形式呈现的,在hive建表的过程中需要指定逗号分割:

 Excel文件导入hive_第1张图片

 

 

1.注意要将表头第一行(字段名)删除,然后先导出为csv,再查看数据格式,确认是UTF-8,再转为txt文件(个人习惯,CSV文件也可以,主要是确保不中文乱码,还有逗号分割)

Excel文件导入hive_第2张图片

 

注意,这里编码记得UTF-8,否则中文乱码格式不正确


2.上传文件到HDFS 里,先用rz 命令将文件上传到linux文件目录下,然后导入

hadoop fs -put /data/temp/ods_tj_farm_feed.txt /tmp

Excel文件导入hive_第3张图片
根据excel中的数据结构进行建表,注意结构顺寻要一致


3.load数据到hive表中

load data inpath '/tmp/ods_tj_farm_feed.txt' into table tianjin_ods.ods_tj_farm_feed;

Excel文件导入hive_第4张图片

你可能感兴趣的:(hive,hive,hdfs,hadoop)