Hive数据存储

1、Hive中所有的数据包存储在HDFS中,没有专门的数据存储格式(可支持Text,SequenceFile,ParquetFile,RCFile等)

2、只需要在创建表的时候告诉Hive 数据中的列分隔符和行分隔符,Hive就可以解析数据。(不懂hive中数据分割符的可以看我的这一篇:https://blog.csdn.net/S_Running_snail/article/details/84258162)

3、Hive中包含以下数据模型: DB,Table, External Table,Partition,Bucket.     

  • db:在hdfs中表现为S(hive metastore warehouse.dir)目录下一个文件夹
  • table:在hdfs中表现所属db目录下一个文件夹
  • extermal rable:与table类似,不过其数据存放位置可以在任意指定路径
  • partition在hdfs中表现为table目录下的子目录
  • bucket:在hdfs中表现为同一个表目录下根据hash散列之后的多个文件

你可能感兴趣的:(hadoop)