Hive内置数据类型

Hive的内置数据类型可以分为两大类:

(1)、基础数据类型:

基础数据类型包括:TINYINT、SMALLINT、INT、BIGINT、BOOLEAN、FLOAT、DOUBLE、STRING、BINARY、TIMESTAMP、DECIMAL、CHAR、VARCHAR、DATE。下面的表格列出了这些基础数据类型所占的字节以及什从什么版本开始支持这些类型。

数据类型 所占字节 开始支持版本
TINYINT 1byte,-128 ~ 127  
SMALLINT 2byte,-32,768 ~ 32,767  
INT 4byte,-2,147,483,648 ~ 2,147,483,647  
BIGINT 8byte,-9,223,372,036,854,775,808 ~ 9,223,372,036,854,775,807  
BOOLEAN    
FLOAT 4byte单精度  
DOUBLE 8byte双精度  
STRING    
BINARY   从Hive0.8.0开始支持
TIMESTAMP   从Hive0.8.0开始支持
DECIMAL   从Hive0.11.0开始支持
CHAR   从Hive0.13.0开始支持
VARCHAR   从Hive0.12.0开始支持
DATE   从Hive0.12.0开始支持

(2)、复杂数据类型:

复杂类型包括:ARRAY、MAP、STRUCT、UNION,这些复杂类型是由基础类型组成的。

   ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过 fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
   MAP:MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过 userlist['username']来得到这个用户对应的password;
   STRUCT:STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过 user.address得到这个用户的地址。
   UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。

 

示例:

创建一张员工表:姓名name为STRING类型;薪资salary为FLOAT类型;下属subordinates为ARRAY类型,其中的元素为STRING类型;工资扣除项deductions为MAP类型,扣除项名称作为key为STRING类型,扣除费用作为value为FLOAT类型;地址address为STRUCT类型包含street为STRING类型,city为STRING类型,num为INT类型。

建表语句如下:

create table if not exists employees(
        name STRING,
        salary FLOAT,
        subordinates ARRAY<STRING>,
        deductions MAP<STRING,FLOAT>,
        address STRUCT<street:STRING,city:STRING,num:INT>
);

注:上述语句中,当字段前面用制表符填充时会报错。使用空格填充则没什么问题!

你可能感兴趣的:(hive建表,Hive数据类型,Hive内置数据类型)