Hive总结

 

Hive架构图

Hive总结_第1张图片

 

外部表,内部表

Hive存储的各种字段类型,表属性

分区(其实就是目录的名字),分桶

DESCRIBE FORMATTED [表明]

 

Tez    Ambari

 

加载数据

LOAD DATA [LOCAL] INPATH 'fileppath' [OVERWRITE] INTO TABLE tablename

使用查询语句加载数据

INSERT [OVERWRITE] TABLE tablename [IF NOT EXISTS] SELECT select_fields FROM from_statement;

将查询到的数据写入到文件系统

INSERT [OVERWRITE] DIRECTORY directoryname SELECT select_fields FROM from_statement;

普通语句

INSERT INTO TABLE tablename VALUES(row_values1),(row_values2);
UPDATE tablename SET column=value [WHERE expression];
DELETE tablename [WHERE expression];

创建结构相同的表

CREATE TABLE blank_tablename LIKE tablename;

连接

SELECT table_fields FROM table_one JOIN table_two ON(table_one.key_1=table_two.key_2 AND table_one,kye_a=table_two.key_b)

外连接

SELECT table_fields FROM table_one [LEFT,RIGHT,FULL OUTER] JOIN table_two ON (t1.key1=t2.key2 AND t1.key_a=t2.key_b);

使用左半连接

SELECT a.key,a.value FROM a WHERE a.key in (SELECT b.key FROM b);

 

 

 

参考

HIVE基本概念原理

Hive和传统关系型数据库比较

Hive的文件存储格式

Hive的数据类型

Hive和Hbase的区别

Hive函数大全

 

 

 

 

 

你可能感兴趣的:(Hadoop)