Hadoop Hive基础SQL语法(DQL 操作:数据查询SQL)

3.1 基本的Select 操作


SELECT [ALL | DISTINCT] 字段名, 字段名, … FROM 表名 [WHERE 条件] [GROUP BY 列名 [HAVING 条件]] [ CLUSTER BY 列名 | [DISTRIBUTE BY 列名] [SORT BY | ORDER BY 列名]][LIMIT 数字]

•使用ALL和DISTINCT选项区分对重复记录的处理。默认是ALL,表示查询所有记录。DISTINCT表示去掉重复的记录

•Where 条件

  • 类似我们传统SQL的where 条件
  • 目前支持 AND,OR ,0.9版本支持between
  • IN, NOT IN
  • 不支持EXIST ,NOT EXIST

•ORDER BY与SORT BY的不同

  • ORDER BY 全局排序,只有一个Reduce任务
  • SORT BY 只在本机做排序

•Limit 可以限制查询的记录数

•REGEX Column Specification

SELECT 语句可以使用正则表达式做列选择,下面的语句查询除了 ds 和 hr 之外的所有列:

SELECT `(ds|hr)?+.+` FROM test

你可能感兴趣的:(hive入门)