create table test2(
stu_id int,
class_name string,
score int)
row format delimited fields terminated by ',';
0: jdbc:hive2://hadoop102:10000> select * from test2;
操作符 | 支持的数据类型 | 描述 |
A=B | 基本数据类型 | 如果A等于B则返回TRUE,反之返回FALSE |
A<=>B | 基本数据类型 | 如果A和B都为NULL,则返回TRUE,如果一边为NULL,返回False |
A<>B, A!=B | 基本数据类型 | A或者B为NULL则返回NULL;如果A不等于B,则返回TRUE,反之返回FALSE |
A | 基本数据类型 | A或者B为NULL,则返回NULL;如果A小于B,则返回TRUE,反之返回FALSE |
A<=B | 基本数据类型 | A或者B为NULL,则返回NULL;如果A小于等于B,则返回TRUE,反之返回FALSE |
A>B | 基本数据类型 | A或者B为NULL,则返回NULL;如果A大于B,则返回TRUE,反之返回FALSE |
A>=B | 基本数据类型 | A或者B为NULL,则返回NULL;如果A大于等于B,则返回TRUE,反之返回FALSE |
A [NOT] BETWEEN B AND C | 基本数据类型 | 如果A,B或者C任一为NULL,则结果为NULL。如果A的值大于等于B而且小于或等于C,则结果为TRUE,反之为FALSE。如果使用NOT关键字则可达到相反的效果。 |
A IS NULL | 所有数据类型 | 如果A等于NULL,则返回TRUE,反之返回FALSE |
A IS NOT NULL | 所有数据类型 | 如果A不等于NULL,则返回TRUE,反之返回FALSE |
IN(数值1, 数值2) | 所有数据类型 | 使用 IN运算显示列表中的值 |
A [NOT] LIKE B | STRING 类型 | B是一个SQL下的简单正则表达式,也叫通配符模式,如果A与其匹配的话,则返回TRUE;反之返回FALSE。B的表达式说明如下:‘x%’表示A必须以字母‘x’开头,‘%x’表示A必须以字母’x’结尾,而‘%x%’表示A包含有字母’x’,可以位于开头,结尾或者字符串中间。如果使用NOT关键字则可达到相反的效果。 |
A RLIKE B, A REGEXP B | STRING 类型 | B是基于java的正则表达式,如果A与其匹配,则返回TRUE;反之返回FALSE。匹配使用的是JDK中的正则表达式接口实现的,因为正则也依据其中的规则。例如,正则表达式必须和整个字符串A相匹配,而不是只需与其字符串匹配。 |
select * from test2 where score=90;
| test2.stu_id | test2.class_name | test2.score |
| 1001 | BigData | 90 |
| 1005 | BigData | 90 |
select * from test2 where score between 80 and 90;
| test2.stu_id | test2.class_name | test2.score |
| 1001 | BigData | 90 |
| 1005 | BigData | 90 |
| 1009 | BigData | 89 |
| 1012 | BigData | 84 |
select * from test2 where stu_id is null;
| test2.stu_id | test2.class_name | test2.score |
select * from test2 where score in (90,100);
| test2.stu_id | test2.class_name | test2.score |
| 1001 | BigData | 90 |
| 1003 | BigData | 100 |
| 1005 | BigData | 90 |
| 1007 | BigData | 100 |
% 代表零个或多个字符(任意个字符)。
_ 代表一个字符。
select * from test2 where stu_id like '101%';
| test2.stu_id | test2.class_name | test2.score |
| 1010 | BigData | 78 |
| 1011 | BigData | 91 |
| 1012 | BigData | 84 |
select * from test2 where stu_id like '___1';
| test2.stu_id | test2.class_name | test2.score |
| 1001 | BigData | 90 |
| 1011 | BigData | 91 |
select * from test2 where class_name rlike '[B]';
操作符 | 含义 |
AND | 逻辑并 |
OR | 逻辑或 |
NOT | 逻辑否 |
select * from test2 where score>90 and stu_id like '101%';
| test2.stu_id | test2.class_name | test2.score |
| 1011 | BigData | 91 |
select * from test2 where score>95 or stu_id like '101%';
| test2.stu_id | test2.class_name | test2.score |
| 1003 | BigData | 100 |
| 1004 | BigData | 99 |
| 1007 | BigData | 100 |
| 1010 | BigData | 78 |
| 1011 | BigData | 91 |
| 1012 | BigData | 84 |
select * from test2 where stu_id not in (1001,1002,1003,1004,1005,1010);
| test2.stu_id | test2.class_name | test2.score |
| 1006 | BigData | 94 |
| 1007 | BigData | 100 |
| 1008 | BigData | 93 |
| 1009 | BigData | 89 |
| 1011 | BigData | 91 |
| 1012 | BigData | 84 |
GROUP BY语句通常会和聚合函数一起使用,按照一个或者多个列队结果进行分组,然后对每个组执行聚合操作。
select class_id,avg(score) as avg_score from test2 group by class_id;
| class_id | avg_score |
| class1 | 94.66666666666667 |
| class2 | 94.33333333333333 |
| class3 | 94.0 |
| class4 | 84.33333333333333 |
select class_id,max(score) as max_score from test2 group by class_id;
| class_id | max_score |
| class1 | 100 |
| class2 | 99 |
| class3 | 100 |
| class4 | 91 |
(2)having只用于group by分组统计语句。
select class_id,avg(score) as avg_score from test2 group by class_id having avg_score>94.5;
| class_id | avg_score |
| class1 | 94.66666666666667 |