Hive SQL查询汇总分析

目录

SQL查询汇总分析

成绩查询

 查询编号为“02”的课程的总成绩

 查询参加考试的学生个数

分组查询

 查询各科成绩最高和最低的分

 查询每门课程有多少学生参加了考试(有考试成绩)

 查询男生、女生人数

 分组结果的条件

查询平均成绩大于60分的学生的学号和平均成绩

 查询至少选修四门课程的学生学号

 查询同姓(假设每个学生姓名的第一个字为姓)的学生名单并统计同姓人数大于2的姓

 查询每门课程的平均成绩,结果按平均成绩升序排序,平均成绩相同时,按课程号降序排列

 统计参加考试人数大于等于15的学科

 查询结果排序 & 分组指定条件

 查询学生的总成绩并按照总成绩降序排序

 按照如下格式显示学生的语文、数学、英语三科成绩,没有成绩的输出为0,按照学生的有效平均成绩降序显示

查询一共参加三门课程且其中一门为语文课程的学生的id和姓名


SQL查询汇总分析

环境准备看如下链接

环境准备icon-default.png?t=O83Ahttps://blog.csdn.net/qq_45115959/article/details/142057624?spm=1001.2014.3001.5501​​​​​​​  

成绩查询

 查询编号为“02”的课程的总成绩
hive>
select
  course_id,
  sum(score) score_sum
from score_info
where course_id='02'
group by course_id;

结果

course_id score_sum
02 1133

 查询参加考试的学生个数

思路: 对成绩表中的学号做去重并count

hive>
select
  count(distinct stu_id) stu_num
from score_info;

结果

stu_num
19

分组查询
 查询各科成绩最高和最低的分

思路: 按照学科分组并使用max和min。

hive> 
select
  course_id,
  max(score) max_score,
  min(score) min_score
from score_info
group by course_id;

结果

course_id max_score min_score
01 94 38
02 93 34
03 99 32
04 100 34
05 87 59

 查询每门课程有多少学生参加了考试(有考试成绩)
hive> 
select
  course_id,
  count(stu_id) stu_num
from score_info
group by course_id;

结果

course_id stu_num
01 19
02 19
03 19
04 12
05 5

 查询男生、女生人数
hive>
select
  sex,
  count(stu_id) count
from student_info
group by sex;

结果

sex count
9
11

 分组结果的条件
查询平均成绩大于60分的学生的学号和平均成绩

思路分析

  1. 平均成绩:展开来说就是计算每个学生的平均成绩。
  2. 这里涉及到“每个”就是要分组了。
  3. 平均成绩大于60分,就是对分组结果指定条件。
  4. 首先要分组求出每个学生的平均成绩,筛选高于60分的,并反查出这批学生,统计出这些学生总的平均成绩。

HQL实操

hive> 
select
  stu_id,
  avg(score) score_avg
from score_info
group by stu_id
having score_avg > 60; 
 

你可能感兴趣的:(Hive,hive,sql,hadoop,数据仓库,数据库,大数据)