sheygshsi

HiveSQL基础练习题

- 1.环境准备
- - 1.1建表语句
  - 1.2数据准备
  - 1.3插入数据
- 2.查询
- - 2.1 查询姓名中带“华”的学生名单
  - 2.2 查询姓“王”老师的个数
  - 2.3 检索课程编号为“04”且分数小于60的学生学号，结果按分数降序排列
  - 2.4 查询语文成绩 < 90分的学生和其对应的成绩，按照学号升序排序
  - 2.5 查询各学生的年龄（精确到月份）
  - 2.6 查询本月过生日的学生
  - 2.7 查询课程编号为“04”的总成绩
  - 2.8 查询参加考试的学生个数
  - 2.9 查询各科成绩最高和最低的分，以如下的形式显示：课程号，最高分，最低分
  - 2.10 查询每门课程有多少学生参加了考试（有考试成绩）
  - 2.11 查询男生、女生人数
  - 2.12 查询平均成绩大于60分学生的学号和平均成绩
  - 2.13 查询至少选修两门课程的学生学号
  - 2.14 统计同姓（假设每个学生姓名的第一个字为姓）的学生人数
  - 2.15查询每门课程的平均成绩，结果按平均成绩升序排序，平均成绩相同时，按课程号降序排列
  - 2.16 统计参加考试人数大于等于15的学科
  - 2.17 查询学生的总成绩并进行排名
  - 2.18 查询平均成绩大于60分的学生的学号和平均成绩
  - 2.19 按照如下格式显示学生的语文、数学、英语三科成绩，没有成绩的输出为0，按照学生的有效平均成绩降序显示
  - 2.20查询一共参加两门课程且其中一门为语文课程的学生的id和姓名
  - 2.21查询所有课程成绩小于60分学生的学号、姓名
  - 2.22查询没有学全所有课的学生的学号、姓名
  - 2.23查询出只选修了两门课程的全部学生的学号和姓名
  - 2.24查找1995年出生的学生名单
  - 2.25查询两门以上不及格课程的同学的学号及其平均成绩
  - 2.26 查询所有学生的学号、姓名、选课数、总成绩
  - 2.27查询平均成绩大于85的所有学生的学号、姓名和平均成绩
  - 2.28查询学生的选课情况：学号，姓名，课程号，课程名称
  - 2.29查询出每门课程的及格人数和不及格人数
  - 2.30 使用分段[100-85],[85-70],[70-60],[<60]来统计各科成绩，分别统计：各分数段人数，课程号和课程名称
  - 2.31 查询课程编号为03且课程成绩在80分以上的学生的学号和姓名
  - 2.32 （重要！行转列）使用sql实现将该表行转列为下面的表结构
  - 2.33 检索"01"课程分数小于60，按分数降序排列的学生信息
  - 2.34 查询任何一门课程成绩在70分以上的学生的姓名、课程名称和分数
  - 2.35 查询两门及其以上不及格课程的同学的学号，姓名及其平均成绩
  - 2.36 查询不同课程成绩相同的学生的学生编号、课程编号、学生成绩
  - 2.37 查询课程编号为“01”的课程比“02”的课程成绩高的所有学生的学号
  - 2.38 查询学过编号为“01”的课程并且也学过编号为“02”的课程的学生的学号、姓名
  - 2.39 查询学过“李体音”老师所教的所有课的同学的学号、姓名
  - 2.40 查询学过“李体音”老师所讲授的任意一门课程的学生的学号、姓名
  - 2.41 查询没学过"李体音"老师讲授的任一门课程的学生id及其学生姓名
  - 2.42 查询选修“李体音”老师所授课程的学生中成绩最高的学生姓名及其成绩
  - 2.43 查询至少有一门课与学号为“001”的学生所学课程相同的学生的学号和姓名
  - 2.44 查询所学课程与学号为“001”的学生所学课程完全相同的学生的学号和姓名
  - 2.45 查询学过与学号为“001”的学生全部所学课程的学生的学号和姓名
  - 2.46 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩
  - 2.47 查询每个学生的学生平均成绩及其名次
  - 2.48 按各科成绩进行排序，并显示在这个学科中的排名
  - 2.49 查询每门课程成绩最好的前两名学生姓名及成绩
  - 2.50 查询所有课程的成绩第2名到第3名的学生信息及该课程成绩
  - 2.51 查询各科成绩前三名的记录（如果有并列，则全部展示，例如如果前7名为：80,80,80,79,79,77,75,70，则统计结果为数字的前三名，结果为80,80,80,79,79,77）

题目来自于尚硅谷,笔者自己写的 SQL,不保证全部正确

1.环境准备

1.1建表语句

create database if not exists db_hive;
use db_hive;

--创建学生表
drop table if exists student;
create table if not exists student(
	stu_id string COMMENT '学生id',
	stu_name string COMMENT '学生姓名',
	birthday date COMMENT '出生日期',
	sex string COMMENT '性别'
)
row format delimited fields terminated by ','
stored as textfile;

--创建课程表
drop table if exists course;
create table if not exists course(
	course_id string COMMENT '课程id',
	course_name string COMMENT '课程名',
	tea_id string COMMENT '任课老师id'
)
row format delimited fields terminated by ','
stored as textfile;

--创建老师表
drop table if exists teacher;
create table if not exists teacher(
	tea_id string COMMENT '老师id',
	tea_name string COMMENT '老师姓名'
)
row format delimited fields terminated by ','
stored as textfile;

--创建分数表
drop table if exists score;
create table if not exists score(
	stu_id string COMMENT '学生id',
	course_id string COMMENT '课程id',
	grade int COMMENT '成绩'
)
row format delimited fields terminated by ','
stored as textfile;

1.2数据准备

创建/opt/module/data目录,将如下4个文件放到/opt/module/data目录下
以下是部分数据(自己准备数据)

[hyj@hadoop102 data]$ cat student.txt 
001,彭于晏,1995-05-16,男
002,胡歌,1994-03-20,男
003,周杰伦,1995-04-30,男
004,刘德华,1998-08-28,男
005,唐国强,1993-09-10,男
[hyj@hadoop102 data]$ cat course.txt 
01,语文,1003
02,数学,1001
03,英语,1004
04,体育,1002
05,音乐,1002
[hyj@hadoop102 data]$ cat teacher.txt 
1001,张高数
1002,李体音
1003,王子文
1004,刘丽英
[hyj@hadoop102 data]$ cat score.txt 
001,01,94
002,01,74
004,01,85
005,01,64
006,01,71
007,01,48
008,01,56
009,01,75

1.3插入数据

向表中加载数据

load data local inpath '/opt/module/data/student.txt' into table student;

load data local inpath '/opt/module/data/course.txt' into table course;

load data local inpath '/opt/module/data/teacher.txt' into table teacher;

load data local inpath '/opt/module/data/score.txt' into table score;

验证插入数据情况

select * from student limit 5;
select * from course limit 5;
select * from teacher limit 5;
select * from score limit 5;

2.查询

2.1 查询姓名中带“华”的学生名单

%代表任意个字符(0个或多个)
-代表一个字符

select * from student where stu_name like '%华%';

2.2 查询姓“王”老师的个数

select count(*) from teacher where tea_name like '王%';

2.3 检索课程编号为“04”且分数小于60的学生学号，结果按分数降序排列

select stu_id from score where course_id='04' and grade < 60 order by grade desc;

2.4 查询语文成绩 < 90分的学生和其对应的成绩，按照学号升序排序

select s2.stu_id,s2.stu_name,s1.grade from course c,score s1,student s2 where c.course_id=s1.course_id 
	and c.course_name="语文" and s1.stu_id=s2.stu_id and s1.grade < 90 order by s2.stu_id;

2.5 查询各学生的年龄（精确到月份）

获取年份
select year(‘2023-05-21’);

获取当前日期
select current_date();

获取月份
select month(‘2023-05-21’);

if条件判断: if(boolean testCondition, T valueTrue, T valueFalseOrNull)

select 
	stu_name, 
	concat(
		if(bir_year>=0,bir_year,bir_year-1),'岁',
		if(bir_month>=0,bir_month,bir_month+12),'个月'
	) as age
from (
	select 
		stu_name,
		year(current_date())-year(birthday) bir_year,
		month(current_date())-month(birthday) bir_month 	
	from student
) t;

2.6 查询本月过生日的学生

select * from student where month(birthday)=month(current_date());

2.7 查询课程编号为“04”的总成绩

方法一:
select '04' as course_id,sum(grade) as grade_sum from score where course_id='04';

方法二:
select course_id,sum(grade) as grade_sum from score where course_id='04' group by course_id;

2.8 查询参加考试的学生个数

思路：对成绩表中的学号做去重并count

select count(distinct(stu_id)) from score;
--或
select count(*) from (select distinct(stu_id) from score) t;

2.9 查询各科成绩最高和最低的分，以如下的形式显示：课程号，最高分，最低分

思路：按照学科分组并使用max和min。

select course_id,max(grade),min(grade) from score group by course_id;

2.10 查询每门课程有多少学生参加了考试（有考试成绩）

select course_id,count(*) from score group by course_id;

2.11 查询男生、女生人数

select sex,count(*) from student group by sex;

2.12 查询平均成绩大于60分学生的学号和平均成绩

select stu_id,avg(grade) avg_grade from score group by stu_id having avg_grade>60;

2.13 查询至少选修两门课程的学生学号

select stu_id,count(distinct course_id) course_num from score group by stu_id having course_num>=2;

2.14 统计同姓（假设每个学生姓名的第一个字为姓）的学生人数

思路：先提取出每个学生的姓并分组，如果分组的count>=2则为同姓

substring(str, pos[, len])
如:substring(“hellohive”,2,3) 从2位置开始截取3长度
注意:下标是从1开始的.

select first_stu_name,
	   count(*) as count_first_stu_name 
from (
	   select 
	  		substring(stu_name,1,1) first_stu_name 
	   from student
) t 
group by first_stu_name 
having count_first_stu_name>=2;

2.15查询每门课程的平均成绩，结果按平均成绩升序排序，平均成绩相同时，按课程号降序排列

select course_id,avg(grade) avg_grade from score group by course_id order by avg_grade asc,course_id desc;

2.16 统计参加考试人数大于等于15的学科

select course_id,count(stu_id) count_stu from score group by course_id having count_stu >= 15;

2.17 查询学生的总成绩并进行排名

select stu_id,sum(grade) sum_grade from score group by stu_id order by sum_grade desc;

2.18 查询平均成绩大于60分的学生的学号和平均成绩

思路：分组，avg，过滤>=60

select * from (select stu_id,avg(grade) avg_grade from score group by stu_id) t where avg_grade > 60;

2.19 按照如下格式显示学生的语文、数学、英语三科成绩，没有成绩的输出为0，按照学生的有效平均成绩降序显示

学生id 学生姓名语文数学英语有效课程数有效平均成绩

NVL( value，default_value) 函数

它的功能是如果value为NULL，则NVL函数返回default_value的值，否则返回value的值，如果两个参数都为NULL ，则返回NULL。

case when 判断:

语法1:

CASE
WHEN 条件1 THEN VALUE1
WHEN 条件2 THEN VALUE2
……
WHEN 条件N THEN VALUEN
ELSE 默认值
END

语法2:

CASE 列
WHEN V1 THEN VALUE1
WHEN V2 THEN VALUE2
……
WHEN VN THEN VALUEN
ELSE 默认值
END

select h.stu_id as `学生id`,student.stu_name as `学生姓名`,`语文`,`数学`,`英语`,`有效课程数`,`平均成绩`
from 
	(select 
		stu_id,
		max(case course_name when '语文' then grade else 0 end) as `语文`,
		max(case course_name when '数学' then grade else 0 end) as `数学`,
		max(case course_name when '英语' then grade else 0 end) as `英语`,
		count(*) as `有效课程数`,
		avg(grade) as `平均成绩`
	from 
		(select s.stu_id,c.course_name,s.grade  from course c join score s on c.course_id=s.course_id) t 
	group by stu_id
	order by avg(grade) desc
) h join student on h.stu_id=student.stu_id;

2.20查询一共参加两门课程且其中一门为语文课程的学生的id和姓名

select t2.stu_id,student.stu_name
from (
	select stu_id,count(*) cnt,sum(case course_name when '语文' then 1 else 0 end) as cond
	from
		(select g.stu_id,c.course_id,c.course_name from course c join score g on c.course_id=g.course_id) t1
	group by stu_id having cnt=2 and cond=1
) t2 join student on t2.stu_id=student.stu_id;

select t.stu_id,student.stu_name
from 
	(select 
		stu_id 
	from 
		score 
	where 
		stu_id in (select stu_id from score where course_id in (select course_id from course where course_name='语文')) 
	group by stu_id 
	having count(*)=2
) t join student on t.stu_id=student.stu_id;

2.21查询所有课程成绩小于60分学生的学号、姓名

select s.stu_id,s.stu_name,t.max_grade 
from (
	select stu_id,max(grade) max_grade from score group by stu_id having max_grade <60
) t join student s on t.stu_id=s.stu_id;

2.22查询没有学全所有课的学生的学号、姓名

解释：没有学全所有课，也就是该学生选修的课程数 < 总的课程数

select stu_id,stu_name
from (
	select student.stu_id,student.stu_name,score.course_id from score join student on score.stu_id=student.stu_id
) t 
group by stu_id,stu_name 
having count(course_id) < (select count(course_id) from course);

2.23查询出只选修了两门课程的全部学生的学号和姓名

解释：学生选修的课程数=2

select s.stu_id,s.stu_name
from (
	select stu_id from score group by stu_id having count(score.course_id)=2
) t join student s on t.stu_id=s.stu_id;

select stu_id,stu_name
from
	student 
where stu_id in (select stu_id from score group by stu_id having count(score.course_id)=2);

2.24查找1995年出生的学生名单

date_format() 函数: 格式化日期
select date_format(‘2023-05-23 15:58:43’,‘yyyy/MM/dd HH:mm:ss’);

select * from student where date_format(birthday,'yyyy')='1995';

2.25查询两门以上不及格课程的同学的学号及其平均成绩

先找出有两门以上不及格的学生名单，按照学生分组，过滤组内成绩低于60的并进行count，count>=2。
接着做出一张表查询学生的平均成绩并和上一个子查询中的学生学号进行连接

select s.stu_id,avg(s.grade) as avg_grade
from score s where s.stu_id in
(
	select stu_id
	from 
		score 
	where grade<60
	group by stu_id
	having count(*)>=2
)
group by s.stu_id;

2.26 查询所有学生的学号、姓名、选课数、总成绩

select t.stu_id,s.stu_name,`选课数`,`总成绩`
from (
	select stu_id,count(course_id) as `选课数`,sum(grade) as `总成绩` from score group by stu_id
) t join student s on t.stu_id=s.stu_id;

2.27查询平均成绩大于85的所有学生的学号、姓名和平均成绩

select student.stu_id,student.stu_name,t.avg_grade
from (
	select stu_id,avg(grade) avg_grade from score group by stu_id having avg_grade > 85
) t join student on t.stu_id=student.stu_id;

select distinct stu_id,stu_name,avg_grade
from(
	select t.stu_id,t.stu_name,avg(grade) over(partition by s.stu_id) avg_grade
	from 
		score s left join student t on s.stu_id=t.stu_id
) t 
where t.avg_grade>85;

2.28查询学生的选课情况：学号，姓名，课程号，课程名称

select t.stu_id,t.stu_name,m.course_id,m.course_name 
from student t left join (
	select s.stu_id,c.course_id,c.course_name from score s left join course c on s.course_id=c.course_id
) m on t.stu_id=m.stu_id;

2.29查询出每门课程的及格人数和不及格人数

select 
	s.course_id,
	c.course_name,
	sum(case when grade>=60 then 1 else 0 end) as `及格人数`,
	sum(case when grade<60 then 1 else 0 end) as `不及格人数` 
from score s left join course c on s.course_id=c.course_id 
group by s.course_id,c.course_name;

2.30 使用分段[100-85],[85-70],[70-60],[<60]来统计各科成绩，分别统计：各分数段人数，课程号和课程名称

select 
	sum(case when grade<=100 and grade >85 then 1 else 0 end) `[100-85]`,
	sum(case when grade<=85 and grade>70 then 1 else 0 end) `[85-70]`,
	sum(case when grade<=70 and grade>60 then 1 else 0 end) `[70-60]`,
	sum(case when grade<60 then 1 else 0 end) `[<60]`,
	s.course_id,
	c.course_name 
from score s left join course c on s.course_id=c.course_id 
group by s.course_id,c.course_name;

2.31 查询课程编号为03且课程成绩在80分以上的学生的学号和姓名

select stu_id,stu_name 
from 
	student 
where stu_id in 
	(select stu_id from score where course_id='03' and grade>80);

select t.stu_id,t.stu_name,c.course_id,c.course_name,grade
from 
	score s inner join course c on s.course_id=c.course_id inner join student t on s.stu_id=t.stu_id 
where c.course_id='03' and s.grade>80;

2.32 （重要！行转列）使用sql实现将该表行转列为下面的表结构

如果没有该课程成绩用0代替。
学号课程01 课程02 课程03 课程04

select 
	stu_id,
	max(case course_id when '01' then grade else 0 end) `课程01`, 
	max(case course_id when '02' then grade else 0 end) `课程02`,
	max(case course_id when '03' then grade else 0 end) `课程03`,
	max(case course_id when '04' then grade else 0 end) `课程04`
from 
	score 
group by stu_id;

2.33 检索"01"课程分数小于60，按分数降序排列的学生信息

select s.*,t.grade 
from 
	student s join (select stu_id,grade from score where course_id='01' and grade < 60) t on s.stu_id=t.stu_id
order by t.grade desc;

2.34 查询任何一门课程成绩在70分以上的学生的姓名、课程名称和分数

只要有一门课程超70分：

select t.stu_name,c.course_name,grade
from
	score s join course c on s.course_id=c.course_id join student t on s.stu_id=t.stu_id 
where s.grade>70;

所有的课程都在70分以上：

select t.stu_id,t.stu_name,c.course_name,s.grade
from 
	student t join score s on t.stu_id=s.stu_id join course c on s.course_id=c.course_id
where t.stu_id in
	(select stu_id from score group by stu_id having min(grade)>70)
order by t.stu_id;

2.35 查询两门及其以上不及格课程的同学的学号，姓名及其平均成绩

知识点：分组 + 条件 + 多表连接
思路：计算每个学号不及格分数个数，筛选出大于2个的学号并找出姓名，平均成绩

select s.stu_id,s.stu_name,t.avg_grade
from(
	select stu_id,avg(grade) avg_grade 
	from 
		score 
	where stu_id in (select stu_id from score where grade<60 group by stu_id having count(*)>=2)
	group by stu_id
) t join student s on t.stu_id=s.stu_id;

2.36 查询不同课程成绩相同的学生的学生编号、课程编号、学生成绩

select s1.*
from score s1 inner join score s2 on s1.stu_id=s2.stu_id and s1.course_id<>s2.course_id and s1.grade=s2.grade;

2.37 查询课程编号为“01”的课程比“02”的课程成绩高的所有学生的学号

select stu_id
from(
	select 
		stu_id,
		max(case when course_id='01' then grade else 0 end) course_01,
		max(case when course_id='02' then grade else 0 end) course_02
	from 
		score 
	where score.course_id='01' or score.course_id='02'
	group by stu_id 
	having count(*) =2
) t where course_01>course_02;

2.38 查询学过编号为“01”的课程并且也学过编号为“02”的课程的学生的学号、姓名

select stu_id,stu_name
from student 
where stu_id in
(
	select 
		stu_id
	from 
		score 
	where score.course_id='01' or score.course_id='02'
	group by stu_id 
	having count(*) =2
) ;

2.39 查询学过“李体音”老师所教的所有课的同学的学号、姓名

size() 求集合中元素的个数 size(Map) size(Array)

concat_set(colName) 用于将一列中的多行合并为一行,并进行去重,返回Array类型字段。而COLLECT_LIST(col) 不进行去重。

--先查询李体音老师所教的课程,并计算其所教的课程数
select stu_id,stu_name
from
	student 
where stu_id in
(
	select score.stu_id
	from(
		select course_id, count_course
		from 
			(select collect_set(course_id) course_ids,size(collect_set(course_id)) count_course 
			 from 
			 	course where tea_id in (select tea_id from teacher where tea_name='李体音')
			 ) a
		lateral view explode(course_ids) b as course_id
	) t join score on t.course_id=score.course_id
	group by score.stu_id
	having count(*)=max(count_course)
);

2.40 查询学过“李体音”老师所讲授的任意一门课程的学生的学号、姓名

select s.stu_id,s.stu_name
from (
	select stu_id
	from 
		score s join (select course_id from course where tea_id in (select tea_id from teacher where tea_name='李体音')) t on s.course_id=t.course_id
	group by stu_id
	having count(*)=1
) a join student s on a.stu_id=s.stu_id;

--查询只学过一门“李体音”老师所讲授的课程的学生的学号、姓名
select stu_id,stu_name
from student 
where stu_id in
	(select stu_id 
	 from
		score 
	 where course_id in
		(select course_id from course where tea_id in (select tea_id from teacher where tea_name='李体音'))
	)
;

2.41 查询没学过"李体音"老师讲授的任一门课程的学生id及其学生姓名

select stu_id,stu_name
from 
	student 
where stu_id not in (
	select 
		distinct stu_id 
	from score s join 
		(select course_id from course where tea_id in (select tea_id from teacher where tea_name='李体音')) t
		on s.course_id=t.course_id
);

2.42 查询选修“李体音”老师所授课程的学生中成绩最高的学生姓名及其成绩

（与上题类似,用成绩排名，用 limit 1得出最高一个）

select student.stu_name,grade
from 
student join (
	select stu_id,grade 
	from 
		score s join (
			select course_id from course where tea_id in (select tea_id from teacher where tea_name='李体音')
		) t on s.course_id=t.course_id
	order by grade desc  
	limit 1
	) a on a.stu_id=student.stu_id
;

2.43 查询至少有一门课与学号为“001”的学生所学课程相同的学生的学号和姓名

select stu_id,stu_name 
from student where stu_id in (
	select distinct stu_id 
	from 
		score 
	where stu_id!='001' and course_id in (select course_id from score where stu_id='001')
);

2.44 查询所学课程与学号为“001”的学生所学课程完全相同的学生的学号和姓名

concat_ws(SplitChar，element1，element2……) 用于实现字符串拼接，可以指定分隔符。
注意: CONCAT_WS must be "string or array"

array(n0, n1…) 创建一个数组
sort_array(array(obj1, obj2,…)) 对数组中的元素进行升序排序
select sort_array(array(‘021’,‘3’,‘21’,‘87’));
select sort_array(array(29,4,22,1,4,32,5));

select stu_id,stu_name
from 
	student 
where stu_id in (
	select stu_id
	from 
		(select stu_id,concat_ws(',',sort_array(collect_list(course_id))) as course_ids from score group by stu_id) t2
	where stu_id!='001' and course_ids=(select concat_ws(',',sort_array(collect_list(course_id))) as course_ids from score where stu_id='001')
);

2.45 查询学过与学号为“001”的学生全部所学课程的学生的学号和姓名

select stu_id,stu_name
from
	student 
where stu_id in (
	select stu_id 
	from 
		score join 
		(select course_id, course_nums
		 from 
			(select collect_list(course_id) as course_ids,count(*) course_nums from score where stu_id='001') t1 lateral view explode(course_ids) l as course_id
		) t2 on score.course_id=t2.course_id
	where stu_id!='001'
	group by stu_id
	having count(*)=max(course_nums) --因为分组后的course_nums列可能有好几个值,只取一个
);

2.46 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

select stu_name,course_name,grade,avg_grade
from 
	student join (
		select stu_id,course_name,grade,avg(grade) over(partition by stu_id) avg_grade
		from (
			select s.stu_id,c.course_id,c.course_name,s.grade from course c join score s on c.course_id=s.course_id
			) t1
		) t2 on student.stu_id=t2.stu_id
order by avg_grade desc,student.stu_id asc
;

2.47 查询每个学生的学生平均成绩及其名次

取整函数: round 返回double类型的整数值部分（遵循四舍五入）
select round(3.1415926);

指定精度取整函数: round(double a, int d) 返回指定精度d的double类型
select round(3.1415926,4); --3.1416

-- RANK() 排序相同时会重复，总数不会变
select s.*,avg_grade,rank() over(order by avg_grade desc)
from 
	student s left join 
		(select stu_id,round(avg(grade),2) avg_grade from score group by stu_id) t 
	on s.stu_id=t.stu_id
;

2.48 按各科成绩进行排序，并显示在这个学科中的排名

select 
	stu_id,
	stu_name,
	course_name,
	grade,
	rank() over(partition by course_name order by grade desc)
from (
	select s1.stu_id,s1.stu_name,c.course_name,s2.grade
	from student s1 join score s2 on s1.stu_id=s2.stu_id join course c on s2.course_id=c.course_id
) t;

2.49 查询每门课程成绩最好的前两名学生姓名及成绩

窗口函数排名+多表连接+条件

select course_name,stu_name,grade,rk
from (
	select
		stu_name,
		course_name,
		grade,
		rank() over(partition by course_name order by grade desc) as rk
	from (
		select s1.stu_name,c.course_name,s2.grade from student s1 join score s2 on s1.stu_id=s2.stu_id join course c on s2.course_id=c.course_id
	) t
) t2 where rk<=2;

2.50 查询所有课程的成绩第2名到第3名的学生信息及该课程成绩

select *
from (
	select
		t1.*,
		rank() over(partition by course_name order by grade desc) as rk
	from (
		select s1.*,c.course_name,s2.grade from student s1 join score s2 on s1.stu_id=s2.stu_id join course c on s2.course_id=c.course_id
	) t1
) t2 where rk=2 or rk=3;

2.51 查询各科成绩前三名的记录（如果有并列，则全部展示，例如如果前7名为：80,80,80,79,79,77,75,70，则统计结果为数字的前三名，结果为80,80,80,79,79,77）

--DENSE_RANK() 排序相同时会重复，总数会减少
select *
from (
	select 
		s2.stu_id,
		s2.stu_name,
		c.course_name,
		s1.grade,
		dense_rank() over(partition by c.course_name order by s1.grade desc) rk
	from teacher t 
		join course c on t.tea_id=c.tea_id 
		join score s1 on c.course_id=s1.course_id 
		join student s2 on s1.stu_id=s2.stu_id
) temp where rk<=3;

你可能感兴趣的:(hive,数据仓库,HiveSQL)

数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
Presto【基础 01】简介+架构+数据源+数据模型 2401_84254343 程序员架构
一个Catalog包含Schema和Connector。例如，配置JMX的Catalog，通过JXMConnector访问JXM信息。当执行一条SQL语句时，可以同时运行在多个Catalog。Presto处理table时，是通过表的完全限定（fully-qualified）名来找到Catalog。例如，一个表的权限定名是hive.test_data.test，则test是表名，test_data是
数据仓库介绍阿龙的代码在报错数据分析数据仓库数据库
数据仓库数据仓库的概念数据仓库的主要特征数据仓库的主流开发语言-sql结构化数据sql语句数据仓库的概念数据仓库（英语：DataWarehouse，简称数仓、DW）,是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分析的集成化数据环境，分析结果为企业提供决策支持（DecisionSupport）。就是数据仓库只分析数据并不产生数据数据仓库的主要特征1、面向主题主题是一个抽象的概念，是
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
大数据之flink与hive 星辰_mya 大数据 flink hive
其实吧我不太想写flink，因为线上经验确实不多，这也是我需要补的地方，没有条件创造条件，先来一篇吧flink：高性能低延迟流批一体的分布式计算框架基于事件时间对实时数据精准处理快速响应支持批处理，高效离线分析和数据挖掘数据仓库的引擎丰富数据源/接收器，集成多种数据存储格式和源，比较常见就是咱们今天的主题hive了checkpoint恢复机制，故障恢复快速恢复计算任务分布式弹性扩展，据业务灵活增加
hive血缘关系之输入表与目标表的解析 zxfBdd hive 大数据治理大数据
接了一个新需求：需要做数据仓库的血缘关系。正所谓兵来将挡水来土掩，那咱就动手吧。血缘关系是数据治理的一块，其实有专门的第三方数据治理框架，但考虑到目前的线上环境已经趋于稳定，引入新的框架无疑是劳民伤财，伤筋动骨，所以就想以最小的代价把这个事情给做了。目前我们考虑做的血缘关系呢只是做输入表和输出表，最后会形成一张表与表之间的链路图。这个东西的好处就是有助于仓库人员梳理业务，后面可能还会做字段之间的血
初级练习[3]:Hive SQL子查询应用大数据深度洞察 Hive hive sql hadoop 数据仓库大数据数据库
目录环境准备看如下链接子查询查询所有课程成绩均小于60分的学生的学号、姓名查询没有学全所有课的学生的学号、姓名解释：没有学全所有课，也就是该学生选修的课程数<总的课程数。查询出只选修了三门课程的全部学生的学号和姓名环境准备看如下链接环境准备https://blog.csdn.net/qq_45115959/article/details/142057624?spm=1001.2014.3001.5
Linux下载压缩包：tar.gz、zip、tar.bz2格式全攻略 promise524 Linux linux 运维服务器后端 bash shell
在Linux中，下载各种格式的压缩包（如.tar.gz、.zip、.tar.bz2等）通常使用命令行工具如wget和curl。1.使用wget下载压缩包wget是Linux中最常用的文件下载工具，支持HTTP、HTTPS、FTP等协议，可以直接从命令行下载文件。基本命令：wget[URL]下载.tar.gz文件wgethttps://test.com/archive.tar.gz此命令将从指定的U
Anaconda版本和Python版本对应关系纬领网络 python anaconda3
官网下载地址：https://repo.anaconda.com/archive/下载地址：https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/anaconda3版本基础python版本Anaconda3-2024.06-1Python3.12.4Anaconda3-2024.02-1Python3.11.7Anaconda3-2023.09
影响数据分析导致数据建模错误！你可能都没发觉的几个小细节丨程序之道丨
如果你有一个目标，想获得所有这些数据的可操作的见解，并一直在收集。那么，你如何确定模型的数据，以便实际上可以获得这些见解，并回答你的业务问题?你的计划。当规划阶段不充分或不完全，其结果是可怕的。那么分析和性能、数据完整性和安全性的问题接踵而至，将会使日常的维护和发展的成本达到了不必要的水平。避免常见的建模错误1.开始实施时没有明确的行动计划当涉及到的分析，如数据仓库或Elasticube建模数据资
从零到一建设数据中台 - 架构概览我码玄黄从零到一建设数据中台架构数据中台中台架构
数据中台功能架构概览数据中台相关名词解释1.数据仓库：数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合，用于支持管理决策。因此，其重点在于数据的集合。数据仓库可使用维度建模方法论从业务过程中抽象出通用维度与度量，组成数据模型，为决策分析提供通用的数据分析能力。数据仓库重在建数据，而数据中台则将建、治、管、服放到同样的高度，数据仓库只是数据中台的一个子集。用一个蔬菜储存的例子来简
R语言包AMORE安装报错问题以及RStudio与Rtools环境配置卡卡_R-Python R语言数据分析与可视化 r语言开发语言
在使用R语言进行AMORE安装时会遇到报错，这时候需要采用解决办法：'''AMORE包安装，需要离线官网下载安装包：Indexof/src/contrib/Archive/AMORE(r-project.org)https://cran.r-project.org/src/contrib/Archive/AMORE/一、出现的问题最近开始学习R语言，安装了最新版的R4.4.1和RStudio，但安
中级练习[3]：Hive SQL用户行为与商品销售数据分析大数据深度洞察 Hive hive 数据仓库大数据 sql
目录1.用户累计消费金额及VIP等级查询1.1题目需求1.2代码实现2.首次下单后第二天连续下单的用户比率查询2.1题目需求2.2代码实现3.每个商品销售首年的年份、销售数量和销售金额统计3.1题目需求3.2代码实现1.用户累计消费金额及VIP等级查询1.1题目需求从订单信息表(order_info)中统计每个用户截止其每个下单日期的累积消费金额，以及每个用户在其每个下单日期的VIP等级。VIP等
Python基础知识进阶之正则表达式_头歌python正则表达式进阶前端陈萨龙程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
离线数仓VS实时数仓 james二次元数据仓库数据仓库大数据
离线数据仓库（OfflineDataWarehouse）和实时数据仓库（Real-timeDataWarehouse）的实施有一些相似之处，但也存在显著的差异。以下是两者在几个关键方面的对比：相同点：数据集成：都需要从多个数据源提取、转换和加载数据（ETL/ELT）。都需要处理数据清洗、去重和规范化，以保证数据的一致性和准确性。数据建模：都需要进行数据建模，设计数据仓库的星型或雪花模型，定义事实表
编程常用命令总结 Yellow0523 Linux BigData 大数据
编程命令大全1.软件环境变量的配置JavaScalaSparkHadoopHive2.大数据软件常用命令Spark基本命令Spark-SQL命令Hive命令HDFS命令YARN命令Zookeeper命令kafka命令Hibench命令MySQL命令3.Linux常用命令Git命令conda命令pip命令查看Linux系统的详细信息查看Linux系统架构(X86还是ARM，两种方法都可)端口号命令L
博客园怎么了？ YYH1992
新年好，给大家拜个早年！今年来到安徽过年，无聊中，不知不觉中又来到博客园了（忠实粉丝哦），却发现一件奇怪的事情，请看截图难道博客园被挂马了？抑或其它问题？如果真有问题，还请dudu抓紧时间修正，免得影响我们园子的声誉！我要下线了，出去买回家的车票了，只能年后回家了。。。转载于:https://www.cnblogs.com/HollisYao/archive/2008/02/06/1065351.
数仓建模之维度表&指标表锵锵锵锵~蒋数据研发数据仓库数据研发
在数据仓库中，维度和指标是两个重要的概念。维度（Dimension）：维度是一种描述业务过程中各种属性的方法，用于对业务过程进行分析和归类。维度包括时间、地点、人员、产品、客户等各种业务属性，是数据分析的基础。指标（Measure）：指标是衡量业务过程效果的标准，是数据分析的重要指标。指标包括数量、金额、时间、比率、百分比等，用于衡量业务过程的各种结果。在数据仓库中，通常会使用维度表和指标表来进行
Hadoop常见面试题整理及解答叶青舟 Linux hdfs 大数据 hadoop linux
Hadoop常见面试题整理及解答一、基础知识篇：1.把数据仓库从传统关系型数据库转到hadoop有什么优势？答：（1）关系型数据库成本高，且存储空间有限。而Hadoop使用较为廉价的机器存储数据，且Hadoop可以将大量机器构建成一个集群，并在集群中使用HDFS文件系统统一管理数据，极大的提高了数据的存储及处理能力。（2）关系型数据库仅支持标准结构化数据格式，Hadoop不仅支持标准结构化数据格式
linux下文件的复制、移动与删除搬砖中年人
一、文件复制命令cp命令格式：cp[-adfilprsu]源文件(source)目标文件(destination)cp[option]source1source2source3...directory参数说明：-a:是指archive的意思，也说是指复制所有的目录-d:若源文件为连接文件(linkfile)，则复制连接文件属性而非文件本身-f:强制(force)，若有重复或其它疑问时，不会询问用户
2024年最全使用Python求解方程_python解方程(1)，字节面试官迟到 2401_84569545 程序员 python 学习面试
最后硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是
一文说清什么是数据仓库数据分析小兵数据中台系列 spark 大数据分布式数据分析数据挖掘数据仓库
01数据仓库的概念数据仓库的概念可以追溯到20世纪80年代，当时IBM的研究人员开发出了“商业数据仓库”。本质上，数据仓库试图提供一种从操作型系统到决策支持环境的数据流架构模型。目前对数据仓库（DataWarehouse）的标准定义，业界普遍比较认可的是由数据仓库之父比尔·恩门（BillInmon）在1991年出版的“BuildingtheDataWarehouse”（《建立数据仓库》）一书中所提
美团点评酒旅数据仓库建设实践大数据金猫数据仓库
美团点评酒旅数据仓库建设实践：https://tech.meituan.com/2017/05/26/hotel-dw-layer-topic.html
兼容 Trino Connector，扩展 Apache Doris 数据源接入能力｜Lakehouse 使用手册 vvvae1234 apache
ApacheDoris内置支持包括Hive、Iceberg、Hudi、Paimon、LakeSoul、JDBC在内的多种Catalog，并为其提供原生高性能且稳定的访问能力，以满足与数据湖的集成需求。而随着ApacheDoris用户的增加，新的数据源连接需求也随之增加。因此，从3.0版本开始，ApacheDoris引入了TrinoConnector兼容框架。Trino/Presto作为业界较早应用
SAP HANA makaitai BW sap 数据库工具报表 layer 服务器
原文地址：http://LiuAlex.com/archives/1776也是刚刚开始学习HANA的一些知识，一边看书一遍做笔记，说到底无非是用自己的语言来理解标准帮组文档所讲解的意思，肯定有理解失误的地方，毕竟没有参加过标准培训，即使有培训，从老师那边来的知识也不可能是完整的传授过来，中间多少的知识遗漏是正常的，所以多看看HELP的文档，应该可以原汁原味的理解作者的意思。这张图片是从SAPHAN
Hive SQL查询汇总分析大数据深度洞察 Hive hive sql hadoop 数据仓库数据库大数据
目录SQL查询汇总分析成绩查询查询编号为“02”的课程的总成绩查询参加考试的学生个数分组查询查询各科成绩最高和最低的分查询每门课程有多少学生参加了考试（有考试成绩）查询男生、女生人数分组结果的条件查询平均成绩大于60分的学生的学号和平均成绩查询至少选修四门课程的学生学号查询同姓（假设每个学生姓名的第一个字为姓）的学生名单并统计同姓人数大于2的姓查询每门课程的平均成绩，结果按平均成绩升序排序，平均成
RMAN-08137 rman delete archivelog force jnrjian 数据库 oracle
deleteforcearchiveloguntiltime'trunc(sysdate-4)'backedup1timestodevicetypedisk;SymptomsDatabaseAClonedtoDatabaseBonCloneserver.GoldenGateisConfiguredonSourcedatbaseA.DatabaseBwhichisclonedfromSourcedo
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f