经典Hive SQL面试题

第一题

找出所有科目成绩都大于某一学科平均成绩的学生

数据集如下：

uid	 subject_id  score
1001  01  90
1001  02  90
1001  03  90
1002  01  85
1002  02  85
1002  03  70
1003  01  70
1003  02  70
1003  03  85

数据准备

create table score(
	uid string,
	subject_id string,
	score int)
row format delimited fields terminated by '\t';

实现SQL

select
	uid
from(
	select
		uid,
		if(score>avg_score,0,1) flag
	from(
		select
			uid,
			score,
			avg(score) over(partition by subject_id) avg_score
		from score
	) t1
) t2
group by uid
having sum(flag)=0;

第二题

我们有如下的用户访问数据

userId visitDate visitCount
u01 2017/1/21 5
u02 2017/1/23 6
u03 2017/1/22 8
u04 2017/1/20 3
u01 2017/1/23 6
u01 2017/2/21 8
U02 2017/1/23 6
U01 2017/2/22 4

要求使用SQL统计出每个用户的累积访问次数，如下表所示：

用户id 月份 小计 累积
u01 2017-01 11 11
u01 2017-02 12 23
u02 2017-01 12 12
u03 2017-01 8 8
u04 2017-01 3 3

数据准备

CREATE TABLE action( 
    userId string, 
    visitDate string,
    visitCount int)
ROW format delimited FIELDS TERMINATED BY "\t";

INSERT INTO TABLE action VALUES
('u01', '2017/1/21', 5),
('u02', '2017/1/23', 6),
('u03', '2017/1/22', 8),
('u04', '2017/1/20', 3),
('u01', '2017/1/23', 6),
('u01', '2017/2/21', 8),
('u02', '2017/1/23', 6),
('u01', '2017/2/22', 4);

实现SQL

SELECT
	t2.userid,
	t2.visitmonth,
	subtotal_visit_cnt,
	sum(subtotal_visit_cnt) over (partition BY userid ORDER BY visitmonth) as total_visit_cnt
FROM(
    SELECT
        userid,
        visitmonth,
        sum(visitcount) as subtotal_visit_cnt
	FROM(
        SELECT
        	userid,
			date_format(regexp_replace(visitdate,'/','-'),'yyyy-MM') AS visitmonth,
        	visitcount
		FROM action
	) t1
	GROUP BY userid,visitmonth
) t2
ORDER BY t2.userid,t2.visitmonth;

第三题

有50W个京东店铺，每个顾客访客访问任何一个店铺的任何一个商品时都会产生一条访问日志，访问日志存储的表名为visit，访客的用户id为user_id，被访问的店铺名称为shop，请统计：

每个店铺的UV（访客数）
每个店铺访问次数top3的访客信息（输出店铺名称、访客id、访问次数）

数据准备

CREATE TABLE visit(
	user_id string,
    shop string)
ROW format delimited FIELDS TERMINATED BY '\t';

INSERT INTO TABLE visit VALUES
    ('u1', 'a'),
    ('u2', 'b'),
    ('u1', 'b'),
    ('u1', 'a'),
    ('u3', 'c'),
    ('u4', 'b'),
    ('u1', 'a'),
    ('u2', 'c'),
    ('u5', 'b'),
    ('u4', 'b'),
    ('u6', 'c'),
    ('u2', 'c'),
    ('u1', 'b'),
    ('u2', 'a'),
    ('u2', 'a'),
    ('u3', 'a'),
    ('u5', 'a'),
    ('u5', 'a'),
    ('u5', 'a');

实现SQL

1、每个店铺的UV（访客数）
方式一：
SELECT
	shop,
	count(DISTINCT user_id)
FROM visit
GROUP BY shop;
方式二：
SELECT
	t.shop,
	count(*)
FROM(
	SELECT
		user_id,
		shop
	FROM visit
	GROUP BY user_id,shop
) t
GROUP BY t.shop;

2、每个店铺访问次数top3的访客信息
SELECT
	t2.shop,
	t2.user_id,
	t2.cnt
FROM(
	SELECT
		t1.*,
		row_number() over(partition BY t1.shop ORDER BY t1.cnt DESC) rank
	FROM(
		SELECT
			user_id,
			shop,
			count(*) AS cnt
		FROM visit
		GROUP BY user_id,shop
	) t1
) t2
WHERE rank <= 3;

第四题

已知一个表STG.ORDER，有如下字段:：Date，Order_id，User_id，amount

数据样例：2017-01-01,10029028,1000003251,33.57

请给出sql进行统计：

给出2017年每个月的订单数、用户数、总成交金额
给出2017年11月的新客数（指在11月才有第一笔订单）

数据准备

CREATE TABLE order_tab( 
	dt string,
	order_id string, 
	user_id string, 
	amount DECIMAL(10, 2))
ROW format delimited FIELDS TERMINATED BY '\t';

INSERT INTO TABLE order_tab VALUES ('2017-01-01','10029028','1000003251',33.57);
INSERT INTO TABLE order_tab VALUES ('2017-01-01','10029029','1000003251',33.57);
INSERT INTO TABLE order_tab VALUES ('2017-01-01','100290288','1000003252',33.57);
INSERT INTO TABLE order_tab VALUES ('2017-02-02','10029088','1000003251',33.57);
INSERT INTO TABLE order_tab VALUES ('2017-02-02','100290281','1000003251',33.57);
INSERT INTO TABLE order_tab VALUES ('2017-02-02','100290282','1000003253',33.57);
INSERT INTO TABLE order_tab VALUES ('2017-11-02','10290282','100003253',234);
INSERT INTO TABLE order_tab VALUES ('2018-11-02','10290284','100003243',234);

实现SQL

1、给出 2017年每个月的订单数、用户数、总成交金额
SELECT
	t1.mon,
    count(t1.order_id) AS order_cnt,
    count(DISTINCT t1.user_id) AS user_cnt,
    sum(amount) AS total_amount
FROM(
	SELECT
		order_id,
		user_id,
		amount,
		date_format(dt,'yyyy-MM') mon
	FROM order_tab
	WHERE date_format(dt,'yyyy') = '2017'
) t1
GROUP BY t1.mon;

2、给出2017年11月的新客数(指在11月才有第一笔订单)
SELECT count(user_id)
FROM order_tab
GROUP BY user_id
HAVING date_format(min(dt),'yyyy-MM')='2017-11';

第五题

有日志如下，请写出代码求得所有用户和活跃用户的总数及平均年龄（活跃用户指连续两天都有访问记录的用户）

日期 用户 年龄
2019-02-11 test_1 23
2019-02-11 test_2 19
2019-02-11 test_3 39
2019-02-11 test_1 23
2019-02-11 test_3 39
2019-02-11 test_1 23
2019-02-12 test_2 19
2019-02-13 test_1 23
2019-02-15 test_2 19
2019-02-16 test_2 19

数据准备

create table user_age(
    dt string,
    user_id string,
    age int)
row format delimited fields terminated by ',';

INSERT INTO TABLE user_age VALUES ('2019-02-11','test_1',23);
INSERT INTO TABLE user_age VALUES ('2019-02-11','test_2',19);
INSERT INTO TABLE user_age VALUES ('2019-02-11','test_3',39);
INSERT INTO TABLE user_age VALUES ('2019-02-11','test_1',23);
INSERT INTO TABLE user_age VALUES ('2019-02-11','test_3',39);
INSERT INTO TABLE user_age VALUES ('2019-02-11','test_1',23);
INSERT INTO TABLE user_age VALUES ('2019-02-12','test_2',19);
INSERT INTO TABLE user_age VALUES ('2019-02-13','test_1',23);
INSERT INTO TABLE user_age VALUES ('2019-02-15','test_2',19);
INSERT INTO TABLE user_age VALUES ('2019-02-16','test_2',19);

实现SQL

SELECT
	sum(total_user_cnt) total_user_cnt,
	sum(total_user_avg_age) total_user_avg_age,
	sum(two_days_cnt) two_days_cnt,
	sum(avg_age) avg_age
FROM(
	SELECT
		0 total_user_cnt,
		0 total_user_avg_age,
		count(*) AS two_days_cnt,
		cast(sum(age) / count(*) AS decimal(5,2)) AS avg_age
	FROM(
		SELECT
			user_id,
			max(age) age
		FROM(
			SELECT
				user_id,
                max(age) age
			FROM(
				SELECT
					user_id,
                    age,
                    date_sub(dt,rank) flag
				FROM(
					SELECT
						dt,
						user_id,
						max(age) age,
						row_number() over(PARTITION BY user_id ORDER BY dt) rank
					FROM user_age
				GROUP BY dt,user_id
				) t1
			) t2
		GROUP BY user_id,flag
		HAVING count(*) >= 2
		) t3
	GROUP BY user_id
	) t4
UNION ALL
SELECT
	count(*) total_user_cnt,
	cast(sum(age) /count(*) AS decimal(5,2)) total_user_avg_age,
	0 two_days_cnt,
	0 avg_age
FROM(
	SELECT
		user_id,
        max(age) age
	FROM user_age
	GROUP BY user_id
	) t5
) t6;

第六题

请用sql写出所有用户中在今年10月份第一次购买商品的金额

表ordertable字段（购买用户：userid，金额：money，购买时间：paymenttime(格式：2017-10-01)，订单id：orderid）

数据准备

CREATE TABLE ordertable(
	userid string,
	money decimal(10,2),
	paymenttime string,
	orderid string);

INSERT INTO TABLE ordertable VALUES('001',100,'2017-10-01','123');
INSERT INTO TABLE ordertable VALUES('001',200,'2017-10-02','124');
INSERT INTO TABLE ordertable VALUES('002',500,'2017-10-01','125');
INSERT INTO TABLE ordertable VALUES('001',100,'2017-11-01','126');

实现SQL

SELECT
	userid,
	paymenttime,
	money,
	orderid
from(
	SELECT
		userid,
		money,
		paymenttime,
		orderid,
		row_number() over (PARTITION BY userid ORDER BY paymenttime) rank
	FROM ordertable
	WHERE date_format(paymenttime,'yyyy-MM') = '2017-10'
) t
WHERE rank = 1;

第七题

有一个线上服务器访问日志格式如下（用sql答题）

时间		接口		ip地址
2016-11-09 11:22:05		/api/user/login		110.23.5.33
2016-11-09 11:23:10		/api/user/detail	57.3.2.16
2016-11-09 23:59:40		/api/user/login		200.6.5.166
......

求11月9号下午14点（14-15点），访问/api/user/login接口的top10的ip地址

数据准备

CREATE TABLE ip(
	time string,
	interface string,
	ip string);

INSERT INTO TABLE ip VALUES('2016-11-09 11:22:05','/api/user/login','110.23.5.23');
INSERT INTO TABLE ip VALUES('2016-11-09 11:23:10','/api/user/detail','57.3.2.16');
INSERT INTO TABLE ip VALUES('2016-11-09 23:59:40','/api/user/login','200.6.5.166');
INSERT INTO TABLE ip VALUES('2016-11-09 11:14:23','/api/user/login','136.79.47.70');
INSERT INTO TABLE ip VALUES('2016-11-09 11:15:23','/api/user/detail','94.144.143.141');
INSERT INTO TABLE ip VALUES('2016-11-09 11:16:23','/api/user/login','197.161.8.206');
INSERT INTO TABLE ip VALUES('2016-11-09 12:14:23','/api/user/detail','240.227.107.145');
INSERT INTO TABLE ip VALUES('2016-11-09 13:14:23','/api/user/login','79.130.122.205');
INSERT INTO TABLE ip VALUES('2016-11-09 14:14:23','/api/user/detail','65.228.251.189');
INSERT INTO TABLE ip VALUES('2016-11-09 14:15:23','/api/user/detail','245.23.122.44');
INSERT INTO TABLE ip VALUES('2016-11-09 14:17:23','/api/user/detail','22.74.142.137');
INSERT INTO TABLE ip VALUES('2016-11-09 14:19:23','/api/user/detail','54.93.212.87');
INSERT INTO TABLE ip VALUES('2016-11-09 14:20:23','/api/user/detail','218.15.167.248');
INSERT INTO TABLE ip VALUES('2016-11-09 14:24:23','/api/user/detail','20.117.19.75');
INSERT INTO TABLE ip VALUES('2016-11-09 15:14:23','/api/user/login','183.162.66.97');
INSERT INTO TABLE ip VALUES('2016-11-09 16:14:23','/api/user/login','108.181.245.147');
INSERT INTO TABLE ip VALUES('2016-11-09 14:17:23','/api/user/login','22.74.142.137');
INSERT INTO TABLE ip VALUES('2016-11-09 14:19:23','/api/user/login','22.74.142.137');

实现SQL

SELECT
	ip,
	count(*) as cnt
FROM ip
WHERE date_format(time,'yyyy-MM-dd HH') >= '2016-11-09 14'
AND date_format(time,'yyyy-MM-dd HH') < '2016-11-09 15'
AND interface='/api/user/login'
GROUP BY ip
ORDER BY cnt desc
LIMIT 10;

第八题

有一个账号表如下，请写出SQL语句，查询各自区组的money排名前十的账号（分组取前10）

`dist_id` string '区组id',
`account` string '账号',
`gold` int '金币'

数据准备

CREATE TABLE account(
    dist_id int(11) DEFAULT NULL COMMENT '区组id',
	account varchar(100) DEFAULT NULL COMMENT '账号',
	gold int(11) DEFAULT 0 COMMENT '金币');

INSERT INTO TABLE account VALUES(1,'77',18);
INSERT INTO TABLE account VALUES(1,'88',106);
INSERT INTO TABLE account VALUES(1,'99',10);
INSERT INTO TABLE account VALUES(1,'12',13);
INSERT INTO TABLE account VALUES(1,'13',14);
INSERT INTO TABLE account VALUES(1,'14',25);
INSERT INTO TABLE account VALUES(1,'15',36);
INSERT INTO TABLE account VALUES(1,'16',12);
INSERT INTO TABLE account VALUES(1,'17',158);
INSERT INTO TABLE account VALUES(2,'18',12);
INSERT INTO TABLE account VALUES(2,'19',44);
INSERT INTO TABLE account VALUES(2,'10',66);
INSERT INTO TABLE account VALUES(2,'45',80);
INSERT INTO TABLE account VALUES(2,'78',98);

实现SQL

SELECT
	dist_id,
	account,
	gold
FROM(
	SELECT
		dist_id,
		account,
		gold,
		row_number () over (PARTITION BY dist_id ORDER BY gold DESC) rank
	FROM test_sql.test10
) t
WHERE rank <= 10;

第九题

有一个充值日志表credit_log，字段如下：

`dist_id` int '区组id',
`account` string '账号',
`money` int '充值金额',
`create_time` string '订单时间'

请写出SQL语句，查询充值日志表2019年01月02号每个区组下充值额最大的账号

要求结果：区组id，账号，金额，充值时间

数据准备

CREATE TABLE credit_log(
	dist_id string COMMENT '区组id',
    account string COMMENT '账号',
    money decimal(10,2) COMMENT '充值金额',
    create_time string COMMENT '订单时间');
      
INSERT INTO TABLE credit_log VALUES ('1','11',100006,'2019-01-02 13:00:01');
INSERT INTO TABLE credit_log VALUES ('1','22',110000,'2019-01-02 13:00:02');
INSERT INTO TABLE credit_log VALUES ('1','33',102000,'2019-01-02 13:00:03');
INSERT INTO TABLE credit_log VALUES ('1','44',100300,'2019-01-02 13:00:04');
INSERT INTO TABLE credit_log VALUES ('1','55',100040,'2019-01-02 13:00:05');
INSERT INTO TABLE credit_log VALUES ('1','66',100005,'2019-01-02 13:00:06');
INSERT INTO TABLE credit_log VALUES ('1','77',180000,'2019-01-02 13:00:07');
INSERT INTO TABLE credit_log VALUES ('1','88',106000,'2019-01-02 13:00:08');
INSERT INTO TABLE credit_log VALUES ('1','99',100400,'2019-01-02 13:00:09');
INSERT INTO TABLE credit_log VALUES ('1','12',100030,'2019-01-02 13:00:10');
INSERT INTO TABLE credit_log VALUES ('1','13',100003,'2019-01-02 13:00:20');
INSERT INTO TABLE credit_log VALUES ('1','14',100020,'2019-01-02 13:00:30');
INSERT INTO TABLE credit_log VALUES ('1','15',100500,'2019-01-02 13:00:40');
INSERT INTO TABLE credit_log VALUES ('1','16',106000,'2019-01-02 13:00:50');
INSERT INTO TABLE credit_log VALUES ('1','17',100800,'2019-01-02 13:00:59');
INSERT INTO TABLE credit_log VALUES ('2','18',100800,'2019-01-02 13:00:11');
INSERT INTO TABLE credit_log VALUES ('2','19',100030,'2019-01-02 13:00:12');
INSERT INTO TABLE credit_log VALUES ('2','10',100000,'2019-01-02 13:00:13');
INSERT INTO TABLE credit_log VALUES ('2','45',100010,'2019-01-02 13:00:14');
INSERT INTO TABLE credit_log VALUES ('2','78',100070,'2019-01-02 13:00:15');

实现SQL

WITH TEMP AS(
    SELECT
    	dist_id,
        account,
        sum(money) sum_money
    FROM credit_log
    WHERE date_format(create_time,'yyyy-MM-dd') = '2019-01-02'
    GROUP BY dist_id,account)
SELECT 
	t1.dist_id,
    t1.account,
    t1.sum_money
FROM(
    SELECT 
        temp.dist_id,
        temp.account,
        temp.sum_money,
        rank() over(partition BY temp.dist_id ORDER BY temp.sum_money DESC) ranks
    FROM TEMP
) t1
WHERE ranks = 1

第十题

有三张表分别为会员表(member)、销售表(sale)、退货表(regoods)

会员表有字段memberid(会员id，主键)、credits(积分)
销售表有字段memberid(会员id，外键)、MNAccount(购买金额)
退货表中有字段memberid(会员id，外键)、RMNAccount(退货金额)

业务说明：

销售表中的销售记录可以是会员购买，也可以是非会员购买（即销售表中的memberid可以为空）
销售表中的一个会员可以有多条购买记录
退货表中的退货记录可以是会员，也可是非会员
一个会员可以有一条或多条退货记录

查询需求：

分组查出销售表中所有会员购买金额，同时分组查出退货表中所有会员的退货金额，把会员id相同的购买金额、退款金额得到的结果更新到表会员表中对应会员的积分字段（credits）

数据集

sale表
memberid  MNAccount
1001  50.3
1002  56.5
1003  235
1001  23.6
1005  56.2
      25.6
      33.5

regoods表
memberid  RMNAccount
1001  20.1
1002  23.6
1001  10.1
      23.5
      10.2
1005  0.8

数据准备

create table member(
    memberid string,
    credits double)
row format delimited fields terminated by '\t';

create table sale(
    memberid string,
    MNAccount double)
row format delimited fields terminated by '\t';

create table regoods(
    memberid string,
    RMNAccount double)
row format delimited fields terminated by '\t';

实现SQL

insert into table member
select
	t1.memberid,
	MNAccount-RMNAccount
from(
	select
	    memberid,
	    sum(MNAccount) MNAccount
	from sale
	where memberid!=''
	group by memberid
) t1
join(
select
    memberid,
    sum(RMNAccount) RMNAccount
from regoods
where memberid!=''
group by memberid
) t2
on t1.memberid=t2.memberid;

第十一题

用一条SQL语句查询出每门课都大于80分的学生姓名

name  kecheng  fenshu
张三  语文  81
张三  数学  75
李四  语文  76
李四  数学  90
王五  语文  81
王五  数学  100
王五  英语  90

实现SQL

方式一：
select distinct name from table where name not in (select distinct name from table where fenshu<=80);
方式二：
select name from table group by name having min(fenshu)>80;

第十二题

学生表如下：

自动编号  学号  姓名  课程编号  课程名称  分数
 1  2005001  张三  0001  数学  69
 2  2005002  李四  0001  数学  89
 3  2005001  张三  0001  数学  69

删除除了自动编号不同，其他都相同的学生冗余信息

实现SQL

delete tablename where 自动编号 not in(select min(自动编号) from tablename group by 学号, 姓名, 课程编号, 课程名称, 分数);

第十三题

一个叫team的表，里面只有一个字段name，一共有4条纪录，分别是a,b,c,d，对应四个球队，现在四个球队进行比赛，用一条sql语句显示所有可能的比赛组合

实现SQL

select a.name, b.name from team a, team b where a.name < b.name;

第十四题

面试题：怎么把这样一个数据

year  month  amount
1991  1  1.1
1991  2  1.2
1991  3  1.3
1991  4  1.4
1992  1  2.1
1992  2  2.2
1992  3  2.3
1992  4  2.4

查成这样一个结果？

year  m1  m2  m3  m4
1991  1.1  1.2  1.3  1.4
1992  2.1  2.2  2.3  2.4

实现SQL

selec
	year, 
	(select amount from aaa m where month=1 and m.year=aaa.year) as m1,
	(select amount from aaa m where month=2 and m.year=aaa.year) as m2,
	(select amount from aaa m where month=3 and m.year=aaa.year) as m3,
	(select amount from aaa m where month=4 and m.year=aaa.year) as m4
from aaa
group by year;

第十五题

说明：复制表（只复制结构，源表名：a，新表名：b）

实现SQL

select * into b from a where 1<>1; (where1=1，拷贝表结构和数据内容)

<>（不等于）(SQL Server Compact)：比较两个表达式；当使用此运算符比较非空表达式时，如果左操作数不等于右操作数，则结果为true；否则，结果为false

第十六题

原表：

courseid coursename score
1 java 70
2 oracle 90
3 xml 40
4 jsp 30
5 servlet 80

为了便于阅读，查询此表后的结果显式如下（及格分数为60）：

courseid coursename score mark
1 java 70 pass
2 oracle 90 pass
3 xml 40 fail
4 jsp 30 fail
5 servlet 80 pass

实现SQL

select courseid,coursename,score,if(score>=60,"pass","fail") as mark from course;

第十七题

表名：购物信息

购物人  商品名称  数量
A  甲  2
B  乙  4
C  丙  1
A  丁  2
B  丙  5
……

给出所有购入商品为两种或两种以上的购物人记录

实现SQL

select * from 购物信息 where 购物人 in (select 购物人 from 购物信息 group by 购物人 having count(*) >= 2);

第十八题

info表

date result
2005-05-09 win
2005-05-09 lose 
2005-05-09 lose 
2005-05-09 lose 
2005-05-10 win 
2005-05-10 lose 
2005-05-10 lose

如果要生成下列结果，该如何写sql语句?

date  win  lose
2005-05-09  2  2 
2005-05-10  1  2

实现SQL

方式一：
select
	date,
	sum(case when result = "win" then 1 else 0 end) as "win",
	sum(case when result = "lose" then 1 else 0 end) as "lose"
from info
group by date;

方式二：
select
	a.date,
	a.result as win,
	b.result as lose 
from(
	select
		date,
		count(result) as result
	from info
	where result = "win"
	group by date
) as a 
join (
select
	date,
	count(result) as result
from info
where result = "lose"
group by date
) as b 
on a.date = b.date;

第十九题

有一个订单表order，已知字段有：order_id(订单ID)，user_id(用户ID)，amount(金额)，pay_datetime(付费时间)，channel_id(渠道ID)，dt(分区字段)

在Hive中创建这个表
查询dt='2018-09-01’里每个渠道的订单数，下单人数（去重），总金额
查询dt='2018-09-01’里每个渠道的金额最大3笔订单
有一天发现订单数据重复，请分析原因

实现SQL

1、在Hive中创建这个表
create external table order(
	order_id int,
	user_id int,
	amount double,
	pay_datatime timestamp,
	channel_id int
)partitioned by(dt string)
row format delimited fields terminated by '\t';

2、查询dt='2018-09-01'里每个渠道的订单数，下单人数（去重），总金额；查询dt='2018-09-01'里每个渠道的金额最大3笔订单
select
	count(order_id),
	count(distinct(user_id)),
	sum(amount)
from order
where dt="2019-09-01"
select
	order_id,
	channel_id,
	channel_id_amount
from(
	select
		order_id
		channel_id,
		amount,
		max(amount) over(partition by channel_id),
		min(amount) over(partition by channel_id),
		row_number() over(partition by channel_id order by amount desc) ranks
	from order
	where dt="2019-09-01"
) t
where t.ranks<4;

3、有一天发现订单数据重复，请分析原因
订单属于业务数据，在关系型数据库中不会存在数据重复
hive建表时也不会导致数据重复
我推测是在数据迁移时，迁移失败导致重复迁移数据冗余了

第二十题

有一个订单表t_order，已知字段有：order_id(订单ID)，item_id(商品id)，create_time(下单时间)，amount(下单金额)

有一个商品表t_item，已知字段有：item_id(商品id)，item_name(商品名称)，category(品类)

有一个商品表t_item，已知字段有：item_id(商品id)，item_name(商品名称)，category_1(一级品类)，category_2(二级品类)

最近一个月，销售数量最多的10个商品
最近一个月，每个种类里销售数量最多的10个商品

实现SQL

1、最近一个月，销售数量最多的10个商品
select
	item_id,
	count(order_id) a
from t_order
where dataediff(create_time,current_date)<=30
group by item_id
order by a desc;

2、最近一个月，每个种类里销售数量最多的10个商品
一个订单对应一个商品，一个商品对应一个品类
with(
	select
		order_id,
		item_id,
		item_name,
		category
	from t_order
	join t_item
	on t_order.item_id = t_item.item_id
) t
select
	order_id,
	item_id,
	item_name,
	category,
	count(item_id)over(partition by category) item_count
from t
group by category
order by item_count desc
limit 10;

第二十一题

有一个5000万的用户文件(user_id，name，age)，一个2亿记录的用户看电影的记录文件(user_id，url)，根据年龄段观看电影的次数进行排序

数据准备

CREATE TABLE movie_user(
	user_id string,
	name string,
	age int);

CREATE TABLE movie_log(
	user_id string,
    url string);

INSERT INTO TABLE movie_user VALUES('001','u1',10);
INSERT INTO TABLE movie_user VALUES('002','u2',15);  
INSERT INTO TABLE movie_user VALUES('003','u3',15);  
INSERT INTO TABLE movie_user VALUES('004','u4',20);  
INSERT INTO TABLE movie_user VALUES('005','u5',25);  
INSERT INTO TABLE movie_user VALUES('006','u6',35);  
INSERT INTO TABLE movie_user VALUES('007','u7',40);
INSERT INTO TABLE movie_user VALUES('008','u8',45); 
INSERT INTO TABLE movie_user VALUES('009','u9',50); 
INSERT INTO TABLE movie_user VALUES('0010','u10',65); 

INSERT INTO TABLE movie_log VALUES('001','url1');
INSERT INTO TABLE movie_log VALUES('002','url1');  
INSERT INTO TABLE movie_log VALUES('003','url2');  
INSERT INTO TABLE movie_log VALUES('004','url3');  
INSERT INTO TABLE movie_log VALUES('005','url3');  
INSERT INTO TABLE movie_log VALUES('006','url1');  
INSERT INTO TABLE movie_log VALUES('007','url5');
INSERT INTO TABLE movie_log VALUES('008','url7'); 
INSERT INTO TABLE movie_log VALUES('009','url5'); 
INSERT INTO TABLE movie_log VALUES('0010','url1');

实现SQL

select
	age_region, sum(cnt) as total_count
from(
	select 
    	user_id,
    	case
			when age between 0 and 20 then "0-20"
       		when age between 20 and 40 then "20-40"
			when age between 40 and 60 then "40-60"
    	else "other age region"
    	end as age_region
	from movie_user
) as t1
join(
select 
	user_id, count(*) as cnt
from movie_log
group by user_id
) as t2
on t1.user_id = t2.user_id
group by t1.age_region
order by total_count desc;

第二十二题

现有图书管理数据库的三个数据模型如下：

图书（数据表名：BOOK）

序号	字段名称	字段描述	字段类型
1	BOOK_ID	总编号	文本
2	SORT	分类号	文本
3	BOOK_NAME	书名	文本
4	WRITER	作者	文本
5	OUTPUT	出版单位	文本
6	PRICE	单价	数值（保留小数点后2位）

读者（数据表名：READER）

序号	字段名称	字段描述	字段类型
1	READER_ID	借书证号	文本
2	COMPANY	单位	文本
3	NAME	姓名	文本
4	SEX	性别	文本
5	GRADE	职称	文本
6	ADDR	地址	文本

借阅记录（数据表名：BORROW_LOG）

序号	字段名称	字段描述	字段类型
1	READER_ID	借书证号	文本
2	BOOK_ID	总编号	文本
3	BORROW_DATE	借书日期	日期

创建图书管理库的图书、读者和借阅三个基本表的表结构
找出姓李的读者姓名(NAME)和所在单位(COMPANY)
查找“高等教育出版社”的所有图书名称(BOOK_NAME)及单价(PRICE)，结果按单价降序排序
查找价格介于10元和20元之间的图书种类(SORT)出版单位(OUTPUT)和单价(PRICE)，结果按出版单位(OUTPUT)和单价(PRICE)升序排序
查找所有借了书的读者的姓名(NAME)及所在单位(COMPANY)
求”科学出版社”图书的最高单价、最低单价、平均单价
找出当前至少借阅了2本图书（大于等于2本）的读者姓名及其所在单位
考虑到数据安全的需要，需定时将“借阅记录”中数据进行备份，请使用一条SQL语句，在备份用户bak下创建与“借阅记录”表结构完全一致的数据表BORROW_LOG_BAK，井且将“借阅记录”中现有数据全部复制到BORROW_LOG_BAK中
现在需要将原Oracle数据库中数据迁移至Hive仓库，请写出“图书”在Hive中的建表语句（Hive实现，提示：列分隔符|；数据表数据需要外部导入：分区分别以month_part、day_part命名）
Hive中有表A，现在需要将表A的月分区 201505 中 user_id 为20000的user_dinner字段更新为bonc8920，其他用户user_dinner字段数据不变，请列出更新的方法步骤（Hive实现，提示：Hive中无update语法，请通过其他办法进行数据更新）

实现SQL

1、创建图书管理库的图书、读者和借阅三个基本表的表结构
-- 创建图书表book
CREATE TABLE library_book(
	book_id string,
	SORT string,
	book_name string,
	writer string,
	OUTPUT string,
	price decimal(10,2));
	
INSERT INTO TABLE library_book VALUES ('001','TP391','信息处理','author1','机械工业出版社','20');
INSERT INTO TABLE library_book VALUES ('002','TP392','数据库','author12','科学出版社','15');
INSERT INTO TABLE library_book VALUES ('003','TP393','计算机网络','author3','机械工业出版社','29');
INSERT INTO TABLE library_book VALUES ('004','TP399','微机原理','author4','科学出版社','39');
INSERT INTO TABLE library_book VALUES ('005','C931','管理信息系统','author5','机械工业出版社','40');
INSERT INTO TABLE library_book VALUES ('006','C932','运筹学','author6','科学出版社','55');

-- 创建读者表reader 
CREATE TABLE library_reader(
	reader_id string,
	company string,
	name string,
	sex string,
	grade string,
	addr string);

INSERT INTO TABLE library_reader VALUES ('0001','阿里巴巴','jack','男','vp','addr1');
INSERT INTO TABLE library_reader VALUES ('0002','百度','robin','男','vp','addr2');
INSERT INTO TABLE library_reader VALUES ('0003','腾讯','tony','男','vp','addr3');
INSERT INTO TABLE library_reader VALUES ('0004','京东','jasper','男','cfo','addr4');
INSERT INTO TABLE library_reader VALUES ('0005','网易','zhangsan','女','ceo','addr5');
INSERT INTO TABLE library_reader VALUES ('0006','搜狐','lisi','女','ceo','addr6');

-- 创建借阅记录表borrow_log 
CREATE TABLE library_borrow_log(
	reader_id string,
	book_id string,
	borrow_date string);

INSERT INTO TABLE library_borrow_log VALUES ('0001','002','2019-10-14');
INSERT INTO TABLE library_borrow_log VALUES ('0002','001','2019-10-13');
INSERT INTO TABLE library_borrow_log VALUES ('0003','005','2019-09-14');
INSERT INTO TABLE library_borrow_log VALUES ('0004','006','2019-08-15');
INSERT INTO TABLE library_borrow_log VALUES ('0005','003','2019-10-10');
INSERT INTO TABLE library_borrow_log VALUES ('0006','004','2019-17-13');

2、找出姓李的读者姓名(NAME)和所在单位(COMPANY)
SELECT
	name,
	company
FROM library_reader
WHERE name LIKE '李%';

3、查找“高等教育出版社”的所有图书名称(BOOK_NAME)及单价(PRICE)，结果按单价降序排序
SELECT
	book_name,
	price
FROM library_book
WHERE OUTPUT = "高等教育出版社"
ORDER BY price DESC;

4、查找价格介于10元和20元之间的图书种类(SORT)出版单位(OUTPUT)和单价(PRICE)，结果按出版单位(OUTPUT)和单价(PRICE)升序排序
SELECT
	sort,
	output,
	price
FROM library_book
WHERE price >= 10 and price <= 20
ORDER BY output,price;

5、查找所有借了书的读者的姓名(NAME)及所在单位(COMPANY)
SELECT
	b.name,
	b.company
FROM library_borrow_log a
JOIN library_reader b
ON a.reader_id = b.reader_id;

6、求”科学出版社”图书的最高单价、最低单价、平均单价
SELECT
	max(price),
	min(price),
	avg(price)
FROM library_book
WHERE OUTPUT = '科学出版社';

7、找出当前至少借阅了2本图书（大于等于2本）的读者姓名及其所在单位
SELECT
b.name,
b.company
FROM(
	SELECT
		reader_id
    FROM library_borrow_log
    GROUP BY reader_id
    HAVING count(*) >= 2
) a
JOIN library_reader b
ON a.reader_id = b.reader_id;

8、考虑到数据安全的需要，需定时将“借阅记录”中数据进行备份，请使用一条SQL语句，在备份用户bak下创建与“借阅记录”表结构完全一致的数据表BORROW_LOG_BAK，井且将“借阅记录”中现有数据全部复制到BORROW_LOG_BAK中
CREATE TABLE library_borrow_log_bak as SELECT * FROM library_borrow_log;

9、现在需要将原Oracle数据库中数据迁移至Hive仓库，请写出“图书”在Hive中的建表语句（Hive实现，提示：列分隔符|；数据表数据需要外部导入：分区分别以month_part、day_part命名）
CREATE TABLE book_hive( 
    book_id string,
    SORT string, 
    book_name string,
    writer string, 
    OUTPUT string, 
    price DECIMAL(10, 2))
partitioned BY ( month_part string, day_part string )
ROW format delimited FIELDS TERMINATED BY '|' stored AS textfile;

10、Hive中有表A，现在需要将表A的月分区 201505 中 user_id 为20000的user_dinner字段更新为bonc8920，其他用户user_dinner字段数据不变，请列出更新的方法步骤（Hive实现，提示：Hive中无update语法，请通过其他办法进行数据更新）
方式1：配置hive支持事务操作，分桶表，orc存储格式
方式2：第一步找到要更新的数据，将要更改的字段替换为新的值，第二步找到不需要更新的数据，第三步将上两步的数据插入一张新表中

第二十三题

计算平台的每一个用户发过多少日记、获得多少点赞数

已知数据

t1：10万行数据
uid(用户id)  log_id(日记id)
uid1  log_id1
uid2  log_id2
uid3  log_id3
......

t2：1000万行数据（注：没有被点赞的日志此表不做记录）
log_id(日记id)  like_uid(点赞的用户id)
log_id1  uid2
log_id1  uid3
log_id1  uid4
log_id3  uid2
......

需求，请用sql计算出如下结果

uid(用户id)  log_cnt(发过多少日记)  liked_cnt(获得多少点赞)
uid1  2  3
uid2  1  1
......

实现SQL

with t3 as(
	select
		* 
	from t1
	left join t2 
	on t1.log_id = t2.log_id
)
select
	uid,
	count(log_id) over(partition by uid) log_cnt,
	count(like_uid) over(partition by log_id) liked_cnt
from t3;

第二十四题

处理产品版本号，版本号信息存储在数据表中，每行一个版本号

版本号命名规则：产品版本号由三部分组成，如：v9.11.2

第一部分9为主版本号，为1-99之间的数字；第二部分11为子版本号，为0-99之间的数字；第三部分2为阶段版本号，为0-99之间的数字(可选)

已知t1表有若干个版本号：

version_id(版本号)
v9.9.9
v8.1
v9.9.2
v9.20
v31.0.1
......

找出t1表中最大的版本号

计算出如下格式的所有版本号排序，要求对于相同的版本号，顺序号并列

version_id(版本号)  seq(顺序号)
v31.0.1  0
v9.20  1
v9.9.2  2
v9.9.2  2
v9.0.8  4
......

实现SQL

1、找出t1表中最大的版本号
思路：列转行，切割版本号，一列变三列（主版本号 子版本号 阶段版本号）
with t2 as( -- 转换
	select
		version_id v1, -- 版本号
		version_id v2 -- 主
	from t1
	lateral view explode(v2) tmp as v2
)
select -- 第一层 找出第一个
	v1,
	max(v2)
from t2;

select
	version_id, -- 版本号
	max(split(version_id,".")[0]) v1, -- 主版本不会为空
	max(if(split(version_id,".")[1]="",0,split(version_id,".")[1]))v2, -- 取出子版本并判断是否为空，并给默认值
	max(if(split(version_id,".")[2]="",0,split(version_id,".")[2]))v3 -- 取出阶段版本并判断是否为空，并给默认值
from t1;

2、计算出如下格式的所有版本号排序，要求对于相同的版本号，顺序号并列
select
	version_id,
	rank() over(partition by version_id order by version_id) seq
from t1;

第二十五题

现在有三个表student（学生表）、course(课程表)、score（成绩单），结构如下：

create table student(
	id bigint comment '学号'，
	name string comment '姓名',
	age bigint comment '年龄');

create table course(
	cid string comment '课程号，001/002格式',
	cname string comment '课程名');

create table score(
	id bigint comment '学号',
	cid string comment '课程号',
	score bigint comment '成绩'
) partitioned by(event_day string)

其中score中的id、cid，分别是student、course中对应的列请根据上面的表结构，回答下面的问题：

请将本地文件（/home/users/test/20190301.csv）文件，加载到分区表score的20190301分区中，并覆盖之前的数据
查出平均成绩大于60分的学生的姓名、年龄、平均成绩
查出没有‘001’课程成绩的学生的姓名、年龄
查出有‘001’，’002’这两门课程下，成绩排名前3的学生的姓名、年龄
创建新的表score_20190317，并存入score表中20190317分区的数据
如果上面的score表中，uid存在数据倾斜，请进行优化，查出在20190101-20190317中，学生的姓名、年龄、课程、课程的平均成绩
描述一下union和union all的区别，以及在mysql和HQL中用法的不同之处？
简单描述一下lateral view语法在HQL中的应用场景，并写一个HQL实例

准备数据

insert into table student values(1001,'wsl1',21);
insert into table student values(1002,'wsl2',22);
insert into table student values(1003,'wsl3',23);
insert into table student values(1004,'wsl4',24);
insert into table student values(1005,'wsl5',25);

insert into table course values('001','math');
insert into table course values('002','English');
insert into table course values('003','Chinese');
insert into table course values('004','music');

insert into table score values(1001,'004',10);
insert into table score values(1002,'003',21);
insert into table score values(1003,'002',32);
insert into table score values(1004,'001',43);
insert into table score values(1005,'003',54);
insert into table score values(1001,'002',65);
insert into table score values(1002,'004',76);
insert into table score values(1003,'002',77);
insert into table score values(1001,'004',48);
insert into table score values(1002,'003',39);

1、请将本地文件（/home/users/test/20190301.csv）文件，加载到分区表score的20190301分区中，并覆盖之前的数据
load data local inpath '/home/users/test/20190301.csv' overwrite into table score partition(event_day='20190301');

2、查出平均成绩大于60分的学生的姓名、年龄、平均成绩
select
   stu.name,
   stu.age,
   stu.avg_score
from student stu
join(
   select
       id,
       avg(score) avg_score
   from score
   group by id
) t1
on stu.id=t1.id
where avg_score>60;

3、查出没有‘001’课程成绩的学生的姓名、年龄
select
   stu.name,
   t2.age
from student stu
join(
   select
   	id
   from score
   where cid != 001
   group by id
) t2
on stu.id=t2.id;

4、查出有‘001’，’002’这两门课程下，成绩排名前3的学生的姓名、年龄
select
   stu.name,
   stu.age
from(
   select
   	id,
   	cid,
   	score,
   	rank() over(partition by cid order by score desc) rank
   from score
   where cid=001 or cid-002
) t1
join student stu
on t1.id=stu.id
where rank<=3;

5、创建新的表score_20190317，并存入score表中20190317分区的数据
create table score_20190317 as select * from score where dt='20190317';

6、如果上面的score表中，uid存在数据倾斜，请进行优化，查出在20190101-20190317中，学生的姓名、年龄、课程、课程的平均成绩
select
   stu.name,
   stu.age,
   cou.cname,
   t1.avg_score
from(
   select 
       id,
       cid,
       avg(score) avg_score
   from score
   group by id,cid
   where dt >= '20190101' and dt <= '20190317'
) t1
left join student stu on t1.id = stu.id
left join course cou on t1.cid = cou.cid;
   
7、描述一下union和union all的区别，以及在mysql和HQL中用法的不同之处？
union会将联合的结果集去重，效率较union all差
union all不会对结果集去重，所以效率高
HQL中要求union或union all操作时必须保证select集合的结果相同个数的列，并且每个列的类型是一样的

8、简单描述一下lateral view语法在HQL中的应用场景，并写一个HQL实例
比如一个学生表为：
学号  姓名  年龄  成绩(语文|数学|英语)
001  张三  16  90,80,95
需要实现的效果：
学号  成绩
001  90
001  80
001  95

create table student(
   id string,
   name string,
   age int,
   scores array<string>)
row format delimited fields terminated by '\t'
collection items terminated by ',';

select
   id,
   score
from student
lateral view explode(scores) tmp_score as score;

第二十六题

需求：

求出每人每月的消费金额
求出截止到当月每个人累计消费总额

数据如下

username month salary(消费记录)
A 2015-01 5
A 2015-01 15
B 2015-01 5
A 2015-01 8
B 2015-01 25
A 2015-01 5
A 2015-02 4
A 2015-02 6
B 2015-02 10
B 2015-02 5

数据准备

create table t_consumer(
    username string,
    month string,
    salary int)
row format delimited fields terminated by ',';

load data local inpath '/home/hadoop/data/emp_salas.txt' into table t_consumer;

实现SQL

1、求出每人每月的消费金额
select
	username,
	month,
	sum(salary) as salary
from t_consumer
group by username,month;

2、求出截止到当月每个人累计消费总额
select
	username,
	month,
	cnt,
	sum(cnt) over(partition by username order by month) as total_cnt
from(
    select 
        username, 
        month, 
        sum(salary) as cnt
    from(
        select 
            *
        from t_consumer
    ) as t1
    group by username, month
) as t2
order by username, month;

你可能感兴趣的:(面试,Hive,hive,sql)

mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
MYSQL面试系列-04 king01299 面试 mysql 面试
MYSQL面试系列-0417.关于redolog和binlog的刷盘机制、redolog、undolog作用、GTID是做什么的？innodb_flush_log_at_trx_commit及sync_binlog参数意义双117.1innodb_flush_log_at_trx_commit该变量定义了InnoDB在每次事务提交时，如何处理未刷入（flush）的重做日志信息（redolog）。它
Kafka 消息丢失如何处理？架构文摘JGWZ 学习
今天给大家分享一个在面试中经常遇到的问题：Kafka消息丢失该如何处理？这个问题啊，看似简单，其实里面藏着很多“套路”。来，咱们先讲一个面试的“真实”案例。面试官问：“Kafka消息丢失如何处理？”小明一听，反问：“你是怎么发现消息丢失了？”面试官顿时一愣，沉默了片刻后，可能有点不耐烦，说道：“这个你不用管，反正现在发现消息丢失了，你就说如何处理。”小明一头雾水：“问题是都不知道怎么丢的，处理起来
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
SpringBlade dict-biz/list 接口 SQL 注入漏洞文章永久免费只为良心 oracle 数据库
SpringBladedict-biz/list接口SQL注入漏洞POC:构造请求包查看返回包你的网址/api/blade-system/dict-biz/list?updatexml(1,concat(0x7e,md5(1),0x7e),1)=1漏洞概述在SpringBlade框架中，如果dict-biz/list接口的后台处理逻辑没有正确地对用户输入进行过滤或参数化查询（PreparedSta
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Java企业面试题3 马龙强_ java
1.break和continue的作用(智*图)break：用于完全退出一个循环（如for,while）或一个switch语句。当在循环体内遇到break语句时，程序会立即跳出当前循环体，继续执行循环之后的代码。continue：用于跳过当前循环体中剩余的部分，并开始下一次循环。如果是在for循环中使用continue，则会直接进行条件判断以决定是否执行下一轮循环。2.if分支语句和switch分
Java面试题精选：消息队列(二) 芒果不是芒 Java面试题精选 java kafka
一、Kafka的特性1.消息持久化：消息存储在磁盘，所以消息不会丢失2.高吞吐量：可以轻松实现单机百万级别的并发3.扩展性：扩展性强，还是动态扩展4.多客户端支持：支持多种语言（Java、C、C++、GO、）5.KafkaStreams（一个天生的流处理）:在双十一或者销售大屏就会用到这种流处理。使用KafkaStreams可以快速的把销售额统计出来6.安全机制：Kafka进行生产或者消费的时候会
2019考研 | 西交大软件工程笔者阿蓉
本科背景：某北京211学校电子信息工程互联网开发工作两年录取结果：全日制软件工程学院分数：初试350+复试笔试80+面试85+总排名：100+从五月份开始脱产学习，我主要说一下专业课和复试还有我对非全的一些看法。【数学100+】张宇，张宇，张宇。跟着张宇学习，入门视频刷一遍，真题刷两遍，错题刷三遍。书刷N多遍。从视频开始学习，是最快的学习方法。5-7月份把主要是数学学好，8-9月份开始给自己每个周
MongoDB知识概括 GeorgeLin98 持久层 mongodb
MongoDB知识概括MongoDB相关概念单机部署基本常用命令索引-IndexSpirngDataMongoDB集成副本集分片集群安全认证MongoDB相关概念业务应用场景：传统的关系型数据库（如MySQL），在数据操作的“三高”需求以及应对Web2.0的网站需求面前，显得力不从心。解释：“三高”需求：①Highperformance-对数据库高并发读写的需求。②HugeStorage-对海量数
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
入门MySQL——查询语法练习 K_un
前言：前面几篇文章为大家介绍了DML以及DDL语句的使用方法，本篇文章将主要讲述常用的查询语法。其实MySQL官网给出了多个示例数据库供大家实用查询，下面我们以最常用的员工示例数据库为准，详细介绍各自常用的查询语法。1.员工示例数据库导入官方文档员工示例数据库介绍及下载链接：https://dev.mysql.com/doc/employee/en/employees-installation.h
博客网站制作教程 2401_85194651 java maven
首先就是技术框架：后端：Java+SpringBoot数据库：MySQL前端：Vue.js数据库连接：JPA(JavaPersistenceAPI)1.项目结构blog-app/├──backend/│├──src/main/java/com/example/blogapp/││├──BlogApplication.java││├──config/│││└──DatabaseConfig.java
ubuntu安装wordpress lissettecarlr
1安装nginx网上安装方式很多，这就就直接用apt-get了apt-getinstallnginx不用启动啥，然后直接在浏览器里面输入IP:80就能看到nginx的主页了。如果修改了一些配置可以使用下列命令重启一下systemctlrestartnginx.service2安装mysql输入安装前也可以更新一下软件源，在安装过程中将会让你输入数据库的密码。sudoapt-getinstallmy
计算机毕业设计PHP仓储综合管理系统（源码+程序+VUE+lw+部署） java毕设程序源码王哥 php 课程设计 vue.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：phpStudy+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：原生PHP++Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是小皮phpstudy最新版，我们在这个版本上开发的。其他版本理论上也可以。2.开发
MyBatis 详解阿贾克斯的黎明 java mybatis
目录目录一、MyBatis是什么二、为什么使用MyBatis（一）灵活性高（二）性能优化（三）易于维护三、怎么用MyBatis（一）添加依赖（二）配置MyBatis（三）创建实体类和接口（四）使用MyBatis一、MyBatis是什么MyBatis是一个优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。它可以通过简
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
Day_11 ROC_bird.. 算法
面试题16.15.珠玑妙算-力扣（LeetCode）/***Note:Thereturnedarraymustbemalloced,assumecallercallsfree().*///下标和对应位置的值都一样，answer[0]+1,对应位置的值猜对了，但是下标不对，answer[1]+1int*masterMind(char*solution,char*guess,int*returnSiz
字节二面 Redstone Monstrosity 前端面试
1.假设你是正在面试前端开发工程师的候选人，面试官让你详细说出你上一段实习过程的收获和感悟。在上一段实习过程中，我获得了宝贵的实践经验和深刻的行业洞察，以下是我的主要收获和感悟：一、专业技能提升框架应用熟练度：通过实际项目，我深入掌握了React、Vue等前端框架的使用，不仅提升了编码效率，还学会了如何根据项目需求选择合适的框架。问题解决能力：在实习期间，我遇到了许多预料之外的技术难题。通过查阅文
You have an error in your SQL syntax； check the manual that corresponds to your MySQL server version 努力的菜鸟~ sql 数据库
YouhaveanerrorinyourSQLsyntax;checkthemanualthatcorrespondstoyourMySQLserverversionfortherightsyntaxtousenear‘IDENTIFIEDBY‘123456’WITHGRANTOPTION’atline1在mysql5.7之前GRANTALLPRIVILEGESON*.*TO'root'@'%'I
mysql学习教程，从入门到精通，TOP 和MySQL LIMIT 子句（15）知识分享小能手大数据数据库 MySQL mysql 学习 oracle 数据库开发语言 adb 大数据
1、TOP和MySQLLIMIT子句内容在SQL中，不同的数据库系统对于限制查询结果的数量有不同的实现方式。TOP关键字主要用于SQLServer和Access数据库中，而LIMIT子句则主要用于MySQL、PostgreSQL（通过LIMIT/OFFSET语法）、SQLite等数据库中。下面将分别详细介绍这两个功能的语法、语句以及案例。1.1、TOP子句（SQLServer和Access）1.1
ERROR 1064 (42000): You have an error in your SQL syntax; check the manual that corresponds to your †徐先森® Oracle数据库 Web相关错误集
createtablestudents(idintunsignedprimarykeyauto_increment,namevarchar(50)notnull,ageintunsigned,highdecimal(3,2),genderenum('男','女','中性','保密','妖')default'保密',cls_idintunsigned);在对数据库插入如上带有中文带有默认值的字段的时
鲲鹏 ARM 架构麒麟 Lylin v10 安装 Nginx (离线) 焚木灵 arm开发架构 nginx 服务器
最近做一个银行的项目，银行的服务器是鲲鹏ARM架构的服务器，并且是麒麟v10的系统，这里记录一下在无法访问外网安装Nginx的方法。其他文章：鲲鹏ARM架构麒麟Lylinv10安装Mysql8.3(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Node和NVM(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装Pm2(离线)-CSDN博客鲲鹏ARM架构麒麟Lylinv10安装P
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方