本书本

mysql 根据分数分等级_数分面试-SQL篇

前言

文中部分SQL，可能考虑不全面，欢迎大家指正

文章结构:

1.SQL中的进阶函数-窗口函数

2.拼多多面试题

case专题-商品订单数据

case专题-活动运营数据

case专题-用户行为路径分析

case专题-用户留存分析

case专题-统计特征(中位数,众数,四分位数)

case专题-GMV周同比统计

case专题-连续区间问题

3.猿辅导面试题

case专题-学生成绩分析

case专题-学生做题情况分析

4.Hive面试高频知识点-行转列

一.SQL中的进阶函数-窗口函数

1.窗口函数

窗口函数和普通聚合函数的区别：

①聚合函数是将多条记录聚合为一条；窗口函数是每条记录都会执行，有几条记录执行完还是几条。

②聚合函数也可以用于窗口函数。

原因就在于窗口函数的执行顺序(逻辑上的)是在FROM，JOIN，WHERE，GROUP　BY，HAVING之后，在ORDER　BY，LIMIT，SELECT　DISTINCT之前。它执行时GROUP　BY的聚合过程已经完成了，所以不会再产生数据聚合。

注:窗口函数是在where之后执行的，所以如果where子句需要用窗口函数作为条件，需要多一层查询，在子查询外面进行,例如:

select user_id,avg(diff)

from

(

select user_id,lead(log_time)over(partition user_id order by log_time) - log_time as diff

from user_log

where datediff(now(),t.log_time)<=30

group by user_id

2.窗口函数的基本用法：

函数名 OVER 子句

over关键字用来指定函数执行的窗口范围,若后面括号中什么都不写,则意味着窗口包含满足WHERE条件的所有行，窗口函数基于所有行进行计算；如果不为空,则支持以下4中语法来设置窗口。

①window_name:给窗口指定一个别名。如果SQL中涉及的窗口较多,采用别名可以看起来更清晰易读

②partition by子句：窗口按照哪些字段进行分组,窗口函数在不同的分组上分别执行

③order by子句：按照哪些字段进行排序,窗口函数将按照排序后的记录顺序进行编号

④frame子句：frame是当前分区的一个子集,子句用来定义子集的规则,通常用来作为滑动窗口使用

3.(面试考点)序号函数:row_number(),rank(),dense_rank()的区别

ROW_NUMBER():顺序排序——1、2、3

RANK():并列排序，跳过重复序号——1、1、3

DENSE_RANK():并列排序，不跳过重复序号——1、1、2

4.分布函数:percent_rank(),cume_dist()

percent_rank():

每行按照公式(rank-1) / (rows-1)进行计算。其中，rank为RANK()函数产生的序号，rows为当前窗口的记录总行数

--给窗口指定别名：WINDOW w AS (PARTITION BY stu_id ORDER BY score) rows = 5

mysql> SELECT

-> RANK() OVER w AS rk,

-> PERCENT_RANK() OVER w AS prk,

-> stu_id, lesson_id, score

-> FROM t_score

-> WHERE stu_id = 1

-> WINDOW w AS (PARTITION BY stu_id ORDER BY score)

-> ;

+----+------+--------+-----------+-------+

+----+------+--------+-----------+-------+

| 1 | 0 | 1 | L003 | 79 |

| 2 | 0.25 | 1 | L002 | 86 |

| 3 | 0.5 | 1 | L004 | 88 |

| 4 | 0.75 | 1 | L005 | 98 |

| 4 | 0.75 | 1 | L001 | 98 |

+----+------+--------+-----------+-------+

cume_dist():

分组内小于、等于当前rank值的行数 / 分组内总行数 eg:查询小于等于当前成绩(score)的比例

--cd1：没有分区，则所有数据均为一组，总行数为8

--cd2：按照lesson_id分成了两组，行数各为4

mysql> SELECT stu_id, lesson_id, score,

-> CUME_DIST() OVER (ORDER BY score) AS cd1,

-> CUME_DIST() OVER (PARTITION BY lesson_id ORDER BY score) AS cd2

-> FROM t_score

-> WHERE lesson_id IN ('L001','L002')

-> ;

+--------+-----------+-------+-------+------+

+--------+-----------+-------+-------+------+

| 2 | L001 | 84 | 0.125 | 0.25 |

| 1 | L001 | 98 | 0.75 | 0.5 |

| 4 | L001 | 99 | 0.875 | 0.75 |

| 3 | L001 | 100 | 1 | 1 |

| 1 | L002 | 86 | 0.25 | 0.25 |

| 4 | L002 | 88 | 0.375 | 0.5 |

| 2 | L002 | 90 | 0.5 | 0.75 |

| 3 | L002 | 91 | 0.625 | 1 |

+--------+-----------+-------+-------+------+

5.前后函数:lag(expr,n),lead(expr,n)用途：返回位于当前行的前n行(LAG(expr,n))或后n行(LEAD(expr,n))的expr的值

应用场景：查询前1名同学的成绩和当前同学成绩的差值

mysql> SELECT stu_id, lesson_id, score, pre_score,

-> score-pre_score AS diff

-> FROM(

-> SELECT stu_id, lesson_id, score,

-> LAG(score,1) OVER w AS pre_score

-> FROM t_score

-> WHERE lesson_id IN ('L001','L002')

-> WINDOW w AS (PARTITION BY lesson_id ORDER BY score)) t

-> ;

+--------+-----------+-------+-----------+------+

+--------+-----------+-------+-----------+------+

| 2 | L001 | 84 | NULL | NULL |

| 1 | L001 | 98 | 84 | 14 |

| 4 | L001 | 99 | 98 | 1 |

| 3 | L001 | 100 | 99 | 1 |

| 1 | L002 | 86 | NULL | NULL |

| 4 | L002 | 88 | 86 | 2 |

| 2 | L002 | 90 | 88 | 2 |

| 3 | L002 | 91 | 90 | 1 |

+--------+-----------+-------+-----------+------+

6.头尾函数：FIRST_VALUE(expr),LAST_VALUE(expr)用途：返回第一个(FIRST_VALUE(expr))或最后一个(LAST_VALUE(expr))expr的值

应用场景：截止到当前成绩，按照日期排序查询第1个和最后1个同学的分数

mysql> SELECT stu_id, lesson_id, score, create_time,

-> FIRST_VALUE(score) OVER w AS first_score,

-> LAST_VALUE(score) OVER w AS last_score

-> FROM t_score

-> WHERE lesson_id IN ('L001','L002')

-> WINDOW w AS (PARTITION BY lesson_id ORDER BY create_time)

-> ;

+--------+-----------+-------+-------------+-------------+------------+

+--------+-----------+-------+-------------+-------------+------------+

| 3 | L001 | 100 | 2018-08-07 | 100 | 100 |

| 1 | L001 | 98 | 2018-08-08 | 100 | 98 |

| 2 | L001 | 84 | 2018-08-09 | 100 | 99 |

| 4 | L001 | 99 | 2018-08-09 | 100 | 99 |

| 3 | L002 | 91 | 2018-08-07 | 91 | 91 |

| 1 | L002 | 86 | 2018-08-08 | 91 | 86 |

| 2 | L002 | 90 | 2018-08-09 | 91 | 90 |

| 4 | L002 | 88 | 2018-08-10 | 91 | 88 |

+--------+-----------+-------+-------------+-------------+------------+

拼多多面试题

注:部分来源于笔试,面试部分因为都是基于其他人面经口述记录，所以难免有一些在格式不统一的地方。

二.case专题-商品订单数据

数据表:

订单表orders,大概字段有(order_id'订单号,'user_id‘用户编号’, order_pay‘订单金额’ , order_time‘下单时间’,'商品一级类目commodity_level_I','商品二级类目commodity_level_2')

1.求最近7天内每一个一级类目下成交总额排名前3的二级类目:

select commodity_level_1 as '商品一级类目',

commodity_level_2 as '商品二级类目',

total_pay as '成交总额'

from

(

select commodity_level_1,commodity_level_2,total_pay

row_number()over(partition by commodity_level_1 order by a.total_pay desc) as rank

from

(

select commodity_level_1,

commodity_level_2,

sum(order_pay) as total_pay

from orders

where datediff(now(),order_time) <= 7

group by commodity_level_1,commodity_level_2,

) a

) b

where rank <= 3

2.提取8.1-8.10每一天消费金额排名在101-195的user_id

select order_date as '订单日期',

user_id,

total_pay as '消费金额'

from

(

select order_date,user_id,total_pay

row_number()over(partition by order_date order by a.total_pay desc) as rank

from

(

select convert(order_time,date) as order_date,

user_id,

sum(order_pay) as total_pay

from orders

where convert(order_time,date) between '20190801' and '20190810'

group by convert(order_time,date),user_id

) a

) b

where rank between 101 and 195

三.case专题-活动运营数据分析

数据表

表1——订单表orders,大概字段有(user_id‘用户编号’, order_pay‘订单金额’ , order_time‘下单时间’)

表2——活动报名表act_apply,大概字段有(act_id‘活动编号’, user_id‘报名用户’,act_time‘报名时间’)

1.活动运营数据分析-统计每个活动对应所有用户在报名后产生的总订单金额，总订单数

select act_id as '活动编号', COUNT(*) as '订单数', SUM(order_pay) as '总金额'

from act_apply left join orders on orders.user_id=act_apply.user_id

where order_time >= act_time

GROUP BY act_id

2.统计每个活动从开始后到当天(考试日)平均每天产生的订单数，活动开始时间定义为最早有用户报名的时间。(涉及到时间的数据类型均为：datetime)

解题思路:

(1)找到活动最早用户报名的时间用窗口函数min()over()

(2)计算最早报名时间到当前时间的天数差,datediff(now(),act_start)

select act_id as '活动编号',count(*)/datediff(now(),act_start)

from orders a

left join

(

select act_id,user_id,act_time,min()over(partition by act_id order act_time) as act_start

from act_apply

on a.user_id = b.user_id

where order_time >= act_time

group by act_id,act_start

四.case专题-用户行为路径分析

表1——用户行为表tracking_log，大概字段有(user_id‘用户编号’,opr_id‘操作编号’,log_time‘操作时间’)

1.统计每天符合以下条件的用户数：A操作之后是B操作，AB操作必须相邻

解题思路:运用窗口函数在每行数据生成一列数据:下次操作编号

注意要把datetime格式转换成date格式来表示天

select Date,count(*) as 'A-B路径用户计数'

from

(

select distinct user_id,opr_id as cur_opr,convert(log_time,date) as 'Date',

lead(opr_id,1)over(partition by user_id,convert(log_time,date) order by log_time) as next_opr

from tracking_log

) t

where where t.cur_opr = A and t.next_opr=B

group by Date

2.统计用户行为序列为A-B-D的用户数

其中:A-B之间可以有任何其他浏览记录(如C,E等),B-D之间除了C记录可以有任何其他浏览记录(如A,E等)

select count(user_id) as result

from

(

select user_id,group_concat(opr_id order by log_time) as user_behavior_path

from tracking_log

group by user_id

having (user_behavior_path like '%A%B%D%')

and (user_behavior_path not like '%A%B%C%D%')

) t

五.case专题-用户留存分析

表1——用户登陆表user_log，大概字段有(user_id‘用户编号’，log_date‘登陆时间’)

1.求每天新增用户数，以及他们第2天、30天的留存率

解法一:不要窗口函数,case when

select first_date as '日期',

count(distinct l.user_id) as '新增用户数',

round(

count(distinct case when datediff(log_date,first_date) = 1 then l.user_id else null end) /

count(distinct l.user_id)

) as '次日留存率',

round(

count(distinct case when datediff(log_date,first_date) = 29 then l.user_id else null end) /

count(distinct l.user_id)

) as '30日留存率',

from user_log l left join

(

select user_id,min(log_date) as first_date

from user_log

group by user_id

)t on l.user_id = t.user_id

group by first_date

解法二:

select a.date as '日期',a.new as '新增用户',

b.2_back / a.new as '第2天回访率',

c.30_back / a.new as '第3天回访率',

from

(

select convert(aa.log_date,date) as 'date',count(distinct user_id) as 'new'

from

(

--找到每个用户第一次登陆时间,按第一次登陆日期聚合,统计user_id,即每天新增用户量

select user_id,min(log_date)over(partition by user_id) as first_date,log_date

from user_log

)aa

group by aa.first_date

left join

(

--计算第二天回访的用户量,计算当前时间与第一次登陆的时间差

select convert(bb.first_date,date) as 'date',count(distinct bb.user_id) as '2_back'

from

(

select user_id,log_date,min(log_date)over(partition by user_id) as first_date

from user_log

)bb

where datediff(bb.log_date,bb.first_date) = 1

group by bb.first_date

)b on a.date = b.date

left join

(

--计算第二天回访的用户量,计算当前时间与第一次登陆的时间差

select convert(cc.first_date,date) as 'date',count(distinct cc.user_id) as '30_back'

from

(

select user_id,log_date,min(log_date)over(partition by user_id) as first_date

from user_log

)cc

where datediff(cc.log_date,cc.first_date) = 29

group by cc.first_date

)c on a.date = c.date

2.找近90天,30天,7天的登录人数

select count(distinct case when datediff(now(),log_time)<=90 then user_id else null end) as 90_log_users,

count(distinct case when datediff(now(),log_time)<=30 then user_id else null end) as 30_log_users,

count(distinct case when datediff(now(),log_time)<=7 then user_id else null end) as 7_log_users

from user_log

3.求用户近一个月平均登录时间间隔(按天)

select user_id,avg(diff)

from

(

select user_id,lead(log_time,1)over(partition user_id order by log_time) - log_time as diff

from user_log

where datediff(now(),t.log_time)<=30

group by user_id

六.case专题-统计特征(中位数,众数,四分位数)

字段：店铺id(shop_id),销量(sale),商品id(commodity_id)

1.求每个店铺商品销量排名的中位数

解法一:常规思路

设每个店铺销量组成的序列长度是cnt

当cnt是偶数时,中位数所在序号是cnt/2,cnt/2+1

当cnt是奇数时,中位数所在序号是ceil(cnt/2)

select shop_id,avg(sale)

from

(

select sale,

count(1)over(partition by shop_id) as total, --shop对应数据行数

--用来计算偶数中位数

cast(count(1)over(partition by shop_id) as decimal) / 2 as even_mid,

--用来计算奇数中位数

ceiling(cast(count(1)over(partition by shop_id) as decimal)/2)as odd_mid,

row_number()over(partition by shop_id order by sale) as sale_rank

from orders

) t

where ( total%2=0 and sale_rank in (even_mid,even_mid+1)) or ( total%2=1 and sale_rank = mid)

group by shop_id

解法二:

abs(rn - (cnt+1)/2) < 1

解释下上面的公式:

rn是给定长度为cnt的数列的序号排序，

eg:对于1,2,3,4,5,它的中位数所在序号是3,3-(5+1)/2 = 0

对于1,2,3,4，它的中位数所在序号是2,3

2 - (4+1)/2 = -0.5

3-(4+1)/2 = 0.5

可见(cnt+1)/2是一个数列的中间位置,如果是奇数数列，这个位置刚好是中位数所在

如果是偶数,abs(rn - (cnt+1)/2) < 1

select shop_id,avg(sale) as median

from

(

select shop_id,sale,

row_number() over (partition by shop_id order by sale) as rn, -- 各商品销量在其店铺内的顺序编号

count(1) over (partition by shop_id) as cnt -- 各店铺的商品记录数

from orders

)

where abs(rn - (cnt+1)/2) < 1 -- 顺序编号在店铺商品销量记录数中间的，即为中位数

group by shop_id

解法三:不用窗口函数，不排序，利用中位数定义

对于一个奇数长度数组中的中位数，大于这个数的数值个数等于小于这个数的数值个数。

当数组长度为偶数，且元素唯一时，中位数等于排序后中间两个数的平均值。对这两个数来说，大于当前数的数值个数跟小于当前数的数值个数绝对值之差为 1，恰好等于这个数出现的频率。

总的来说，不管是数组长度是奇是偶，也不管元素是不是唯一，中位数出现的频率一定大于等于大于它的数和小于它的数的绝对值之差。

1.使用自连接

2.其中计算各个数的出现频率 sum(case when t1.sale = t2.sale then 1 else 0 end)

3.大于它(每个数)的数和小于它的数的绝对值之差 abs(sum(sign(t1.sale - t2.sale)))

select shop_id,avg(sale) as median

from

(

select t1.shop_id,t1.sale

from orders t1 left join orders t2

on t1.shop_id = t2.shop_id

group by t1.shop_id,t1.shop_id

having sum(case

when t1.sale = t2.sale then 1

else 0

end) >= abs(sum(sign(t1.sale - t2.sale)))

group by t.shop_id

2.求每个店铺订购商品的众数

select shop_id,commodity_id,order_num

from

(

select shop_id,commodity_id,order_num,max(order_num)over(partition by shop_id) as max_order_num

(

select shop_id,commodity_id,count(*) as order_num

from orders

group by shop_id,commodity_id

) t1

) t2

where order_num = max_order_num

3.求四分位数

三个表

T1：good_id,cate_id(分类)

T2:mall_id(店铺), good_id

T3:mall_id, credit_score(信用分)

问，在不同分类中,店铺的信用分前100和求top25%

select cate_id,mall_id,credit_score

from

(

select cate_id,mall_id,

credit_score,

row_number()over(partition by cate_id order by credit_score desc) as score_rn

count(*)over(partition by cate_id) as mall_total

from

(--选择商品分类id,店铺id,商品信用分数

select T1.cate_id,T2.mall_id,credit_score

from T1 left join (T2 left join T3 on T2.mall_id = T3.mall_id) on T1.good_id = T2.good_id

group by T1.cate_id,T2.mall_id

)

where score_rn <= mall_total*0.25

七.case专题-GMV周同比统计

字段:时间(sale_date),店铺类别(cate_id),店铺数量(mall_num),gmv

1.拼多多618前后一周内各店铺类别gmv的日均提升幅度和比例

注:以下解法只适用于数据连续情况，如果数据不连续，例如对于上一周没有星期六，星期日的数据，lead(gmv,7)这样规定移动窗口必然会出现错误。

select cate_id,avg(gmv_diff),avg(gmv_rate)

from

(

select sale_date,cate_id,mall_num,gmv,

(lead(gmv,7)over(partition by cate_id order by sale_date)-gmv) as gmv_diff,

(lead(gmv,7)over(partition by cate_id order by sale_date)-gmv) / gmv as gmv_rate

from T

where sale_date between '20190611' and '20190624'

where sale_date between '20190611' and '20190617'

group by cate_id,mall_num,gmv

2.在618前一周gmv top20%，20-40%等这5类商铺在618后一周内gmv日均提升幅度和比例

select cate_id,avg(gmv_diff),avg(gmv_rate)

from

(

select sale_date,cate_id,mall_num,gmv,

(lead(gmv,7)over(partition by cate_id order by sale_date)-gmv) as gmv_diff,

(lead(gmv,7)over(partition by cate_id order by sale_date)-gmv) / gmv as gmv_rate

from T

where sale_date between '20190611' and '20190624'

)t1 left join

(

select cate_id,

case when gmv_rank <= total*0.1 then '10%'

when gmv_rank <= total*0.2 and gmv_rank > total*0.1 then '10%-20%'

when gmv_rank <= total*0.3 and gmv_rank > total*0.2 then '20%-30%'

when gmv_rank <= total*0.4 and gmv_ranl > total*0.3 then '30%-40%'

when gmv_rank <= total*0.5 and gmv_ranl > total*0.4 then '40%-50%'

when gmv_ranl > total*0.5 then '50%以上'

else NULL

end as gmv_quantile

from

(

select cate_id,

row_number()over(order by total_gmv desc) as gmv_rank,

count(*)over() as total

from

(

select cate_id,

sum(gmv) as total_gmv

from T

where sale_date between '20190611' and '20190617'

group by cate_id

)t3

)t4

)t2 on t1.cate_id = t2.cate_id

where sale_date between '20190611' and '20190617'

and t2.gmv_quantile in ('10%','10%-20%','20%-30%','30%-40','40%-50%')

group by cate_id

八.case专题-连续区间问题

(拼多多二面面试题，就是找到一个session的开始和结束位置，但是具体题目条件记不清楚了，这里放个类似的题目,看看这一类题目的解题思路)

表:Logs+---------------+---------+| Column Name | Type |+---------------+---------+| log_id | int |+---------------+---------+id 是上表的主键。上表的每一行包含日志表中的一个 ID。后来一些 ID 从 Logs 表中删除。编写一个 SQL 查询得到 Logs 表中的连续区间的开始数字和结束数字。将查询表按照 start_id 排序。查询结果格式如下面的例子：Logs 表：+------------+| log_id |+------------+| 1 || 2 || 3 || 7 || 8 || 10 |+------------+结果表：+------------+--------------+| start_id | end_id |+------------+--------------+| 1 | 3 || 7 | 8 || 10 | 10 |+------------+--------------+结果表应包含 Logs 表中的所有区间。从 1 到 3 在表中。从 4 到 6 不在表中。从 7 到 8 在表中。9 不在表中。10 在表中。

解题思路:(对于一些难度较高的SQL面试题，建议复习下自定义变量的用法)

(1)使用两个变量,一个@id用来记录logid,可以比较当下log_id与之前log_id的差值,判断是否连续。一个@num用来储存连续状态。

select log_id,

case when @id = log_id - 1 then @num := @num

else @num := @num + 1

end num,

@id := log_id

from Logs,(select @num := 0,@id := null)t

上述输出结果如下所示:

输入:{"headers":{"Logs":["log_id"]},"rows":{"Logs":[[1],[2],[3],[7],[8],[10]]}}

输出:{"headers": ["log_id", "num", "@prev_id := log_id"], "values": [[1, "1", 1], [2, "1", 2], [3, "1", 3], [7, "2", 7], [8, "2", 8], [10, "3", 10]]}

(2)得到上述结果后，用num字段分组，最小log_id为start_id，最大log_id为end_id。

最终答案

select min(log_id) start_id,

max(log_id) end_id

from

(

select log_id,

case when @id = log_id - 1 then @num := @num

else @num := @num + 1

end num,

@id := log_id

from Logs,(select @num := 0,@id := null)t

)t2

group by num

猿辅导面试题

九.case专题-学生成绩分析

表：Enrollments

+---------------+---------+

| Column Name | Type |

+---------------+---------+

| student_id | int |

| course_id | int |

| grade | int |

+---------------+---------+

(student_id, course_id) 是该表的主键。

1.查询每位学生获得的最高成绩和它所对应的科目，若科目成绩并列，取 course_id 最小的一门。查询结果需按 student_id 增序进行排序。

解法一:窗口函数

select a.student_id,a.course_id,a.grade

from

(

select student_id,course_id,grade,

row_number()over(partition by student_id order by course_id) as course_rank

from

(

select student_id,course_id,grade,

dense_rank()over(partition by student_id order by grade desc) as grade_rank

from Enrollments

) t

where t.grade_rank = 1

) a

where a.course_rank = 1

order by a.student_id

解法二: in解法(更简单,快速)

select student_id,min(course_id) as course_id,grade

from Enrollments

where (student_id, grade) in (select student_id,max(grade) from Enrollments group by student_id)

group by student_id,grade

order by student_id

2.查询每一科目成绩最高和最低分数的学生,输出courseid,studentid,score

解题思路:

(1)先分别查询最高和最低分数学生

(2)然后使用union合并

预备知识:union和union all

union对两个结果集进行并集操作,两个联合的字段必须一样

两者区别是union要进行重复值扫描,不包括重复行,同时进行默认规则的排序,效率低

union all包括重复行,不进行排序

请注意，union 内部的每个select语句必须拥有相同数量的列。列也必须拥有相似的数据类型。同时，每个select语句中的列的顺序必须相同。

如果union的两列数据类型不一样,可以用强制类型转化为相同类型,convert(value,type)

-- 查询每一科目成绩最高分数的学生

select e.course_id,e.student_id,e.grade as score

from Enrollments e left join

(

select course_id,max(grade) as max_grade

from Enrollments

group by course_id

) t on e.course_id = t.course_id

where e.grade = t.max_grade

union all 合并

select e.course_id,e.student_id,e.grade as score

from Enrollments e left join

(

select course_id,max(grade) as max_grade

from Enrollments

group by course_id

) t on e.course_id = t.course_id

where e.grade = t.max_grade

union all

select e.course_id,e.student_id,e.grade as score

from Enrollments e left join

(

select course_id,min(grade) as min_grade

from Enrollments

group by course_id

) t on e.course_id = t.course_id

where e.grade = t.min_grade

十.case专题-学生做题情况分析

表t:做题日期(time),学生id(stu_id),题目id(exer_id)

统计10.1-10.10每天做新题的人的数量，重点在每天

select count(1) as result

from

(

select a.stu_id,count(distinct a.first_time) as cnt

from

(

select stu_id,exer_id,time,min(time)over(partition by stu_id,exer_id) as first_time

from t

where convert(time,da between ‘20191001’ and ‘20191010’

) a

where a.time = a.first_time

group by a.stu_id

having cnt = 10

) b

十一.Hive面试高频知识点-行转列

1.Hive中的UDF

Hive中有三种UDF:

1、用户定义函数(user-defined function)UDF；

2、用户定义聚集函数(user-defined aggregate function，UDAF);

3、用户定义表生成函数(user-defined table-generating function，UDTF)。

UDF操作作用于单个数据行，并且产生一个数据行作为输出。大多数函数都属于这一类(比如数学函数和字符串函数)。eg:round() abs()

UDAF 接受多个输入数据行，并产生一个输出数据行。像COUNT和MAX这样的函数就是聚集函数。

UDTF 操作作用于单个数据行，并且产生多个数据行-------一个表作为输出。

例如:explode()

简单来说：

UDF:返回对应值，一对一 | UDAF：返回聚类值，多对一 | UDTF：返回拆分值，一对多

2.lateral view explode()

这个是面试高频知识点，也是工作中经常遇到的

下面以搜索业务中用户行为数据为例，为了简单展示，只拿出日志中的部分字段

search_id:唯一标识别每一次搜索记录

query:搜索词

click_detail:点击明细字段

数据样例:

1,'知乎',[{"pos":'4',"time":''20190411 5:30:00'',"type":'A'},{"pos":'3',"time":''20190411 5:30:00'',"type":'B'},{"pos":'2',"time":''20190411 5:30:00'',"type":'C'}]

数据是随便写的，实际数据也比这个复杂，这里只是用来说明其中的数据格式

可以看到click_detail是个Array,代表一次搜索页面结果下的点击情况，pos代表点击位置,time代表点击时间,type代表搜索结果类型

里面是个Map格式

现在需要查询某一天搜索知乎这个query,同时搜索结果type为A的点击量.

第一步:explode()

explode()接受Array或者Map作为输入，输出Array (Map)中的每一个元素作为新的行，即将复杂的结构，由一行转化成多行

例如对于上述数据样例，执行

select explode(click_detail) as click from t;

执行结果如下:

{"pos":'4',"time":''20190411 5:30:00'',"type":'A'}

{"pos":'3',"time":''20190411 5:30:00'',"type":'B'}

{"pos":'2',"time":''20190411 5:30:00'',"type":'C'}

但是explode有自己的局限性，其中一点就是不能关联其他字段,使用explode(udtf)时，只支持一个字段，例如:

--执行以下语句会报错

select search_id,query,explode(click_detail) as click from t;

第二步:lateral view explode()

lateral view 用于和UDTF相结合使用。他会将UDTF生成的结果放在一张虚拟表中(即lateral view里)。虚拟表相当于再和主表关联, 从而达到添加“UDTF(explode)生成的字段“以外的字段。

select count(search_id) as '目标点击量'

from t lateral view explode(clk_detail) clk_detail as click

where partition_stat_date = 20190522 --时间分区

and click['type'] = 'A'

and query = '知乎'

你可能感兴趣的:(mysql,根据分数分等级)

YOLOV10的tensorrt C++部署 dddccc1234 YOLO
根据博客进行python版本安装YOLOv10最全使用教程（含ONNX和TensorRT推理）-CSDN博客并将pt转为onnx：yoloexportmodel=yolov10s.ptformat=onnxopset=13simplify然后采用：https://github.com/hamdiboukamcha/yolov10-tensorrt.git进行c++编译配置好cuda11.7tens
Ubuntu开放mysql 3306端口
Ubuntu开放mysql3306端口1.检查UFW防火墙规则2.检查iptables规则1.检查UFW防火墙规则sudoufwstatusverbose|grep3306若输出包含3306/tcpALLOW，表示端口已开放(如下)ubuntu@Ubuntu2404:~$sudoufwstatusverbose|grep33063306/tcpALLOWINAnywhere3306/tcp(v6)
推客系统赋能商家：智能分佣 + 多级裂变 + 数据驱动的增长新范式 ywxs5787 系统搭建微信开放平台推客系统微信小店大数据
在当下电商市场，流量获取成本日益攀升，竞争愈发激烈，商家们都在探寻更高效、更具性价比的运营模式。推客系统的出现，为商家带来了诸多变革，成为众多商家实现业务突破的有力助手。一、智能分佣，精准激励传统的营销推广方式，商家往往难以精准衡量投入产出比，大量资金可能耗费在无效曝光上。而推客系统的智能分佣模式，让商家的每一分投入都花在刀刃上。商家可以根据不同商品的利润空间、市场定位以及推广难度，灵活设置佣金比
Day32 Web自动化进阶 lookout99 软件测试 python 自动化测试工具
系列文章目录Day01软件测试基础总结Day02测试用例知识点总结（上）Day03测试用例知识点总结（下）Day04禅道-从安装到卸载Day05MySql的基础使用Day06MySql知识点总结Day07MySql知识点再总结与多表查询Day08redis的基础知识Day08VMware的安装、Linux系统安装和Linux基础命令Day09Linux常用命令总结Day10Linux环境部署和项目
Day33 PO模型 lookout99 软件测试 python 自动化测试工具
系列文章目录Day01软件测试基础总结Day02测试用例知识点总结（上）Day03测试用例知识点总结（下）Day04禅道-从安装到卸载Day05MySql的基础使用Day06MySql知识点总结Day07MySql知识点再总结与多表查询Day08redis的基础知识Day08VMware的安装、Linux系统安装和Linux基础命令Day09Linux常用命令总结Day10Linux环境部署和项目
FineWeb数据集 frostmelody 人工智能
FineWeb数据集根据您提供的文档链接，我将对FineWeb数据集进行全面解析。FineWeb是HuggingFace在2024年发布的一项革命性开源AI训练数据集，它通过提供高质量、大规模的数据，打破了AI训练数据的垄断局面。以下解析基于文档内容，分为几个核心部分：FineWeb的定义与规模、其重要性、主要突破点，以及制作过程的全貌。我会在相关部分嵌入文档中的图片，以增强理解。所有图片均来自文
TensorFlow运行时核心：DirectSession::Run全解析 Jay Kay tfserving c++tensorflow 分布式
TensorFlow运行时核心：DirectSession::Run全解析TensorFlow的本地执行模式通过DirectSession::Run实现高效计算图处理，其核心流程分为三个阶段：图剪枝生成ClientGraph、设备间图分裂、跨设备并发执行。下面结合源码层设计深入剖析各环节实现原理。一、图剪枝：从FullGraph到ClientGraph目标：根据Session::Run指定的输入（
mysql锁机制 weixin_45990219 教程 mysql 数据库
深入解析MySQL锁机制：从原理到实战场景前言在数据库高并发场景中，锁机制是保障数据一致性和事务隔离性的核心。然而，MySQL中锁的类型繁多，概念抽象，容易让人望而生畏。本文将通过通俗的语言和实际场景，带你彻底理解MySQL中的各种锁机制及其应用。一、锁的由来与分类1.1为什么需要锁？多个事务并发执行时，可能出现脏写、脏读、不可重复读、幻读等问题。例如：场景：A事务修改了某条数据但未提交，B事务读
AlpineLinux安装部署MariaDB 山岚的运维笔记 Linux 运维及使用 mariadb 数据库
简单来说，MariaDB被视为MySQL的一个社区驱动的分支，它保留了MySQL的许多特性和功能，同时引入了一些新的特性和改进。许多用户和组织选择使用MariaDB，因为它提供了更多的自由度和对未来许可证变更的保护。而对于一些需要特定Oracle支持或特定MySQL功能的用例，依然使用MySQL是首选。这里不对两者间的差异做任何介绍，仅介绍如何在AlpineLinux下安装MariaDB。在Alp
`docker-compose` 安装 Neo4j 的详细步骤 MonkeyKing.sun docker neo4j 容器
docker-compose安装Neo4j的详细步骤，适用于本地开发或测试环境（适配Neo4j5.x或4.x版本）：一、准备环境1.安装Docker和DockerCompose如果尚未安装，请根据系统安装：Linux/macOS推荐安装DockerDesktop（已集成DockerCompose）Windows安装DockerDesktop验证安装：docker-vdocker-compose-v
Ubuntu下安装Moodle平台 swy520 ubuntu Moodle ubuntu Moodle
一前言Moodle是一个开源课程管理系统（CMS），也被称为学习管理系统（LMS）或虚拟学习环境（VLE），它通常用来播放符合SCORM标准的课件，但功能远不止课程管理，作业模块等功能。这里主要介绍moodle的安装方法。二安装准备Moodle通常在Linux操作系统上，基于Apache，PostgreSQL/MySQL/MariaDB和PHP进行开发。为了平台的稳定性，我们选择Linux操作系统
MySQL 锁机制全解析：从表锁到间隙锁，谁都能看懂的知识！ dr李四维笔记 mysql 数据库锁死锁乐观锁悲观锁意向锁
目录一、锁的基本概念二、MySQL中的锁类型1.表级锁（TableLock）2.行级锁（RowLock）3.间隙锁（GapLock）4.意向锁（IntentLock）5.乐观锁（OptimisticLock）6.悲观锁（PessimisticLock）7.死锁（Deadlock）8.自增锁（Auto-IncrementLock）9.元数据锁（MetadataLock,MDL）三、锁的对比与选择四、
学而思编程周赛语言普及奠基组 | 2025年春第15周T1 新二进制热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
学而思编程周赛语言普及奠基组 | 2025年春第15周T2 散步热爱编程的通信人算法 c++
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
MySQL5.7评估数据库层binlog过滤写入颖妍--唯爱数据库 mysql
binlog-do-db参数的影响本次测试均为binlog_format=row格式,因为binlog_format=statement格式在复制场景下，对函数和存储过程使用不友好，很容易导致主从数据不一致，生产环境很少有使用statement格式。使用use指定库在test库进行ddl操作和dml操作[root@localhost]15:17:10[test]>flushbinarylogs;Q
Linux学习笔记：PCIe内核篇（1）：初始化与枚举流程 ZH_2025 嵌入式协议篇 PCIE
根据system.map查看内核中PCIe加载流程：root@zh-vm:~#cat/boot/System.map-5.15.0-130-generic|greppci|grepinitcallffffffff8350ff68d__initcall__kmod_pci__453_6907_pci_realloc_setup_params0ffffffff83510098d__initcall__
高性价比二手服务器CPU你知多少? 专注VB编程开发20年 CPU 二手
以前E33220这些都不太好的吧,现在不知有哪种二手服务器CPU核心多,主频高,性价比更高,闲鱼二手上哪些值的买,多少钱根据2025年二手服务器CPU市场现状，结合核心数、主频、价格及兼容性，以下推荐四款高性价比型号（价格参考2025年5-6月闲鱼行情）：⚡‌一、性能怪兽：IntelXeonE5-2696v3（18核36线程）‌‌核心参数‌：18核36线程｜基础2.3GHz/睿频3.8GHz｜L3
mariadb冷备操作流程运维小杨 mariadb 数据库
1、配置清单10.0.0.23客户端一台，10.0.0.13服务端一台，需要将客户端的数据备份到服务端2、客户端配置2.1开启二进制日志vim/etc/mysql/mariadb.conf.d/50-server.cnf2.2在[mysql]下面添加log_bin=/data/mysql/logs/binlog2.3创建日志目录，给予权限mkdir/data/mysql/logs/-pchownm
【有源码】基于爬虫+python的美食数据分析与可视化flask热门美食推荐系统的设计与实现 Q2643365023 Python 大数据 python 爬虫计算机毕设选题毕业设计源码计算机毕设项目数据分析美食推荐系统
注意：该项目只展示部分功能，如需了解，文末咨询即可。本文目录1.开发环境2系统设计2.1设计背景2.2设计内容3系统展示3.1功能展示视频3.2系统页面4更多推荐5部分功能代码1.开发环境开发语言：Python采用技术：flask、爬虫数据库：MySQL开发环境：PyCharm2系统设计2.1设计背景在现代社会中，人们对美食的兴趣和需求日益增长。互联网和社交媒体的普及使得各种美食信息、评论和推荐变
文本数据增强-同义词替换、随机交换、随机插入、随机删除
根据zhangy代码改写，主要针对千言问题匹配进行文本数据增强。依赖安装pipinstalljiebapipinstallsynonymseda.pyimportjiebaimportsynonymsimportrandomfromrandomimportshufflerandom.seed(2019)#停用词列表，默认使用哈工大停用词表f=open('stopwords/hit_stopword
Kotlin编译流程 xiangxiongfly915 Kotlin kotlin
文章目录Kotlin编译流程Kotlin编译流程使用AS工具Kotlin与Java代码对比printlnKotlin类型类型推导字符串模板when表达式类抽象类接口数据类不设置默认值全设置默认值总结@JvmOverloadsKotlin编译流程Kotlin编译流程Kotlin代码经过编译器边后，生成Java字节码，这种字节码是专门为JVM设计的，JVM拿到字节码后，会根据特定的语法解析其中的内容，
实数系的基本定理_七大实数理论与互推 weixin_39710288 实数系的基本定理
七大实数理论简介（一）确界原理定义1.1：是一个非空数集，是一个常数，若，有，则称是数集的一个上界。同理，若，有，则称是数集的一个下界。定义1.2：若是数集的一个上界，并且有，，满足，则称是数集的上确界。类似的，若是数集的一个下界，并且有，，满足，则称是数集的下确界。定理1.1：若数集有上确界，则上确界是唯一的。证明：使用反证法，若是数集的上确界，假设还有也是上确界。若，根据定义1.2的否定，取，
论软件设计方法及其应用怎么可能-怎么可能系统架构软件设计方法
20250427-作题目软件设计（SoftwareDesign，SD)根据软件需求规格说明书设计软件系统的整体结构、划分功能模块、确定每个模块的实现算法以及程序流程等，形成软件的具体设计方案。软件设计把许多事物和问题按不同的层次和角度进行抽象，将问题或事物进行模块化分解，以便更容易解决问题。分解得越细，模块数量也就越多，设计者需要考虑模块之间的耦合度。请围绕“论软件设计方法及其应用”论题，依次从以
Android面试准备之Android基础北诺南兮 android java 面试
一、Handler机制创建一个Handler//提示已过时Handlerhandler=newHandler();Handlerhandler=newHandler(Looper.myLooper());隐式指定Looper的Handler初始化方法已被Android11报过时，根据注释，是由于不指定Looper在一些场景下会导致任务丢失或程序崩溃，比如没有Looper的线程。publicstat
Redis 集群架构妖怪兮诺‍ 数据库 redis 架构数据库
Redis集群是什么Redis集群是一种通过将多个Redis节点连接在一起以实现高可用性、数据分片和负载均衡的技术。它允许Redis在不同节点上同时提供服务，提高整体性能和可靠性。根据搭建的方式和集群的特点，Redis集群主要有三种模式：主从复制模式（Master-Slave）、哨兵模式（Sentinel）和Cluster模式Redis集群的作用和优势高可用性负载均衡容灾恢复数据分片易于拓展Mas
Python爬虫实战：研究sanitize库相关技术 ylfhpy 爬虫项目实战 python 爬虫网络开发语言安全 sanitize
1.引言1.1研究背景与意义在当今数字化时代，互联网已成为人们获取信息、交流互动的重要平台。随着Web2.0技术的发展，用户生成内容(UGC)、社交媒体嵌入、第三方插件等功能极大丰富了网页的内容和交互性，但也带来了严峻的安全挑战。根据Web应用安全联盟(WAS)的统计数据，2025年全球范围内因网页安全漏洞导致的数据泄露事件超过15万起，造成的经济损失高达250亿美元。其中，跨站脚本攻击(XSS)
OceanBase批量插入数据报错java.lang.ArrayIndexOutOfBoundsException:0 二宝哥 oceanbase java 开发语言
OceanBase数据库MySQL模式，插入数据报错，直接首先换了连接池，插入数据成功。参考文章：com.mysql.cj.jdbc.result.ResultSetMetaData.getCloumnType(ResultSetMetaData.java:188)空指针-CSDN博客批量插入数据时，报错如下：OceanBase社区中搜索批量插入报错，出现“ArrayIndexOutOfBound
WPF 常用布局控件的基础使用 Dr.多喝热水 WPF wpf
WPF常用布局控件在WPF中，布局控件（也叫布局容器）负责安排子元素（比如按钮、文本框等）的摆放位置。1.Grid（网格布局）Grid是最常用的布局控件，它把空间划分成行和列，可以让子元素按照表格方式排列。示例：说明：RowDefinitions和ColumnDefinitions分别定义了行和列。Height="Auto"表示高度根据内容自动调整。Height="*"表示分配剩余空间。2*表示是
如何让人工智能使你的工作效率一日千里南风过闲庭人工智能 ai python
1.自动化重复性任务1.1识别并自动化日常任务提高工作效率的首要步骤是识别日常工作中重复性高且耗时的任务。根据麦肯锡全球研究院的报告，知识工作者大约有40%的时间花费在此类任务上。通过自动化这些任务，员工可以将更多时间投入到需要创造性思维和复杂决策的工作上。数据支持：一项针对500名知识工作者的调查显示，通过自动化日常任务，平均每天可以节省2小时的工作时间。这些任务包括数据录入、文件整理、邮件分类
多模态融合相机L3CAM moonsims 人工智能
多模态融合相机L3CAML3CAM是Beamagine公司推出的多模态传感器融合技术，结合了激光雷达（LiDAR）和可见光摄像头，旨在为自动驾驶、工业机器人和其他需要精确环境感知的应用场景提供高效、安全的解决方案。L3CAM技术参数L3CAM结合了LiDAR和可见光摄像头，使其能够提供三维空间感知及图像级别的环境识别能力激光雷达部分（LiDAR）探测范围：大约200米（具体范围根据不同环境和反射面
HQL之投影查询归来朝歌 HQL Hibernate 查询语句投影查询
在HQL查询中，常常面临这样一个场景，对于多表查询，是要将一个表的对象查出来还是要只需要每个表中的几个字段，最后放在一起显示？针对上面的场景，如果需要将一个对象查出来： HQL语句写“from 对象”即可 Session session = HibernateUtil.openSession();
Spring整合redis bylijinnan redis
pom.xml <dependencies>  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redi
org.hibernate.NonUniqueResultException: query did not return a unique result: 2 0624chenhong Hibernate
参考：http://blog.csdn.net/qingfeilee/article/details/7052736 org.hibernate.NonUniqueResultException: query did not return a unique result: 2 在项目中出现了org.hiber
android动画效果不懂事的小屁孩 android动画
前几天弄alertdialog和popupwindow的时候，用到了android的动画效果，今天专门研究了一下关于android的动画效果，列出来，方便以后使用。 Android 平台提供了两类动画。一类是Tween动画，就是对场景里的对象不断的进行图像变化来产生动画效果（旋转、平移、放缩和渐变）。第二类就是 Frame动画，即顺序的播放事先做好的图像，与gif图片原理类似。
js delete 删除机理以及它的内存泄露问题的解决方案换个号韩国红果果 JavaScript
delete删除属性时只是解除了属性与对象的绑定，故当属性值为一个对象时，删除时会造成内存泄露（其实还未删除）举例： var person={name:{firstname:'bob'}} var p=person.name delete person.name p.firstname -->'bob' // 依然可以访问p.firstname，存在内存泄露
Oracle将零干预分析加入网络即服务计划蓝儿唯美 oracle
由Oracle通信技术部门主导的演示项目并没有在本月较早前法国南斯举行的行业集团TM论坛大会中获得嘉奖。但是，Oracle通信官员解雇致力于打造一个支持零干预分配和编制功能的网络即服务（NaaS）平台，帮助企业以更灵活和更适合云的方式实现通信服务提供商（CSP）的连接产品。这个Oracle主导的项目属于TM Forum Live!活动上展示的Catalyst计划的19个项目之一。Catalyst计
spring学习——springmvc（二） a-john springMVC
Spring MVC提供了非常方便的文件上传功能。 1，配置Spring支持文件上传： DispatcherServlet本身并不知道如何处理multipart的表单数据，需要一个multipart解析器把POST请求的multipart数据中抽取出来，这样DispatcherServlet就能将其传递给我们的控制器了。为了在Spring中注册multipart解析器，需要声明一个实现了Mul
POJ-2828-Buy Tickets aijuans ACM_POJ
POJ-2828-Buy Tickets http://poj.org/problem?id=2828 线段树，逆序插入 #include<iostream>#include<cstdio>#include<cstring>#include<cstdlib>using namespace std;#define N 200010struct
Java Ant build.xml详解 asia007 build.xml
1,什么是antant是构建工具2,什么是构建概念到处可查到，形象来说，你要把代码从某个地方拿来，编译，再拷贝到某个地方去等等操作，当然不仅与此，但是主要用来干这个3,ant的好处跨平台 --因为ant是使用java实现的，所以它跨平台使用简单--与ant的兄弟make比起来语法清晰--同样是和make相比功能强大--ant能做的事情很多，可能你用了很久，你仍然不知道它能有
android按钮监听器的四种技术百合不是茶 android xml配置监听器实现接口
android开发中经常会用到各种各样的监听器,android监听器的写法与java又有不同的地方; 1,activity中使用内部类实现接口 ,创建内部类实例使用add方法与java类似创建监听器的实例 myLis lis = new myLis(); 使用add方法给按钮添加监听器
软件架构师不等同于资深程序员 bijian1013 程序员架构师架构设计
本文的作者Armel Nene是ETAPIX Global公司的首席架构师，他居住在伦敦，他参与过的开源项目包括 Apache Lucene,，Apache Nutch， Liferay 和 Pentaho等。如今很多的公司
TeamForge Wiki Syntax & CollabNet User Information Center sunjing TeamForge How do Attachement Anchor Wiki Syntax
the CollabNet user information center http://help.collab.net/ How do I create a new Wiki page? A CollabNet TeamForge project can have any number of Wiki pages. All Wiki pages are linked, and
【Redis四】Redis数据类型 bit1129 redis
概述 Redis是一个高性能的数据结构服务器，称之为数据结构服务器的原因是，它提供了丰富的数据类型以满足不同的应用场景，本文对Redis的数据类型以及对这些类型可能的操作进行总结。 Redis常用的数据类型包括string、set、list、hash以及sorted set.Redis本身是K/V系统，这里的数据类型指的是value的类型，而不是key的类型，key的类型只有一种即string
SSH2整合-附源码白糖_ eclipse spring tomcat Hibernate Google
今天用eclipse终于整合出了struts2+hibernate+spring框架。我创建的是tomcat项目，需要有tomcat插件。导入项目以后，鼠标右键选择属性，然后再找到“tomcat”项，勾选一下“Is a tomcat project”即可。具体方法见源码里的jsp图片，sql也在源码里。补充1：项目中部分jar包不是最新版的，可能导
[转]开源项目代码的学习方法 braveCS 学习方法
转自： http://blog.sina.com.cn/s/blog_693458530100lk5m.html http://www.cnblogs.com/west-link/archive/2011/06/07/2074466.html 1）阅读features。以此来搞清楚该项目有哪些特性2）思考。想想如果自己来做有这些features的项目该如何构架3）下载并安装d
编程之美-子数组的最大和（二维） bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; import java.util.Random; public class MaxSubArraySum2 { /** * 编程之美子数组之和的最大值（二维） */ private static final int ROW = 5; private stat
读书笔记-3 chengxuyuancsdn jquery笔记 resultMap配置 ibatis一对多配置
1、resultMap配置 2、ibatis一对多配置 3、jquery笔记 1、resultMap配置当<select resultMap="topic_data"> <resultMap id="topic_data">必须一一对应。 (1)<resultMap class="tblTopic&q
[物理与天文]物理学新进展 comsci
如果我们必须获得某种地球上没有的矿石,才能够进行某些能量输出装置的设计和建造,而要获得这种矿石,又必须首先进行深空探测,而要进行深空探测,又必须获得这种能量输出装置,这个矛盾的循环,会导致地球联盟在与宇宙文明建立关系的时候,陷入困境怎么办呢?
Oracle 11g新特性:Automatic Diagnostic Repository daizj oracle ADR
Oracle Database 11g的FDI（Fault Diagnosability Infrastructure）是自动化诊断方面的又一增强。 FDI的一个关键组件是自动诊断库（Automatic Diagnostic Repository-ADR）。在oracle 11g中，alert文件的信息是以xml的文件格式存在的，另外提供了普通文本格式的alert文件。这两份log文
简单排序:选择排序 dieslrae 选择排序
public void selectSort(int[] array){ int select; for(int i=0;i<array.length;i++){ select = i; for(int k=i+1;k<array.leng
C语言学习六指针的经典程序，互换两个数字 dcj3sjt126com c
示例程序，swap_1和swap_2都是错误的，推理从1开始推到2，2没完成，推到3就完成了 # include <stdio.h> void swap_1(int, int); void swap_2(int *, int *); void swap_3(int *, int *); int main(void) { int a = 3; int b =
php 5.4中php-fpm 的重启、终止操作命令 dcj3sjt126com PHP
php 5.4中php-fpm 的重启、终止操作命令: 查看php运行目录命令：which php/usr/bin/php 查看php-fpm进程数：ps aux | grep -c php-fpm 查看运行内存/usr/bin/php -i|grep mem 重启php-fpm/etc/init.d/php-fpm restart 在phpinfo()输出内容可以看到php
线程同步工具类 shuizhaosi888 同步工具类
同步工具类包括信号量（Semaphore）、栅栏（barrier）、闭锁（CountDownLatch）闭锁（CountDownLatch） public class RunMain { public long timeTasks(int nThreads, final Runnable task) throws InterruptedException { fin
bleeding edge是什么意思 haojinghua DI
不止一次，看到很多讲技术的文章里面出现过这个词语。今天终于弄懂了——通过朋友给的浏览软件，上了wiki。我再一次感到，没有辞典能像WiKi一样，给出这样体贴人心、一清二楚的解释了。为了表达我对WiKi的喜爱，只好在此一一中英对照，给大家上次课。 In computer science, bleeding edge is a term that
c中实现utf8和gbk的互转 jimmee c iconv utf8&gbk编码
#include <iconv.h> #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <fcntl.h> #include <string.h> #include <sys/stat.h> int code_c
大型分布式网站架构设计与实践 lilin530 应用服务器搜索引擎
1.大型网站软件系统的特点？ a.高并发，大流量。 b.高可用。 c.海量数据。 d.用户分布广泛，网络情况复杂。 e.安全环境恶劣。 f.需求快速变更，发布频繁。 g.渐进式发展。 2.大型网站架构演化发展历程？ a.初始阶段的网站架构。应用程序，数据库，文件等所有的资源都在一台服务器上。 b.应用服务器和数据服务器分离。 c.使用缓存改善网站性能。 d.使用应用
在代码中获取Android theme中的attr属性值 OliveExcel android theme
Android的Theme是由各种attr组合而成, 每个attr对应了这个属性的一个引用, 这个引用又可以是各种东西. 在某些情况下, 我们需要获取非自定义的主题下某个属性的内容 (比如拿到系统默认的配色colorAccent), 操作方式举例一则: int defaultColor = 0xFF000000; int[] attrsArray = { andorid.r.
基于Zookeeper的分布式共享锁 roadrunners zookeeper 分布式共享锁
首先，说说我们的场景，订单服务是做成集群的，当两个以上结点同时收到一个相同订单的创建指令，这时并发就产生了，系统就会重复创建订单。等等......场景。这时，分布式共享锁就闪亮登场了。共享锁在同一个进程中是很容易实现的，但在跨进程或者在不同Server之间就不好实现了。Zookeeper就很容易实现。具体的实现原理官网和其它网站也有翻译，这里就不在赘述了。官
两个容易被忽略的MySQL知识 tomcat_oracle mysql
1、varchar(5)可以存储多少个汉字，多少个字母数字？　　相信有好多人应该跟我一样，对这个已经很熟悉了，根据经验我们能很快的做出决定，比如说用varchar(200)去存储url等等，但是，即使你用了很多次也很熟悉了，也有可能对上面的问题做出错误的回答。　　这个问题我查了好多资料，有的人说是可以存储5个字符，2.5个汉字（每个汉字占用两个字节的话），有的人说这个要区分版本，5.0
zoj 3827 Information Entropy(水题) 阿尔萨斯 format
题目链接：zoj 3827 Information Entropy 题目大意：三种底，计算和。解题思路：调用库函数就可以直接算了，不过要注意Pi = 0的时候，不过它题目里居然也讲了。。。limp→0+plogb(p)=0，因为p是logp的高阶。 #include <cstdio> #include <cstring> #include <cmath&