人猿宇宙

大数据-玩转数据-Hive应用小结

说明

本文只为说明功能，除十二节外，案例数据并不连贯。

一、 HIVE是什么

HIVE是基于Hadoop的一个数据仓库工具，它是一个可以将Sql翻译为MR程序的工具；HIVE支持用户将HDFS上的文件映射为表结构，然后用户就可以输入SQL对这些表（HDFS上的文件）进行查询分析,HIVE将用户定义的库、表结构等信息存储到HIVE的元数据库（可以是本地derby，也可以是远程mysql）中。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

二、登录交互模式

我们假设已经启动了HDFS,Yarn

[root@hadoop1 ~]# jps
1991 NameNode
2122 DataNode
2556 Jps
2414 NodeManager

1、单机交互式

已经配置了HIVE环境变量(参考HIVE安装篇)

[root@hadoop1 ~]# hive

2、hive服务交互

后台启动运行hive服务

[root@hadoop1 hive]# nohup bin/hiveserver2 1>/dev/dull 2>&1 &
[1] 3034

查看服务是否启动（需要一点时间）

[root@hadoop1 hive]# netstat -nltp|grep 10000

如果看到10000的端口的服务说明服务已经启动

任一台安装了hive的客户端连接启动的服务

[root@hadoop1 hive]# bin/beeline -u jdbc:hive2://hadoop1:10000 -n hadoop

如果报错：

21/03/17 18:04:41 [main]: WARN jdbc.HiveConnection: Failed to connect to hadoop102:10000
Error: Could not open client transport with JDBC Uri: jdbc:hive2://hadoop102:10000: Failed to open new session: java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.authorize.AuthorizationException): User: kuber is not allowed to impersonate kuber (state=08S01,code=0)

首先在./etc/hadoop/core-site.xml文件里面加上：

<property>
		<name>hadoop.proxyuser.kuber.hostsname>
		<value>*value>
property>
<property>
		<name>hadoop.proxyuser.kuber.groupsname>
		<value>*value>
property>

然后重启hdfs和yarn，重启hiveserver,hiveserver2但是对我来说并没用。
随后，我在hive/conf/hive.site.xml里面加了下面一句：

<property>
    <name>hive.server2.enable.doAsname>
    <value>falsevalue>
property>

重新启动服务登录

3、将hive作为命令shell运行

bin/hive -e “sql1;sql2;sql3;sql4”
事先将sql语句写入一个文件比如 q.hql ，然后用hive命令执行：

[root@hadoop1 ~]# hive -e "select count(1) from default.t_big24"

当前目录下创建q.hql

[root@hadoop1 ~]# hive -f q.hql

4、shell脚本中调用

编写一个shell脚本文件etl.sh

#!/bin/bash
hive -e "create table t_count_text(sex string,number int)"
hive -e "isnert into t_count_text select sex,count(1) from default.t_big24 group by sex"

运行shell 脚本

[root@hadoop1 ~]# sh etl.sh

三、HIVE的DDL语法

1、建库

登录hive

jdbc:hive2://hadoop1:10000> create database db1;

hive就会在默认仓库路径 /user/hive/warehouse/下建一个文件夹： db1.db

2、建内部表

2.1创建表

jdbc:hive2://hadoop1:10000> use db1;

jdbc:hive2://hadoop1:10000>create table t_2(id int,name string,salary bigint,add string)
row format delimited
fields terminated by ',';

建表后，hive会在仓库目录中建一个表目录： /user/hive/warehouse/db1.db/t_test1，数据格式的分隔符是’,’，如果不指定，默认分割划是^A，用ctrl + v可以输入 ^符号，ctrl + a 可以输入A，linux下用cat命令是看不到这个默认分割符的。

2.2 添加列

jdbc:hive2://hadoop1:10000> alter table t_seq add columns(address string,age int);

2.3 全部替换

jdbc:hive2://hadoop1:10000> alter table t_seq replace columns(id int,name string,address string,age int);

2.4 修改已存在的列定义

jdbc:hive2://hadoop1:10000> alter table t_seq change userid uid string;

3、建外部表

jdbc:hive2://hadoop1:10000> create external table t_3(id int,name string,salary bigint,add string)
row format delimited
fields terminated by ','
location '/aa/bb';

4、内部表和外部表区别

内部表的目录由hive创建在默认的仓库目录下：/user/hive/warehouse/…
外部表的目录由用户建表时自己指定： location ‘/位置/’
drop一个内部表时，表的元信息和表数据目录都会被删除；
drop一个外部表时，只删除表的元信息，表的数据目录不会删除；
意义：通常，一个数据仓库系统，数据总有一个源头，而源头一般是别的应用系统产生的，其目录无定法，为了方便映射，就可以在hive中用外部表进行映射；并且，就算在hive中把这个表给drop掉，也不会删除源数据目录，也就不会影响到别的应用系统；

5、分区表

分区关键字 PARTITIONED BY

jdbc:hive2://hadoop1:10000> create table t_4(ip string,url string,staylong int)
partitioned by (day string) 
row format delimited
fields terminated by ',';

分区标识不能存在于表字段中。

6、修改表的分区

6.1 添加分区

jdbc:hive2://hadoop1:10000> alter table t_4 add partition(day='2017-04-10') partition(day='2017-04-11');

添加完成后，可以检查t_4的分区情况：

jdbc:hive2://hadoop1:10000> show partitions t_4;

然后，可以向新增的分区中导入数据：

jdbc:hive2://hadoop1:10000> load data local inpath '/root/weblog.3' into table t_4 partition(day='2017-04-10');
jdbc:hive2://hdp-nn-01:10000> select * from t_4 where day='2017-04-10';

–还可以使用insert

insert into table t_4 partition(day='2017-04-11')
select ip,url,staylong from t_4 where day='2017-04-08' and staylong>30;

6.2 删除分区

jdbc:hive2://hadoop1:10000> alter table t_4 drop partition(day='2017-04-11');

四、数据的导入

先把数据存放到HDFS上指定目录

hdfs dfs -mkdir /hive_operate
hdfs dfs -mkdir /hive_operate/movie_table
hdfs dfs -mkdir /hive_operate/rating_table

hdfs dfs -put movies.csv /hive_operate/movie_table
hdfs dfs -put ratings.csv /hive_operate/rating_table

1、本地导入数据hive表

将hive运行所在机器的本地磁盘上的文件导入表中

hive>load data local inpath '/root/weblog.1' into[overwrite] table t_1;

2 、将hdfs中的文件导入hive表

jdbc:hive2://hadoop1:10000> load data inpath '/user.data.2' into table t_1;

不加local关键字，则是从hdfs的路径中移动文件到表目录中；

3、从别的表查询数据后插入到一张新建表中

jdbc:hive2://hadoop1:10000> create table t_1_jz
as
select id,name from t_1;

4、从别的表查询数据后插入到一张已存在的表中

加入已存在一张表：可以先建好：

jdbc:hive2://hadoop1:10000> create table t_1_hd like t_1;

然后从t_1中查询一些数据出来插入到t_1_hd中：

jdbc:hive2://hadoop1:10000> insert into table t_1_hd
select 
id,name,add 
from t_1
where add='handong';

5、导入数据到不同的分区目录

jdbc:hive2://hadoop1:10000> load data local inpath '/root/weblog.1' into table t_4 partition(day='2017-04-08');
jdbc:hive2://hadoop1:10000> load data local inpath '/root/weblog.2' into table t_4 partition(day='2017-04-09');

五、数据的导出

1、将数据从hive的表中导出到hdfs的目录中

jdbc:hive2://hadoop1:10000> insert overwrite directory '/aa/bb'
select * from t_1 where add='jingzhou';

2 、将数据从hive的表中导出到本地磁盘目录中

jdbc:hive2://hadoop1:10000> insert overwrite local directory '/aa/bb'
select * from t_1 where add='jingzhou';

六、显示命令

show tables
show databases
show partitions
例子： show partitions t_4;
show functions – 显示hive中所有的内置函数
desc t_name; – 显示表定义
desc extended t_name; – 显示表定义的详细信息
desc formatted table_name;
– 显示表定义的详细信息，并且用比较规范的格式显示
show create table table_name – 显示建表语句

七、hive 中 DML 语句

同sql语句

八、HIVE的内置函数

1、时间处理函数

from_unixtime(21938792183,'yyyy-MM-dd HH:mm:ss')  -->   '2017-06-03 17:50:30'

select current_date from dual;
select current_timestamp from dual;

select unix_timestamp() from dual;
--1491615665

select unix_timestamp('2011-12-07 13:01:03') from dual;
--1323234063

select unix_timestamp('20111207 13:01:03','yyyyMMdd HH:mm:ss') from dual;
--1323234063

select from_unixtime(1323234063,'yyyy-MM-dd HH:mm:ss') from dual;

--获取日期、时间
select year('2011-12-08 10:03:01') from dual;
--2011
select year('2012-12-08') from dual;
--2012
select month('2011-12-08 10:03:01') from dual;
--12
select month('2011-08-08') from dual;
--8
select day('2011-12-08 10:03:01') from dual;
--8
select day('2011-12-24') from dual;
--24
select hour('2011-12-08 10:03:01') from dual;
--10
select minute('2011-12-08 10:03:01') from dual;
--3
select second('2011-12-08 10:03:01') from dual;
--1

--日期增减
select date_add('2012-12-08',10) from dual;
--2012-12-18

date_sub (string startdate, int days) : string
--例：
select date_sub('2012-12-08',10) from dual;
--2012-11-28

2、类型转换函数

from_unixtime(cast('21938792183' as bigint),'yyyy-MM-dd HH:mm:ss')

3、字符串截取和拼接

substr("abcd",1,3)  -->   'abc'
concat('abc','def')  -->  'abcdef'

4、Json数据解析函数

get_json_object('{\"key1\":3333，\"key2\":4444}' , '$.key1')  -->  3333

json_tuple('{\"key1\":3333，\"key2\":4444}','key1','key2') as(key1,key2)  --> 3333, 4444

5、url解析函数

parse_url_tuple('http://www.edu360.cn/bigdata/baoming?userid=8888','HOST','PATH','QUERY','QUERY:userid')
--->     www.edu360.cn      /bigdata/baoming     userid=8888   8888

6、函数：explode 和 lateral view

可以将一个数组变成列
加入有一个表，其中的字段为array类型
表数据：
1,zhangsan,数学:语文:英语:生物
2,lisi,数学:语文
3,wangwu,化学:计算机:java编程

建表：

create table t_xuanxiu(uid string,name string,kc array<string>)
row format delimited
fields terminated by ','
collection items terminated by ':';

** explode效果示例：

select explode(kc) from t_xuanxiu where uid=1;

数学
语文
英语
生物

** lateral view 表生成函数

hive> select uid,name,tmp.* from t_xuanxiu 
    > lateral view explode(kc) tmp as course;

1       zhangsan        数学
1       zhangsan        语文
1       zhangsan        英语
1       zhangsan        生物
2       lisi    数学
2       lisi    语文
3       wangwu  化学
3       wangwu  计算机
3       wangwu  java编程

利用explode和lateral view 实现hive版的wordcount 有以下数据：
a b c d e f g
a b c
e f g a
b c d b

对数据建表：

create table t_juzi(line string) row format delimited;

导入数据：

load data local inpath '/root/words.txt' into table t_juzi;

select a.word,count(1) cnt
from 
(select tmp.* from t_juzi lateral view explode(split(line,' ')) tmp as word) a
group by a.word
order by cnt desc;

7、row_number() over() 函数

常用于求分组TOPN

有如下数据：
zhangsan,kc1,90
zhangsan,kc2,95
zhangsan,kc3,68
lisi,kc1,88
lisi,kc2,95
lisi,kc3,98

建表：

create table t_rowtest(name string,kcId string,score int)
row format delimited
fields terminated by ',';

导入数据：

利用row_number() over() 函数看下效果：

select *,row_number() over(partition by name order by score desc) as rank from t_rowtest;

从而，求分组topn就变得很简单了：

select name,kcid,score
from
(select *,row_number() over(partition by name order by score desc) as rank from t_rowtest) tmp
where rank<3;

create table t_rate_topn_uid
as
select uid,movie,rate,ts
from
(select *,row_number() over(partition by uid order by rate desc) as rank from t_rate) tmp
where rank<11;

九、自定义函数

略

十、hive中的复合数据类型

1、array

有如下数据：

战狼2,吴京:吴刚:龙母,2017-08-16
三生三世十里桃花,刘亦菲:痒痒,2017-08-20
普罗米修斯,苍老师:小泽老师:波多老师,2017-09-17
美女与野兽,吴刚:加藤鹰,2017-09-17

– 建表映射：

create table t_movie(movie_name string,actors array<string>,first_show date)
row format delimited fields terminated by ','
collection items terminated by ':';

– 导入数据

load data local inpath '/root/hivetest/actor.dat' into table t_movie;
load data local inpath '/root/hivetest/actor.dat.2' into table t_movie;

– 查询

select movie_name,actors[0],first_show from t_movie;

select movie_name,actors,first_show
from t_movie where array_contains(actors,'吴刚');

select movie_name
,size(actors) as actor_number
,first_show
from t_movie;

2、map

有如下数据：

1,zhangsan,father:xiaoming#mother:xiaohuang#brother:xiaoxu,28
2,lisi,father:mayun#mother:huangyi#brother:guanyu,22
3,wangwu,father:wangjianlin#mother:ruhua#sister:jingtian,29
4,mayun,father:mayongzhen#mother:angelababy,26

– 建表映射上述数据

create table t_family(id int,name string,family_members map<string,string>,age int)
row format delimited fields terminated by ','
collection items terminated by '#'
map keys terminated by ':';

– 导入数据

load data local inpath '/root/hivetest/fm.dat' into table t_family;

– 查出每个人的爸爸、姐妹

select id,name,family_members["father"] as father,family_members["sister"] as sister,age
from t_family;

– 查出每个人有哪些亲属关系

select id,name,map_keys(family_members) as relations,age
from  t_family;

– 查出每个人的亲人名字

select id,name,map_values(family_members) as relations,age
from  t_family;

– 查出每个人的亲人数量

select id,name,size(family_members) as relations,age
from  t_family;

– 查出所有拥有兄弟的人及他的兄弟是谁
– 方案1：一句话写完

select id,name,age,family_members['brother']
from t_family  where array_contains(map_keys(family_members),'brother');

– 方案2：子查询

select id,name,age,family_members['brother']
from
(select id,name,age,map_keys(family_members) as relations,family_members 
from t_family) tmp 
where array_contains(relations,'brother');

3、struct

假如有以下数据：

1,zhangsan,18:male:深圳
2,lisi,28:female:北京
3,wangwu,38:male:广州
4,赵六,26:female:上海
5,钱琪,35:male:杭州
6,王八,48:female:南京

– 建表映射上述数据

drop table if exists t_user;
create table t_user(id int,name string,info struct<age:int,sex:string,addr:string>)
row format delimited fields terminated by ','
collection items terminated by ':';

– 导入数据

load data local inpath '/root/hivetest/user.dat' into table t_user;

– 查询每个人的id name和地址

select id,name,info.addr
from t_user;

十、WEB管理

http://192.168.80.2:50070/explorer.html#/user/hive/warehouse

十一 HIVE的存储文件格式

HIVE支持很多种文件格式： SEQUENCE FILE | TEXT FILE | PARQUET FILE | RC FILE

试验：先创建一张表t_seq，指定文件格式为sequencefile

create table t_seq(id int,name string,add string)
stored as sequencefile;

然后，往表t_seq中插入数据，hive就会生成sequence文件插入表目录中

insert into table t_seq
select * from t_1 where add='handong';

十二、一个日活、日增的分析案例

1 、需求分析

我们有一个 web 系统。
每天都产生数据。
求，日新：每天新来的用户。
求，日活：每天的活跃用户。

2 ，数据

log2017-09-15

192.168.33.6,hunter,2017-09-15 10:30:20,/a
192.168.33.7,hunter,2017-09-15 10:30:26,/b
192.168.33.6,jack,2017-09-15 10:30:27,/a
192.168.33.8,tom,2017-09-15 10:30:28,/b
192.168.33.9,rose,2017-09-15 10:30:30,/b
192.168.33.10,julia,2017-09-15 10:30:40,/c

log2017-09-16

192.168.33.16,hunter,2017-09-16 10:30:20,/a
192.168.33.18,jerry,2017-09-16 10:30:30,/b
192.168.33.26,jack,2017-09-16 10:30:40,/a
192.168.33.18,polo,2017-09-16 10:30:50,/b
192.168.33.39,nissan,2017-09-16 10:30:53,/b
192.168.33.39,nissan,2017-09-16 10:30:55,/a
192.168.33.39,nissan,2017-09-16 10:30:58,/c
192.168.33.20,ford,2017-09-16 10:30:54,/c

log2017-09-17

192.168.33.46,hunter,2017-09-17 10:30:21,/a
192.168.43.18,jerry,2017-09-17 10:30:22,/b
192.168.43.26,tom,2017-09-17 10:30:23,/a
192.168.53.18,bmw,2017-09-17 10:30:24,/b
192.168.63.39,benz,2017-09-17 10:30:25,/b
192.168.33.25,baval,2017-09-17 10:30:30,/c
192.168.33.10,julia,2017-09-17 10:30:40,/c

3 ，建表，分区表

create table web_log(ip string,uid string,access_time string,url string) 
partitioned by (dt string)
row format delimited fields terminated by ',';

4 ，导入数据

load data local inpath '/root/hivetest/log2017-09-15' into table web_log partition(dt='2017-09-15');
load data local inpath '/root/hivetest/log2017-09-16' into table web_log partition(dt='2017-09-16');
load data local inpath '/root/hivetest/log2017-09-17' into table web_log partition(dt='2017-09-17');

5 ，查看数据，查看分区

select * from web_log;
show partitions web_log;

6 、日活数据：建表

ip ：用户的 ip 地址，如果他用过很多 ip 来访问我们，我们就取出他的最早访问的那一条
uid ：用户 id
first_access ：如果用户来过很多次，我们记录第一次
url ：他访问了我们的哪个页面

sql ：

create table t_user_access_day(ip string,uid string,first_access string,url string) partitioned by(dt string);

7 、日活数据，查询：每个用户访问最早的一条 sql 的进化

select ip,uid,access_time,url from web_log;

select ip,uid,access_time,url from web_log where dt='2017-09-15';

select ip,uid,access_time,url, 
row_number() over(partition by uid order by access_time) as rn
from web_log 
where dt='2017-09-15';

select ip,uid,access_time,url 
from
(select ip,uid,access_time,url, 
row_number() over(partition by uid order by access_time) as rn
from web_log 
where dt='2017-09-15') tmp
where rn=1;

结果：

+----------------+---------+----------------------+------+--+
|       ip       |   uid   |     access_time      | url  |
+----------------+---------+----------------------+------+--+
| 192.168.33.6   | hunter  | 2017-09-15 10:30:20  | /a   |
| 192.168.33.6   | jack    | 2017-09-15 10:30:27  | /a   |
| 192.168.33.10  | julia   | 2017-09-15 10:30:40  | /c   |
| 192.168.33.9   | rose    | 2017-09-15 10:30:30  | /b   |
| 192.168.33.8   | tom     | 2017-09-15 10:30:28  | /b   |
+----------------+---------+----------------------+------+--+

8 ，将查询到的数据，存储到日活表

insert into table t_user_access_day partition(dt='2017-09-15')
select ip,uid,access_time,url 
from
(select ip,uid,access_time,url, 
row_number() over(partition by uid order by access_time) as rn
from web_log 
where dt='2017-09-15') tmp
where rn=1;

9 ，活跃用户总结

15 号活跃用户：

insert into table t_user_access_day partition(dt='2017-09-15')
select ip,uid,access_time,url 
from
(select ip,uid,access_time,url, 
row_number() over(partition by uid order by access_time) as rn
from web_log 
where dt='2017-09-15') tmp
where rn=1;

16 号活跃用户：

insert into table t_user_access_day partition(dt='2017-09-16')
select ip,uid,access_time,url 
from
(select ip,uid,access_time,url, 
row_number() over(partition by uid order by access_time) as rn
from web_log 
where dt='2017-09-16') tmp
where rn=1;

17 号活跃用户：

insert into table t_user_access_day partition(dt='2017-09-17')
select ip,uid,access_time,url 
from
(select ip,uid,access_time,url, 
row_number() over(partition by uid order by access_time) as rn
from web_log 
where dt='2017-09-17') tmp
where rn=1;

10 ，日新：思路

建历史表。
用今天的日活用户关联历史表。
日活有数据，历史表没有数据，就是当天的新用户，将数据插入到当天新增用户表。
查询过后，将当天的新用户，加入到历史表中。

11 ，日新：找到历史表中没有，日活有的用户 ( 日新 )

建表：历史用户表

 create table t_user_history(uid string);

建表：新用户表

create table t_user_new_day like t_user_access_day;

看一下，3 张表：
t_user_access_day 日活用户表
t_user_history 历史用户表
t_user_new_day 日新用户表
找出新用户：历史表没有，日活表有的数据

select a.*
from t_user_access_day a left join t_user_history b on a.uid=b.uid 
where a.dt='2017-09-15' and b.uid is null;

将这些数据，存储进日新表：

insert into table t_user_new_day partition(dt='2017-09-15') 
select a.ip,a.uid,a.first_access,a.url 
from t_user_access_day a left join t_user_history b on a.uid=b.uid 
where a.dt='2017-09-15' and b.uid is null;

将这些新用户插入历史表：

insert into t_user_history
select uid from t_user_new_day where dt='2017-09-15';

12 ，编写脚本

 vim rixin.sh

#!/bin/bash
day_str=`date -d '-1 day' +'%Y-%m-%d'`
echo "准备处理 $day_str 的数据......"

HQL_user_active_day="
insert into table sfl.t_user_active_day partition(day=\"$day_str\")
select ip,uid,access_time,url
from 
(select ip,uid,access_time,url,
row_number() over(partition by uid order by access_time) as rn
where day=\"$day_str\") tmp
where rn=1
"
echo "executing sql :"
echo $HQL_user_active_day
hive -e "$HQL_user_active_day"

十三、hive 系统参数

本地模式

set hive.exec.mode.local.auto=true

动态分区

set hive.exec.dynamic.partition.mode=nonstrict;

#指定开启分桶

set hive.enforce.bucketing = true;
set mapreduce.job.reduces=4;

你可能感兴趣的:(大数据-玩转数据-HIVE,hive,大数据,数据仓库,etl,数据库开发)

pytorch基础-layernormal 与 batchnormal yuweififi pytorch 人工智能 python
nn.LayerNorm（层归一化）和nn.BatchNorm（批量归一化）是深度学习中常用的两种归一化方法，都有助于提高模型的训练效率和稳定性，但它们在归一化维度、应用场景、计算方式等方面存在明显区别，以下为你详细介绍：1、归一化维度nn.LayerNorm：对单个样本的特征维度进行归一化。无论输入数据的形状如何，它会计算每个样本在特征维度上的均值和方差，然后进行归一化。例如，对于一个形状为(b
通俗理解闭包 yuren_xia 前端技术 javascript
JavaScript在ES6之前并没有类的概念，但通过原型链和闭包，开发者可以实现类似继承和封装的功能（原型链实现继承，闭包实现封装）。ES6引入了类语法，但闭包仍然是实现私有数据封装的重要手段之一。另外，使用闭包还可用于保存上下文信息等场景。一、定义从函数角度闭包是指有权访问另一个函数作用域中的变量的函数。即使外部函数已经返回，闭包仍然可以访问外部函数内部的变量。例如：functionouter
【Multipath网络层协议】MPTCP工作原理码上为赢 Multipath精通之路 multipath MPTCP
常见网络层多路径协议介绍MPTCP（MultipathTCP）MPTCP是在传统TCP基础上进行扩展的协议，它允许在源端和目的端之间建立多个TCP子流，这些子流可以通过不同的网络路径传输数据。例如，一台笔记本电脑同时连接了Wi-Fi网络和以太网网络，当使用MPTCP进行数据传输时，它可以将数据分别通过Wi-Fi和以太网这两条不同的路径发送到目标服务器，从而充分利用两条链路的带宽。LISP（Loca
我在广州学 Mysql 系列——存储过程与存储函数详解练小杰数据库相关 mysql android 数据库学习 adb sql
ℹ️大家好，我是练小杰，今天周五了，一周就这样从手上溜走了，还有两星期过年！！本文将学习MYSQL中存储过程与存储函数的概念~~回顾：【索引详解】【索引相关练习】数据库专栏【数据库专栏】~想要了解更多内容，主页【练小杰的CSDN】文章目录存储过程与存储函数存储过程（StoredProcedure）存储函数（StoredFunction）⚠️主要区别选择存储过程还是存储函数创建存储过程命令解释创建存
我在广州学 Mysql 系列——数据表查询命令详解练小杰数据库相关 mysql 数据库学习经验分享 adb 后端
ℹ️大家好，我是LXJ，今天星期二了，本文将讲述MYSQL查询数据的详细命令以及相关例题~~复习：《Mysql函数的练习题》同时，数据库相关内容查看专栏【数据库专栏】~想要了解更多内容请点击我的主页:【练小杰的CSDN】“倒霉，倒霉，倒霉！”——龙叔文章目录前言基本查询语句单个表格查询查询所有字段查询指定字段查询指定记录带IN关键字的查询带BETWEENAND的范围查询带LIKE的字符匹配查询查询
通过TensorFlow实现简单深度学习模型（2） yyc_audio 人工智能深度学习 python 机器学习
前文我们已经实现了对每批数据的训练，下面继续实现一轮完整的训练。完整的训练循环一轮训练就是对训练数据的每个批量都重复上述训练步骤，而完整的训练循环就是重复多轮训练。deffit(model,images,labels,epochs,batch_size=128):forepoch_counterinrange(epochs):print(f"Epoch{epoch_counter}")batch_
c语言概率产生字母,智邮普创c语言面试题 ---- 字母概率(示例代码) 飞跃思考 c语言概率产生字母
题目描述小明最近对概率问题很感兴趣。一天，小明和小红一起玩一个概率游戏，首先小明给出一个字母和一个单词，然后由小红计算这个字母在这个单词中出现的概率。字母不区分大小写。例如，给定的字母是a，单词是apple，那么概率是0.20000。输入输入包含多组测试数据。每组数据包含一个字母和一个单词。单词的长度不超过200。输出对于每一个输入，输出对应的概率，结果保留5位小数。样例输入aapplecCand
c语言字母概率,C/C++知识点之智邮普创c语言面试题 ---- 字母概率 OK up c语言字母概率
本文主要向大家介绍了C/C++知识点之智邮普创c语言面试题----字母概率，通过具体的内容向大家展示，希望对大家学习C/C++知识点有所帮助。题目描述小明最近对概率问题很感兴趣。一天，小明和小红一起玩一个概率游戏，首先小明给出一个字母和一个单词，然后由小红计算这个字母在这个单词中出现的概率。字母不区分大小写。例如，给定的字母是a，单词是apple，那么概率是0.20000。输入输入包含多组测试数据
-字母概率- -JMY- C++题库 c++
题目描述小明最近对概率问题很感兴趣。一天，小明和小红一起玩一个概率游戏，首先小明给出一个字母和一个单词，然后由小红计算这个字母在这个单词中出现的概率。字母不区分大小写。例如，给定的字母是a，单词是apple，那么概率是0.20。输入输入包含多组测试数据。每组数据包含一个字母和一个单词。单词的长度不超过200。输出对于每一个输入，输出对应的概率，结果保留2位小数。样例输入aapple样例输出0.20
Unity（游戏）中五种数据存储的方法别皱眉inging unity3d 游戏存储存储方式
Unity（游戏）中五种数据存储的方法一、PlayerPrefsunity3d提供了一个用于本地持久化保存与读取的类-------PlayerPrefs.工作原理很简单，以键值对的形式将数据保存在文件中，然后程序可以根据这个名称取出上次保存的数值（注：PlayerPrefs运用起来很方便，随时都可以存取与读取）。Playerprefs类支持3中数据类型的保存和读取，分别是浮点型、整型和字符串型：P
Apache Lucene 详解及示例微笑听雨。 java 进阶教程 apache lucene java 全文检索
ApacheLucene详解及示例1.简介ApacheLucene是一个开源的高性能全文搜索引擎库，广泛应用于构建各种搜索系统和信息检索应用。Lucene提供了丰富的API来进行索引和搜索，支持高效的文本处理和查询。本文将深入解析Lucene的核心概念和主要功能，并通过示例代码演示其使用方法。2.核心概念2.1倒排索引倒排索引（InvertedIndex）是Lucene的核心数据结构。它将文档中的
【linux自动化实践】linux shell 脚本替换某文本忙碌的菠萝 linux自动化实践 linux 自动化运维
在Linuxshell脚本中，可以使用sed命令来替换文本。以下是一个基本的例子，它将在文件example.txt中查找文本old_text并将其替换为new_textsed-i's/old_text/new_text/g'example.txt解释：sed:是streameditor的缩写，用于处理文本数据。-i:表示直接修改文件内容。s:表示替换操作。old_text:要被替换的文本。new_
Python连接SQL SEVER数据库全流程 m0_74824865 面试学习路线阿里巴巴数据库 python sql
背景介绍在数据分析领域，经常需要从数据库中获取数据进行分析和处理。而SQLServer是一种常用的关系型数据库管理系统，因此学习如何使用Python连接SQLServer数据库并获取数据是非常有用的。以下是Python使用pymssql连接SQLServer数据库的全流程：安装pymssql库本地账号设置脚本连接数据导入函数实现一、安装pymssqlpymssql是Python连接SQLServe
SpringBoot + vue 管理系统 m0_74825565 面试学习路线阿里巴巴 spring boot vue.js 后端
SpringBoot+vue管理系统文章目录SpringBoot+vue管理系统1、成品效果展示2、项目准备3、项目开发3.1、部门管理3.1.1、前端核心代码3.1.2、后端代码实现3.2、员工管理3.2.1、前端核心代码3.2.2、后端代码实现3.3、班级管理3.3.1、前端核心代码3.3.2、后端代码实现3.4、学生管理3.4.1、前端核心代码3.4.2、后端代码实现3.5、数据统计3.5.
Spring 核心技术解析【纯干货版】- XII：Spring 数据访问模块 Spring-R2dbc 模块精讲 m0_74825003 面试学习路线阿里巴巴 spring java 后端
在现代应用架构中，高并发、低延迟的需求推动了响应式编程的发展，而传统的JDBC由于其同步阻塞机制，在高吞吐场景下可能成为瓶颈。R2DBC（ReactiveRelationalDatabaseConnectivity）作为响应式关系型数据库访问标准，正是为了解决这一问题而诞生的。SpringR2DBC作为Spring生态对R2DBC的封装，提供了非阻塞、异步的数据库访问能力，并与SpringWebF
解释SQL和NoSQL数据库的区别，各自的适用场景是什么？破碎的天堂鸟学习教程 nosql 数据库
SQL与NoSQL数据库的深度对比及适用场景分析一、核心定义与数据模型差异1：SQL数据库结构化数据模型：基于关系型模型，数据以表格（行和列）形式存储，表之间通过外键建立关联。例如，客户表与订单表通过客户ID关联，形成严格的逻辑结构。预定义模式（Schema）：需提前定义表结构（字段类型、主键、外键等），修改结构需通过ALTER等命令，灵活性较低。标准化查询语言：使用SQL（StructuredQ
深入剖析 Weblogic、ThinkPHP、Jboss、Struct2 历史漏洞阿贾克斯的黎明网络安全 web安全
目录深入剖析Weblogic、ThinkPHP、Jboss、Struct2历史漏洞一、Weblogic漏洞（一）漏洞原理（二）漏洞利用代码（Python示例）（三）防范措施二、ThinkPHP漏洞（一）漏洞原理（二）漏洞利用代码（示例，假设存在漏洞的代码片段）（三）防范措施三、Jboss漏洞（一）漏洞原理（二）漏洞利用代码（Java示例，用于构造恶意序列化数据）（三）防范措施四、Struct2漏洞
冒泡排序原理及C++的实现方法小鹏编程 c++排序算法算法
冒泡排序是一种简单的排序算法，通过重复遍历列表并交换相邻元素来排序。一、算法原理核心思想：每次遍历将当前未排序部分的最大元素"冒泡"到正确位置。操作方式：比较相邻元素顺序错误则交换位置每轮遍历减少一次比较次数二、模拟示例以下用4个数据的数组[4,3,2,1]详细演示冒泡排序过程：初始数组[4,3,2,1]第一轮遍历（确定最大值）目标：将最大的数移动到最右侧比较与交换：比较4和3→交换→[3,4,2
【数组】- 如何在C++的数组中插入元素？小鹏编程 C++c++数组
数组逆序数组是C++语言重要的数据结构，对它的一些基本操作要熟练掌握。今天，我们就来讨论，如何在数组中插入元素？案例题目描述在一个数组的第x个位置插入一个新的数y。输入有四行第一行有一个整数n(5usingnamespacestd;intmain(){inta[11],i,n,x,y;cin>>n;for(i=0;i>a[i];}cin>>x;//插入的位置cin>>y;//插入的元素x--;//
【数组】- 如何用C++数组统计相同数字出现的次数？小鹏编程 C++c++算法
统计数字出现次数数组是C++语言重要的数据结构，对它的一些基本操作要熟练掌握。那么，今天我们就来讨论，怎么使用数组统计一组数中每个数字出现的次数？案例题目描述有50个数（0-19），求这50个数中相同数字出现的最多次数为几次？输入50个数字。样例输入110201581270315015181671716911916121712431111421114611464111318703231819216
文心一言产品拆解调研报告 Charlues.k AI产品经理文心一言 ai
目录一、产品概述二、目标用户与市场定位三、核心功能分析1.功能列表2.功能使用流程3.交互体验四、用户体验评估1.用户视角1.1学习曲线1.2操作流畅度1.3用户心理预期满足程度2.情感设计2.1细节设计与用户情感体验2.2界面与交互符合用户预期3.使用场景3.1高频场景下的操作体验3.2低频或紧急场景下的操作便利性总结五、数据和技术分析1.技术架构1.1技术架构概述1.2核心功能支持与稳定性1.
Spark技术系列（一）：初识Apache Spark——大数据处理的统一分析引擎数据大包哥 #Spark 大数据
Spark技术系列（一）：初识ApacheSpark——大数据处理的统一分析引擎1.背景与核心价值1.1大数据时代的技术演进MapReduce的局限性：磁盘迭代计算、中间结果落盘导致的性能瓶颈Spark诞生背景：UCBerkeleyAMPLab实验室为解决复杂迭代计算需求研发（2010年开源）技术定位：基于内存的通用分布式计算框架（支持批处理、流计算、机器学习、图计算等）1.2Spark内置模块S
主成分回归（PCR）与特征值因子筛选：从理论到MATLAB实战青橘MATLAB学习多元分析回归 matlab 线性代数数学建模算法
内容摘要：本文深入解析主成分回归（PCR）的原理与MATLAB实现，结合Hald水泥数据案例对比PCR与普通回归的性能差异。详细讲解特征值筛选策略（累积贡献率、交叉验证），并提供单参数估计优化方法。通过完整代码与可视化结果，助力读者掌握高维数据建模与多重共线性处理技巧。关键词：主成分回归特征值筛选多重共线性MATLAB实现交叉验证—1.主成分回归（PCR）概述主成分回归（PrincipalComp
类加载器详解1 2401_85327573 java 开发语言
回顾一下类加载过程开始介绍类加载器和双亲委派模型之前，简单回顾一下类加载过程。类加载过程：加载->连接->初始化。连接过程又可分为三步：验证->准备->解析。类加载过程加载是类加载过程的第一步，主要完成下面3件事情：通过全类名获取定义此类的二进制字节流将字节流所代表的静态存储结构转换为方法区的运行时数据结构在内存中生成一个代表该类的Class对象，作为方法区这些数据的访问入口类加载器类加载器介绍类
十大经典排序算法上 2401_85327573 排序算法算法数据结构
0、算法概述0.1算法分类十种常见排序算法可以分为两大类：1、冒泡排序（BubbleSort）冒泡排序是一种简单的排序算法。它重复地走访过要排序的数列，一次比较两个元素，如果它们的顺序错误就把它们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端。1.1算法描述内执行时所需存储空间的度量，它也是数据
C++ 游戏开发入门安年CJ C++游戏 c++开发语言 c#游戏
一、为什么选择C++进行游戏开发C++在游戏开发领域具有独特的地位。它兼具高效性与对底层硬件的良好控制能力，这使得它非常适合开发对性能要求极高的游戏核心引擎部分。许多知名的大型游戏，如《使命召唤》系列、《虚幻竞技场》等，其底层架构都是基于C++构建的。C++能够直接操作内存，在处理复杂的游戏逻辑、大规模数据运算（如物理模拟、图形渲染中的大量计算）以及优化游戏性能方面有着卓越的表现。同时，丰富的类库
reallocate() 和 allocate() 的区别 zjkzjk7711 c++
reallocate()和allocate()的区别在C++的std::vector及其底层内存管理中，allocate()和reallocate()是两个核心的内存管理函数。它们的作用不同：函数作用影响size()吗？影响capacity()吗？allocate(n)分配n个元素的内存（不初始化）❌否✅是reallocate(n)重新分配内存，拷贝旧数据，释放旧内存❌否✅是（通常2倍扩容）1.a
Exception:data did not match any variant of untagged enum PyPreTokenizerTypeWrapper at line 69 解决方案爱编程的喵喵 Python基础课程 python tokenizer PyPreTokenizer 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Exception:datadidn
记录更换电脑硬盘并克隆数据鱼干～电脑
1.傲梅安装在c盘2.删除旧机械硬盘里无用的软件以及数据3.删除新固态硬盘里的无用数据，并备份数据到其他电脑硬盘或存储设备4.打开傲梅==》克隆硬盘==>选择源旧机械硬盘》目标新固态硬盘》弹窗提示点击是==》设置里选中“让分区适应整个硬盘大小”》点击保存》提交里点击执行即可5.执行完毕后关机，拆掉旧机械硬盘，换上新固态硬盘6.开机后，在计算机管理–》存储==》磁盘管理==》更改新固态硬盘的驱动器号
电竞赛事数据分析：LNG vs BLG的胜利背后烧瓶里的西瓜皮 python 自动驾驶人工智能数据可视化机器学习
电竞赛事数据分析：LNGvsBLG的胜利背后摘要在S14瑞士轮次日，LNG以1:0战胜BLG，取得了开赛二连胜。本文将通过Python进行数据处理与分析，结合机器学习算法预测比赛结果，并使用数据可视化工具展示关键指标。通过对这场比赛的数据深入挖掘，揭示LNG获胜的关键因素。引言电子竞技（Esports）已经成为全球范围内的一项重要娱乐活动，而《英雄联盟》（LeagueofLegends,LoL）作
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http

大数据-玩转数据-Hive应用小结

说明

一、 HIVE是什么

二、登录交互模式

1、单机交互式

2、hive服务交互

3、将hive作为命令shell运行

4、shell脚本中调用

三、HIVE的DDL语法

1、建库

2、建内部表

2.1创建表

2.2 添加列

2.3 全部替换

2.4 修改已存在的列定义

3、建外部表

4、内部表和外部表区别

5、分区表

6、修改表的分区

6.1 添加分区

6.2 删除分区

四、数据的导入

1、本地导入数据hive表

2 、将hdfs中的文件导入hive表

3、 从别的表查询数据后插入到一张新建表中

4、 从别的表查询数据后插入到一张已存在的表中

5、导入数据到不同的分区目录

五、数据的导出

1、将数据从hive的表中导出到hdfs的目录中

2 、将数据从hive的表中导出到本地磁盘目录中

六 、显示命令

七、hive 中 DML 语句

八、HIVE的内置函数

1、时间处理函数

2、类型转换函数

3、字符串截取和拼接

4、Json数据解析函数

5、url解析函数

6、函数：explode 和 lateral view

7、row_number() over() 函数

九、 自定义函数

十、hive中的复合数据类型

1、array

2、map

3、struct

十、WEB管理

十一 HIVE的存储文件格式

十二、一个日活、日增的分析案例

1 、需求分析

2 ，数据

3 ，建表 ，分区表

4 ，导入数据

5 ，查看数据，查看分区

6 、日活数据 ： 建表

7 、日活数据，查询 ： 每个用户访问最早的一条 sql 的进化

8 ，将查询到的数据，存储到日活表

9 ，活跃用户总结

10 ，日新 ：思路

11 ，日新 ： 找到历史表中没有，日活有的用户 ( 日新 )

12 ，编写脚本

十三、hive 系统参数

你可能感兴趣的:(大数据-玩转数据-HIVE,hive,大数据,数据仓库,etl,数据库开发)

3、从别的表查询数据后插入到一张新建表中

4、从别的表查询数据后插入到一张已存在的表中

六、显示命令

九、自定义函数

3 ，建表，分区表

6 、日活数据：建表

7 、日活数据，查询：每个用户访问最早的一条 sql 的进化

10 ，日新：思路

11 ，日新：找到历史表中没有，日活有的用户 ( 日新 )