笑一笑、

大数据技术-Hive学习笔记

Hive-安装部署
Hive-配置元数据库MetaStore
- 配置MetaStore到MySQL
- 使用元数据服务的方式访问Hive
- 使用JDBC方式访问Hive
- 后台启动
Hive-常用SHELL命令
- Hive常用交互命令
- Hive常用命令
Hive常见属性配置
- Hive运行日志信息配置
- 打印当前库和表头
- Hive参数配置方式
Hive-数据类型
- 基本数据类型
- 集合数据类型
- 集合数据操作
Hive-DDL数据定义
- 数据库操作
- 内部表
- 外部表
- 管理表与外部表的互相转换
- 数据表操作
Hive-DML数据操作
- load-向表中装载数据
- insert-通过查询语句向表中插入数据
- as select-查询语句中创建表并加载数据
- import-导入数据到hive表
- insert-导出数据
- truncate-清除表中数据
Hive-查询操作
Hive-分区表
- 二级分区
- 数据直接上传到分区目录三种方式
- 动态分区
Hive-分桶表
Hive-函数

Hive官网地址： http://hive.apache.org/

文档查看地址https://cwiki.apache.org/confluence/display/Hive/GettingStarted

下载地址https://github.com/apache/hive

Hive-安装部署

解压hive到指安装目录下

tar -zxvf apache-hive-3.1.2-bin.tar.gz -C /opt/module/

配置hive环境变量

# HIVE_HOME
export HIVE_HOME=/opt/module/hive
export PATH=$PATH:$HIVE_HOME/bin

解决日志jar包冲突（一般不用）

mv $HIVE_HOME/lib/log4j-slf4j-impl-2.10.0.jar $HIVE_HOME/lib/log4j-slf4j-impl-2.10.0.bak

初始化元数据库

bin/schematool -dbType derby -initSchema

报错解决如下

原因：hadoop和hive的两个guava.jar版本不一致，删除低版本的那个，将高版本的复制到低版本目录下
hive所在位置：/opt/module/hive/lib/
hadoop所在位置：/opt/module/hadoop-3.1.3/share/hadoop/common/lib
再次执行初始化命令bin/schematool -dbType derby -initSchema

Hive启动

在hive目录下执行

bin/hive

Hive默认使用的元数据库为derby，开启Hive之后就会占用元数据库，且不与其他客户端共享数据，所以需要将Hive的元数据地址改为MySQL

报错解决如下

需要先启动hadoop

Hive-配置元数据库MetaStore

Hive默认使用的元数据库为derby，开启Hive之后就会占用元数据库，且不与其他客户端共享数据，所以需要将Hive的元数据地址配置到外部系统

配置MetaStore到MySQL

hive/conf创建配置文件hive-site.xml



<configuration>
     
    <property>
        <name>javax.jdo.option.ConnectionURLname>
        <value>jdbc:mysql://hadoop102:3306/metastore?useSSL=falsevalue>
    property>
     
    <property>
        <name>javax.jdo.option.ConnectionDriverNamename>
        <value>com.mysql.jdbc.Drivervalue>
    property>
    
 	<property>
        <name>javax.jdo.option.ConnectionUserNamename>
        <value>rootvalue>
    property>
     
    <property>
        <name>javax.jdo.option.ConnectionPasswordname>
        <value>rootvalue>
    property>
     
    <property>
        <name>hive.metastore.schema.verificationname>
        <value>falsevalue>
    property>
     
    <property>
        <name>hive.metastore.event.db.notification.api.authname>
        <value>falsevalue>
    property>
     
    <property>
        <name>hive.metastore.warehouse.dirname>
        <value>/user/hive/warehousevalue>
    property>
configuration>

登录MySQL创建Hive元数据库

mysql -uroot -proot;
mysql> create database metastore;
mysql> quit;

初始化Hive元数据库

schematool -initSchema -dbType mysql -verbose

启动Hive

bin/hive

使用元数据服务的方式访问Hive

在hive-site.xml文件中添加如下配置信息


<property>
    <name>hive.metastore.urisname>
    <value>thrift://hadoop102:9083value>
property>

启动metastore，启动后窗口不能再操作，需打开一个新的shell窗口做别的操作

bin/hive --service metastore

启动hive

bin/hive

说明：当配置了这种方式之后，就必须先启动元数据服务再启动hive了，即使本机启动hive也要开服务，否则会报错

metastore元数据服务是提供给第三方服务查询hive的数据信息的，如果不需要只是在本地做hive的验证测试，为了方便，可以注掉该配置

使用JDBC方式访问Hive

前置要求：metastore元数据服务要先启动，因为hiveserver2使用jdbc方式去连接metastore元数据服务

在 hive-site.xml 文件中添加如下配置信息


<property>
 	<name>hive.server2.thrift.bind.hostname>
    <value>hadoop102value>
property>

<property>
    <name>hive.server2.thrift.portname>
    <value>10000value>
property>

查看端口是否被占用

netstat -anp|grep 10000

启动hiveserver2

bin/hive --service hiveserver2

等待hiveserver2启动完成

通过netstat -anp|grep 10000查看hiveserver2是否启动，在启动的时候保证端口没被占用，启动之后10000端口会有显示，在启动查端口前，没有查到占用就说明hiveserver2没有启动，hiveserver2会显示七八个Hive Session ID之后，才会真正启动，这要等个几分钟

或者查看hive的运行日志，在/tmp/用户名/hive.log

启动beeline客户端

bin/beeline -u jdbc:hive2://hadoop102:10000 -n root

看到如下界面表示成功

Connecting to jdbc:hive2://hadoop102:10000
Connected to: Apache Hive (version 3.1.2)
Driver: Hive JDBC (version 3.1.2)
Transaction isolation: TRANSACTION_REPEATABLE_READ
Beeline version 3.1.2 by Apache Hive
0: jdbc:hive2://hadoop102:10000>

启动报错解决如下

解决方式：在hadoop的配置文件core-site.xml增加如下配置，重启hdfs，其中“xxx”是连接beeline的用户，将“xxx”替换成自己的用户名即可。一定要重启hadoop，否则不会生效的还是报错！

*表示可通过超级代理xxx操作hadoop的用户、用户组和主机

<property>
    <name>hadoop.proxyuser.xxx.hostsname>
    <value>*value>
property>
<property>
    <name>hadoop.proxyuser.xxx.groupsname>
    <value>*value>
property>

后台启动

前台启动的方式导致需要打开多个shell窗口，可以使用如下方式后台方式启动

nohup: 放在命令开头，表示不挂起,也就是关闭终端进程也继续保持运行状态
/dev/null：是Linux文件系统中的一个文件，被称为黑洞，所有写入改文件的内容都会被自动丢弃
2>&1 : 表示将错误重定向到标准输出上
&: 放在命令结尾,表示后台运行
一般会组合使用nohup [xxx 命令操作]> file 2>&1 &，表示将xxx命令运行的结果输出到file中，并保持命令启动的进程在后台运行

nohup hive --service metastore 2>&1 &

nohup hive --service hiveserver2 2>&1 &

编写脚本启动hive

 vim $HIVE_HOME/bin/hiveservices.sh

#!/bin/bash
HIVE_LOG_DIR=$HIVE_HOME/logs
if [ ! -d $HIVE_LOG_DIR ]
then
mkdir -p $HIVE_LOG_DIR
fi
#检查进程是否运行正常，参数 1 为进程名，参数 2 为进程端口
function check_process()
{
pid=$(ps -ef 2>/dev/null | grep -v grep | grep -i $1 | awk '{print $2}')
ppid=$(netstat -nltp 2>/dev/null | grep $2 | awk '{print $7}' | cut -d '/' -f 1)
echo $pid
[[ "$pid" =~ "$ppid" ]] && [ "$ppid" ] && return 0 || return 1
}
function hive_start()
{
metapid=$(check_process HiveMetastore 9083)
cmd="nohup hive --service metastore >$HIVE_LOG_DIR/metastore.log 2>&1 &"
[ -z "$metapid" ] && eval $cmd || echo "Metastroe 服务已启动"
server2pid=$(check_process HiveServer2 10000)
cmd="nohup hiveserver2 >$HIVE_LOG_DIR/hiveServer2.log 2>&1 &"
[ -z "$server2pid" ] && eval $cmd || echo "HiveServer2 服务已启动"
}
function hive_stop()
{
metapid=$(check_process HiveMetastore 9083)
[ "$metapid" ] && kill $metapid || echo "Metastore 服务未启动"
server2pid=$(check_process HiveServer2 10000)
[ "$server2pid" ] && kill $server2pid || echo "HiveServer2 服务未启动"
}
case $1 in
"start")
hive_start
;;
"stop")
hive_stop
;;
"restart")
hive_stop
sleep 2
hive_start
;;
"status")
check_process HiveMetastore 9083 >/dev/null && echo "Metastore 服务运行正常" || echo "Metastore 服务运行异常"
check_process HiveServer2 10000 >/dev/null && echo "HiveServer2 服务运行正常" || echo "HiveServer2 服务运行异常"
;;
*)
echo Invalid Args!
echo 'Usage: '$(basename $0)' start|stop|restart|status'
;;
esac

chmod +x $HIVE_HOME/bin/hiveservices.sh

hiveservices.sh start

Hive-常用SHELL命令

Hive常用交互命令

-e：不进入hive的交互窗口执行sql语句

bin/hive -e "select id from test;"

-f：执行脚本中sql语句

创建sql脚本hive.sql

select * from test;

执行脚本

bin/hive -f data/hive.sql > data/result.txt

Hive常用命令

退出hive窗口

hive> exit;
hive> quit;

在hive客户端命令窗口查看hdfs文件系统

hive> dfs -ls /;

查看在hive中输入的所有历史命令

进入到当前用户的根目录cd ~，查看.hivehistory文件

cat .hivehistory

Hive运行日志信息配置

Hive的log 默认存放在/tmp/当前用户名/hive.log 目录下

Hive常见属性配置

Hive运行日志信息配置

Hive的log默认存放在/tmp/xxx/hive.log 目录下（xxx当前用户名下）

修改hive的log存放日志存放路径

第一步：修改hive/conf/hive-log4j2.properties.template文件名称为hive-log4j2.properties

第二步：在hive-log4j2.properties文件中修改log存放位置

打印当前库和表头

在hive-site.xml中加入如下两个配置

<property>
    <name>hive.cli.print.headername>
    <value>truevalue>
property>
<property>
    <name>hive.cli.print.current.dbname>
    <value>truevalue>
property>

Hive参数配置方式

全部的配置信息在${HIVE_HOME}/conf/hive-default.xml.template

查看当前所有的配置信息

hive> set

配置文件声明方式

默认配置文件：hive-default.xml

用户自定义配置文件：hive-site.xml

用户自定义配置会覆盖默认配置，另外Hive也会读入Hadoop的配置，因为Hive是作为Hadoop的客户端启动的，Hive的配置会覆盖Hadoop的配置。配置文件的设定对本机启动的所有Hive进程都有效

命令行参数方式

启动Hive时，可以在命令行添加-hiveconf param=value来设定参数，仅对本次hive启动有效

bin/hive -hiveconf mapred.reduce.tasks=10;

查看参数设置

hive> set mapred.reduce.tasks;

参数声明方式

可以在HQL中使用SET关键字设定参数

hive> set mapred.reduce.tasks=100;

上述三种设定方式的优先级依次递增。即配置文件<命令行参数<参数声明。注意某些系统级的参数，例如log4j相关的设定，必须用前两种方式设定，因为那些参数的读取在会话建立以前已经完成了

Hive-数据类型

基本数据类型

Hive数据类型	Java数据类型	长度	例子
TINYINT	byte	1byte有符号整数	20
SMALINT	short	2byte有符号整数	20
INT	int	4byte有符号整数	20
BIGINT	long	8byte有符号整数	20
BOOLEAN	boolean	布尔类型，true或者false	TRUE FALSE
FLOAT	float	单精度浮点数	3.14159
DOUBLE	double	双精度浮点数	3.14159
STRING	string	字符系列，可以指定字符集，可以使用单引号或者双引号。	hive
TIMESTAMP		时间类型
BINARY		字节数组

对于Hive的String类型相当于数据库的varchar类型，该类型是一个可变的字符串，不过它不能声明其中最多能存储多少个字符，理论上它可以存储2GB的字符数

集合数据类型

数据类型	描述	语法示例
STRUCT	和c语言中的struct类似，都可以通过“点”符号访问元素内容。例如，如果某个列的数据类型是STRUCT{first STRING, last STRING},那么第1个元素可以通过字段.first来引用	struct()
MAP	MAP是一组键-值对元组集合，使用数组表示法可以访问数据。例如，如果某个列的数据类型是MAP，其中键 ->值对是’first’->’John’和’last’->’Doe’，那么可以通过字段名[‘last’]获取最后一个元素	map()
ARRAY	数组是一组具有相同类型和名称的变量的集合。这些变量称为数组的元素，每个数组元素都有一个编号，编号从零开始。例如，数组值为[‘John’, ‘Doe’]，那么第2个元素可以通过数组名[1]进行引用	Array()

Hive有三种复杂数据类型ARRAY、MAP和STRUCT。ARRAY和MAP与Java中的Array和Map类似，而STRUCT与C语言中的Struct类似，它封装了一个命名字段集合，复杂数据类型允许任意层次的嵌套

集合数据操作

{
 	"name": "czs",
 	"friends": ["qhh" , "xyx"] , //列表 Array, 
 	"children": { //键值 Map,
 	"czs age": 18 ,
 	"qhh age": 19
 	}
 	"address": { //结构 Struct,
 	"street": "tkk",
 	"city": "xujc"
 	}
}

创建数据库

create table stu
(
name string,
friends array<string>,
children map<string,int>,
address struct<street:string,city:string>
)
row format delimited fields terminated by ','
collection items terminated by '_'
map keys terminated by ':'
lines terminated by '\n';

row format delimited fields terminated by ','：列分隔符

collection items terminated by '_' ：MAP STRUCT和ARRAY的分隔符(数据分割符号)

map keys terminated by ':'：MAP中的key与value的分隔符

lines terminated by '\n';：行分隔符

创建数据

数据繁多，可以通过外部文件方式导入数据

czs,qhh_xyx,czs age:18_qhh age:19,tkk_xujc

导入文本数据到测试表

load data local inpath '/hive/datas/test.txt' into table test;

访问数据

select friends[1],children['czs age'],address.city from test where name="czs";

Hive-DDL数据定义

数据库操作

显示数据库

show databases

过滤显示查询的数据库

show databases like 'db_hive*'

显示数据库信息

desc database db_hive

显示数据库详细信息

desc database extended db_hive

切换当前数据库

use db_hive

描述数据库属性信息

alter database db_hive set dbproperties('createauth'='czs')

if exists避免要删除的空数据库不存在错误

drop database if exists db_hive

cascade强制删除数据不为空的数据库

drop database db_hive cascade

if not exists避免要创建的数据库已存在错误

create database db_hive  if not exists db_hive

指定数据库存放位置创建数据库

create database db_hive location '/db_hive.db'

内部表

默认创建的表都是所谓的管理表，有时也被称为内部表。因为这种表Hive会或多或少地控制着数据的生命周期。Hive默认情况下会将这些表的数据存储在由配置项hive.metastore.warehouse.dir所定义的目录的子目录下

创建普通表

create table if not exists student(
id int, name string
)
row format delimited fields terminated by '\t'
stored as textfile
location '/user/hive/warehouse/student';

根据查询结果创建表

create table if not exists student2 as select id, name from student;

根据已存在的表结构创建表

create table if not exists student3 like student;

外部表

因为表是外部表，所以Hive并非认为其完全拥有这份数据。删除该表并不会删除掉这份数据，不过描述表的元数据信息会被删除掉，外部表删除后hdfs中的数据还在，但是metadata中的元数据已被删除

创建外部表

create external table if not exists dept(
deptno int,
dname string,
loc int
)
row format delimited fields terminated by '\t';

管理表与外部表的互相转换

修改内部表为外部表

alter table student set tblproperties('EXTERNAL'='TRUE');

修改外部表为内部表

alter table student set tblproperties('EXTERNAL'='FALSE');

数据表操作

查看表信息

desc formatted score;

查看表字段信息

desc student;

修改表

alter table student rename to stu

删除表

drop table dept;

增加列信息

alter table dept add columns(deptdesc string);

修改列信息

 alter table dept change column deptdesc desc string;

替换列信息

alter table dept replace columns(deptno string, dnamestring, loc string);

Hive-DML数据操作

load-向表中装载数据

load data [local] inpath '数据的path' [overwrite] into table student [partition (partcol1=val1,…)];

load data:表示加载数据

local:表示从本地加载数据到hive表；否则HDFS加载数据到 hive 表

inpath:表示加载数据的路径

overwrite:表示覆盖表中已有数据，否则表示追加

into table:表示加载到哪张表

student:表示具体的表

partition:表示上传到指定分区

加载本地文件到hive

load data local inpath '/hive/datas/student.txt' into table default.student;

加载hdfs数据到hive

load data inpath '/user/hive/student.txt' into table default.student;

insert-通过查询语句向表中插入数据

insert into：以追加数据的方式插入到表或分区，原有数据不会删除
insert overwrite：会覆盖表中已存在的数据

insert into table student values(1,'xyx'),(2,'czs');
insert overwrite table student select id, name from student where name='czs';

as select-查询语句中创建表并加载数据

create table if not exists student as select id, name from student;

import-导入数据到hive表

import table student from '/hive/export/student';

insert-导出数据

insert overwrite local directory '/hive/data/export/student' select * from student;

truncate-清除表中数据

truncate table student;

Hive-查询操作

内连接：只有进行连接的两个表中都存在与连接条件相匹配的数据才会被保留下来

select e.empno, e.ename, d.deptno from emp e join dept d on e.deptno = d.deptno;

左外连接：JOIN操作符左边表中符合WHERE子句的所有记录将会被返回

select e.empno, e.ename, d.deptno from emp e left join dept d on e.deptno = d.deptno;

右外连接：JOIN操作符右边表中符合WHERE子句的所有记录将会被返回

select e.empno, e.ename, d.deptno from emp e right join dept d on e.deptno = d.deptno;

满外连接：将会返回所有表中符合WHERE语句条件的所有记录。如果任一表的指定字段没有符合条件的值的话，那么就使用NULL值替代

select e.empno, e.ename, d.deptno from emp e full join dept d on e.deptno = d.deptno;

Like,Rlike：Like运算选择类似的值%代表任意字符,_代表一个字符，Rlike可以通过正则表达式的方式指定匹配条件

# 查找名字以 A 开头的员工信息
select * from emp where ename LIKE 'A%';
# 查找名字中第二个字母为 A 的员工信息
select * from emp where ename LIKE '_A%';
# 查找名字中带有 A 的员工信息
select * from emp where ename RLIKE '[A]';

GroupBy：和聚合函数一起使用，按照一个或者多个列队结果进行分组，然后对每个组执行聚合操作

# 计算 emp 表每个部门的平均工资
select t.deptno, avg(t.sal) avg_sal from emp t group by t.deptno;

Having：只用于group by分组统计语句

# 求每个部门的平均薪水大于 2000 的部门
select deptno, avg(sal) avg_sal from emp group by deptno having avg_sal > 2000;

Order By：全局排序，只有一个Reducer，ASC默认升序，DESC降序

 select ename, deptno, sal from emp order by deptno, sal;

Sort By：局部排序，为每个reducer产生一个排序文件。每个Reducer内部进行排序，对全局结果集来说不是排序

# 设置reducer个数
set mapreduce.job.reduces=3;
# 查看reducer个数
set mapreduce.job.reduces
# 将查询结果导入到文件中
insert overwrite local directory '/opt/module/data/sortby-result' select * from emp sort by deptno desc;

Distribute By：分区，控制某个特定行应该到哪个reducer，类似MR中partition自定义分区，结合Sort By使用，分区规则是根据分区字段的hash码与reduce的个数进行模除后，余数相同的分到一个区

set mapreduce.job.reduces=3;
# 先按照部门编号分区，再按照员工编号降序排序。
insert overwrite local directory '/opt/module/data/distribute-result' select * from emp distribute by deptno sort by empno desc;

Cluster By：当distribute by和sorts by字段相同时，可以使用cluster by方式，但是排序只能是升序排序的方式

# 等价
select * from emp cluster by deptno;
select * from emp distribute by deptno sort by deptno;

Hive-分区表

分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多

load data local inpath '/opt/module/hive/datas/dept_20200401.log' into table dept_partition partition(day='20200401');
load data local inpath '/opt/module/hive/datas/dept_20200402.log' into table dept_partition partition(day='20200402');
load data local inpath '/opt/module/hive/datas/dept_20200403.log' into table dept_partition partition(day='20200403');

查询分区中的数据

# 单分区查询
select * from dept_partition where day='20200401';
# 多分区查询
select * from dept_partition where day='20200401'
union
select * from dept_partition where day='20200402'
union
select * from dept_partition where day='20200403';

增加分区

# 创建单分区
alter table dept_partition add partition(day='20200404');
# 创建多分区
alter table dept_partition add partition(day='20200405') partition(day='20200406');

删除分区

# 删除单分区
alter table dept_partition drop partition (day='20200406');
# 删除多分区
alter table dept_partition drop partition (day='20200404'), partition(day='20200405');

查看分区

# 查看有多少分区
show partitions dept_partition;
# 查看分区表结构
desc formatted dept_partition;

二级分区

创建二级分区

create table dept_partition2(
deptno int, dname string, loc string
)
partitioned by (day string, hour string)
row format delimited fields terminated by ' ';

导入分区数据

 load data local inpath '/root/dept.log' into table dept_partition2 partition(day='20200401', hour='12');

查询分区数据

select * from dept_partition2 where day='20200401' and hour='12';

数据直接上传到分区目录三种方式

上传数据后修复

# 上传数据
hive (default)> dfs -mkdir -p /user/hive/warehouse/mydb.db/dept_partition2/day=20200401/hour=13;
hive (default)> dfs -put /opt/module/datas/dept_20200401.log /user/hive/warehouse/mydb.db/dept_partition2/day=20200401/hour=13;
# 查询数据（查询不到刚上传的数据）
hive (default)> select * from dept_partition2 where day='20200401' and hour='13';
# 执行修复命令
hive> msck repair table dept_partition2;
# 再次查询
hive (default)> select * from dept_partition2 where day='20200401' and hour='13';

上传数据后添加分区

# 上传数据
hive (default)> dfs -mkdir -p /user/hive/warehouse/mydb.db/dept_partition2/day=20200401/hour=13;
hive (default)> dfs -put /opt/module/datas/dept_20200401.log /user/hive/warehouse/mydb.db/dept_partition2/day=20200401/hour=13;
# 添加分区
hive (default)> alter table dept_partition2 add partition(day='20200401',hour='14');
# 查询数据
hive (default)> select * from dept_partition2 where day='20200401' and hour='14';

创建文件夹后load数据到分区

# 创建目录
hive (default)> dfs -mkdir -p /user/hive/warehouse/mydb.db/dept_partition2/day=20200401/hour=15;
# 上传数据
hive (default)> load data local inpath '/opt/module/hive/datas/dept.log' into table dept_partition2 partition(day='20200401',hour='15');
# 查询数据
hive (default)> select * from dept_partition2 where day='20200401' and hour='15';

动态分区

关系型数据库中，对分区表Insert数据时候，数据库自动会根据分区字段的值，将数据插入到相应的分区中，Hive中也提供了类似的机制，即动态分区(DynamicPartition)，只不过，使用Hive的动态分区，需要进行相应的配置。

开启动态分区

# 默认开启
hive.exec.dynamic.partition=true

设置非严格模式

设置为非严格模式，动态分区的模式，默认strict，表示必须指定至少一个分区为静态分区，nonstrict模式表示允许所有的分区字段都可以使用动态分区

hive.exec.dynamic.partition.mode=nonstrict

设置最大分区数

在所有执行MR的节点上，最大一共可以创建多少个动态分区。默认1000

hive.exec.max.dynamic.partitions=1000

设置单个节点最大分区数

在每个执行MR的节点上，最大可以创建多少个动态分区。该参数需要根据实际的数据来设定。比如：源数据中包含了一年的数据，即day字段有365个值，那么该参数就需要设置成大于365，如果使用默认值100，则会报错

hive.exec.max.dynamic.partitions.pernode=100

设置最大创建文件数

整个MR Job中，最大可以创建多少个HDFS文件。默认100000

hive.exec.max.created.files=100000

设置空分区不抛出异常

当有空分区生成时，是否抛出异常。一般不需要设置。默认 false

hive.error.on.empty.partition=false

动态分区

# 创建目标动态分区表
create table dept_partition_dy(id int, name string) partitioned by (loc int) row format delimited fields terminated by '\t';
# 设置动态分区
set hive.exec.dynamic.partition.mode = nonstrict;
hive (default)> insert into table dept_partition_dy partition(loc) select deptno, dname, loc from dept;
# 查看目标分区表的分区情况
hive (default)> show partitions dept_partition;

Hive-分桶表

分区提供一个隔离数据和优化查询的便利方式。不过，并非所有的数据集都可形成合理的分区。对于一张表或者分区，Hive可以进一步组织成桶，也就是更为细粒度的数据范围划分。分桶是将数据集分解成更容易管理的若干部分的另一个技术。分区针对的是数据的存储路径；分桶针对的是数据文件

分桶规则：Hive的分桶采用对分桶字段的值进行哈希，然后除以桶的个数求余的方式决定该条记录存放在哪个桶当中

# 创建分桶表
create table stu_buck(id int, name string)
clustered by(id) 
into 4 buckets
row format delimited fields terminated by '\t';
# 查看表结构
hive (default)> desc formatted stu_buck;
Num Buckets: 4
# 导入数据到分桶表中，load 的方式
hive (default)> load data inpath '/student.txt' into table stu_buck;
# 查看分桶的数据
hive(default)> select * from stu_buck;

注意事项

reduce的个数设置为-1,让Job自行决定需要用多少个reduce或者将reduce的个数设置为大于等于分桶表的桶数
从hdfs中load数据到分桶表中，避免本地文件找不到问题
不要使用本地模式

Hive-函数

SELECT [ALL | DISTINCT] select_expr, select_expr, ...
FROM table_reference
[WHERE where_condition]
[GROUP BY col_list]
[ORDER BY col_list]
[CLUSTER BY col_list
| [DISTRIBUTE BY col_list] [SORT BY col_list]
]
[LIMIT number]

常用函数

函数	作用
count	求总行数
max	求最大值
min	求最小值
sum	求总和
avg	求平均值

select count(*) cnt from emp;
select max(sal) max_sal from emp;
select min(sal) min_sal from emp;
select sum(sal) sum_sal from emp;
select avg(sal) avg_sal from emp;

行转列

CONCAT：返回输入字符串连接后的结果，支持任意个输入字符串;

CONCAT_WS：按指定分隔符连接

COLLECT_SET：将某字段的值进行去重汇总，产生Array类型字段

SELECT
t1.c_b,
CONCAT_WS("|",collect_set(t1.name))
FROM (
SELECT
NAME,
CONCAT_WS(',',constellation,blood_type) c_b
FROM person_info
)t1
GROUP BY t1.c_b

列转行

EXPLODE：将hive一列中复杂的Array或者Map结构拆分成多行

用法：LATERAL VIEW udtf(expression) tableAlias AS columnAlias

用于和split，explode等UDTF一起使用，它能够将一列数据拆成多行数据，在此基础上可以对拆分后的数据进行聚合

SELECT
movie,
category_name
FROM
movie_info
lateral VIEW explode(split(category,",")) movie_info_tmp AS category_name;

窗口函数

详情请看这

over() 此时每一行的窗口都是所有的行

SELECT id,name,num,
sum(num) over() sum1 from aa

over(order by id) id=1的窗口只有一行，id=2的窗口包括id=1,id=2

SELECT id,name,num,
sum(num) over(order by id) sum1 from aa

over(partition by name) 每一行根据name来区分窗口

SELECT id,name,num,
sum(num) over(partition by name) sum1 from aa

over(partition by name order by id) 每一行根据name来区分窗口,再根据order by取具体的范围

SELECT id,name,num,
sum(num) over(partition by name order by id) sum1 from aa

over( order by id range between 1 preceding and 1 following ) range 代表范围 preceding 向前 following 向后窗口范围当前行前后一行

SELECT id,name,num,
sum(num) over( order by id range between 1 preceding and 1 following ) sum1 from aa

over( order by id range between CURRENT ROW AND 1 following ) 窗口范围当前行和后面一行

SELECT id,name,num,
sum(num) over( order by id range between CURRENT ROW AND  1 following ) sum1 from aa

自定义UDF

源码地址

将自定义函数打包之后，将jar包添加到hive的classpath路径下

hive (default)> add jar /opt/module/hive/data/myudtf.jar;

创建临时函数与开发好的java class关联

hive (default)> create temporary function myudtf as "czs.study.hive.MyUDTF";

使用自定义的函数

select myudtf("hello,world,hadoop,hive",",");

你可能感兴趣的:(BigData,hive,hadoop,big,data)

hivePB级迁移方案我要用代码向我喜欢的女孩表白数据库 bigdata-大数据专栏 hive
1、评估磁盘空间大小、调整副本数、设置heapsize大小2、distcp-i-skipcrccheck源端到目标端，迁移3、元数据迁移，建表，替换location地址，或者导出db4、表分区修复5、配置增量T-1迁移或者T-26、校验历史分区脚本，表结构，大小，文件数7、根据ditcp不对的，进行补数脚本，删分区，重拉8、任务校验，客户跑完任务后，校验指定分区的count数和内容的md59、任务
javaweb将上传的图片保存在项目文件webapp下的upload文件夹下 yuren_xia 后端技术前端技术 web app java tomcat eclipse
前端HTML表单(upload.html)首先，创建一个HTML页面，允许用户选择并上传图片。图片上传上传图片注意：表单的method设置为"post"，enctype需设置成"multipart/form-data"2.后端Servlet(UploadServlet.java)接下来，创建一个Servlet来处理文件上传请求，并将上传的图片保存到webapp/load目录下。packagecom
Spring 核心技术解析【纯干货版】- XII：Spring 数据访问模块 Spring-R2dbc 模块精讲 m0_74825003 面试学习路线阿里巴巴 spring java 后端
在现代应用架构中，高并发、低延迟的需求推动了响应式编程的发展，而传统的JDBC由于其同步阻塞机制，在高吞吐场景下可能成为瓶颈。R2DBC（ReactiveRelationalDatabaseConnectivity）作为响应式关系型数据库访问标准，正是为了解决这一问题而诞生的。SpringR2DBC作为Spring生态对R2DBC的封装，提供了非阻塞、异步的数据库访问能力，并与SpringWebF
javaweb文件上传：@MultipartConfig注解与Apache Commons FileUpload对比 yuren_xia 后端技术 apache java tomcat
在JavaWeb应用中处理文件上传时，可以选择使用@MultipartConfig注解或第三方库如ApacheCommonsFileUpload（通常简称为fileupload）。以下是两者的比较和建议：使用@MultipartConfig注解简介：@MultipartConfig是JavaServlet规范中用于处理multipart/form-data请求（通常是文件上传）的注解。它简化了在S
Exception:data did not match any variant of untagged enum PyPreTokenizerTypeWrapper at line 69 解决方案爱编程的喵喵 Python基础课程 python tokenizer PyPreTokenizer 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Exception:datadidn
driver中为什么要使用非阻塞赋值 m0_71354184 systemverilog
1.模拟硬件时序行为实际硬件行为：DUT的输入信号通常在时钟边沿被采样。Driver需要确保信号的更新与时钟同步，而非阻塞赋值的延迟更新特性（在时间步结束时统一生效）能够准确模拟寄存器的行为。示例：always@(posedgeclk)begin//非阻塞赋值：信号在时钟边沿后更新data<=next_data;//当前时钟周期计算next_data，下一时钟生效valid<=next_valid
Flask——request的form_data_args用法活动的笑脸 flask框架 flask python 后端
request中包含了前端发送过来的所有请求数据，在使用前要进行导入request库fromflaskimportFlask,request1.form和data是用来提取请求体数据，通过request.form可以直接提取请求体中的表单格式的数据，是一个类字典的对象，例如：fromflaskimportFlask,requestapp=Flask(__name__)@app.route("/in
python pandas 读取数据库_Python+Pandas 获取数据库并加入DataFrame的实例 weixin_39955149 python pandas 读取数据库
Python+Pandas获取数据库并加入DataFrame的实例实例如下所示：importpandasaspdimportsysimportimpimp.reload(sys)fromsqlalchemyimportcreate_engineimportcx_Oracledb=cx_Oracle.connect('userid','password','10.10.1.10:1521/dbins
python把oracle的查询结果导出为insert语句优游的鱼 oracle python 数据库开发语言
可以使用cx_Oracle库在Python中连接Oracle数据库并执行查询。然后，可以使用pandas库将查询结果读取为DataFrame，并使用to_sql()方法将其导出为insert语句。示例代码如下：importcx_Oracleimportpandasaspd#ConnecttoOracledatabaseconn=cx_Oracle.connect('username/passwor
python调用kafka smile__su python python kafka
先启动hadoop，zookeeper，kafka启动命令hadoop启动命令sbin/start-all.shzookeeper启动命令./bin/zkServer.shstart每台机器都要启动kafka启动命令bin/kafka-server-start.shconfig/server.properties每台机器都要启动进行以下操作的前提是将hadoop，zookeeper，kafka安装
Postgresql 查询数据库列表，表列表，字段列表小毛驴850 postgresql 数据库
--列出数据库列表SELECT*FROMpg_database;--查询表字段明细SELECTcol.table_schema,col.table_name,col.ordinal_position,col.column_name,col.data_type,col.character_maximum_length,col.numeric_precision,col.numeric_scale,c
MRtrix3安装报错2则：Checking for Qt: ERROR: error linking Qt application! 皎皎如月明 linux 运维服务器
服了，mrtrix3官网现在只推荐了conda安装这种方法，但是conda安装我一直报错，报错代码如下：Solvingenvironment:failedwithinitialfrozensolve.Retryingwithflexiblesolve.Collectingpackagemetadata(repodata.json):donePackagesNotFoundError:Thefoll
使用Python或R语言重新拟合模型 pk_xz123456 python 算法 python r语言开发语言
以下分别给出使用Python和R语言完成该任务的示例代码，假设我们有一个包含被试编号、实验条件和反应时的数据，并且要拟合一个线性回归模型。Python实现importpandasaspdimportnumpyasnpimportstatsmodels.apiassm#生成示例数据data={'subject':np.repeat(range(1,11),5),'condition':np.tile
软件定义网络（SDN）技术解析：现代网络架构的革新 Lethehong SDN技术网络架构 php 开发语言
嗨，我是Lethehong！立志在坚不欲说，成功在久不在速欢迎关注：点赞⬆️留言收藏欢迎使用：小智初学计算机网页AI文末第六点有：基于SDN控制器的流量转发示例目录一、什么是软件定义网络（SDN）？二、SDN的工作原理1、控制平面（ControlPlane）2、数据平面（DataPlane）：3、应用平面（ApplicationPlane）：三、SDN的关键技术1、OpenFlow协议2、SDN控
向量数据库实战介绍 Zhank10 数据库
本文将介绍三种常用的向量数据库：faiss,Milvus和Qdrant，并给出一个具体的使用例子。向量数据库（VectorDatabase）是一种专门用于存储、管理、查询、检索向量的数据库，主要应用于人工智能、机器学习、数据挖掘等领域。在向量数据库中，数据以向量的形式进行存储和处理，需要将原始的非向量型数据转化为向量表示（比如文本使用Embedding技术获得其表征向量）。这种数据库能够高效地进行
Hive基本操作小肥柴呀 Apache Hive hive 数据库
Hive基本操作1.Hive常用命令1.1Hive启动1.2Hive退出1.3Hive查看历史命令1.4Hive常用交互命令2.数据库基本操作2.1创建数据库2.2创建数据库并指定hdfs存储位置2.3删除空数据库2.4强制删除非空数据库2.5查看所有数据库2.6查看数据相关信息2.7数据库切换2.8修改数据库3.数据表基本操作3.1创建表3.1.1创建表的方式3.1.2创建内部表3.1.3创建外
python 多进程 Zswdhy python
#-*-coding:utf-8-*-importtimeimportpymysqlfrommultiprocessingimportProcessfromdatetimeimportdatemonth=date.today().strftime("%Y%m")HOST,USER,PASSWD,DB,PORT='192.168.1.1','admin','password','database',
Pandas逐行读取DataFrame数据以及修改对应数据 Zswdhy python python
逐行读取数据，并修改对应数据#remove_data，为一个DataFrame对象forindexsinremove_data.index:#逐行查看，values可以用int型索引remove_data.loc[indexs].values[0:-1]#逐行修改列值remove_data.loc[indexs,"Norm_peptide"]=norm_protein#也可以用loc方法查看指定元
向量数据库milvus部署一方有点方 milvus
官方文档MilvusvectordatabasedocumentationRunMilvusinDocker(Linux)|MilvusDocumentationMilvusvectordatabasedocumentation按部署比较简单，这里说一下遇到的问题一：DockerCompose方式部署1、镜像无法拉取,(docker.io被禁)只能获取以下镜像，image:quay.io/core
2024年最全Python入门的60个基础练习（二）(1) 2401_84281588 程序员 python 开发语言
data=f.read(4)#读4字节f.readline()#读到换行符、n结束f.readlines()#把每一行数据读出来放到列表中f.close()################################f=open(‘/tmp/passwd’)forlineinf:print(line,end=‘’)f.close()##############################f
hive迁移补数脚本细粒度表名-分区唯一键我要用代码向我喜欢的女孩表白 hive hadoop 数据仓库
假设我通过对数脚本发现，这些表对不上。假设检测出来是这样的（这些表存在于源端，但不存在目标端）我们需要从源端迁移过去。diff.txtads_xx1dt=20250219ads_xx2dt=20250217ads_xx2dt=20250218ads_xx2dt=20250219ads_xx3dt=20250217ads_xx4dt=20250217bak_xx1dt=20250109bak_xx1
android——Livedata、StateFlow、ShareFlow和Channel的介绍和使用 wy313622821 kotlin -java android
目录一、LiveData介绍二、StateFlow介绍三、ShareFlow介绍四、Channel介绍小结一、LiveData介绍LiveData是一种在Android开发中用于观察数据变化的组件。它可以被观察者注册并在数据变化时通知观察者，从而实现数据的实时更新。LiveData具有生命周期感知能力，它会自动管理观察者的生命周期，确保观察者只会在活动状态下接收数据更新。示例代码classMyVi
redis中的bigkey及读取优化 w_t_y_y #java操作redis redis 数据库缓存
一、bigKey介绍1、简介在Redis中，BigKey（大键）指的是占用大量内存的单个键。通常，Redis是一个高性能的内存数据库，但是当某些键变得非常大时，会带来性能上的影响。例如，大量的内存消耗、长时间的操作延迟，甚至可能导致Redis停止响应或崩溃。通俗的来说，指的是value值大，而不是key值大。2、case大字符串（String）：单个字符串值过大，例如存储非常大的JSON或XML数
慢慢欣赏linux 网络协议栈二 net_device以及初始化注册 (4.19版本) 天麓网络 linux device driver linux内核 linux 网络协议网络
代码流程staticint__initnet_dev_init(void){BUG_ON(!dev_boot_phase);dev_proc_init();=>int__initdev_proc_init(void){intret=register_pernet_subsys(&dev_proc_ops);==>staticstructpernet_operations__net_initdata
Redis hot key管理 Zhi@Li Redis运维 redis 数据库缓存数据库架构 dba
文章目录Redishotkey管理1.查询hotkey1.通过redis-cli工具2.通过monitor命令2.优化hotkeyRedishotkey管理在某个Key接收到的访问次数、显著高于其它Key时，可以将其称之为热Key，即hotkey。同bigkey一样，hotkey也会带来一系列问题，如拖慢Redis性能、造成Redis集群节点间负载不均衡、大量请求造成Redis缓存击穿等。1.查询
Android LiveData(一)：介绍和简单使用且听风吟9527 框架原理 LiveData 框架原理源码分析
传统的组件间的通信方式有Handler、BroadcastReceiver，Interface、EventBus等等方式实现，他们有自己适合的应用场景，也有各自的弊端。这里介绍新的组件通信同时LiveData，它是一个数据持有类，具有以下特点：数据可以被观察者订阅能够感知组件(Fragment、Activity、Service）)的生命周期组件处于active状态时，会通知观察者有数据更新对于观察
LiveData真的会被Flow替代吗？ Android-Developer android
LiveData和Flow都是Android中用于响应式编程的工具，但它们有不同的使用场景和优缺点。先看一下LiveData和Flow的简单使用：LiveData是一种可观察的数据持有者，它可以感知生命周期并在数据发生变化时通知观察者。在Android中，LiveData通常用于将数据从ViewModel传递到UI层。以下是LiveData的使用步骤：1.创建LiveData对象可以通过继承Liv
Android开发实战班 - 应用架构 - LiveData/Flow 数据流老码小张 Android 开发实战班 android 架构
在MVVM架构中，数据流是连接ViewModel和View的重要桥梁，用于实现数据的观察和响应。Jetpack提供了两种主要的数据流机制：LiveData和Flow。本章节将深入讲解LiveData和Flow的概念、使用方法、区别以及在实际开发中的应用场景，帮助学员掌握数据流的应用。数据流概述数据流的作用:数据流用于在ViewModel和View之间传递数据，实现数据的观察和响应。数据流可以感知生
仿12306购票系统（3）容器( ु⁎ᴗ_ᴗ⁎)ु.｡oO java 前端
前面完成了乘车人登录功能的实现，本篇主要是控制台方面的管理对于整体的控制台的设计，为了能够快速的检验，不进行登录拦截，在控制台的这个模块的controller层增加admin，以及在登录界面的拦截器排除掉admin.车站即都有那些车站createtable`station`(`id`bigintnotnullcomment'id',`name`varchar(20)notnullcomment'站
COMP8410 Data Mining S1 2025 后端
COMP8410DataMiningS12025PostgraduateAssignment1Maximummarks100Weight20%ofthetotalmarksforthecourseMintopasshurdle30%LengthMaximumof8pagesexcludingcoverpage,bibliographyandappendices.LayoutA4.Atleast11
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS