biwenjun999

hive知识点小结

hive
------------------
数据仓库，OLAP，分析处理，存储和分析，延迟较高。
数据库: OLTP,在线事务处理，低延迟，事务支持。
运行在hadoop，类SQL方法方式运行，SQL(HiveQL,HQL),MR运算。
操纵的结构化数据。
schema(模式，元信息存放到数据库中)，HDFS文件。derby，mysql。
数据库和表都是路径。

hive
------------------
类似mysql

[配置hive]
1.conf/hive-env.sh
HADOOP_HOME=... //不配也可以
2.conf/hive-site.xml
${system:java.io.tmpdir} //配置本地临时目录

$hive>schematool -initSchema --dbtype derby //初始化模式
$hive>hive //初始化模式

hive常用命令
----------------------
$hive>!clear ; //hive中执行shell命令
$hive>!dfs -lsr / ; //hive中执行hdfs命令
$hive>create table hive1.t as select hive2.t2 ; //复制表

将hive中的schema存放到外部的mysql中
---------------------------------------
1.编写hive-site.xml，添加mysql连接信息
[hive/conf/hive-site.xml]
...

javax.jdo.option.ConnectionDriverName
com.mysql.jdbc.Driver

javax.jdo.option.ConnectionURL
jdbc:mysql://192.168.231.1:3306/myhive

javax.jdo.option.ConnectionUserName
root

javax.jdo.option.ConnectionPassword
root

2.在mysql中创建myhive数据库
$hive>create database myhive ;

3.mysql驱动程序(jar)放置到hive classpath下。
...
4.重新初始化hive schema元数据库。
$>hive/bin/shematool -initschema --dbtype mysql

启动hiveserver2服务,接收多个客户端连接请求,
使得client通过jdbc连接操纵hive数据仓库
--------------------------------------------
$>hive/bin/hive --service hiveserver2 start //启动服务
$>netstat -ano | grep 10000 //查看端口

在eclipse中创建maven(暂时不用)项目
----------------------------------
1.创建java项目
2.引入外部jar包
181个
3.修改hive-site.xml配置文件
使用OS操作系统的认证方式。
[hive-site.xml]
hive.server2.enable.doAs=false
hive.metastore.sasl.enabled=false
hive.server2.authentication=NONE
3'.重启hiveserver2服务器
$hive>hive --service hiveserver2 stop
$hive>hive --service hiveserver2 start &
$hive>netstat -ano | grep 10000 //验证是否启动10000端口

4.编写App程序
public static void main(String[] args) throws Exception {
Class.forName("org.apache.hive.jdbc.HiveDriver");
Connection conn = DriverManager.getConnection("jdbc:hive2://192.168.231.100:10000/hive1","ubuntu","123456");
PreparedStatement ppst = conn.prepareStatement("select * from t");
ResultSet rs = ppst.executeQuery();
while(rs.next()){
int id = rs.getInt("id");
String name = rs.getString("name");
int age = rs.getInt("age");
System.out.println(id + "," + name + "," + age);
}
rs.close();
ppst.close();
conn.close();
}

5.常用聚集函数
count()
sum()
avg()
max()
min()

6.解决beeline命令行终端的上下键导航历史命令的bug
[bin/beeline]
修改行
if [[ ! $(ps -o stat= -p $$) =~ + ]]; then
为
if [[ ! $(ps -o stat= -p $$) =~ "+" ]]; then

hive命令
-------------
$hive>dfs -lsr / //执行dfs命令
$hive>!clear ; //执行shell脚本
$>hive -e "select * from test" //-e execute
$>hive -S -e "select * from test" //-S 静默,不输出OK,...
$>hive -f /x/x/x/a.sql //-f 执行一个文件,通常用于批处理
$hive>tab tab //显示所有命令
$hive>-- this is a comment ! //显示所有命令
$hive>set hive.cli.print.header=true; //现在字段名称(头)
$hive>create database if not exists xxx //
$hive>create database hive3 with dbproperties('author'='xupc','createtime'='today')
$hive>alter database hivee3 set dbproperties('author'='you')

[创建表语法]
CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.] table_name
[(col_name data_type [COMMENT col_comment], ...)]
[COMMENT table_comment]
[ROW FORMAT row_format]
[STORED AS file_format]
[创建表例子]
CREATE TABLE IF NOT EXISTS employee( eid int, name String, salary String, destination String)
COMMENT 'Employee details' //注释
PARTITION BY (PNAME PTYPE,...)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t' //字段结束符
LINES TERMINATED BY '\n' //行结束符
STORED AS TEXTFILE; //存储成何种文件
[创建表带分区]
create table hive1.test5(id int ,name string ,age int ) partitioned by (province string , city string) row format DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' STORED AS TEXTFILE;

[加载数据===insert]
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]
LOAD DATA LOCAL INPATH '/home/user/sample.txt' OVERWRITE INTO TABLE employee;

[创建分区表]
create table test5(id int,name string,age int) partitioned by (province string,city string); //按照省份和城市分区
[加载数据到指定分区]
load data local inpath '/home/ubuntu/employees.txt' into table hive1.test5 partition(province='hebei',citry='baoding');
[查看hdfs]
/user/hive/warehouse/hive1.db/test5/province=hebei/city=baoding/employees.txt //
[查询分区表]
$hive>select * from hive1.test5 where province = 'hebei' and city = 'baoding';
[分区表的查询模式:strict / nostrict]
$hive>set hive.mapred.mode=strict //严格模式,默认是nostrict

[查看分区表有哪些分区]
$hive>show partitions hive1.test5 ;
$hive>show partitions hive1.test5 partition(province='hebei') ; //查看具体分区的细节信息
$hive>desc extended hive1.test5 ; //查看扩展表信息
[手动增加分区]
$hive>alter table hive1.test5 add partition(province='hanan',city='pingdingshan') //
$hive>alter table hive1.test5 add partition(area='huabei',province='hanan',city='pingdingshan') //增加不存在的分区列，是非法的。

[修改表]
$hive>alter table hive1.test5 rename to hive1.test6 ; //重命名
$hive>alter table hive1.test5 add partion(province='hebei',city='zhangjiakou') location 'xxx' //添加多个分区
partion(province='hebei',city='zhangjiakou')
partion(province='hebei',city='zhangjiakou')
partion(province='hebei',city='zhangjiakou')
$hive>alter table hive1.test5 partition(province=..,city=..) set location 'xxxx' //移动分区

$hive>alter table hive1.test5 change name string //??????
$hive>alter table hive1.test5 add columns(birth string , fire string); //增加列
$hive>alter table hive1.test5 replace columns(birth string , fire string); //增加列

[修改表属性]
$hive>alter table hive1.test5 set tblproperties('a'='x',...) //修改表属性
[启用归档]
$hive>set hive.archive.enabled=true //设置可以归档,默认false????

[复制数据到分区表]
$hive>insert into hive1.test5 partition(province='hebei',city='baoding') select * from hive1.test2 ;//
insert into hive1.test6 partition(province='hebei',city='baoding') select * from hive1.test6 //字段个数相同
where province='hebei' and city='shijiazhuang' and id > 5 ; //查询时，分区通过where子句指定，
//插入时，分区用partition(..)指定
[动态分区]
$hive>insert overwrite table hive1.test6 partition(province,city) select id,...,province ,city //动态分区.
from table2 ;

$hive>create table hive1.test1(id int) tblproperties('author'='xupc');
//创建表，指定属性
$hive>create table hive1.test1(id int) LOCATION '/user/ubuntu/test1'

$hive>create external table hive1.test3 like hive1.test1 ; //创建外部表external,只复制表结构，没有数据。
$hive>create external table hive1.test4 as select * from hive1.test1; //创建外部表external,只复制表结构，有数据。

$hive>desc extended hive1.test1; //显示扩展信息
$hive>desc formatted hive1.test1; //显示格式化的信息
$hive>create table hive2.test4 like hive1.test1; //复制表
$hive>show tables in hive1; //显示指定数据库的表集合,默认是当前库.

$hive>hive>drop database if exists xxx //存在即删除
$hive>hive>drop database if exists xxx //存在即删除
$hive>hive>drop database if exists xxx cascde //级联删除
$hive>hive>create database hive2 location '/user/ubuntu/';
$hive>hive>desc[ribe] database hive2 //显示db信息,不包含扩展信息
$hive>hive>desc[ribe] database extended hive3 //显示db信息,不包含扩展信息
$hive>hive>use hive3; //使用哪个库

分区表
-----------------

托管表
----------------
hive默认表都是托管表。hive控制其数据的生命周期。删除托管表时，元数据和数据都被删除。

外部表
---------------
hive控制元数据。删除托管表时，数据不被删除。
create external table hive1.test3 like hive1.test1 ;

使用beeline客户端可以实现远程jdbc连接
--------------------------------------
1.连接
$>hive --service beeline -u jdbc:hive2://s100:10000/hive1
$>beeline -u jdbc:hive2://s100:10000/hive1
$beenline>
$beenline>!sh clear ; //执行shell脚本
$beenline>show databases; //查看库
$beenline>!help; //帮助
$beenline>!dbinfo //帮助

配置hive的仓库位置
---------------------
[hive-site.xml]
hive.metastore.warehouse.dir=/user/hive/warehouse/

hive数据类型
----------------------
类型 Size 案例
TINYINT 1 byte signed integer. 20 //byte
SMALLINT 2 byte signed integer. 20 //short
INT 4 byte signed integer. 20 //int
BIGINT 8 byte signed integer. 20 //long
BOOLEAN Boolean true or false. TRUE //boolean
FLOAT Single precision floating point. 3.14159 //float
DOUBLE Double precision floating point. 3.14159 //double

STRING 'Now is the time', "for all good men" //字符串'' / ""
TIMESTAMP
BINARY 字节数组

[集合类型]
STRUCT struct('John', 'Doe')
MAP map('first', 'John','last', 'Doe')
ARRAY array('John', 'Doe')

Hive所谓的读模式
-----------------------
hive在写操作是不校验，读时校验。

-----------------------------------------------------
创建分区表
------------
create external table hive1.test2(id int , name string ,age int)
partitioned by(province string , city string)
row format DELIMITED
FIELDS TERMINATED BY '\t'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;

手动添加分区
-------------
alter table hive1.test2 add partition(province='hebei',city='baoding')

插入数据到分区表
----------------
insert into hive1.test2 partition(province='hebei',city='baoding')
select * from hive1.test6 where province='hebei' and city='shijiazhuang' and id > 5 ;

动态分区
----------------
$hive>-- 创建test3分区表
$hive>create table test3(id int,name string,age int)
partitioned by (province string,city string)
row format delimited
fields terminated by '\t'
lines terminated by '\n'
stored as textfile ;

$hive>-- 动态分区,复制一个表数据到分区表，动态创建分区
$hive>-- 如果两个都是动态分区需要关闭严格模式
$hive>set hive.exec.dynamic.partition.mode=nonstrict; //关闭动态分区的严格模式
$hive>insert into hive1.test2 partition(province,city) //
select id,name,age, 'henan' as province , 'kaifeng' as city
from table2 ;

$hive>-- 使用分区动静混合
$hive>insert into hive1.test2 partition(province='henan',city)
select id,name,age, 'henan' as province , 'kaifeng' as city
from table2 ;

$hive>-- 查询期间，动态创建表，并将数据写入创建表中
$hive>create table test3 as select id,name from test2 where province = 'hebei' and city = 'baoding';

$hive>-- 导出hive数据到本地目录(下载)
$hive>insert overwrite local directory '/home/ubuntu/hive' select * from test2 where province = 'hebei';

$hive>-- 导出hive数据到HDFS目录
$hive>insert overwrite directory 'hdfs://s100:8020/user/ubuntu/xxx' select * from test2 where province = 'hebei';

$>-- 查询数据向多个目录同时输出??????????????????
$>from test2 t
insert overwrite local directory '/home/ubuntu/hebei' select * where t.province = 'hebei'
insert overwrite local directory '/home/ubuntu/henan' select * where t.province = 'nanan' ;

查询
-------------------------------
$>-- 查询,投影查询，指定表的别名
$>select col1,col2,... from table t ;

$>-- 查询,使用函数
$>select upper(name) from test2 ;
$>select lower(name) from test2 ;

$>-- 数学函数
$>select round(12.345) ; //四舍五入
$>select floor(12.345) ; //地板
$>select ceil(12.345) ; //天花板
$>select rand(10) ; //随机数

$>-- 聚合函数
$>select count(*) from test2 ;
$>select sum(age) from test2 ;
$>select avg(age) from test2 ;
$>select max(age) from test2 ;
$>select min(age) from test2 ;

$>-- 去重.distinct
$>select count(dinstinct name) from test2 ;

$>-- 表生成函数
$>select explode(array('tom','tomas','tomsLee')) ;

$>-- ascii函数,字符串首个字母ascii值
$>select ascii('abc') ;

$>-- base64字符串编码
$>select base64(binary('httpt://localhost:8080/helloworld')) ;//输出select base64(binary('httpt://localhost:8080/helloworld')) ;

$>-- binary函数，将字符串转换成二进制
$>select base64(binary('httpt://localhost:8080/helloworld')) ;//输出select base64(binary('httpt://localhost:8080/helloworld')) ;

$>-- binary函数，将字符串转换成二进制
$>select binary('httpt://localhost:8080/helloworld') ;

$>-- 类型转换
$>select cast('120' as bigint) + 200 ; //320

$>-- 字符串连接
$>select concat('120',200) ; //120200

$>-- 分页查询limit
$>select * from test2 limit 1,1 ; //offset , length

$>-- 嵌套子查询
$>from (select * from test2 where province = 'hebei') e select e.id,e.name,e.age where e.city = 'baoding'; //OK
$>select e.id,e.name,e.age from (select * from test2 where province = 'hebei') e where e.city = 'baoding'; //OK

$>case .. when then 相当于if
$>select id,name,case when age <= 12 then 'young'
when age > 12 and age <= 13 then 'middle'
when age > 13 and age <= 15 then 'old'
else 'too old'
end as yearstate from test2 ;

$>-- 不能在where使用列别名
$>select id,name n ,age from test2 where n like 't%' ; //wrong,where中不能字段别名。

$>-- 范围运算
$>select id,name n ,age from test2 where age <= 14 and age >= 12 ;
$>select id,name n ,age from test2 where age between 12 and 14 ;

$>-- 浮点数比较的规避方案
$>select cast(0.2 as float) ;

$>-- group by查询
$>select count(*),province from test2 group by province ; //
$>select count(*) as c ,province from test2 group by province having c > 3 ; //having是组内过滤

[Hive的Join操作,只支持等值连接]
$>-- 创建customers和orders表，一对多关系。

$>-- customers
$>create table customers(id int , name string , age int)
row format delimited
fields terminated by '\t'
lines terminated by '\n'
stored as textfile ;

$>-- orders
$>create table orders(id int , orderno string , price float , cid int)
row format delimited
fields terminated by '\t'
lines terminated by '\n'
stored as textfile ;

$>-- 准备数据
customers.txt数据
------------------
1 tom1 12
2 tom2 13
3 tom3 14

orders.txt数据
-------------------
1 No001 121.34 1
2 No002 121.35 1
3 No003 121.00 1
4 No004 22.66 2
5 No005 300.65 2
6 No006 800.56 2
7 No007 1000.12

$>-- 加载数据到customers + orders中.
$>load data local inpath '/home/ubuntu/customers.txt' into table hive1.customers;
$>load data local inpath '/home/ubuntu/orders.txt' into table hive1.orders;

$>select * from customers;

$> --内连接 join .. on
$>select a.id,a.name,b.id,b.orderno,b.price from customers a join orders b on a.id = b.cid ;
1 tom1 1 No001 121.34
1 tom1 2 No002 121.35
1 tom1 3 No003 121.0
2 tom2 4 No004 22.66
2 tom2 5 No005 300.65
2 tom2 6 No006 800.56

$>-- 连接查询优化手段：查询表的大小从左到右是递增的。
$>select c.id,c.name,c.age,o.orderno,o.price from customers c join orders o on c.id = o.cid where ...; //right
$>select c.id,c.name,c.age,o.orderno,o.price from orders o join customers c on c.id = o.cid where ...; //wrong

$>-- 使用查询暗示 hint
$>select /*+streamtable(c)*/ c.id,c.name,c.age,o.orderno,o.price from orders o join customers c on c.id = o.cid;

$>-- left outer join
$>select c.id,c.name,c.age,o.orderno,o.price from customers c left outer join order o on c.id = o.cid ;
1 tom1 1 No001 121.34
1 tom1 2 No002 121.35
1 tom1 3 No003 121.0
2 tom2 4 No004 22.66
2 tom2 5 No005 300.65
2 tom2 6 No006 800.56
3 tom3 NULL NULL NULL

$>-- right outer join
$>select c.id,c.name,c.age,o.orderno,o.price from customers a right outer join order b on c.id = o.cid ;
1 tom1 1 No001 121.34
1 tom1 2 No002 121.35
1 tom1 3 No003 121.0
2 tom2 4 No004 22.66
2 tom2 5 No005 300.65
2 tom2 6 No006 800.56
NULL NULL 7 No007 1000.12

$>-- full outer join
$>select c.id,c.name,c.age,o.orderno,o.price from customers a full outer join order b on c.id = o.cid ;
NULL NULL 7 No007 1000.12
1 tom1 3 No003 121.0
1 tom1 2 No002 121.35
1 tom1 1 No001 121.34
2 tom2 6 No006 800.56
2 tom2 5 No005 300.65
2 tom2 4 No004 22.66
3 tom3 NULL NULL NULL

$>-- 左半连接,select和where子句不能引用到右边表字段
$>-- 左表的记录在右表中一旦找到对应的记录，右侧表即停止扫描。
$>select c.id,c.name from customers c left semi join orders o on c.id = o.cid ;

$>-- hive不支持右半连接操作. right semi join xxxx

$>-- 笛卡尔连接 m x n
$>select c.id,c.name,o.orderno from customers c join orders o ;

$>-- map端连接,一张小表，通过mapper的时候，将小表完全载入内存。
$>-- 暗示 mapjoin(c)在0.7之前使用。
$>select /*+mapjoin(c)*/ c.id,c.name,o.orderno from customers c join orders o ;
$>select /*+mapjoin(o)*/ c.id,c.name,o.orderno from customers c join orders o ;

$>set hive.auto.conert.join=true --转换连接,map端优化，在右外链接和全外连接中不支持
$>hive.mapjoin.smalltable.filesize=25000000 --设置小表阀值

$>-- order by 全排序，对所有数据通过一个reduce进行排序。
$>-- 如果开启了hive.mapred.mode=strict,在全排序时必须集合limit使用。
$>-- 现在推荐使用hive.strict.checks.*属性.
$>select * from orders order by cid asc , price desc ; --全局排序

$>-- sort by 每个reduce进行排序(局部排序)。
$>select * from orders sort by cid asc , price desc ; --局部排序

$>-- distribute by等价于自定义分区函数,写在sort by之前.
$>select * from orders distribute by cid sort by price desc ; --局部排序

$>--cluster by === distribute by ... sort by ...

$>分桶采样
$>select * from orders tablesample(bucket 3 out of 10 on number) ;

$>-- 按照数据块百分比采样，100块,抽取10块.,如果总共1块，没有采样。
$>select * from orders tablesample(0.1 percent) ;

$>-- union all 联合操作,字段类型和个数需要匹配。
$>select id , name from customers union all select id ,orderno from orders ;

$>-- view(虚表),降低查询的复杂度
$>-- create view v_name as select ...
$>create view view1 as select c.id,c.name,c.age,o.id,o.prderno,o.price --创建视图
from customers c left outer join orders o on c.id = o.cid ;

$>-- 通过视图直接查询
$>select * from view1 ;
$>select * from view1 where price > 200 ;

$>-- 使用like方式创建view
$>create view v2 like view1 ;

$>--删除视图
$>drop view if exists v2;

$>--索引,hive没有key(primary key + auto_increment)
$>--创建索引,DEFERRED REBUILD该选项时，索引为空白状态，需要rebuild才能够初始化。
$>CREATE INDEX idx_customers_id ON TABLE customers (id) AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' WITH DEFERRED REBUILD IDXPROPERTIES ('creator' = 'me') IN TABLE customers_index COMMENT 'this is a comment!';

$>-- order index
$>CREATE INDEX idx_orders_orderno ON TABLE orders (orderno) AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler' WITH DEFERRED REBUILD IN TABLE orders_index;

$>alter index idx_customers_id on customers rebuild ; --重建索引,产生索引表(hdfs文件)
hdfs://s100:8020/../customers_index/000000_0 --索引文件(表)
[内容如下]
1 hdfs://s100:8020/user/hive/warehouse/hive1.db/customers/customers.txt [0]
2 hdfs://s100:8020/user/hive/warehouse/hive1.db/customers/customers.txt [10]
3 hdfs://s100:8020/user/hive/warehouse/hive1.db/customers/customers.txt [20]

$>alter index idx_customers_id on customers rebuild ; --重建索引
$>alter index idx_orders_orderno on orders rebuild ; --重建索引
No001hdfs://s100:8020/user/hive/warehouse/hive1.db/orders/orders.txt0
No002hdfs://s100:8020/user/hive/warehouse/hive1.db/orders/orders.txt17
No003hdfs://s100:8020/user/hive/warehouse/hive1.db/orders/orders.txt34
No004hdfs://s100:8020/user/hive/warehouse/hive1.db/orders/orders.txt51
No005hdfs://s100:8020/user/hive/warehouse/hive1.db/orders/orders.txt67
No006hdfs://s100:8020/user/hive/warehouse/hive1.db/orders/orders.txt84
No007hdfs://s100:8020/user/hive/warehouse/hive1.db/orders/orders.txt101

$>-- 删除索引
$>drop index idx_customers_id on table customers;

$>--分区是路径，是目录，是文件逻辑隔离。有效降低查询量。

$>--桶表(bucket)，是文件。
$>--创建桶表
$>create table ... clustered by (field_name) into n buckets ;
$>create table orderitems (id int , itemname string , oid int) clustered by (oid) into 3 buckets row format delimited fields terminated by '\t' lines terminated by '\n' stored as textfile ;

1 item1 1
2 item2 1
3 item3 1
4 item4 2
5 item5 2
6 item6 2
7 item7 3
8 item8 3
9 item9 3
10 item10 3
12 item10 4
13 item10 4
14 item10 4
15 item10 4

***** 何时Hive可以避免MR操作 *****
--------------------------------------
不是mr的job就是本地模式。
1.全表扫描：没有where子句。
select * from test2 ;

2.where子句作用只有分区字段，也不需要mr.
select * from test2 where province = 'hebei' ;

3.设置hive.exec.model.local.auto=true
该属性hive会尽量使用local模式查询。

4.其余的所有查询都会转换成MR.

nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Hadoop架构 henan程序媛 hadoop 大数据分布式
一、案列分析1.1案例概述现在已经进入了大数据(BigData)时代，数以万计用户的互联网服务时时刻刻都在产生大量的交互，要处理的数据量实在是太大了，以传统的数据库技术等其他手段根本无法应对数据处理的实时性、有效性的需求。HDFS顺应时代出现，在解决大数据存储和计算方面有很多的优势。1.2案列前置知识点1.什么是大数据大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的大量数据集合，
[转载] NoSQL简介 weixin_30325793 大数据数据库运维
摘自“百度百科”。NoSQL，泛指非关系型的数据库。随着互联网web2.0网站的兴起，传统的关系数据库在应付web2.0网站，特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心，暴露了很多难以克服的问题，而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战，尤其是大数据应用难题。虽然NoSQL流行语
Kafka详细解析与应用分析芊言芊语 kafka 分布式
Kafka是一个开源的分布式事件流平台（EventStreamingPlatform），由LinkedIn公司最初采用Scala语言开发，并基于ZooKeeper协调管理。如今，Kafka已经被Apache基金会纳入其项目体系，广泛应用于大数据实时处理领域。Kafka凭借其高吞吐量、持久化、分布式和可靠性的特点，成为构建实时流数据管道和流处理应用程序的重要工具。Kafka架构Kafka的架构主要由
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
疫情，疫情东山草
2020年，疫情爆发，至今已近三年，反反复复，此起彼伏。不但没被消灭，还自我发展，从德尔塔到奥密克戎，与时俱进的变异着。去年11月，疫情之下，大数据800米范围内，都成为时空伴随者。“你的码儿有没有变颜色”“你绿码还是黄码”成为那段时间的流行语，当然少不了的还有全员核酸。段子手整出来一首歌：我走过你走过的路,这算不算相逢？我吹过你吹过的风，这算不算相拥？800米内我们不曾擦肩而过，你却要我14天相
在服务器计算节点中使用 jupyter Lab ranshan567 程序人生
JupyterLab是一个基于网页的交互式开发环境,用于科学计算、数据分析和机器学.jupyterlab是jupyternotebook的下一代产品,集成了更多功能,使用起来更方便.在进行数据分析及可视化时，个人电脑不能满足大数据的分析需求，就需要用到高性能计算机集群资源，然而计算机集群的计算节点往往没有联网功能，所以在计算机集群中使用jupyterLab需要进行一些配置。具体的步骤如下：
大数据真实面试题---SQL The博宇大数据面试题——SQL 大数据 mysql sql 数据库 big data
视频号数据分析组外包招聘笔试题时间限时45分钟完成。题目根据3张表表结构，写出具体求解的SQL代码（搞笑品类定义：视频分类或者视频创建者分类为“搞笑”）1、表创建语句：createtablet_user_video_action_d(dsint,user_idstring,video_idstring,action_typeint,`timestamp`bigint)rowformatdelimi
Flume：大规模日志收集与数据传输的利器傲雪凌霜，松柏长青后端大数据 flume 大数据
Flume：大规模日志收集与数据传输的利器在大数据时代，随着各类应用的不断增长，产生了海量的日志和数据。这些数据不仅对业务的健康监控至关重要，还可以通过深入分析，帮助企业做出更好的决策。那么，如何高效地收集、传输和存储这些海量数据，成为了一项重要的挑战。今天我们将深入探讨ApacheFlume，它是如何帮助我们应对这些挑战的。一、Flume概述ApacheFlume是一个分布式、可靠、可扩展的日志
云服务业界动态简报-20180128 Captain7
一、青云青云QingCloud推出深度学习平台DeepLearningonQingCloud，包含了主流的深度学习框架及数据科学工具包，通过QingCloudAppCenter一键部署交付，可以让算法工程师和数据科学家快速构建深度学习开发环境，将更多的精力放在模型和算法调优。二、腾讯云1.腾讯云正式发布腾讯专有云TCE(TencentCloudEnterprise)矩阵，涵盖企业版、大数据版、AI
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
架构评审的自动化与人工智能: 如何提高效率光剑书架上的书架构自动化人工智能运维
1.背景介绍架构评审是软件开发过程中的一个关键环节，它旨在确保软件架构的质量、可维护性和可扩展性。传统的架构评审通常是由人工进行，需要大量的时间和精力。随着大数据技术和人工智能的发展，自动化和人工智能技术已经开始应用于架构评审，从而提高评审的效率和准确性。在本文中，我们将讨论如何通过自动化和人工智能技术来提高架构评审的效率。我们将从以下几个方面进行讨论：背景介绍核心概念与联系核心算法原理和具体操作
【数字化供应链】数字化供应链架构、全景管理、全流程贯通方案数字化建设方案数字化转型数据治理主数据数据仓库供应链数字仓储智慧物流智慧仓储物流园区架构微服务数据挖掘大数据人工智能
原文《数字化供应链架构、全景管理、全流程贯通方案》PPT格式。主要从供应链管理全景、智慧供应链建设总体目标、供应链总体业务流程、供应链总体功能架构、供应链总体技术架构、供应链全流程贯通、供应链全领域管理、供应链数据数据分析、供应链决策中台等进行建设。本文仅对主要内容进行介绍。来源网络公开渠道，旨在交流学习，如有侵权联系速删，更多参考公众号：优享智库基于先进IT技术、大数据能力、物联网应用、区块链平
80 鑫_259b
科普一个谈恋爱的方法。在以前，谈恋爱千难万难，就难在对对方不知底细，不知道对方希望自己是一个怎样的人，要耗费大量的时间去试探、再磨合，往往会因为一些小事一些细节，满盘皆输。在一个信息化的时代，在一个大数据近乎变成了流行语的时代，我们要跟上时代的步伐，通过大数据，去寻找异性最希望自己展现出来的形象是什么，才可以在爱情的道路上少走弯路。那这个大数据怎么操作呢？上街发问卷？问别人的择偶标准？一来会被打死
解锁企业潜能，Vatee万腾平台引领智能新纪元自媒体经济说其他
在数字化转型的浪潮中，企业正站在一个前所未有的十字路口，面对着前所未有的机遇与挑战。解锁企业内在潜能，实现跨越式发展，已成为众多企业的共同追求。而Vatee万腾平台，作为智能科技的先锋，正以其强大的智能赋能能力，引领企业步入一个全新的智能纪元。Vatee万腾平台，是一个集成了人工智能、大数据、云计算等前沿技术的综合性智能服务平台。它不仅仅是一个技术工具，更是企业转型升级的加速器，能够深入企业运营的
释放“AI+”新质生产力，深算院如何“把大数据变小”？ YashanDB YashanDB 国产数据库数据库数据库大数据
近期，南都·湾财社推出《新质·中国造》栏目，深入千行百业，遍访湾区企业，解锁湾区新质生产力，共探高质量发展之道。本期对话深圳计算科学研究院YashanDB首席技术官陈志标，探讨国产数据库如何实现创新突围，抢抓数字经济时代的新机遇。以下是专访内容：如何应对AI时代所面临的算力挑战？南都·湾财社：数据、算力和算法是发展人工智能的三要素，深算院做了怎样的前瞻性布局？陈志标：今年，政府工作报告中首次提及开
数字化智能工厂数字化供应链架构、全景管理、全流程贯通方案数字化建设方案智能制造数字工厂制造业数字化转型工业互联网架构
随着信息技术的飞速发展，数字化转型已成为制造企业提升竞争力的关键途径。数字化智能工厂通过集成先进的物联网(IoT)、大数据、云计算、人工智能(AI)等技术，实现了生产过程的智能化、供应链管理的精准化及决策的科学化。本方案旨在构建一套完善的数字化供应链架构，实现全景管理、全流程贯通、智慧化升级，以数据为驱动，强化技术支撑与安全管理体系，推动企业向智能制造迈进。一、数字化供应链架构1.**集成化平台构
日记——我的歌单静若小猴
又到一年一度大数据汇总的时候了，听歌已经成为很多人生活里的一种乐趣。春夏秋冬，我们都有自己喜欢的歌，歌词歌曲唱出沃尔玛你的心声。还记得大学时候最喜欢听的《春天里》，我有一天单曲回放了30遍，总觉得听着仿佛看到自己声音。还有的歌，初听不知曲中意，再听已经是曲终人，听着歌流泪，听着歌入睡……还记得那些年少的故事吗，总觉得自己才是故事外的人，却不是自己已经入歌。一段时间会喜欢一个人的音乐，一段时间会沉静
Linux dmesg命令：显示开机信息 fafadsj666 linux 数据库数据挖掘机器学习大数据
通过学习《Linux启动管理》一章可以知道，在系统启动过程中，内核还会进行一次系统检测（第一次是BIOS进行加测），但是检测的过程不是没有显示在屏幕上，就是会快速的在屏幕上一闪而过那么，如果开机时来不及查看相关信息，我们是否可以在开机后查看呢？答案是肯定的，使用dmesg命令就可以。无论是系统启动过程中，还是系统运行过程中，只要是内核产生的信息，都会被存储在系统缓冲区中，已经为大家精心准备了大数据
大数据新视界 --大数据大厂之揭秘大数据时代 Excel 魔法：大厂数据分析师进阶秘籍青云交大数据新视界 Excel 数据分析函数公式数据透视表图表功能规划求解数据分析工具库大数据新视界数据库
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
大数据新视界 --大数据大厂之数据挖掘入门：用 R 语言开启数据宝藏的探索之旅青云交大数据新视界数据库大数据数据挖掘 R 语言算法案例未来趋势应用场景学习建议大数据新视界
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：Ja
高职人工智能训练师边缘计算实训室解决方案武汉唯众智创人工智能训练师边缘计算实训室人工智能训练师实训室边缘计算实训室
一、引言随着物联网（IoT）、大数据、人工智能（AI）等技术的飞速发展，计算需求日益复杂和多样化。传统的云计算模式虽在一定程度上满足了这些需求，但在处理海量数据、保障实时性与安全性、提升计算效率等方面仍面临诸多挑战。在此背景下，边缘计算作为一种新兴的计算模式应运而生，通过将计算能力推向数据生成或用户所在的网络边缘，显著降低了数据传输的延迟，提升了处理效率，并增强了数据安全性。针对高等职业院校的人工
python基于django/flask的NBA球员大数据分析与可视化python+java+node.js QQ_511008285 python django flask java spring boot 数据分析
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以本文针对NBA球员的大数据进行
Java基于spring boot的国产电影数据分析与可视化python+java+node.js QQ_511008285 java spring boot 数据分析 python django vue.js flask
前端开发框架:vue.js数据库mysql版本不限后端语言框架支持：1java(SSM/springboot)-idea/eclipse2.Nodejs+Vue.js-vscode3.python(flask/django)--pycharm/vscode4.php(thinkphp/laravel)-hbuilderx数据库工具：Navicat/SQLyog等都可以该系统使用进行大数据处理和
数字化（电子化）招标采购平台系统核心功能详细介绍 xinyuan_123456 oracle
数智化招标采购平台覆盖全业务类型、全采购流程、全采购方式，是郑州信源公司运用“互联网+”、大数据、人工智能、区块链、物联网等新兴技术，结合供应链管理理念，以招标采购为核心，提供交易、管理、数据、服务、监管为一体的高标准采购管理平台，赋能政企用户实现采购业务全流程的电子化、数字化、智慧化。根据产品功能及应用领域，产品包括：企业数智化招采供应链平台、金融数智化招采平台、政府数智化采购平台、公共资源数智
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

hive知识点小结

你可能感兴趣的:(大数据)