Byyyi耀

Hive详解、配置、数据结构、Hive CLI

一、Hive 认识

1. Hive 应用

问题：公司的经营状况？
主题一：财务
	现金流
		指标1.1：净现金流入/流出量
		指标1.2：现金转换周期
	预算执行状况
		指标2.1：预算内成本控制
		指标2.2：预算与实际支出的差异
主题二：产品
		指标1：产品销售量
		指标2：产品利润率
		指标3：新产品开发周期
主题三：客户
	老客户的流失率
		指标1.1：重复购买率
		指标1.2：客户满意度调查结果
	新客户的留存率、转化率
		指标2.1：新客户留存率
		指标2.2：潜在客户到实际客户的转化率
主题四：员工
		指标1：员工满意度
		指标2：员工流失率
		指标3：员工绩效评估
主题五：资产
		指标1：资产负债率
		指标2：固定资产周转率
		指标3：存货周转率

问题 => 主题(拆分) => 指标 => HQL

2. Hive 定义

基于元数据和表数据对数据进行结构化治理的机制(数仓)

"基于元数据"的核心：获取Hive MetaStore指定Mysql存储的元数据并根据其解析HQL生成执行计划
"基于表数据"的核心：获取表数据并通过执行计划进行数据处理和结果存储和加载。

3. Hive 具体设计

关键组件

UI：客户端提交查询。
Compiler：借助MetaStore获取存储在Mysql中的元数据信息解析查询块或表达式，生成执行计划。
Execution engine：管理计划的不同阶段之间的依赖关系(协调各操作的执行顺序)，并在适当的大数据组件上执行这些阶段。

关键步骤详解

6.1步：
1.将执行计划提交到Hadoop作为一个MapReduce作业.
2.RM将作业分解为多个任务，并且分配给不同的集群节点去执行。
3.启动Map任务(读取输入数据，处理，输出结果)
4.启动Reduce任务(可选)(读取Map|Shffle端输出，处理，输出结果) => 决定了是MapOnly引擎还是MapReduce引擎
6.2步：
完成了一个Job，将数据加载到Hive表上。
6.3步：
Hive与HDFS进行交互，包括读取数据文件以进行查询，或将查询结果写入到HDFS。
7,8,9步：
一旦执行引擎完成了查询任务，结果需要被传回UI
体现了将查询结果有执行引擎处理并通过Hive驱动程序返回给用户界面的过程。

执行计划的变化过程

二、ETL——数仓构建核心环节

定义

将数据从各种数据源中提取出来，经过一系列处理和转换，最后导入到Hive委托存储的地方(例如：HDFS,Mysql等)

详解

Extract
			从外部数据源读取不同数据格式(结构化，半结构化，非结构化)数据通过UI提交到Hive系统
		ODS 近源层
			Extract后提取到的保持原始格式的数据被提取到ODS层，并在ODS层内经过一定的清洗和结构化。
		==================进入MapReduce框架=====================
		Transform(+宽表)									
			列裁剪：使用 INSERT INTO ... SELECT 语句创建新表或视图。			
			数据清洗：移除无用或错误数据。									
			数据补全：修正残缺或错误数据。如 mlae 视为 male。				province  city					
			数据变形：改变数据的格式。如 {province:Jiangsu, city:wuxi} 转为 Jiangsu | wuxi。										
			无法修正错误：删除记录或视为缺失后估算。如年龄 -3。	
		数据集大小对处理要求的影响
			大数据集：尽量近似和估算
			小数据集：尽量补全		
		
		DWD 明细层
			存储原始或未加工的数据
			数据分析示例
			事实->维度->维度建模
			事实：如 “我在12:13分在小A包子店吃了一个鲜肉包。”
			维度建模：基于不同客体分析，如对用户，则有特征，身份，喜好...
										  对鲜肉包，则有销量，销量占比，材料，烹饪方式...
		DWT	轻聚层
			对数据进行不同维度和不同量级的聚合，便于对数据进行即时查询
			
		DWS 汇总层
			数据被进一步聚合和汇总
			
		DM 	数据集市
			数据仓库架构中的业务数据仓库子集，通常针对特定业务部门或功能领域。
			
		Load
			1. 将数据从DM层或者直接从源头加载到HDFS中。
			2. 将物理计划传递给执行引擎，如MapReduce。
			3. 获取处理后的结果或将处理后的结果写入HDFS。
			
		关于"层"的概念：
		1. "层"是逻辑概念，表示一个数据处理|存储环节，实际上存储在不同的服务器中。
		2. "层"是基于数仓的概念，不依赖于任何引擎。

三、Hive 数据结构

（一）简介

1.存储位置

库、表的存储位置：

/user/hive/warehouse【即配置hive.metastore.warehouse.dir的文件夹路径地址】

	默认数据库default	非default数据库
数据库位置		/user/hive/warehouse/数据库名字.db
表位置	/user/hive/warehouse/表名	/user/hive/warehouse/数据库名字.db/表名

2.类型

数据的存储位置：

服务
	Hive MetaStore：指定Derby|Mysql存储元数据信息，并与HDFS相关联。
					开放API面向客户端供它们访问元数据信息。			
存储
	database_params：存放元数据参数配置
	dbs：存放metadata元数据

（二）各数据类型详解

1.库：文件夹

2.表：文件夹

命名

内部表与外部表

A.区别

内部表
	1.HDFS中的数据由Hive管理，在Hive中删除表会同步删除数据。
	2.在Hive中创建内部表之后，在HDFS中会自动创建内部映射路径：/hive312/warehouse/DB_NAME.db/TABLE_NAME
	3.内部表在创建的时候，通常路径中还没有数据。
外部表
	1.HDFS中的数据不由Hive管理，在Hive中删除表不会同步删除数据，要删数据必须去HDFS中手动删除。
	2.在Hive中创建外部表之后，在HDFS中不会有内部映射路径，需要自行创建并指定location。(location为数据文件的上一级目录)
	3.外部表在创建的时候，通常路径中已有数据。

B.选择
只在Hive中使用；频繁更新数据并希望这些操作自动管理 —— 内部表
数据由多个应用共享，例如Hive和Spark；数据不经常变化或数据更新由外部过程管理 —— 外部表

3.分区：文件夹

定义

分区字段名=分区字段值
基于一个或多个分区键进行分区，通常以日期进行分区。
分区表为内部表。
分区字段可以是原始表中的字段，也可以是通过表中的一个或多个字段计算出来的表达式。(日期 -> 年)。
若非原始字段，其本身也可以作为原始字段使用所有的SQL语句。

如何选用分区字段？

1.WHERE … | ON …
2.GROUP BY … , DISTRIBUTE BY … (确定Reducer) , cluster by …(确定Reducer并在内部排序)
3.如果数据量大，由于分区本身(文件夹)的大小限制，会选择缩小分区字段的维度。

分类

1.静态分区(eg:客户按分区给数据)
需要为每个加载的数据集指定一个具体的分区(分区字段名=字段值)
适用于持续增长的新数据，例如对按月分区的数据，每个月增加一次分区即可。

2.动态分区(eg:项目初期，客户一次性给了大量数据)
适合处理包含大量分区的情况

作用

1.hive进行查询时就是文件流读文件，即使读一条数据也需要加载整个文件。
所以分区表将文件切割成更小的粒度，当需要针对局部数据进行检索、聚合等处理时，便于快速筛选出符合特定条件的数据，提高效率。
2.如果需要进行分组聚合的字段是分组字段，即直接对该分区作聚合，则直接设置combiner，无需设置reducer。

多级分区

GROUP BY year(order_time),month(order_time),weekofmonth(order_time)
	=>从左到右分区从主到次
一级分区(year=2012)
	二级分区(month=3)
		三级分区(weekofmonth=2)

4.分桶：文件

定义

选择桶中的一个或多个列作为桶的依据，根据这些列的值对数据进行散列，然后根据散列值将数据分配到不同的桶中。
分桶的字段必须是表中已存在的字段，分桶数通常为2^n
默认采用原始字段值的hashcode%分桶数来决定该行数据会被拆分到几个桶。

目的

便于进行抽样，通过了解数据的分布状态来对数据进行全量分析。或者作为一部分数据集运行查询测试。
提升有join操作时的MR效率

如何确定分桶数量？

主要由采样率决定 : 10% -> 桶数定义为10
数据量越大，分桶越多。分桶越多，并行度越高。
分区倾斜严重，分桶能缓解。

四、Hive的配置与优化

配置:											优先级			重要程度
set config_item=value;	临时配置			  1				✔✔✔(个性化 执行优化)
	set hive.server2.logging.operation.level=verbose|NONE; 开启|关闭日志()
hive-site.xml			自定义配置			  2				  ✔(服务 通用优化配置)
	取hive-default.xml的头结构并且按hive_install.md进行个性化配置。
hive-default.xml		默认配置(模板)		  3

优化：
Cost based Optimizer
1.通过估算不同查询策略的成本来选择执行计划，根据数据库中数据的变化动态调整计划。
2.在执行多表连接的查询时,会找出最优的连接顺序和连接算法.

五、Hive CLI

1.启用 CLI

	HiveServer2 Beeline	HiveServer1 CLI
Connection	beeline -u beeline -u jdbc:hive2://localhost:10000	hive -h -p hive
Query	beeline -e beeline -f	hive -e hive -f

注意：beeline -u输入的所有SQL语句前面不能有空白符。
beeline -u 刚开始连接上的时候会因为Hadoop的安全模式或者服务的延迟导致开始可能会连接不上。
hive -e 适用于编写处理Hive的脚本，因为可以做临时连接(添加|删除分区…)

2.基本命令

!table					List Tables
!column 	List Columns
!sh ls					Run Shell CMD
dfs -ls ;				Run DFS CMD
!run 		Run SQL File
!dbinfo					Check Supports

3.数据类型(用于解析数据)

基础类型([]为较Mysql多出的)
	字符：char,varchar,[string]✔
	整数：tinyint,smallint,int✔,bigint
	小数：float,double,numeric(m,n),decimal(m,n)✔
	布尔：[boolean]✔
	日期：date✔(YYYY-mm-dd 必须完整),timestamp(ms为单位，也可解析具体到秒的日期和时间信息：2015-9-7 1:52:22)✔
复杂类型(支持泛型)
	数组：array => 用于处理同类型数据，对原始数据做结构化映射的(先升维才方便降维)
	键值对：map => 用于处理有稳定映射关系的数据
	结构体：struct => 用于处理无稳定映射关系的数据
	一般来说，键值对or结构体的键尽量简单，值可以有一定的复杂度。
嵌套复杂类型
	数组结构体
		array> => 
		[
		  {"name": "Alice", "age": 30},
		  {"name": "Bob", "age": 25},
		  {"name": "Charlie", "age": 35}
		]
特殊：
	01 => string(若设置为int，会自动去除前导零)
	2015-01 => date ❌(不完整) timestamp ❌(没有具体到秒) string ✔

4. 数据库

show databases;
create datebase if not exists yb12211;
use yb12211;
describe database yb12211;
alter database yb12211 set owner user dayongd;
drop datebase if exists yb12211;

5.数据表

A.建表操作

mkdir -p EXTERNAL_TABLE_DIR
hdfs dfs -put FILE_NAME EXTERNAL_TABLE_DIR
create [external] table if not exists TABLE_NAME(
	id int,
	name string,
	time bigint,
	isPartyMember boolean,
	expectSalary decimal(10,2),
	hobby array<string>,
	scores map<string,int>,
	address struct<province:string,city:string>
)
comment 'TABLE_USAGE'
PARTITIONED BY (partition_key STRING)
---	row format delimited
|		fields terminated by ','				字段分隔方式
|		collection items terminated by ';'		集合项分隔方式
|		map keys terminated by ':'				键值对分隔方式
|		lines terminated by '\n'				行间分隔方式(还可能有'\r\n','\t',' '...)
|	
---	row format serde 'CLASS_FULL_PATH'
	CSV(123,张三,1698376651212,true,26238.45)
		serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
		with serdeproperties(
			separatorChar=',',
			quoteChar='"',(用于包围数据字段，避免数据内的符号被视为分隔符)
			escapeChar='\\'(规避处理转义符)
		)
	regex
		serde 'org.apache.hadoop.hive.serde2.RegexSerDe'
		with serdeproperties(
			'input.regex'='^(\\d+),(.*?),(\\d+),(true|false),(\\d+).(\\d+\.?\\d+?)$'
		)
	json
		serde 'org.apache.hive.hcatalog.data.JsonSerDe'
	hbase
		serde 'org.apache.hadoop.hive.hbase.HBaseSerde'
		stored by 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
		with sederproperties(
		"hbase.columns.mapping"=":key,info:name,info:sex,info:age"
		)
		tblproperties("hbase.table.name"="test_serde");

stored as FILE_FORMAT(textfile|orc|parquet|sequencefile|JSONFile|CSV)	指定存储格式，文件的存储格式改变，可能要相应设置InputFormat和OutputFormat。
location 'EXTERNAL_TABLE_DIR'
tblproperties(
	'skip.header.line.count'='1'
	'skip.footer.line.count'='2'
	'related_sql_table' = 'my_sql_table'	将Hive表与另一个数据库的表`my_sql_table`相关联
);
load data [local] inpath 'FILEDIR' [overwrite] into table DB_NAME.TABLE_NAME;

行格式的用法

delimited：以特定分隔符分隔的数据，可处理复杂数据
	"123 Main St,Anytown,12345"
	"math:90,science:85,english:95"
Serde：不得已才用
	OpenCSVSerde：可以很好地处理包含引号和逗号的复杂 CSV 数据
				  不支持数据中有复杂的数据结构
		"Jane Doe","[email protected]","555-1234","Street 123, Some City"
		记忆：CSV格式要求
		表头(可选)
		CSV文件通常由多行组成，每行代表一个数据记录，字段内容可以包含在引号中(尤其是当字段值中包含分隔符时)
		字段之间通常用,进行分隔，行之间通常用换行符进行分隔
	RegexSerDe：适用于非标准或更复杂的文本数据格式和数据行中有较多无用数据的情况，通常面向日志
		"[INFO] 2023-11-15 09:00:00 - Task started"
	JsonSerDe：处理	json 格式的数据
		{"id": 2, "name": "Bob", "role": "Analyst", "salary": 50000}
		记忆：JSON格式要求
		键值对形式 + 字符串需用双引号括起来 + 逗号分隔
ROW FORMAT 
	便于对不同类型的数据进行建表，在采集数据到ODS的过程中发挥作用
LOAD
	上传的文件类型不重要
	LOCAL：有LOCAL表示文件位于Linux本地，执行后为拷贝数据
		   没有LOCAL表示文件位于HDFS中,执行后为直接移动数据
		   
	OVERWRITE：有OVERWRITE表示覆盖
			   没有OVERWRITE表示追加

LOAD DATA和LOCATION的区别
LOAD DATA：在hive312的目录下，将数据从文件系统(本地|HDFS)直接加载到Hive表中
	LOCAL INPATH	复制
	INPATH			移动
LOCATION：用于指定表的数据实际存储在哪个文件系统路径上
	
LOCAL INPATH 选择复制数据的原因是为了在本地文件系统下留存一份数据副本
INPATH 选择移动数据的原因是在HDFS中移动数据只设计元数据的更改，并且不涉及网络传输，效率更高。

常见函数

split("...",'SEPERATOR')				分隔
regexp_replace("...",'REGEX','REPLACE')	正则替换
explode(...)							列转行

先建表，再插入数据

INSERT INTO TABLE_NAME(FIELD1,FIELD2...)  SELECT ...

表结构和表数据一起创建

建表高阶语句(CTAS —— CREATE TABLE AS SELECT)
CTAS
CTAS 常用于筛选某表中的数据出来并作为新表的内容
CTAS 不能创建分区表、分桶表、外部表
eg:筛选2015年之前的数据作为新表

create table hive_ext_test_before2015 as
select * from hive_ext_regex_test1w
where year(order_time) <= 2015;

CTAS WITH CTE(WITH 作为数据来源)
eg:筛选2015年之前的全部数据和2015年之后男性中订单数超过5条记录或订单总金额超过50000的数据

CREATE TABLE hive_test_before2015_and_male_over5or5w_after2015 AS
WITH 
	before2015 AS (
		SELECT * FROM hive_ext_regex_test1w
		WHERE YEAR(order_time)<=2015
	),
	agg_male_over5or5w AS (
		SELECT user_id
		FROM hive_ext_regex_test1w
		WHERE YEAR(order_time)>2015 AND user_gender = '男'
		GROUP BY user_id
		HAVING COUNT(*) >= 5 OR SUM(order_amount) >= 50000
	),
	male_over5or5w AS (
		SELECT * FROM hive_ext_regex_test1w A
		INNER JOIN agg_male_over5or5w B
		ON A.user_id = B.user_id AND YEAR(A.order_time)>2015
	)
SELECT * FROM before2015 
UNION ALL
SELECT * FROM male_over5or5w;

CTL 完全复制表结构

CREATE TABLE employee_like LIKE employee;
					-- 有时还需要添加内容
INSERT INTO employee_like SELECT * FROM employee;

创建临时表
临时表只对当前session有效，session退出后自动删除
表空间位于/tmp/hive-(安全考虑)，根据Modify的时间查找对应的临时表文件。
如果创建的临时表和已创建的常规表表名相同，优先使用临时表

CREATE TEMPORARY TABLE TABLE_NAME(...) | AS SELECT ... ✔ | LIKE ...

创建视图
视图本质是一条复杂的公用的查询语句，实际上并不存储数据，查询视图实际上是在查询背后的基础表。

DROP VIEW IF EXISTS hive_view_test2020
CREATE VIEW IF NOT EXISTS hive_view_test2020 AS SELECT * FROM hive_ext_regex_test1w
WHERE year(order_time)=2020;

CTE & TEMPORARY TABLE & View 的区别

View ：简化复杂查询
TEMPORARY TABLE : 短期数据处理复杂查询的中间结果预聚合数据存储
CTE : 单词查询使用。

B. 删除/修改表

DROP TABLE IF EXISTS employee [WITH PERGE];
With PERGE直接删除（可选），否则会放到 .Trash目录
TRUNCATE TABLE employee;
清空表数据
			
修改表是可以在创建表之后进行追加描述的。
ALTER TABLE employee RENAME TO new_employee;(修改表名，常用于数据备份)
ALTER TABLE c_employee SET TBLPROPERTIES ('key'='value');
常见的表属性
	'comment'：用于提供关于表的描述性注释。
	'serde'：指定用于序列化和反序列化数据的序列化/反序列化器。
	'location'：指定表的物理存储位置。
	'inputformat'：指定输入数据的格式。
	'outputformat'：指定输出数据的格式。
	'external'：指示表是否为外部表（外部表的数据存储在外部位置，不受表删除操作的影响）。
	...(可设置的表属性一般可通过DESCRIBE FORMATTED TABLE_NAME查看)
	key不一定已存在：可以新建属性，也可以对已有属性进行修改。
ALTER TABLE employee_internal SET SERDEPROPERTIES ('field.delim' = '$');
ALTER TABLE c_employee SET FILEFORMAT RCFILE; -- 修正表文件格式
通常用于拉链表的情况
-- 修改表的列操作
ALTER TABLE employee_internal CHANGE old_name new_name STRING; -- 修改列名
ALTER TABLE c_employee ADD COLUMNS (work string); -- 添加列
ALTER TABLE c_employee REPLACE COLUMNS (name string); -- 替换

C.查看表信息

show tables;							查看所有表
SHOW TABLES LIKE 'TABLE_NAME'			快速检查是否存在某表
desc inner_tab_employee;				查看表结构（字段名称、类型等）
desc formatted inner_tab_employee;		获取表的详细信息（包括分区信息、字段信息、表属性、存储信息等）
show create table inner_tab_employee;	获取创建表的完整SQL语句

D.分区表

定义：partitioned by(PAR_FIELD_NAME DATA_TYPE, …)
数据:

drop table if exists hive_internal_par_ext_regex_test1w;
create table if not exists hive_internal_par_ext_regex_test1w(
	user_id int,
	user_gender string,
	order_time timestamp,
	order_amount decimal(10,2)
)
partitioned by (year int)
row format delimited
fields terminated by ','
stored as textfile;

静态分区
1. 简单文本处理：
– 从文件中筛选2012年的数据
cat test1w.log | awk ‘/2012-/{print $0}’>test2012.log
– 将该数据上传到该表的2012年的分区下
load data local inpath ‘/root/hive/data/course/test2012.log’
overwrite into table hive_internal_par_ext_regex_test1w partition(year=2012);
2. 复杂数据处理：
INSERT OVERWRITE TABLE sales PARTITION(year=2023, month=3)
SELECT …
FROM another_table
WHERE …

动态分区优先级
SET hive.exec.dynamic.partition = true; – 1.会话 ✔
SET hive.exec.dynamic.partition.mode = nonstrict;
hive-site.xml – 2.个性化配置
hive-default.xml – 3.为所有配置项提供默认配置

INSERT OVERWRITE TABLE hive_internal_par_ext_regex_test1w PARTITION (year) 
SELECT *, year(order_time) FROM hive_ext_regex_test1w where year(order_time)>=2014;
(RegexSerDe不适用)
(分区字段除了可以从源表中获取，也可以从计算字段中获取 PARTITION(`year`) <=> `year(order_time)` )

虚拟分区的创建：只能使用动态分区的语法，并且需要指定值。
动态分区和静态分区的区别：
静态分区：
分区键值必须在插入数据时明确指定
可以向一个分区内导入数据
动态分区：
分区键值在插入数据时动态指定
可以向多个分区内导入数据

查看分区信息
	SHOW PARTITIONS TABLE_NAME;
手动添加分区
	ALTER TABLE hive_internal_par_ext_regex_test1w ADD PARTITION(year=2021);
	可以将符合数据结构的文件直接放到分区的路径下，从而实现分区数据的添加。
手动删除分区
	ALTER TABLE hive_internal_par_ext_regex_test1w DROP PARTITION(year=2021);

eg：设置一个定时任务，定时删除三年前同月份的分区，并添加当年新月份的数据(一个月结束之后才能获取到该月完整的分区数据)

dt=$(date -d '-1 month' '+%F')
del_year=$(date -d "$dt -3 year" '+%Y')
del_month=$(date -d "$dt -3 year" '+%m')
add_year=$(date -d '+%Y')
add_month=$(date -d '+%m')
hive -e "ALTER TABLE hive_internal_par_ext_regex_test1w DROP PARTITION(year=$del_year,month=$del_month);"
if [ $? -eq 0 ];then
	echo "SUCCESS TO DROP PREVIOUS PARTITION"
else
	echo "FAIL TO DROP PREVIOUS PARTITION"
fi
hive -e "ALTER TABLE hive_internal_par_ext_regex_test1w ADD PARTITION(year=$add_year,month=$add_month);"
if [ $? -eq 0 ];then
	echo "SUCCESS TO ADD NEW PARTITION"
else
	echo "FAIL TO ADD NEW PARTITION"
fi

E.分桶表

clustered by (FIELD_NAME) INTO 2 BUCKETS
			create table if not exists hive_internal_par_cluster_ext_regex_test1w(
				user_id int,
				user_gender string,
				order_time timestamp,
				order_amount decimal(10,2)
			)
			partitioned by (year int)
			clustered by (order_time) into 4 buckets 
			row format delimited
			fields terminated by ','
			stored as textfile;
			
			INSERT OVERWRITE TABLE hive_internal_par_cluster_ext_regex_test1w PARTITION(year)
			SELECT *, year FROM hive_ext_regex_test1w where year(order_time)>=2014;
	
			分桶抽样
			随机抽样基于随机列
				SELECT * FROM TABLE_NAME TABLESAMPLE(BUCKET 3 OUT OF 4 ON rand()) s;
			随机抽样基于指定列(使用分桶列更高效)
				SELECT * FROM TABLE_NAME TABLESAMPLE(BUCKET 3 OUT OF 32 ON id) s;
			
			** 基于随机列和指定列的区别：
			基于随机列的抽样提供了数据的随机和均匀代表性，适合于需要估计整个数据集的参数时。
			基于指定列的抽样则适用于对数据集的特定部分感兴趣的情况，例如分析特定区域的销售数据或特定时间段的用户行为。
			
			** 如何理解`BUCKET x OUT OF y`？
			即将原本的桶分成y份后的顺序的第x个。
			假设Num Buckets=4，x=2,y=8，明显桶的份数不够8份，因此将4个桶切分为8份，并且获取到第二份的数据。
			![bucket抽样](./assets/bucket%E6%8A%BD%E6%A0%B7.png)
			bucket的顺序是A1，B1 , C1 , D1 , A2 , B2 , C2 , D2
			假设y<Num Buckets，那么直接假设合并即可。

			未抽样数据：		抽样数据：
			2014,945			2014,234
			2015,931			2015,210
			2016,858	1/4		2016,205
			2017,909	===>	2017,220 ===> 对每个分区数据进行抽样
			2018,911			2018,224	
			2019,928			2019,224
	
		临时表
		如何判断该表是否为临时表？
			通过命名看出来，如果有_tmp_的命名则是临时表；
			SHOW CREATE TABLE TABLE_NAME;

		使用环境：
			Hive UI
				Tableau(数据呈现),Zeppelin(交互)

你可能感兴趣的:(hive,笔记,hadoop)

10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
为什么你总是对下属不满意? ZhaoWu1050
【ZhaoWu的听课笔记】大多数公司，都存在两种问题。我创业四年，更是体会深切。这两种问题就是：老板经常不满意下属的表现；下属总是不知道老板想要什么；虽然这两种问题普遍存在，其实解决方法并不复杂。这节课，我们再聊聊第一个问题：为什么老板经常不满意下属表现?其实，这背后也是一条管理常识。管理学家德鲁克先生早就说过：管理者的任务，不是去改变人。*来自《卓有成效的管理者》只是大多数老板和我一样，都是一边
母亲节如何做小红书营销美橙传媒
小红书的一举一动引起了外界的高度关注。通过爆款笔记和流行话题，我们可以看到“干货”类型的内容在小红书中偏向实用的生活经验共享和生活指南非常受欢迎。根据运营社的分析，这种现象是由小红书用户心智和内容社区背后机制共同决定的。首先，小红书将使用“强搜索”逻辑为用户提供特定的“搜索场景”。在“我必须这样生活”中，大量使用了满足小红书站用户喜好和需求的内容。内容社区自制的高质量内容也吸引了寻找营销新途径的品
读书笔记|《遇见孩子，遇见更好的自己》5 抹茶社长
为人父母意味着放弃自己的过去，不要对以往没有实现的心愿耿耿于怀，只有这样，孩子们才能做回自己。985909803.jpg孩子在与父母保持亲密的同时更需要独立，唯有这样，孩子才会成为孩子，父母才会成其为父母。有耐心的人生往往更幸福，给孩子留点余地。认识到养儿育女是对耐心的考验。为失败做好心理准备，教会孩子控制情绪。了解自己的底线，说到底线，有一点很重要，父母之所以发脾气，真正的原因往往在于他们自己，
基于Python给出的PDF文档转Markdown文档的方法程序媛了了 python pdf 开发语言
注：网上有很多将Markdown文档转为PDF文档的方法，但是却很少有将PDF文档转为Markdown文档的方法。就算有，比如某些网站声称可以将PDF文档转为Markdown文档，尝试过，不太符合自己的要求，而且无法保证文档没有泄露风险。于是本人为了解决这个问题，借助GPT（能使用GPT镜像或者有条件直接使用GPT的，反正能调用GPT接口就行）生成Python代码来完成这个功能。笔记、代码难免存在
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
Armv8.3 体系结构扩展--原文版代码改变世界ctw ARM-TEE-Android armv8 嵌入式 arm架构安全架构芯片 Trustzone Secureboot
快速链接:.ARMv8/ARMv9架构入门到精通-[目录]付费专栏-付费课程【购买须知】:个人博客笔记导读目录(全部)TheArmv8.3architectureextensionTheArmv8.3architectureextensionisanextensiontoArmv8.2.Itaddsmandatoryandoptionalarchitecturalfeatures.Somefeat
springboot+vue项目实战一-创建SpringBoot简单项目苹果酱0567 面试题汇总与解析 spring boot 后端 java 中间件开发语言
这段时间抽空给女朋友搭建一个个人博客，想着记录一下建站的过程，就当做笔记吧。虽然复制zjblog只要一个小时就可以搞定一个网站，或者用cms系统，三四个小时就可以做出一个前后台都有的网站，而且想做成啥样也都行。但是就是要从新做，自己做的意义不一样，更何况，俺就是专门干这个的，嘿嘿嘿要做一个网站，而且从零开始，首先呢就是技术选型了，经过一番思量决定选择-SpringBoot做后端，前端使用Vue做一
阅读《认知觉醒》读书笔记就看看书
本周阅读了周岭的《认知觉醒开启自我改变的原动力》，启发较多，故做读书笔记一则，留待学习。全书共八章，讲述了大脑、潜意识、元认知、专注力、学习力、行动力、情绪力及成本最低的成长之道。具体描述了大脑、焦虑、耐心、模糊、感性、元认知、自控力、专注力、情绪专注、学习专注、匹配、深度、关联、体系、打卡、反馈、休息、清晰、傻瓜、行动、心智宽带、单一视角、游戏心态、早起、冥想、阅读、写作、运动等相关知识点。大脑
阅读笔记：阅读方法中的逻辑和转念施吉涛
聊聊一些阅读的方法论吧，别人家的读书方法刚开始想写，然后就不知道写什么了，因为作者写的非常的“精致”我有一种乡巴佬进城的感觉，看到精美的摆盘，精致的食材不知道该如何下口也就是《阅读的方法》，我们姑且来试一下强劲的大脑篇，第一节：逻辑通俗的来讲，也就是表达的排列和顺序，再进一步就是因果关系和关联实际上书已经看了大概一遍，但直到打算写一下笔记的时候，才发现作者讲的推理更多的是阅读的对象中呈现出的逻辑也
《转介绍方法论》学习笔记小可乐的妈妈
一、高效转介绍的流程：价值观---执行----方案一）转介绍发生的背景：1、对象：谁向谁转介绍？全员营销，人人参与。①员工的激励政策、客户的转介绍诱因制作客户画像：a信任；支付能力；意愿度；便利度（根据家长具备四个特征的个数分为四类）B性格分类C职业分类D年龄性别②执行：套路，策略，方法，流程2、诱因：为什么要转介绍？认同信任；多方共赢；传递美好；零风险承诺打动人心，超越期待。选择做教育，就是选择
JAVA学习笔记之23种设计模式学习 victorfreedom Java技术设计模式 android java 常用设计模式
博主最近买了《设计模式》这本书来学习，无奈这本书是以C++语言为基础进行说明，整个学习流程下来效率不是很高，虽然有的设计模式通俗易懂，但感觉还是没有充分的掌握了所有的设计模式。于是博主百度了一番，发现有大神写过了这方面的问题，于是博主迅速拿来学习。一、设计模式的分类总体来说设计模式分为三大类：创建型模式，共五种：工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式，共七种：适配器
解决Obsidian写笔记中的＜img＞标签无法显示图片的问题全能全知者笔记
Obsidian中写md笔记如果使用标签会显示不出图案，后来才知道因为Obsidian的问题导致只能用绝对路径定位。所以我本人写了一个py插件，将md笔记里的img标签批量替换成Obsidian能够读取的形式。安装FixObsImgDpy:pipinstallFixObsImgDpy安装完成后在需要修复的md文件的父目录下运行命令:FixObsImgDpy就会自动修复父目录以下的全部md文件仓库
2021年周总结 03 Ruby之家
这周的生活过得也是比较快，因为暂时住的离公司有点距离，所以通勤时间相对较长一点，而在地铁上的一个半小时如何充分利用起来，则是我最近一直在思考的问题，2021年想让自己的生活都运行在计划中。(有时候自己想干一件事情就总是给自己找很多借口，想着以后怎么怎么样？然而哪有那么多的以后，能够方便当下的工作生活就立马执行就OK，这仅仅只是我此时想到背的很重的老人机笔记本电脑，也算是陪伴我快8年的—当时买的时候
浅谈MapReduce Android路上的人 Hadoop 分布式计算 mapreduce 分布式框架 hadoop
从今天开始，本人将会开始对另一项技术的学习，就是当下炙手可热的Hadoop分布式就算技术。目前国内外的诸多公司因为业务发展的需要，都纷纷用了此平台。国内的比如BAT啦，国外的在这方面走的更加的前面，就不一一列举了。但是Hadoop作为Apache的一个开源项目，在下面有非常多的子项目，比如HDFS，HBase,Hive，Pig,等等，要先彻底学习整个Hadoop，仅仅凭借一个的力量，是远远不够的。
2021-12-11 人生导演
今天读到佛学书籍的一段话：初学者很难直接体验到无我，但可以经常提醒自己：一切事物都是无我的。不断强化这个观念，也会相当有帮助。比如生病了我们一般会说：“我不舒服！我很痛！我很惨！”这时候如果我们提醒自己：没有我，只是这个肉体的某些部分、某些功能出了问题，不舒服、疼痛也只是一时的感受，而感受随时在变化。仅仅是知道没有一个实存的我在生病、在受苦。然后把“一切事物都是无我的”这句话，记到笔记上，并且朗读
新能源汽车 BMS 学习笔记篇—BMS 基本定义及分类 WPG大大通其他笔记汽车 BMS 经验分享新能源电池
一、BMS定义1、概念：BMS（BatteryManagementSystem）即电池管理系统，其管理对象是二次电池（充电电池或蓄电池），其主要目的是电池的利用率，防止电池出现过度充电和过度放电，可应用于电动汽车、电瓶车、机器人、无人机等图片来源：腾讯网https://new.qq.com《标准普尔警告，电动汽车电池生产面临供应链和地缘政治风险》2、四大功能①感知和测量：检测电池的电压、电流、温度
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_