妖精小狗

Apache Hive进阶实战

Udf 单行函数：一行输入一行输出

Udaf 多行函数：多行输入一行输出

Udtf 用户表函数：一行输入多行输出，主要用在侧视图

Hive视图概述：

视图是一个元数据，只能在MySQL DataStore中找到

视图是一种逻辑结构，通过在虚拟表中隐藏子查询、连接和函数来简化查询，数据查询的快捷方式，把复杂的查询放在view里

Hive视图不存储数据或获得物化

一旦创建了视图，它的模式就会立即冻结，元数据就会被存起来，查询才能显示出来

如果删除或更改了基础表，则查询视图将失败

视图是只读的，不能用作加载/插入/修改的目标，只能进行查询

Hive视图常用操作：

建立视图：CREATE VIEW view_name AS SELECT statement;

建立视图支持：CTE，ORDER BY，LIMIT，JOIN等等

查找视图用：SHOW TABLES; （hive v2.2.0之后才支持SHOW VIEWS）

显示View定义用：SHOW CREATE TABLE view_name;

删除视图：DROP view_name;

更改视图属性：ALTER VIEW view_name SET TBLPROPERTIES ('comment' = 'This is a view');

更改视图定义：ALTER VIEW view_name AS SELECT statement;

显示表的格式属性：SHOW TABLE FORMATE;

使用show views查看是否支持该命令，不支持的话就使用SHOW CREATE TABLE ，desc formatted tablename; 可以查看表的格式和详细信息，这里可以得到Table Type ，也可以得到表的location。 根据Table Type值可以知道表是内部表还是外部表。是表还是视图。

Hive侧视图：

应用表生成函数，将函数的输入和输出连接在一起

即使输出为空，LATERAL VIEW OUTER也会生成结果

支持多个水平

SELECT * FROM table_name

LATERAL VIEW explode(col1) myTable1 AS myCol1

LATERAL VIEW explode(myCol1) myTable2 AS myCol2;

通常用于规范化行或JSON解析器

select * from work lateral view outer explode(split(null, ',')) a as loc;

explode会把这个数组拆成多个行

使用outer关键字可以把null也输出出来

Complier 编译器 compile（编译）

Optimizer 优化器

Executor 执行器

Hive SELECT（数据映射）：

SELECT语句用于项目符合WHERE/JOIN指定的查询条件的行

Hive SELECT语句是数据库标准SQL的子集

SELECT 1; //直接返回这个常量，可以测试自定义函数

SELECT [DISTINCT] column_nam_list FROM table_name;

//仅从 "table_name" 表的 "column_name, column_name" 列中选取唯一不同的值，也就是去掉 "column_name, column_name" 列中的重复值。

//在表中，一个列可能会包含多个重复值，但有时希望仅仅列出不同（distinct）的值。

SELECT * FROM table_name;

SELECT * FROM employee LIMIT 5;

//限制返回的行数

CTE：WITH t1 AS (SELECT …) SELECT * FROM t1

CTE就是CTAS加上WITH，子查询嵌套使用Common Table Expression，把查询写的更清楚

CREATE TABLE cte_employee AS WITH

r1 AS (SELECT name FROM r2 WHERE name = 'Michael'),

r2 AS (SELECT name FROM employee WHERE sex_age.sex= 'Male'),

r3 AS (SELECT name FROM employee WHERE sex_age.sex= 'Female')

SELECT * FROM r1 UNION ALL SELECT * FROM r3;

嵌套查询：SELECT * FROM (SELECT * FROM employee) a;（后面一定要加别名，否则会报错）

Hive SELECT in Advance（进阶语句）

正则表达式列规范

SET hive.support.quoted.identifiers = none;（设置好就能使用了）

SELECT `^o.*` FROM offers;

虚拟列（两个连续下划线，对数据验证有用）

INPUT__FILE__NAME，这是映射器任务的输入文件的名称（文件地址）

BLOCK__OFFSET__INSIDE__FILE，它是当前的全局文件（块大小）

Hive中JOIN概述：

JOIN语句用于将两个或多个表中的行组合在一起，join要有关联条件

Hive JOIN语句类似于数据库连接，Hive不支持不平等连接，join的表的column要相等

INNER JOIN，OUTER JOIN（RIGHT JOIN，LEFT JOIN， FULL OUTER JOIN）其中的OUTER可以省略掉，CROSS JOIN（完全连接，在两个表没有相同元素时使用，或者使用：笛卡儿积/JOIN ON 1=1），隐藏JOIN（INNER JOIN不使用JOIN关键字但是使用where和逗号，来分割表），但是如果两个表都有100行，同时查询就会一口气查10000行数据。

JOIN用在WHERE子句之前

Area C = Circle1 JOIN Circle2

Area A = Circle1 LEFT OUTER JOIN Circle2

Area B = Circle1 RIGHT OUTER JOIN Circle2

AUBUC = Circle1 FULL OUTER JOIN Circle2

求A和B异差集的方法

求A和B右连接A为null的部分，UNION上A和B左连接B为null的部分

Inner JOIN, select * from a join b on a.k = b.k

Implicit JOIN, select * from a, b where a.k = b.k

Outer JOIN, select * from a left join b where a.k = b.k

Cross JOIN, select * from a join b where 1 = 1

Inequality JOIN （2.2.0之后的版本支持）【异差集】

Hive中MAPJOIN：

必须是一个大表JOIN一个小表，把小表的数据进行一个复制，把小表复制多份放到大表所在的节点上，把小表数据在大表上过滤一遍

MAPJOIN语句意味着只通过map执行连接，而不执行reduce作业

MAPJOIN语句将所有数据从小表读入内存并广播到所有映射

一旦设置hive.auto.convert.join = true，Hive自动转换JOIN成为MAPJOIN如果可能的话，在运行时检查MAPJOIN hint，这是默认的

SELECT /*+ MAPJOIN(employee) */ emp.name, emph.sin_number

FROM employee emp JOIN employee_hr emph ON emp.name = emph.name;

MAPJOIN操作符不支持以下操作：

在UNION ALL, LATERAL VIEW, GROUP BY/JOIN/SORT BY/CLUSTER BY/DISTRIBUTE BY后面使用MAPJOIN

不能在UNION, JOIN和其他MAPJOIN后面使用MAPJOIN

Hive集合操作Union：

UNION ALL，合并后保留副本

UNION，删除重复，自v1.2.0以来的支持

可以在顶层查询中使用

所有子集数据必须具有相同的名称和类型。否则，将执行隐式转换，并且可能存在运行时异常。

ORDER BY、SORT BY、CLUSTER BY、distribution BY或LIMIT用于union后的整个结果

select key from (select key from src1 order by key limit 10) sub union all

select key from src2 order by key limit 10

如果在union之前排序要用子查询的形式加上()进行order by

Hive中集合的其他操作：

其他set操作符可以使用JOIN/OUTER JOIN来实现

MINUS（集合和集合之间求子集）：

SELECT a.name

FROM employee a

LEFT JOIN employee_hr b

ON a.name = b.name

WHERE b.name IS NULL;

INTERCEPT（集合和集合之间求交集）：

SELECT a.name

FROM employee a

JOIN employee_hr b

ON a.name = b.name;

Hive中使用LOAD进行移动数据：

要在Hive中移动数据，它使用LOAD关键字。当不适用LOCAL字段时，移动到这里意味着原始数据被移动到目标表/分区，并且不再存在于原始位置。

不太推荐使用，不是标准的hive语句，load不能重复运行，只是进行文件转移，并没有进行块操作

load data local inpath '/tmp/hivedemo/data/employee2.txt' overwrite into table employee_external;

load data inpath '/tmp/hivedemo/data/employee2.txt' overwrite into table employee_external;

LOCAL指定文件位于主机中，当使用LOCAL时而且本地文件不会被删除

不当不适用LOCAL在HDFS中进行操作时，本质就是把路径改变，并不是把文件的储存位置改变

OVERWRITE覆盖用于决定是否追加或替换现有数据，加就是清空，不加就是不清空

Hive中表插入要点：

要将数据插入表/分区，Hive使用insert语句

INSERT比DBMS中的INSERT弱

INSERT支持OVERWRITE和INTO语法（但是使用OVERWRITE不能指定具体列了）

Hive支持从同一个表中插入多个数据

TABLE关键字在INSERT INTO中是可选的，但是建议写出来

INSERT INTO、可以像INSERT INTO T (z, x, c1)插入到T (z, x, c1)

INSERT INTO table_name VALUES，支持插入值列表

所有数据插入必须具有相同数量的指定列，或在未指定时具有相同数量的所有列

示例：

Hive中文件插入要点

要将数据插入/导出文件，Hive还使用insert语句

文件插入只支持OVERWRITE

Hive支持从同一个数据源/表进行多次插入

LOCAL关键字支持写入本地文件系统。

默认情况下，写入的数据为文本，列之间以^A和行换行隔开。如果任何列不是基元类型，则将这些列序列化为JSON。

支持行格式导出文件到不同的格式CSV，JSON等。

示例：

Hive中的数据交换[EX|IM]PORT

IMPORT和EXPORT语句用于数据迁移（是Hive和Hadoop之间的导入和导出）

所有数据和元数据在没有数据库的情况下导出/导入

EXPORT语句在名为_metadata的文件中导出名为data和metadata的子目录中的数据

EXPORT TABLE employee TO '/tmp/output3';

EXPORT TABLE employee_partitioned partition (year=2014, month=11) TO '/tmp/output5';

EXPORT之后，我们可以手动将导出的文件复制到其他HDFS。然后，使用import语句导入它们

IMPORT TABLE empolyee_imported FROM '/tmp/output3';

IMPORT TABLE employee_partitioned_imported FROM '/tmp/output5’;

Hive分类数据ORDER BY：

ORDER BY (ASC|DESC)类似于标准SQL

ORDER BY仅使用一个reducer执行全局数据排序。

虽然ORDER BY很慢，我们应该尽早放置过滤器

ORDER BY支持使用CASE WHEN或表达式

ORDER BY支持设置这个位置参数：

set hive.groupby.ordervy.position.alias = true;

排序时使用select * from b order by case when num is null then 101 else num end;或者select * from b order by nvl(num,101);来把数据库里null排到最后

Hive排序数据—SORT BY：

SORT BY（ASC|DESC）决定如何排序每个reducer中的数据，是每一个reduce内部的排序

当reducer的数量设置为1时，它等于ORDER BY

SORT BY通常不单独使用

by列后面的字段必须出现在SELECT列的列表中（*字标签是可以的）

有1个以上的reducer时，数据排序不正确，因为每一个reduce都进行SORT BY合起来可能就不正确了

例如：SET mapred.reduce.tasks = 2;【这个在select中可以用，但是insert中就不能用了】

Hive排序数据—DISTRIBUTE BY：

DISTRIBUTE BY类似于标准SQL中的GROUP BY语句

它确保具有匹配列值的行将被分区到相同的简化程序中

它不对每个reduce的输出进行排序

它通常使用在SORT BY语句之前（partition => reducer）

by列必须出现在SELECT列列表中（*字标签是可以的）

示例：（绩效评估典型应用）

SELECT department_id , name, employee_id, evaluation_score

FROM employee_hr DISTRIBUTE BY department_id SORT BY evaluation_score DESC;

因为使用DISTRIBUTE BY + SORT BY会快一些

DISTRIBUTE BY决定了数据按什么划分，SORT BY在同一个地方进行局部排序，因为在这个例子里不同部门进行排序是没有意义的

Hive排序数据—CLUSTER BY：

CLUSTER BY = DISTRIBUTE BY + SORT BY在同一列

CLUSTER BY不支持ASC | DESC

by列必须出现在SELECT列列表中（*字标签是可以的）

为了充分利用所有的reducer方法进行全局排序，我们可以先使用CLUSTER BY，然后再使用ORDER BY。

示例：

SELECT name, employee_id FROM employee_hr CLUSTER BY name;

SELECT后应用所有排序语句。

如果在select中使用别名，应该在order之后使用别名

最常用的是order by，应用范围比较广，它是全局排序，只用到一个reduce，但是有的时候需求是不需要统一进行排序的，比如比赛的排名只要求单项比赛的排名就可以；因为剩下两个都需要对数据非常了解，如果要用其他的记得先用DISTRIBUTE BY，查看数据之后再使用ORDER BY

而CLUSTER BY理论上讲速度可以比ORDER BY快，但是ORDER BY适用场合比较多

Hive分组GROUP BY

Hive的基本内置聚合函数通常和GROUP BY子句一起使用

如果没有指定GROUP BY子句，默认情况下，它将聚合整个表。

除了聚合函数外，所选的所有其他列也必须包含在GROUP BY中

select afferId, max(offervalue) from offers group by category;

offerId也必须放到group by里面

GROUP BY支持使用CASE WHEN或表达

GROUP BY 支持位置number：hive.groupby.orderby.position.alias = true

Hive的聚合条件HAVING：

自从Hive 0.7.0，所以添加了have来支持GROUP BY的聚合结果的条件过滤

通过使用HAVING，我们可以避免在GROUP By之后使用子查询

HAVING之后，我们也可以使用表达式，但不建议这样使用

并且HAVING可以替代WHERE但是也不建议这么做，因为这不是一种高效的写法

HAVING更擅长在使用function的时候使用，也就是聚合条件的时候，但是普通条件用WHERE就可以，而且WHERE不能用在聚合函数上

Hive基本聚合：

我们经常使用内置的聚合函数来进行数据聚合

聚合总是与GROUP BY一起使用

聚合函数可以应用于列或表达式

没有GROUP BY，聚合GROUP BY所有列

GROUP BY之后的列必须在SELECT列列表中（因为select选出的数据可能会有重复如果不加Group就不能正常计算出）

在NULL上的聚合为0，选择count(NULL) = 0

没有两个聚合可以具有不同的列

SELECT count(DISTINCT col1), count(DISTINCT col2) FROM test GROUP BY col3;（不允许）

SELECT count(DISTINCT col1), sum(DISTINCT col1) FROM test GROUP BY col3; （允许）

注意一些函数

Max，min，count，sum，avg

max(distinct col)，avg(distinct col)等等

collect_set，collect_list（返回每个组列中的对象集/列表）

Hive高级聚合—GROUPING SETS：

GROUP BY中的groups SETS子句允许我们指定多余一个的记录集中的GROUP BY选项 = GROUP BY UNION GROUP BY…

使用GROUPING SETS分组集聚合查询

具有GROUP BY的等效聚合查询

SELECT a, b, SUM( c ) FROM tab1

GROUP BY a, b

GROUPING SETS ((a, b), a, b, ( ))

SELECT a, b, SUM( c ) FROM tab1 GROUP BY a, b UNION

SELECT a, null, SUM( c ) FROM tab1 GROUP BY a, null

UNION

SELECT null, b, SUM( c ) FROM tab1 GROUP BY null, b

UNION

SELECT null, null, SUM( c ) FROM tab1

SELECT a, b, SUM( c ) FROM tab1

GROUP BY a, b GROUPING SETS ( (a,b), a)

SELECT a, b, SUM( c ) FROM tab1 GROUP BY a, b UNION

SELECT a, null, SUM( c ) FROM tab1 GROUP BY a

SELECT a, b, SUM(c) FROM tab1

GROUP BY a, b GROUPING SETS ( (a,b) )

SELECT a, b, SUM(c) FROM tab1 GROUP BY a, b

SELECT a,b, SUM( c ) FROM tab1

GROUP BY a, b GROUPING SETS (a,b)

SELECT a, null, SUM( c ) FROM tab1 GROUP BY a UNION

SELECT null, b, SUM( c ) FROM tab1 GROUP BY b

Hive高级聚合—CUBE|ROLLUP

一般的语法是GROUP BY WITH CUBE/ROLLUP

CUBE创造了多维数据集在其参数中创建列集的所有可能组合的求部分和。一旦我们在一组维度上计算了一个CUBE，我们就可以得到这些维度上所有可能的聚合问题的答案，所有组合都表达出来

ROLLUP子句用于在维度的层次结构级别上计算聚合

使用ROLLUP/CUBE聚合查询

具有GROUP BY的等效聚合查询

SELECT a, b, SUM( c ) FROM tab1

GROUP BY a, b, c WITH CUBE

SELECT a, b, SUM( c ) FROM tab1

GROUP BY a, b, c GROUPING SETS

( (a, b, c), (a, b), (b, c), (a, c), (a), (b), (c), ( ))

SELECT a, b, SUM( c ) FROM tab1

GROUP BY a, b, c WITH ROLLUP

SELECT a, b, SUM( c )

FROM tab1 GROUP BY a, b, c

GROUPING SETS ( (a, b, c), (a, b), (a), ( ))

Hive窗口功能概述：

SYNTAX (语法解析)

排序：ROW_NUMBER，RANK，DENSE_RANK，NLITE，ERCENT_RANK

聚合：COUNT，SUM, AVG，MAX，MIN

分析：CUME_DIST，LEAD，LAG，FIRST_VALUE，LAST_VALUE

WINDOW clause（窗口的定义）

Case Study（案例分析）

Hive窗口功能语法：

自Hive 0.11.0添加之后，Hive window函数是一组特殊的函数，它扫描多个输入行来计算每个输出值。

解析函数功能强大，不受GROUP BY的限制

语法解析

Function (arg1,..., arg n) OVER ([PARTITION BY <...>] [ORDER BY <....>] [])

PARTITION BY类似于GROUP。如果没有分区，就全部分区

如果没有ORDER BY，则无法定义window_clause

windows_clause不常用, 但功能很强

过滤其结果必须在外面一层

可同时用多个函数

窗口排序功能—排序类：

ROW_NUMBER：一个惟一的编号在结果集中每一行基于PARTITION内的ORDER BY子句（1234）

RANK：相等的行用相同的数字排序（11144）

DENSE_RANK：在普通的RANK函数中，我们可以看到行数之间的差距。DENSE_RANK是一个没有间隙的函数。（11122）

NLITE：它将有序数据集划分为桶数，并为每一行分配适当的桶数。它可以用于将行分割成相等的集合，并为每一行分配一个数字。

PERCENT_RANK：(目前排名- 1)/(总行数- 1)。因此，它返回一个值相对于一组值的百分比等级(%)。

示例：

SELECT name, dept_num, salary,

ROW_NUMBER() OVER () AS row_num,

//写出这是第几列

RANK() OVER (PARTITION BY dept_num ORDER BY salary) AS rank,

//按照工资大小排列返回具体第几

DENSE_RANK() OVER (PARTITION BY dept_num ORDER BY salary) AS dense_rank,

//和单独的rank有区别，没有相同排名之后造成的差

PERCENT_RANK() OVER(PARTITION BY dept_num ORDER BY salary) AS percent_rank,

//相对排序(目前排名- 1)/(总行数- 1)显示的是百分比

NTILE(2) OVER(PARTITION BY dept_num ORDER BY salary) AS ntile

//分成两个桶，按照部门分区，salary进行排序

FROM employee_contract

ORDER BY dept_num, salary;

窗口聚合函数—聚合类：

COUNT：计数，可以和DISTINCT一起用，从v2.1.0开始没有ORDER BY和window_cause。完全支持v2.2.0。

SELECT COUNT(DISTINCT a)

OVER (PARTITION BY c ORDER BY d ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING)

FROM T

SUM：聚合，

AVG ： 均值

MAX／MIN：最大／小值

从Hive 2.1.0开始在OVER子句支持中聚合函数

SELECT rank() OVER (ORDER BY sum(b)) FROM T GROUP BY a;

示例：

SELECT name, dept_num, salary,

COUNT(*) OVER (PARTITION BY dept_num) AS row_cnt,

//不支持GROUP BY

//COUNT(DISTINCT *) OVER (PARTITION BY dept_num) AS row_cnt_dis,

SUM(salary) OVER(PARTITION BY dept_num ORDER BY dept_num) AS deptTotal,

//各个部门的工资和

SUM(salary) OVER(ORDER BY dept_num) AS runningTotal1,

//进行但是在部门层次上进行工资相加

SUM(salary) OVER(ORDER BY dept_num, name rows unbounded preceding) AS runningTotal2,

// 用name作为一个边界成为一个窗口函数

AVG(salary) OVER(PARTITION BY dept_num) AS avgDept,

//部门间的均值

MIN(salary) OVER(PARTITION BY dept_num) AS minDept,

//部门间的最小值

MAX(salary) OVER(PARTITION BY dept_num) AS maxDept

//部门间的最大值

FROM employee_contract

ORDER BY dept_num, name;

//其实总体的这个ORDER BY并不起什么作用，主要还是窗口函数里面的ORDER BY起作用

窗口分析函数—分析类：

CUME_DIST：(行数<=当前行)/(总行数)

LEAD／LAG：lead/lag(value_expr [,offset[,default]])，用于返回下一行/上一行数据。可以选择指定行数（value_expr）。如果未指定行数（偏移量），则默认为一行。如果未指定默认值，则返回[,default]或null。

FIRST_VALUE：它从有序集返回第一个结果。

LAST_VALUE：它返回有序集的最后一个结果。

示例：

SELECT name, dept_num, salary,

LEAD(salary, 2) OVER(PARTITION BY dept_num ORDER BY salary) AS lead,

//把salary的行数向前移动两行，以部门分组，就是把每组的数据各自向前移动两行

LAG(salary, 2, 0) OVER(PARTITION BY dept_num ORDER BY salary) AS lag,

//把salary的行数向后移动两行，以部门分组，就是把每组的数据各自向前移动两行

FIRST_VALUE(salary) OVER (PARTITION BY dept_num ORDER BY salary) AS first_value,

//工资的第一个值

LAST_VALUE(salary) OVER (PARTITION BY dept_num ORDER BY salary) AS last_value_default,

LAST_VALUE(salary) OVER (PARTITION BY dept_num ORDER BY salary

RANGE BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) AS last_value

//工资的最后第一个值，但是默认的求最后一个值是有问题的所以要采用RANGE BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING才能正常使用LAST

FROM employee_contract

ORDER BY dept_num, salary;

对于LAST_VALUE，使用默认的窗口子句，结果可能有点出乎意料。这是因为默认窗口子句的范围是RANGE BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW，在本例中这意味着当前行始终是最后一个值。将窗口子句更改为RANGE BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING给出了我们可能期望的结果

窗口定义详解：

子句[]用于进一步细分结果并应用解析函数

有两种类型的窗口:行类型窗口和范围类型窗口。

RANK，NTILE，DENSE_RANK，CUME_DIST，PERCENT_RANK，LEAD，LAG和ROW_NUMBER函数还不支持与window clause一起使用（window clause有一定的局限性）

行类窗口：

对于行类型窗口，定义是根据当前行之前或之后的行号。row window clause的一般语法如下：

ROWS BETWEEN AND

可以是以下任意一种：

UNBOUNDED PRECEDING：窗口从分区的第一行开始

CURRENT ROW：当前行数

N PRECEDING or FOLLOWING：在当前行之前或之后的N行

可以是以下任意一种：

UNBOUNDED FOLLOWING：窗口在分区的最后一行结束

CURRENT ROW：当前行数

N PRECEDING or FOLLOWING：在当前行之前或之后的N行

UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING代表所有的行

排序时如果ORDER BY 列不充分区分序列， ROW顺序可能随机（尽量用上主键列） , 会影响结果

行类窗口图解：

示例：

SELECT name, dept_num AS dept, salary AS sal,

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) win1,

//当前行和当前行前两行的最大值，都用各个部门分组

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN 2 PRECEDING AND UNBOUNDED FOLLOWING) win2,

//当前行前两行和最后一行的最大值，都用各个部门分组

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN 1 PRECEDING AND 2 FOLLOWING) win3,

//当前行前一行和当前行后两行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN 2 PRECEDING AND 1 PRECEDING) win4,

//当前行前两行和当前行前一行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN 1 FOLLOWING AND 2 FOLLOWING) win5,

//当前行后一行和当前行后两行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN CURRENT ROW AND CURRENT ROW) win6,

//当前行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN CURRENT ROW AND 1 FOLLOWING) win7,

//当前行和当前行后一行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN CURRENT ROW AND UNBOUNDED FOLLOWING) win8,

//当前行和最后一行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) win9,

//第一行和当前行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN UNBOUNDED PRECEDING AND 1 FOLLOWING) win10,

//第一行和当前行后一行的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN UNBOUNDED PRECEDING AND UNBOUNDED FOLLOWING) win11,

//第一行和最后一的最大值

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name ROWS 2 PRECEDING) win12

//当前行前两行和当前行的最大值

FROM employee_contract

ORDER BY dept, name;

范围类窗口：

与行类型窗口（以行为单位）相比，范围类型窗口（以分区中当前行之前或之后的值/距离为单位）必须是数字或日期类型。目前，范围类型窗口只支持一个ORDER BY列。

SUM(close) RANGE BETWEEN 500 PRECEDING AND 1000 FOLLOWING

根据与当前行值的距离选择行。假设当前值为3000，这个框架将包括分区中工资范围在2500到4000之间的行。

示例：

SELECT name, dept_num AS dept, salary AS sal,

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

ROWS BETWEEN 2 PRECEDING AND CURRENT ROW) win1,

//当前行前两行和当前行的最大值

salary - 1000 as sal_r_start,

salary as sal_r_end,

MAX(salary) OVER (PARTITION BY dept_num ORDER BY name

RANGE BETWEEN 1000 PRECEDING AND CURRENT ROW) win13

//当前行减1000和当前行的最大值

FROM employee_contract

ORDER BY dept, name;

你可能感兴趣的:(大数据,Hive)

智慧水库信息化系统建设产品需求文档V2.0 小赖同学啊 test Technology Precious 物联网
智慧水库信息化系统建设产品需求文档1.引言1.1文档目的本文档旨在明确智慧水库信息化系统的建设需求，为系统设计、开发和实施提供全面依据，确保系统功能满足水库管理业务需求，提升水库管理的智能化水平和决策效率。1.2背景介绍传统水库管理面临数据采集不及时、分析手段有限、决策依赖经验等问题，难以应对复杂多变的水文情势和日益增长的管理需求。随着物联网、大数据、人工智能等技术的发展，智慧水库建设成为必然趋势
9.20其二道左无人
做一家服务公司，为下面的公司提供一些事务性的管理、财务管理、风险管理的服务，粘住一个大圈子的HR，通过下面的公司做掉项目，为HR提供一个稳定的资源变现的渠道；做一家科技公司，提供线上的平台运营，大数据采集，以及基于这个基础上的卖货、信贷等服务做一家连锁企业，每一家门店都是独立的企业，提供招聘、引流以及终端服务所以外部通过众筹绑定大批量的HR，就会有稳定的订单，通过服务公司提供服务，通过终端门店保证
只靠可视化大屏，做不了数字化，数据总监总结3点，你做到了几个大数据的那些事
企业数字化是很多企业热衷的话题。本文的数字化指各行业头的头部企业的端到端数字化解决方案，常见部署于华为专有云、阿里私有云、亚马逊云，项目金额一般百万起步，上不封顶。很多企业投人、投钱数字化，都希望有个酷炫的数据大脑，政府、合作伙伴来参观时，用酷炫的数据大脑让来宾们啧啧称赞。热闹散去后，企业内部的各部门，天天围着数据挖宝，大数据快告诉我，下个月能卖多少，哪几个渠道卖得不好，哪条生产线有问题，哪些货压
hive底层原理 sql执行过程_Hive原理总结（完整版）
目录课程大纲(HIVE增强)31.Hive基本概念41.1Hive简介41.1.1什么是Hive41.1.2为什么使用Hive41.1.3Hive的特点41.2Hive架构51.2.1架构图51.2.2基本组成51.2.3各组件的基本功能51.3Hive与Hadoop的关系61.4Hive与传统数据库对比61.5Hive的数据存储62.Hive基本操作72.1DDL操作72.1.1创建表72.1.
hive的sql优化思路-明白底层运行逻辑 ycllycll hive sql hadoop
一、首先要明白底层map、shuffle、reduce的顺序之中服务器hdfs数据文件在内存与存储之中是怎么演变的，因为hive的性能瓶颈基本在内存，具体参考以下他人优秀文章：1.HiveSQL底层执行过程详细剖析2.HiveJOIN性能调优二是要明白hive对应的sql它底层的mapreduce的过程中sql字段的执行顺序，来理解map的key、value会填充什么值，才能深刻理解怎么一步一步的
你多久没有认真读一本书了我是巴卡
我九岁博览群书，二十岁达到顶峰。我现在都是看社会人文类的书，例如《知音》《故事会》……往前推三百年，往后推三百年，总共六百年没有人超过我。——凤姐引用凤姐的话，没有嘲讽的意思。现在的人，包括我自己，除了刷手机，恐怕连杂志都很少读了，更别说认真读一本书了。1、大数据下，人越读越窄，越读越傻前段时间，埃航波音737MAX8出事，就在网上跟着读了几篇报道。随后的一段时间，基本打开APP都是关于波音和73
注意力才是我们最值钱的东西心守平凡_王慧超
4月10日晚，罗永浩携手国民神车哈弗品牌完成了第二场带货直播。此次直播共售出11357张2777元的优惠券，预估销售额15.65亿元，创造了汽车直播带货的新纪录。流量时代真的已经来临了，随着互联网的高速发展，越来越多的网络用户增加，我们不得不承认，我们已经进入了一个网络时代，进入了一个流量大数据时代。我们所有想获得的东西都可以通过网络获取，资料、信息、购物，网络正在改变人们的生活方式，正在成为人们
六、深度剖析 Hadoop 分布式文件系统（HDFS）的数据存储机制与读写流程
深度剖析Hadoop分布式文件系统（HDFS）的数据存储机制与读写流程在当今大数据领域当中，Hadoop分布式文件系统（HDFS）作为极为关键的核心组件之一，为海量规模的数据的存储以及处理构筑起了坚实无比的根基。本文将会对HDFS的数据存储机制以及读写流程展开全面且深入的探究，通过将原理与实际的实例紧密结合的方式，助力广大读者更加全面地理解HDFS的工作原理以及其具体的应用场景。一、HDFS概述H
python连接数据库的方法,Python 连接数据库的多种方法 AI MIU python连接数据库的方法
JZGKCHINAPython是一种计算机程序设计语言，它是一种动态的、面向对象的脚本语言。它是一种跨平台的，可以运行在Windows，Mac和Linux/Unix系统上。在日常使用中需要对大量数据进行数据分析，那么就必然用到数据库，我们常用的数据库有SQLServer,MySQL,Oracle,DB2,SQLite，Hive，PostgreSQL,MongoDB还有其他常用的MicrosoftA
养老院管理系统基于SpringBoot的养老院管理系统系统设计与实现（源码+论文+部署讲解等）
博主介绍：✌全网粉丝60W+,csdn特邀作者、Java领域优质创作者、csdn/掘金/哔哩哔哩/知乎/道客/小红书等平台优质作者，计算机毕设实战导师，目前专注于大学生项目实战开发,讲解,毕业答疑辅导，欢迎高校老师/同行前辈交流合作✌技术栈范围：SpringBoot、Vue、SSM、Jsp、HLMT、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习、单片机
大数据处理技术：分布式文件系统HDFS 茜茜西西CeCe hdfs hadoop 大数据 HDFS-JAVA接口文件头歌 Java
目录1实验名称：2实验目的3实验内容4实验原理5实验过程或源代码5.1HDFS的基本操作5.2HDFS-JAVA接口之读取文件5.3HDFS-JAVA接口之上传文件5.4HDFS-JAVA接口之删除文件6实验结果6.1HDFS的基本操作6.2HDFS-JAVA接口之读取文件6.3HDFS-JAVA接口之上传文件6.4HDFS-JAVA接口之删除文件1实验名称：分布式文件系统HDFS2实验目的1.理
Linux教程（4）----[hive数据仓库工具] .房东的猫 Linux教程（完善中~~）linux
Hive基本概念Hive简介什么是HiveHive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。为什么使用Hive直接使用hadoop所面临的问题人员学习成本太高
基于用户画像的商品推荐系统 Dush32 机器学习人工智能 python 推荐算法
随着人工智能和大数据技术的进步，产品推荐系统成为了现代广告与电商平台中不可或缺的部分。通过深度挖掘用户的行为数据，能够为广告主提供精准的用户画像，从而更高效地推荐相关产品，提升购买转化率。本项目基于科大讯飞AI营销云大赛的赛题，目的是利用用户画像进行产品推荐，预测用户是否会购买相应商品。我们使用了机器学习的二分类模型，通过分析用户的性别、年龄、常驻地、机型等信息，来判断用户的付费行为。项目目标：本
InfluxDB 数据模型：桶、测量、标签与字段详解（一）计算机毕设定制辅导-无忧 #InfluxDB db
一、引言**在大数据和物联网蓬勃发展的当下，时间序列数据的处理需求呈爆发式增长。InfluxDB作为一款高性能的开源时序数据库，凭借其卓越的特性，在时序数据库领域占据了重要地位，被广泛应用于各种场景。InfluxDB专为时间序列数据设计，拥有高效的存储和查询性能。它采用独特的存储引擎，能够快速写入大量带有时间戳的数据，并支持灵活的查询操作。其核心设计针对时间序列数据的特点进行了优化，包括时间索引、
Kafka 集群架构与高可用方案设计（一）计算机毕设定制辅导-无忧 #Kafka kafka 架构分布式
Kafka集群架构与高可用方案设计的重要性在大数据和分布式系统的广阔领域中，Kafka已然成为了一个中流砥柱般的存在。它最初由LinkedIn开发，后捐赠给Apache软件基金会并成为顶级项目，凭借其卓越的高吞吐量、可扩展性以及持久性，被广泛应用于日志收集、实时数据处理、流计算、数据集成等诸多关键领域。在日志收集场景下，以大型互联网公司为例，每天都会产生海量的日志数据，如用户的访问记录、系统操作日
大数据集成方案对比：Kafka vs Flume vs Sqoop AI天才研究院计算 AI大模型应用入门实战与进阶 Agentic AI 实战大数据 kafka flume ai
大数据集成方案对比：KafkavsFlumevsSqoop关键词：大数据集成、Kafka、Flume、Sqoop、流处理、批量迁移、日志收集摘要：在大数据生态中，数据集成是连接数据源与数据处理平台的关键环节。本文深度对比Kafka、Flume、Sqoop三大主流集成工具，从核心架构、技术原理、适用场景到实战案例展开系统性分析。通过数学模型量化性能差异，结合实际项目经验总结选型策略，帮助开发者根据业
飞算科技：以创新科技引领数字化变革，旗下飞算 JavaAI 成开发利器飞算JavaAI开发助手科技
作为国家级高新技术企业，飞算科技专注于自主创新，在数字科技领域持续深耕，用前沿技术为各行业客户赋能，助力其实现数字化转型升级的飞跃。飞算科技凭借深厚的技术积累，将互联网科技、大数据、人工智能等技术与实际应用紧密融合。公司组建了一支由行业资深专家和技术精英构成的团队，他们在相关领域积累了多年实践经验，深刻理解不同行业客户在数字化进程中面临的痛点与挑战。基于这些洞察，飞算科技推出了一系列具有创新性和实
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用青云交大数据新视界 Java 大视界 java 大数据机器学习情绪分析智能投资多源数据
Java大视界--Java大数据机器学习模型在金融市场情绪分析与投资策略制定中的应用）引言：正文：一、金融情绪数据的立体化采集与治理1.1多模态数据采集架构1.2数据治理与特征工程二、Java机器学习模型的工程化实践2.1情感分析模型的深度优化2.2强化学习驱动的动态投资策略三、顶级机构实战：Java系统的金融炼金术四、技术前沿：Java与金融科技的未来融合4.1量子机器学习集成4.2联邦学习在合
Java 大视界 -- Java 大数据在影视内容推荐与用户兴趣挖掘中的深度实践（183）青云交大数据新视界 Java 大视界 Java+Python 双剑合璧：AI 大数据实战通关秘籍大数据影视内容推荐用户兴趣挖掘协同过滤基于内容推荐数据可视化个性化推荐系统
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！全网（微信公众号/CSDN/抖音/华为/支付宝/微博）：青云交一、欢迎加入【福利社群】点击快速加入1：青云交技术圈福利社群（NEW)点击快速加入2：2025CS
Java 大视界 -- 基于 Java 的大数据分布式文件系统在科研数据存储与共享中的应用优化（187）青云交大数据新视界 Java 大视界 Java+Python 双剑合璧：AI 大数据实战通关秘籍大数据大数据分布式文件系统科研数据存储科研数据共享应用优化 HDFS 数据分区
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！全网（微信公众号/CSDN/抖音/华为/支付宝/微博）：青云交一、欢迎加入【福利社群】点击快速加入1：青云交技术圈福利社群（NEW)点击快速加入2：CSDN博客
Python医疗大数据实战：基于Scrapy-Redis的医院评价数据分布式爬虫设计与实现 Python爬虫项目 python 开发语言爬虫 selenium scrapy
摘要本文将详细介绍如何使用Python构建一个高效的医院评价数据爬虫系统。我们将从爬虫基础讲起，逐步深入到分布式爬虫架构设计，使用Scrapy框架结合Redis实现分布式爬取，并采用最新的反反爬技术确保数据采集的稳定性。文章包含完整的代码实现、性能优化方案以及数据处理方法，帮助读者掌握医疗大数据采集的核心技术。关键词：Python爬虫、Scrapy-Redis、分布式爬虫、医疗大数据、反反爬技术1
flink sql读hive catalog数据，将string类型的时间戳数据排序后写入kafka，如何保障写入kafka的数据是有序的 fzip Flink flink sql hive
在FlinkSQL中，要确保从Hive读取的STRING类型时间戳数据排序后有序写入Kafka，需要结合批处理模式、时间类型转换、单分区写入和Kafka生产者配置。以下是完整解决方案：一、核心解决方案1.批处理模式+全局排序将作业设置为批处理模式，并对字符串时间戳进行类型转换后排序：--设置为批处理模式（关键！）SET'execution.runtime-mode'='batch';--从Hive
flink-sql读写hive-1.13 第一片心意 flink flink sql hive
1.版本说明本文档内容基于flink-1.13.x，其他版本的整理，请查看本人博客的flink专栏其他文章。1.1.概述ApacheHive已经成为了数据仓库生态系统中的核心。它不仅仅是一个用于大数据分析和ETL场景的SQL引擎，同样也是一个数据管理平台，可用于发现，定义，和演化数据。Flink与Hive的集成包含两个层面。一是利用了Hive的MetaStore作为持久化的Catalog，用户可通
flink sql如何对hive string类型的时间戳进行排序
在FlinkSQL中对Hive表的STRING类型时间戳进行排序，需要先将字符串转换为时间类型，再基于时间类型排序。以下是具体方法和示例：一、核心解决方案1.字符串转TIMESTAMP后排序若Hive中的时间戳格式为'yyyy-MM-ddHH:mm:ss'（如'2024-01-0112:00:00'），可直接转为TIMESTAMP排序：SELECT*FROMhive_tableORDERBYTO_
觉察与正念佳佳的宝瓶子
今天因为交电费的事与妈妈沟通。在沟通的过程中，年届八十的母亲一直给我强调着过去怎么怎么。父母家的电费一直是银行代扣的，这样的模式自从可以通过银行代扣便开始了。可见那时候的父母还是蛮新潮的，能接受新事物的。至从有了智能手机，人类便进入了大数据时代。通过微信或支付宝来交电费方便得多。可惜父亲不在了，老母亲是连手机都坚决不用的人。（因为想要掩饰自己的不能、不敢，所以干脆拒绝！不愿意做任何的改变）。今年，
Java大视界：Java大数据在智能医疗电子健康档案数据挖掘与健康服务创新＞ Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
>本文通过完整代码示例，揭秘如何用Java大数据技术挖掘电子健康档案价值，实现疾病预测、个性化健康管理等创新服务。###一、智能医疗时代的数据金矿电子健康档案（EHR）作为医疗数字化的核心载体，包含海量患者全生命周期健康数据。据统计，全球医疗数据量正以每年**48%的速度增长**，单个三甲医院年数据量可达**PB级**。这些数据蕴藏着疾病规律、治疗效能的宝贵知识，但传统技术难以有效挖掘。**Jav
无人值守人工智能智慧系统数据分析：深度洞察与未来展望呆码科技人工智能数据分析数据挖掘
无人值守人工智能智慧系统数据分析：深度洞察与未来展望随着科技的飞速发展，人工智能（AI）技术已逐渐渗透到社会经济的各个领域，其中无人值守人工智能智慧系统作为AI技术应用的前沿阵地，正引领着一场深刻的行业变革。这类系统通过集成高级算法、大数据分析、物联网（IoT）及云计算等先进技术，实现了对复杂环境的自主监控、智能决策与高效管理，极大地提升了运营效率，降低了人力成本，并开启了数据驱动决策的新纪元。本
Python 生物信息学秘籍第三版（四）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/9694cf42f7d741c69225ff1cf52b0efe译者：飞龙协议：CCBY-NC-SA4.0第十一章：生物信息学中的机器学习机器学习在许多不同的领域中都有应用，计算生物学也不例外。机器学习在该领域有着无数的应用，最古老且最为人熟知的应用之一就是使用主成分分析（PCA）通过基因组学研究种群结构。随着该领域的蓬勃发展，还有许多其他潜在的应
浮漂式水质监测设备：智能守护水环境的未来之眼柏峰电子人工智能
浮漂式水质监测设备：智能守护水环境的未来之眼柏峰【BF-FBSZ】随着全球水资源短缺和水污染问题日益严峻，水质监测技术正迎来前所未有的发展机遇。作为这一领域的创新突破，浮漂式水质监测设备凭借其实时性、智能化和网络化优势，正在重塑水资源管理的新格局。本文将深入探讨这一技术的原理、特点、应用场景及未来发展趋势。一、技术原理与系统架构浮漂式水质监测设备是一种集成了现代传感器技术、物联网和大数据分析的智能
基于蜣螂算法优化多头注意力机制的卷积神经网络结合双向长短记忆神经网络实现温度预测DBO-CNN-biLSTM-Multihead-Attention附matlab代码 matlab科研助手神经网络算法 cnn
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍温度预测在气象学、农业、能源等领域具有重要的应用价值。随着大数据和人工智能技术的快速发
312个免费高速HTTP代理IP（能隐藏自己真实IP地址） yangshangchuan 高速免费 superword HTTP代理
124.88.67.20:843 190.36.223.93:8080 117.147.221.38:8123 122.228.92.103:3128 183.247.211.159:8123 124.88.67.35:81 112.18.51.167:8123 218.28.96.39:3128 49.94.160.198:3128 183.20
pull解析和json编码百合不是茶 android pull解析 json
n.json文件: [{name:java,lan:c++,age:17},{name:android,lan:java,age:8}] pull.xml文件 <?xml version="1.0" encoding="utf-8"?> <stu> <name>java
[能源与矿产]石油与地球生态系统 comsci 能源
按照苏联的科学界的说法,石油并非是远古的生物残骸的演变产物,而是一种可以由某些特殊地质结构和物理条件生产出来的东西,也就是说,石油是可以自增长的.... 那么我们做一个猜想: 石油好像是地球的体液,我们地球具有自动产生石油的某种机制,只要我们不过量开采石油,并保护好
类与对象浅谈沐刃青蛟 java 基础
类，字面理解，便是同一种事物的总称，比如人类，是对世界上所有人的一个总称。而对象，便是类的具体化，实例化，是一个具体事物，比如张飞这个人，就是人类的一个对象。但要注意的是：张飞这个人是对象，而不是张飞，张飞只是他这个人的名字，是他的属性而已。而一个类中包含了属性和方法这两兄弟，他们分别用来描述对象的行为和性质（感觉应该是
新站开始被收录后，我们应该做什么？ IT独行者 PHP seo
新站开始被收录后，我们应该做什么？百度终于开始收录自己的网站了，作为站长，你是不是觉得那一刻很有成就感呢，同时，你是不是又很茫然，不知道下一步该做什么了？至少我当初就是这样，在这里和大家一份分享一下新站收录后，我们要做哪些工作。至于如何让百度快速收录自己的网站，可以参考我之前的帖子《新站让百
oracle 连接碰到的问题文强chu oracle
Unable to find a java Virtual Machine－－安装64位版Oracle11gR2后无法启动SQLDeveloper的解决方案作者：草根IT网来源：未知人气：813标签：导读：安装64位版Oracle11gR2后发现启动SQLDeveloper时弹出配置java.exe的路径，找到Oracle自带java.exe后产生的路径“C:\app\用户名\prod
Swing中按ctrl键同时移动鼠标拖动组件（类中多借口共享同一数据）小桔子 java 继承 swing 接口监听
都知道java中类只能单继承，但可以实现多个接口，但我发现实现多个接口之后，多个接口却不能共享同一个数据，应用开发中想实现：当用户按着ctrl键时，可以用鼠标点击拖动组件，比如说文本框。编写一个监听实现KeyListener,NouseListener,MouseMotionListener三个接口，重写方法。定义一个全局变量boolea
linux常用的命令 aichenglong linux 常用命令
1 startx切换到图形化界面 2 man命令:查看帮助信息 man 需要查看的命令,man命令提供了大量的帮助信息,一般可以分成4个部分 name:对命令的简单说明 synopsis:命令的使用格式说明 description:命令的详细说明信息 options:命令的各项说明 3 date:显示时间语法：date [OPTION]... [+FORMAT]
eclipse内存优化 AILIKES java eclipse jvm jdk
一基本说明在JVM中，总体上分2块内存区,默认空余堆内存小于 40%时，JVM就会增大堆直到-Xmx的最大限制；空余堆内存大于70%时，JVM会减少堆直到-Xms的最小限制。 1)堆内存(Heap memory):堆是运行时数据区域，所有类实例和数组的内存均从此处分配,是Java代码可及的内存，是留给开发人
关键字的使用探讨百合不是茶关键字
//关键字的使用探讨/*访问关键词private 只能在本类中访问public 只能在本工程中访问protected 只能在包中和子类中访问默认的只能在包中访问*//*final 类方法变量 final 类不能被继承 final 方法不能被子类覆盖，但可以继承 final 变量只能有一次赋值，赋值后不能改变 final 不能用来修饰构造方法*///this()
JS中定义对象的几种方式 bijian1013 js
1. 基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)： <html> <head> <title>基于已有对象扩充其对象和方法(只适合于临时的生成一个对象)</title> </head> <script> var obj = new Object();
表驱动法实例 bijian1013 java 表驱动法 TDD
获得月的天数是典型的直接访问驱动表方式的实例，下面我们来展示一下： MonthDaysTest.java package com.study.test; import org.junit.Assert; import org.junit.Test; import com.study.MonthDays; public class MonthDaysTest { @T
LInux启停重启常用服务器的脚本 bit1129 linux
启动，停止和重启常用服务器的Bash脚本，对于每个服务器，需要根据实际的安装路径做相应的修改 #! /bin/bash Servers=(Apache2, Nginx, Resin, Tomcat, Couchbase, SVN, ActiveMQ, Mongo); Ops=(Start, Stop, Restart); currentDir=$(pwd); echo
【HBase六】REST操作HBase bit1129 hbase
HBase提供了REST风格的服务方便查看HBase集群的信息，以及执行增删改查操作 1. 启动和停止HBase REST 服务 1.1 启动REST服务前台启动（默认端口号8080） [hadoop@hadoop bin]$ ./hbase rest start 后台启动 hbase-daemon.sh start rest 启动时指定
大话zabbix 3.0设计假设 ronin47
What’s new in Zabbix 2.0? 去年开始使用Zabbix的时候，是1.8.X的版本，今年Zabbix已经跨入了2.0的时代。看了2.0的release notes，和performance相关的有下面几个： :: Performance improvements::Trigger related da
http错误码大全 byalias http协议 javaweb
响应码由三位十进制数字组成，它们出现在由HTTP服务器发送的响应的第一行。响应码分五种类型，由它们的第一位数字表示： 1）1xx：信息，请求收到，继续处理 2）2xx：成功，行为被成功地接受、理解和采纳 3）3xx：重定向，为了完成请求，必须进一步执行的动作 4）4xx：客户端错误，请求包含语法错误或者请求无法实现 5）5xx：服务器错误，服务器不能实现一种明显无效的请求
J2EE设计模式-Intercepting Filter bylijinnan java 设计模式数据结构
Intercepting Filter类似于职责链模式有两种实现其中一种是Filter之间没有联系，全部Filter都存放在FilterChain中，由FilterChain来有序或无序地把把所有Filter调用一遍。没有用到链表这种数据结构。示例如下： package com.ljn.filter.custom; import java.util.ArrayList;
修改jboss端口 chicony jboss
修改jboss端口 %JBOSS_HOME%\server\{服务实例名}\conf\bindingservice.beans\META-INF\bindings-jboss-beans.xml 中找到 <!-- The ports-default bindings are obtained by taking the base bindin
c++ 用类模版实现数组类 CrazyMizzz C++
最近c++学到数组类，写了代码将他实现，基本具有vector类的功能 #include<iostream> #include<string> #include<cassert> using namespace std; template<class T> class Array { public: //构造函数
hadoop dfs.datanode.du.reserved 预留空间配置方法 daizj hadoop 预留空间
对于datanode配置预留空间的方法为：在hdfs-site.xml添加如下配置 <property> <name>dfs.datanode.du.reserved</name> <value>10737418240</value>
mysql远程访问的设置 dcj3sjt126com mysql 防火墙
第一步: 激活网络设置你需要编辑mysql配置文件my.cnf. 通常状况，my.cnf放置于在以下目录： /etc/mysql/my.cnf (Debian linux) /etc/my.cnf （Red Hat Linux/Fedora Linux) /var/db/mysql/my.cnf (FreeBSD) 然后用vi编辑my.cnf，修改内容从以下行： [mysqld] 你所需要: 1
ios 使用特定的popToViewController返回到相应的Controller dcj3sjt126com controller
1、取navigationCtroller中的Controllers NSArray * ctrlArray = self.navigationController.viewControllers; 2、取出后，执行， [self.navigationController popToViewController:[ctrlArray objectAtIndex:0] animated:YES
Linux正则表达式和通配符的区别 eksliang 正则表达式通配符和正则表达式的区别通配符
转载请出自出处：http://eksliang.iteye.com/blog/1976579 首先得明白二者是截然不同的通配符只能用在shell命令中,用来处理字符串的的匹配。判断一个命令是否为bash shell(linux 默认的shell)的内置命令 type -t commad 返回结果含义 file 表示为外部命令 alias 表示该
Ubuntu Mysql Install and CONF gengzg Install
http://www.navicat.com.cn/download/navicat-for-mysql Step1: 下载Navicat ，网址：http://www.navicat.com/en/download/download.html Step2：进入下载目录，解压压缩包：tar -zxvf navicat11_mysql_en.tar.gz
批处理，删除文件bat huqiji windows dos
@echo off ::演示：删除指定路径下指定天数之前（以文件名中包含的日期字符串为准）的文件。 ::如果演示结果无误，把del前面的echo去掉，即可实现真正删除。 ::本例假设文件名中包含的日期字符串（比如：bak-2009-12-25.log） rem 指定待删除文件的存放路径 set SrcDir=C:/Test/BatHome rem 指定天数 set DaysAgo=1
跨浏览器兼容的HTML5视频音频播放器天梯梦 html5
HTML5的video和audio标签是用来在网页中加入视频和音频的标签，在支持html5的浏览器中不需要预先加载Adobe Flash浏览器插件就能轻松快速的播放视频和音频文件。而html5media.js可以在不支持html5的浏览器上使video和audio标签生效。 How to enable <video> and <audio> tags in
Bundle自定义数据传递 hm4123660 android Serializable 自定义数据传递 Bundle Parcelable
我们都知道Bundle可能过put****()方法添加各种基本类型的数据，Intent也可以通过putExtras(Bundle)将数据添加进去，然后通过startActivity()跳到下一下Activity的时候就把数据也传到下一个Activity了。如传递一个字符串到下一个Activity 把数据放到Intent
C＃：异步编程和线程的使用（.NET 4.5 ） powertoolsteam .net 线程 C#异步编程
异步编程和线程处理是并发或并行编程非常重要的功能特征。为了实现异步编程，可使用线程也可以不用。将异步与线程同时讲，将有助于我们更好的理解它们的特征。本文中涉及关键知识点 1. 异步编程 2. 线程的使用 3. 基于任务的异步模式 4. 并行编程 5. 总结异步编程什么是异步操作？异步操作是指某些操作能够独立运行，不依赖主流程或主其他处理流程。通常情况下，C＃程序
spark 查看 job history 日志 Stark_Summer 日志 spark history job
SPARK_HOME/conf 下: spark-defaults.conf 增加如下内容 spark.eventLog.enabled true spark.eventLog.dir hdfs://master:8020/var/log/spark spark.eventLog.compress true spark-env.sh 增加如下内容 export SP
SSH框架搭建 wangxiukai2015eye spring Hibernate struts
MyEclipse搭建SSH框架 Struts Spring Hibernate 1、new一个web project。 2、右键项目，为项目添加Struts支持。选择Struts2 Core Libraries -<MyEclipes-Library> 点击Finish。src目录下多了struts