神是念着倒

[Hive] 07 - HQL：数据检索-查询（select）

环境

宿主机：Windows 10 64_bit
虚拟机：VMware pro 12
- CentOS 7.5 64_bit（3台：1个master、2个slave）
- Hadoop-2.6.5
- MariaDB-5.5.60
- Hive 1.2.2
ssh工具：SecureCRT 7.3

0、Select语法

----0.0 group by

----0.1 Order/Sort/Distribute/Cluster By

----0.2 转换和Map-Reduce 脚本

----0.3 操作符和用户自定义函数（UDFs）

----0.4 XPath UDF

----0.5 Join-联接

----0.6 Join优化

----0.7 Union

----0.8 Lateral View（侧视图）

1、子查询Sub Queries

2、抽样（samping）

3、虚拟列

4、窗口和分析函数

5、增强的聚合（aggregation）、多维数据集(cube）、分组（group）和汇总(roll up）

6、程序语言：hive hpl/sql

7、explain语法

正文

0、Select语法

预热
首先认识select ...from语法，是SQL中的射影算子，from子句标识了从哪个表、视图、或嵌套查询中选择记录。更多参考【Hive-Select语法】。

语法：

[with CommonTableExpression (, CommomnTableExpression)*] --Hive 0.13.0+才支持
select [all | distinct] select_expr, select_expr, ...
  from table_reference
  [where where_condition]
  [group by col_list]
  [order by col_list]
  [cluster by col_list | [distribute by col_list] [sort by col_list]
  [limit [offset,] rows]

一个select语句可以是一个联合查询或另一个查询的子查询的一部分；
table_reference表示查询的输入。它可以是一个有规律的表、一个视图、一个连接结构、或者一个子查询；
表名、列名是不区分大小写的。
- Hive 0.12之前，表名和列名只能是数字、字母、下划线字符；
- Hive 0.13起，列名可以包含任何Unicode字符。指定在两个反引号`之内的任何列名都按字面字符来处理；
- 恢复到Hive 0.13之前的行为和限制，即列名为字母数字和下划线字符，可以设置配置属性hive.support.quoted.identifiers为none。在这个配置，由反引号包围的名字被解释为正则表达式。
取得当前数据库（Hive 0.13.0起），可以使用current_database()函数。

hive> select current_database();

若要指定一个数据库，可以用数据库名去限定表名（Hive 0.7起，db_name.table_name），或在查询语句之前使用use语句（Hive 0.6起）。db_name.table_name允许查询访问不同数据库中的表。

use可设置数据库，用于所有后续的Hive QL语句。使用default关键字可以回到默认数据库：

use database_name;
select query_specification;
use default;

where子句
where条件是一个布尔表达式，用于过滤条件，即查找到符合过滤条件的记录。例如，下方查询只返回来自US地区数量大于10的销售记录。在where子句中，Hive支持多个操作符和UDF：

select * from sales where amout > 10 and region='US';

all和distinct子句

all和distinct选项指定是否返回重复的行；
假如这两个选项都没给，默认是all（所有匹配的行都会返回）；
distinct指定会从结果集中删除重复的行；
Hive 1.1.0支持select distinct *。

创建表
hive> create table t1(col1 int, col2 int);

往表中插入数据
hive> insert into table t1 values(1,20),(1,18),(1,66),(2,24),(3,30);

显示t1表中两个列
hive> select col1,col2 from t1;
OK
1       20
1       18
1       66
2       24
3       30

查询不重复的col1列
hive> select distinct col1 from t1;
OK
1
2
3

hive> select distinct col1,col2 from t1;
OK
1       18
1       20
1       66
2       24
3       30

all和distinct还可用在union子句中。Union 语法

基于分区的查询
通常，一个select查询会扫描整个表（取样除外（sampling））。
假如一个表是用partition by子句创建的，查询可以执行分区修剪和只扫描与查询指定的分区相关的表的一小部分。假如在where子句中指定了分区或在join中的on子句，则Hive目前能执行分区修剪。例如，在page_view表中有date列分区，下方的查询语句只会检索日期在2008-03-01 和2008-03-31之间的行。

select page_view.* from page_views
where page_views.date >='2008-03-01' and page_views.date <=2008-03-31;

假如page_views表被另一个dim_users表加入了，在on子句中可以指定一个分区范围，例如：

select page_views.*
from page_views join dim_users
  on (page_views.user_id = dim_users.id AND page_views.date >= '2008-03-01' AND page_views.date <= '2008-03-31');

having子句
having允许用户通过一个简单的语法完成原本需要通过子查询才能对group by子句产生的分组进行条件过滤的任务。

Hive 0.7.0中，Hive添加了对havin子句的支持。在Hive旧版，使用
一个子查询也可能取得同样的效果，例如：

select col1 from t1 group by col1 having sum(col2)>10;

也可以表示为：

select col1 from (select col1, sum(col2) as col2sum from t1 group by col1) t2 where t2.col2sum > 10

limit子句

limit子句用于限制（限定）由select语句返回的行数。
limit可以带一个或两个数字参数，且必须是非负整数常量。
- 第一个参数指定指定要返回的第一行的偏移量（Hive 2.0.0)）；
- 第二个参数指定要返回的最大行数；
- 当只给一个参数时，它代表最大行数，默认偏移量为0。

下方查询将返回5个任意的customer：

select * from customers limit 5;

下方查询将返回以create_date的前5个customer：

select * from customers order by create_date limit 5;

下方将返回以create_date的第3个到第7个customer：

select * from customers order by create_date limit 2,5;

limit子句

在Hive 0.13.0之前，select语句可以采用基于正则的列规范；
在Hive 0.13.0之后，可以设置属性hive.support.quoted.identifiers为none【各种属性的设置可参考Hive Configuration Properties】

可以使用Java的正则语法。下方将查询sales表中除了ds和hr的所有列：

select `(ds|hr)?+.+` from sales;

0.0 group by

group by子句通常会和聚合函数一起使用，按照一个或多个列对结果进行分组，然后对每个分组进行聚合操作。

groupByClause子句：group by groupByExpression (, groupByExpression)*
groupByExpression：expression
group by查询：select expression (, expression)* from src groupByClause?
在groupByExpression中列是通过名称指定的，不是通过位置编号。不过，Hive 0.11.0+，当配置了下方属性时，是可以通过位置来指定列的：

Hive 0.11.0到2.1.x，设置属性hive.groupby.orderby.position.alias为true，默认是false；
Hive 2.2.0+，设置属性hive.groupby.position.alias为true，默认是false。

示例1：统计表的行数。在Hive 0.6.0需要用count(1)代替count(*)。其他版本两个都可以用。

select count(*) from table2;

示例2：按性别（gender）统计不同的user。

insert overwrite table pv_gender_sum
select pv_users.gender, count (distinct pv_users.userid)
from pv_users
group by pv_users.gender;

同时，还可以做多聚合（Multiple aggregations），不过，没有两个聚合能够有不同的distinct列。例如，下方是可能的，因为count(distinct)和sum(distinct)指定了同一列

insert overwrite table pv_gender_agg
select pv_users.gender, count(distinct pv_users.userid), count(*), sum(distinct pv_users.userid)
from pv_users
group by pv_users.gender;

不过，下方查询是不允许的。不允许在同一个查询中使用多个distinct：

insert overwrite table pv_gender_agg
select pv_users.gender, count(distinct pv_users.userid), count(distinct pv_users.ip)
from pv_users
group by pv_users.gender;

select语句和group by子句
当使用group by子句时，select语句只能包含已在group by子句包含了的列。当然，在select语句中可以有多个聚合函数（如count()）。例如：

create table t1(a integer, b integer);

对于上面这个表，一个group by查询可以像这样：

select a, sum(b) from t1
group by a;

上面这个查询能够执行，是因为select语句包含了group by key，和一个聚合函数（sum(b)）。
不过，下方这种查询是不会执行的：因为select语句有一个额外的列（b），它没有包含在group by子句中，它也不是一个聚合函数。

select a,b from t1
group by a;

比如这个表像这样：

a   b
------
100 1
100 2
100 3

由于分组（group by）只作用在a，那么对于组a=100，Hive应该显示给b什么值呢？有人认为，它应该是第一个值或最低值，但也会认为有多个选项。Hive通过使SQL（准确地说是HQL）在select语句中具有不包含在group by子句中的列无效来消除这种猜测。

group by子句高级特性
多group by插入
聚合或简单select的输出可以可以进一步发送到多个表中、甚至到hadoop dfs文件中（这个可以使用hdfs工具进行操作）。例如，假如对性别（gender）进行细分，需要通过年龄（age）查找唯一的page view的细分，可以通过语句完成：

from pv_users
insert overwrite table pv_gender_sum
  select pv_users.gender, count(distinct pv_users.userid)
  group by pv_users.gender
insert overwrite directory '/user/facebook/tmp/pv_age_sum'
  select pv_users.age, count(distinct pv_users.userid)
  group by pv_users.age;

对group by进行map-side聚合
hive.map.aggr控制了怎么做聚合，默认是false。假如设置为true，Hive将直接在map task中执行第一级聚合。这通常能提供更高的效率，但可能需要更多的memory才能运行成功。

set hive.map.aggr=true;
select count(*) from t2;

更多可参考LanguageManual GroupBy。

0.1 Order/Sort/Distribute/Cluster By

0.1.0 `order by`

Hive QL的order by语法跟SQL的order by语法是相似的。其会对查询结果执行一个全局排序，即会有一个所有的数据都通过一个reducer进行处理的过程（对于大数据集，该过程将消耗一些时间来执行）。语法：

colOrder：( asc | desc) --默认排序为升序（asc）
colNullOrder：( nulls first | null last) -- Hive 2.1.0+支持
orderBy：order by colName colOrder? colNullOrder? (',' colName colOrder? colNullOrder?)*

查询语句：
select expression (',' expression)* from src orderBy;

在order by子句中有一些限制。在严格模式下（hive.mapred.mode=strict），其后面必须跟着limit；但是，在非严格模式下，就不必了。原因是为了把所有结果的顺序加在一起，这必须有一个reducer来最终输出排序。假如在输出中行数太大了，单个reducer可能花费很长的时间去完成。

切记的是通过列名来指定，而不是位置编号。不过，在Hive 0.11.0+，当配置了下面的属性时，列是可以通过位置来指定的：

Hive 0.11.0到Hive 2.1.x，设置hive.groupby.orderby.position.alias=true，默认是false；
Hive 2.2.0+，hive.orderby.position.alias=true，默认就为true。

Hive 2.1.0+，在order by子句中，支持对每列指定null的排序。对于升序排序（asc），默认null排序是nulls first，而对于降序排序（desc）默认的null排序是nulls last。
Hive 3.0.0+，在子查询中order by没有限制（limit）了，优化器将删除视图。禁用它可以去设置hive.remove.orderby.in.subquery=false。

0.1.1 `sort by`

sort by也和SQL中的order by语法相似。

colOrder：( asc | desc)
sortBy：sort by colName colOrder? (',' colName colOrder?)*

查询语句：
select expression (',' expression)* from src sortBy;

在将行送进reducer之前，Hive会在sort by中使用列来对行进行排序。sort排序依赖于列的类型，举例：

假如列是数字类型，那么sort是会按照数字排序的；
假如列是字符串类型，那么sort排序是按照字典排序。

Hive 3.0.0+，在子查询中sort by没有限制（limit）了，优化器将删除视图。禁用它可以去设置hive.remove.orderby.in.subquery=false。

小结：sort by和order by的不同
Hive支持sort by，它会对每个reducer上数据进行排序。sort by和order by的不同是：

sort by只确保在一个reducer内的行的排序。假如有多个reducer，sort by可能给出部分排序的最终结果。
order by确保在输出中总得排序。

一般情况下，根据用户指定的顺序，数据将在每一个reducer中被排序。示例：

select key, value from src sort by key asc, value desc

查询会有两个reducer，每一个的输出结果是：

对sort by设置类型
在转换后，变量的类型通常被认为是字符串，意味着数字数据将被以字典排序。为了避免这个，在使用sort by之前，可以使用带有强制转换（cast）的select语句。

from (from (from src
    select transform(value)
    using 'mapper'
    as value, count) mapped
  select cast(value as double) as value, cast(count as int) as count
  sort by value, count) sorted
select transform(value, count)
using 'reducer'
as whatever

0.1.2 `cluster by`和`distribute by`

cluster by和distribute by主要跟Transform/Map-Reduce脚本一起使用。但是，假如有一个需要去做分区和为了后续查询对一个子查询的输出进行排序，有时，cluster by和distribute by是非常有用的。

cluster by是对distribute by和sort by的一个捷径。

在distribute by中，Hive使用列在reducer之间去分布（distribute，分配）行。所有按distribute by的列分布的行都将转到同一个reducer。然而，distribute by不能确保在分布的键上聚类或排序属性。例如：通过distribute by x将下方5行分布到2个reducer中去：

x1
x2
x4
x3
x1

reducer1 得到：

x1
x2
x1

reducer2得到：

x4
x3

注意，所有行中具有相同key（x1）被确保分布到了同一个reducer上（上述例中是reducer1），但是不能确保它们聚集在相邻的位置。

相反，假如用cluster by x，这2个reducer将进一步以x对行进行排序，那么：
reducer1 得到：

x1
x1
x2

reducer2得到：

x3
x4

不是通过cluster by，用户可以指定distribute by和sort by，因此，分区列和排序列是不同的。通常情况下，分区列是排序列的前奏，但那不是必需的。

select col1,col2 from t1 cluster by col1;

select col1,col2 from t1 distribute by col1;
select col1,col2 from t1 distribute by col1 sort by col1 asc, col2 desc;

0.2 转换和Map-Reduce 脚本

通过使用Hive语言支持的本身特性，用户还可以往数据流中插入（plug）自己自定义的mapper和reducer。例如，为了运行一个自定义的mapper脚本（map_script）和一个自定义的reducer脚本（reducer_script），用户可以发布使用了transform子句的命令嵌入到mapper和reducer脚本中。

默认情况下，在发送到用户脚本之前，列将被转换为字符串、并以tab键分割；同样地，为了区分null值、空字符串，所有null值将被转换为字面字符串\N。用户脚本的标准输出将被对待为以tab分割的字符串列，任何只含有\N的单元将被重新解释一个null，然后，生成的字符串列将按常规方式转换为表声明中指定的数据类型。用户脚本可以将调试信息输出到标准错误，该错误将显示在Hadoop的任务详细信息页上。可以用row format覆盖这些默认值。

更多可参考LanguageManual Transform。

稍后更新其他内容

0.3 操作符和用户自定义函数（UDFs）

参考博客【[Hive] 08 - 内建操作符、函数（UDF）】

0.4 XPath UDF

XPath，即XML路径语言（XML Path Language，可扩展标记语言路径语言），它是一种用来确定XML文档中某部分位置的语言。

UDF
xpath, xpath_short, xpath_int, xpath_long, xpath_float, xpath_double, xpath_number, xpath_string

使用XPath表达式解析XML数据的函数
Hive 0.6.0+

UDF的xpath家族是通过JDK提供的Java XPath library javax.xml.xpath的包装器。这个library是基于XPath 1.0规范。有关Java XPath library

参考：LanguageManual XPathUDF

0.5 Join-联接

join语法
Hive支持下面的语法来联接表：

join_table：
  table_reference [inner] join table_factor [join_condition]
  table_reference {left|right|full} [outer] join table_reference join_condition
  table_reference left semi join table_reference join_condition
  table_reference cross join table_reference [join_condition] --Hive 0.10+

table_reference：
  table_factor
  join_table

table_factor：
  tbl_name [alias]
  table_subquery alias
  ( table_references )

join_condition：
  on expression

对于联接（join）语法的上下文可参考上方的select语法。
Hive 0.13.0+：隐式join表示。允许from子句去联接一个以逗号分隔的表列表，省略join关键字。例如：

select *
from table1 t1, table2 t2, table3 t3
where t1.id=t2.id and t2.id=t3.id and t1.zipcode='02535';

Hive 0.13.0+：不合格的列引用。在join条件中支持非限定列引用。Hive尝试根据join的输入来解决这些问题。假如非限定列引用解析为多个表，那么Hive将其标记为不明确的引用。

create table a (k1 string, v1 string);
create table b (k2 string, v2 string);

select k1, v1, k2, v2 from a join b on k1=k1;

Hive 2.2.0+：在on子句中的复杂表达式。在此之前，Hive不支持非相等条件的join条件。尤其是，join条件的语法受到如下限制:

join_condition:
  on equality_expression ( and equality_expression )*

equality_expression:
  expression=expression

示例
编写join查询时，要考虑一些重点：

允许使用复杂的join表达式，如：下方都是有效的联接（join）

select a.* from a join b on(a.id=b.id);

select a.* from a join b on (a.id=b.id and a.department=b.department);

select a.* from a left outer join b on (a.id <> b.id);

在同一个查询中，可以join两个以上的表，如：下方是一个有效的联接（join）

select a.val, b.val, c.val from a join b on (a.key=b.key1) join c on (c.key=b.key2);

假如对于每个表，join子句中使用相同的列，Hive将多个表上的join转换为单个map/reduce job。如：

select a.val, b.val, c.val from a join b on (a.key=b.key1) join c on (c.key=b.key1);

上述例子就被转换成了一个单独的map/reduce job，只有b的key1列参与了联接（join）。另一方面

select a.val, b.val, c.val from a join b on (a.key=b.key1) join c on (c.key=b.key2);

这个示例就被转换成了两个map/reduce job，因为b的key1列用在了第一个联接（join）条件，以及b的key2列用在了第二个上。第一个map/reduce job 联接了a和b，它的结果然后在第二个map/reduce job中联接c。

在联接（join）的每一个map/reduce阶段，在顺序上的最后一个表通过reducers进行流式传输，其他表被缓冲了。因此，通过组织表使得最大的表出现在顺序的最后，帮助减少了reducer中所需的内存，以便联接键的特定值缓冲行。例如：

select a.val, b.val, c.val from a join b on (a.key=b.key1) join c on (c.key=b.key1);

三个表都在一个单独的map/reduce job上被联接了，并且对于表a和b的键的特定值都缓冲reducer内存中。然后对于从c中检索的每一行，联接（join）是随着缓冲的行来计算的。相似于

select a.val, b.val, c.val from a join b on (a.key=b.key1) join c on (c.key=b.key2);

在联接（join）计算中这有两个map/reduce job参与了。第一个联接（join）a与b，缓冲了a的值，在reducer中流式缓冲了b的值。第二个联接（join）在通过reducer流式缓冲了c的值时，这些job缓冲了第一个联接（join）的结果。

在join的每一个map/reduce阶段，可以通过提示来指定要流式传输的表。例如：

select /*+ streamtable(a) */ a.val, b.val, c.val from a join b on (a.key=b.key1) join c on (c.key=b.key1);

三个表都联接（join）在一个单独的map/reduce job里，并且对于表b和c的键的一个特定值都缓存了reducer内存中。然后从表a检索的每一行，join都会随着缓存的行来计算。假如忽略了streamtable提示，在联接（join）中，Hive将流式传输最右边那个表。

为了提供在on子句上有更多的控制，存在left、right、full outer联接（join），而没有匹配的。例如，这个查询：

select a.val, b.val from a left outer join b on (a.key=b.key);

将对a中每一行返回一行。当有一个b.key等于a.key时，输出行将是a.val和b.val；当没有对应的b.key时，输出行将是a.val，null。b中没有对应的a.key的行将被丢弃。为了理解是如何工作的，from a left outer join b语法必须写在一行中。在这个查询中，a是在b的左边，所以a中所有行都将被保留。right outer join将保留所有b的行，full outer join将保留a的所有行。outer join应该符合SQL标准规范。

join发生在before where clauses。所以，假如想限制一个联接的输出，那么在where子句中应该有一个要求，否则它应该在join子句中。这个问题最大的一点疑惑是分区表：

select a.val, b.val from a left outer join b on (a.key=b.key)
where a.ds='2009-07-07' and b.ds='2009-07-07';

将在b上联接（join）a，产生一个a.val和b.val的列。然而，where子句也可以引用join输出的a和b的其他列，然后过滤掉它们。然而，无论何时，来自join的一行

更多的示例可参考Joins-Examples

MapJoin的限制
假如但是所join的表中只有一个是小表，join可以被执行作为只有一个job的map。下方查询：

select /*+ mapjoin(b) */ a.key, a.value
from a join b on a.key=b.key;

上述查询不需要一个reducer。对于a的每一个mapper，b是被完全读取的。
更多可参考Join

0.6 Join优化

Hive 0.11.0+。Hive查询执行计划的优化，以提高Join的效率并减少对用户提示的需要。
Hive优化器的改进

星形join优化

参考JoinOptimization

0.7 Union

Union语法

select_statement union [all | distinct] select_statement unoin [all | distinct] select_statement ...

union用于将来自多个 select语句的结果组合为一个结果集。

Hive 1.2.0之前的版本，只支持union all（bag union），不会去掉重复的行；
Hive 1.2.0+，union的默认行为是从结果中删除重复的行。可选的distinct关键字除了默认值之外没有其他效果，因为它还指定了重复行删除。对于all关键字，不会删除重复的行，结果会包括所有select语句中的所有匹配的行。

参考Union

0.8 Lateral View（侧视图）

lateral view语法

lateralView：lateral view udft(expression) tableAlias as columnAlias(',' columnAlias)*

fromClause：from baseTable (lateralView)*

描述
laterial view 跟用户定义的表生成函数（比如explode()）一起使用。

示例

多lateral view

外lateral view

以后用上再继续补充。

1、子查询Sub Queries

在from子句中的子查询

select ... from (subquery) name ...

select ... from (subquery) as name ...-- Hive 0.13.0起

在Hive 0.12.0中，Hive只在from子句中支持子查询。这个子查询必须给一个名称，因为在一个from子句中的每一个表都必须有一个名称。在子查询select中的列必须有一个唯一的名称。就像一个表中的列一样，在子查询select中的列在外部查询中可用。子查询和union也是一个查询表达式。
在Hive 0.13.0+中，在子查询名词之前，可用包含可选的as关键字。带简单子查询的示例：

select col
from (
  select a+b as col
  from t1
) t2

包含union all的子查询的示例：

select t3.col
from (
  select a+b as col
  from t1
  union all
  select c+d as col
  from t2
) t3

在where子句中的子查询
Hive 0.13.0+，在where子句中，支持一些子查询的类型。这些查询可以将查询结果视为in和not in语句的常量（调用不相关的子查询，因为子查询不引用父查询中的列）。

select *
from a
where a.a in (select foo from b);

其他支持的类型在exists和not exists子句中：

select a
from t1
where exists (select b from t2 where t1.x=t2.y);

这有一些限制：

这些子查询仅在表达式的右侧受支持；
in/not in子查询只能选择一列；
exists/not exists必须有一个或多个相关谓词；
只有子查询的where子句才支持父查询的引用。

2、抽样（samping）

抽样语法：

取样桶表

table_sample：tablesample (bucket x out of y [on colname])

tablesample子句允许用户为数据的样本而不是整个表编写查询。在from子句中，任何表都可以添加tablesample子句。

块取样

Hive 0.8+

更多参考Sampling

3、虚拟列

Hive 0.8.0支持两个虚拟列：

input_file_name，是mapper task的输入文件名称；
block_offset_inside_file，是当前全局文件的位置。

对于块压缩文件，它是当前块文件的偏移，是当前块的第一个字节的文件偏移量。Hive 0.8.0+，添加了下面的虚拟列：

row_offset_inside_block
raw_data_size
row_id
grouping_id

不过这些列出的所有虚拟列都不能用于任何其他目的。
示例：

select input_file_name, key, block_offset_inside_file from src;

select key, count(input_file_name) from src group by key order by key;

select * from src where block_offset_inside_file > 12000 order by key;

4、窗口和分析函数

对Hive QL的增强
Hive 0.11+，本节介绍窗口、分析函数对Hive QL的增强。所有窗口和分析函数都按照SQL标准运行。当前版本支持下方的窗口、分析函数：

窗口函数
- lead，可以选择指定要引导的行数（未指定时，默认是1行）。如果当前行的前导超出窗口末端，则返回null。
- lag，设置滞后的行数
- first_value
- last_value
over子句
- 跟标准聚合一起使用：
  - count
  - sum
  - min
  - max
  - avg
- 跟任何基本数据类型的一个或多个分区列的partition by语句一起使用
- partition by 和order by一起使用
分析函数
- rank
- row_number
- dense_rank
- cume_dist
- percent_rank
- ntile
Hive 2.1.0+支持distinct
Hive 2.1.0+支持在over子句里使用聚合函数

示例
在select语句中使用Hive QL 窗口和分析函数。

参考

5、增强的聚合（aggregation）、多维数据集(cube）、分组（group）和汇总(roll up）

主要是针对select语句中的group by子句的聚合功能的增强。

参考Enhanced Aggregation, Cube, Grouping and Rollup

6、程序语言：hive hpl/sql

Hive 2.0.0+

参考Hive HPL/SQL

7、explain语法

Hive提供了一个explain语法，它显示查询的执行计划。语法：

explain [extended | cbo | ast | dependency | authorization | locks | vectorization | analyze] query

Hive 0.14.0+，支持authorization；
Hive 2.3.0+，支持vectorization；
Hive 3.2.0+，支持locks；

示例：

explain
from src insert overwrite table dest_g1 select src.key, sum(substr(src.value,4)) group by src.key;

参考LanguageManual Explain

官方手册目录

你可能感兴趣的:(Hive,Hive,QL,数据检索,查询,select,from,排序)

Python脚本压缩图片大小，不损害图片质量凉风听雪 Python python 开发语言
Python源码：同步绑定有exe文件，可下载直接使用importosfromPILimportImagedefcompress_images(input_folder,quality):#确定输出文件夹路径为输入路径同级的"out"output_folder=os.path.join(os.path.dirname(input_folder),"out")#确保输出文件夹存在ifnotos.pa
企业级AI搜索引擎从零到一开发实战：全链路技术解析与代码实现
简介从零开始构建一个企业级AI搜索引擎，是掌握现代搜索技术栈的重要实践。本文将深入剖析基于大语言模型、知识图谱和分布式架构的智能搜索引擎开发全流程，从数据抓取、索引构建到查询处理模块，提供完整的代码实现和架构设计。通过整合多平台数据并应用优化策略，构建一个具备高并发处理能力、精准语义理解及高效搜索排序的智能搜索引擎系统。一、架构设计：智能搜索引擎的核心组件智能搜索引擎架构由三个核心模块组成：数据抓
OpenSearch SQL 查询完整指南
OpenSearchSQL查询完整指南目录基础查询字符串查询数值查询日期时间查询数组和嵌套查询聚合查询地理空间查询全文搜索复杂查询性能优化基础查询基本SELECT--查询所有字段SELECT*FROMindex_name;--查询特定字段SELECTname,age,emailFROMusers;--使用别名SELECTnameASuser_name,ageASuser_ageFROMusers;
银川最全20家可以做无创亲子鉴定中心机构名单（附2024年查询名录）中检国权有限公司
在银川，无创胎儿亲子鉴定正成为越来越多家庭关注的焦点。你或许会好奇，什么是无创胎儿亲子鉴定呢？它是一种先进的亲子鉴定技术，专门针对孕期中的胎儿与疑似父亲之间的亲子关系进行准确判定。在银川，这项技术为那些处于特殊时期、有着特殊需求的家庭带来了新的希望和选择。它无需像传统亲子鉴定那样进行侵入性采样，避免了对孕妇和胎儿可能造成的伤害风险。它以其安全、准确、便捷的特点，正逐渐改变着人们对亲子鉴定的认知。让
SQL中EXPLAIN命令详解 FSW... mysql 数据库 sql
SQL中EXPLAIN命令详解explain显示了mysql如何使用索引来处理select语句以及连接表。可以帮助选择更好的索引和写出更优化的查询语句。使用方法，在select语句前加上explain就可以了：如:explainselectsurname,first_nameforma,bwherea.id=b.id1、EXPLAINtbl_nameEXPLAINtbl_name是DESCRIBE
Elasticsearch 聚合查询源码解读与架构方法论北漂老男人 Elasticsearch elasticsearch 架构大数据搜索引擎全文检索
Elasticsearch聚合查询源码解读与架构方法论01.引言Elasticsearch的聚合查询（Aggregation）是大规模分布式数据分析的核心能力。理解其源码结构与设计方法论，不仅有助于高效使用聚合，也能为自定义扩展、性能优化、集群运维等提供理论与实践基础。本文将从源码结构、核心模块、关键实现、行级注释与方法论出发，系统剖析聚合查询的底层原理。02.源码结构与核心模块2.1聚合相关源码
CSS实现前端响应式布局
一、响应式布局概述响应式布局的定义与重要性响应式布局是一种能够使网页在不同设备上（如桌面电脑、平板电脑、手机等）都能呈现出良好视觉效果和用户体验的设计方法。它通过使用灵活的布局、可适应的图像和媒体查询等技术，确保网页能够根据设备的屏幕尺寸、分辨率和方向进行自动调整和优化。在当今数字化时代，响应式布局至关重要。随着移动设备的广泛使用，用户越来越多地通过各种设备访问网页。如果网页不能在不同设备上良好地
我在黑马程序员学web前端新手来了@click 前端
1网页由三部分组成1.、html负责网页的结构2.css、负责网页的美化，控制网页元素的样式3、js，负责网页交互html常见的标签：1、form表单input输入框select下拉菜单option下拉列表2、table表格thead表头ｔｂｏｄｙ是表体tr行th表头加粗ｔｄ是列ｂｒ是换行2/CＳＳ常见的三种引入方式行内样式、内部样式、外部样式用ｌｉｎｋ关键字常用的元素选择器：标签选择器、id选择
Leetcode703. 数据流中的第K大元素 LonnieQ
题目设计一个找到数据流中第K大元素的类（class）。注意是排序后的第K大元素，不是第K个不同的元素。你的KthLargest类需要一个同时接收整数k和整数数组nums的构造器，它包含数据流中的初始元素。每次调用KthLargest.add，返回当前数据流中第K大的元素。示例:intk=3;int[]arr=[4,5,8,2];KthLargestkthLargest=newKthLargest(
数据结构排序算法总结（C语言实现） xienda 排序算法数据结构算法
以下是常见排序算法的总结及C语言实现，包含时间复杂度、空间复杂度和稳定性分析：1.冒泡排序(BubbleSort)思想：重复比较相邻元素，将较大元素向后移动。时间复杂度：O(n²)（最好O(n)，最坏O(n²))空间复杂度：O(1)稳定性：稳定voidbubbleSort(intarr[],intn){for(inti=0;iarr[j+1]){//交换相邻元素inttemp=arr[j];arr
前端学习路线推荐 oldfifteen
第一阶段：HTML+CSS:HTML进阶、CSS进阶、div+css布局、HTML+css整站开发、JavaScript基础：Js基础教程、js内置对象常用方法、常见DOM树操作大全、ECMAscript、DOM、BOM、定时器和焦点图。JS基本特效：常见特效、例如：tab、导航、整页滚动、轮播图、JS制作幻灯片、弹出层、手风琴菜单、瀑布流布局、滚动事件、滚差视图。JS高级特征：正则表达式、排序算
分治算法---归并
1、排序数组classSolution{vectortmp;public:vectorsortArray(vector&nums){tmp.resize(nums.size());mergeSort(nums,0,nums.size()-1);returnnums;}voidmergeSort(vector&nums,intleft,intright){if(left>=right)return;
基于 Qwen-Agent 与 MCP 实现阿里云 ECS 实例查询（含完整代码与实操）
✅关键词：Qwen-Agent、MCP、阿里云、运维、LLM、FunctionCalling在现代云运维场景中，我们不仅希望大语言模型（LLM）能回答文本问题，更希望它能直接调用云端API、查询资源，实现「智能运维」。本文将分享如何基于Qwen-Agent和MCP，快速实现一个“云资源助手”，能帮你查询阿里云ECS实例信息。什么是MCP？MCP(Model-ComputingPlatform)是阿
MongoDB复杂查询聚合框架巴里巴气 MongoDB知识记录 mongodb 数据库
前言前面已经对MongoDB基础的增删改查进行了分享,在增删改方面基本已经够用了,但是查询方面是远远不够的,find方法只能传入一些查询条件。涉及到稍微复杂点的查询就无法实现了,如分组、排序、映射(起别名)等这些操作的时候就没有办法实现。所以我接下来给同志们分享专一用于MongoDB复杂查询的框架-----聚合框架注意:文档和JSON对象基本上是一个意思,我会在解释的时候说是JSON对象,便于理解
排序算法—交换排序（冒泡、快速）（动图演示）每天都要进步1 排序算法排序算法算法
目录十大排序算法分类编辑冒泡排序算法步骤：动图演示：性能分析：代码实现（Java）：快速排序（挖坑法）算法步骤：动图演示：性能分析：代码实现（Java）：十大排序算法分类本篇分享十大排序算法中的需要进行交换操作的冒泡排序与快速排序,其余算法也有介绍噢（努力赶进度中，后续会添加上）冒泡排序冒泡排序是一种非常直观的排序算法，遍历数组，每次比较两个元素，如果后者比前者小则交换位置，重复的进行直至没有再需
一维数组练题习~ 遇见尚硅谷初学者算法数据结构 c语言开发语言排序算法
1.键盘录入一组数列，利用冒泡排序将数据由大到小排序/*************************************************************************>FileName:demo01.c>Author:阮>Description:>CreatedTime:***********************************************
python连接数据库的方法,Python 连接数据库的多种方法 AI MIU python连接数据库的方法
JZGKCHINAPython是一种计算机程序设计语言，它是一种动态的、面向对象的脚本语言。它是一种跨平台的，可以运行在Windows，Mac和Linux/Unix系统上。在日常使用中需要对大量数据进行数据分析，那么就必然用到数据库，我们常用的数据库有SQLServer,MySQL,Oracle,DB2,SQLite，Hive，PostgreSQL,MongoDB还有其他常用的MicrosoftA
java8的stream流常用用法sorted l1o3v1e4ding 后端开发热点代码 java 开发语言
java8的stream流常用用法持续更新~~，用法案例，项目开发中方便寻找一.排序stream().sorted()1.缺省排序字段：以类属性一升序排序2.带排序字段：以类属性一升序排序，推荐Comparator.reverseOrder()2.1.升序：不加参数即可2.2.降序：reversed()和Comparator.reverseOrder()，有区别：2.3.案例：注意两种写法3.多属
jxORM--整体说明 jxandrew jxWebUI 数据库 python ORM
系列文章目录：jxORMI–编程指南jxORM是配套jxWebUI使用的数据库操作库。使用说明jxORM的使用非常简单，主要包括几个步骤：1、导入依赖fromjxORMimportjxORMLogger,ORM,DBDataType,ColType,jxDB2、设置数据库连接#用默认设置，设置本地的mysql数据库连接jxDB.set('testDB',password='password')目前
EXPLAIN 解码：MySQL 索引优化的黄金决策术渡难繁辰数据库 mysql sql mysql 数据库 sql
引言在MySQL数据库中，索引是优化查询性能的核心工具。但盲目添加索引会导致写性能下降和存储浪费，而缺少关键索引又会引发全表扫描的灾难。如何科学决策？答案在于深入分析查询执行计划——EXPLAIN。本文将聚焦如何通过EXPLAIN诊断查询瓶颈，精准制定索引策略。一、EXPLAIN的核心字段解读EXPLAIN输出结果中的关键字段揭示了查询的执行逻辑，以下为需重点关注的列：1.type列：查询访问数据
（2）React的JSX语法 __method__
JSX−JSX是JavaScript语法的扩展。React开发不一定使用JSX，但我们建议使用它。要使用自定义的组件，要以大写字母开始自行编辑一个todolist页面首先在src下面创建src/TodoList.js，输入以下代码importReact,{Component}from"react";classTodoListextendsComponent{render(){return(todo
MybatisPlus-13.扩展功能-DB静态工具天上掉下来个程小白微服务数据库 mybatisplus 微服务 springboot java
一.DB静态工具我们来看mp提供的第二个扩展功能——DB静态工具。首先我们来看Db类中都提供了哪些静态方法。其中save方法用来新增，update方法用来更新，remove用来删除，list用来查询(批量)，count用来计数，get用来查询(ById：根据id查询，One：查一个)，page分页查询，lambdaQuery查询，lambdaUpdate更新。由于这些都是静态方法，这就导致在方法的
基于Docker构建Python后端项目落地总结
Docker使用总结基于Dockerfile的镜像构建示例dockerfile解析#加载centos7的最小镜像源FROMcentos:7RUNyumcleanallRUNyum-yupdate#修改时区RUNln-sf/usr/share/zoneinfo/Asia/Shanghai/etc/localtime&&echo"Asia/Shanghai">/etc/timezone#安装中文支持R
服务器与工控机的区别解析 D-海漠其他
服务器和工控机虽然都是计算机，但它们的设计目标、使用环境和核心特性有本质的区别，就像轿车和越野车虽然都是车，但用途和构造截然不同。以下是它们的主要区别：核心设计目标：服务器：数据处理、存储、网络服务和应用托管。核心目标是高性能、高吞吐量、高可靠性、可扩展性和高可用性（通常通过集群、冗余实现）。它需要处理海量并发请求（如网页服务、数据库查询、文件共享、虚拟化等）。工控机：工业环境中的过程控制、数据采
纯色图片生成器准时准点睡觉人工智能 pyqt
就是在测试代码的时候有时候会用到一些纯色的图片进行测试，后面突发奇想才搞了一个纯色生成器玩玩，有需要的可以三连自取哦~一键生成高清纯色背景，满足设计、演示、测试需求。支持自定义颜色代码，快速导出PNG。效果如下：代码如下：importsysfromPyQt5.QtWidgetsimport(QApplication,QMainWindow,QWidget,QVBoxLayout,QHBoxLayo
Java List 集合详解：从基础到实战，掌握 Java 列表操作全貌大葱白菜 java合集 java 开发语言后端学习个人开发
作为一名Java开发工程师，你一定在项目中频繁使用过List集合。它是Java集合框架中最常用、最灵活的数据结构之一。无论是从数据库查询出的数据，还是前端传递的参数列表，List都是处理这些数据的首选结构。本文将带你全面掌握：List接口的核心方法与特性常见实现类（如ArrayList、LinkedList、Vector、CopyOnWriteArrayList）List的遍历、增删改查、排序、线
十种常用数据分析模型耐思nice～数据分析数据分析人工智能机器学习数学建模
1-线性回归（LinearRegression）场景：预测商品销售额优点：简单易用，结果易于解释缺点：假设线性关系，容易受到异常值影响概念：建立自变量和因变量之间线性关系的模型。公式：[y=b_0+b_1x_1+b_2x_2+...+b_nx_n]代码示例：importpandasaspdfromsklearn.linear_modelimportLinearRegressionfromsklea
Saprk中RDD詳解文子轩
一.常用的transfromRDD算子通過並行化scala創建RDDvalrdd1=sc.parallelize(Array(1,2,3,4,5,6,7,8))查看該RDD的分區數量rdd1.partitions.lengthres23:Int=4使用filter算子valrdd2=sc.parallelize(List(5,6,4,7,3,8,2,9,1,10)).map(*2).sortBy(
HTTPS，不可或缺的数据安全锁 Arwen303 SSL证书 https 网络协议 http
一、HTTPS：数字时代的"隐形护卫"在网购时输入银行卡信息、登录社交平台发送私信、通过企业OA系统上传文件，这些日常操作背后都藏着一把无形的"安全锁"——HTTPS。↓https://www.joyssl.com/certificate/select/joyssl-dv-single-free-1.html?nid=59↑（注册码230959，赠送1个月有效期）它如同数据传输的"保险箱"，在客户
ORACLE物化视图materialized view Caster_Z oracle
物化视图会占用空间，一半可用于大量数据查询时，减缓主表的查询压力使用。例如创建一个物化视图，让对接单位查询。ONDEMAND：仅在该物化视图“需要”被刷新了，才进行刷新(REFRESH)，即更新物化视图，以保证和基表数据的一致性；ONCOMMIT：一旦基表有了COMMIT，即事务提交，则立刻刷新，立刻更新物化视图，使得数据和基表一致。1，创建creatematerializedviewmv_nam
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，

[Hive] 07 - HQL：数据检索-查询（select）

0、Select语法

0.0 group by

0.1 Order/Sort/Distribute/Cluster By

0.1.0 order by

0.1.1 sort by

0.1.2 cluster by和distribute by

0.2 转换和Map-Reduce 脚本

0.3 操作符和用户自定义函数（UDFs）

0.4 XPath UDF

0.5 Join-联接

0.6 Join优化

0.7 Union

0.8 Lateral View（侧视图）

1、子查询Sub Queries

2、抽样（samping）

3、虚拟列

4、窗口和分析函数

5、增强的聚合（aggregation）、多维数据集(cube）、分组（group）和汇总(roll up）

6、程序语言：hive hpl/sql

7、explain语法

你可能感兴趣的:(Hive,Hive,QL,数据检索,查询,select,from,排序)

0.1.0 `order by`

0.1.1 `sort by`

0.1.2 `cluster by`和`distribute by`