HiveSQL 窗口函数

HiveSQL窗口函数

窗口函数的主要作用是对数据进行分组排序、求和、求平均值、计数等。

一、窗口函数的基本语法

<分析函数> over ([partition by <列清单>] order by <排序用列清单> [rows between 开始位置 and 结束位置])

理解窗口函数的基本语法:

​over()函数中包括三个函数:

  1. 包括分区 partition by 列名
  2. 排序 order by 列名
  3. 指定窗口范围 rows between 开始位置 and 结束位置。我们在使用over()窗口函数时,over()函数中的这三个函数可组合使用也可以不使用。

​over()函数中如果不使用这三个函数,窗口大小是针对查询产生的所有数据,如果指定了分区,窗口大小是针对每个分区的数据。

1.1 partition by

partition by划分的范围被称为窗口,这也是窗口函数的由来。

1.2 order by

order by决定着窗口范围内的数据以什么样的方式排序。

1.3 rows between 开始位置 and 结束位置

​指的是指定窗口范围,比如第一行到当前行。而这个范围是随着数据变化的。over(rows between 开始位置 and 结束位置)搭配分析函数时,分析函数按照这个范围进行计算的。

窗口范围说明:

​我们常使用的窗口范围是ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW(表示从起点到当前行),常用该窗口来计算累加。

二、函数执行顺序

在加入窗口函数的基础上SQL的执行顺序也会发生变化,具体的执行顺序如下(window就是窗口函数):
在这里插入图片描述

三、窗口函数的类型

专用窗口函数例如rank、row_number、lag和lead等,在窗口函数中有静态函数和动态函数的分类,具体的划分如下
HiveSQL 窗口函数_第1张图片

关注林哥,持续更新哦!!!★,°:.☆( ̄▽ ̄)/$:.°★ 。

你可能感兴趣的:(Oracle,笔记,sql,数据库,hive)