MYSQL lag() 和lead()函数使用介绍

LAG()函数是一个窗口函数,允许您从当前行向前看多行数据。与LEAD()函数类似,LEAD()函数对于计算同一结果集中当前行和后续行之间的差异非常有用。

LAG语法:LAG(列名,[offset], [default_value]) OVER ( PARTITION BY 列名,... ORDER BY 列名 [ASC|DESC],... )

LEAD语法:LEAD(列名,[offset], [default_value]) OVER ( PARTITION BY 列名,... ORDER BY 列名 [ASC|DESC],... )

offset:offset是从当前行偏移的行数,以获取值。offset必须是一个非负整数。如果offset为零,则LEAD()函数计算当前行的值。如果省略 offset,则LEAD()函数默认使用一个。
default_value:如果没有后续行,则LEAD()函数返回default_value。例如,如果offset是1,则最后一行的返回值为default_value。如果您未指定default_value,则函数返回 NULL 。
PARTITION BY子句:PARTITION BY子句将结果集中的行划分LEAD()为应用函数的分区。如果PARTITION BY未指定子句,则结果集中的所有行都将被视为单个分区。
ORDER BY子句:ORDER BY子句确定LEAD()应用函数之前分区中行的顺序。

用途举例:

  1. 查找每个客户的订单日期和下一个订单日期
  2. 查找连续X天登录、下单、签到的用户

ps:
不适合计算留存,举例说明:
求3日留存用户,以下为用户登录表login_history_table:

user_id login_day
abc 20211022
abc 20211023
abc 20211025
abc 20211026

首先使用LEAD函数对用户登录时间做偏移,SQL如下:

SELECT user_id,login_day
    LEAD (login_day) OVER(PARTITION BY user_id ORDER BY login_day) AS day1
    FROM login_history_table

结果如下:

user_id login_day day1
abc 20211022 20211023
abc 20211023 20211025
abc 20211025 20211026
abc 20211026 null

根据上面查询到的结果,3日留存用户中不能统计到abc,而实际应该包含abc,因为该用户20211022登录后,在3天后的20211025日又重新登录了。

你可能感兴趣的:(MYSQL lag() 和lead()函数使用介绍)