ODPS基础语法

系统参数

目前系统参数有两个,这两个系统参数只要代码里用到,不需要做额外的赋值动作,节点自动调度的时候就会自动替换。系统参数分别为:

${bdp.system.bizdate}
格式为yyyymmdd,日常调度实例定时时间的前一天(年月日)。节点每天自动调度实例定时时间年月日减1天。
正常调度时,比如:任务定时在14号凌晨执行,那么${bdp.system.bizdate}替换的结果是13号。
测试,补数据时,比如:业务日期选择为12号,那么${bdp.system.bizdate}替换的结果是12号。
${bdp.system.cyctime}
格式为yyyymmddhh24miss,日常调度实例定时时间(年月日时分秒)。yyyy表示4位数年份,mm表示2位数月份,dd表示2位数天,hh24表示24小时制的时,mi表示2位数分钟,ss表示2位数秒。
正常调度时,比如:任务定时在14号凌晨1点整执行,那么${bdp.system.cyctime}替换的结果是 当天yyyymm140100。
测试,补数据时,比如:业务日期选择为12号(任务调度时间配置为每天凌晨1点整执行),那么${bdp.system.cyctime}替换的结果是 所选业务日期的yyyymm130100。

常用函数

SUM()
COUNT()
toupper(""aBcd"") = ""ABCD""  // 转化为大写
若trans_date = 2005-02-28 00:00:00, dateadd(transdate, 1, 'mm') = 2005-03-28 00:00:00 // dateadd()时间的加减
to_date('20080718', 'yyyymmdd') = 2008-07-18 00:00:00 // 字符串转换成时间
to_char('2008-07-18 00:00:00', 'yyyymmdd') = '20080718' // 时间转换成字符串
datetrunc(2011-12-07 16:28:46, 'month') = 2011-12-01 00:00:00 // 时间的截取
datepart('2013-06-08 01:10:00', 'mm') = 6 // 返回时间的部分内容
若start = 2005-12-31 23:59:59,end = 2006-01-01 00:00:00,datediff(end, start, 'dd') = 1 // 返回时间差
round(125.315, 2) = 125.32 // 截取有效位数,四舍五入
单位 字符串(忽略大小写) 有效值域
yyyy / year 0001 ~ 9999
mm / month / mon 01 ~ 12
dd / day 01 ~ 28,29,30,31
hh / hour 00 ~ 23
mi 00 ~ 59
ss 00 ~ 59

基础语法

1.选择数据:

IN,  NOT IN // 在...之中
LIKE, NOT LIKE // 像...
<> // 不等于
SELECT * 
FROM bi_item
WHERE status NOT IN ('cancel_trade', 'cancel')
 AND platform NOT LIKE '%批发%'
 AND trade_type <> 4;

2.分组标记统计:

SELECT *
FROM (
 SELECT platform_item_id,create_time,item_sku
 , ROW_NUMBER() OVER (PARTITION BY platform_item_id ORDER BY create_time DESC) AS seq
 FROM bi_platform_item
) emp;
// 按照platform_item_id分组,按照create_time降序,将排序结果作为 seq字段

结果:

ODPS基础语法_第1张图片
Paste_Image.png

3.添加序号:

SELECT item_sku,
 ROW_NUMBER() OVER(PARTITION BY 1 order by item_sku) 
AS nums
FROM bi_item;

4.分段排除数据:in和not in 中数据限制在1000,当需要排除的数据超过1000,可用分段排除

SELECT *
FROM bi_item
WHERE item_sku NOT IN (
 SELECT item_sku
 FROM tmp_1_item
 WHERE nums <= 1000
 )
 AND item_sku NOT IN (
 SELECT item_sku
 FROM tmp_1_item
 WHERE nums > 1000
 AND nums <= 2000
 );

�5.根据条件选择不同数据(也可用于设置查询结果的默认值):

SELECT *
 , CASE 
 WHEN item_price < 10 THEN '0-10'
 WHEN item_price < 100 THEN '10-100'
 ELSE '100-300'
 END AS wave
FROM bi_crm_order

第二种:

SELECT 
 if(length(style)>0,style,"")
 , if(qty>0,qty,0)
FROM tmp_item

6.条件不等连接查询:

SELECT /*+mapjoin(all_p)*/ all_p.platform
FROM tmp_all_platform all_p
JOIN tmp_platform tmp
ON char_matchcount(all_p.platform, tmp.platform) >= LENGTH(tmp.platform)
// char_matchcount():返回两个字段中相同的字符数

不等连接查询2:

SELECT  tmp.item_sku
    , if(length(all_p.platform)>0,all_p.platform,tmp.platform)
FROM tmp_platform tmp 
LEFT OUTER JOIN (
    SELECT platform,
    substr(platform, length(split_part(platform,'-',1))+2, length(platform)) as splatform
    FROM tmp_all_platform
)  all_p
ON tmp.platform = all_p.splatform;

参考:
https://help.aliyun.com/document_detail/27810.html?spm=5176.doc27809.6.572.aw24p5
https://yq.aliyun.com/articles/67084?spm=5176.100239.blogcont67083.15.Y8KSlR

你可能感兴趣的:(ODPS基础语法)