执行计划分析 · datalake · 正则表达式(20220625)


一、背景

 本文介绍正则表达式解析数据分析引擎所产生的执行计划,最后能够以易懂的方式分析执行计划,进而为SQL优化提供帮助。

二、正则表达式

基础语法: "^([]{})([]{})([]{})$"

正则字符串 = "开始([包含内容]{长度})([包含内容]{长度})([包含内容]{长度})结束"

二、解析案例

1.Gather Motion

输入:Gather Motion 2:1  (slice1; segments: 2)  (cost=0.00..431.00 rows=1 width=8)

规则:(.*) \((cost=(.*)\.\.(.*) ){0,1}rows=(.*) width=(.*)\)

解读:"(.*)任意长度文本"   "\( 转义左括号"  

            "cost=文本开头 (.*)任意文本  \.\. 两个点 (.*) 任意文本 ){0,1} 长度为0或1" 

图1 类型匹配

2.域段分解

图3 域段


三、项目代码

https://github.com/sinwaj/planchecker

你可能感兴趣的:(执行计划分析 · datalake · 正则表达式(20220625))