API原理概念篇(六)玩转正则表达式等常用API

  玩转正则表达式等常用API

①  正则

1、openresty存在'两套'正则表达式规范

 1) lua自身'独有'的正则规范   

 备注:大约有'5%~15%'性能损耗

 损耗原因:表达式'compile'成pattern,并不会被缓存,每次都会被重新'compile'编译

 2) nginx的符合'POSIX'规范'的PCRE'正则规范  --> 推荐并'强制'使用

API原理概念篇(六)玩转正则表达式等常用API_第1张图片

ngx.re模块和lua正则匹配的区别

②  ngx.re API的来源

lua-resty-core 提供ngx.re.split      lua-nginx-module提供ngx.re API

涉及: 'match、find、sub、gsub、gmatch'、'split、opt'函数

关注点: 函数的'参数'、'作用域'

③  ngx.re.match

语法: captures, err = ngx.re.match(subject, regex, options?, ctx?, res_table?)

关注: '入参含义'、'可选项'、'返回值'

补充: 参数subject和regex是'必须'的,而后三个options、ctx、res_table都可以'省略'

captures[n]是匹配的'子表达式';如果未找到匹配或者出错,那么captures就是nil,err 是错误信息

附加: captures '说明'

  1) captures 是'table'类型

  2) captures[0]存储匹配出的'完整'子字符串

  3) 其他'从1开始'的元素存储regex指定的'捕获'

常用: regex 'pattern' 用'变量'代替

1、基本'解读'

 1) 如果'有匹配'结果,返回'第一个'匹配的结果
 
 2) 如果'没有匹配'的结果,value=nil

 3) 如果出现'异常',value=nil,err为'异常'信息

API原理概念篇(六)玩转正则表达式等常用API_第2张图片

说明: 以下'四个'官方案例,不使用'options'和''

API原理概念篇(六)玩转正则表达式等常用API_第3张图片

2、regex 'pattern解读' --> 'PCRE'正则

nginx中使用的PCRE正则 

3、可选'options'参数解读

推荐: "oj" 参数  --> "双引号"

x: 允许在'模式中'加入任何数量的'空白'

API原理概念篇(六)玩转正则表达式等常用API_第4张图片

补充: 'o'选项的解读

说明: 'u'选项的'案例'

4、可选'ctx'参数解读

API原理概念篇(六)玩转正则表达式等常用API_第5张图片

API原理概念篇(六)玩转正则表达式等常用API_第6张图片

5、可选'res_table'参数解读  --> "了解"

解读: 存储'所有匹配'的结果,相当于'返回值captures',有利于'重用内存'

API原理概念篇(六)玩转正则表达式等常用API_第7张图片

res_table案例

④  ngx.re.find

1: 上下文  --> '思考:常用在哪个阶段?'

2: synax '语法'

关注点: 可选入参 'nth?'、返回值 'from、to、err'

备注: 其它'入参解读'参见 'ngx.re.match'函数讲解

3: 基本'解读'

 1) 如果'有匹配'结果,start、end表示'第一个匹配'的'起、始'索引位置

 细节点: 好好体回'第一个匹配'的含义

 2) 如果'没有'匹配的结果,start、end=nil

 3) 如果出现'异常',start、end=nil,err为'异常'描述信息

备注: 返回值根据'不同'的匹配结果,是'动态'的

API原理概念篇(六)玩转正则表达式等常用API_第8张图片

4、应用'场景'的强调

场景:当只需要判断'是否能匹配到'时推荐使用'find'而不是match方法

原因:因为该方法'不会'产生'新'的lua tables,'速度'更快

5、对可选入参'nth'的解读

API原理概念篇(六)玩转正则表达式等常用API_第9张图片

⑤  ngx.re.gmatch

1: '基本解读'

 1) 语法格式:value, err = ngx.re.match(subject, pattern, options?)
 
 2) 返回'迭代器',可'遍历'输出'匹配'数据

 3) 如果出现'异常',value=nil,err为'异常'信息

API原理概念篇(六)玩转正则表达式等常用API_第10张图片

2:案例'讲解'

API原理概念篇(六)玩转正则表达式等常用API_第11张图片

⑥  ngx.re.sub

1:基本'解读'

 1) 语法格式:newStr, n, err = ngx.re.sub(subject, pattern, replace, options?)

 2) 功能:将'第一个匹配的字符串'替换为'replace',返回'替换后'的字符串'newstr'

 备注: '返回 n'表示替换的'次数 (0或者1)'

 附加: sub --> 'substitutes' --> '替换'

API原理概念篇(六)玩转正则表达式等常用API_第12张图片

2: 案例'讲解'

案例1: 'replace'是'字符串'的形式

 1) replace中'$0'、'$1'、'${n}'的含义

 2) 只能使用'$'转义'$'获取'$'字面字符,不能使用'\'进行转义

API原理概念篇(六)玩转正则表达式等常用API_第13张图片

案例2: 'replace'是'function'的形式,此时'match table'是'replace function'的入参

API原理概念篇(六)玩转正则表达式等常用API_第14张图片

⑦  ngx.re.gsub

syntax: res, err = ngx_re.split(subject, regex, options?, ctx?, max?, res?)

API原理概念篇(六)玩转正则表达式等常用API_第15张图片

⑧  ngx.re.split

1: '导读'

API原理概念篇(六)玩转正则表达式等常用API_第16张图片

2: 基本'语法'解读

细节:

  1) split是lua-resty-core 库的一部分,能够非常轻松地'切分'字符串

  2) 但它'没有内置'在ngx.re表内,必须'显式加载ngx.re模块'才能使用

   reqire("ngx.re").split  --> '显式加载'ngx.re模块,这里'不复用'
3: '案例1'讲解 --> 不同的'regex'分割形式

 形式1: regex --> "(,)"

 形式2: regex --> ""

API原理概念篇(六)玩转正则表达式等常用API_第17张图片

4: '案例2'讲解 --> options为'nil',ctx含有'pos'字段

API原理概念篇(六)玩转正则表达式等常用API_第18张图片

5:max '可选'参数解读 --> '参数5'

场景: 在'己知'可能的字串数量的时候可以'提前'结束匹配,提高'效率'

API原理概念篇(六)玩转正则表达式等常用API_第19张图片

6:res '可选'参数解读 --> '参数6'  --> '了解即可'

API原理概念篇(六)玩转正则表达式等常用API_第20张图片

⑨  require "ngx.re".opt

API原理概念篇(六)玩转正则表达式等常用API_第21张图片

相关参考

API原理概念篇(六)玩转正则表达式等常用API_第22张图片

⑪  openresty的正则指令

1: 'lua_regex_match_limit'  --> 限制'回溯'次数

lua_regex_match_limit

API原理概念篇(六)玩转正则表达式等常用API_第23张图片

如何彻底避免正则表达式的灾难性回溯

API原理概念篇(六)玩转正则表达式等常用API_第24张图片

lua_regex_cache_max_entries 

2: 'lua_regex_cache_max_entries'  --> 正则'缓存'

API原理概念篇(六)玩转正则表达式等常用API_第25张图片

⑩  正则转义

1、在'*_by_lua_block'中使用:

1)  需要\\\\d表示\d,因为ngxin.conf会将'\\\\d'解析成\\d,再在lua中解析成\d

2) 使用[[...]],在[[...]]里可以'直接被lua用',像这样[[\\d]]

2、在'*_by_lua_file'中使用:

1) \\d被lua解析一次为\d

2) 用[[...]],直接使用'[[\d]]'

备注:其他'转义字符'同理 

案例:ngx.re.match(str,[[\w+z]],'ijo') --> 忽略大小写,'编译并缓存'

openresty编程最佳实践   令牌桶算法的限流实例   正则 [[]]案例

OpenResty动态反向代理域名的实践

lua自身的正则表达式

openresty最佳实践    注解5

nginx'内存'泄露: gdb、nmmap、'火焰图'等

你可能感兴趣的:(Openresty,正则表达式,ngx.re,PCRE)