玉米侠爱吃玉米

正则表达式与文本三剑客（sed grep awk）

一，正则表达式

（一）正则表达式相关定义

1，正则表达式含义

REGEXP： Regular Expressions，由一类特殊字符及文本字符所编写的模式，其中有些字符（元字符）不表示字符字面意义，而表示控制或通配的功能，类似于增强版的通配符功能，但与通配符不同，通配符功能是用来处理文件名，而正则表达式是处理文本内容中字符。

2，正则表达式支持的语言

vim, less,grep,sed,awk, nginx,mysql 等

3，正则表达式分类

基本正则表达式
扩展正则表达式
编程语言支持的高级正则表达式

4，基础正则表达式扩展正则表达式区别

grep sed默认使用基础正则表达式

grep -E、sed -r、egrep、awk扩展正则表达式

扩展正则表达式加\

（二）元字符（字符匹配）

1，常用元字符

2，元字符（.）的介绍

. 匹配任意单个字符，可以是一个汉字

[root@localhost ~]#ls /etc/|grep rc[.0-6]
#此处的点代表字符
rc0.d
rc1.d
rc2.d
rc3.d
rc4.d
rc5.d
rc6.d
rc.d
rc.local

[root@localhost ~]#ls /etc/ | grep 'rc\.'
#点值表示点需要转义
rc.d
rc.local

3,元字符 [ ] 的介绍

[root@localhost ~]# ls |grep '[zhou].txt'
#匹配[]中任意一个字符
h.txt
o.txt
u.txt
z.txt

[a-z] 小写字母

[A-Z] 大写字母

[root@localhost ~]# ls |grep '[^a-z].txt'
#显示非小写字母

（三）表示次数表示一个qq 号码

1，常用表示次数的元字符

小技巧: 怎么去记 \{n\} 把斜杠看成转义符

2，匹配规则

h[abcde] 先去匹配 hello h[abcde] 再去匹配world

匹配 1到5 和9

（四）位置锚定

（五）分组或其他

1，定义

分组：( ) 将多个字符捆绑在一起，当作一个整体处理，如：(root)+

后向引用：分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中，这些变量的命名

方式为: \1, \2, \3, ... 分组

\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符

或者：\|

2，例子

2.1 匹配ccc三次

[root@localhost ~]#echo abccc |grep "abc\{3\}"
abccc

2.2 匹配 abc 三次

[root@localhost ~]#echo abcabcabc |grep "$abc$\{3\}"
#分组匹配abc

2.3 匹配 1或 2abc

[root@localhost ~]#echo 1abc |grep "1\|2abc"
#只匹配了1
1abc

2.4 匹配 1abc 或者 2abc

[root@localhost ~]#echo 1abc |grep "$1\|2$abc"
#1abc或者2abc
1abc

2.5 提取ip地址

[root@localhost ~]#ifconfig ens33|grep netmask|grep -o '$[0-9]\{1,3\}\.$\{3\}[0-9]\{3\}'|head -1
192.168.91.100

二，扩展正则表达式（表示字符相差不大）

grep -E 或者egrep

（一）表示次数

* 匹配前面字符任意次
? 0或1次
+ 1次或多次
{n} 匹配n次
{m,n} 至少m，至多n次
{,n} #匹配前面的字符至多n次,<=n，n可以为0
{n,} #匹配前面的字符至少n次,<=n，n可以为0

（二）表示分组

() 分组
分组：() 将多个字符捆绑在一起，当作一个整体处理，如：$root$+
后向引用：\1, \2, ...
| 或者
a|b #a或b
C|cat #C或cat
(C|c)at #Cat或cat

（三）例子

1，表示qq号

[root@localhost ~]#echo "aa940132245" |grep "\b[0-9]\{6,12\}\b"

位置锚定后，像aa940132245这种杂项就不会被过滤了

这样我们只会过滤我们想要的 qq号

前后加\b 位置锚定

如 grep name 可能会匹配 hostname

grep "\bname\b" 只会匹配name 前后的\b 相当于符号，电脑可以识别

2, 表示邮箱

echo "[email protected]" |grep -E "[[:alnum:]_-]+@[[:alnum:]_]+\.[[:alnum:]_]+"

3，表示手机号

echo "13705173391"|grep -E "\b1[3456789][0-9]{9}\b"

三，grep

（一）通式

grep [选项]… 查找条件目标文件

（二）选项

（三）选项详细介绍

1，grep 支持标准输入，标准输出，文件内容

2，-m 1 匹配一次就停止

3, -i 忽略大小写

4， -c 行数

5，-o 显示匹配内容

6，-A 匹配后三行 -B 匹配前三行 -C 匹配前后三行

7， -e 或

8， -E 启用扩展正则，grep 默认基本正则

9，-W 匹配单词

和正则表达式 \b 用途相似

10， -r递归目录，但不处理软链接 -R递归目录，但处理软链接muku

目录文件夹！！！！！！

（四）示例

1，提取 ip

+ 表示1 或多次

[root@localhost yum.repos.d]# ifconfig ens33 |grep -o "[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+"
192.168.91.100
255.255.255.0
192.168.91.255

[root@localhost yum.repos.d]# ifconfig ens33 |grep -o "[0-9]\+\.[0-9]\+\.[0-9]\+\.[0-9]\+"|head -1
192.168.91.100

2，统计当前主机的连接状态

[root@localhost ~]# ss -nta | grep -v '^State' |cut -d" " -f1|sort |uniq -c

3，统计当前连接主机数

[root@localhost ~]#ss -nt |tr -s " "|cut -d " " -f5|cut -d ":" -f1 |sort|uniq -c

四，sed

（一）sed 介绍

sed 即 Stream EDitor，和 vi 不同，sed是行编辑器，读取一行处理一行。

用于大文件，电脑内存不够，vim打不开大于内存大小的文件

（二）基本用法

sed [option]... 'script;script;...' [input file...]
选项自身脚本语法支持标准输入管道

1，常用选项

常用选项：
-n 不输出模式空间内容到屏幕，即不自动打印
-e 多点编辑[root@www data]#sed -n -e '/^r/p' -e'/^b/p' /etc/passwd
-f FILE 从指定文件中读取编辑脚本
-r, -E 使用扩展正则表达式
-i.bak 备份文件并原处编辑

#说明:
-ir 不支持
-i -r 支持
-ri 支持
-ni 会清空文件

2，常用基本用法

2.1 sed 为空看文件内容

2.2 支持重定向

2.3 支持管道符

2.4 n 选项是关闭自动打印 p语法选项打印

系统自带自动打印

（三）sed 脚本格式

单引号中间需要写脚本；脚本格式如下

'地址+命令'组成

1，地址相关语法

1.1 不给地址：全文处理

vim不给地址:默认光标当前行

1.2 单地址：

2p 第二行 $最后一行

1.3 地址范围

1,3 1到3行

1.4 3q 1到3行 (不能加 -n)

1.5 r 开头 f结尾

1.6 某一天几点几分到某一天几点几分的日志

12\/Jan\/2024:04:12:06

这是时间 Jan 和2024 前面的/ 需要转义

1.7 步进打印奇数行，偶数行

1~2 奇数

2~2偶数 sed -n 'n;p'

2，命令相关语法

2.1 命令的选项

2.2 真删 sed -i

2.3 删之前备份 sed -i.bak

2.4 在第三行的后一行追加 a

2.5 追加多行内容 \n 换行

2.6 在第三行的前一行追加 i

2.7 替换 c

2.8 把第三行写到新文件 w

2.9把新文件插入第二行 r

（四）搜索替代

1，通式

新内容一定是固定的字符串，不能有通配符

s/pattern/string/修饰符查找替换,支持使用其它分隔符，可以是其它形式：s@@@，s###
替换修饰符：
g 行内全局替换
p 显示替换成功的行
w /PATH/FILE 将替换成功的行保存至文件中
I,i 忽略大小写

2，示例

2.1 修改防火墙

2.2 & 变量指前面找的内容

2.3 分组替换

-r, -E 使用扩展正则表达式 \1 是扩展正则表达式，表示第一个括号里的内容

2.4 提取ip

.* 意思 1到正无穷任意长度字符约等于+

2.5 提取中间的数字

2.6 提文件权限

提取第四行

然后提取(四个0到9的数字)

提取（）里的内容

（五）sed 支持变量

（六）不打开配置文件改配置文件

（七）sed 高级用法

1，模式空间保持空间

sed 中除了模式空间，还另外还支持保持空间(Hold Space)

利用此空间，可以将模式空间中的数据，临时保存至保持空间，从而后续接着处理，实现更为强大的功能

2，常见的高级命令

3，示例

3.1 打印偶数行 4种写法

第一种写法：

#解释： 'n;p'

此处 n 是读取匹配到的行的下一行覆盖至模式空间 p 是打印

先读第一行是数字1

然后匹配第二行，将第二行覆盖，就是把数字2 覆盖数字 1 再输出

这样，第一行，第二行都处理完毕

接下来从第三行开始，以此类推

第二种写法：

这是步进，从第二行开始，隔两行打印一次

第三种写法：

这也是步进从第一行开始，隔两行删除（删除了奇数行，剩下的就是偶数行）注意次出不要加 -n

第四种写法：

！反选的意思奇数反选

3.2 小p 大P 区别

小p 是打印的意思大P 指打印模式空间开端至\n内容，并追加到默认输出之前

N 指读取匹配到的行的下一行追加至模式空间

小p 打印

此处N 到模式空间就是

大P 是打印 \n 之前的内容，（换行之前的内容）即数字 1

依次类推，打印奇数

3.3 前后两行追加

3.4 倒序

五，awk

（一）awk 含义

vim：是将整个文件加载到内存中再进行编辑，受限你的内存

awk（语言）：读取一行处理一行，

在 Linux/UNIX 系统中，awk 是一个功能强大的编辑工具，逐行读取输入文本，默认以空格或tab键作为分隔符作为分隔（并且默认会压缩空格），并按模式或者条件执行编辑命令。而awk比较倾向于将一行分成多个字段然后进行处理。AWK信息的读入也是逐行

指定的匹配模式进行查找，对符合条件的内容进行格式化输出或者过滤处理，可以在无交互

的情况下实现相当复杂的文本操作，被广泛应用于 Shell 脚本，完成各种自动化配置任务。

（二）工作原理

前面提到 sed 命令常用于一整行的处理,而 awk 比较倾向于将一行分成多个“字段”然后再进行处理，且默认情况下字段的分隔符为空格或 tab 键。awk 执行结果可以通过 print 的功能将字段数据打印显示。

（三）awk通式

awk [options] 'program' var=value file…

1，program组成

program通常是被放在单引号中，并可以由三种部分组成

BEGIN语句块
模式匹配的通用语句块
END语句块

2，Program格式

xxxxxxxxxx1 11 1pattern{action statements;..}

pattern：决定动作语句何时触发及触发事件，比如：BEGIN,END,正则表达式等
action statements：对数据进行处理，放在{}内指明，常见：print, printf
- output statements：print,printf
- Expressions：算术，比较表达式等
- Compound statements：组合语句
- Control statements：if, while等
- input statements

3，awk 常见选项：

-F “分隔符” 指明输入时用到的字段分隔符，默认的分隔符是若干个连续空白符
-v var=value 变量赋值

（四） awk 执行原理

第一步：执行BEGIN{action;… }语句块中的语句

第二步：从文件或标准输入(stdin)读取一行，然后执行pattern{ action;… }语句块，它逐行扫描文件，
从第一行到最后一行重复这个过程，直到文件全部被读取完毕。

第三步：当读至输入流末尾时，执行END{action;…}语句块
BEGIN语句块在awk开始从输入流中读取行之前被执行，这是一个可选的语句块，比如变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中

END语句块在awk从输入流中读取完所有的行之后即被执行，比如打印所有行的分析结果这类信息汇总都是在END语句块中完成，它也是一个可选语句块

pattern语句块中的通用命令是最重要的部分，也是可选的。如果没有提供pattern语句块，则默认执行{ print }，即打印每一个读取到的行，awk读取的每一行都会执行该语句块

（五）awk 使用方法

1，输出原来内容

2，提取某一行并输出

3，指定分隔符 -F

4， BEGIN语句块 END语句块

改变执行顺序，先BEGIN 再print$1

改变执行顺序，先print$1 最后END

5,重定向

passwd 有多少行 hello 打多少行

6，awk 可以当计算机

注意，此处 awk 没有处理的文件对象，所以加一个BEGIN

7, 提取磁盘占用率

8，改输出内容分隔符

输出内容默认空格做分隔符

9，提取网卡的 ip 地址（awk sed）

awk方法;

sed 方法：

-rn r启用扩展正则 n 不打印

2p 打印第二行

\1 打印第一个括号的内容

10，提取普通用户 uid 号大于等于1000

11，统计当前主机的连接状态

第一种方法：

第二种方法：

第三种方法：

#解释

NR!=1 先去掉第一行

a[$1]++ a是数组名 [$1] 第一个位置变量listen 或者estab

a[$1] 就是 a的数组，把isten 或者estab 当做下标且自循环加1（出现一次加1）

end 做完以上结束后，再做下面的动作

for(i in a)print i,a[i] 这是遍历的意思

12，去重

非0 是真 0是假

#解释： zzz 是数组名 $0 就是把一整行作为参数写进去

++是最后执行，前面！zzz[$0] 处理完再++

针对aa:

初始取反是否打印打印后++

第一次为空假非0真打印真+1

第二次真+1 （真）假（0）不打 0+1

第三次 0+1（真）假（0）不打 0+1

第四次 0+1（真）假（0）不打 0+1

所以aa 不论有多少行只打印一次，达到去重的效果

13，提出主机名，再放指定文件夹

第一种方法：awk

第二种方法：cut

第三张方法：sed

14,统计/etc/fstab文件中每个文件系统类型出现的次数

15,统计/etc/fstab文件中真单词的个数

16 ，提取一长串乱码中的数字

17，提取文件权限

方法1：sed

方法2：awk

18,查出uid最大的用户的 uid 用户名 shell类型

这边有个小技巧，awk 提取的时候把 uid放第一列

方便我们后续用 sort -n 排序

19，打印 1-200 之间所有能被7整除并且包含数字7 的整数

20，提取内存使用率

先提出内存这一行，用使用内存除所有内存

取整并加 %

21 ，看ssh 登录失败（看谁在暴力破解密码）

（六）awk 常见的内置变量

awk 选项

-F “分隔符” 指明输入时用到的字段分隔符，默认的分隔符是若干个连续空白符
-v var=value 变量赋值

1，内置变量具体内容

awk 选项 '模式{print }'

FS :指定每行文本的字段分隔符，缺省默认为空格或制表符（tab）。与 “-F”作用相同 -v "FS=:"

OFS：输出时的分隔符

NF：当前处理的行的字段个数

NR：当前处理的行的行号（序数）

$0：当前处理的行的整行内容

$n：当前处理行的第n个字段（第n列）

FILENAME:被处理的文件名

RS：行分隔符。awk从文件上读取资料时，将根据RS的定义就把资料切割成许多条记录，而awk一次仅读入一条记录进行处理。预设值是\n

2，示例展示内置变量

2,1 FS 自定义分隔符

二者效果相同

此外，FS 支持bash 变量

2.2 RS 行分隔符代表一行结束

2.3 NF 你一行有多少列 $NF 表示最后一列

2.4 NR 行号的序号

显示行号

打印第二行（固定格式 2个等号）

2 到5行

不要第一行

2.5 FNR 将两个文件合并并显示行号

（七）自定义变量

1，自定义变量具体内容

printf
%s：显示字符串
%d, %i：显示十进制整数
%f：显示为浮点数
%e, %E：显示科学计数法数值
%c：显示字符的ASCII码
%g, %G：以科学计数法或浮点形式显示数值
%u：无符号整数
%%：显示%自身

2，用法

（八）模式

awk '模式{处理动作}'

PATTERN:根据pattern条件，过滤匹配的行，再做处理

模式"其实就是选择的"条件"，awk是逐行处理文本的，也就是说，awk会先处理完当前行，再处理下一行，当不指定任何"条件"，awk会一行一行的处理文本中的每一行，如果指定了"条件"，只有满足"条件"的行才会被处理，不满足"条件"的行就不会被处理。

1，正则匹配

2，找到10:00 到11:00 之间的日志

sed -nr '/10/,/11/p'

awk '/10/,/11/'

3,关系表达式

非0 是真 0是假

3.1 非0 是真

3.2 n++

除了第一行都打印

#解释：第一次循环n=0 所以不打印数字1

后面循环依次加1 都大于0 所以后面的都打印

3.3 ！0

都打印

3.4 i=!i

打印奇数

#解释

i 一开始0 所以第一行假，然后取反是结果真最后打印

下一行真取反假不打印

3.5 ！（i=!i）

打印偶数

（九）条件判断

1， if 语句

1.1 支持if else

注意括号不同

1.2 支持多分支

‘{if(判断条件){执行语句1}else if（判断条件）{执行语句}else if(判断条件){执行语句}}’

2，支持 for while 循环语句

3，数组

3,1， awk 数组特性

awk数组特性：

awk的数组是关联数组(即key/value方式的hash数据结构)，索引下标可为数值(甚至是负数、小数等)，也可为字符串

1. 在内部，awk数组的索引全都是字符串，即使是数值索引在使用时内部也会转换成字符串

2. awk的数组元素的顺序和元素插入时的顺序很可能是不相同的

awk数组支持数组的数组

3.2， awk 数组示例

① 数字1 是关联数组是个符号不是数字

a为关联数组的名字 1 是个符号不是数字

② 遍历数组遍历出来顺序不固定

③统计当前主机的连接状态

#解释

NR!=1 先去掉第一行

a[$1]++ a是数组名 [$1] 第一个位置变量listen 或者estab

a[$1] 就是 a的数组，把isten 或者estab 当做下标且自循环加1（出现一次加1）

end 做完以上结束后，再做下面的动作

for(i in a)print i,a[i] 这是遍历的意思

④ 去重

非0 是真 0是假

#解释： zzz 是数组名 $0 就是把一整行作为参数写进去

++是最后执行，前面！zzz[$0] 处理完再++

针对aa:

初始取反是否打印打印后++

第一次为空假非0真打印真+1

第二次真+1 （真）假（0）不打 0+1

第三次 0+1（真）假（0）不打 0+1

第四次 0+1（真）假（0）不打 0+1

所以aa 不论有多少行只打印一次，达到去重的效果

（十） awk 模糊匹配

1，用~表示包含

2，！~ 表示不包含

你可能感兴趣的:(正则表达式)

SpringBoot日志脱敏：敏感信息保护全面指南 Clf丶忆笙 spring boot 后端 java 日志脱敏
文章目录一、日志脱敏概述与核心概念1.1什么是日志脱敏1.2为什么需要日志脱敏1.3常见需要脱敏的敏感信息类型1.4脱敏技术核心原理二、SpringBoot基础日志脱敏实现2.1基于正则表达式的简单脱敏2.2在SpringBoot中集成基础脱敏2.3基础实现的优缺点分析三、基于注解的高级脱敏方案3.1自定义脱敏注解3.2实现自定义JSON序列化器3.3在实体类中应用脱敏注解3.4测试与验证四、Sp
【Python练习】035. 编写一个函数，实现简单的文本搜索功能视睿从零开始学习机器人 python 开发语言机器人算法人工智能
035.编写一个函数，实现简单的文本搜索功能035.编写一个函数，实现简单的文本搜索功能示例代码代码解释测试结果注意事项多种实现方法方法一：使用字符串内置方法方法二：使用正则表达式方法三：使用列表推导式方法四：使用KMP算法方法五：使用第三方库035.编写一个函数，实现简单的文本搜索功能示例代码importredefsimple_text_search(text,pattern):"""在文本中搜
数据安全审计平台的三大关键技术：日志分析、行为监测与智能告警 KKKlucifer 安全算法
在数字化浪潮中，数据安全审计是企业守护核心资产的“瞭望塔”。通过日志分析、行为监测、智能告警三大技术，数据安全审计平台构建起“全流程监控-异常识别-快速响应”的闭环，为数据安全筑牢防线。以下从技术原理、实践价值与行业应用展开解析。日志分析：数据安全的“DNA图谱”1.多源日志融合技术实现：通过Agent采集操作系统、数据库、网络设备等200+日志源，利用正则表达式、NLP技术解析非结构化日志（如“
LeetCode Top100特训九筒- LeetCode 算法力扣
更新中……两数相加盛水最多的容器电话号码的字母组合删除链表的倒数第N个结点字母异位词分组寻找两个正序数组的中位数合并区间不同路径（与最小路径和类似）正则表达式匹配颜色分类单词搜索只出现一次的数字合并K个升序链表接雨水移除元素最长有效括号不同的二叉搜索树验证二叉搜索树对称二叉树从前序与中序遍历序列构造二叉树最长连续序列排序链表乘积最大子数组编辑距离最小栈最小覆盖子串计算右侧小于当前元素的个数柱状图中
Python正则表达式实战指南 Monkey的自我迭代 mysql 数据库 java python
一正则表达式库正则表达式是文本处理中不可或缺的强大工具，Python通过re模块提供了完整的正则表达式支持。本文将详细介绍re模块中最常用的match()、search()和findall()函数，以及贪婪模式与非贪婪模式的区别，帮助读者掌握Python中正则表达式的核心用法。1.re.match()函数：从字符串开头匹配re.match()是正则表达式最基本的函数之一，它尝试从字符串的起始位置匹
C语言正则表达式使用详解
标准的C和C++都不支持正则表达式，但有正则表达式的函数库提供这功能.C语言处理正则表达式常用的函数有regcomp()、regexec()、regfree()和regerror()。使用正则表达式步骤：1)编译正则表达式regcomp()2)匹配正则表达式regexec()3)释放正则表达式regfree()4)获取regcomp或者regexec产生错误，获取包含错误信息的字符串函数声明如下：
正则表达式基本用法（notepad++）丨封尘绝念斩丨正则表达式
1.启动Notepad++并打开一个文本文件。点击菜单栏的"搜索"，然后选择"查找"或"替换"。2.学习基本的匹配字符："."表示匹配任意字符。"\d"表示匹配数字字符。"\w"表示匹配字母、数字和下划线字符。"\s"表示匹配空白字符。"[abc]"表示匹配字符"a"、"b"或"c"中的任意一个。3.学习特殊字符和量词："^"表示匹配字符串的开头。"$"表示匹配字符串的结尾。"*"表示匹配前面的字
正则表达式-元字符及描述 dianaixun1635 java scala javascript ViewUI
元字符描述\将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如，“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。^匹配输入字行首。如果设置了RegExp对象的Multiline属性，^也匹配“\n”或“\r”之后的位置。$匹配输入行尾。如果设置了RegExp对象的Multiline属性，$也匹配“\n”
notepad++正则表达式痞子IT 嵌入式开发语言 xml c语言
notepad++正则表达式使用笔记：1.查找空行：^\s*\r\n2.排除以（开头的行：^(?!（).*$3.查找第二行以A-D开头的情况：(\r\n)(^[A-D])4.查找不含有helloworld的行：^(?!.*helloworld).*$5.查找不以com结尾的字符串：^.*?(?|"']|"[^"]*"|'[^']*')*?(?:/>|>.*?)11.查找非换行空白：(\s)(?)及
爬虫-数据解析打酱油的； python自动化+爬虫爬虫
1.解析概述特性re(正则表达式)bs4(BeautifulSoup)xpath(lxml)pyquery本质文本模式匹配HTML/XML解析器(DOM树操作)XML路径语言(节点导航)jQuery式CSS选择器(封装lxml)学习曲线陡峭中等中等简单(熟悉jQuery/CSS)灵活性极高(处理任意文本)高(容错好，DOM操作)高(路径、轴、谓词)高(jQuery语法)可读性差(模式复杂时难懂)好
爬虫-正则表达式打酱油的； python自动化+爬虫爬虫 python
在线正则表达式测试OSCHINA.NET在线工具,ostools为开发设计人员提供在线工具，提供jsbin在线CSS、JS调试，在线JavaAPI文档,在线PHPAPI文档,在线Node.jsAPI文档,LessCSS编译器，MarkDown编译器等其他在线工具https://tool.oschina.net/regex/
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类，由易到难，循序渐进，玩转OD 哪吒搬砖工逆袭Java架构师华为od 算法华为OD机试 2025B卷 java
目录推荐刷题方法：一、适合人群二、本期训练时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目，作为入门。第1天、逻辑分析第2天、逻辑分析第3天、逻辑分析第4天、字符串处理第5天、正则表达式第6天、深度优先搜索dfs第7天、深度优先搜索dfs六、集训总结国内直接使用ChatGPT4o、o3、o4-mini-high、GPT-4.5、GPT4.1、Gemini2.5pro0605
字符串的模糊匹配方法介绍超级土豆粉前端 javascript typescript html
字符串的模糊匹配方法介绍目录字符串的模糊匹配方法介绍一、编辑距离（LevenshteinDistance）复杂度分析二、Jaro-Winkler距离复杂度分析三、最长公共子序列（LCS）复杂度分析四、模糊搜索（FuzzySearch）复杂度分析五、正则表达式复杂度分析六、第三方库复杂度分析总结在日常开发和数据处理中，我们经常会遇到需要判断两个字符串是否“相似”或“接近”的场景，这时就需要用到字符串
Python词法分析器：从概念到实践凡狗蛋
本文还有配套的精品资源，点击获取简介：Python词法分析器是编程语言处理的关键环节，负责将源代码解析为有意义的标记或符号序列。本简介详细介绍了词法分析、正则表达式、分词、词法规则、词法分析器生成器以及编译原理等核心概念，并展示了如何使用Python内置的re模块和第三方库ply实现词法分析器，为进一步理解编程语言的工作原理和构建自定义编程语言打下基础。1.词法分析器的作用与目的词法分析器是编译器
如何记住js的正则表达式 HebyH_ javascript 正则表达式数据库
正则表达式（RegularExpressions）是处理字符串的强大工具，但确实需要一些记忆和练习才能掌握。以下是一些帮助你记忆JavaScript正则表达式的方法和常用模式：1.基础结构记忆法记住正则表达式的基本结构：/pattern/flags-斜杠包围模式，后面可跟标志例如：/hello/gi-匹配"hello"，全局且不区分大小写2.常用元字符记忆口诀"点星加问，花括号量".匹配任意单个字
正则表达式虎皮辣椒小怪兽 Linux 正则表达式
文章目录一、什么是正则表达式二、第一类正则三、第二类正则一、什么是正则表达式正则表达式（RegularExpression）是用于匹配字符串模式的工具。它可以高效地实现字符串的搜索、替换、验证等操作二、第一类正则元字符：指那些在正则表达式中具有特殊意义的专用字符，如：点(.)星(*)问号(?)等。前导字符：即位于元字符前面的字符abc*或aooo.1、.任意单个字符，除了换行符[root@loca
python爬虫正则表达式使用说明 yuwinter Python python 爬虫正则表达式
Python爬虫和正则表达式是自动化网络数据提取中常用的两种技术。本文将详细介绍如何使用Python编写爬虫，结合正则表达式提取网页中的数据。一、基础知识点1.安装必要库爬虫通常需要使用库来处理HTTP请求和解析网页，常用库有：requests：用于发送HTTP请求，获取网页内容。re：Python自带的正则表达式库，用于模式匹配和提取数据。BeautifulSoup（可选）：如果你需要更高级的网
python：正则表达式符号初于青丝mc终于白发 python相关正则表达式 python pycharm
本次给大家带来的是python中的正则表达式符号的复习呀，还记得清楚嘛^^？匹配零次或一次前面的分组*匹配零次或多次前面的分组+匹配一次或多次前面的分组{n}匹配n次前面的分组{n，}匹配n次或更多次前面的分组{，m}匹配零次或m次前面的分组{n，m}匹配至少n次，至多m次前面的分组{n，m}？、*？、+？对前面的分组进行非贪心匹配^spam意味着字符串必须以spam开始spam$意味着字符串必须
Python：正则表达式慕婉0307 python基础知识点正则表达式
正则表达式是处理文本数据的强大工具，Python通过re模块提供了完整的正则表达式功能。本文将详细介绍Python正则表达式的使用方法，包括基础语法、高级技巧和re模块API的详细解析。一、正则表达式基础1.1什么是正则表达式正则表达式(RegularExpression)是一种用于匹配字符串中字符组合的模式，可以用于搜索、替换和验证文本数据。1.2Python中的re模块Python通过内置的r
正则表达式咸鱼时日翻身正则表达式
是指定一组与之匹配的字符串，限定符号a*a出现0或者多次a+a出现1次或者多次a？a出现0次或者1次a{2,5}出现在2到5次之间或运算法（cat|dog）匹配cat或者dog字符类[abz]+表示匹配的字符只能是中括号中的字母如果使用了^则为取反符号元字符、/d代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符不包括换行符号^a匹配行
深入理解 grep 命令：从基础匹配到正则表达式的全面指南线条1 正则表达式 java 数据库
一、grep命令概述在Linux系统中，grep（GlobalRegularExpressionPrint）是一个强大的文本搜索工具，它能够使用正则表达式在文本文件中查找匹配的行，并将这些行输出。从系统管理员到开发人员，grep都是日常工作中不可或缺的工具，广泛应用于日志分析、代码搜索、数据过滤等场景。二、grep基础匹配用法1.普通文本匹配命令格式：grep"pattern"filename示例
Python网络数据采集的方法蚂蚁ai Python零基础 Python python 开发语言
听说还有很多小伙伴还不知道网络数据采集的方法，让我来看看都有谁，不说话我就点名了。我把教程分享在下面了，需要的小伙伴自己领取。（https://jq.qq.com/?_wv=1027&k=kYtMeTfp）一般情况下以下四种方式都是可以匹配到结果的，只是复杂程度不一致，根据情况进行选择。◾正则re的使用◾bs4的使用◾xpath◾PyQuery①Re（RegularExpression正则表达式）
python 海象运算符_python := 海象运算符伶邪 python 海象运算符
最近在做算法题越来越发现python写法真的挺好用的记下来map(lambdax:sum(x))中lambda代表匿名函数re.findall(r'0+|1+',s)是正则表达式:=海象运算符转if(n:=len(a))>10:print(f"Lististoolong({n}elements,expected10:print(f"Lististolong({len(a)}elements,exp
python := 海象运算符 challenge-linge it it
参考视频教程:**体系课-Go+Python双语言混合开发盯紧技术先机抓紧高薪机遇**最近在做算法题越来越发现python写法真的挺好用的记下来map(lambdax:sum(x))中lambda代表匿名函数re.findall(r’0+|1+’,s)是正则表达式:=海象运算符转背景：python3.8正式版最近更新了，其中PEP572中的海象运算符获得正式python版本的支持.我看了官网的文档
正则表达式
运用正则表达式进行爬虫就是把想要得到的信息爬取出来贪婪爬取和非贪婪爬取replace(正则表达式,新的内容)符合正则表达式的被替换成新的内容(返回值是String)split(正则表达式)按照正则表达式规则切割字符串(返回值是String[]),遍历数组就可以得到了分组其实就是把内容分组,然后用组号代替内容复制,这样就不用多写几遍练习:其实正则表达式不用背,以后要用的时候直接右键选择插件下载的选择
Java 正则表达式你都会上树？ Java java 正则表达式
基本语法元字符转义号\\限定符符号含义*指定前面内容可以出现0次及以上+指定前面内容可以出现1次及以上。至少会出现一次?指定前面内容可以出现0次或一次{n}指定前面的内容只能出现n次{n,}指定前面内容至少出现n次{n,m}指定前面内容至少出现n次但不多于m次选择匹配符符号解释|逻辑或的含义，符号两边内容有一个成立即可|分组组合和反向引用符分组常用分组构造形式说明(pattern)非命名捕获。捕获
ORACLE数据库转国产阿里OceanBase数据库
1.BLOB类型修改将接口内oracle.sql.BLOB改为java.sql.Blob2.REGEXP_LIKE判断函数正则表达式中字符转义问题OB的正则表达式使用的是标准的Linux模式,oracle是黑盒子,在处理部分转义符([]+)的时候,Oracle无需使用转义符,OB务必使用转义符,加/转义处理,例如在regexp_like(t.xx,’^(+|[0-9]+)$’)改为regexp_l
Oracle 进阶语法实战：从多维分析到数据清洗的深度应用(第四课) AI、少年郎 oracle 数据库
在《Oracle树形统计再进阶》(第三课)基础上，我们跳出传统SQL聚合框架，探索Oracle特有的高级语法特性，包括多维分析神器MODEL子句、数据清洗利器正则表达式、PL/SQL存储过程优化，以及基于执行计划的查询调优技巧。这些技术能解决传统方法难以处理的复杂场景，如动态列生成、不规则数据清洗、批量数据处理等。一、MODEL子句：多维数据建模与动态透视业务场景：动态生成各部门全年度各季度请假类
Qt 各种功能学习笔记栈不收 qt 学习笔记
目录1.Qt关于数据库1.1Qt链接数据库1.2将数据库的模型显示在控件中2.Qt关于控件2.1用正则表达式设置输入框只能输入正浮点数2.2设置QDateTimeEdit的时间格式和设置为当前时间1.Qt关于数据库1.1Qt链接数据库基础教学：使用Qt链接MySql数据库_qt连接mysql_栈不收的博客-CSDN博客需要注意的问题：在链接MySQL的时候，首先要确保MySQL已经安装成功在目录Q
【实战演练】运维工程师初试必胜指南：解析公司笔试真题与技巧分享江湖有缘运维工程师面试专栏运维服务器 Linux 面试求职
【实战演练】运维工程师初试必胜指南：解析公司笔试真题与技巧分享一、填空题1.第1题：修改网卡IP地址2.第2题：基本文件相关命令解释3.第3题：新建用户4.第4题：设置文件权限5.第5题：路由协议RIP6.第6题：ping命令相关7.第7题：创建目录8.第8题：正则表达式9.第9题：列出文件10.第10题：如何查看系统信息11.第11题：重命名文件12.第12题：修改用户密码13.第13题：如何向
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

正则表达式 与文本三剑客（sed grep awk）

一，正则表达式

（一）正则表达式相关定义

1，正则表达式含义

2，正则表达式支持的语言

3，正则表达式分类

4，基础正则表达式 扩展正则表达式区别

（二）元字符（字符匹配）

1，常用元字符

2，元字符 （.）的介绍

3,元字符 [ ] 的介绍

（三）表示次数 表示一个qq 号码

1，常用表示次数的元字符

2，匹配规则

（四）位置锚定

（五）分组或其他

1，定义

2，例子

二， 扩展正则表达式（表示字符相差不大）

（一）表示次数

（二） 表示分组

（三） 例子

1，表示qq号

2, 表示邮箱

3，表示手机号

三，grep

（一）通式

（二）选项

（三）选项详细介绍

1，grep 支持 标准输入，标准输出，文件内容

2，-m 1 匹配一次就停止

3, -i 忽略大小写

4， -c 行数

5，-o 显示匹配内容

6，-A 匹配后三行 -B 匹配前三行 -C 匹配前后三行

7， -e 或

8， -E 启用扩展正则，grep 默认基本正则

9，-W 匹配单词

10， -r递归目录，但不处理软链接 -R递归目录，但处理软链接muku

（四）示例

1，提取 ip

2， 统计当前主机的连接状态

3， 统计当前连接主机数

四，sed

（一）sed 介绍

（二）基本用法

1， 常用选项

2，常用基本用法

2.1 sed 为空 看文件内容

2.2 支持重定向

2.3 支持管道符

2.4 n 选项是关闭自动打印 p语法选项打印

（三）sed 脚本格式

1，地址 相关语法

1.1 不给地址： 全文处理

1.2 单地址：

2p 第二行 $最后一行

1.3 地址范围

1,3 1到3行

1.4 3q 1到3行 (不能加 -n)

1.5 r 开头 f结尾

1.6 某一天几点几分 到 某一天几点几分 的日志

1.7 步进 打印奇数行，偶数行

2，命令相关语法

2.1 命令的选项

2.2 真删 sed -i

2.3 删之前备份 sed -i.bak

2.4 在第三行的后一行 追加 a

2.5 追加多行内容 \n 换行

2.6 在第三行的前一行 追加 i

2.7 替换 c

2.8 把第三行写到 新文件 w

2.9把新文件插入 第二行 r

（四） 搜索替代

1，通式

2，示例

2.1 修改防火墙

2.2 & 变量 指前面找的内容

2.3 分组替换

2.4 提取ip

正则表达式与文本三剑客（sed grep awk）

4，基础正则表达式扩展正则表达式区别

2，元字符（.）的介绍

（三）表示次数表示一个qq 号码

二，扩展正则表达式（表示字符相差不大）

（二）表示分组

（三）例子

1，grep 支持标准输入，标准输出，文件内容

2，统计当前主机的连接状态

3，统计当前连接主机数

1，常用选项

2.1 sed 为空看文件内容

1，地址相关语法

1.1 不给地址：全文处理

1.6 某一天几点几分到某一天几点几分的日志

1.7 步进打印奇数行，偶数行

2.4 在第三行的后一行追加 a

2.6 在第三行的前一行追加 i

2.8 把第三行写到新文件 w

2.9把新文件插入第二行 r

（四）搜索替代

2.2 & 变量指前面找的内容

（六）不打开配置文件改配置文件

1，模式空间保持空间

2，提取某一行并输出

3，指定分隔符 -F

8，改输出内容分隔符

9，提取网卡的 ip 地址（awk sed）

15,统计/etc/fstab文件中真单词的个数

16 ，提取一长串乱码中的数字

17，提取文件权限

19，打印 1-200 之间所有能被7整除并且包含数字7 的整数

20，提取内存使用率

2，示例展示内置变量

2.2 RS 行分隔符代表一行结束

2.5 FNR 将两个文件合并并显示行号