Fang_Qianling

正则表达式与文本三剑客

一、正则表达式

1. 定义

2. 字符匹配

3. 重复限定符

4. 位置锚点

5. 分组和引用

6. 扩展正则表达式

二、文本三剑客

1. grep

1.1 定义

1.2 语法

1.3 选项

1.4 示例

2. sed

2.1 定义

2.2 通式

2.3 选项

2.4 脚本格式（脚本语法）

2.4.1 地址了解

2.4.2 命令了解

2.5 搜索替代

2.6 分组替换

2.7 调用变量

2.8 修改配置文件

2.9 修改网卡名

3. awk

3.1 定义和格式

3.2 常见选项和执行流程

3.3 基本用法

3.4 常规应用

3.5 常见的内置变量

3.6 自定义变量

3.7 模式PATTERN

3.7.1 模式为空

3.7.2 正则匹配

3.7.3 line ranges：行范围

3.7.4 /pat1/,/pat2/ 案例：找到10:00到11:00之间的日志

3.7.5 关系表达式

3.8 条件判断

3.9 循环：for | while

3.10 数组

3.10.1 访问、赋值数组元素

3.10.2 数组长度

3.10.3 遍历数组

3.10.4 实际案例

3.11 awk脚本

一、正则表达式

1. 定义

正则表达式是一种用于匹配和操作文本的强大工具，它使用特定的语法和模式来描述文本的结构和模式。正则表达式被很多程序和开发语言所广泛支持：vim，less，grep，sed，awk，nginx，mysql等。

2. 字符匹配

正则表达式可以匹配普通字符和元字符。

普通字符：任何普通字符都可以直接匹配自身

元字符：一些字符具有特殊含义，如点号（.）匹配除了换行符之外的任意字符，星号（*）匹配前一个字符的零个或多个重复，问号（?）匹配前一个字符的零个或一个重复

元字符	说明
.	匹配任意单个字符，可以是一个汉字
[ ]	匹配指定范围内的任意单个字符，[0-9]，[a-zA-Z]
[^]	匹配指定范围外的任意单个字符，[^a.z]：非a和z
[:alnum:]	字母和数字
[:alpha:]	代表任何英文大小写字符，亦即A-Z，a-z
[:lower:]	小写字母,示例:[[:lower:]],相当于[a-z]
[:upper:]	大写字母
[:blank:]	空白字符（空格和制表符）
[:space:]	包括空格、制表符 (水平和垂直)、换行符、回车符等各种类型的空白,比[:blank:]包含的范围广
[:cntrl:]	不可打印的控制字符（退格、删除、警铃...）
[:digit:]	十进制数字十进制数字
[:xdigit:]	十六进制数字
[:graph:]	可打印的非空白字符
[:print:]	可打印字符
[:punct:]	标点符号
\w	匹配单词构成部分，等价于[_[:alnum:]]
\W	匹配非单词构成部分，等价于[^_[:alnum:]]
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意Unicode 正则表达式会匹配全角空格符

示例：

元字符点 .

[root@localhost ~]# ls /etc/|grep rc[.0-3]    #此处的点代表字符
rc0.d
rc1.d
rc2.d
rc3.d
rc.d
rc.local
[root@localhost ~]# ls /etc/ | grep 'rc\.'    #点值表示点需要转义
rc.d
rc.local
[root@localhost ~]# grep r..t /etc/passwd     #r..t ..代表任意两个字符
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin

元字符[ ]

[root@localhost opt]# touch {a..z}.txt
[root@localhost opt]# ls | grep "[fql].txt"  #fql三个字母任意一个
f.txt
l.txt
q.txt

元字符[^]

[root@localhost opt]# touch {1..3}.txt
[root@localhost opt]# touch {a..c}.txt
[root@localhost opt]# ls | grep '[^0-9].txt'  #除去0-9任意字符.txt文件
a.txt
b.txt
c.txt

3. 重复限定符

① 星号（*）：匹配前一个字符的零个或多个重复，即：匹配前面的字符任意次，包括0次

[root@localhost ~]# echo ac | grep 'ab*c'       #匹配前面一个字符b，0次
ac
[root@localhost ~]# echo abbbc | grep 'ab*c'    #匹配前面一个字符b，3次
abbbc

② 点星（.*）：任意长度的任意字符不包括0次

[root@localhost ~]# echo ac | grep 'ab.*c';echo $? 
1                                          #ac之间没有b匹配不到
[root@localhost ~]# echo abbbc | grep 'ab.*c'
abbbc                                      #匹配前面的字符b，3次

③ \? ：匹配前面的字符1次或0次，即：可有可无

[root@localhost ~]# echo ac | grep 'ab\?c'            #匹配前面的字符b，0次
ac
[root@localhost ~]# echo abc | grep 'ab\?c'           #匹配前面的字符b，1次
abc
[root@localhost ~]# echo abbc | grep 'ab\?c';echo $?  #无法匹配
1

④ \+：匹配其前面的字符出现最少1次，即：肯定有且>=1次

[root@localhost ~]# echo ac | grep 'ab\+c';echo $?  #无法匹配
1
[root@localhost ~]# echo abc | grep 'ab\+c'         #匹配前面的字符b，1次
abc
[root@localhost ~]# echo abbc | grep 'ab\+c'        #匹配前面的字符b，两次
abbc

⑤ \{n\}：匹配前面的字符n次

[root@localhost ~]# echo abbc | grep 'ab\{1\}c';echo $? 
1                                        #匹配前面的字符b，1次，无法匹配，\转义{和} 
[root@localhost ~]# echo abbc | grep 'ab\{2\}c'
abbc                                     #匹配前面的字符b，两次

⑥ \{m,n\}：匹配前面的字符至少m次，至多n次

[root@localhost ~]# echo ac | grep 'ab\{1,3\}c';echo $?      
1                                #匹配前面的字符b至少1次，至多3次，这里0次无法匹配
[root@localhost ~]# echo abc | grep 'ab\{1,3\}c'
abc
[root@localhost ~]# echo abbbc | grep 'ab\{1,3\}c'
abbbc
[root@localhost ~]# echo abbbbc | grep 'ab\{1,3\}c';echo $?
1                                #匹配前面的字符b至少1次，至多3次，这里4次无法匹配

⑦ \{,n\}：匹配前面的字符至多n次，<=n

[root@localhost ~]# echo ac | grep 'ab\{,1\}c'           
ac                              #匹配前面的字符b至多1次，0次可以匹配
[root@localhost ~]# echo abc | grep 'ab\{,1\}c'
abc                             
[root@localhost ~]# echo abbc | grep 'ab\{,1\}c';echo $?
1                               #匹配前面的字符b至多1次，两次无法匹配

⑧ \{n,\}：匹配前面的字符至少n次

[root@localhost ~]# echo ac | grep 'ab\{1,\}c';echo $?
1                               #匹配前面的字符b至少1次，0次无法匹配
[root@localhost ~]# echo abc | grep 'ab\{1,\}c'
abc
[root@localhost ~]# echo abbc | grep 'ab\{1,\}c'
abbc

4. 位置锚点

① ^：行首锚定, 用于模式的最左侧

② $：行尾锚定，用于模式的最右侧

③ ^PATTERN$：表示用于模式匹配整行（单独一行只有PATTERN字符）

④ ^$：表示空行

⑤ ^[[:space:]]*$：空白行，如tab、换行、回车

⑥ \< 或 \b：词首锚定，用于单词模式的左侧(连续的数字，字母，下划线都算单词内部)

⑦ \> 或 \b：词尾锚定，用于单词模式的右侧

⑧ \：匹配整个单词

示例：

[root@localhost opt]# vim file.txt
root$
123root456$
123ro456ot$
abc  cba$
efg  ghe$
$                      #空行
^I^I$                  #TabTab
:set list              #显示控制字符

[root@localhost opt]# cat file.txt | grep "^a"              #过滤以a开头行
abc  cba
[root@localhost opt]# cat file.txt | grep "a$"              #过滤以a结尾行
abc  cba
[root@localhost opt]# cat file.txt | grep "^root$"          #过滤只有root字符的行
root
[root@localhost opt]# cat file.txt | grep "^$"              #过滤空行        
#显示空行
[root@localhost opt]# cat file.txt | grep "^[[:space:]]*$"  #过滤空白行
#显示空行		
#显示空行
[root@localhost opt]# cat file.txt | grep "g\b"             #过滤以g结尾的词，efg
efg  ghe
[root@localhost opt]# cat file.txt | grep "\bc"             #过滤以c开头的词，cba
abc  cba
[root@localhost opt]# cat file.txt | grep "\broot\b"        #过滤单词root
root

5. 分组和引用

圆括号( )：用于分组，可以将多个字符作为一个整体进行处理

反向引用：使用\n（n 为数字）来引用分组中匹配的内容，如：\1 表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符

示例：

[root@localhost ~]# echo abccc | grep "abc\{3\}"
abccc
[root@localhost ~]# echo abccc | grep "\(abc\)\{3\}";echo $?
1
[root@localhost ~]# echo abcabcabccc | grep "\(abc\)\{3\}"
abcabcabccc                       #abcabcabc高亮

[root@localhost ~]# echo 1abc |grep  "1\|2abc"
1abc                              #1高亮
[root@localhost ~]# echo 1abc |grep  "\(1\|2\)abc"
1abc                              #1abc高亮

应用：过滤ens33ip地址

[root@localhost ~]# ifconfig ens33
ens33: flags=4163  mtu 1500
        inet 192.168.190.100  netmask 255.255.255.0  broadcast 192.168.190.255
        inet6 fe80::e743:cb44:9825:6230  prefixlen 64  scopeid 0x20
        ether 00:0c:29:e1:cb:86  txqueuelen 1000  (Ethernet)
        RX packets 781  bytes 58624 (57.2 KiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 386  bytes 38313 (37.4 KiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
[root@localhost ~]# ifconfig ens33 | grep netmask | grep -o '\([0-9]\{1,3\}\.\)\{3\}[0-9]\{1，3\}' | head -1
#显示被匹配到的字符串，表示匹配1-9之间任意数组成的1位、2位或3位数+点，{1，3}表示出现1-3次；
192.168.190.100
[root@localhost ~]# ifconfig ens33 |grep netmask | grep -Eo '([0-9]{1,3}\.){3}[0-9]{1,3}' | head -1
192.168.190.100
#-E支持扩展正则表达式

6. 扩展正则表达式

① 使用方法

grep -E或者egrep 默认使用的是扩张正则表达式

② 表示次数

*：匹配前面字符任意次
?：0或1次
+：1次或多次
{n}：匹配n次
{m,n}：至少m，至多n次
{,n}：匹配前面的字符至多n次,<=n，n可以为0
{n,}：匹配前面的字符至少n次,<=n，n可以为0

③ 表示分组

() 分组：将多个字符捆绑在一起，当作一个整体处理

| 或者
a|b #a或b
C|cat #C或cat
(C|c)at #Cat或cat

二、文本三剑客

1. grep

1.1 定义

grep是Linux系统中一个常用的文本搜索工具，用于在文件中查找指定的字符串或匹配某个正则表达式的文本行。

1.2 语法

grep [选项]… 查找条件 目标文件

1.3 选项

选项	说明
-m	-m n，匹配n次（行）后停止
-v	显示不被pattern匹配到的行，即取反
-i	忽略字符大小写
-n	显示匹配的行号
-c	统计匹配的行数
-o	仅显示匹配到的字符串
-q	静默模式，不输出任何信息，常用于脚本
-A	after，后#行
-B	before，前#行
-C	context，前后各#行
-e	实现多个选项间的逻辑or关系
-w	匹配整个单词
-E	使用ERE，相当于egrep
-F	不支持正则表达式，相当于fgrep
-f	file根据模式文件，处理两个文件相同内容把第一个文件作为匹配条件
-r	递归目录，但不处理软链接，开始搜索目录
-R	递归目录，但处理软链接
-color=auto	对匹配到的文本着色显示

1.4 示例

[root@localhost opt]# cat file.txt 
a 1
a 2
a 3
[root@localhost opt]# cat file.txt | grep -m 2 a   #以a为过滤条件匹配到第二行停止
a 1
a 2

[root@localhost opt]# cat file.txt 
a 1
A 2
b 3
[root@localhost opt]# cat file.txt | grep -i a     #以a为过滤条件忽略字符大小写
a 1
A 2

[root@localhost opt]# cat file.txt
abc123
Aabc12
[root@localhost opt]# cat file.txt | grep -o abc   #仅显示匹配到的字符串abc
abc
abc

[root@localhost ~]# grep -e root -e bash /etc/passwd #包含root或者包含bash的行
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
fql:x:1000:1000:fql:/home/fql:/bin/bash

2. sed

2.1 定义

sed是一个流式文本编辑器，它可以对文本文件进行各种编辑操作。它主要用于对文本文件进行替换、插入、删除、打印等操作，它可以通过管道符（|）将多个命令串联起来使用。

Sed是从文件或管道中读取一行，处理一行，输出一行；再读取一行，再处理一行，再输出一行，直到最后一行。每当处理一行时，把当前处理的行存储在临时缓冲区中，称为模式空间（PatternSpace），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾。一次处理一行的设计模式使得sed性能很高，sed在读取大文件时不会出现卡顿的现象。如果使用vi命令打开几十M上百M的文件，明显会出现有卡顿的现象，这是因为vi命令打开文件是一次性将文件加载到内存，然后再打开。Sed就避免了这种情况，一行一行的处理，打开速度非常快，执行速度也很快。

2.2 通式

sed [option]... 'script;script;...' [input  file...]
     选项         '自身脚本语法'         支持标准输入管道或者文件
#如果不知道语法可以写' '，' ' 文件则是打印文件内容

2.3 选项

选项	说明
-n	不输出模式空间内容到屏幕，即不自动打印
-e	多点编辑
-f FILE	从指定文件中读取编辑脚本
-r，-E	使用扩展正则表达式
-i.bak	备份文件并原处编辑

注意：

-ir：不支持
-i -r：支持
-ri：支持
-ni：会清空文件

2.4 脚本格式（脚本语法）

脚本格式由'地址+命令'组成。

2.4.1 地址了解

① 如果不给地址，即对全文进行处理（比如行号）

[root@localhost ~]# seq 3 | sed ' '    #默认将输入内容打印出来，系统自带自动打印
1                                      #支持管道符
2
3
[root@localhost ~]# sed ' ' /etc/passwd |wc -l     #查看文件内容
41
[root@localhost ~]# sed ' ' < /etc/passwd |wc -l   #支持重定向
41

② 单地址：指定的行，$代表最后一行

[root@localhost ~]# sed 'p' /etc/passwd | wc -l   
82
#p代表打印内容，因为没有规定范围' '默认也会打印一遍，所以这里会造成打印两倍
[root@localhost ~]# sed -n 'p' /etc/passwd | wc -l
41
#-n代表关闭自动打印
[root@localhost ~]# sed -n '2p' /etc/passwd  #打印文件的第二行（单地址写法）
bin:x:1:1:bin:/bin:/sbin/nologin              
[root@localhost ~]# sed -n '$p' /etc/passwd  #打印文件的最后一行（单地址写法）
fql:x:1000:1000:fql:/home/fql:/bin/bash
[root@localhost ~]# sed '2q' /etc/passwd       #到第二行退出，也就是打印1到2行
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin

③ 地址范围：

#,#：#从#行到第#行，3，6 从第3行到第6行
#,+#：#从#行到+#行，3,+4 表示从3行到第7行
/pat1/,/pat2/：第一个正则表达式和第二个正则表达式之间的行
#,/pat/：从#号行为开始找到pat为止 (可能有bug)
/pat/,#：找到#号个pat为止

示例：

[root@localhost ~]# sed -n '1,2p' /etc/passwd        #打印一到二行
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
[root@localhost ~]# sed -n '1,+2p' /etc/passwd       #从第一行到第三行
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
[root@localhost opt]# cat file.txt 
a123
b456
c789
d000
[root@localhost opt]# sed -n '/^a/,/^b/p' file.txt   #从a开头行到b开头行
a123
b456

应用：提取时间段的日志内容

[root@localhost log]# tail messages 
Jan 29 22:38:17 localhost chronyd[708]: Source 2001:1600:4:1::123 replaced with 119.28.183.184
Jan 29 22:40:01 localhost systemd: Started Session 18 of user root.
Jan 29 22:40:01 localhost systemd: Starting Session 18 of user root.
Jan 29 22:43:42 localhost chronyd[708]: Selected source 119.28.183.184
Jan 29 22:50:01 localhost systemd: Started Session 19 of user root.
Jan 29 22:50:01 localhost systemd: Starting Session 19 of user root.
Jan 29 23:00:01 localhost systemd: Started Session 20 of user root.
Jan 29 23:00:01 localhost systemd: Starting Session 20 of user root.
Jan 29 23:01:01 localhost systemd: Started Session 21 of user root.
Jan 29 23:01:01 localhost systemd: Starting Session 21 of user root.
[root@localhost log]# sed -n '/Jan 29 22:38:17/,/Jan 29 22:43:42/p' messages 
Jan 29 22:38:17 localhost chronyd[708]: Source 2001:1600:4:1::123 replaced with 119.28.183.184
Jan 29 22:40:01 localhost systemd: Started Session 18 of user root.
Jan 29 22:40:01 localhost systemd: Starting Session 18 of user root.
Jan 29 22:43:42 localhost chronyd[708]: Selected source 119.28.183.184
#提取Jan 29 22:38:17到Jan 29 22:43:42时间段的日志内容

④ 步进：~

1~2 奇数行
2~2 偶数行

示例：

[root@localhost ~]# seq 4 | sed -n '1~2p'  #从1开始，步长为2，即每次加2，奇数
1
3
[root@localhost ~]# seq 4 | sed -n '2~2p'  #从2开始，步长为2，即每次加2，偶数
2
4
[root@localhost ~]# seq 4 | sed -n '1~2!p' #取反，也是打印偶数
2
4
[root@localhost ~]# seq 4 | sed -n 'n;p'   
2
4
#高级用法，将第一个数放入第二空间（第一个是匹配空间）里不输出，打印处理下一行。当处理完后1，2行后，这两行已经不存在了，处理第3行，依然将第3行放入第二空间，打印下一行。
[root@localhost ~]# seq 4 | sed -n '2,${n;p}'
3
#与上面同理，从2开始，打印下一行，代表奇数行

2.4.2 命令了解

命令	说明
p	打印当前模式空间内容，追加到默认输出之后
Ip	忽略大小写输出
d	删除模式空间匹配的行，并立即启用下一轮循环
a [\]text	在指定行后面追加文本，支持使用\n实现多行追加
i [\]text	在行前面插入文本
c [\]text	替换行为单行或多行文本
w file	保存模式匹配的行至指定文件
r file	读取指定文件的文本至模式空间中匹配到的行后
=	为模式空间中的行打印行号
!	模式空间中匹配行取反处理
q	结束或退出sed

示例：

[root@localhost ~]# seq 4 | sed '3d'    #删除第三行（只是删输出的内容，实际依然存在）
1
2
4
[root@localhost ~]# sed 4 | sed -i '3d'       #真实删除原内容 
[root@localhost ~]# sed 4 | sed -i.bak '3d'   #删除之前先备份

[root@localhost ~]# seq 3 | sed  '2a22'       #在第二行后添加22
1
2
22
3
[root@localhost ~]# seq 3 | sed  '2a22\n33'   #下一行追加33
1
2
22
33
3

[root@localhost ~]# seq 3 > file.txt
[root@localhost ~]# cat file.txt 
1
2
3
[root@localhost ~]# sed -i '3ccc' file.txt    #替换第三行内容为cc
[root@localhost ~]# cat file.txt 
1
2
cc

[root@localhost opt]# cat file.txt 
a123
b456
[root@localhost opt]# sed -n '1，2wbbb.txt' file.txt  
#将file.txt文件的一到二行保存到bbb.txt文件中
[root@localhost opt]# ls
bbb.txt  file.txt  rh

[root@localhost opt]# cat a.txt 
a
b
[root@localhost opt]# cat b.txt 
c
d
[root@localhost opt]# sed '2r b.txt' a.txt  #将b.txt插入到a.txt第二行后
a
b
c
d

2.5 搜索替代

s/pattern/string/修饰符查找替换，即：s/旧内容/新内容/修饰符。支持使用其它分隔符，可以是其它形式：s@@@，s###。

替换修饰符：
g：行内全局替换
p：显示替换成功的行
w /PATH/FILE：将替换成功的行保存至文件中
I,i：忽略大小写

[root@localhost ~]# cat /etc/selinux/config

# This file controls the state of SELinux on the system.
# SELINUX= can take one of these three values:
#     enforcing - SELinux security policy is enforced.
#     permissive - SELinux prints warnings instead of enforcing.
#     disabled - No SELinux policy is loaded.
SELINUX=enforcing
……
[root@localhost ~]# sed -i.bak 's/SELINUX=enforcing/SELINUX=enforcing/' /etc/selinux/config
[root@localhost ~]# cat /etc/selinux/config | grep SELINUX=enforcing
SELINUX=enforcing
#修改主配置文件，SELinux设为enforcing强制模式

[root@localhost opt]# cat file.txt 
root
rcot
rptt
r\ft
[root@localhost opt]# sed 's/r..t/&er/g' file.txt  
#&代表前面匹配到的内容，指代之前找到的内容
rooter
rcoter
rptter
r\fter

注意：新内容一定是固定的字符串

2.6 分组替换

可以使用分组机制来进行文本替换操作分组可以将匹配的部分文本捕获并在替换操作中使用，注意只有扩展表达式才可以实现分区替换。允许在模式匹配和替换中引用已匹配的文本。使用分组和后向引用，可以在替换文本中包含匹配到的特定部分。

语法：

sed -nr 's/正则匹配/\1/p'

示例：

[root@localhost opt]# echo 123abcDEF | sed -nr 's/123(abc)DEF/\1/p'
abc
[root@localhost opt]# echo 123abcDEF | sed -nr 's/123(abc)(DEF)/\2/p'
DEF
#\1\2代表引用前面括号里的内容，固定格式
[root@localhost opt]# echo 123abcDEF | sed -nr 's/(123)(abc)(DEF)/\2\1\3/p'
abc123DEF

应用：sed命令提取网卡ip地址

[root@localhost ~]# ifconfig ens33
ens33: flags=4163  mtu 1500
        inet 192.168.190.100  netmask 255.255.255.0  broadcast 192.168.190.255
        inet6 fe80::e743:cb44:9825:6230  prefixlen 64  scopeid 0x20
        ether 00:0c:29:e1:cb:86  txqueuelen 1000  (Ethernet)
        RX packets 12577  bytes 931901 (910.0 KiB)
        RX errors 0  dropped 0  overruns 0  frame 0
        TX packets 5565  bytes 1298791 (1.2 MiB)
        TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0

[root@localhost ~]# ifconfig ens33 | sed -rn '2s/.*inet (.*) netmask.*/\1/p'
192.168.190.100
#sed命令提取网卡ip地址（注意空格）
[root@localhost opt]# ifconfig ens33 | sed -rn '2s/.*inet ([0-9.]+).*/\1/p'
192.168.190.100
#同样可以实现：（0-9数字.）一个以上
[root@localhost opt]# echo /etc/sysconfig/network-scripts/ifcfg-ens33 | sed -nr 's#.*/(.*)#\1#p'
ifcfg-ens33
#提取ifcfg-ens33

应用：提取文件的版本号

[root@localhost opt]# cat test
ant-1.9.7.jar
ant-launcher-1.9.7.jar
antlr-2.7.7.jar
antlr-runtime-3.4.jar
aopalliance-1.0.jar
[root@localhost opt]# cat test | sed -nr 's/.*-(.*).jar/\1/p'
1.9.7
1.9.7
2.7.7
3.4
1.0
#提取文件的版本号
#使用cat test | grep -e "[0-9]\+\."也可以提取

应用：提取文件属性以数字形式显示

[root@localhost opt]# stat test
  文件："test"
  大小：95        	块：8          IO 块：4096   普通文件
设备：fd00h/64768d	Inode：68786720    硬链接：1
权限：(0644/-rw-r--r--)  Uid：(    0/    root)   Gid：(    0/    root)
环境：unconfined_u:object_r:usr_t:s0
最近访问：2024-01-30 13:48:56.384782770 +0800
最近更改：2024-01-30 13:48:53.689798114 +0800
最近改动：2024-01-30 13:48:53.690798109 +0800
创建时间：-
[root@localhost opt]# stat test | sed -nr '4s/.*([0-9]{4}).*/\1/p'
0644
#提取文件属性以数字形式显示

2.7 调用变量

要在"sed"命令中使用变量，您需要使用双引号来引用变量，不能使用单引号，并使用符号&来引用变量名。其中有一个-e选项代表多点编辑，类似grep用法，是“或”的意思。

示例：

[root@localhost opt]# name=root
[root@localhost opt]# sed -n "/$name/p" passwd     #双引号可以查询
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin
[root@localhost opt]# sed -n '/'$name'/p' passwd   #两单引号也可以查询
root:x:0:0:root:/root:/bin/bash
operator:x:11:0:operator:/root:/sbin/nologin

2.8 修改配置文件

sed可以用于修改配置文件，它可以从标准输入或文件中读取文本，并对其进行编辑和转换。

示例：不打开配置文件，修改httpd80端口

[root@localhost ~]# sed -i.bak 's/^Listen 80/Listen 8080/' /etc/httpd/conf/httpd.conf
[root@localhost ~]# grep 8080 /etc/httpd/conf/httpd.conf
Listen 8080

2.9 修改网卡名

[root@localhost ~]# cat /etc/default/grub
GRUB_TIMEOUT=5
GRUB_DISTRIBUTOR="$(sed 's, release .*$,,g' /etc/system-release)"
GRUB_DEFAULT=saved
GRUB_DISABLE_SUBMENU=true
GRUB_TERMINAL_OUTPUT="console"
GRUB_CMDLINE_LINUX="crashkernel=auto rd.lvm.lv=centos/root rd.lvm.lv=centos/swap rhgb quiet"
GRUB_DISABLE_RECOVERY="true"
[root@localhost ~]# sed -ri.bak '/^GRUB_CMDLINE_LINUX/s#(.*)"#\1 net.ifnames=0"#' /etc/default/grub
[root@localhost ~]# grep GRUB_CMDLINE_LINUX  /etc/default/grub
GRUB_CMDLINE_LINUX="crashkernel=auto rd.lvm.lv=centos/root rd.lvm.lv=centos/swap rhgb quiet net.ifnames=0"

3. awk

3.1 定义和格式

awk是一个功能强大的编辑工具，逐行读取输入文本，默认以空格或tab键作为分隔符作为分隔，并按模式或者条件执行编辑命令。用于从文件、管道或标准输入中读取文本，并根据用户指定的模式和操作进行处理。

前面提到sed命令常用于一整行的处理，而awk比较倾向于将一行分成多个“字段"然后再进行处理，且默认情况下字段的分隔符为空格或tab键。awk执行结果可以通过print的功能将字段数据打印显示。sed是行处理工具，不能直接处理列数据，需要分组后向引用，而awk可以直接处理列数据。

格式：

awk [options]   'program' var=value   file…
      选项         语法      值       文件，支持标准输入、输出
awk         'pattern { action }'      input_file

语法program通常是被放在单引号中，可分为pattern和action：

pattern：用于匹配输入文本的模式。可以使用正则表达式或字符串进行匹配。如果省略模式，则默认匹配所有行。

action：对数据进行处理，放在{}内指明，在满足模式的情况下要执行的动作。可以是单个命令或多个命令组合。如果省略动作，则默认打印整行。处理动作默认写print即可。

3.2 常见选项和执行流程

常见选项：

-F：“分隔符” 指明输入时用到的字段分隔符，默认的分隔符是若干个连续空白符

-v：var=value 变量赋值

执行流程：

① 执行BEGIN{action;… }{print}语句块中的语句
② 从文件或标准输入(stdin)读取一行，然后执行pattern{ action;… }语句块，它逐行扫描文件，
从第一行到最后一行重复这个过程，直到文件全部被读取完毕。
③ 当读至输入流末尾时，执行END{action;…}语句块
BEGIN语句块在awk开始从输入流中读取行之前被执行，这是一个可选的语句块，比如变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中
END语句块在awk从输入流中读取完所有的行之后即被执行，比如打印所有行的分析结果这类信息汇总都是在END语句块中完成，它也是一个可选语句块
pattern语句块中的通用命令是最重要的部分，也是可选的。如果没有提供pattern语句块，则默认执行{ print }，即打印每一个读取到的行，awk读取的每一行都会执行该语句块

示例：

[root@localhost opt]# cat file.txt 
1:a
2:b
3:c
[root@localhost opt]# awk -F: 'BEGIN{print "123abc"}{print}' file.txt 
123abc
1:a
2:b
3:c
#以冒号为分割符，awk开始从输入流中读取行之前执行打印123abc，即在表头添加123abc

3.3 基本用法

[root@localhost ~]#  echo 123 | awk '{print}'
123                                            #pattern什么都不写，打印全部
[root@localhost opt]# cat file.txt 
1234
abCD
[root@localhost opt]# cat file.txt | awk '/[a-z]/{print}'
abCD                                           #匹配包含小写字母的行
[root@localhost opt]# awk '{print "hello"}' < file.txt 
hello                                          #文件有几行打印几次hello
hello
hello
[root@localhost ~]# awk 'BEGIN{print 1+2}' 
3                                              #支持运算

[root@localhost opt]# cat file.txt 
1:a
2:b
[root@localhost opt]# awk -F: '{print $1,$2}' file.txt
1 a                                            #默认以空格为分隔符
2 b
[root@localhost opt]# wk -F: '{print $1"@@"$2}' file.txt
1@@a                                           #指定@@作为分隔符，打印第一列和第二列
2@@b

小结：

[root@localhost ~]#awk -F: '{print $0}' /etc/passwd
#$0代表全部元素
[root@localhost ~]#awk -F: '{print $1}' /etc/passwd
#代表第一列
[root@localhost ~]#awk -F: '{print $1,$3}' /etc/passwd
#代表第一第三列
[root@localhost ky15]#awk '/^root/{print}' passwd 
#已root为开头的行
[root@localhost ky15]#grep -c "/bin/bash$" passwd 
#统计当前已/bin/bash结尾的行
2

3.4 常规应用

提取磁盘使用率：

[root@localhost ~]# df -h
文件系统                 容量  已用  可用 已用% 挂载点
/dev/mapper/centos-root   50G  3.5G   47G    7% /
devtmpfs                 897M     0  897M    0% /dev
tmpfs                    912M     0  912M    0% /dev/shm
tmpfs                    912M  9.0M  903M    1% /run
tmpfs                    912M     0  912M    0% /sys/fs/cgroup
/dev/sda1                5.0G  179M  4.9G    4% /boot
tmpfs                    183M   12K  183M    1% /run/user/42
tmpfs                    183M     0  183M    0% /run/user/0
[root@localhost ~]# df | awk '{print $5}'| cut -d% -f1 |tail -n +2
7
0
0
1
0
4
1
0
df | awk -F"( +|%)" '{print $5}' | tail -n +2 以空格或者%为分隔符
df | awk -F"[ %]+" '{print $5}' | tail -n +2
df | awk -F"[[:space:]]+|%" '{print $5}' | tail -n +2
#均可以实现提取

提取网卡ip地址：

[root@localhost opt]# ifconfig ens33
ens33: flags=4163  mtu 1500
        inet 192.168.190.100  netmask 255.255.255.0  broadcast 192.168.190.255
[root@localhost opt]# ifconfig ens33| sed -n '2p' | awk '{print $2}'
192.168.190.100
[root@localhost opt]# ifconfig ens33 | awk '/netmask/{print $2}'
192.168.190.100
#找到第二行第二列

3.5 常见的内置变量

awk提供了一些内置变量，用于方便地处理文本数据。

FS :指定每行文本的字段分隔符，缺省默认为空格或制表符（tab）。与 “-F”作用相同 -v "FS=:"
OFS：输出时的分隔符
NF：当前处理的行的字段个数
NR：当前处理的行的行号（序数）
$0：当前处理的行的整行内容
$n：当前处理行的第n个字段（第n列）
FILENAME:被处理的文件名
RS：行分隔符。awk从文件上读取资料时，将根据RS的定义就把资料切割成许多条记录，而awk一次仅读入一条记录进行处理。预设值是\n

示例：FS

[root@localhost opt]# awk -F: {print} file.txt 
1:a
2:b
[root@localhost opt]# awk -F: '{print $1}' file.txt 
1
2
[root@localhost opt]# awk -v FS=: '{print $1}' file.txt 
1
2
[root@localhost opt]# awk -v FS=: '{print $1FS$2}' file.txt  #调用变量名FS不需要$
1:a
2:b
[root@localhost opt]# fs=:
[root@localhost opt]# awk -v FS=$fs '{print $1FS$2}' file.txt 
1:a                                                          #支持定义变量传给FS
2:b

示例OFS：

[root@localhost opt]# cat file.txt
1:a
2:b
[root@localhost opt]# awk -v FS=":" -v OFS="==" '{print $1,$2}' file.txt 
1==a
2==b

示例RS：默认是已 /n （换行符）为一条记录的分隔符

[root@localhost ~]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin
[root@localhost ~]# echo $PATH | awk -v RS=":" '{print $1}'   #以：为换行符
/usr/local/sbin
/usr/local/bin
/usr/sbin
/usr/bin
/root/bin

[root@localhost opt]# echo $PATH | sed -rn 's#/(.*)#\1#p' | awk -v RS='/' '{print $1}'| tr -d :
usr
local
sbin
usr
local
bin
usr
sbin
usr
bin
root
bin
#以/为分隔符
echo $PATH | sed -rn 's#/(.*)#\1#p' | awk -v RS='/|:/' '{print $1}'
这样也可以实现

示例NF：代表字段的个数

[root@localhost opt]# cat file.txt 
1:a
2:b
[root@localhost opt]# awk -F: '{print NF}' file.txt 
2
2

应用：过滤磁盘占用百分比

[root@localhost opt]# df
文件系统                   1K-块    已用     可用 已用% 挂载点
/dev/mapper/centos-root 52403200 3625008 48778192    7% /
devtmpfs                  917604       0   917604    0% /dev
tmpfs                     933524       0   933524    0% /dev/shm
tmpfs                     933524    9216   924308    1% /run
tmpfs                     933524       0   933524    0% /sys/fs/cgroup
/dev/sda1                5232640  182372  5050268    4% /boot
tmpfs                     186708      12   186696    1% /run/user/42
tmpfs                     186708       0   186708    0% /run/user/0
[root@localhost opt]# df | awk  '{print $(NF-1)}' | tr -d % | tail -n +2
7                                        #$NF表示最后一个字段
0
0
1
0
4
1
0

示例NR：行号，类似于wc -l

[root@localhost opt]# cat file.txt 
a:aa
b:bb
3:33
[root@localhost opt]# awk -F: '{print NR}' file.txt 
1
2
3

应用：打印出当前系统普通用户同时按倒序排列

[root@localhost ~]# awk -F:  '$3>=1000{print $3,$1}' /etc/passwd | sed -nr 's/(.*) (.*)/\2 \1/p'
nfsnobody 65534
fql 1000

[root@localhost ~]# cat /etc/passwd | sort -t: -k3 -n | tail -n1
nfsnobody:x:65534:65534:Anonymous NFS User:/var/lib/nfs:/sbin/nologin
#可以找打uid最大的用户，-t也是指定分隔符，-k3代表第三列

示例FNR：把两个文件分开重新计数

[root@localhost opt]# cat file1.txt 
123
456
[root@localhost opt]# cat file2.txt 
abc
[root@localhost opt]# awk '{print NR}' file1.txt file2.txt     #NR会合并计数
1
2
3
[root@localhost opt]# awk '{print FNR}' file1.txt file2.txt    #FNR分开计数
1
2
1

3.6 自定义变量

[root@localhost ~]# awk -v test='hello' 'BEGIN{print test}'
hello

printf（了解）

%s：显示字符串
%d, %i：显示十进制整数
%f：显示为浮点数
%e, %E：显示科学计数法数值
%c：显示字符的ASCII码
%g, %G：以科学计数法或浮点形式显示数值
%u：无符号整数
%%：显示%自身

[root@localhost opt]# cat file1.txt 
123:a
456:b
[root@localhost opt]# awk -F: '{printf "%s\n",$1}' file1.txt 
123
456
#printf虽然功能强大，但是不自动换行，需要\n换行

3.7 模式PATTERN

awk '模式{处理动作}'，PATTERN:根据pattern条件，过滤匹配的行，再做处理。

3.7.1 模式为空

如果模式为空表示每一行都匹配成功，相当于没有额外条件

[root@localhost opt]# cat file1.txt 
123:a
456:b
[root@localhost opt]# awk -F: '{print $1,$2}' file1.txt 
123 a
456 b

3.7.2 正则匹配

/regular expression/：仅处理能够模式匹配到的行，需要用/ /括起来

[root@localhost opt]# cat file1.txt 
123:a 000
456:b 789
[root@localhost opt]# awk  '/^4/{print $1}' file1.txt 
456:b                     
#匹配以4开头的行的第一列

3.7.3 line ranges：行范围

不支持使用行号，但是可以使用变量NR间接指定行号加上比较操作符或者逻辑关系

算术操作符

x+y, x-y, x*y, x/y, x^y, x%y
-x：转换为负数
+x：将字符串转换为数值

比较操作符：

==, !=, >, >=, <, <=
#####逻辑
与：&&，并且关系
或：||，或者关系
非：!，取反

[root@localhost opt]# cat file1.txt 
a:1 4
b:2 5
c:3 6
[root@localhost opt]# awk 'NR==1{print}' file1.txt 
a:1 4
[root@localhost opt]# awk 'NR==1,NR==3{print}' file1.txt  #打印出1到3行
a:1 4                           
b:2 5
c:3 6

3.7.4 /pat1/,/pat2/ 案例：找到10:00到11:00之间的日志

sed -nr '/10/,/11/p' 文件名    #sed参考2.4.1相关内容介绍
awk '/10/,/11/'      文件名
[root@localhost log]# awk '/Jan 30 21:34:24/,/Jan 30 21:34:26/' messages 
Jan 30 21:34:24 localhost avahi-daemon[685]: Registering new address record for fe80::e743:cb44:9825:6230 on ens33.*.
Jan 30 21:34:26 localhost setroubleshoot: SELinux is preventing /usr/sbin/ip from read access on the file /run/vmware-active-nics. For complete SELinux messages run: sealert -l 3c1805c2-5564-44bb-ab25-c32fb01e593a
#找到an 30 21:34:24到Jan 30 21:34:26日志

3.7.5 关系表达式

在awk中，关系表达式用于比较两个值，并返回一个布尔值（真或假）。这些表达式通常用于控制流程和过滤数据，关系表达式结果为“真”才会被处理。

真：结果为非0值，非空字符串

假：结果为空字符串或0值

[root@localhost ~]# seq 5 | awk 'n++'
2
3
4
5
#结果为第一行不打印
第一行：n=0，awk 0为假，则第一行不打印
第二行：n=1，awk 1为真，则打印第二行
第三行：n=2，awk 2为真，则打印第三行
第四行：n=3，awk 3为真，则打印第四行
第五行：n=4，awk 4为真，则打印第五行
[root@localhost ~]# seq 5 | awk '!n++'    #取反，只打印第一行
1 
[root@localhost ~]# seq 5 | awk '!0'      #都打印
1
2
3
4
5
[root@localhost ~]# seq 5 | awk 'i=!i'    #打印奇数行
1 
3
5
第一行：i未赋值，为假，!i取反为真，打印第一行
第二行：i为真，!i取反为假，第二行不打印
第三行：i为假，!i取反为真，打印第三行
第四行：i为真，!i取反为假，第四行不打印
第五行：i为假，!i取反为真，打印第五行
[root@localhost ~]# seq 5 | awk '!(i=!i)' #打印偶数行
2
4
seq 5 |awk -v i=1 'i=!i'也可实现打印偶数行

3.8 条件判断

在awk中，条件判断通常用于控制程序的流程，以便根据特定条件执行不同的操作。条件判断通常与if语句结合使用。

格式：awk 选项 '模式 {actions}'，条件判断写在 actions里

if语句：awk的if语句也分为单分支、双分支和多分支
单分支为if(判断条件){执行语句}
双分支为if(判断条件){执行语句}else{执行语句}
多分支为if(判断条件){执行语句}else if(判断条件){执行语句}else if(判断条件){执行语句}else if(判断条件){执行语句

示例：

[root@localhost opt]# awk  '{if($2>=10){print $1,$2}else{print $1}}' file.txt 
a
b
c 10
d 20
#以空格为分隔符，如果第二列大于等于10，打印第一列和第二列，否则只打印第一列

3.9 循环：for | while

在awk中，可以使用循环语句来重复执行一组操作，直到满足特定条件为止。awk支持for循环和while循环。

格式：condition:条件；statement:语句

for(expr1;expr2;expr3) {statement;…}
for(variable assignment;condition;iteration process) {for-body}
for(var in array) {for-body}

示例：1-100求和

[root@localhost ~]# awk 'BEGIN{sum=0;for(i=1;i<=100;i++){sum+=i};print sum}'
5050

3.10 数组

在awk中，数组是一种非常有用的数据结构，用于存储和操作数据。awk中的数组是关联数组，也就是说它们可以使用字符串作为索引。

awk数组特性：

(1)awk的数组是关联数组(即key/value方式的hash数据结构)，索引下标可为数值(甚至是负数、小数等)，也可为字符串

① 在内部，awk数组的索引全都是字符串，即使是数值索引在使用时内部也会转换成字符串

② awk的数组元素的顺序和元素插入时的顺序很可能是不相同的

(2) awk数组支持数组的数组

3.10.1 访问、赋值数组元素

可以使用数组的索引来访问和修改数组元素的值

[root@localhost ~]# awk 'BEGIN{name["a"]="zhangsan";name["b"]="lisi";name["c"]="wangwu";for(i in name)print name[i]}'
zhangsan
lisi
wangwu

3.10.2 数组长度

awk提供了 length() 函数来获取数组的元素个数，它也可以用于获取字符串的字符数量。还可以获取数值转换成字符串后的字符数量。

示例：

[root@localhost ~]# awk 'BEGIN{a[1]="zhangsan";print a[1];print length(a)}'
zhangsan
1

3.10.3 遍历数组

使用for循环来迭代数组中的元素

格式：for(var in array) {for-body}

示例：

[root@localhost ~]# ss -natp | awk 'NR!=1{print $1}' | sort |uniq -c
      1 ESTAB
     11 LISTEN
[root@localhost ~]# ss -natp | awk 'NR!=1{a[$1]++}END{for(i in a)print i,a[i]}'
LISTEN 11
ESTAB 1

3.10.4 实际案例

去除重复行：

[root@localhost opt]# cat file.txt 
a
a
b
b
c
[root@localhost opt]# awk '!line[$0]++' file.txt 
a
b
c
#line数组，$0，将整行作为参数写入
第一行a，一开始未赋值为假，取反为真，打印a，+1依然为真
第二行a，真取反为假，不打印，+1为真，即下次在遇到a一直不打印
第三行b，一开始未赋值为假，取反为真，打印b，+1依然为真
下面同理

3.11 awk脚本

将awk程序写成脚本，直接调用或执行

示例：

#!/bin/awk -f
{if($3>=1000){print $1,$3}}

[root@localhost opt]# awk -F: -f passwd.awk /etc/passwd
nfsnobody 65534
fql 1000

你可能感兴趣的:(正则表达式,grep,sed,awk)

Workerman-Thrift 使用教程沈韬淼Beryl
Workerman-Thrift使用教程workerman-thriftThriftRPCforphpbasedonworkerman.项目地址:https://gitcode.com/gh_mirrors/wo/workerman-thrift1、项目介绍Workerman-Thrift是一个基于Workerman的高性能PHPThriftRPC框架。Workerman是一个高性能的PHPsoc
如何在 Typecho 中实现 Joe 编辑器标签自动填充 6v6博客编辑器 android
如何在Typecho中实现Joe编辑器标签自动填充在Typecho的文章编辑过程中，如果你使用Joe编辑器，可能会希望输入#标签后能自动提取并填充到文章的标签输入框中，以提高工作效率。接下来，我们将详细介绍如何通过开发一个Typecho插件来实现这一功能。6v6博客地址：6v6.ren一、功能实现原理这个功能的实现依赖于JavaScript来监听Joe编辑器中的输入事件，通过正则表达式提取出#开头
spring.cloud.nacos.config.shared-configs property hshpy spring java 前端
InNacos,thespring.cloud.nacos.config.shared-configspropertyisusedtoloadadditionalsharedconfigurationsthatarenotdirectlytiedtothespecificapplicationbutcanbesharedacrossmultipleapplicationsorenvironment
ssh 远程echo追加文本(单双引号的使用,awk引用外部变量,$的使用) 运维青年系统运维 shell
#!/bin/bashexportx=1exporty=2exportz=3foriin{1..6}doa=`awk-vi=$i-vx=$x'NR==i{print$x}'/root/ip.txt`;//awk引用外部变量-vb=`awk-vi=$i-vy=$y'NR==i{print$y}'/root/ip.txt`;c=`awk-vi=$i-vz=$z'NR==i{print$z}'/root
python正则表达式操作指南_Python正则表达式操作指南 weixin_39566864 python正则表达式操作指南
Python正则表达式操作指南出自Ubuntu中文原文作者：A.M.Kuchling([email protected])翻译人员：FireHare校对人员：Leal适用版本：Python1.5及后续版本摘要本文是通过Python的re模块来使用正则表达式的一个入门教程，和库参考手册的对应章节相比，更为浅显易懂、循序渐进。目录[编辑]简介Python自1.5版本起增加了re模块，它提供Perl风格的正则表达式模
Python正则表达式指南 weixin_33755554 python
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html1.正则表达式基础1.1.简单介绍正则表达式并不是Python的一部分。正则表达式是用于处理字符串的强大工具，拥有自己独特的语法以及一个独立的处理引擎，效率上可能不如str自带的方法，但功能十分强大。得益于这一点，在提供了正则表达式的语言里，正则表达式的语法都是一样的，区别只在于不
Python中的正则表达式完全指南一键难忘 python 正则表达式 mysql
Python中的正则表达式完全指南正则表达式（RegularExpressions，简称regex）是一个非常强大的工具，广泛应用于文本处理、数据清洗、日志分析等领域。Python提供了re模块来处理正则表达式，它可以帮助我们在字符串中查找、替换、分割、匹配复杂模式等操作。本文将全面介绍Python中正则表达式的使用，包括基础语法、常用操作符、实用技巧，并配有代码实例，帮助大家深入理解。正则表达式
微信小程序压缩图片 Goat恶霸詹姆斯微信小程序小程序
由于wx.compressImage(Objectobject)iOS仅支持压缩JPG格式图片。所以我们需要做一下特殊的处理：1.获取文件，判断文件是否大于设定的大小2.如果大于则使用canvas进行绘制，并生成新的图片路径3.上传图片asyncchooseImage(){letres=awaitwx.chooseMedia({count:1,sizeType:["compressed"],med
如何监控ubuntu系统某个程序的运行状态，如果程序出现异常，对其自动重启。 hunter206206 ubuntu ubuntu chrome linux
在Ubuntu系统中，可以通过编写脚本结合cron或systemd来监控程序的运行状态，并在程序异常时自动重启。以下是具体步骤：方法一：使用Shell脚本和Cron编写监控脚本创建一个Shell脚本来检查程序是否运行，并在程序异常时重启。#!/bin/bash#程序名称PROGRAM_NAME="your_program_name"#检查程序是否在运行if!pgrep-x"$PROGRAM_NAM
Oracle多租户体系,使用Oracle数据库综合的多租户架构.pdf weixin_39792751 Oracle多租户体系
DatabaseConsolidationusingOracleMultitenantPiniDibask,ProductManagerforDatabaseSolutionsOctober1st,2017AboutMe•PiniDibask,ProductManager,DatabaseMonitoringSolutions(Quest)•BasedinIsrael•OracleDBAsince
jhyperscan性能优化过程大明__ hyperscan java c++
因业务需求，对正则匹配进行优化，使用hyperscan进行文本内容提取优化；Hyperscan是一款来自于Intel的高性能的正则表达式匹配库；因为业务代码是java编写的，所以参照hyperscan-java的方法，使用C/C++编译Hyperscan，然后使用JNA调用的方式使用Hyperscan；不过经性能测试，发现Hyperscan-java，并未能产生明显的性能优化；隧开始定位为什么Hy
springboot集成钉钉_SpringBoot集成钉钉报警sdk（解决Failed to introspect Class异常）周愫理(西山飞鱼) springboot集成钉钉
1.pom文件配置在resources/lib目录下加入钉钉的sdk的jar包。com.dingtalk.apidingtalk3.0.12system${project.basedir}/src/main/resources/lib/taobao-sdk-java-auto_1479188381469-20191122.jarmaven插件配置：org.springframework.boots
Transaction rolled back because it has been marked as rollback-only linab112 BUG 数据库
目录1.问题说明2.示例代码3.原因4.解决方案1.问题说明Causedby:java.lang.RuntimeException:org.springframework.transaction.UnexpectedRollbackException:Transactionrolledbackbecauseithasbeenmarkedasrollback-only有事务的方法A调用有事务的方法B
Nexpose 7.4.0 for Linux & Windows - 漏洞扫描漏洞
Nexpose7.4.0forLinux&Windows-漏洞扫描Rapid7on-premVulnerabilityManagement,releasedJan30,2025请访问原文链接：https://sysin.org/blog/nexpose-7/查看最新版。原创作品，转载请保留出处。作者主页：sysin.orgNexposeVulnerabilityScanner您的本地漏洞扫描程序搜
【加密算法】简单区分HS、RSA、ES 和 ED，与对应go实现案例 {⌐■_■} golang java 前端后端开发语言服务器
HS、RSA、ES、ED四种签名算法：一、算法对比属性HSRSAESED加密类型对称加密非对称加密非对称加密非对称加密密钥长度任意长度私钥：2048+位私钥：256+位私钥：256位（Ed25519）签名效率高较低高高验证效率高较低高高安全性中高高高密钥分离不支持支持支持支持典型场景内部系统通信安全性要求高的场景移动设备和IoT场景安全敏感的高效场景二、构建过程1.HS(HMAC-SHA)密钥生成
A Survey on Large Language Model Acceleration based on KV Cache Management UnknownBody LLM Daily Survey Paper LLM Inference 语言模型人工智能自然语言处理
本文是LLM系列文章，针对《ASurveyonLargeLanguageModelAccelerationbasedonKVCacheManagement》的翻译。基于KV缓存管理的大型语言模型加速研究综述摘要1引言2前言3分类4token级优化5模型级优化6系统级优化7文本和多模态数据集8结论摘要大型语言模型（LLM）因其理解上下文和执行逻辑推理的能力，彻底改变了自然语言处理、计算机视觉和多模态
nc命令查看远程端口通不通(Mac/Linux） fuqying macos linux 运维
nc命令-查验远程端口查看远程服务器端口是否开放,可通过nc命令nc-zv端口开放,succeeded!端口未开放,Connectionrefused扩展:nc命令可用来做网络调试、文件传输、端口扫描、网络代理、监听网络数据语法:nc[选项]主机名端口号命令选项:-l:监听模式,用于创建服务器端监听端口-p:指定源端口-s:指定源IP地址-w:设置超时时间-u:使用UDP协议-v:显示详细信息-z
Win10 Java SE Development Kit (JDK) 17.0.1 安装指南：开启您的Java开发之旅徐尚翔
Win10JavaSEDevelopmentKit(JDK)17.0.1安装指南：开启您的Java开发之旅Win10JavaSEDevelopmentKitJDK17.0.1安装项目地址:https://gitcode.com/Resource-Bundle-Collection/98c12项目介绍在当今的软件开发领域，Java作为一门广泛应用的编程语言，其开发工具包（JDK）的重要性不言而喻。本
第七章 C - D 开头的术语 yaoxin521123 IRIS相关术语 oracle 数据库
文章目录第七章C-D开头的术语当前设备(currentdevice)当前目录(currentdirectory)基于游标的SQL(cursor-basedSQL)游标(cursor)自定义存储(customstorage)以D开头的术语数据库(database)数据库缓存(databasecache)数据库加密(databaseencryption)数据库加密密钥(database-encrypt
Helix 文本编辑器使用教程邬楠满Seaman
Helix文本编辑器使用教程helixAGarry'sModroleplayingframeworkdevelopedbynebulousforthepeople.HelixISopen-source-thecodecanbeusedasyouwish.项目地址:https://gitcode.com/gh_mirrors/helix3/helix1.项目介绍Helix是一个后现代的模态文本编辑器
可扩展性设计架构模式——开闭原则 goTsHgo Java 开闭原则 java
1.概述在架构设计中，遵循开闭原则（Open/ClosedPrinciple,OCP）,代码应该“对扩展开放，对修改关闭”是实现可扩展性的关键。这个原则指导我们设计系统时，应使其对新增功能开放，而对现有代码的修改封闭。这样，当系统需求变化或需要添加新功能时，我们可以通过添加新的代码模块而不是修改现有代码来实现，从而减少了对现有系统稳定性和已有功能的风险。底层原理解释开闭原则基于抽象构建架构。系统中
Apple M1 ARM MacBook 安装 Apache TVM FF-Studio arm开发 apache
一、前置准备AppleSiliconMacBook本文以AppleM1/M2为例，M3及后续版本同理。已安装HomebrewmacOS上的包管理器，可前往Homebrew官网查看安装指引。已安装Anaconda或Miniforge确保Conda是ARM版本（通过condainfo|grepplatform验证应为osx-arm64）。二、创建并激活Conda环境在终端创建环境（Python3.8为
修改mysql初始密码「已注销」数据库 mysql java
查看当前MySQL登录密码[root@liwenjingmysql]#greppassword/var/log/mysqld.log2022-09-22T19:20:12.368849Z6[Note][MY-010454][Server]Atemporarypasswordisgeneratedforroot@localhost:mmxuyPx%+2hC当前登录密码为：mmxuyPx%+2hC执行
Docker-Compose以KRaft模式快速部署Kafka LUCIAZZZ docker kafka 容器 java 运维 spring boot
我们创建一个docker-compose.yaml文件然后后台启动我们的DockerComposedocker-composeup-d我们修改配置后可以关闭后重启docker-composedowndocker-compose.yaml文件内容version:"3"services:kafka:image:'bitnami/kafka:latest'user:rootenvironment:-KA
unity3d tilemap hewei+ unity3d
2019的unity3d需要进入packageManager添加tilemap。不然找不到tilepalette瓦片碰撞器compositecollider2d是将多个碰撞器融合提高性能的。自动添加的刚体改成static，勾选tilemapcollider2d的usedBycomposite不添加碰撞器的瓦片设置为none;图片有间隙。改为能被图片像素除断的值，也不能太小
【Vue3】defineExpose 正宗咸豆花 vue.js javascript 前端
【Vue3】defineExposedefineExpose是Vue3.2引入的一个新API，它是的配套API之一。在中，所有定义的变量和函数默认是私有的，不能从组件外部访问。如果你想让外部组件访问到内定义的属性或方法，你需要使用defineExpose显式地暴露它们。这是defineExpose的基本用法：import{defineExpose}from'vue'//...定义响应式数据、函数等
【c语言】【c++】for循环对比吃掉你也没关系吧数据结构与算法 c语言 c++
C++中的for(constauto&pair:anagramMap)是基于**范围-basedforloop（范围循环）**的语法，主要用于遍历容器或序列，和C语言中的传统for循环相比，差异在语法、功能、适用场景等方面。以下对两者进行详细对比。1.语法和适用场景C语言的传统for循环使用控制变量（如整数索引）结合条件判断和增量操作实现循环。通常用来遍历数组或实现重复逻辑。语法灵活，但不够简洁，
JavaScript学习记录22 济南小草根 JavaScript javascript 学习开发语言
第十节RegExp对象1.概述正则表达式（regularexpression）是一种表达文本模式（即字符串结构）的方法，有点像字符串的模板，常常用来按照“给定模式”匹配文本。比如，正则表达式给出一个Email地址的模式，然后用它来确定一个字符串是否为Email地址。JavaScript的正则表达式体系是参照Perl5建立的。新建正则表达式有两种方法。一种是使用字面量，以斜杠表示开始和结束。varr
《深入理解Mybatis原理》MyBatis配置解析过程后端javamybatis
配置解析主体方法publicConfigurationparse(){if(parsed){thrownewBuilderException("EachXMLConfigBuildercanonlybeusedonce.");}parsed=true;//源码中没有这一句，只有parseConfiguration(parser.evalNode("/configuration"));//为了让读者
正则表达式（Regex）-- 捕获组（capture group） xdsemo 编程语言正则表达式 python
RegularExpressionHOWTO—Python3.10.4documentation捕获组就是把正则表达式中子表达式匹配的内容，保存到内存中以数字编号或显式命名的组里，方便后面引用。分为普通捕获组(Expression)和命名捕获组(?Expression)。普通捕获组：如果没有显式为捕获组命名，即没有使用命名捕获组，那么需要按数字顺序来访问所有捕获组。在只有普通捕获组的情况下，捕获组
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul