7月26日上课 正则表达式

1、diff命令

[root@centos6 app]#cat f1
CentOS release 6.9 (Final)
Kernel \r on an \m
\l
\n
\t
[root@centos6 app]#cat f2
CentOS release 6.9 (Final)
Kernel \r on an \m
l
\n
\t
[root@centos6 app]#diff f1 f2  ---比较f1和f2文件有什么不同
3c3
< \l
---
> l
[root@centos6 app]#diff -u f1 f2 ---  -u使命令的输出为统一的格式,这种格式文件最适用于打补丁
--- f1  2017-07-26 19:33:19.089912551 +0800
+++ f2  2017-07-26 19:34:05.325914359 +0800
@@ -1,5 +1,5 @@
 CentOS release 6.9 (Final)
 Kernel \r on an \m
-\l
+l
 \n
 \t
[root@centos6 app]#diff -u f1 f2 >diff.log ---比较两个文件的不同并输出到diff.log文件中
[root@centos6 app]#ls
diff.log  f1  f2  passwd
[root@centos6 app]#rm -f f1---删除f1文件
[root@centos6 app]#patch -b f2 diff.log  ---找回f1并备份f2
patching file f2
Reversed (or previously applied) patch detected!  Assume -R? [n] y
[root@centos6 app]#ls
diff.log  f2  f2.orig  passwd
[root@centos6 app]#cat f2---f2为f1文件
CentOS release 6.9 (Final)
Kernel \r on an \m
\l
\n
\t
[root@centos6 app]#cat f2.orig ---f2.orig为备份的f2文件
CentOS release 6.9 (Final)
Kernel \r on an \m
l
\n
\t

2、基本的正则表达式

grep: Global search REgularexpression and Print out the line
作用:文本搜索工具,根据用户指定的“模式”对目标文本逐行进行匹配检查;打印匹配到的行
模式:由正则表达式字符及文本字符所编写的过滤条件

  • grep 命令选项
    --color=auto: 对匹配到的文本着色显示
    -v: 显示不被pattern匹配到的行
    -i: 忽略字符大小写
    -n:显示匹配的行号
    -c: 统计匹配的行数
    -o: 仅显示匹配到的字符串
    -q: 静默模式,不输出任何信息
    -A #: after, 后#行
    -B #: before, 前#行
    -C #:context, 前后各#行
    -e:实现多个选项间的逻辑or关系
    grep –e ‘cat ’ -e ‘dog’ file
    -w:匹配整个单词
    -E:使用ERE ,扩展的正则表达式
    -F:相当于fgrep,不支持正则表达式
  • 元字符分类:字符匹配、匹配次数、位置锚定、分组
    ①字符匹配:
    . 匹配任意单个字符
    [] 匹配指定范围内的任意单个字符
    [^] 匹配指定范围外的任意单个字符
    [:alnum:] 字母和数字
    [:alpha:] 代表任何英文大小写字符,亦即A-Z, a-z
    [:lower:] 小写字母[:upper:] 大写字母
    [:blank:] 空白字符(空格和制表符)
    [:space:]水平和垂直的空白字符(比[:blank:]包含的范围广)
    [:cntrl:] 不可打印的控制字符(退格、删除、警铃...)
    [:digit:] 十进制数字[:xdigit:]十六进制数字
    [:graph:] 可打印的非空白字符
    [:print:] 可打印字符
    [:punct:] 标点符号
    ②匹配次数:用在要指定次数的字符后面,用于指定前面的字符要出现的次数
  • 匹配前面的字符任意次,包括0次
    贪婪模式:尽可能长的匹配
    .任意长度的任意字符
    ?匹配其前面的字符0或1次
    +匹配其前面的字符至少1次
    {n}匹配前面的字符n次
    {m,n}匹配前面的字符至少m次,至多n次
    {,n}匹配前面的字符至多n次
    {n,}匹配前面的字符至少n次
    ③位置锚定:定位出现的位置
    ^ 行首锚定,用于模式的最左侧
    $ 行尾锚定,用于模式的最右侧
    ^PATTERN$ 用于模式匹配整行
    ^$ 空行
    ^[[:space:]]
    $ 空白行
    < 或\b词首锚定,用于单词模式的左侧
    > 或\b词尾锚定;用于单词模式的右侧
    匹配整个单词
    ④分组:() 将一个或多个字符捆绑在一起,当作一个整体进行处理,如:(root)+
    分组括号中的模式匹配到的内容会被正则表达式引擎记录于内部的变量中,这些变量的命名方式为: \1, \2, \3, ...
    \1表示从左侧起第一个左括号以及与之匹配右括号之间的模式所匹配到的字符
    示例:(string1+(string2))
    \1 :string1+(string2)

    \2 :string2
    后向引用:引用前面的分组括号中的模式所匹配字符,而非模式本身
    或者:|
    示例:a|b: a或b C|cat: C或cat (C|c)at:Cat或cat
[root@centos6 app]#echo "rootaaaabcxxyyyrootzzzabcyzzz"|grep "\(root\).*\1"
rootaaaabcxxyyyrootzzzabcyzzz
[root@centos6 app]#echo "rootaaaabcxxyyyrootzzzabcyzzz"|grep "\(root\).*\1\(zzz\).*\2"
rootaaaabcxxyyyrootzzzabcyzzz

总结:后向引用。引用的是匹配的结果,而不是模式本事。

3、扩展的正则表达式

egrep= grep -E
egrep[OPTIONS] PATTERN [FILE...]

  • 字符匹配:
    . 任意单个字符
    [] 指定范围的字符
    [^] 不在指定范围的字符
  • 次数匹配:
    *:匹配前面字符任意次
    ?: 0或1次
    +:1次或多次
    {m}:匹配m次
    {m,n}:至少m,至多n次
  • 位置锚定:
    ^ :行首
    $ :行尾
    <, \b :语首
    >, \b :语尾
  • 分组:
    ()
    后向引用:\1, \2, ...
  • 或者:
    a|b: a或b
    C|cat: C或cat
    (C|c)at:Cat或cat

4、正则表达式书写注意事项

  • . 是否加转移符 ** \ **
  • 基本的正则表达式()和{ }是否为\ ( \ )和\ { \ }
  • 是否加-o选项
  • 是否加" "
  • "<([0-9]{1,2}|1[0-9]{2}|2[0-4][0-9]|25[0-5])>"表示的数字是否用括号扩起来表示一个整体,以及前后是否锚定

你可能感兴趣的:(7月26日上课 正则表达式)