正则表达式

  • 正则表达式 --用于文本精确匹配
(1).:               代表任意单个字符,除了换行符
(2)*:               前导字符出现 0 次 或 多次
(3).*:              任意长度的字符
(4)^:               行的开头
(5)$:               行的结尾
(6)^$:          空行
(7)[abc]            以字符为单位的或关系
(8)[a-z]   [A-Z]   [0-9]
(9)[^abc]           取非
(10)^[abc]          a或b或c开头的行
(11)^[^abc]         非a或非b或非c开头
(12)\<:         取单词的头
(13)\>:         取单词的尾

正则表达式是一种描述方法,一种小型的语言,用字符来表示某种含义的符号
一个点代表一个字符
例1 样式.T.代表3个字符,中间的字符是T 左右两边是任意一个字符
例2 ... 代表字符长度是3的字符串,如果要对比 请加入转意符
例3 data... 代表data.后接3个字符,入data.txtt data.cf data.123
^在行首
例如 样式^jack 代表jack应出现在行首,才符合条件 如jack ding
表示尾部

例 样式123$ 表示在最后一个行是123才符合条件 如jack123  
123jack  
以下是常见用法  

[A-Z] 匹配一个大写的字母  
[a-z]匹配一个小写的字母  
[0-9]一个数字  
[^A-Z]除了大写字母之外的一个字符  
[^a-zA-Z] 一个非英文字母的字符  
[^a-zA-Z0-9] 一个非英文字母,并且非数字的字符  
^出现在括号里的第一个位置 表示"非/不是"的意思  
*出现0个以上  
*表示前面的字符出现0个或者多个  
例 aA*c 代表A这个字符可能出现0个或者0个以上 如:ac aAc aAAc  
{...}指定符合的个数  
指定符合的个数  
指定前面字符的个数  
例如:{3,5}表示前面的字符有3到5个。[a-z]{3,5}、代表以小字母组成的字符串,长度是3到5  
(..)把比对符合的字符串暂时保存起来  
例如:H(..)y表示要保存H和y之间的3个字符  
若要提取保存的字符串,可以用位置参数。1代表第一个保存的字符串,2代表第二个保存的字符

支持正则表达式工具

  • grep/egrep find locate sed awk vim
grep 'regex' file       --把正则表达式写在单引号中,防止shell解释正则表达式
grep -E 'regex' file        --匹配扩展的正则表达式在grep中需要加-E选项
egrep=grep -E

# find / -regex '.*\.iso$'
# find / -regex '^\/var.*\.iso$'

locate -r
# locate -r '^\/var.*\.iso$'


sed -n '/^root/p' /etc/passwd

awk '/^root/ {print $0}' /etc/passwd

vim
/^root
/nologin$
:%s/^root/ROOT/g
  • grep
o:只打印匹配出来的字符
n:显示行号
v:取反
l:匹配成功,打印文件
c:统计匹配到的字符的数量,但是统计的是行数,而不是匹配的字符个数
A:匹配行后几行
B:匹配行前几行
C:匹配行前后几行,  如    -C 2   与   -2
i:忽略大小写
q:静默执行,一般在测试时,取返回值用
r/R:对一个目录下的所有文件进行搜索
--color:用特殊颜色标示匹配到的关键字
H: 列出匹配到关键字的文件路径

egrep:拓展正则搜索
    egrep = grep -E
    

    
# cat grep.txt 
ggle
gogle
google
gooogle
gagle
gaagle
gaaagle
abcgef

abcdef

操作如下:
grep 'g.g' grep.txt                 --只要两个g字母中间有一个任意字符就可以
grep 'g*g' grep.txt             --只要有一个g字母就可以。等同于grep g grep.txt
grep 'go*g' grep.txt            --只要两个g字母中间有零个o或多个o就可以 
grep 'g.*g' grep.txt                --只要两个g字母中间有零个或任意个字符就可以
grep 'go.*g' grep.txt           --只要go与g字母中间有零个或任意个字符就可以

/etc/passwd
grep ^...t /etc/passwd                          --查找每行里第四个字符为t的行
grep o.....$ /etc/passwd                            --查找每行里倒数第六个字符为o的行
grep s..n /etc/passwd                           --查找每行里有s和n字符,并且中间有两个字符的行
grep x:4: /etc/passwd                           --查找uid为4的行(只使用grep和正则表达式,不使用cut或awk的截取)
grep .*:.:4:.*:.*:.*:.* /etc/passwd                 --查找uid里是4的行
grep .*:.:.*4.*:.*:.*:.*:.* /etc/passwd                 --查找uid里包括4的行
grep .*:.*:.*:.*::.*:.* /etc/passwd                 --查找/etc/passwd里注释列为空的行
grep -v .*:.*:.*:.*::.*:.* /etc/passwd                  --查找/etc/passwd里注释列不为空的行
grep .*:.*:.*:.*:..*:.*:.* /etc/passwd
grep .*:[!x].*:.*:.*:.*:.*:.*:.*:.* /etc/shadow         --查找不能在登录界面用密码正常登录的用户
grep root /etc/passwd                           -- 过滤关键字
grep '^root' /etc/passwd                        -- 以 root 开头的行
grep 'bash$' /etc/passwd                        -- 以 bash 结尾的行
grep '^$' /etc/passwd                               -- 查找空行
grep '^[ru]' /etc/passwd                        -- r 或  u
grep '[0-9]' /etc/passwd                            -- 查找数字
grep '^[^abc]' /etc/passwd                          -- 取反,非 a 非 b 非 c 开头
grep '\' /etc/passwd                         --  \< 取单词的头,\> 取单词的尾
grep -E '^root|^zhang' /etc/passwd  --color         -- 拓展正则 ,  -E,匹配以root 或 zhang 开头
grep -n root /etc/passwd                        -- 带行号过滤
grep -oE '(([0-9]{1,3}\.){3}[--9]{1,3})' /var/log/secure    --在文本过滤IP地址

grep [[:digit:]] /etc/passwd 
grep [[:lower:]] /etc/passwd 
grep [[:upper:]] /etc/passwd 
grep [[:space:]] /etc/passwd 
grep [[:alnum:]] /etc/passwd    

你可能感兴趣的:(正则表达式)