正则表达式

正则表达式 --用于文本精确匹配

（1）.：               代表任意单个字符，除了换行符
（2）*：               前导字符出现 0 次 或 多次
（3）.*：              任意长度的字符
（4）^：               行的开头
（5）$：               行的结尾
（6）^$：          空行
（7）[abc]            以字符为单位的或关系
（8）[a-z]   [A-Z]   [0-9]
（9）[^abc]           取非
（10）^[abc]          a或b或c开头的行
（11）^[^abc]         非a或非b或非c开头
（12）\<：         取单词的头
（13）\>：         取单词的尾

正则表达式是一种描述方法，一种小型的语言，用字符来表示某种含义的符号
一个点代表一个字符
例1 样式.T.代表3个字符，中间的字符是T 左右两边是任意一个字符
例2 ... 代表字符长度是3的字符串，如果要对比请加入转意符
例3 data... 代表data.后接3个字符，入data.txtt data.cf data.123
^在行首
例如样式^jack 代表jack应出现在行首,才符合条件如jack ding
表示尾部

例 样式123$ 表示在最后一个行是123才符合条件 如jack123  
123jack  
以下是常见用法  

[A-Z] 匹配一个大写的字母  
[a-z]匹配一个小写的字母  
[0-9]一个数字  
[^A-Z]除了大写字母之外的一个字符  
[^a-zA-Z] 一个非英文字母的字符  
[^a-zA-Z0-9] 一个非英文字母，并且非数字的字符  
^出现在括号里的第一个位置 表示"非/不是"的意思  
*出现0个以上  
*表示前面的字符出现0个或者多个  
例 aA*c 代表A这个字符可能出现0个或者0个以上 如:ac aAc aAAc  
{...}指定符合的个数  
指定符合的个数  
指定前面字符的个数  
例如：{3,5}表示前面的字符有3到5个。[a-z]{3,5}、代表以小字母组成的字符串，长度是3到5  
(..)把比对符合的字符串暂时保存起来  
例如：H(..)y表示要保存H和y之间的3个字符  
若要提取保存的字符串，可以用位置参数。1代表第一个保存的字符串，2代表第二个保存的字符

支持正则表达式工具

grep/egrep find locate sed awk vim

grep 'regex' file       －－把正则表达式写在单引号中，防止shell解释正则表达式
grep -E 'regex' file        －－匹配扩展的正则表达式在grep中需要加－E选项
egrep=grep -E

# find / -regex '.*\.iso$'
# find / -regex '^\/var.*\.iso$'

locate -r
# locate -r '^\/var.*\.iso$'


sed -n '/^root/p' /etc/passwd

awk '/^root/ {print $0}' /etc/passwd

vim
/^root
/nologin$
:%s/^root/ROOT/g

grep

o：只打印匹配出来的字符
n：显示行号
v：取反
l：匹配成功，打印文件
c：统计匹配到的字符的数量，但是统计的是行数，而不是匹配的字符个数
A：匹配行后几行
B：匹配行前几行
C：匹配行前后几行，  如    -C 2   与   -2
i：忽略大小写
q：静默执行，一般在测试时，取返回值用
r/R：对一个目录下的所有文件进行搜索
--color:用特殊颜色标示匹配到的关键字
H: 列出匹配到关键字的文件路径

egrep：拓展正则搜索
    egrep = grep -E
    

    
# cat grep.txt 
ggle
gogle
google
gooogle
gagle
gaagle
gaaagle
abcgef

abcdef

操作如下：
grep 'g.g' grep.txt                 --只要两个g字母中间有一个任意字符就可以
grep 'g*g' grep.txt             --只要有一个g字母就可以。等同于grep g grep.txt
grep 'go*g' grep.txt            --只要两个g字母中间有零个o或多个o就可以 
grep 'g.*g' grep.txt                --只要两个g字母中间有零个或任意个字符就可以
grep 'go.*g' grep.txt           --只要go与g字母中间有零个或任意个字符就可以

/etc/passwd
grep ^...t /etc/passwd                          --查找每行里第四个字符为t的行
grep o.....$ /etc/passwd                            --查找每行里倒数第六个字符为o的行
grep s..n /etc/passwd                           --查找每行里有s和n字符，并且中间有两个字符的行
grep x:4: /etc/passwd                           --查找uid为4的行（只使用grep和正则表达式，不使用cut或awk的截取)
grep .*:.:4:.*:.*:.*:.* /etc/passwd                 --查找uid里是4的行
grep .*:.:.*4.*:.*:.*:.*:.* /etc/passwd                 --查找uid里包括4的行
grep .*:.*:.*:.*::.*:.* /etc/passwd                 --查找/etc/passwd里注释列为空的行
grep -v .*:.*:.*:.*::.*:.* /etc/passwd                  --查找/etc/passwd里注释列不为空的行
grep .*:.*:.*:.*:..*:.*:.* /etc/passwd
grep .*:[!x].*:.*:.*:.*:.*:.*:.*:.* /etc/shadow         --查找不能在登录界面用密码正常登录的用户
grep root /etc/passwd                           -- 过滤关键字
grep '^root' /etc/passwd                        -- 以 root 开头的行
grep 'bash$' /etc/passwd                        -- 以 bash 结尾的行
grep '^$' /etc/passwd                               -- 查找空行
grep '^[ru]' /etc/passwd                        -- r 或  u
grep '[0-9]' /etc/passwd                            -- 查找数字
grep '^[^abc]' /etc/passwd                          -- 取反，非 a 非 b 非 c 开头
grep '\' /etc/passwd                         --  \< 取单词的头，\> 取单词的尾
grep -E '^root|^zhang' /etc/passwd  --color         -- 拓展正则 ，  -E，匹配以root 或 zhang 开头
grep -n root /etc/passwd                        -- 带行号过滤
grep -oE '(([0-9]{1,3}\.){3}[--9]{1,3})' /var/log/secure    --在文本过滤IP地址

grep [[:digit:]] /etc/passwd 
grep [[:lower:]] /etc/passwd 
grep [[:upper:]] /etc/passwd 
grep [[:space:]] /etc/passwd 
grep [[:alnum:]] /etc/passwd

正则表达式

支持正则表达式工具

你可能感兴趣的:(正则表达式)