正则表达式和grep、vim、awk、sed等的关系:
正则表达式是一种方法,相当于一种工艺,grep等命令相当于是一个具体的加工机器,机器在加工产品的时候,采用这种方法。
三者的效率:grep>sed>awk
常用通配符:
* 代表 匹配0个或者多个字符
?代表匹配1个字符
[…] :匹配范围内任意1个字符,例如[az]、[a-z]、[a\-z]
[^…]: 匹配范围外任意1个字符,表示取反
{}:组合匹配,touch a{1,3,5} touch b{1..10} touch {a,b,c}_{1,2,3}
例:
[0-9] 代表数字
[abcd123]代表取中括号里的任意一个字符
[a-Z] 代表大小写字母
[0-Z]代表数字0-9和所有的大小写字母
正则表达式里通配符和shell里面的通配符的区别:
grep全称通用正则表达式分析程序(global research regular expression and printing)。
其实,grep是一个过滤命令,根据特定的正则表达式来过滤文本里的内容。
grep是根据某个模式进行匹配文件里的一行一行的数据去处理的,如果有匹配的行,就会将整行输出到屏幕上。
grep用的时候模式要用双引号""引起来!!!
用途:使用正则表达式搜索文本,并把匹配的行打印出来
格式:grep [选项] 模式 目标文件
模式其实就是一个公式,里面有字母+数字+特殊符号,组合成一个正则表达式,表达出某个含义。
常用选项:
-v:invert,反转查找,输出与模式不相符的行;
-An:after-context,同时显示符合条件行的下面n行;
-Bn:before-context,同时显示符合条件行的上面n行;
-Cn:同时显示符合条件行的上面n行和下面n行;
-E:extended regular,支持扩展正则表达式;
-o:only-matching,仅显示匹配的字符串;
-f:根据文件内容进行匹配;
-a:以文本文件方式搜索,不忽略二进制的数据;
-c:计算找到的符合行的次数;
-i:ignore-case忽略大小写;
-n:line-number,顺便输出行号;
-P "\t" --》得到Tab键 --》使用perl语言的正则语法,支持\t表示table键,\s表示空白。
Linux系统支持三种形式的grep命令,通常将这三种形式的grep命令称为grep命令族,这三种形式具体为:
正则表达式是一个指定文本模式的标准Unix 语法。
使用特殊元字符实现复杂的搜索问题;
元字符(meta characters)是用来阐释字符表达式意义的字符,简言之,元字符就是描述字符的字符,它用于对字符表达式的内容、转换及各种操作信息进行描述。
正则表达式是由一串字符和元字符构成的字符串,简称RE(Regular Expression)。
基本正则表达式和Unix兼容;
扩展正则表达式增加了一些新的元字符。
正则表达式由下列元素构成 :
正则里的通配符:
例:a…b :代表ab之间有三个字符。
[abc] :a或者b或者c中的一个。
[^abc] :不是abc其中的一个。
[0-9]、[a-z]、[A-Z] : 数字、小写、大写。
[:alnum:] -字母数字混排 等同于[0-Z]
[:digit:] -数字 等同于[0-9]
[:lower:] -小写字母 等同于[a-z]
[:upper:] -大写字母 等同于[A-Z]
[:space:] -空白字符,空格、TAB、换行符等
通用修饰符(理解为通配符即可)
例:ab?c 代表没有b或者只有一个b,即等同于ac、abc。
例:ab*c 代表没有b或者多个b,即等同于ac、abc、abbc、abbbc......
例:ab+c 代表 一个b或者多个b,即等同于abc、abbc、abbc......
例:ab{2}c 代表b出现了两次,即等同于abbc。
例:ab{2,4}c 代表2个到4个b,即等同于abbc、abbbc、abbbbc。
锚点搜索
例 ^aa 代表以aa开头的行。
例 bash$代表以bash结尾的行。
例 \bwubing 代表以wubing开头的行。
例 wubing\b 代表以wubing结尾。
例 \<wubing\> 代表wubing这个单词。
grep在界定单词的时候,默认使用的分隔符是空白。
egrep、awk和Perl等Linux工具还支持正则表达式扩展出来的一些元字符,这些元字符如下表所示:
正则表达式分组
①“?”、”*”、”+”默认只能修饰前面一个字符
②利用圆括号( )可以实现多个字符分组。
例 f(oo)* :因为oo括起来了,所以把oo看成"一个字符",即f、foo、foooo......
③在圆括号中利用”|”实现或者的功能
echo foooeee | egrep --color "(oo|ee){2}"
echo foooeee | egrep --color "(oo|ee){1}"
转义元字符
egrep ‘cat.' /etc/aa
egrep ‘cat\.' /etc/aa
正则表达式与通配符匹配的区别:
简单来讲分为三类:
写ip地址正则时的方法:需要按个位(1位)、十位(2位)、百位(3位)
显示文件中的所有A类地址:(1-126)
"\b([1-9]|[1-9][0-9]|1[01][0-9]|12[0-6])(\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]) ){3}\b"
解析:
先写的个位,十位,百位先写的100-119,再120-126;
0-255,先0-9,再10-99,100-199,200-249,最后250-255
显示文件中的所有B类地址:(128-191)
"\b(12[89]|1[3-8][0-9]|19[01])(\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]) ){3}\b"
显示文件中的所有C类地址:(192-223)
"\b(19[2-9]|2[01][0-9]|22[0-3])(\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5]) ) {3}\b"
匹配email地址:
egrep "[0-Z._]+@[0-Z]+\.[a-Z]+"
匹配HTTP URL:
egrep "^http://([0-Z]+\.){2}[a-Z]{2,3}"
egrep --color "http://(.*\..*){2}" --》网址至少有两个点!(适用所有网址)
1.新建/lianxi目录,复制/etc/passwd到当前目录下。
2.查找出当前passwd文件中以ftp开头或者mail开头的行,在屏幕输出。
3.查找出当前passwd文件中首行不是以r、m、f开头的行,在屏幕输出。
4.查找出当前passwd文件中以bash结尾的行。
5.查找出/etc/login.defs文件中的有效行(不显示空行和注释行)。
6.查找出/var/log/messages文档中有16个字母的单词。
7.查找/etc/passwd文件里用户名包含liu同时使用bash的用户。
8.查找/etc/ssh/sshd_config文件里的有效行。
9.查找/etc/ssh/sshd_config文件里的包含连续2个数字的行。
10.查找出包含特殊字符的行。
11.查找出不包含数字的行。
12.查找出/var/log/messages里的ip地址出来。
13.写一个正则来表示出下面的网址,例如:
http://www.baidu.com
http://www.sina.com
http://www.163.com
http://www.12306.cn
http://www.qillu.edu
14.写一个表示邮箱的正则,例如:
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
15.C类ip地址的正则表达式
section1:范围在192-223之间
section2和section3和section4范围:0-255之间
例如:193.168.23.1
16.监控/var/log/secure文件,统计出ssh错误连接本机次数超过十次的ip地址,拒绝这个ip地址再ssh连接过来(将这个ip地址写入到/etc/hosts.deny黑名单,/etc/hosts.allow是白名单)。
答案:
1.新建/lianxi目录,复制/etc/passwd到当前目录下。
mkdir /lianxi
cd /lianxi
cp /etc/passwd .
2.查找出当前passwd文件中以ftp开头或者mail开头的行,在屏幕输出。
cat passwd|grep "^ftp|^mail"
3.查找出当前passwd文件中首行不是以r、m、f开头的行,在屏幕输出。
cat passwd|grep -v "^r|^m|^f"
4.查找出当前passwd文件中以bash结尾的行。
cat passwd|grep "bash$"
5.查找出/etc/login.defs文件中的有效行(不显示空行和注释行)。
cat /etc/login.defs|egrep -v "^$|^#"
6.查找出/var/log/messages文档中有16个字母的单词。
cat /var/log/messages|egrep "\<[0-Z]{16}\>"
7.查找/etc/passwd文件里用户名包含liu同时使用bash的用户。
cat passwd|egrep "^[0-Z]*liu[0-Z]*" | egrep "bash"
或
cat /etc/passwd|egrep "^.*liu.*:x:"|egrep "bash"
或
cat passwd|egrep "^[0-Z_]*liu.*bash$"
8.查找/etc/ssh/sshd_config文件里的有效行。
cat /etc/ssh/sshd_config|egrep -v "^$|^#"
9.查找/etc/ssh/sshd_config文件里的包含连续2个数字的行。
cat /etc/ssh/sshd_config|egrep "\b[0-9]{2}\b"
10.查找出包含特殊字符的行。
cat /etc/ssh/sshd_config|egrep "[^0-Z]" --》包含特殊字符(^在[]里面,表示取反)
11.查找出不包含数字的行。
cat /etc/passwd|grep -v ".*[0-9].*"
12.查找出/var/log/messages里的ip地址出来。
cat /var/log/messages | egrep "\b([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5])(\.([0-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]) ){3}\b"
13.写一个正则来表示出下面的网址,例如:
http://www.baidu.com
http://www.sina.com
http://www.163.com
http://www.12306.cn
http://www.qillu.edu
[root@liupeng lianxi]# cat dizhi.txt
http://www.baidu.com
http://www.sina.com
http://www.163.com
http://www.12306.cn
http://www.qillu.edu
[root@liupeng lianxi]# cat dizhi.txt|egrep --color "http://(.*\..*){2}"
http://www.baidu.com
http://www.sina.com
http://www.163.com
http://www.12306.cn
http://www.qillu.edu
[root@liupeng lianxi]#
14.写一个表示邮箱的正则,例如:
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
PS:用户名最大16位。
[root@liupeng lianxi]# cat youxiang.txt
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[root@liupeng lianxi]# cat youxiang.txt|egrep "\b[0-Z._]{1,16}+@[0-Z]+\.[a-Z]+\b"
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[email protected]
[root@liupeng lianxi]#
15.C类ip地址的正则表达式
section1:范围在192-223之间
section2和section3和section4范围:0-255之间
例如:193.168.23.1
[root@liupeng lianxi]# cat ipip.txt
193.168.23.1
10.10.10.1
192.168.12.12
123.123.123.123
[root@liupeng lianxi]# cat ipip.txt|egrep "\b(19[2-9]|2[01][0-9]|22[0-3])(\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}\b"
193.168.23.1
192.168.12.12
[root@liupeng lianxi]#
16.监控/var/log/secure文件,统计出ssh错误连接本机次数超过十次的ip地址,拒绝这个ip地址再ssh连接过来(将这个ip地址写入到/etc/hosts.deny黑名单,/etc/hosts.allow是白名单)。
#!/bin/bash
while true
do
cat secure|egrep "Failed passwd"|egrep -o "\b192(\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}\b"|sort|uniq -c|sort -nr >secure.txt
deny=$(cat /etc/hosts.deny|egrep "^sshd:192(\.([0-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])){3}$"|awk -F: '{print $2}')
echo $deny >deny_ip.txt
cat secure.txt|while read times IP
do
if (( $times>=2 ))
then
if ! grep $IP deny_ip.txt &>/dev/null
then
echo "sshd:$IP" >>/etc/hosts.deny&&echo "$IP has been written to /etc/hosts.deny"
fi
fi
done
sleep 1
done