perl学习笔记五----模式匹配

模式匹配
模式指在字符串中寻找的特定序列的字符,由反斜线包含:
/def/即模式def。

一 模式匹配的语法
m/def/
例如if(m/def/){}这是在$_中寻找def匹配. 如果将模式括起来的字符
(称为界限符)是斜杠,那么编写模式匹配代码时也可以不带m。
/def/
模式匹配的操作符 =~,!~若在该字符串中找到了该模式,则返回非零值,
即true,不匹配则返回0,即false。!~则相反。这两者适合条件控制.
例如 if ($question =~ /please/) {
      print ("Thank you for being polite!/n") ;
    }
   
二 模式匹配中的特殊字符
2.1 +
+用于使前面的字符与后面的字符至少匹配一次,也可以任
意次地进行匹配.类似于windows中*
例如 /d+g/能匹配的dog,dogg,dooooog
     /ab+/在字符串abbc中匹配的将是abb,而不是ab。
2.2 []和[^]
 []意味着匹配一组字符中的一个
 ^表示除其之外的所有字符
 例如 /w[abcd]s/能匹配的was,wbs,wcs,wds
     /w[^ab]s/不能匹配的was,wbs
也可以写成如下形式
/w[a-z0-9A-Z]s/  
2.3 字符 *和? 
   它们与+类似,区别在于*匹配0个、1个或多个相同字符,?匹配0个或1个该字符。
   例如 /de*f/匹配df、def、deeeef等;
        /de?f/匹配df或def。
2.4 位置通配符(锚模式)
^ 或 /A 仅匹配串首  
$ 或 /Z 仅匹配串尾 
/b 匹配单词边界 
/B 单词内部匹配 
例如 :/^def/只匹配以def打头的字符串,/$def/只匹配以def结尾的字符串,
       结合起来的/^def$/只匹配字符串def(?)。/A和/Z在多行匹配时与^和$不同。
       
        /b在单词边界匹配://bdef/匹配def和defghi等以def打头的单词,但
        不匹配abcdef。/def/b/匹配def和abcdef等以def结尾的单词,但不匹配defghi,
        //bdef/b/只匹配字符串def。注意://bdef/可匹配$defghi,因为$并不被看作
        是单词的部分。
        
    /B在单词内部匹配://Bdef/匹配abcdef等,但不匹配def;/def/B/匹配defghi等;
    //Bdef/B/匹配cdefg、abcdefghi等,但不匹配def,defghi,abcdef。
2.5 字符转义类
/d 任意数字  [0-9] 
/D 除数字外的任意字符   [^0-9] 
/w 任意单词字符  [_0-9a-zA-Z] 
/W 任意非单词字符  [^_0-9a-zA-Z] 
/s 空白  [ /r/t/n/f] 
/S 非空白  [^ /r/t/n/f] 
2.6 .
字符"."匹配除换行外的所有字符,通常与*合用。
2.7 匹配指定数目的字符 
   字符对{}指定所匹配字符的出现次数。
   如:/de{1,3}f/匹配def,deef和deeef;
   /de{3}f/匹配deeef;
   /de{3,}f/匹配不少于3个e在d和f之间;
   /de{0,3}f/匹配不多于3个e在d和f之间。
2.8 指定选项 
   字符"|"指定两个或多个选择来匹配模式。如:/def|ghi/匹配def或ghi。
   
这些转义符有一定的操作顺序:
()  模式内存 
+ * ? {}  出现次数 
^ $ /b /B  锚 
|  选项 

2.9 模式次序变量 
   在模式匹配后调用重用部分的结果可用变量$n,全部的结果用变量$&。
     $string = "This string contains the number 25.11.";
     $string =~ /-?(/d+)/.?(/d+)/; # 匹配结果为25.11
     $integerpart = $1; # now $integerpart = 25
     $decimalpart = $2; # now $decimalpart = 11
     $totalpart = $&; # now totalpart = 25.11

三 模式匹配选项
g  匹配所有可能的模式 
i  忽略大小写 
m  将串视为多行 
o  只赋值一次 
s  将串视为单行 
x  忽略模式中的空白 

3.1、匹配所有可能的模式(g选项) 
  @matches = "balata" =~ /.a/g; # now @matches = ("ba", "la", "ta")
   匹配的循环:
   while ("balata" =~ /.a/g) {
     $match = $&;
     print ("$match/n") ;
   }
   结果为:
     ba
     la
     ta
   当使用了选项g时,可用函数pos来控制下次匹配的偏移:
     $offset = pos($string);
     pos($string) = $newoffset;
3.2、忽略大小写(i选项)例 
   /de/i 匹配de,dE,De和DE。
3.3、将字符串看作多行(m选项) 
   在此情况下,^符号匹配字符串的起始或新的一行的起始;$符号匹配任意行的末尾。
3.4、只执行一次变量替换例 
   $var = 1;
   $line = <STDIN>;
   while ($var < 10) { 
     $result = $line =~ /$var/o;
     $line = <STDIN>; 
     $var++;
   }
   每次均匹配/1/。
3.5、将字符串看作单行例 
   /a.*bc/s匹配字符串axxxxx /nxxxxbc,但/a.*bc/则不匹配该字符串。
3.6、在模式中忽略空格 
   //d{2} ([/W]) /d{2} /1 /d{2}/x等价于//d{2}([/W])/d{2}/1/d{2}/。
             
四 模式匹配的附加操作
4.1 替换操作符
语法为s/pattern/replacement/,其效果为将字符串中与pattern匹配的部分换成replacement。如:
     $string = "abc123def";
     $string =~ s/123/456/; # now $string = "abc456def";
   在替换部分可使用模式次序变量$n,如s/(/d+)/[$1]/,但在替换部分不支持模式的特殊字符,
如{},*,+等,如s/abc/[def]/将把abc替换为[def]。
   替换操作符的选项如下表:

g  改变模式中的所有匹配 
i  忽略模式中的大小写 
e  替换字符串作为表达式 
m  将待匹配串视为多行 
o  仅赋值一次 
s  将待匹配串视为单行 
x  忽略模式中的空白 

   注:e选项把替换部分的字符串看作表达式,在替换之前先计算其值,如:
     $string = "0abc1";
     $string =~ s/[a-zA-Z]+/$& x 2/e; # now $string = "0abcabc1"


4.2 翻译操作符      
这是另一种替换方式,语法如:tr/string1/string2/。同样,string2为替换部分,但其
效果是把string1中的第一个字符替换为string2中的第一个字符,把string1中的第二个字符替
换为string2中的第二个字符,依此类推。如:
     $string = "abcdefghicba";
     $string =~ tr/abc/def/; # now string = "defdefghifed"
   当string1比string2长时,其多余字符替换为string2的最后一个字符;当string1中同一个字符
出现多次时,将使用第一个替换字符。
   翻译操作符的选项如下:

c  翻译所有未指定字符 
d  删除所有指定字符 
s  把多个相同的输出字符缩成一个 
如$string =~ tr//d/ /c;把所有非数字字符替换为空格。$string =~ tr/t//d;删除tab和空格; 
    $string =~ tr/0-9/ /cs;把数字间的其它字符替换为一个空格 

你可能感兴趣的:(perl学习笔记五----模式匹配)