Perl学习笔记1
Eddy0825
1:Perl真假简单规则:
数字0为假
空的字符串(“”)和字符串“ 0 ” 为假
为定义值undef为假
其他东西均为真
2 :perl相关控制语句学习
Last’:退出当前循环
Next:使得控制权被重新传递到循环的顶部,同时下一循环继续进行
Exit:Perl退出语句
3:Perl数据列表的三种表示方法:列表,数组与哈希结构
Perl中数组变量表示:@name
qw运算符:qw( apples oranges 45.6 $x)等价于
qw(‘apples’,’oranges’,’ 45.6’ ,’$x’)
定义数组:@boy = qw(Greg Peter Bobby)
print “@array”; 打印@array中的所有元素
print scalar(@array);计算@array数组的元素数量
(其中,scalar是个特殊伪函数,强制参数在变量上下文中计算)
注:在引用各个元素之前,数组不一定需要存在
寻找数组结尾的两种方法:
A:特殊变量,形式是$#arrayname,返回数组的最后一个有效索引的号码。
B:在期望存在标量的位置上使用数组变量,如:
$size = @array;
4:@foo=qw(water pepsi coke lemonade);
$a = @foo; //$a包含数字4
$b= $#foo; //$b包含数字3
Print “$a/n”;
Print “$b/n”;
5:遍历数组:
foreach $cone (@flavors)
{
Print “I’d like a cone of $cone/n”;
}
此代码中,变量$cone设置为@flavors中的各个值。
注:foreach与for语句功能相同,互相之间可以替换使用。
6: 数组与变量之间的转换:
Split函数:标量转换为数组
Join函数:数组转换为变量
Split函数格式:
Split函数包含两个参数:第一个参数为模式,第二个为要分割的标量。
sp:@words=split(/ /,”the quick brown fox”);
注:@words包含各个单词。
sp: $numbers=join(‘,’,(1.10));
注:将字符串1,2,3,…10赋予$numbers
7:数组排序函数介绍
A:sort()函数
B:飞船运算符< = >:只能比较数字
C:cmp运算符:比较字符串
8:reverse函数
功能:对字符串的字符进行倒序操作。
Sp:@liens=qw(I do not like greem eggs and ham);
Print join(‘ ‘, reverse @lines);
9:Perl的文件操作:
打开句柄:
Open (filename,pathname) || die “$!”;
成功返回一个非0值,失败返回undef(假)。其中die函数用于终止perl程序的运行。
关闭文件句柄:
Close (filename);
Perl接受反斜杠或正斜杠的UNC路径名,sp:
open(MYTEXT,”c://windows//users//pierce//novel.txt”)||die;
open(MYTEXT,”c:/windows/users/pierce/novel.txt’)||die;
10:读取文件:
一用文件输入运算符,二是尖括号运算符<>
sp:open(MYTEXT,”myfile”)|| die “can not open myfile:$!”;
$line =<MYTEXT>;
读取文件句柄的快捷方式是:while循环。
While(<MYTEXT>)
{
Print $_;
}
注:while循环负责吧输入行赋予$_,并确保文件结束,此种特性只有while循环才有。
写入文件:
Open(filename,”>pathname”)
Open(filename,”>>pathname”)
区别:>告诉perl,pathname设定的文件应该被用新数据改写,而现有数据被删除,同时文件句柄是打开的,用于写入。
>>告诉perl打开该文件,新数据附加到该文件的结尾处。
注:写入文件后必须关闭文件句柄,写入的文件才生效。
11:模式匹配
元字符是指改变模式匹配运行特性的字符。
简单匹配模式:m/ /
模式匹配的四个原则:
1)匹配从目标字符串的左边开始,逐步向右边匹配
2)当整个模式与目标字符串相匹配时,模式匹配才返回真
3)目标字符串中第一个能匹配的字符串首先匹配
4)进行第一次最大字符数量的匹配
12:元字符简介:
圆点 . :用于匹配除了换行符外的任何单个字符。(单个不包括多个或0个)
元字符前面加上/,元字符就可以纳入正则表达式。
+通配符:使前面的字符与后面的字符至少匹配一次,也可以匹配若干次。
*通配符:使前面的字符可以进行0次或若干次匹配
?通配符:使前面的字符进行0次或一次匹配(最多匹配一次)
{}通配符,如:pat{n,m},其中,n是最小匹配次数,m是最大匹配次数。
注意:不能同时省略n与m
.*通配符:可以用来匹配任何东西。
举例:模式/c?ola/可以匹配cola和ola,但是不能与coola匹配,多出的c需要匹配两次,模式/c*ola/可以匹配cola,ola和ccola。
13:perl字符类:
用[]将字符括起来,匹配时,字符类中的所有字符被视为单个字符。
如:【abcde】:用于匹配a,b,c,d,e中的任一字符
【A- Za-z】{5}:用于匹配任何一组5个字符
14:位置通配符:
^:位于开头的插入符号^,表示正则表达式只匹配一行开头的字符
$:位于结尾的美元字符使模式只匹配一行结尾的字符
15:替换运算符:
形式如下:s///.语法如下:
S/searchpattrern/replacement/;
替换运算符用于默认搜索$_,找出searchpattern,用replacement来替换。
16:perl程序
while ($line = <FILE>)
{
if ($line =~ /http:/)
{
print $line;
}
}
其中,=~符号是模式绑定操作符,告诉perl在$line中寻找匹配正则表达式”http:”
程序2:
next LINE if $line =~ /^#/;
表示:当遇到#开头的行,则跳到LINE循环的下一次循环。
17:perl中常见的字母字符类型
名字 ASCII代码 代码
空白 [/t/n/r/f] /s
词 [a-zA-Z_0-9] /w
数字 [0-9] /d
其中,这三个简写只匹配单个字符。 可以用/w+/来匹配一个单词。
如:/bam{2}/:匹配”bam”
/(bam){2}/:匹配”bambam”
18:最小匹配
可以在量词后面加上一个问号表示最小匹配。
如:/.*?:/:此处的.*?现在表示尽可能少的匹配字符。
19:模式修饰词
修饰词 含义
/i 忽略字符的大小写
/s 令. 匹配换行符并忽略不建议使用的$*变量
/m 令^和$匹配下一个嵌入的/n
/x 忽略大多数空白并允模式中的注释
/0 只编译模式一次
/g 全局地查找所有匹配
/cg 在/g匹配失败后允许继续查找
/e 把右边当作一个表达式来计算
应用举例:m//w+:(/s+/w+)/s*/d+/;
等价于:
m
{
/w+; #匹配一个词和一个冒号
{ #分组开始
/s+ #匹配一个或多个空白
/w+ #匹配另一个单词
} #分组结束
/s* #匹配零或更多空白
/d+ #匹配一些数字
}x;