php 正则备忘
在[]中.匹配的是.。在()中.匹配的是除去换行的任意字符。需要\.才能匹配.(只匹配)
$在()中需要双\\转义:因为开头有字符^没有的话,单反斜线就可以转义
^单斜线转义\
元字符:
正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符。
PHP中preg_match正则匹配的/u /i /s
/u 表示按unicode(utf-8)匹配(主要针对多字节比如汉字) /i 表示不区分大小写(如果表达式里面有 a, 那么 A 也是匹配对象) /s (此模式下,.将匹配换行符。也就是说:.将匹配任意字符)
分隔符:
模式需要由分隔符闭合包裹. 分隔符 可以使任意非字母数字, 非反斜线, 非空白字符.
经常使用的分隔符是正斜线(/), hash符号(#) 以及取反符号(~). 下面的例子都是使用合法分隔符的模式.
/foo bar/ #^[^0-9]$# +php+ %[a-zA-Z0-9_-]%
字符簇
字符簇 含义 [[:alpha:]] 任何字母 [[:digit:]] 任何数字 [[:alnum:]] 任何字母和数字 [[:space:]] 任何白字符 [[:upper:]] 任何大写字母 [[:lower:]] 任何小写字母 [[:punct:]] 任何标点符号 [[:xdigit:]] 任何16进制的数字,相当于[0-9a-fA-F]
-标示 字符范围
[a-z] //匹配所有的小写字母 -标示 字符范围
[A-Z] //匹配所有的大写字母
[a-zA-Z] //匹配所有的字母
[0-9] //匹配所有的数字
[0-9\.\-] //匹配所有的数字,句号和减号
[ \f\r\t\n] //匹配所有的白字符
常用字符:
\b 匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。 \B 匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er',但不能匹配 "never" 中的 'er'。 \d 匹配一个数字字符。等价于 [0-9]。 \D 匹配一个非数字字符。等价于 [^0-9]。 \s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。 \S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 \w 匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。 \W 匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。
特殊字符:
$ 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身,请使用 \$。 () 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 \( 和 \)。 * 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 \*。 + 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 \+。 . 匹配除换行符 \n之外的任何单字符。要匹配 .,请使用 \。 [ 标记一个中括号表达式的开始。要匹配 [,请使用 \[。 ? 匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。要匹配 ? 字符,请使用 \?。 \ 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如, 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\",而 '\(' 则匹配 "("。 ^ 匹配输入字符串的开始位置,除非在方括号表达式中使用,此时它表示不接受该字符集合。要匹配 ^ 字符本身,请使用 \^。 { 标记限定符表达式的开始。要匹配 {,请使用 \{。 | 指明两项之间的一个选择。要匹配 |,请使用 \|。
- 标示字符范围0-9
限定符:
* 匹配前面的子表达式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。 + 匹配前面的子表达式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等价于 {1,}。 ? 匹配前面的子表达式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等价于 {0,1}。 {n} n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。 {n,} n 是一个非负整数。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。 {n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。
定位符:
用来描述字符串或单词的边界,^和$分别指字符串的开始与结束,\b描述单词的前或后边界,\B表示非单词边界。不能对定位符使用限定符。
注:^在[]中括号开端代表:非,不匹配[]中的字符。[^0-9] :不匹配数字
非打印字符(空白符)
\f 匹配一个换页符。等价于 \x0c 和 \cL。 \n 匹配一个换行符。等价于 \x0a 和 \cJ。 \r 匹配一个回车符。等价于 \x0d 和 \cM。 \s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。 \S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。 \t 匹配一个制表符。等价于 \x09 和 \cI。 \v 匹配一个垂直制表符。等价于 \x0b 和 \cK。
后向引用:
断言:
例:
preg_match_all("/^\d+-?\d+$/",$check,$res1,PREG_PATTERN_ORDER);//验证数字开头,数字结尾,中间允许出现一个-横杠
//preg_match_all("/^1[3|5|7|8][0-9]{9}$/" , $v , $res , PREG_PATTERN_ORDER);//单个电话号码验证
//if($res[0] == false)
//{
// $data[$v] = '格式不正确';
//}
//手机格式
function checkMBPhone(phone){ var GSMPhNo = /^(13[4-9])|(147)|(159)|(158)|(150)|(151)|(152)|(157)|(178)|(182)|(183)|(184)|(187)|(188)/; //以134(5、6、7、8、9)或159,158,151,150开头; var num11 = /^\d{11}$/; //11位数字; if( "" != phone ){ if(num11.exec(phone)){ if(GSMPhNo.exec(phone)){ checkSuc("loginName"); return true; }else{ //alert("对不起,请您正确输入中国移动GSM手机号码(以134-139、159、158、157、152、151、150 、182 或188开头)!"); showMessage("温馨提示:请正确输入11位中国移动手机号码!","loginName"); return false; } }else{ //alert("请正确输入11位手机号码(数字)!"); showMessage("温馨提示:请正确输入11位中国移动手机号码!","loginName"); return false; } }else{ showMessage("温馨提示:请输入11位中国移动手机号码!","loginName"); return false; } }
//邮箱格式 \w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
function CheckMail(mail) { var filter = /^([a-zA-Z0-9_\.\-])+\@(([a-zA-Z0-9\-])+\.)+([a-zA-Z0-9]{2,4})+$/; if (filter.test(mail)) return true; else { alert('您的电子邮件格式不正确'); return false;} }
preg_match_all("/<tr>([\s\S]*?)<\/tr>/" , $htm , $res , PREG_PATTERN_ORDER);//([\s\S]*)得到一个整体一个数组,([\s\S]*?)多个,(.*?)不匹配换行
去除空白符:$res = preg_replace("/[\s]/" , "" , $res);
0-255的数字:preg_match("/^(([0-9]{1,2})|(1[0-9][0-9])|(2[0-4][0-9])|(25[0-5]))$/","233")
(待续)