一点正则表达式的学习碎片

1、主要作用:分割、匹配、查找、替换
2、正则表达式最少要包含一个原子。
3、php正则表达式函数:
  • preg_match(mode,string subject,array matches)以perl语言为基础
  • ereg(mode,string subject,array regs)以POSIX基础
4、正则表达式的原子:
  1. a-z A-Z _ 0-9    //最常见的字符
  2. (abc) (skd)        //单元符合,必须完全匹配
  3. [abcs] [^abd]   //原子表,只要出现其中的元素就行,原子表中的^代表排除或相反内容
  4. 转义字符:
    1. \d   包含所有数字[0-9]
    2. \B   除所有数字外[^0-9]
    3. \w   包含所有常见字符[a-zA-Z_0-9]
    4. \W  除所有常见字符外[^a-zA-Z_0-9]
    5. \s    包含空白区域如回车、换行、分页等[\f\n\r]
5、正则表达式元字符:
     * 匹配前一个内容的0次1次或多次
     .  匹配内容的0次1次或多次,但不包括回车换行
     +匹配前一个内容的1次或多次
     ?匹配前一个内容的0次或1次
     | 选择匹配PHP中的|
     ^匹配字符串首部内容
     $匹配字符串尾部内容
     \b匹配单词边界,边界可以是空格或者特殊符合
     \B匹配除带单词边界意外内容
     {m}匹配前一个内容的重复次数为M次
     {m,}匹配前一个内容的重复次数大于等于M次
     {m,n}匹配前一个内容的重复次数M次到N次
     ()合并整体匹配,并放入内存,可以使用\1 \2 ……一次获取

6、运算顺序:
     ()圆括号是内存处理,优先级最高
     * ? + {} 重复匹配内容其次
     ^ $ \b等边界处理第三
     | 条件处理第四

7、模式修正符
     i 正则内容在匹配的时候不区分大小写(默认是区分的)
     m 在匹配首内容或者尾内容时候才用多行识别匹配
     S 将转义回车取消是为单行匹配(将多行视为一行)
     x 忽略正则中的空白
     A 强制从头开始匹配
     D 强制$匹配尾部无任何内容
     U 禁止贪婪匹配 只跟踪到最近的一个匹配符并结束

你可能感兴趣的:(一点正则表达式的学习碎片)