正则表达式

 

  1. 句点:句点匹配所有字符,包含空格、TAB甚至是换行符。
  2. 方括号:句点的优点是通用,缺点也是通用。为解决句点符号匹配范围过于广泛这一问题,你可以在方括号(“[]”)里面指定看来有意义的字符。此时,只有方括号里面指定的字符才参与匹配。也就是说,正则表达式“t[aeio]n”只匹配“tan”、“Ten”、“tin”和“ton”。但“Toon”不匹配,因为在方括号之内你只能匹配单个字符 .方括号表示可能出现的单个字符
  3. 或符号:句点和方括号只匹配单个字符,如果要匹配多个字符就要看”或”运算符了。如果除了上面匹配的所有单词之外,你还想要匹配“toon”,那么,你可以使用“|”操作符。“|”操作符的基本意义就是“或”运算。要匹配“toon”,使用“t(a|e|i|o|oo)n”正则表达式。这里不能使用方扩号,因为方括号只允许匹配单个字符;这里必须使用圆括号“()”。圆括号还可以用来分组,具体请参见后面介绍。
  4. 表示匹配次数的符号:下面这些符号用来确定紧靠该符号左边的符号出现的次数:                                             "*"   0次或者多次   "+" 1次或者多次   "?" 0次或1次   "{n}" 恰好n次   "{n,m}"从n次到m次
  5. 实例1:假如我们在文本文件中搜索美国的社会安全码。这个号码的格式是“999-99-999”,用来匹配他的正则表达式。在正则表达式中,连字符“-”有着特殊的含义,他表示一个范围,比如0到9,因此在匹配社会安全码的连接字符是,他的前面要加一个转义字符"\"。因此正确的表示为[0-9]{3}\-[0,9]{2}\-[0,9]{3}
  6. 实例2,假如进行搜索时,你希望连字符可以出现也可以不出现,即999-99-9999和999999999都是正确的格式。这时,可以在连字符号后面加一个数量限定符号。正确的表示为[0-9]{3}\-?[0,9]{2}\-?[0,9]{4}
  7. 否符号:"^"如果用在方括号内表示不想匹配的字符,例如不能以A开头的字符串[^A][a-z]+
  8. 空白符:\s匹配所有的空白符,包含Tab字符。[\t\n\r\f]
  9. 一些常用符号: \d 表示[0-9] ,\D表示[^0-9], \w表示[A-Za-z0-9],\W表示[^A-Za-z0-9]

       

你可能感兴趣的:(正则表达式)