正则表达式笔记01

元字符(正则表达式规定的特殊代码)

1.\b(位置)单词的分界处

\bhi\b

2..(字符)匹配除了换行符以外的任意字符

3.*(数量)指定*前边的内容可以连续重复使用任意次以使整个表达式得到匹配

因此,.*连在一起就意味着任意数量的不包含换行的字符。

\bhi\b.*\bLucy\b

意思是:先是一个单词 hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词。


4.\d(数字)匹配一位数字 (0,或1,或2,或……)

0\d\d-\d\d\d\d\d\d\d\d

匹配的字符串:以0开头,然后是两个数字,然后是一个连字符“-”,最后是8个数字。 (也就是中国的电话号码。当然,这个例子只能匹配区号为3位的情形)。

(“-”不是元字符)

简写:

0\d{2}-\d{8}

这里\d后面的{2}({8})的意思是:前面\d必须连续重复匹配2次(8次)。


5.\s(空白符)匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等。

6.\w 匹配字母或数字或下划线或汉字等。


测试正则表达式的工具:

Regex Tester(.Net下的工具)

首先确保已经安装了.Net Framework 2.0,然后下载Regex Tester。这是个绿色软件,下载完 后打开压缩包,直接运行RegexTester.exe就可以了。

你可能感兴趣的:(正则表达式笔记01)