黑马程序员 java基础之正则表达式



------Java培训、Android培训、iOS培训、.Net培训、期待与您交流! -------

一、概述

        1、 概念:符合一定规则的表达式。

        2、 作用:用于专门操作字符串。

        3、 特点:用于一些特定的符号来表示一些代码操作,这样可以简化书写。所以学习正则表达式,就是在学习一些特殊符号的使用。

        4、 好处:可以简化对字符串的复杂操作。

        5、 弊端:符合定义越多,正则越长,阅读性越差。

 

二、常见符号

       说明:X表示字符X或者匹配的规则。

1、字符

        x                  字符 x

        \\                 反斜线字符

        \t                 制表符 ('\u0009')

        \n                 新行(换行)符 ('\u000A')

        \r                 回车符 ('\u000D')

        \f                 换页符 ('\u000C')

        \a                 报警 (bell) ('\u0007')

2、字符类

        [abc]                    ab c(简单类)

        [^abc]                 任何字符,除了 ab c(否定)

        [a-zA-Z]               a z A Z,两头的字母包括在内(范围)

        [a-d[m-p]]            a d m p[a-dm-p](并集)

        [a-z&&[def]]               de f(交集)

        [a-z&&[^bc]]        a z,除了 b c[ad-z](减去)

        [a-z&&[^m-p]]     a z,而非 m p[a-lq-z](减去)

3、预定义字符类

        .                         任何字符(与行结束符可能匹配也可能不匹配)

        \d                        数字:[0-9]

        \D                       非数字: [^0-9]

        \s                        空白字符:[ \t\n\x0B\f\r]

        \S                       非空白字符:[^\s] 

        \w                       单词字符:[a-zA-Z_0-9]

        \W                      非单词字符:[^\w]

4、边界匹配器

        ^                         行的开头

        $                         行的结尾

        \b                        单词边界

        \B                       非单词边界

        \A                       输入的开头

        \G                       上一个匹配的结尾

        \Z                       输入的结尾,仅用于最后的结束符(如果有的话)

        \z                        输入的结尾

5Greedy数量词

        X?                       X,一次或一次也没有

        X*                       X,零次或多次

        X+                       X,一次或多次

        X{n}                    X,恰好 n

        X{n,}                   X,至少 n

        X{n,m}                X,至少 n次,但是不超过 m

6、组和捕获

       捕获组可以通过从左到右计算其开括号来编号。例如,在表达式 ((A)(B(C)))中,存在四个这样的组:

                    1     ((A)(B(C)))

                    2     \A

                    3     (B(C))

                    4     (C)

       组零始终代表整个表达式。在替换中常用$匹配组的内容。

 

三、正则表达式具体功能

        主要有四种具体功能:匹配、切割、替换和获取

1、匹配:String类中的booleanmatches(String regex)方法。用规则匹配整个字符串,只要有一处不符合规则,就匹配结束,返回false

class  MatchesDemo
{
	/*
	对QQ号码进行校验
	要求:5~15  0不能开头,只能是数字
	*/
	//方式一,不用正则表达式
	public static void qqCheck_1(String qq)
	{
		if (!qq.startsWith("0"))
		{
			if (qq.length()>=5&&qq.length()<=15)
			{
				try
				{
					Long l=Long.parseLong(qq);//利用封装基本数据类型出现非数字报异常的特点
					System.out.println(qq);
				}
				catch (NumberFormatException e)
				{
					System.out.println("包含非法字符!");
				}
			}
			else
				System.out.println("你输入的长度非法!");
		}
		else
			System.out.println("没有0开头的号码,请重输!");
	}
	
	//方式二,用正则来实现
	public static void qqCheck_2(String qq)
	{
		String regex="[1-9]\\d{4,14}";
		if (qq.matches(regex))//用String类中matches方法来匹配
		{
			System.out.println(qq);
		}
		else
			System.out.println(qq+":是非法的号码!");

	}


	/*
		匹配
		手机号段只有 13xxx 15xxx 18xxxx
	*/

	public static void phoneCheck(String phone)
	{
		String regex="1[358]\\d{9}";
		if (phone.matches(regex))
		{
			System.out.println(phone+":::is ok..");
		}
		else
			System.out.println("手机号码输入有误!");
	}


	public static void main(String[] args) 
	{
		String qq="125696";
		qqCheck_1(qq);//不用正则的方式
		qqCheck_2(qq);//用正则的方式

		String phone="13345678910";
		phoneCheck(phone);//匹配手机号码是否正确
	}
}

切割:String类中的String[]split(String regex)方法。

class SplitDemo 
{

	public static void main(String[] args) 
	{
		String regex1="\\.";//按 .切
		String regex2=" +";//按空格切,可能有一个空格或者多个空格
		String regex3="(.)\\1+";//按照出现两次或者以上的叠词切
		String[] arr="192.168.1.62".split(regex1);//按 . 切
		print(arr);

		arr ="wo  shi   shui    545  21     3".split(regex2);//按空格切
		print(arr);

		arr="erkktyqqquizzzzzo".split(regex3);//按叠词切
		print(arr);	
	}

	//遍历
	public static void print(String[] arr)
	{
		for (String s : arr)
		{
			System.out.println(s);
		}
	}
}



你可能感兴趣的:(黑马程序员 java基础之正则表达式)