Java SE 学习笔记(十)—— 正则表达式

目录

  • 1 引言
  • 2 常用匹配规则
    • 2.1 字符类
    • 2.2 预定义的字符类
    • 2.3 贪婪的量词
  • 3 正则表达式匹配的 API
  • 4 正则表达式应用
    • 4.1 正则表达式常见应用案例
    • 4.2 正则表达式在字符串方法中的使用
    • 4.3 正则表达式爬取信息

1 引言


正则表达式可以用一些规定的字符来制定规则,并用来校验数据格式的合法性。

Java SE 学习笔记(十)—— 正则表达式_第1张图片

2 常用匹配规则


2.1 字符类


默认匹配一个字符

[abc] :只能是a 、b、或者 c

[^abc]: 除了a 、b、 c 之外的任意字符

[a-zA-Z]: a 到 z A 到 Z(范围)

[a-d[m-p]] :a 到 d 或者 m 到 p(并集)

[a-z&&[def]]: d、e 或 f (交集)

[a-z&&[^bc]]: a 到 z,除了 b、c

[a-z&&[^m-p]] : a 到 z,除了 m 到 p

2.2 预定义的字符类


默认匹配一个字符

.:任意字符

\d:一个数字:[0-9]

\D:非数字:[^0-9]

\s:一个空白字符:[\t\n\x0B\f\r]

\S:非空白字符:[^\s]

\w:英文、数字、下划线: [a-zA-Z_0-9]

\W:非英文、数字、下划线: [^\w]

2.3 贪婪的量词


配合匹配多个字符

?:前面的字符出现 0 次或 1 次

*:前面的字符出现 0 次或 多 次

+:前面的字符出现 1 次或 多 次

{n}:前面的字符出现 n 次

{n,}:前面的字符至少出现 n 次

{n,m}:前面的字符至少出现 n 次,但不超过 m 次

3 正则表达式匹配的 API


字符串对象提供了匹配正则表达式规则的 API

public boolean matches(String regex)

判断指定字符串是否匹配正则表达式,匹配返回true、不匹配返回false

举个栗子:

public class Demo {
    public static void main(String[] args) {
        // 只能出现a、b、c
        System.out.println("a".matches("[abc]")); // true
        // 默认只匹配一个字符
        System.out.println("ab".matches("[abc]")); // false
        System.out.println("ab".matches("[abc]+")); // true

        // 不能出现a、b、c
        System.out.println("a".matches("[^abc]")); // false
        System.out.println("z".matches("[^abc]")); // true

        // 匹配数字
        System.out.println("3".matches("\\d")); // true
        System.out.println("a".matches("\\d")); // false

        // 匹配数字、字母、_
        System.out.println("_".matches("\\w")); // true
        System.out.println("24".matches("\\w")); // false
        System.out.println("我".matches("\\w")); // false
        System.out.println("我".matches("\\W")); // true

        System.out.println("-------------------------");

        // 校验密码:必须是数字、字母、下划线,至少6位
        System.out.println("2ugyftyf2".matches("\\w{6,}")); // true

        // 验证码,必须是数字、字符,必须是4位
        System.out.println("34jh".matches("[a-zA-Z0-9]{4}")); // true
        System.out.println("34jh".matches("[\\w&&[^_]]{4}")); // true
    }
}

4 正则表达式应用

4.1 正则表达式常见应用案例


需求

  • 请编写程序模拟用户输入手机号码、验证格式正确,并给出提示,直到格式输入正确为止。
  • 请编写程序模拟用户输入邮箱号码、验证格式正确,并给出提示,直到格式输入正确为止。
  • 请编写程序模拟用户输入电话号码、验证格式正确,并给出提示,直到格式输入正确为止。

分析

  • 定义方法,接收用户输入的数据,使用正则表达式完成检验,并给出提示。

示例代码:

import java.util.Scanner;

public class Demo {
    public static void main(String[] args) {
        checkPhone();
        checkEmail();
        checkTel();
    }
    public static void checkPhone(){
        Scanner sc =new Scanner(System.in);
        while (true) {
            System.out.println("请您输入你的注册手机号码:");
            String phone = sc.next();
            if (phone.matches("1[3-9]\\d{9}")){
                System.out.println("手机号码格式正确,注册成功!");
                break;
            }else{
                System.out.println("手机号码格式有误!");
            }
        }
    }
    public static void checkEmail(){
        Scanner sc =new Scanner(System.in);
        while (true) {
            System.out.println("请您输入你的邮箱:");
            String phone = sc.next();
            // [email protected]
            // [email protected]
            // [email protected]
            // 这里注意.的正则表达式
            if (phone.matches("\\w{1,30}@[a-zA-Z0-9]{2,20}(\\.[a-zA-Z0-9]){1,2}")){
                System.out.println("邮箱格式正确,注册成功!");
                break;
            }else{
                System.out.println("邮箱格式有误!");
            }
        }
    }
    public static void checkTel(){
        Scanner sc =new Scanner(System.in);
        while (true) {
            System.out.println("请您输入你的电话号码:");
            String phone = sc.next();
            if (phone.matches("0\\d{2,6}-?\\d{5,20}")){
                System.out.println("电话号码格式正确,注册成功!");
                break;
            }else{
                System.out.println("电话号码格式有误!");
            }
        }
    }
}

4.2 正则表达式在字符串方法中的使用


在这里插入图片描述
举个栗子:

public class Demo {
    public static void main(String[] args) {
        String names = "张三huuigh7566756李四vtftr65675王五tftyftyfty999赵六";
        String[] arrs = names.split("\\w+");
        for (int i = 0; i < arrs.length; i++) {
            System.out.println(arrs[i]);
        }
        /*
        /张三
        李四
        王五
        赵六
         */
        String s = names.replaceAll("\\w+", "\\\\");
        System.out.println(s); // 张三\李四\王五\赵六
        
        String s1 = names.replaceAll("\\w+", "\t");
        System.out.println(s1); // 张三	李四	王五	赵六

        String s2 = names.replaceAll("\\w+", "\\t"); // 同直接替换成t
        System.out.println(s2); // 张三t李四t王五t赵六
    }
}

4.3 正则表达式爬取信息


正则表达式支持爬取指定的信息

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Demo {
    public static void main(String[] args) {
        String rs = "来学习Java,电话020-43422424,或者联系邮箱" +
                "[email protected],电话18762832533,0203232323" +
                "邮箱[email protected],400-150-3233 ,4001073232";
        // 需求:从上面的内容中爬取出 电话号码和邮箱
        // 1.定义爬取规则
        String regex = "(\\w{1,}@\\w{2,10}(\\.\\w{2,10}){1,2})|" +
                "(1[3-9]\\d{9})|(0\\d{2,5}-?\\d{5,15})|400-?\\d{3,8}-?\\d{3,8}";
        // 2.编译正则表达式成为一个匹配规则对象
        Pattern pattern = Pattern.compile(regex);
        // 3.通过匹配规则对象得到一个匹配数据内容的匹配器对象
        Matcher matcher = pattern.matcher(rs);
        // 4.通过匹配器去内容中爬取出信息
        while (matcher.find()) {
            System.out.println(matcher.group());
        }
        /*
        020-43422424
        [email protected]
        18762832533
        0203232323
        [email protected]
        400-150-3233
        4001073232
        * */
    }
}

你可能感兴趣的:(Java,java,学习,笔记)