关于正则表达式的那些事儿

本文参照教科书《Java语言程序设计与数据结构(第11版)》以及网上资料进行编写。
参考网址:Java 多态 | 菜鸟教程 (runoob.com)
———————————————————————————————————————————

文章目录

  • 前言
  • 一、正则表达式是什么?
  • 二、JAVA正则表达式
    • 1.正则表达式实例
    • 2.几个类
    • 3.正则表达式的语法
  • 总结


前言

        本文主要较为浅显地来整理一下正则表达式的相关信息,其中主要是对java正则表达式的讲解与说明。


一、正则表达式是什么?

       正则表达式,又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

       正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

       目前,正则表达式已经在很多软件中得到广泛的应用,包括 *nix(Linux, Unix等)、HP 等操作系统,PHP、C#、Java 等开发环境,以及很多的应用软件中,都可以看到正则表达式的影子。

二、JAVA正则表达式

1.实例

       一个字符串其实就是一个简单的正则表达式,例如 Hello World 正则表达式匹配 "Hello World" 字符串。

       .(点号)也是一个正则表达式,它匹配任何一个字符如:"a" 或 "1"。

(1)目标字符串,输出2后面的abc:

// 目标字符串。 只要求输出2后面的abc
String s = "1abc 2abc 3abc";
String regular = "(?<=2)\\w{3}";
Matcher m = Pattern.compile(regular).matcher(s);
while(m.find()) {
System.out.println(m.group());
   	}

(2)使用正则表达式查找字符串中数字出现的位置:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class PrimitiveTypeTest {
    //查找数字,返回位置 
    private static final String regex ="\\d+";
    private static final String input ="0 cat catt catre cat cat 9";
    public static void main(String[] Args) {
    
        Pattern p =Pattern.compile(regex);
        Matcher q =p.matcher(input);
        int count=0;
        while(q.find()) {
            count++;
            System.out.println("match number"+count);
            System.out.println("start()"+q.start());
            System.out.println("end()"+q.end());
            
        }
    }
}

2.java.util.regex 包主要包括以下三个类:

  • Pattern 类:

    pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern 对象。该方法接受一个正则表达式作为它的第一个参数。

  • Matcher 类:

    Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。

  • PatternSyntaxException:

    PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。

(1)Pattern类:
       pattern对象是一个正则表达式的编译表示。Pattern类没有公共构造方法。要创建一个Pattern对象,必须首先调用公共静态编译方法,返回一个Pattern对象,该方法接受一个正则表达式作为它的第一个参数。
       最常用的是静态方法public static Pattern compile(String regex)返回一个Pattern对象,然后调用public Matcher match(CharSequemce input)方法,返回Matcher对象。

(2) Matcher类:
       Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。


(3)PatternSyntaxException:
PatternSyntaxException是一个非强制异常类,它表示一个正则表达式模式中的语法错误。
 

3.正则表达式的语法

字符

说明

\

将下一字符标记为特殊字符、文本、反向引用或八进制转义符。例如, n匹配字符 n。\n 匹配换行符。序列 \\\\ 匹配 \\ ,\\( 匹配 (。

^

匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与"\n"或"\r"之后的位置匹配。

$

匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与"\n"或"\r"之前的位置匹配。

*

零次或多次匹配前面的字符或子表达式。例如,zo* 匹配"z"和"zoo"。* 等效于 {0,}。

+

一次或多次匹配前面的字符或子表达式。例如,"zo+"与"zo"和"zoo"匹配,但与"z"不匹配。+ 等效于 {1,}。

?

零次或一次匹配前面的字符或子表达式。例如,"do(es)?"匹配"do"或"does"中的"do"。? 等效于 {0,1}。

{n}

是非负整数。正好匹配 n 次。例如,"o{2}"与"Bob"中的"o"不匹配,但与"food"中的两个"o"匹配。

{n,}

是非负整数。至少匹配 次。例如,"o{2,}"不匹配"Bob"中的"o",而匹配"foooood"中的所有 o。"o{1,}"等效于"o+"。"o{0,}"等效于"o*"。

{n,m}

m 和 n 是非负整数,其中 n <= m。匹配至少 n 次,至多 m 次。例如,"o{1,3}"匹配"fooooood"中的头三个 o。'o{0,1}' 等效于 'o?'。注意:您不能将空格插入逗号和数字之间。

?

当此字符紧随任何其他限定符(*、+、?、{n}、{n,}、{n,m})之后时,匹配模式是"非贪心的"。"非贪心的"模式匹配搜索到的、尽可能短的字符串,而默认的"贪心的"模式匹配搜索到的、尽可能长的字符串。例如,在字符串"oooo"中,"o+?"只匹配单个"o",而"o+"匹配所有"o"。


总结

       以上就是要讲的内容,本文仅仅简单介绍了正则表达式的一些概念,而正则表达式还有很多知识点,之后会慢慢梳理。

你可能感兴趣的:(正则表达式,java)