Java中的正则表达式

1、体验正则表达式

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @Description: 体验正则表达式:提取英文单词
 * @Author: yangyongbing
 * @CreateTime: 2023/10/16  08:38
 * @Version: 1.0
 */
public class Regexp {

    public static void main(String[] args) {
        String content="20世纪90年代,硬件领域出现了单片式计算机系统,这种价格低廉的系统一出现就立即引起了自动控制领域人员的注意,因为使用它可以大幅度提升消费类电子产品(如电视机顶盒、面包烤箱、移动电话等)的智能化程度。Sun公司为了抢占市场先机,在1991年成立了一个称为Green的项目小组,帕特里克、詹姆斯·高斯林、麦克·舍林丹和其他几个工程师一起组成的工作小组在加利福尼亚州门洛帕克市沙丘路的一个小工作室里面研究开发新技术,专攻计算机在家电产品上的嵌入式应用。\n" +
                "由于C++所具有的优势,该项目组的研究人员首先考虑采用C++来编写程序。但对于硬件资源极其匮乏的单片式系统来说,C++程序过于复杂和庞大。另外由于消费电子产品所采用的嵌入式处理器芯片的种类繁杂,如何让编写的程序跨平台运行也是个难题。为了解决困难,他们首先着眼于语言的开发,假设了一种结构简单、符合嵌入式应用需要的硬件平台体系结构并为其制定了相应的规范,其中就定义了这种硬件平台的二进制机器码指令系统(即后来成为“字节码”的指令系统),以待语言开发成功后,能有半导体芯片生产商开发和生产这种硬件平台。对于新语言的设计,Sun公司研发人员并没有开发一种全新的语言,而是根据嵌入式软件的要求,对C++进行了改造,去除了留在C++的一些不太实用及影响安全的成分,并结合嵌入式系统的实时性要求,开发了一种称为Oak的面向对象语言。\n" +
                "由于在开发Oak语言时,尚且不存在运行字节码的硬件平台,所以为了在开发时可以对这种语言进行实验研究,他们就在已有的硬件和软件平台基础上,按照自己所指定的规范,用软件建设了一个运行平台,整个系统除了比C++更加简单之外,没有什么大的区别。1992年的夏天,当Oak语言开发成功后,研究者们向硬件生产商进行演示了Green操作系统、Oak的程序设计语言、类库和其硬件,以说服他们使用Oak语言生产硬件芯片,但是,硬件生产商并未对此产生极大的热情。因为他们认为,在所有人对Oak语言还一无所知的情况下,就生产硬件产品的风险实在太大了,所以Oak语言也就因为缺乏硬件的支持而无法进入市场,从而被搁置了下来。\n" +
                "1994年6、7月间,在经历了一场历时三天的讨论之后,团队决定再一次改变了努力的目标,这次他们决定将该技术应用于万维网。他们认为随着Mosaic浏览器的到来,因特网正在向同样的高度互动的远景演变,而这一远景正是他们在有线电视网中看到的。作为原型,帕特里克·诺顿写了一个小型万维网浏览器WebRunner。 [8]\n" +
                "1995年,互联网的蓬勃发展给了Oak机会。业界为了使死板、单调的静态网页能够“灵活”起来,急需一种软件技术来开发一种程序,这种程序可以通过网络传播并且能够跨平台运行。于是,世界各大IT企业为此纷纷投入了大量的人力、物力和财力。这个时候,Sun公司想起了那个被搁置起来很久的Oak,并且重新审视了那个用软件编写的试验平台,由于它是按照嵌入式系统硬件平台体系结构进行编写的,所以非常小,特别适用于网络上的传输系统,而Oak也是一种精简的语言,程序非常小,适合在网络上传输。Sun公司首先推出了可以嵌入网页并且可以随同网页在网络上传输的Applet(Applet是一种将小程序嵌入到网页中进行执行的技术),并将Oak更名为Java。5月23日,Sun公司在Sun world会议上正式发布Java和HotJava浏览器。IBM、Apple、DEC、Adobe、HP、Oracle、Netscape和微软等各大公司都纷纷停止了自己的相关开发项目,竞相购买了Java使用许可证,并为自己的产品开发了相应的Java平台。 [9-10]\n" +
                "1996年1月,Sun公司发布了Java的第一个开发工具包(JDK 1.0),这是Java发展历程中的重要里程碑,标志着Java成为一种独立的开发工具。9月,约8.3万个网页应用了Java技术来制作。10月,Sun公司发布了Java平台的第一个即时(JIT)编译器。\n" +
                "1997年2月,JDK 1.1面世,在随后的3周时间里,达到了22万次的下载量。4月2日,Java One会议召开,参会者逾一万人,创当时全球同类会议规模之纪录。9月,Java Developer Connection社区成员超过10万。\n" +
                "1998年12月8日,第二代Java平台的企业版J2EE发布。1999年6月,Sun公司发布了第二代Java平台(简称为Java2)的3个版本:J2ME(Java2 Micro Edition,Java2平台的微型版),应用于移动、无线及有限资源的环境;J2SE(Java 2 Standard Edition,Java 2平台的标准版),应用于桌面环境;J2EE(Java 2Enterprise Edition,Java 2平台的企业版),应用于基于Java的应用服务器。Java 2平台的发布,是Java发展过程中最重要的一个里程碑,标志着Java的应用开始普及。\n" +
                "1999年4月27日,HotSpot虚拟机发布。HotSpot虚拟机发布时是作为JDK 1.2的附加程序提供的,后来它成为了JDK 1.3及之后所有版本的Sun JDK的默认虚拟机 [11] 。\n" +
                "2000年5月,JDK1.3、JDK1.4和J2SE1.3相继发布,几周后其获得了Apple公司Mac OS X的工业标准的支持。2001年9月24日,J2EE1.3发布。2002年2月26日,J2SE1.4发布。自此Java的计算能力有了大幅提升,与J2SE1.3相比,其多了近62%的类和接口。在这些新特性当中,还提供了广泛的XML支持、安全套接字(Socket)支持(通过SSL与TLS协议)、全新的I/OAPI、正则表达式、日志与断言。2004年9月30日,J2SE1.5发布,成为Java语言发展史上的又一里程碑。为了表示该版本的重要性,J2SE 1.5更名为Java SE 5.0(内部版本号1.5.0),代号为“Tiger”,Tiger包含了从1996年发布1.0版本以来的最重大的更新,其中包括泛型支持、基本类型的自动装箱、改进的循环、枚举类型、格式化I/O及可变参数。";
        // 创建一个Pattern对象,即模式对象
        Pattern compile = Pattern.compile("[a-zA-Z]+");
        // 创建一个匹配器对象,找到返回true
        Matcher matcher = compile.matcher(content);
        // 可以循环匹配
        while (matcher.find()){
            // 匹配道德文本内容放到matcher.group(0)
            System.out.println(matcher.group(0));
        }
    }
}

运行结果如下:
Java中的正则表达式_第1张图片

2、正则表达式原理

        Pattern compileGroup = Pattern.compile("[(\\d\\d)(\\d\\d)]+");
        /*
        * 分组
        * 什么是分组,比如(\d\d)(\d\d),正则表达式中有()表示分组,第一个()表示第一组,第二个()表示第二组.....
        * 1、根据指定的规则,定位满足规则的子字符串(比如(19)(98))
        * 2、找到后,将子字符串开始的索引记录到matcher对象的属性int[] groups;
        *    2.1、groups[0]=0,把该字符串的结束的索引+1的值记录到groups[1]=4
        *    2.2、记录第一组()匹配到的字符串groups[2]=0 groups[3]=2
        *    2.3、记录第二组()匹配到的字符串groups[4]=2,groups[5]=4
        *    2.4、如果有更多的分组....
        * */

3、正则表达式语法

如果想要灵活的运用正则表达式,必须了解其中各种元字符的功能,元字符从功能上大致分为:

  1. 限定符
  2. 选择匹配符
  3. 分组组合和反向引用符
  4. 特殊字符
  5. 字符匹配符
  6. 定位符

3.1、元字符(Metacharacter)-转义号 \

\ 符号说明:在我们使用正则表达式去检索某些特殊字符的时候,需要用到转移符号,否则检索不到结果,甚至会报错。

import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
 * @Description: 正则表达式语法
 * @Author: yangyongbing
 * @CreateTime: 2023/10/20  08:07
 * @Version: 1.0
 */
public class RegExp02 {

    public static void main(String[] args) {
        /*
        * 案列:用$去匹配“abc$(”会怎么样?
        * 用(去匹配“abc$(”会怎么样?
        * 匹配.要用\\.
        * */
        String content="abc$(abc(123(";
        // 匹配(
        String regStr="\\$";
        Pattern pattern=Pattern.compile(regStr);
        Matcher matcher = pattern.matcher(content);
        while (matcher.find()){
            System.out.println(matcher.group(0));
        }
    }

}

Java中的正则表达式_第2张图片

*注意:在Java的正则表达式中,两个\ 代表其它语言中的一个*

需要用到转义符号的字符:.* + () $ /\ ? [] ^ {}

3.2、元字符-字符匹配符

Java中的正则表达式_第3张图片
Java中的正则表达式_第4张图片

3.2.1、字符匹配符案列

Java中的正则表达式_第5张图片

你可能感兴趣的:(java,正则表达式,python)