licoolxue

java正则表达式

Java正则表达式

虽然 Java 语言以前的版本支持模式匹配，但 StreamTokenizer 和 StringTokenizer 类却很少涉及用模式能够实现的功能。Java 1.4（以及现在的 1.4.1）发行版在 java.util.regex 包中加入了对使用正则表达式的模式匹配的支持。在 Merlin 的魔力系列的这篇文章中，John Zukowski 向您展示了如何用新的正则表达式库解析字符序列，从而使搜索模式的功能更加强大。

解析模式的文本字符串

正则表达式是根据文本匹配模式的方法 ― 类似于编译器生成类文件的工作原理。编译器在源代码中查找各种模式以便将源代码表达式转换为字节码。通过识别这些源代码模式，编译器能够只将有效的源代码表示转换为已编译的类文件。

回页首

什么是模式？

在正则表达式的上下文中，模式是字符序列的文本表示法。例如，如果您想知道一个字符序列中是否存在 car这个词，您会使用模式 car，因为这是精确地表示该字符串的方法。对于更复杂的模式，您可以使用特殊字符作为占位符。如果您不是要搜索 car，而是想搜索以字母 c开头并以字母 r结尾的任何文本字符串，您会使用 c*r模式，其中 *代表第一个 r前的任意多个字符。 c*r模式将匹配任何以 c开头并以 r结尾的字符串，如 cougar、 cavalier或 chrysler。

回页首

如何指定模式表达式

模式匹配的主要部分是关于要使用什么样的表达式。 Pattern 先保存要使用的表达式，然后将其传递给 Matcher 类以便在字符序列的上下文中检查其匹配情况。例如，如果您想验证一个电子邮件地址，您可能要检查用户输入是否与这样一个模式匹配 ― 它包含一个字母数字序列，后跟一个 @ 符号，@ 后又跟两组用句点隔开的字符。这可以用表达式 /p{Alnum}+@/w+/./p{Alpha}{2,3} 来表示。（是的，这过于简化了电子邮件地址的结构，可能会排除某些有效的电子邮件地址，但它作为示例已经足够了。）

在讨论模式语言的具体细节之前，我们来仔细看一下 /p{Alnum}+@/w+/./p{Alpha}{2,3} 。 /p{Alnum} 序列表示单个字母数字字符（A 到 Z、a 到 z 或 0 到 9）。 /p{Alnum} 后面的加号（+）被称为 量词（quantifier）。它被应用在表达式的前面部分，表示 /p{Alnum} 必须出现一次或更多次。使用星号（*）表示要出现零次或一次以上（含一次）。@ 就是意味着它必须出现在至少一个字母数字字符之后，这样整个模式匹配才能成功。 /w+ 与 /p{Alnum}+ 类似，但添加了下划线（_）。某些序列有多个表达式。反斜杠（/ .）代表句点。如果前面没有反斜杠，单独一个句点代表任意字符。最后的 /p{Alpha}{2, 3} 表示两个或三个字母字符。

只要学会了规范语言，您就能掌握模式的所有秘密。我们来看一些更常用的表达式的种类：

文字（Literal）：表达式内任何不具有特殊意义的字符都被看作是一个文字，并与自身匹配。
量词（Quantifier）：某些字符或表达式，它们被用来计算一个文字或分组可以在字符序列中出现的次数，以便该序列与表达式匹配。分组是由圆括号内的一组字符指定的。
- ? 表示出现一次或根本不出现
- * 表示出现零次或一次以上（含一次）
- + 表示出现一次或多次
字符类（Character class）：一个字符类就是方括号内的一个字符集，其中，匹配可以是括号内的任意一个字符。您可以把字符类与量词结合在一起，例如， [acegikmoqsuwy]* 将是只包含字母表中奇数字母的任意字符序列。某些字符类是预先定义的：
- /d ― 数字（0 到 9）
- /D -- 非数字
- /s -- 空白字符，如制表符或换行符
- /S -- 非空白字符
- /w -- 单字字符（a 到 z、A 到 Z、0 到 9 以及下划线）
- /W -- 非单字字符（其它任意字符）
Posix 字符类（Posix character class）：某些字符类仅在用于 US-ASCII 比较时才有效。例如：
- /p{Lower} ― 小写字符
- /p{Upper} ― 大写字符
- /p{ASCII} ― 所有 ASCII 字符
- /p{Alpha} ― 字母字符（/p{Lower} 与 /p{Upper} 相结合）
- /p{Digit} ― 从 0 到 9 的数字
- /p{Alnum} ― 字母数字字符
范围（Range）：使用短线（dash）来指定包括一定范围字符的字符类。例如， [A-J] 表示从 A 到 J 的大写字母。
否定（Negation）：脱字符（^）否定字符类的内容。例如， [^A-J] 表示除 A 到 J 之外的任何字符。

请参阅 Pattern API 文档（可以从参考资料找到）了解关于序列的其它详细信息。

回页首

如何有效地使用模式

既然您已经了解了如何指定模式，我们就来使用它们吧。您需要让 Pattern 类编译它们，如下所示。注意，反斜杠字符（/）在 String 常量中需要转义。

Pattern pattern = Pattern.compile(
  "//p{Alnum}+@//w+//.//p{Alpha}{2,3}");

有了一个编译好的模式后，您可以使用 Pattern 类根据模式把一个输入行分割为一系列单字，或者使用 Matcher 类执行一些更复杂的任务。下面说明了如何分割输入字符序列，其中使用的模式指定了分隔符，而不是字：

String words[] =  pattern.split(input);

如果您想在一个字符序列中多次匹配一个模式，上面的代码片段是一个很好的起点。但如果您想获取特定的输入，您将需要 Pattern 的 matcher() 方法。在给定某个输入时，这个方法将返回适当的 Matcher 类。接着，您使用 Matcher 实例遍历整个结果在输入序列中查找不同的模式匹配，或者使用 Matcher 实例作为查找-替换工具（后一种方法更好）：

Matcher matcher = pattern.matcher(input);

要根据整个序列匹配模式，请使用 matches() 。要确定是否只有序列的一部分匹配，请使用 find() ：

if (matcher.find()) {
    // Found some string within input sequence
    // That matched the compiled pattern
    String match = matcher.group();
    // Process matching pattern
}

回页首

完整的示例

这两个类（ Pattern 与 Matcher ）就是整个模式匹配库。提出正确的正则表达式，然后使用 Matcher 类的结果，这就是这个模式匹配库要做的全部工作。在针对 Java 语言的关于正则表达式的专门书籍出现之前，请找一本关于 Perl 的好书来进一步了解特定的模式。清单 1 提供了一个完整的示例，该示例将在特定文件中查找从命令行作为输入而传入的最长单词。

清单 1.“最长的单词”示例

import java.io.*;
import java.nio.*;
import java.nio.channels.*;
import java.nio.charset.*;
import java.util.*;
import java.util.regex.*;
public class Longest {
  public static void main(String args[]) {
    if (args.length != 1) {
      System.err.println("Provide a filename");
      return;
    }
    try {
      // Map File from filename to byte buffer
      FileInputStream input = 
        new FileInputStream(args[0]);
      FileChannel channel = input.getChannel();
      int fileLength = (int)channel.size();
      MappedByteBuffer buffer = channel.map(
        FileChannel.MapMode.READ_ONLY, 0, fileLength); 
      // Convert to character buffer
      Charset charset = Charset.forName("ISO-8859-1");
      CharsetDecoder decoder = charset.newDecoder();
      CharBuffer charBuffer = decoder.decode(buffer);
      // Create line pattern
      Pattern linePattern = 
        Pattern.compile(".*___FCKpd___4quot;, Pattern.MULTILINE);
      // Create word pattern
      Pattern wordBreakPattern = 
        Pattern.compile("[//p{Punct}//s}]");
      // Match line pattern to buffer
      Matcher lineMatcher = 
        linePattern.matcher(charBuffer);
      // Holder for longest word
      String longest = "";
      // For each line
      while (lineMatcher.find()) {
        // Get line
        String line = lineMatcher.group();
        // Get array of words on line
        String words[] = wordBreakPattern.split(line);
        // Look for longest word
        for (int i=0, n=words.length; i longest.length()) {
            longest = words[i];
          }
        }
      }
      // Report
      System.out.println("Longest word: " + longest);
 
      // Close
      input.close();
    } catch (IOException e) {
      System.err.println("Error processing");
    }
  }
}

如果你曾经用过Perl或任何其他内建正则表达式支持的语言，你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语，那么“正则表达式”（Regular Expression）就是一个字符构成的串，它定义了一个用来搜索匹配字符串的模式。

许多语言，包括Perl、PHP、Python、JavaScript和JScript，都支持用正则表达式处理文本，一些文本编辑器用正则表达式实现高级“搜索-替换”功能。那么Java又怎样呢？本文写作时，一个包含了用正则表达式进行文本处理的Java规范需求（Specification Request）已经得到认可，你可以期待在JDK的下一版本中看到它。

然而，如果现在就需要使用正则表达式，又该怎么办呢？你可以从Apache.org下载源代码开放的Jakarta-ORO库。本文接下来的内容先简要地介绍正则表达式的入门知识，然后以Jakarta-ORO API为例介绍如何使用正则表达式。

一、正则表达式基础知识

我们先从简单的开始。假设你要搜索一个包含字符“cat”的字符串，搜索用的正则表达式就是“cat”。如果搜索对大小写不敏感，单词“catalog”、“Catherine”、“sophisticated”都可以匹配。也就是说：

1.1 句点符号

假设你在玩英文拼字游戏，想要找出三个字母的单词，而且这些单词必须以“t”字母开头，以“n”字母结束。另外，假设有一本英文字典，你可以用正则表达式搜索它的全部内容。要构造出这个正则表达式，你可以使用一个通配符——句点符号“.”。这样，完整的表达式就是“t.n”，它匹配“tan”、“ten”、“tin”和“ton”，还匹配“t#n”、“tpn”甚至“t n”，还有其他许多无意义的组合。这是因为句点符号匹配所有字符，包括空格、Tab字符甚至换行符：

1.2 方括号符号

为了解决句点符号匹配范围过于广泛这一问题，你可以在方括号（“[]”）里面指定看来有意义的字符。此时，只有方括号里面指定的字符才参与匹配。也就是说，正则表达式“t[aeio]n”只匹配“tan”、“Ten”、“tin”和“ton”。但“Toon”不匹配，因为在方括号之内你只能匹配单个字符：

1.3 “或”符号

如果除了上面匹配的所有单词之外，你还想要匹配“toon”，那么，你可以使用“|”操作符。“|”操作符的基本意义就是“或”运算。要匹配“toon”，使用“t(a|e|i|o|oo)n”正则表达式。这里不能使用方扩号，因为方括号只允许匹配单个字符；这里必须使用圆括号“()”。圆括号还可以用来分组，具体请参见后面介绍。

1.4 表示匹配次数的符号

表一显示了表示匹配次数的符号，这些符号用来确定紧靠该符号左边的符号出现的次数：

假设我们要在文本文件中搜索美国的社会安全号码。这个号码的格式是999-99-9999。用来匹配它的正则表达式如图一所示。在正则表达式中，连字符（“-”）有着特殊的意义，它表示一个范围，比如从0到9。因此，匹配社会安全号码中的连字符号时，它的前面要加上一个转义字符“/”。

图一：匹配所有123-12-1234形式的社会安全号码

假设进行搜索的时候，你希望连字符号可以出现，也可以不出现——即，999-99-9999和999999999都属于正确的格式。这时，你可以在连字符号后面加上“？”数量限定符号，如图二所示：

图二：匹配所有123-12-1234和123121234形式的社会安全号码

下面我们再来看另外一个例子。美国汽车牌照的一种格式是四个数字加上二个字母。它的正则表达式前面是数字部分“[0-9]{4}”，再加上字母部分“[A-Z]{2}”。图三显示了完整的正则表达式。

图三：匹配典型的美国汽车牌照号码，如8836KV

1.5 “否”符号

“^”符号称为“否”符号。如果用在方括号内，“^”表示不想要匹配的字符。例如，图四的正则表达式匹配所有单词，但以“X”字母开头的单词除外。

图四：匹配所有单词，但“X”开头的除外

1.6 圆括号和空白符号

假设要从格式为“June 26, 1951”的生日日期中提取出月份部分，用来匹配该日期的正则表达式可以如图五所示：

图五：匹配所有Moth DD,YYYY格式的日期

新出现的“/s”符号是空白符号，匹配所有的空白字符，包括Tab字符。如果字符串正确匹配，接下来如何提取出月份部分呢？只需在月份周围加上一个圆括号创建一个组，然后用ORO API（本文后面详细讨论）提取出它的值。修改后的正则表达式如图六所示：

图六：匹配所有Month DD,YYYY格式的日期，定义月份值为第一个组

1.7 其它符号

为简便起见，你可以使用一些为常见正则表达式创建的快捷符号。如表二所示：

表二：常用符号

例如，在前面社会安全号码的例子中，所有出现“[0-9]”的地方我们都可以使用“/d”。修改后的正则表达式如图七所示：

图七：匹配所有123-12-1234格式的社会安全号码

二、Jakarta-ORO库

有许多源代码开放的正则表达式库可供Java程序员使用，而且它们中的许多支持Perl 5兼容的正则表达式语法。我在这里选用的是Jakarta-ORO正则表达式库，它是最全面的正则表达式API之一，而且它与Perl 5正则表达式完全兼容。另外，它也是优化得最好的API之一。

Jakarta-ORO库以前叫做OROMatcher，Daniel Savarese大方地把它赠送给了Jakarta Project。你可以按照本文最后参考资源的说明下载它。

我首先将简要介绍使用Jakarta-ORO库时你必须创建和访问的对象，然后介绍如何使用Jakarta-ORO API。

▲ PatternCompiler对象

首先，创建一个Perl5Compiler类的实例，并把它赋值给PatternCompiler接口对象。Perl5Compiler是PatternCompiler接口的一个实现，允许你把正则表达式编译成用来匹配的Pattern对象。

▲ Pattern对象

要把正则表达式编译成Pattern对象，调用compiler对象的compile()方法，并在调用参数中指定正则表达式。例如，你可以按照下面这种方式编译正则表达式“t[aeio]n”：

默认情况下，编译器创建一个大小写敏感的模式（pattern）。因此，上面代码编译得到的模式只匹配“tin”、“tan”、 “ten”和“ton”，但不匹配“Tin”和“taN”。要创建一个大小写不敏感的模式，你应该在调用编译器的时候指定一个额外的参数：

创建好Pattern对象之后，你就可以通过PatternMatcher类用该Pattern对象进行模式匹配。

▲ PatternMatcher对象

PatternMatcher对象根据Pattern对象和字符串进行匹配检查。你要实例化一个Perl5Matcher类并把结果赋值给PatternMatcher接口。Perl5Matcher类是PatternMatcher接口的一个实现，它根据Perl 5正则表达式语法进行模式匹配：

使用PatternMatcher对象，你可以用多个方法进行匹配操作，这些方法的第一个参数都是需要根据正则表达式进行匹配的字符串：

· boolean matches(String input, Pattern pattern)：当输入字符串和正则表达式要精确匹配时使用。换句话说，正则表达式必须完整地描述输入字符串。

· boolean matchesPrefix(String input, Pattern pattern)：当正则表达式匹配输入字符串起始部分时使用。

· boolean contains(String input, Pattern pattern)：当正则表达式要匹配输入字符串的一部分时使用（即，它必须是一个子串）。

另外，在上面三个方法调用中，你还可以用PatternMatcherInput对象作为参数替代String对象；这时，你可以从字符串中最后一次匹配的位置开始继续进行匹配。当字符串可能有多个子串匹配给定的正则表达式时，用PatternMatcherInput对象作为参数就很有用了。用PatternMatcherInput对象作为参数替代String时，上述三个方法的语法如下：

· boolean matches(PatternMatcherInput input, Pattern pattern)

· boolean matchesPrefix(PatternMatcherInput input, Pattern pattern)

· boolean contains(PatternMatcherInput input, Pattern pattern)

三、应用实例

下面我们来看看Jakarta-ORO库的一些应用实例。

3.1 日志文件处理

任务：分析一个Web服务器日志文件，确定每一个用户花在网站上的时间。在典型的BEA WebLogic日志文件中，日志记录的格式如下：

分析这个日志记录，可以发现，要从这个日志文件提取的内容有两项：IP地址和页面访问时间。你可以用分组符号（圆括号）从日志记录提取出IP地址和时间标记。

首先我们来看看IP地址。IP地址有4个字节构成，每一个字节的值在0到255之间，各个字节通过一个句点分隔。因此，IP地址中的每一个字节有至少一个、最多三个数字。图八显示了为IP地址编写的正则表达式：

图八：匹配IP地址

IP地址中的句点字符必须进行转义处理（前面加上“/”），因为IP地址中的句点具有它本来的含义，而不是采用正则表达式语法中的特殊含义。句点在正则表达式中的特殊含义本文前面已经介绍。

日志记录的时间部分由一对方括号包围。你可以按照如下思路提取出方括号里面的所有内容：首先搜索起始方括号字符（“[”），提取出所有不超过结束方括号字符（“]”）的内容，向前寻找直至找到结束方括号字符。图九显示了这部分的正则表达式。

图九：匹配至少一个字符，直至找到“]”

现在，把上述两个正则表达式加上分组符号（圆括号）后合并成单个表达式，这样就可以从日志记录提取出IP地址和时间。注意，为了匹配“- -”（但不提取它），正则表达式中间加入了“/s-/s-/s”。完整的正则表达式如图十所示。

图十：匹配IP地址和时间标记

现在正则表达式已经编写完毕，接下来可以编写使用正则表达式库的Java代码了。

为使用Jakarta-ORO库，首先创建正则表达式字符串和待分析的日志记录字符串：

这里使用的正则表达式与图十的正则表达式差不多完全相同，但有一点例外：在Java中，你必须对每一个向前的斜杠（“/”）进行转义处理。图十不是Java的表示形式，所以我们要在每个“/”前面加上一个“/”以免出现编译错误。遗憾的是，转义处理过程很容易出现错误，所以应该小心谨慎。你可以首先输入未经转义处理的正则表达式，然后从左到右依次把每一个“/”替换成“//”。如果要复检，你可以试着把它输出到屏幕上。

初始化字符串之后，实例化PatternCompiler对象，用PatternCompiler编译正则表达式创建一个Pattern对象：

现在，创建PatternMatcher对象，调用PatternMatcher接口的contain()方法检查匹配情况：

接下来，利用PatternMatcher接口返回的MatchResult对象，输出匹配的组。由于logEntry字符串包含匹配的内容，你可以看到类如下面的输出：

3.2 HTML处理实例一

下面一个任务是分析HTML页面内FONT标记的所有属性。HTML页面内典型的FONT标记如下所示：

程序将按照如下形式，输出每一个FONT标记的属性：

在这种情况下，我建议你使用两个正则表达式。第一个如图十一所示，它从字体标记提取出“"face="Arial, Serif" size="+2" color="red"”。

图十一：匹配FONT标记的所有属性

第二个正则表达式如图十二所示，它把各个属性分割成名字-值对。

图十二：匹配单个属性，并把它分割成名字-值对

分割结果为：

现在我们来看看完成这个任务的Java代码。首先创建两个正则表达式字符串，用Perl5Compiler把它们编译成Pattern对象。编译正则表达式的时候，指定Perl5Compiler.CASE_INSENSITIVE_MASK选项，使得匹配操作不区分大小写。

接下来，创建一个执行匹配操作的Perl5Matcher对象。

假设有一个String类型的变量html，它代表了HTML文件中的一行内容。如果html字符串包含FONT标记，匹配器将返回true。此时，你可以用匹配器对象返回的MatchResult对象获得第一个组，它包含了FONT的所有属性：

接下来创建一个PatternMatcherInput对象。这个对象允许你从最后一次匹配的位置开始继续进行匹配操作，因此，它很适合于提取FONT标记内属性的名字-值对。创建PatternMatcherInput对象，以参数形式传入待匹配的字符串。然后，用匹配器实例提取出每一个FONT的属性。这通过指定PatternMatcherInput对象（而不是字符串对象）为参数，反复地调用PatternMatcher对象的contains()方法完成。PatternMatcherInput对象之中的每一次迭代将把它内部的指针向前移动，下一次检测将从前一次匹配位置的后面开始。

本例的输出结果如下：

3.3 HTML处理实例二

下面我们来看看另一个处理HTML的例子。这一次，我们假定Web服务器从widgets.acme.com移到了newserver.acme.com。现在你要修改一些页面中的链接：

执行这个搜索的正则表达式如图十三所示：

图十三：匹配修改前的链接

如果能够匹配这个正则表达式，你可以用下面的内容替换图十三的链接：

注意#字符的后面加上了$1。Perl正则表达式语法用$1、$2等表示已经匹配且提取出来的组。图十三的表达式把所有作为一个组匹配和提取出来的内容附加到链接的后面。

现在，返回Java。就象前面我们所做的那样，你必须创建测试字符串，创建把正则表达式编译到Pattern对象所必需的对象，以及创建一个PatternMatcher对象：

接下来，用com.oroinc.text.regex包Util类的substitute()静态方法进行替换，输出结果字符串：

Util.substitute()方法的语法如下：

这个调用的前两个参数是以前创建的PatternMatcher和Pattern对象。第三个参数是一个Substiution对象，它决定了替换操作如何进行。本例使用的是Perl5Substitution对象，它能够进行Perl5风格的替换。第四个参数是想要进行替换操作的字符串，最后一个参数允许指定是否替换模式的所有匹配子串（Util.SUBSTITUTE_ALL），或只替换指定的次数。

【结束语】在这篇文章中，我为你介绍了正则表达式的强大功能。只要正确运用，正则表达式能够在字符串提取和文本修改中起到很大的作用。另外，我还介绍了如何在Java程序中通过Jakarta-ORO库利用正则表达式。至于最终采用老式的字符串处理方式（使用StringTokenizer，charAt，和substring），还是采用正则表达式，这就有待你自己决定了。

你可能感兴趣的:(java正则表达式)

Java 基础之正则表达式：强大的文本匹配利器幽兰的天空 Java 基础启航：从零到小有所成 mysql 数据库 java
一、什么是Java正则表达式Java正则表达式是一个用于匹配字符串的模板，由字符和特殊字符组成，可用于查找、替换、验证特定的模式。在Java中，我们可以使用java.util.regex包中的类来操作正则表达式。正则表达式在Java编程中发挥着重要作用。它可以被看作是一种定义字符串规则的工具，通过特定的模式来匹配、查找、替换和验证字符串。例如，我们可以使用正则表达式来验证用户输入的邮箱地址是否合法
java正则表达式提取字符串中的序号，BAT大厂面试总结 qq_38514574 程序员 java 经验分享面试
第一个：Alibaba[搜索推荐]一面：算法题:长度为n的数组里放了n+1个大小在[1,n]的数，必然至少有一个重复的数，找出来二面：概率题：求一根绳子被切两刀能组成一个三角形的概率。三面主管面：FM推导，deepfm原理，graphembedding，问了之前的一些项目。四面交叉面：模型上线时应该注意的事，如果请求过高模型服务挂了怎么办，tensorflow和torch的区别，如何降低模型复杂度
正则表达式 xujinwei_gingko JAVA 正则表达式
详解参考：Java——正则表达式详解_java正则表达式-CSDN博客常用示例：1、将含有特殊字符$的字符串表达式转换成可以计算的表达式，如复杂指标计算表达式publicclassTest{publicstaticvoidmain(String[]args){StringoriExpress="$termDays$+$termNum$-$duration$";oriExpress=oriExpre
(十四)java正则表达式、枚举 ANONYMOUS% Step1 java 正则表达式开发语言
目录1.System和Runtime类1.1System类1.2Runtime类2.BigInteger3.正则表达式3.1String类中的正则表达式3.2正则表达式常用类3.2.1Pattern类3.2.2Matcher类3.3表达式语法3.3.1转义字符3.3.2支持的字符3.3.3捕获组4.枚举1.System和Runtime类1.1System类System类代表系统，系统级的很多属性和
用Java正则表达式替换，告别繁琐的字符串操作
在Java编程中，我们经常需要处理字符串的替换操作。有时候，简单的字符串替换无法满足我们的需求，这时就需要借助正则表达式来完成更复杂的字符串替换任务。本文将介绍如何使用Java根据正则表达式替换字符串的方法，并通过实例说明其应用场景。一、正则表达式概述正则表达式，又称规则表达式，是对字符串操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字
java正则表达式获取json字符串中指定key的value 满脑子灵感 mysql linux 数据库
importorg.apache.commons.lang3.StringEscapeUtils;importorg.apache.commons.lang3.StringUtils;importjava.util.ArrayList;importjava.util.List;importjava.util.regex.Matcher;importjava.util.regex.Pattern;p
Java正则表达式 kbforever8 正则表达式
比如校验qq必须全是数字，且位数在6-20之间publicstaticbooleancheckQQ(Stringqq){returnqq!=null&&qq.matchs("\\d{6,20}");}字符类：[abc]只能是abc[^abc]除了abc以为的任何字符[a-zA-Z]a到z，A到Z包括（范围）[a-d[m-p]]a到d或m到p[a-z&&[def]]d，e或f（交集）[a-z&&[^
十八、300份Java零基础教学笔记，真正的从零开始（关注持续更新） python草莓
Java快速入门（本文篇幅较长，建议点喜欢后收藏后阅读）每天学会一个知识点，觉得不错的可以留言关注下，戳我主页获取Java资料（工具包，面试资料，视频教学，包含社群解答）Java正则表达式正则表达式定义了字符串的模式。正则表达式可以用来搜索、编辑或处理文本。正则表达式并不仅限于某一种语言，但是在每种语言中有细微的差别。Java正则表达式和Perl的是最为相似的。java.util.regex包主要
14.2 Java正则表达式(❤❤) 与海boy Java工程师(后端开发)正则表达式
14.2Java正则表达式1.正则表达式1.1简介1.2字符范围匹配1.3元字符1.4多次重复匹配1.5定位匹配1.6贪婪模式与非贪婪模式1.7表达式分组1.正则表达式1.1简介开源在线正则表达式测试1.2字符范
Java 正则表达式总结 u010405836 java 正则表达式 mysql
Java正则表达式总结大家好，我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编。今天，我们将深入探讨Java正则表达式，这是一种强大的文本匹配和处理工具，用于处理字符串的模式匹配。1.正则表达式简介正则表达式是一种用于描述字符串模式的工具，它定义了一种字符串的搜索模式，可以用来检查字符串是否符合某种模式、替换字符串或者提取符合条件的子串。2.基本语法2.1字符类[abc]：匹配a、b或
java 正则 sql_java正则表达式获取sql中所有的表名青衫古道 java 正则 sql
项目中有这么个需求，参照网上相关资料，稍微改动，用了下面的方式，应该不会完全都能获取，或者可能获取有问题，但是暂时先这样吧。也差不多。/***表名解析*/privatestaticPatternp=Pattern.compile("\\s+from\\s+(\\w+)(\\s+|,)(\\w*)|\\s+join\\s+(\\w+)\\s+(\\w*)\\s+on",Pattern.CASE_IN
Java 正则表达式匹配sql参数和替换天狼1222 正则表达式正则表达式 sql语句参数匹配和替换
Java正则表达式匹配sql参数和替换目录匹配和替换sql里面的参数要求：代码：思考：总结：语法：\\s匹配空格在动态sql查询中，需要替换sql查询语句的条件匹配和替换sql里面的参数要求：如何把select*fromaccountWHEREfield_name1=$param.paramNameandfield_name2=$global.dataandfield_name3=$meanand
Java正则表达式之Pattern和Matcher 似霰 Java java 正则表达式开发语言
目录前言一、Pattern和Matcher的简单使用二、Pattern详解2.1Pattern常用方法2.1.1compile(Stringregex)2.1.2matches(Stringregex,CharSequenceinput)2.1.3split(CharSequenceinput)2.1.4pattern()2.1.5matcher(CharSequenceinput)三、Match
正则表达式（全集） external123 JAVA 正则表达式 java
正则表达式（优秀有奇效）1.什么是正则表达式正则表达式是对字符串执行模式匹配的技术。所谓模式匹配个人理解就是找出符合所指定规律的字符串。奇效：把数小时辛苦而易错的文本处理工作缩短在几分钟。而且不仅java语言支持2.正则表达式符号作用（分类）字符匹配符字符匹配符，人如其名，说的就是要选择匹配哪些字符，给出一个匹配字符的集合。注意：（1）java正则表达式中，两个“\”即"\“表示其它语言中的一个”
java正则表达式 1_JAVA与正则表达式1 Andy Kwong java正则表达式 1
§1黑暗岁月有一个String，如何查询其中是否有y和f字符？最黑暗的办法就是：程序1：我知道if、for语句和charAt()啊。classTest{publicstaticvoidmain(Stringargs[]){Stringstr="Formymoney,theimportantthing"+"aboutthemeetingwasbridge-building";charx='y';ch
利用Java正则表达式提取HTML中的链接南国以南i Java java 正则表达式 html
前言请各大网友尊重本人原创知识分享，谨记本人博客：南国以南i、提示：以下是本篇文章正文内容，下面案例可供参考背景提取HTML中的链接是一种常见的需求，可以通过正则表达式来实现。在Java中，可以使用java.util.regex包提供的正则表达式相关类来完成这个任务。首先，让我们了解一下HTML链接的特点。在HTML中，链接通常以标签来表示，包含了href属性用于指定链接的URL地址。因此，我们需
JAVA正则表达式第二个作用：爬取成果、 JAVA正则表达式正则表达式 java
目录本地数据爬取：本地爬取练习：网络爬取：-----以下为均本地数据爬取：带条件爬取贪婪爬取和非贪婪爬取：例题1：使获取1为不贪婪*例题2：使获取0、1都为不贪婪之前介绍了正则表达式的语法和第一个作用（校验字符串）本地数据爬取：目的：获取满足正则表达式规则的所有字符串先来认识几个名词：Pattern：表示正则表达式Matcher：文本匹配器，作用按照正则表达式的规则去读取字符串，从头开始读取本地爬
正则表达式-分组括号以及捕获分组成果、 JAVA正则表达式正则表达式 java
分组：定义：在java正则表达式中，（）是分组的意思，每组都有一个组号如何识别分组？只看左括号，不看右括号，按照左括号的顺序，从左往右，依次为第一组，第二组，第三组等等，如图：根据左括号分成了三组正则表达式中分组有两种：捕获分组，非捕获分组捕获分组：可以获取某一组中的内容反复使用规则：正则表达式内部使用：\\组号外：$组号捕获分组练习1需求1:判断一个字符串的开始字符和结束字符是否一致?只考虑一个
java 正则表达式操作 --各种方法的区别我不是彭于晏灬 java 正则表达式 python
结论：Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持.单独用Pattern只能使用Pattern.matches(Stringregex,CharSequenceinput)一种最基础最简单的匹配。java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现(建议在阅读本文时,打开javaAP
java正则表达式截取字符串只保留 ()（）和字母 Java&Develop Java开发 java 开发语言
java正则表达式判断字符串是否仅含有()（）和字母publicclassss{publicstaticvoidmain(String[]args){Stringnames="@#$(DSFD)#@（dsf）$#@(";names=names.replaceAll("[^(a-zA-Z)(（）)]","");System.out.println(names);}
java正则表达式截取字符串只保留 ()（）和中文 Java&Develop Java开发 java 开发语言
java正则表达式截取字符串只保留()（）和中文publicclassss{publicstaticvoidmain(String[]args){Stringnames="@#$(DSFD)#@（dsf）$#@(";names=names.replaceAll("[^(\\u4E00-\\u9FA5)(（）)]","");System.out.println(names);}
Java正则表达式与时俱哉 java mysql 开发语言
正则表达式概述就是一些由特点的字符组成，代表的是一个规则。作用一：用来校验数据格式是否合法作用二：在一段文本中查找满足要求的内容例如：用于判断一个QQ号是否格式合法正常写法publicclassTest{publicstaticvoidmain(String[]args){System.out.println(checkQQ("12345678"));}publicstaticbooleanche
深度解析Java正则表达式 weixin_836869520 java 正则表达式
深度解析Java正则表达式大家好，我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！在今天的文章中，我们将深度解析Java正则表达式，这个在文本处理中强大而灵活的工具，让你轻松驾驭各种文本匹配的场景。Java正则表达式详解什么是正则表达式？正则表达式是一种用于匹配字符串的表达式，它提供了一种强大且灵活的文本搜索和替换的方式。在Java中，正则表达
java正则表达式大全(参考) 良艺呐^O^ 自我记录 java 正则表达式 mysql
一、校验数字的表达式1数字：1$2n位的数字：^\d{n}$3至少n位的数字：^\d{n,}$4m-n位的数字：^\d{m,n}$5零和非零开头的数字：^(0|[1-9][0-9])$6非零开头的最多带两位小数的数字：^([1-9][0-9])+(.[0-9]{1,2})?$7带1-2位小数的正数或负数：^(-)?\d+(.\d{1,2})?$8正数、负数、和小数：^(-|+)?\d+(.\d+)
Java正则表达式丁总学Java #常用API java 正则表达式
文章目录今日内容教学目标正则表达式1.1正则表达式的概念及演示1.2正则表达式-字符类1.3正则表达式-逻辑运算符1.4正则表达式-预定义字符1.5正则表达式-数量词1.6正则表达式练习11.7正则表达式练习21.8本地数据爬取1.9网络数据爬取（了解）1.10爬取数据练习1.11按要求爬取1.12贪婪爬取和非贪婪爬取1.13String的split方法中使用正则表达式1.14String类的re
java正则表达式 cengel
Java正则表达式语法MarkUtilityEquivalentDemo^匹配输入字符的开始位置$匹配输入字符的结束位置or[a-z]所有小写[A-Z]所有大写[xyz][字符集合]匹配xyz中任意一个字符如yoga可匹配y[^xyz][负值字符集合]匹配未包含的任意字符如yoga可匹配oga\d和\D数字和非数字\s匹配任何不可见字符[\f\n\r\t\v]\S任何可见字符[^\f\n\r\t\
【精简】Java正则表达式使用模板 GodKeyNet java 正则表达式
//传入需要匹配的原文本privateSetgetXmlLabel(Stringmessage){Setset=newHashSet<>();Stringpattern="<[\\w]+";//此处编写正则表达式Patternp=Pattern.compile(pattern);Matcherm=p.matcher(message);//循环便利while(m.find()){Stringgrou
java正则表达式详解 u010405836 java 正则表达式
java正则表达式详解大家好，我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！今天，让我们深入研究Java编程中一个强大的文本处理工具——正则表达式。作为字符串匹配和替换的利器，正则表达式在Java中的应用广泛，通过详细解析其原理和使用方法，我们将更好地掌握这个在文本处理中非常有用的技能。什么是正则表达式？正则表达式是一种强大的字符串匹配工具，
Java正则表达式--分组黔语
版权声明：本文为CSDN博主「gohodo」的原创文章，遵循CC4.0BY-SA版权协议，转载请附上原文出处链接及本声明。原文链接：https://blog.csdn.net/qq_41084324/article/details/83989223在java正则表达式中，（）是分组的意思，依旧是所谓的捕获组。每一个（）代表着一个group，该组是通过从左至右计算其括号来编号。比如：在表达式（（A）
Java正则表达式实用代码-验证日期格式 zgphacker2010 正则表达式 Java编程 java 正则表达式
日期有很多格式，这里只以“年-月-日”这种格式作为示例1、年就是0-9的数字重复4次，月份会有两种情况：0-9和10-12。0-9范围就用0[1-9]来表示，10-12就用1[0-2]来表示^[0-9]{4}-(0[1-9]|1[0-2])2、天数也需要分为三个情况，0-9,10-29和30-31^[0-9]{4}-(0[1-9]|1[0-2])-(0[1-9]|[12][0-9]|3[01])$
github中多个平台共存 jackyrong github
在个人电脑上，如何分别链接比如oschina,github等库呢，一般教程之列的，默认 ssh链接一个托管的而已，下面讲解如何放两个文件 1）设置用户名和邮件地址 $ git config --global user.name "xx" $ git config --global user.email "[email protected]"
ip地址与整数的相互转换(javascript) alxw4616 JavaScript
//IP转成整型 function ip2int(ip){ var num = 0; ip = ip.split("."); num = Number(ip[0]) * 256 * 256 * 256 + Number(ip[1]) * 256 * 256 + Number(ip[2]) * 256 + Number(ip[3]); n
读书笔记-jquey+数据库+css chengxuyuancsdn html jquery oracle
1、grouping ,group by rollup, GROUP BY GROUPING SETS区别 2、$("#totalTable tbody>tr td:nth-child(" + i + ")").css({"width":tdWidth, "margin":"0px", &q
javaSE javaEE javaME == API下载 Array_06 java
oracle下载各种API文档： http://www.oracle.com/technetwork/java/embedded/javame/embed-me/documentation/javame-embedded-apis-2181154.html JavaSE文档： http://docs.oracle.com/javase/8/docs/api/ JavaEE文档： ht
shiro入门学习 cugfy java Web 框架
声明本文只适合初学者，本人也是刚接触而已，经过一段时间的研究小有收获，特来分享下希望和大家互相交流学习。首先配置我们的web.xml代码如下，固定格式，记死就成 <filter> <filter-name>shiroFilter</filter-name> &nbs
Array添加删除方法 357029540 js
刚才做项目前台删除数组的固定下标值时，删除得不是很完整，所以在网上查了下，发现一个不错的方法，也提供给需要的同学。 //给数组添加删除 Array.prototype.del = function(n){
navigation bar 更改颜色张亚雄 IO
今天郁闷了一下午，就因为objective-c默认语言是英文，我写的中文全是一些乱七八糟的样子，到不是乱码，但是，前两个自字是粗体，后两个字正常体，这可郁闷死我了，问了问大牛，人家告诉我说更改一下字体就好啦，比如改成黑体，哇塞，茅塞顿开。翻书看，发现，书上有介绍怎么更改表格中文字字体的，代码如下
unicode转换成中文 adminjun unicode 编码转换
在Java程序中总会出现\u6b22\u8fce\u63d0\u4ea4\u5fae\u535a\u641c\u7d22\u4f7f\u7528\u53cd\u9988\uff0c\u8bf7\u76f4\u63a5这个的字符，这是unicode编码，使用时有时候不会自动转换成中文就需要自己转换了使用下面的方法转换一下即可。 /** * unicode 转换成中文
一站式 Java Web 框架 firefly aijuans Java Web
Firefly是一个高性能一站式Web框架。涵盖了web开发的主要技术栈。包含Template engine、IOC、MVC framework、HTTP Server、Common tools、Log、Json parser等模块。 firefly-2.0_07修复了模版压缩对javascript单行注释的影响，并新增了自定义错误页面功能。更新日志：增加自定义系统错误页面功能
设计模式——单例模式 ayaoxinchao 设计模式
定义 Java中单例模式定义：“一个类有且仅有一个实例，并且自行实例化向整个系统提供。” 分析从定义中可以看出单例的要点有三个：一是某个类只能有一个实例；二是必须自行创建这个实例；三是必须自行向系统提供这个实例。 &nb
Javascript 多浏览器兼容性问题及解决方案 BigBird2012 JavaScript
不论是网站应用还是学习js,大家很注重ie与firefox等浏览器的兼容性问题，毕竟这两中浏览器是占了绝大多数。一、document.formName.item(”itemName”) 问题问题说明：IE下，可以使用 document.formName.item(”itemName”) 或 document.formName.elements ["elementName&quo
JUnit-4.11使用报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing错误 bijian1013 junit4.11 单元测试
下载了最新的JUnit版本，是4.11，结果尝试使用发现总是报java.lang.NoClassDefFoundError: org/hamcrest/SelfDescribing这样的错误，上网查了一下，一般的解决方案是，换一个低一点的版本就好了。还有人说，是缺少hamcrest的包。去官网看了一下，如下发现：
[Zookeeper学习笔记之二]Zookeeper部署脚本 bit1129 zookeeper
Zookeeper伪分布式安装脚本(此脚本在一台机器上创建Zookeeper三个进程，即创建具有三个节点的Zookeeper集群。这个脚本和zookeeper的tar包放在同一个目录下，脚本中指定的名字是zookeeper的3.4.6版本，需要根据实际情况修改)： #!/bin/bash #!!!Change the name!!! #The zookeepe
【Spark八十】Spark RDD API二 bit1129 spark
coGroup package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} import org.apache.spark.SparkContext._ object CoGroupTest_05 { def main(args: Array[String]) { v
Linux中编译apache服务器modules文件夹缺少模块(.so)的问题 ronin47 modules
在modules目录中只有httpd.exp，那些so文件呢？我尝试在fedora core 3中安装apache 2. 当我解压了apache 2.0.54后使用configure工具并且加入了 --enable-so 或者 --enable-modules=so (两个我都试过了) 去make并且make install了。我希望在/apache2/modules/目录里有各种模块，
Java基础-克隆 BrokenDreams java基础
Java中怎么拷贝一个对象呢？可以通过调用这个对象类型的构造器构造一个新对象，然后将要拷贝对象的属性设置到新对象里面。Java中也有另一种不通过构造器来拷贝对象的方式，这种方式称为克隆。 Java提供了java.lang.
读《研磨设计模式》-代码笔记-适配器模式-Adapter bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 适配器模式解决的主要问题是，现有的方法接口与客户要求的方法接口不一致 * 可以这样想，我们要写这样一个类（Adapter）: * 1.这个类要符合客户的要求 ---> 那显然要
HDR图像PS教程集锦&心得 cherishLC PS
HDR是指高动态范围的图像，主要原理为提高图像的局部对比度。软件有photomatix和nik hdr efex。一、教程叶明在知乎上的回答： http://www.zhihu.com/question/27418267/answer/37317792 大意是修完后直方图最好是等值直方图，方法是HDR软件调一遍，再结合不透明度和蒙版细调。二、心得 1、去除阴影部分的
maven-3.3.3 mvn archetype 列表 crabdave ArcheType
maven-3.3.3 mvn archetype 列表可以参考最新的：http://repo1.maven.org/maven2/archetype-catalog.xml [INFO] Scanning for projects... [INFO]
linux shell 中文件编码查看及转换方法 daizj shell 中文乱码 vim 文件编码
一、查看文件编码。在打开文件的时候输入:set fileencoding 即可显示文件编码格式。二、文件编码转换 1、在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式 &
MySQL--binlog日志恢复数据 dcj3sjt126com binlog
恢复数据的重要命令如下 mysql> flush logs; 默认的日志是mysql-bin.000001，现在刷新了重新开启一个就多了一个mysql-bin.000002
数据库中数据表数据迁移方法 dcj3sjt126com sql
刚开始想想好像挺麻烦的，后来找到一种方法了，就SQL中的 INSERT 语句，不过内容是现从另外的表中查出来的，其实就是 MySQL中INSERT INTO SELECT的使用下面看看如何使用语法：MySQL中INSERT INTO SELECT的使用 1. 语法介绍有三张表a、b、c，现在需要从表b
Java反转字符串 dyy_gusi java 反转字符串
前几天看见一篇文章，说使用Java能用几种方式反转一个字符串。首先要明白什么叫反转字符串，就是将一个字符串到过来啦，比如"倒过来念的是小狗"反转过来就是”狗小是的念来过倒“。接下来就把自己能想到的所有方式记录下来了。 1、第一个念头就是直接使用String类的反转方法，对不起，这样是不行的，因为Stri
UI设计中我们为什么需要设计动效 gcq511120594 UI linux
随着国际大品牌苹果和谷歌的引领，最近越来越多的国内公司开始关注动效设计了，越来越多的团队已经意识到动效在产品用户体验中的重要性了，更多的UI设计师们也开始投身动效设计领域。但是说到底，我们到底为什么需要动效设计？或者说我们到底需要什么样的动效？做动效设计也有段时间了，于是尝试用一些案例，从产品本身出发来说说我所思考的动效设计。一、加强体验舒适度嗯，就是让用户更加爽更加爽的用
JBOSS服务部署端口冲突问题 HogwartsRow java 应用服务器 jboss server EJB3
服务端口冲突问题的解决方法，一般修改如下三个文件中的部分端口就可以了。 1、jboss5/server/default/conf/bindingservice.beans/META-INF/bindings-jboss-beans.xml 2、./server/default/deploy/jbossweb.sar/server.xml 3、.
第三章 Redis/SSDB+Twemproxy安装与使用 jinnianshilongnian ssdb reids twemproxy
目前对于互联网公司不使用Redis的很少，Redis不仅仅可以作为key-value缓存，而且提供了丰富的数据结果如set、list、map等，可以实现很多复杂的功能；但是Redis本身主要用作内存缓存，不适合做持久化存储，因此目前有如SSDB、ARDB等，还有如京东的JIMDB，它们都支持Redis协议，可以支持Redis客户端直接访问；而这些持久化存储大多数使用了如LevelDB、RocksD
ZooKeeper原理及使用 liyonghui160com
ZooKeeper是Hadoop Ecosystem中非常重要的组件，它的主要功能是为分布式系统提供一致性协调(Coordination)服务，与之对应的Google的类似服务叫Chubby。今天这篇文章分为三个部分来介绍ZooKeeper，第一部分介绍ZooKeeper的基本原理，第二部分介绍ZooKeeper
程序员解决问题的60个策略 pda158 框架工作单元测试
根本的指导方针 1. 首先写代码的时候最好不要有缺陷。最好的修复方法就是让 bug 胎死腹中。良好的单元测试强制数据库约束使用输入验证框架避免未实现的“else”条件在应用到主程序之前知道如何在孤立的情况下使用日志 2. print 语句。往往额外输出个一两行将有助于隔离问题。 3. 切换至详细的日志记录。详细的日
Create the Google Play Account sillycat Google
Create the Google Play Account Having a Google account, pay 25$, then you get your google developer account. References: http://developer.android.com/distribute/googleplay/start.html https://p
JSP三大指令 vikingwei jsp
JSP三大指令一个jsp页面中，可以有0~N个指令的定义！ 1. page --> 最复杂：<%@page language="java" info="xxx"...%> * pageEncoding和contentType： > pageEncoding：它