读thinking in java笔记(十二):字符串

1. 不可变String

public class Immutable {
  public static String upcase(String s) {
    return s.toUpperCase();
  public static void main(String[] args) {
    String q = "howdy";
    print(q); // howdy
    String qq = upcase(q);
    print(qq); // HOWDY
    print(q); // howdy
/* Output:
 * howdy
 * howdy

    String s = “asdf”;
    String x = Immutable.upcase(s);
2. 重载 “+”与StringBuilder

public class Concatenation {
  public static void main(String[] args) {
    String mango = "mango";
    String s = "abc" + mango + "def" + 47;
/* Output:
 * abcmangodef47 

    这种工作方式当然也行得通,但是为了生成最终的String,此方式会产生一大推需要垃圾回收的中间对象。可用jdk自带的工具javap来反编译以上代码。命令如下:javap -c Concatenation 这里的-c标志表示将生成jvm字节码。在字节码中需要注意的重点是:编译器自动引入了StringBuilder类。虽然我们在源代码中并没有使用StringBuilder类,但是编译器却自作主张使用了它,因为它更高效。

public class WhitherStringBuilder {
  public String implicit(String[] fields) {
    String result = "";
    for(int i = 0; i < fields.length; i++)
      result += fields[i];
    return result;
  public String explicit(String[] fields) {
    StringBuilder result = new StringBuilder();
    for(int i = 0; i < fields.length; i++)
    return result.toString();

    现在运行javap -c WhitherStringBuilder 在字节码中implicit()方法,从第8到第35行构成了一个循环体。注意的重点是:StringBuilder是在循环之内构造的,这意味着每经过一次循环,就会创建一个StringBuilder对象。但是在explicit方法对应的字节码中,可以看到,不仅循环部分的代码更简短、更简单,而且它只生成了一个StringBuilder对象。显式的创建StringBuilder还允许你预先为其指定大小。如果你已经知道最终的字符串大概有多长,那么预先指定StringBulider的大小可以避免多次重新分配缓存。

public class UsingStringBuilder {
  public static Random rand = new Random(47);
  public String toString() {
    StringBuilder result = new StringBuilder("[");
    for(int i = 0; i < 25; i++) {
      result.append(", ");
    result.delete(result.length()-2, result.length());
    return result.toString();
  public static void main(String[] args) {
    UsingStringBuilder usb = new UsingStringBuilder();
} /* Output:
[58, 55, 93, 61, 61, 29, 68, 0, 22, 7, 88, 28, 51, 89, 9, 78, 98, 61, 20, 58, 16, 40, 11, 22, 4]

    最终的结果是用append()语句一点点拼接起来的。如果你想走捷径,例如append(a + “:” + b),那编译器就会掉入陷阱,从而为你另外创建一个StringBulider对象处理括号内的字符串操作。StringBuilder提供了丰富而全面的方法,也是JavaSE5引入的,在这之前用的是StringBuffer。后者是线程安全的,因此开销也会大一些。所以在Java5之后的字符串操作应该还会快一些。
3. 无意识的递归

public class ArrayListDisplay {
  public static void main(String[] args) {
    ArrayList coffees = new ArrayList();
    for(Coffee c : new CoffeeGenerator(10))
} /* Output:
[Americano 0, Latte 1, Americano 2, Mocha 3, Mocha 4, Breve 5, Americano 6, Latte 7, Cappuccino 8, Cappuccino 9]


public class InfiniteRecursion {
  public String toString() {
    return " InfiniteRecursion address: " + this + "\n";
  public static void main(String[] args) {
    List v = new ArrayList();
    for(int i = 0; i < 10; i++)
      v.add(new InfiniteRecursion());

    当你创建了InfiniteRecursion对象,并将其打印出来的时候,你会得到一串非常长的异常。如果你将该InfiniteRecursion对象存入一个ArrayList中,然后打印该ArrayList,你也会得到同样的异常。其实,当如下代码运行时:" InfiniteRecursion address: " + this + "\n" 这里发生了自动类型转换,由InfiniteRecursion类型转换成String类型。因为编译器看到一个String对象后面跟着一个“+”,而再后面的对象不是String,于是编译器试着将this转换成一个String,它怎么转换呢?正是通过调用this的toString()方法,于是就发生了递归调用。

public class InfiniteRecursion {
    public String toString() {
        return " InfiniteRecursion address: " + super.toString() + "\n";

    public static void main(String[] args) {
        List v = new ArrayList();
        for (int i = 0; i < 10; i++)
            v.add(new InfiniteRecursion());

4. String上的操作(API)

    初始化一个新创建的 String 对象,使其表示一个空字符序列。 (String不可变,无需使用该构造方法)
String(byte[] bytes) 
    通过使用平台的默认字符集解码指定的 byte 数组,构造一个新的 StringString(byte[] bytes, Charset charset) 
    通过使用指定的 charset 解码指定的 byte 数组,构造一个新的 StringString(byte[] bytes, int offset, int length) 
    通过使用平台的默认字符集解码指定的 byte 子数组,构造一个新的 String。(offset:第一个索引;length:长度)
String(byte[] bytes, int offset, int length, Charset charset) 
    通过使用指定的 charset 解码指定的 byte 子数组,构造一个新的 StringString(byte[] bytes, String charsetName) 
    通过使用指定的 charset 解码指定的 byte 数组,构造一个新的 String。(charsetName:受支持charset的名称)
String(byte[] bytes, int offset, int length, String charsetName) 
    通过使用指定的字符集解码指定的 byte 子数组,构造一个新的 StringString(char[] value) 
    分配一个新的 String,使其表示字符数组参数中当前包含的字符序列。 
String(char[] value, int offset, int count) 
    分配一个新的 String,它包含取自字符数组参数一个子数组的字符。 
String(int[] codePoints, int offset, int count) 
    分配一个新的 String,它包含 Unicode 代码点数组参数一个子数组的字符。 
String(String original) 
    初始化一个新创建的 String 对象,使其表示一个与参数相同的字符序列;换句话说,新创建的字符串是该参数字符串的副本。 
String(StringBuffer buffer) 
String(StringBuilder builder) 

  4.2 方法

 char charAt(int index) 
    返回指定索引处的 char 值。 
 int codePointAt(int index) 
    返回指定索引处的字符(Unicode 代码点)。 
 int codePointBefore(int index) 
    返回指定索引之前的字符(Unicode 代码点)。 
 int codePointCount(int beginIndex, int endIndex) 
    返回此 String 的指定文本范围中的 Unicode 代码点数。 
 int compareTo(String anotherString) 
    按字典顺序比较两个字符串。 (位于参数前:返回负数;参数后:返回正数;相等返回0)
 int compareToIgnoreCase(String str) 
 String concat(String str) 
 boolean contains(CharSequence s) 
    当且仅当此字符串包含指定的 char 值序列时,返回 trueboolean contentEquals(CharSequence cs) 
    将此字符串与指定的 CharSequence 比较。 
 boolean contentEquals(StringBuffer sb) 
    将此字符串与指定的 StringBuffer 比较。 
static String copyValueOf(char[] data) 
    返回指定数组中表示该字符序列的 Stringstatic String copyValueOf(char[] data, int offset, int count) 
    返回指定数组中表示该字符序列的 Stringboolean endsWith(String suffix) 
 boolean equals(Object anObject) 
 boolean equalsIgnoreCase(String anotherString) 
    将此 String 与另一个 String 比较,不考虑大小写。 
static String format(Locale l, String format, Object... args) 
static String format(String format, Object... args) 
 byte[] getBytes() 
    使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。 
 byte[] getBytes(Charset charset) 
    使用给定的 charset 将此 String 编码到 byte 序列,并将结果存储到新的 byte 数组。 
 byte[] getBytes(String charsetName) 
    使用指定的字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。 
 void getChars(int srcBegin, int srcEnd, char[] dst, int dstBegin) 
 int hashCode() 
 int indexOf(int ch) 
 int indexOf(int ch, int fromIndex) 
 int indexOf(String str) 
 int indexOf(String str, int fromIndex) 
 String intern() 
 boolean isEmpty() 
    当且仅当 length() 为 0 时返回 true。 
 int lastIndexOf(int ch) 
 int lastIndexOf(int ch, int fromIndex) 
 int lastIndexOf(String str) 
 int lastIndexOf(String str, int fromIndex) 
 int length() 
 boolean matches(String regex) 
 int offsetByCodePoints(int index, int codePointOffset) 
    返回此 String 中从给定的 index 处偏移 codePointOffset 个代码点的索引。 
 boolean regionMatches(boolean ignoreCase, int toffset, String other, int ooffset, int len) 
 boolean regionMatches(int toffset, String other, int ooffset, int len) 
 String replace(char oldChar, char newChar) 
    返回一个新的字符串,它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。 
 String replace(CharSequence target, CharSequence replacement) 
 String replaceAll(String regex, String replacement) 
    使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。 
 String replaceFirst(String regex, String replacement) 
    使用给定的 replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。 
 String[] split(String regex) 
 String[] split(String regex, int limit) 
 boolean startsWith(String prefix) 
 boolean startsWith(String prefix, int toffset) 
 CharSequence subSequence(int beginIndex, int endIndex) 
 String substring(int beginIndex) 
 String substring(int beginIndex, int endIndex) 
 char[] toCharArray() 
 String toLowerCase() 
    使用默认语言环境的规则将此 String 中的所有字符都转换为小写。 
 String toLowerCase(Locale locale) 
    使用给定 Locale 的规则将此 String 中的所有字符都转换为小写。 
 String toString() 
 String toUpperCase() 
    使用默认语言环境的规则将此 String 中的所有字符都转换为大写。 
 String toUpperCase(Locale locale) 
    使用给定 Locale 的规则将此 String 中的所有字符都转换为大写。 
 String trim() 
static String valueOf(boolean b) 
    返回 boolean 参数的字符串表示形式。 
static String valueOf(char c) 
    返回 char 参数的字符串表示形式。 
static String valueOf(char[] data) 
    返回 char 数组参数的字符串表示形式。 
static String valueOf(char[] data, int offset, int count) 
    返回 char 数组参数的特定子数组的字符串表示形式。 
static String valueOf(double d) 
    返回 double 参数的字符串表示形式。 
static String valueOf(float f) 
    返回 float 参数的字符串表示形式。 
static String valueOf(int i) 
    返回 int 参数的字符串表示形式。 
static String valueOf(long l) 
    返回 long 参数的字符串表示形式。 
static String valueOf(Object obj) 
    返回 Object 参数的字符串表示形式。 

5. 格式化输出
  5.1 printf()

printf("Row 1:[%d %f]\n",x,y);

  5.2 System.out.format()

public class SimpleFormat {
  public static void main(String[] args) {
    int x = 5;
    double y = 5.332542;
    // The old way:
    System.out.println("Row 1: [" + x + " " + y + "]");
    // The new way:
    System.out.format("Row 1: [%d %f]\n", x, y);
    // or
    System.out.printf("Row 1: [%d %f]\n", x, y);
} /* Output:
Row 1: [5 5.332542]
Row 1: [5 5.332542]
Row 1: [5 5.332542]

  5.3 Formatter类

public class Turtle {
  private String name;
  private Formatter f;
  public Turtle(String name, Formatter f) {
    this.name = name;
    this.f = f;
  public void move(int x, int y) {
    f.format("%s The Turtle is at (%d,%d)\n", name, x, y);
  public static void main(String[] args) {
    PrintStream outAlias = System.out;
    Turtle tommy = new Turtle("Tommy",new Formatter(System.out));
    Turtle terry = new Turtle("Terry",new Formatter(outAlias));
} /* Output:
Tommy The Turtle is at (0,0)
Terry The Turtle is at (4,8)
Tommy The Turtle is at (3,4)
Terry The Turtle is at (2,5)
Tommy The Turtle is at (3,3)
Terry The Turtle is at (3,3)

    所有的tommy都将输出到System.out,而所有的terry则都输出到System.out的一个别名中。Formatter的构造器经过重载可以接受多种输出目的地,不过最常用的还是PrintStream()。例子中还使用了一个新的格式化修饰符%s,它表示插入的参数是String 类型。
  5.4 格式化说明符



public class Receipt {
  private double total = 0;
  private Formatter f = new Formatter(System.out);
  public void printTitle() {
    f.format("%-15s %5s %10s\n", "Item", "Qty", "Price");
    f.format("%-15s %5s %10s\n", "----", "---", "-----");
  public void print(String name, int qty, double price) {
    f.format("%-15.15s %5d %10.2f\n", name, qty, price);
    total += price;
  public void printTotal() {
    f.format("%-15s %5s %10.2f\n", "Tax", "", total*0.06);
    f.format("%-15s %5s %10s\n", "", "", "-----");
    f.format("%-15s %5s %10.2f\n", "Total", "",
      total * 1.06);
  public static void main(String[] args) {
    Receipt receipt = new Receipt();
    receipt.print("Jack's Magic Beans", 4, 4.25);
    receipt.print("Princess Peas", 3, 5.1);
    receipt.print("Three Bears Porridge", 1, 14.29);
} /* Output:
Item              Qty      Price
----              ---      -----
Jack's Magic Be     4       4.25
Princess Peas       3       5.10
Three Bears Por     1      14.29
Tax                         1.42
Total                      25.06

  5.5 Formatter转换
    d 整数型(十进制)
    c Unicode字符
    b Boolean值
    s String
    f 浮点数(十进制)
    e 浮点数(科学计数)
    x 整数(十六进制)
    h 散列码(十六进制)
    % 字符“%”

public class Conversion {
  public static void main(String[] args) {
    Formatter f = new Formatter(System.out);

    char u = 'a';
    System.out.println("u = 'a'");
    f.format("s: %s\n", u);
    // f.format("d: %d\n", u);
    f.format("c: %c\n", u);
    f.format("b: %b\n", u);
    // f.format("f: %f\n", u);
    // f.format("e: %e\n", u);
    // f.format("x: %x\n", u);
    f.format("h: %h\n", u);

    int v = 121;
    System.out.println("v = 121");
    f.format("d: %d\n", v);
    f.format("c: %c\n", v);
    f.format("b: %b\n", v);
    f.format("s: %s\n", v);
    // f.format("f: %f\n", v);
    // f.format("e: %e\n", v);
    f.format("x: %x\n", v);
    f.format("h: %h\n", v);

    BigInteger w = new BigInteger("50000000000000");
      "w = new BigInteger(\"50000000000000\")");
    f.format("d: %d\n", w);
    // f.format("c: %c\n", w);
    f.format("b: %b\n", w);
    f.format("s: %s\n", w);
    // f.format("f: %f\n", w);
    // f.format("e: %e\n", w);
    f.format("x: %x\n", w);
    f.format("h: %h\n", w);

    double x = 179.543;
    System.out.println("x = 179.543");
    // f.format("d: %d\n", x);
    // f.format("c: %c\n", x);
    f.format("b: %b\n", x);
    f.format("s: %s\n", x);
    f.format("f: %f\n", x);
    f.format("e: %e\n", x);
    // f.format("x: %x\n", x);
    f.format("h: %h\n", x);

    Conversion y = new Conversion();
    System.out.println("y = new Conversion()");
    // f.format("d: %d\n", y);
    // f.format("c: %c\n", y);
    f.format("b: %b\n", y);
    f.format("s: %s\n", y);
    // f.format("f: %f\n", y);
    // f.format("e: %e\n", y);
    // f.format("x: %x\n", y);
    f.format("h: %h\n", y);

    boolean z = false;
    System.out.println("z = false");
    // f.format("d: %d\n", z);
    // f.format("c: %c\n", z);
    f.format("b: %b\n", z);
    f.format("s: %s\n", z);
    // f.format("f: %f\n", z);
    // f.format("e: %e\n", z);
    // f.format("x: %x\n", z);
    f.format("h: %h\n", z);
} /* Output: (Sample)
u = 'a'
s: a
c: a
b: true
h: 61
v = 121
d: 121
c: y
b: true
s: 121
x: 79
h: 79
w = new BigInteger("50000000000000")
d: 50000000000000
b: true
s: 50000000000000
x: 2d79883d2000
h: 8842a1a7
x = 179.543
b: true
s: 179.543
f: 179.543000
e: 1.795430e+02
h: 1ef462c
y = new Conversion()
b: true
s: Conversion@9cab16
h: 9cab16
z = false
b: false
s: false
h: 4d5

  5.5 String.format()

public class DatabaseException extends Exception {
  public DatabaseException(int transactionID, int queryID,String message) {
    super(String.format("(t%d, q%d) %s", transactionID,queryID, message));
  public static void main(String[] args) {
    try {
      throw new DatabaseException(3, 7, "Write failed");
    } catch(Exception e) {
} /* Output:
DatabaseException: (t3, q7) Write failed

6. 正则表达式
  6.1 基础
    一般来说,正则表达式就是以某种方式来描述字符串,因此你可以说:“如果一个字符串含有这些东西,那么它就是我正在找的东西。”例如:要找一个数字,它可能有一个负号在最前面,那么你就写一个负号加上一个问号,就像这样: -?
    要表示“一个或多个之前的表达式”,应该使用+。所以,如果要表示“可能有一个负号,后面跟着一位或者多位数字”,可以这样: -?\\d+

public class IntegerMatch {
  public static void main(String[] args) {
} /* Output:

    前两个字符串满足对于的正则表达式,匹配成功。第三个字符串开头有一个+,它也是一个合法的整数,但与对应的正则表达式却不匹配。因为,我们的正则表达式应该描述为;“可能以一个+或-开头”。在正则表达式中,括号有着将正则表达式分组的效果,而| 表示 “或”的含义。也就是 (-|\\+)? 这个正则表达式字符串的起始字符可能是一个-或+,或二者皆没有(因为后面跟着?修饰符)。因为字符+在正则表达式中有特殊的意义,所以必须使用\将其转译,使之成为表达式中的一个普通字符。

public class Splitting {
  public static String knights =
    "Then, when you have found the shrubbery, you must " +
    "cut down the mightiest tree in the forest... " +
    "with... a herring!";
  public static void split(String regex) {
  public static void main(String[] args) {
    split(" "); // Doesn't have to contain regex chars
    split("\\W+"); // Non-word characters
    split("n\\W+"); // 'n' followed by non-word characters
} /* Output:
[Then,, when, you, have, found, the, shrubbery,, you, must, cut, down, the, mightiest, tree, in, the, forest..., with..., a, herring!]
[Then, when, you, have, found, the, shrubbery, you, must, cut, down, the, mightiest, tree, in, the, forest, with, a, herring]
[The, whe, you have found the shrubbery, you must cut dow, the mightiest tree i, the forest... with... a herring!]


public class Replacing {
  static String s = Splitting.knights;
  public static void main(String[] args) {
    print(s.replaceFirst("f\\w+", "located"));
} /* Output:
Then, when you have located the shrubbery, you must cut down the mightiest tree in the forest... with... a herring!
Then, when you have found the banana, you must cut down the mightiest banana in the forest... with... a banana!

  6.2 创建正则表达式

B                                   指定字符B
\xhh                                十六进制值为oxhh的字符
\uhhhh                              十六机制表示为oxhhhh的Unicode字符
\t                                  制表符Tab
\n                                  换行符
\r                                  回车
\f                                  换页
\e                                  转义
.                                   任意字符
[abc]                               包含a、b和c的任何字符(和a|b|c作用相同)
[^abc]                              除了a、b和c之外的任何字符(否定)
[a-zA-Z]                            从a到z或者A到Z的任何字符(范围)
[abc[hij]]                          任意a、b、c、h、i、j(与a|b|c|h|i|j作用相同)(合并)
[a-z&&[hij]]                        任意h、i或j(交)
\s                                  空白符(空格、tab、换行、换页和回车)
\S                                  非空白符([^\s])
\d                                  数字[0-9]
\D                                  非数字[^0-9]
\w                                  词字符[a-zA-Z0-9]
\W                                  非词字符[^\w]
XY                                  Y跟在X后面
X|Y                                 X或Y
(X)                                 捕获组
^                                   一行的起始
$                                  一行的结束
\b                                  词的边界
\B                                  非词的边界
\G                                  前一个匹配的结束
public class Rudolph {
    public static void main(String[] args) {
        for (String pattern : new String[] {"Rudolph", "[rR]udolph", "[rR][aeiou][a-z]ol.*", "R.*"})
     * true
     * true
     * true
     * true

  6.3 Pattern和Matcher
    一般来说,比起功能有限的String类,我们更愿意构造功能强大的正则表达式对象。只需导入java.util.regex包,然后用static Pattern.complier()方法来编译你的正则表达式即可。它会根据你的String类型的正则表达式生成一个Pattern对象。接下来,把你想要检索的字符串传入Pattern对象的matcher()方法。matcher()方法会生成一个Matcher对象,它有很多功能可用。

public class TestRegularExpression {
  public static void main(String[] args) {
    if(args.length < 2) {
      print("Usage:\njava TestRegularExpression " +
        "characterSequence regularExpression+");
    print("Input: \"" + args[0] + "\"");
    for(String arg : args) {
      print("Regular expression: \"" + arg + "\"");
      Pattern p = Pattern.compile(arg);
      Matcher m = p.matcher(args[0]);
      while(m.find()) {
        print("Match \"" + m.group() + "\" at positions " +
          m.start() + "-" + (m.end() - 1));
} /* Output:
Input: "abcabcabcdefabc"
Regular expression: "abcabcabcdefabc"
Match "abcabcabcdefabc" at positions 0-14
Regular expression: "abc+"
Match "abc" at positions 0-2
Match "abc" at positions 3-5
Match "abc" at positions 6-8
Match "abc" at positions 12-14
Regular expression: "(abc)+"
Match "abcabcabc" at positions 0-8
Match "abc" at positions 12-14
Regular expression: "(abc){2,}"
Match "abcabcabc" at positions 0-8


static boolean matchers(String regex,CharSequence input)


boolean matches()
boolean lookingAt()
boolean find()
boolean find(int start)

    6.3.1 Matcher.find()

public class Finding {
  public static void main(String[] args) {
    Matcher m = Pattern.compile("\\w+")
      .matcher("Evening is full of the linnet's wings");
      printnb(m.group() + " ");
    int i = 0;
    while(m.find(i)) {
      printnb(m.group() + " ");
} /* Output:
Evening is full of the linnet s wings
Evening vening ening ning ing ng g is is s full full ull ll l of of f the the he e linnet linnet innet nnet net et t s s wings wings ings ngs gs s

    6.3.2 组
    组是用括号划分的正则表达式,可以根据组的编号来引用某个组。组号为0表示整个表达式,组好1表示被第一对括号括起来的组,依次类推,因此这个表达式 A(B(C))D 有三个组:组0是ABCD,组1是BC,组2是C。
    Matcher对象提供了一系列方法,用以获取和组相关的信息:public int groupCount()返回该匹配器的模式中的分组数目,第0组不包括在内。public String group()返回前一次匹配操作的第0组。public String group(int i)返回在前一次匹配操作期间指定的组号,如果匹配成功,但是指定的组没有匹配输入字符串的任何部分,则将会返回null。public int start(int group)返回在前一次匹配操作中寻找到的组的起始索引。public int end(int group)返回在前一次匹配操作中寻找到的组的最后一个字符索引加1的值。

public class Groups {
  static public final String POEM =
    "Twas brillig, and the slithy toves\n" +
    "Did gyre and gimble in the wabe.\n" +
    "All mimsy were the borogoves,\n" +
    "And the mome raths outgrabe.\n\n" +
    "Beware the Jabberwock, my son,\n" +
    "The jaws that bite, the claws that catch.\n" +
    "Beware the Jubjub bird, and shun\n" +
    "The frumious Bandersnatch.";
  public static void main(String[] args) {
    Matcher m =
    while(m.find()) {
      for(int j = 0; j <= m.groupCount(); j++)
        printnb("[" + m.group(j) + "]");
} /* Output:
[the slithy toves][the][slithy toves][slithy][toves]
[in the wabe.][in][the wabe.][the][wabe.]
[were the borogoves,][were][the borogoves,][the][borogoves,]
[mome raths outgrabe.][mome][raths outgrabe.][raths][outgrabe.]
[Jabberwock, my son,][Jabberwock,][my son,][my][son,]
[claws that catch.][claws][that catch.][that][catch.]
[bird, and shun][bird,][and shun][and][shun]
[The frumious Bandersnatch.][The][frumious Bandersnatch.][frumious][Bandersnatch.]

    6.3.3 split

String[] split(CharSequence input)
String[] split(CharSequence input, int limit)


public class SplitDemo {
  public static void main(String[] args) {
    String input =
      "This!!unusual use!!of exclamation!!points";
    // Only do the first three:
      Pattern.compile("!!").split(input, 3)));
} /* Output:
[This, unusual use, of exclamation, points]
[This, unusual use, of exclamation!!points]
