Guava 字符串处理(Joiner, Splitter, CharMatcher)

guava 提供了非常强大的字符串处理操作

 

1 Joiner

   以前肯定遇到过这样的场景,为了sql查询,把一个List<Integer>集合拼接成一个字符串,用逗号隔开,看一下Joiner如何实现的:

  

public static void main (String args[]) {
        List<Integer> list = Lists.newArrayList(1,2,3,4,5);
        Joiner joiner = Joiner.on(",").skipNulls();
        System.out.println(joiner.join(list));
    }

   输出结果:1,2,3,4,5

 

   是不是很方便?Joiner提供on方法,用来作为各个对象之间的连接

 

2 Splitter

   demo:

    public static void main (String[] args) {
        String str = "fasdga, , fasgasd, fasdgas";
        Splitter splitter = Splitter.on(",").omitEmptyStrings().trimResults();
        List<String> stringList = splitter.splitToList(str);
        for (String s : stringList) {
            System.out.println(s + "============");
        }
    }

   on方法指定按什么分割,omitEmptyStrings方法表示分割结果项中有空字符串则忽略, trimResults表示对分割后的结果使用trim方法

 

 

3 Charsets

   类似一个枚举值,提供各种字符集,如:Charsets.UTF_8

 

4 CaseFormat

   CaseFormat被用来方便地在各种ASCII大小写规范间转换字符串——比如,编程语言的命名规范。CaseFormat支持的格式如下:

 

格式 范例
LOWER_CAMEL lowerCamel
LOWER_HYPHEN lower-hyphen
LOWER_UNDERSCORE lower_underscore
UPPER_CAMEL UpperCamel
UPPER_UNDERSCORE UPPER_UNDERSCORE

   此类一般情况下没用,当使用反射的时候可能有用,比如,你想获取一个属性的get方法,属性名称为"name",那么方法名称为getName,如果你不知道具体的属性名称, 你会怎么做呢?

  

    @Override
    public String toString () {
        Field[] fields = this.getClass().getDeclaredFields();
        Objects.ToStringHelper toStringHelper = Objects.toStringHelper(this.getClass());
        try {
            for (Field field : fields) {
                //这里用到CaseFormat,把方法名转换成驼峰标示(当然这里也可以自己动手去处理字符串)
                String methodName = CaseFormat.LOWER_HYPHEN.to(CaseFormat.LOWER_CAMEL, "get-" + field.getName());
                Method method = this.getClass().getMethod(methodName);
                toStringHelper.add(field.getName(), method.invoke(this));
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
        return toStringHelper.toString();
    }
 

 

5 CharMatcher

   (1)CharMatcher 实现了接口Predicate<Character>,可用来作为集合的过滤器,CharMatcher是一个抽象类,如果要实现自己的CharMatcher要实现方法matches方法

   (2)CharMatcher 一般情况下做了两件事:

          2.1 匹配字符,获取到CharMatcher

          2.2 在获取到的CharMatcher上做操作

    (3)CharMatcher 自己提供了很多CharMatcher的实现:

            ANY: 匹配任何字符

            ASCII: 匹配是否是ASCII字符

            BREAKING_WHITESPACE: 匹配所有可换行的空白字符(不包括非换行空白字符,例如"\u00a0")

            DIGIT: 匹配ASCII数字 

            INVISIBLE: 匹配所有看不见的字符

            JAVA_DIGIT: 匹配UNICODE数字, 使用 Character.isDigit() 实现

            JAVA_ISO_CONTROL: 匹配ISO控制字符, 使用 Charater.isISOControl() 实现

            JAVA_LETTER: 匹配字母, 使用 Charater.isLetter() 实现

            JAVA_LETTER_OR_DIGET: 匹配数字或字母

            JAVA_LOWER_CASE: 匹配小写

            JAVA_UPPER_CASE: 匹配大写

            NONE: 不匹配所有字符

            SINGLE_WIDTH: 匹配单字宽字符, 如中文字就是双字宽

            WHITESPACE: 匹配所有空白字符

     (4)CharMatcher 提供了一些静态方法来让使用者更方便的获取CharMater对象,来处理字符串:

              CharMatcher is(char match): 返回匹配指定字符的Matcher

              CharMatcher isNot(char match): 返回不匹配指定字符的Matcher

              CharMatcher anyOf(CharSequence sequence): 返回匹配sequence中任意字符的Matcher

              CharMatcher noneOf(CharSequence sequence): 返回不匹配sequence中任何一个字符的Matcher

              CharMatcher inRange(char startInclusive, char endIncludesive): 返回匹配范围内任意字符的Matcher

              CharMatcher forPredicate(Predicate<? super Charater> predicate): 返回使用predicate的apply()判断匹配的Matcher

              CharMatcher negate(): 返回以当前Matcher判断规则相反的Matcher

              CharMatcher and(CharMatcher other): 返回与other匹配条件组合做与来判断的Matcher

              CharMatcher or(CharMatcher other): 返回与other匹配条件组合做或来判断的Matcher

      (5)上面几条主要讲了默认实现的CharMatcher,以及如果获取CharMatcher,下面说一下,获取到了CharMatcher如何处理字符:

             boolean matchesAnyOf(CharSequence sequence): 只要sequence中有任意字符能匹配Matcher,返回true

             boolean matchesAllOf(CharSequence sequence): sequence中所有字符都能匹配Matcher,返回true

             boolean matchesNoneOf(CharSequence sequence): sequence中所有字符都不能匹配Matcher,返回true

             int indexIn(CharSequence sequence): 返回sequence中匹配到的第一个字符的坐标

             int indexIn(CharSequence sequence, int start): 返回从start开始,在sequence中匹配到的第一个字符的坐标

             int lastIndexIn(CharSequence sequence): 返回sequence中最后一次匹配到的字符的坐标

             int countIn(CharSequence sequence): 返回sequence中匹配到的字符计数

             String removeFrom(CharSequence sequence): 删除sequence中匹配到到的字符并返回

             String retainFrom(CharSequence sequence): 保留sequence中匹配到的字符并返回

             String replaceFrom(CharSequence sequence, char replacement): 替换sequence中匹配到的字符并返回

             String trimFrom(CharSequence sequence): 删除首尾匹配到的字符并返回

             String trimLeadingFrom(CharSequence sequence): 删除首部匹配到的字符

             String trimTrailingFrom(CharSequence sequence): 删除尾部匹配到的字符

             String collapseFrom(CharSequence sequence, char replacement): 将匹配到的组(连续匹配的字符)替换成replacement 

             String trimAndCollapseFrom(CharSequence sequence, char replacement): 先trim在replace

       (6) 有兴趣的同学可以看一下CharMatcher的源码,可以发现CharMatcher对String的操作并没有什么高明之处,把String转化成char数组,然后根据需要做对应的操作,个人感觉CharMatcher比较好的地方在于,

                 作为一个工具类,提供了非常好用的api,使用内部类And和Or去实现多个CharMatcher实现与或操作,这种编码风格非常值得借鉴

             

    public static void main (String[] args) {
        String str = "12312,agg  ";
        CharMatcher charMatcher1 = CharMatcher.is('1');
        CharMatcher charMatcher2 = CharMatcher.is('2');
        //两个CharMatcher或操作
        CharMatcher charMatcher3 = charMatcher1.or(charMatcher2);
        System.out.println(charMatcher3.retainFrom(str));
    }
  
  //charMatcher1.or的源码实现
  public CharMatcher or(CharMatcher other) {
    return new Or(this, checkNotNull(other));
  }
  
  //在CharMatcher内部定义了一个Or类,用来实现两个CharMatcher的Or操作,这是一种非常好的代码风格
  private static class Or extends CharMatcher {
    final CharMatcher first;
    final CharMatcher second;

    Or(CharMatcher a, CharMatcher b, String description) {
      super(description);
      first = checkNotNull(a);
      second = checkNotNull(b);
    }

    Or(CharMatcher a, CharMatcher b) {
      this(a, b, "CharMatcher.or(" + a + ", " + b + ")");
    }

    @GwtIncompatible("java.util.BitSet")
    @Override
    void setBits(BitSet table) {
      first.setBits(table);
      second.setBits(table);
    }

    @Override
    public boolean matches(char c) {
      return first.matches(c) || second.matches(c);
    }

    @Override
    CharMatcher withToString(String description) {
      return new Or(first, second, description);
    }
  }

 

你可能感兴趣的:(guava,Joiner,Splitter,CharMatcher)