java split

一道腾讯java笔试题

试题如下:

"|DF|A".split("|").length的结果是()

A 2  B 3  C 5  D 6

我知道String的split方法极容易出错,然而想不到的是这道题的答案竟然是D.

分析:

这道题的关键是String.split方法的参数是一个正则表达式字符串,split实际上调用的是:

public String[] split(String regex, int limit) {
    return Pattern.compile(regex).split(this, limit);
    }


而"|"这里不是简单的'|'字符,查阅Pattern类API就会知道:

"|"是正则表达式里的逻辑或运算符,它被编译后匹配的是其左右两边的任意一个字符串.举个例子来说

String[] arr = "a1b2cc1dd".split("1|2");//以1或者2分隔字符串
        
        System.out.println(arr.length);
        for(String s:arr){
            System.out.println(s);
        }


结果:
4
a
b
cc
dd



         //以空串或者空串分隔字符串,实际上是分隔每一个字符



        String[] arr = "a1b2cc1dd".split("|");
        
        System.out.println(arr.length);
        for(String s:arr){
            System.out.println(s);
        }


结果:
10
a
1
b
2
c
c
1
d
d
 



这道题到这里已经知道为什么要选择D了,但对于String.split方法我觉得更容易出问题的还在以下一些例子,请读者自己查看源码查找答案:

"|DF|A|||".split("[|]").length = 3

"||DF|A|||".split("[|]").length = 4

//关键看Pattern类源码



public String[] split(CharSequence input, int limit) {
        int index = 0;
        boolean matchLimited = limit > 0;
        ArrayList matchList = new ArrayList();
        Matcher m = matcher(input);
        // Add segments before each match found
        while(m.find()) {
            if (!matchLimited || matchList.size() < limit - 1) {
                String match = input.subSequence(index, m.start()).toString();
                matchList.add(match);
                index = m.end();
            } else if (matchList.size() == limit - 1) { // last one
                String match = input.subSequence(index,
                                                 input.length()).toString();
                matchList.add(match);
                index = m.end();
            }
        }
        // If no match was found, return this
        if (index == 0)
            return new String[] {input.toString()};
        // Add remaining segment
        if (!matchLimited || matchList.size() < limit)
            matchList.add(input.subSequence(index, input.length()).toString());
        // Construct result
        int resultSize = matchList.size();
        if (limit == 0)



            //请看这里做了什么操作,分隔后的结果从最后开始遍历,凡是等于空串的一律截掉,否则退出
            while (resultSize > 0 && matchList.get(resultSize-1).equals(""))
                resultSize--;
        String[] result = new String[resultSize];
        return (String[])matchList.subList(0, resultSize).toArray(result);
    }

 


转自http://yu.an.jin.5.blog.163.com/blog/static/53155811201099115435386/

你可能感兴趣的:(java,C++,c,正则表达式,腾讯)