##.split()方法和StringTokenizer的用法详解
1.String.split()方法
在java.lang包中有String.split()方法的原型是: public String[] split(String regex, int limit)
split函数是用于使用特定的切割符(regex)来分隔字符串成一个字符串数组,函数返回是一个数组。在其中每个出现regex的位置都要进行分解。
需要注意是有以下几点:
(1)regex是可选项。字符串或正则表达式对象,它标识了分隔字符串时使用的是一个还是多个字符。如果忽略该选项,返回包含整个字符串的单一元素数组。
(2)limit也是可选项。该值用来限制返回数组中的元素个数。
(3)要注意转义字符:“.”和“|”都是转义字符,必须得加"\"。同理:*和+也是如此的。 如果用“.”作为分隔的话,必须是如下写法:
String.split("\."),这样才能正确的分隔开,不能用String.split(".");
如果用“|”作为分隔的话,必须是如下写法:
String.split("\|"),这样才能正确的分隔开,不能用String.split("|");
(4)如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acountId=? and act_id =? or extra=?”,把三个都分隔出来,可以用 String.split(“and|or”);
2.StringTokenizer的用法详解
StringTokenizer类:大多数Java程序员都曾经使用过java.util.StringTokenizer类。它是一个很方便的字符串分解器,主要用来根据分隔符把字符串分割成标记(Token),然后按照请求返回各个标记。这个过程称为Tokenization,实际上就是把字符序列转换成应用程序能够理解的多个标记。
;这个类只是简单地在输入字符串中查找分隔符,一旦找到了分隔符就分割字符串。它不会检查分隔符是否在子串之中这类条件,当输入字符串中出现两个连续的分隔符时,它也不会返回""(字符串长度为0)形式的标记。
StringTokenizer的三个构造方法:
(1).StringTokenizer(String str) :被分割对象str,分隔符采取默认分割,Java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。默认的话,所有的分隔符都会同时起作用。
源码:
public StringTokenizer(String str) {
this(str, ” \t\n\r\f”, false);
}
实例:
[java] view plain copy
public static void main(String[] args) {
StringTokenizer st = new StringTokenizer(“www ooobj com”);
while(st.hasMoreElements()){
System.out.println(“Token:” + st.nextToken());
}
}
输出:
Token:www
Token:ooobj
Token:com
(2).StringTokenizer(String str, String delim):分隔符不采用默认,提供一个指定的分隔符。
(3).StringTokenizer(String str, String delim, boolean returnDelims):指定一个特定的分隔符,同时,指定是否返回分隔符。如果是true,分隔符将被作为一个token返回。
实例:
public static void main(String[] args) {
StringTokenizer st = new StringTokenizer(“www.ooobj.com”, “.”, true);
while(st.hasMoreElements()){
System.out.println(“Token:” + st.nextToken());
}
}
输出:
Token:www
Token:.
Token:ooobj
Token:.
Token:com
方法有6个:(所有的方法都是public型) ·
int countTokens()
对于这个方法API的描述是这样的:Calculates the number of times that this tokenizer’snextToken method can be called before it generates an exception. The current position is not advanced.
它说计算nextToken方法在抛异常以前还能被调用的次数,当前索引不增加。
其实就是说还有几个元素可以被遍历。返回的是 当前可以被访问的元素的个数。
nextToken()方法通过StringTokenizer.nextToken方法获取标记,并检查标记中的双引号字符。如果发现了这些字符,它继续获取标记直至不能再找到带有双引号的标记。countTokens()方法检查子串是否包含双引号。如果包含,那么它减少总数并把索引值修改为字符串中下一个双引号出现的位置(如上面的代码片断所示)。如果bReturnTokens是false,那么它从总数减去输入字符串中出现的非连续分隔符的数量。
方法1:用来判断当前还有没有可以遍历的元素
boolean hasMoreTokens(); //判断字符串中是含还有token
boolean hasMoreElements();
方法2:用来获得当前的元素token,一个返回String类型,一个返回Object类型
Object nextElement();//除返回结果类型外,其返回与 nextToken 方法相同的值
String nextToken();//StringTokenizer对象中的下一个token。
方法3:
String nextToken(String delim)
返回当前索引开始,指定分隔符的下一个token。实际返回的是索引当前位置到下一个delim出现为止所有的字符,见例子。
无法想想出这个方法在什么情况下使用。
StringTokenizer test = new StringTokenizer(“J-PHONE,Vodafone,SoftBank”,",");
while(test.hasMoreTokens()){
System.out.println(“count0=”+test.countTokens());
System.out.println(“carry”+test.nextToken());
System.out.println(“count1=”+test.countTokens());
//System.out.println(" " + test.nextToken("*"));
}
输出结果:
count0=3
carryJ-PHONE
count1=2
count0=2
carryVodafone
count1=1
count0=1
carrySoftBank
count1=0
如果代码换成element:
while(test.hasMoreElements()){
System.out.println(“count0=”+test.countTokens());
System.out.println(“obj” + test.nextElement());
System.out.println(“count1=”+test.countTokens());
}
输出的结果是一样:
count0=3
objJ-PHONE
count1=2
count0=2
objVodafone
count1=1
count0=1
objSoftBank
count1=0
但是 需要注意是nextElement()返回是对象类型,不是String类型,需要根据需要转化下
还要说一个StringTokenizer比较不好的地方,就是她的索引无法返回,一旦nextToken 就不能返回了,像上面两种写法同时存在的话,只有第一个循环能有数据输出,第二个循环是不能进去的。如果哪位大侠知道返回的方法请赐教。
语句:
System.out.println(“count0=”+test.countTokens());
System.out.println(“obj=” + test.nextElement());
System.out.println(“next=” + test.nextToken("*"));
System.out.println(“count1=”+test.countTokens());
输出结果:
count0=2
obj=J-PHONE
next=,Vodafone
count1=1
————————————————
版权声明:本文为CSDN博主「shujuboke」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/shujuboke/article/details/76084842