Java中字符串的分隔问题 "|" "." "*" "_" 特殊符号解决方案

 

StringTokenizer(字符串分隔解析类型)java.util.StringTokenizer 

功效:将字符串以定界符为界,分析为一个个的token(可理解为单词),定界符可以自己指定。 


1、构造函数。 

1. StringTokenizer(String str) :构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。 
2. StringTokenizer(String str, String delim) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符。如new StringTokenizer("A|001:B|002:C|003",":"); 
3. StringTokenizer(String str, String delim, boolean returnDelims) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。 
2、方法。 
说明: 
1. 所有方法均为public; 
2. 书写格式:[修饰符] <返回类型> <方法名([参数列表]) 

1. int countTokens() :返回nextToken方法被调用的次数。如果采用构造函数1和2,返回的就是分隔符数量(例2)。 
2. boolean hasMoreTokens() :返回是否还有分隔符。 
3. boolean hasMoreElements() :结果同2。 
4. String nextToken() :返回从当前位置到下一个分隔符的字符串。 
5. Object nextElement() :结果同4。 
6. String nextToken(String delim) :与4类似,以指定的分隔符返回结果。 
3、例子。() split 与 StringTokenizer 的萧萧区别! 

import java.util.StringTokenizer; 
public class StringTokenizerDemo 

public static void main(String args[]) 

String str="100|66,55:200|567,90:102|43,54"; 
String abc="A|B|C|D"; 
StringTokenizer strToke=new StringTokenizer(str,":");//默认不打印分隔符 
//StringTokenizer strToke=new StringTokenizer(str,":",true);//打印分隔符 
//StringTokenizer strToke=new StringTokenizer(str,":",false);//不打印分隔符 
int size=strToke.countTokens();//3 & 5 
System.out.println("strToke count = "+size); 
while(strToke.hasMoreElements()) 

System.out.println(strToke.nextToken()); 
//System.out.println(strToke.nextElement()); //效果同上 

//String[] str_abc=str.split("\\|");//结果与StringTokenizer一样 
String[] str_abc=str.split("|");//得到不同的结果 
for(int i=0;i<str_abc.length;i++) 

System.out.println(str_abc[i]); 





No. 2 
zz from http://77857.blog.51cto.com/67857/142324 

<!>比较两种表示法利用split函数:String s = new String("2_8_7_4_3_9_1"); 
String[] arr = s.split("_"); 
●利用StringTokenizer类:String s = new String("2_8_7_4_3_9_1"); 
StringTokenizer commaToker = new StringTokenizer(s, "_"); 
String[] arr = new String[commaToker.countTokens()]; 
<2>split用法详解在java.lang包中有String.split()方法,返回是一个数组 
我在应用中用到一些,给大家总结一下,仅供大家参考: 
1、如果用“.”作为分隔的话,必须是如下写法:String.split("\\."),这样才能正确的分隔开,不能用String.split("."); 
2、如果用“|”作为分隔的话,必须是如下写法:String.split("\\|"),这样才能正确的分隔开,不能用String.split("|"); 
“.”和“|”都是转义字符,必须得加"\\"; 
3、如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acount=? and uu =? or n=?”,把三个都分隔出来,可以用String.split("and|or"); 
测试程序如下:public class StringSplit { /** 
* @param args 
*/ 
public static void main(String[] args) { 
// TODO Auto-generated method stub 
String a="acount=? and uu =? or n=?"; 
String b[]=a.split("and|or"); 
for(int i=0;i<=b.length;i++) 

System.out.println(b[i]); 
}   }} 
输出结果:acount=? 
uu =? 
n=? 
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 3 
at com.ljj.string.StringSplit.main(StringSplit.java:14) 

No.3 


String.split方法 

使用String.split方法时要注意的问题在使用String.split方法分隔字符串时,分隔符如果用到一些特殊字符,可能会得不到我们预期的结果。我们看jdk doc中说明public String[] split(String regex)Splits this string around matches of the given regular expression.参数regex是一个 regular-expression的匹配模式而不是一个简单的String,他对一些特殊的字符可能会出现你预想不到的结果,比如测试下面的代码:用竖线 | 分隔字符串,你将得不到预期的结果String[] aa = "aaa|bbb|ccc".split("|"); 
//String[] aa = "aaa|bbb|ccc".split("\\|"); 这样才能得到正确的结果for (int i = 0 ; i System.out.println("--"+aa); 
}用竖 * 分隔字符串运行将抛出java.util.regex.PatternSyntaxException异常,用加号 + 也是如此。String[] aa = "aaa*bbb*ccc".split("*"); 
//String[] aa = "aaa|bbb|ccc".split("\\*"); 这样才能得到正确的结果for (int i = 0 ; i System.out.println("--"+aa); 
}显然,+ * 不是有效的模式匹配规则表达式,用"\\*" "\\+"转义后即可得到正确的结果。"|" 分隔串时虽然能够执行,但是却不是预期的目的,"\\|"转义后即可得到正确的结果。还有如果想在串中使用"\"字符,则也需要转义.首先要表达"aaaa\bbbb"这个串就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果:String[] aa = "aaa\\bbb\\bccc".split("\\\\");

你可能感兴趣的:(java)