Java中字符串的分隔问题 "|" "." "*" "_" 特殊符号解决方案

StringTokenizer(字符串分隔解析类型)java.util.StringTokenizer

功效:将字符串以定界符为界,分析为一个个的token(可理解为单词),定界符可以自己指定。


1、构造函数。

1. StringTokenizer(String str) :构造一个用来解析str的StringTokenizer对象。java默认的分隔符是“空格”、“制表符(‘\t’)”、“换行符(‘\n’)”、“回车符(‘\r’)”。
2. StringTokenizer(String str, String delim) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符。如new StringTokenizer("A|001:B|002:C|003",":");
3. StringTokenizer(String str, String delim, boolean returnDelims) :构造一个用来解析str的StringTokenizer对象,并提供一个指定的分隔符,同时,指定是否返回分隔符。
2、方法。
说明:
1. 所有方法均为public;
2. 书写格式:[修饰符] <返回类型> <方法名([参数列表])

1. int countTokens() :返回nextToken方法被调用的次数。如果采用构造函数1和2,返回的就是分隔符数量(例2)。
2. boolean hasMoreTokens() :返回是否还有分隔符。
3. boolean hasMoreElements() :结果同2。
4. String nextToken() :返回从当前位置到下一个分隔符的字符串。
5. Object nextElement() :结果同4。
6. String nextToken(String delim) :与4类似,以指定的分隔符返回结果。
3、例子。() split 与 StringTokenizer 的萧萧区别!

import java.util.StringTokenizer;
public class StringTokenizerDemo
{
public static void main(String args[])
{
String str="100|66,55:200|567,90:102|43,54";
String abc="A|B|C|D";
StringTokenizer strToke=new StringTokenizer(str,":");//默认不打印分隔符
//StringTokenizer strToke=new StringTokenizer(str,":",true);//打印分隔符
//StringTokenizer strToke=new StringTokenizer(str,":",false);//不打印分隔符
int size=strToke.countTokens();//3 & 5
System.out.println("strToke count = "+size);
while(strToke.hasMoreElements())
{
System.out.println(strToke.nextToken());
//System.out.println(strToke.nextElement()); //效果同上
}
//String[] str_abc=str.split("\\|");//结果与StringTokenizer一样
String[] str_abc=str.split("|");//得到不同的结果
for(int i=0;i<str_abc.length;i++)
{
System.out.println(str_abc[i]);
}
}
}


No. 2
zz from http://77857.blog.51cto.com/67857/142324

<!>比较两种表示法利用split函数:String s = new String("2_8_7_4_3_9_1");
String[] arr = s.split("_");
●利用StringTokenizer类:String s = new String("2_8_7_4_3_9_1");
StringTokenizer commaToker = new StringTokenizer(s, "_");
String[] arr = new String[commaToker.countTokens()];
<2>split用法详解在java.lang包中有String.split()方法,返回是一个数组
我在应用中用到一些,给大家总结一下,仅供大家参考:
1、如果用“.”作为分隔的话,必须是如下写法:String.split("\\."),这样才能正确的分隔开,不能用String.split(".");
2、如果用“|”作为分隔的话,必须是如下写法:String.split("\\|"),这样才能正确的分隔开,不能用String.split("|");
“.”和“|”都是转义字符,必须得加"\\";
3、如果在一个字符串中有多个分隔符,可以用“|”作为连字符,比如:“acount=? and uu =? or n=?”,把三个都分隔出来,可以用String.split("and|or");
测试程序如下:public class StringSplit { /**
* @param args
*/
public static void main(String[] args) {
// TODO Auto-generated method stub
String a="acount=? and uu =? or n=?";
String b[]=a.split("and|or");
for(int i=0;i<=b.length;i++)
{
System.out.println(b[i]);
}   }}
输出结果:acount=?
uu =?
n=?
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 3
at com.ljj.string.StringSplit.main(StringSplit.java:14)

No.3


String.split方法

使用String.split方法时要注意的问题在使用String.split方法分隔字符串时,分隔符如果用到一些特殊字符,可能会得不到我们预期的结果。我们看jdk doc中说明public String[] split(String regex)Splits this string around matches of the given regular expression.参数regex是一个 regular-expression的匹配模式而不是一个简单的String,他对一些特殊的字符可能会出现你预想不到的结果,比如测试下面的代码:用竖线 | 分隔字符串,你将得不到预期的结果String[] aa = "aaa|bbb|ccc".split("|");
//String[] aa = "aaa|bbb|ccc".split("\\|"); 这样才能得到正确的结果for (int i = 0 ; i System.out.println("--"+aa);
}用竖 * 分隔字符串运行将抛出java.util.regex.PatternSyntaxException异常,用加号 + 也是如此。String[] aa = "aaa*bbb*ccc".split("*");
//String[] aa = "aaa|bbb|ccc".split("\\*"); 这样才能得到正确的结果for (int i = 0 ; i System.out.println("--"+aa);
}显然,+ * 不是有效的模式匹配规则表达式,用"\\*" "\\+"转义后即可得到正确的结果。"|" 分隔串时虽然能够执行,但是却不是预期的目的,"\\|"转义后即可得到正确的结果。还有如果想在串中使用"\"字符,则也需要转义.首先要表达"aaaa\bbbb"这个串就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果:String[] aa = "aaa\\bbb\\bccc".split("\\\\");

你可能感兴趣的:(java)