比 StringTokenizer 更加优化的字符串分割


  上篇文中说到,StringTokenizer 是相对比较快的字符分割方法,split和正则表达式 是java 建议的使用方法,subString 在原始字符串很大,切割操作又被高频使用的情况下很容易出现 内存溢出的情况。但是 substring 确实执行的很快,字符串操作中 还有其他方法比如 indexOf 执行的也非常高效,我们是不是可以自己组合,使用高效方法同时避免内存溢出。实例代码仍然采用 前一篇文中的代码。




 

package String;

import java.util.StringTokenizer;

public class StringTokenizerDemo {

	public static void main(String[] args) {

		StringBuffer sb = new StringBuffer();
		for(int i=0;i<10000;i++){
			sb.append(i);
			sb.append(";");
		}
		long begin = System.currentTimeMillis();
//		StringTokenizerDemo.split(sb.toString());// 15665
		StringTokenizerDemo.token(sb.toString());//6679
		System.out.println(System.currentTimeMillis()-begin);
	}

	public static void split(String str){
		for(int i=0;i<10000;i++){
			str.split(";");
		}
	}

	public static void token(String str){
		StringTokenizer st = new StringTokenizer(str,";");
		for(int i=0;i<10000;i++){
			while(st.hasMoreTokens()){
				st.nextToken();
			}
					}
	}

}

   


上面这段代码,使用原始的 split方法  耗时 15665, 使用StringTokenizer 耗时 多集中在 58,如果处理得当,我们可以试试 我们自己的组合方法(index和substirng) 看下面代码。



package String;

import java.util.StringTokenizer;

public class StringTokenizerDemo {

	public static void main(String[] args) {

		StringBuffer sb = new StringBuffer();
		for(int i=0;i<10000;i++){
			sb.append("sb-"+i);
			sb.append(";");
		}
		long begin = System.currentTimeMillis();
//		StringTokenizerDemo.split(sb.toString());// 15665
		StringTokenizerDemo.token(sb.toString());//58
//		StringTokenizerDemo.indexSubstring(sb.toString());//56
		System.out.println(System.currentTimeMillis()-begin);
	}

	public static void indexSubstring(String str){
		for(int i=0;i<10000;i++){
			while(true){
				int index = str.indexOf(";");
				if(index<0)
					break;
				System.out.println(str.substring(0, index));
				str = str.substring(index+1);
			}
		}
	}

	public static void split(String str){
		for(int i=0;i<10000;i++){
			System.out.println(str.split(";")[i]);
		}
	}

	public static void token(String str){
		StringTokenizer st = new StringTokenizer(str,";");
		for(int i=0;i<10000;i++){
			while(st.hasMoreTokens()){
				System.out.println(st.nextToken());
			}
		}
	}

}




多执行几次,你会发现 组合使用的方法  甚至比 StringTokenizer 还要快,多集中在 55-56,组合方式 避免了内存溢出 和 空间浪费,是高频调用的良方。

你可能感兴趣的:(StringTokenizer)