Java指定几个标点符号(或分割)分割字符

应用背景

在做Sentence-LDA处理时,需要将文本数据按照句子分割。通常分割句子(英文)需要使用句号,问号和叹号。

Java案例

package sentencedeal;

public class Test {

	public static void main(String[] args) {
		String line = "I ordered this ? because my original battery ! cover to my. droid x2";
		String[] after = line.split("[?!.]");
		for (int i = 0; i < after.length; i++) {
			System.out.println(after[i].trim());
		}
	}
}


上述代码的运行结果,如下图所示。

Java指定几个标点符号(或分割)分割字符_第1张图片

你可能感兴趣的:(java,主题模型,Sentence-LDA,Java正则表达式)