如何在分割后保留分隔符?

问题:如何在分割后保留分隔符?
对中文字符串,用标点符号(如!?:;等)作为分隔符,使用string.split()方法,具体代码如下:
/**********************************************************
* 给段落分句:以句号。、感叹号!、问号?、冒号:、分号;为句子标识符
* @param String paragraph
* @return String[] result
***********************************************************/
public String[] SplitSentence(String paragraph) {
  String[] result = null;
  result = paragraph.split("。|!|?|:|;");
  return result;
}

例如:paragraph="经济实力大幅提升。经济保持平稳快速发展,物价基本稳定。社会主义新农村建设扎实推进,区域发展协调性增强。创新型国家建设进展良好,自主创新能力较大提高。"
希望得到分割后的结果为:
result[0]="经济实力大幅提升";
result[1]="经济保持平稳快速发展,物价基本稳定";
result[2]="社会主义新农村建设扎实推进,区域发展协调性增强";
result[3]="创新型国家建设进展良好,自主创新能力较大提高";

 

 

解答:lhx222 (初级程序员)

/*需要分割的文章*/  
String str = "第一句。第二句!第三句:第四句;第五句。";   
  
/*正则表达式:句子结束符*/  
String regEx=":|。|!|;";    
Pattern p =Pattern.compile(regEx);   
Matcher m = p.matcher(str);   
  
/*按照句子结束符分割句子*/  
String[] words = p.split(str);   
  
/*将句子结束符连接到相应的句子后*/  
if(words.length > 0)   
{   
    int count = 0;   
    while(count < words.length)   
    {   
        if(m.find())   
        {   
            words[count] += m.group();   
        }   
        count++;   
    }   
}   
  
/*输出结果*/  
for(int index = 0; index < words.length; index++)   
{   
    String word = words[index];   
    System.out.println("word = " + word);   
}  

 

你可能感兴趣的:(正则表达式)