Java字符串操作及处理

http://blog.csdn.net/pipisorry/article/details/43303145

Java字符串操作

两个字符串比较大小compareTo()

使用 String.compareTo 方法:
compareTo() 的返回值是int, 它是先比较对应字符的大小(ASCII码顺序)
1、如果字符串相等返回值0
2、如果第一个字符和参数的第一个字符不等,结束比较,返回他们之间的差值(ascii码值)(负值前字符串的值小于后字符串,正值前字符串大于后字符串)
3、如果第一个字符和参数的第一个字符相等,则以第二个字符和参数的第二个字符做比较,以此类推,直至比较的字符或被比较的字符有一方全比较完,这时就比较字符的长度. 

String s1 = "abc"; 
String s2 = "abcd"; 
String s3 = "abcdfg"; 
String s4 = "1bcdfg"; 
String s5 = "cdfg"; 
System.out.println( s1.compareTo(s2) ); // -1 (前面相等,s1长度小1) 
System.out.println( s1.compareTo(s3) ); // -3 (前面相等,s1长度小3) 
System.out.println( s1.compareTo(s4) ); // 48 ("a"的ASCII码是97,"1"的的ASCII码是49,所以返回48)
System.out.println( s1.compareTo(s5) ); // -2 ("a"的ASCII码是97,"c"的ASCII码是99,所以返回-2)

字符串相加+

String a = 1+"d"+2;

其中也可以有int等等类型

字符串分割split()

sourceStr.split(regex,maxSplit)

String[] sourceStrArray = sourceStr.split(",");

[java.lang.String 的 split() 方法]

字符串子串substring()

public String substring(int beginIndex, int endIndex)
第一个int为开始的索引,对应String数字中的开始位置,
第二个是截止的索引位置,对应String中的结束位置
1、取得的字符串长度为:endIndex - beginIndex;
2、从beginIndex开始取,到endIndex结束,从0开始数,其中不包括endIndex位置的字符
如:"hamburger".substring(4, 8) returns "urge"
取长度大于等于3的字符串a的后三个子字符串,只需a.subString(a.length()-3, a.length());

Java获取指定位置上字符charAt()

char c = string.charAt(int index);

皮皮blog



Java字符串处理

java判断字符串包含某个字符段

1. 用indexOf()方法

     String str = "1234567";

     if(str.indexOf("23") != -1) {
     System.out.println("包含该字符串");

     }


    public void test1() {

        String string = "good morning everyone";
        String sub = "morning";
        int a = string.indexOf(sub);

        if (a >= 0) {
            System.out.println("morning在字符串中的位置:" + a);
            String ss1 = string.substring(0, a + sub.length());
            String ss2 = string.substring(a + sub.length(), string.length());
            System.out.println("你需要的结果是:" + ss1);
            System.out.println("删掉的字符是:" + ss2);
        } else {
            System.out.println("不存在");
        }
    }

2. 用repalce()方法

public class Test {
  public static void main(String[] args) {

   String s1 = "abc";
   String s2 = "1111abcdefe"; 

   if(s2.contains(s1)){
    System.out.println("s2包含了s1");    //删掉s1
    s2 = s2.replace(s2.substring(s2.indexOf(s1), s2.length()), "");
    System.out.println(s2);
   }else{
    System.out.println("s2不包含s1");
   }
  }
}

Java正则表达式在字符串中插入字符

在字符串中日期1985[.07]-(- ——等等)1988[.12]前面插入句号,已经是 。 :;不插入,是. 等等替换
1.                    // 处理简历中的句号
                    String[] tmpResumeContents = resumeContent
                            .split("[((]*[\\d]{4}.[\\d]{2}[-——-]*[[\\d]{4}.[\\d]{2}]*");// 1985.07-1988.12
                    // for (String tmpResumeContent : tmpResumeContents)
                    // System.err.println("^^^^^^^^^" + tmpResumeContent);
                    StringBuffer original = new StringBuffer(resumeContent);
                    // System.err.println("^^^^^^^^^" + original);
                    for (String tmpResume : tmpResumeContents) {
                        // System.err.println("**************" + tmpResume
                        // +"tmpResume.length(): " + );
                        if (tmpResume.length() != 0
                                && !(original.indexOf(tmpResume) + tmpResume.length() == original.length())
                                && (!(original.toString().charAt(original.indexOf(tmpResume) + tmpResume.length() - 1) + "")
                                        .matches("[。:;]")))
                            if ((original.toString().charAt(original.indexOf(tmpResume) + tmpResume.length() - 1) + "")
                                    .matches("[.,,]")) {
                                // System.err.println("^^^^^^^^^"+(original.toString().charAt(original.indexOf(tmpResume)+
                                // tmpResume.length() - 1)));
                                original.replace(original.indexOf(tmpResume) + tmpResume.length() - 1,
                                        original.indexOf(tmpResume) + tmpResume.length(), "。");
                            } else {
                                int insertPoint = 0;
                                do {
                                    // System.err.println("^^^^^^^^^" +
                                    // original);
                                    // System.err.println("***" + tmpResume);
                                    // System.out.println("***" + insertPoint);
                                    insertPoint = original.indexOf(tmpResume, insertPoint) + tmpResume.length();
                                    // System.out.println("&&&" + insertPoint +
                                    // "&&&" +
                                    // original.toString().charAt(insertPoint));
                                } while ((insertPoint < original.length())
                                        && !(("" + original.toString().charAt(insertPoint)).matches("[\\s]*[\\d((]*")));
                                // System.err.print("***" + tmpResume);
                                // System.err.print("&&&" + insertPoint + "&&&"
                                // + original.toString().charAt(insertPoint)
                                // + "\n");
                                original.insert(insertPoint, "。");
                            }
                    }
                    resumeContent = original.toString();// 因为resumeContent.indexOf要时时更新
                    resumeContent = endWithDot(resumeContent);
                    // System.err.println("***************" + resumeContent);
               
2. lastIndexOf(String str):反向索引  解决可能两次匹配情况

do_while循环解决多次匹配情况

3. 取出日期来匹配,不用日期spilt后的字符串匹配,就没有多次匹配出现了

java判断一个字符串中是否包含某几个字符(使用正则表达式)

1. string.matches(".*[【(个人)]*简\\s*[介历]*[】]*:*.*")

string.charAt(0) + "").matches("[,,]")

note:matches("[;;.::。]")中要有[],否则是匹配整个字符串

2.【http://www.111cn.net/jsp/Java/52101.htm】

JAVA用正则表达式处理字符串

http://blog.163.com/zzcc_8/blog/static/1603547220101111127306/

http://www.cxyclub.cn/n/59606/

Java的java.util.regex包

Java爬虫中文乱码处理

package Test;

import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.net.URLEncoder;

public class EncodeConvert {
    public static void main(String[] args) {
        System.out.println(getencode("赵景山"));
        System.out.println(getDecode("%D5%D4%BE%B0%C9%BD"));
    }

    // 中文转码
    public static String getencode(String str) {
        String encodeStr = null;
        try {
            // 编码类型为gbk
            encodeStr = URLEncoder.encode(str, "gbk");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return encodeStr;
    }

    // 解码
    public static String getDecode(String str) {
        String decodeStr = null;
        try {
            // 编码类型为gbk
            decodeStr = URLDecoder.decode(str, "gbk");
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
        return decodeStr;
    }
}

from:http://blog.csdn.net/pipisorry/article/details/43303145

ref:java中String的七种用法


Java获取指定位置上某个字符

char c = string.charAt(int index);

你可能感兴趣的:(Java)