Java-String那些事

文末有彩蛋!!!!!!

Java-String那些事

String对于广大程序员来说,并不陌生,是我们在编写程序中经常使用到的对象。但是,你真的对String了解吗,使用的方式对吗?

接下来,笔者就对String来进行全面的解析,让你对String有更深入的了解!

更重要的是,面试的时候,虐虐面试官!

String源码(截取)

public final class String 
implements java.io.Serializable, Comparable, CharSequence {

    private final char value[];

    private int hash; // Default to 0

    private static final long serialVersionUID = -6849794470754667710L;
}

通过源码,可以看出String类被final修饰,也就意味着String不能被继承,它其中的方法都默认被final修饰(此特性是final的特点)。也就是说当String对象创建之后,就不能再修改此对象中存储的字符串内容,就是因为如此,才说String类型是不可变的(immutable)

在我们平常创建String对象时,在底层通过char数组来实现。

截取字符串:

public String substring(int beginIndex, int endIndex) {
    if (beginIndex < 0) {
        throw new StringIndexOutOfBoundsException(beginIndex);
    }
    if (endIndex > count) {
        throw new StringIndexOutOfBoundsException(endIndex);
    }
    if (beginIndex > endIndex) {
        throw new StringIndexOutOfBoundsException(endIndex - beginIndex);
    }
    return ((beginIndex == 0) && (endIndex == count)) ? this :
        new String(offset + beginIndex, endIndex - beginIndex, value);
}

拼接两个字符串:

public String concat(String str) {
    int otherLen = str.length();
    if (otherLen == 0) {
        return this;
    }
    int len = value.length;
    char buf[] = Arrays.copyOf(value, len + otherLen);
    str.getChars(buf, len);
    return new String(buf, true);
}

替换字符串中的内容:

public String replace(char oldChar, char newChar) {
    if (oldChar != newChar) {
        int len = count;
        int i = -1;
        char[] val = value; /* avoid getfield opcode */
        int off = offset;   /* avoid getfield opcode */

        while (++i < len) {
        if (val[off + i] == oldChar) {
            break;
        }
        }
        if (i < len) {
        char buf[] = new char[len];
        for (int j = 0 ; j < i ; j++) {
            buf[j] = val[off+j];
        }
        while (i < len) {
            char c = val[off + i];
            buf[i] = (c == oldChar) ? newChar : c;
            i++;
        }
        return new String(0, len, buf);
        }
    }
    return this;
}

截取了String类中的三个常用方法,从这三个方法的返回值中可以看出,无论是substring()、concat()还是replace()方法,他们对字符串的操作都不是在原有字符串上进行的,而是通过一系列操作生成了一个新的字符串对象。

这也符合了我们上面所说的,String类被final修饰不可改变,String对象一单创建就固定不变了,对String对象的任何操作都不会改变原对象,只会新生成一个对象。

Java-String那些事_第1张图片
image

创建String对象

在Java程序中,创建String对象有两种形式,一种叫做字面量形式,例如:String str = "jiaboyan";一种叫做构造形式,也就是我们通常的new对象,例如:String str = new String("jiaboyan");

无论是字面量,还是构造形式,在我们编码时都经常使用,尤其是前者。但是,这两种实现方式在性能和内存上却有着不小的差别。

采用字面值的方式赋值:

public static void test1(){
    String str1 = "jiaboyan";
    String str2 = "jiaboyan";
    System.out.println("test1比较结果为:"+ (str1 == str2));//true
    //System.out.println("test1比较结果为:"+ str1 == str2);//false 注意此种写法
}

执行String str1 = "jiaboyan",程序会去字符串常量池中中查找是否存在"jiaboyan"。如果不存在,则在字符串常量池中创建"jiaboyan",并将“jiaboyan”的引用地址返回给str1,也就是说str1拿到了字符串常量池中“jiaboyan”的引用。如果存在,则不创建任何字符串,直接将池中"jiaboyan"引用地址返回赋给所属变量。当创建字符串对象str2时,字符串池中已经存在"jiaboyan",此时会直接把对象"jiaboyan"的引用地址返回给str2。

采用new关键字新建一个字符串对象:

public static void test2(){
    String str1 = new String("jiaboyan");
    String str2 = new String("jiaboyan");
    System.out.println("test2比较结果为:"+ (str1 == str2));//false
}

采用new方式创建对象,执行String str1 = new String("jiaboyan"),程序会在字符串常量池中查找有没有"jiaboyan"这个字符串,如果有,则不在字符串常量池中创建"jiaboyan",直接在堆中创建一个"jiaboyan"字符串对象,然后将堆中的这个"jiaboyan"对象的地址返回给str1;如果没有,则首先在字符串常量池中创建一个"jiaboyan"字符串,然后再在堆中创建一个"jiaboyan"字符串对象,然后将堆中的这个"jiaboyan"对象的地址返回给str2。此时,str1和str2所指向不同的堆内存区域,使用==比较返回为false。

两种创建方式比较:

public static void compare(){
    String str1 = "jiaboyan";
    String str2 = new String("jiaboyan");
    System.out.println("compare比较结果为:"+ (str1 == str2));//false
}

根据前面的2个例子,可以得出,当我们在创建str1的对象时,实际上程序会去字符串常量池中去创建“jiaboyan”,而当程序执行到str2时,会首先检查字符串常量池中是否存在,若存在则直接在堆内存中创建一个字符串对象;若不存在,则首先在字符串常量池中创建“jiaboyan”,再在堆内存中创建字符串对象。所以,当两者进行比较时,实际上内存地址是不同的。

编译期确定:

public static void test3(){
    String str1 = "jiaboyan";
    String str2 = "jiaboyan";
    String str3 = "jia"+"boyan";
    System.out.println("test3比较结果为:"+ (str1 == str2)); //true
    System.out.println("test3比较结果为:"+ (str1 == str3)); //true
}

str1和str2的原理跟第一个例子相同,不在过多陈述。在str3中,两个字符串拼接起来合成一个字符串,在编译期做了拼接处理,被解析成了一个字符串常量,所以str3在运行期间是以一个整体"jiaboyan"在进行比较,结果为true;

使用javap命令,可以查看到test3()在编译期的处理情况。或者通过查看生成的.class文件。

Java-String那些事_第2张图片
image

编译期无法确定:

public static void test4(){
    String str1 = "jiaboyan";
    String str2 = new String("jiaboyan");
    String str3 = "jia" + new String("boyan");
    System.out.println("test4比较结果为:"+ ( str1==str2 )); //false
    System.out.println( "test4比较结果为:"+ (str1==str3 )); //false
    System.out.println( "test4比较结果为:"+ (str2==str3 )); //false
}

str1和str2的结果,上面的例子已经说明。str1在编译器可以确定,只会在字符串常量池中创建。str2在运行期,会在堆中对象。str3在编译期无法确定内容,所以编译时候无法进行优化拼接,直到运行时才可确定,并生成新的对象在堆中。

编译期无法确定:

public static void test5(){
    String str1 = "jia";
    String str2 = "boyan";
    String str3 = str1 + str2;
    System.out.println("test5比较结果为:"+ (str3 == "jiaboyan")); //false
}

String str3 = str1 + str2在编译器无法确定,所以无法做拼接优化。只能等到真正运行时,才能确定。所以当str3 == "jiaboyan"时,结果为false,因为一个在堆中创建,一个在字符串常量池中。此外,str3虽然无法在堆中做拼接优化,但是str3在编译期还是做了代码优化,使用的是StringBuilder。具体,请看.class文件:

Java-String那些事_第3张图片
image

两个在编译期无法确认的String,在编译后是通过StringBuilder对象的append()进行处理的,最后在调用toString()将结果返回给str3。所以,在代码中要么就使用全字符串拼接,要不就别拼接。

编译期确定:

public static void test6(){
    final String str1 = "jia";
    final String str2 = "boyan";
    String str3 = str1 + str2;
    System.out.println("test6比较结果为:"+ (str3 == "jiaboyan"));//true
}

回顾下final的含义,当用final修饰一个类时,表明这个类不能被继承。当用final修饰一个变量时,如果是基本数据类型的变量,则其数值一旦在初始化之后便不能更改;如果是引用类型的变量,则在对其初始化之后便不能再让其指向另一个对象。

在编译期间,由于str1和str2使用了final修饰,所以编译器知道该对象不可改变,所以当编译到str3时,会进行代码优化,直接将str1和str2进行字符串拼接,形成一个“jiaboyan”字符串。当执行比较时为true.

Java-String那些事_第4张图片
image

编译期无法确定:

public static void test7(){
    final String str1 = "jia";
    final String str2 = get();
    String str3 = str1 + str2;
    System.out.println("test6比较结果为:"+ (str3 == "jiaboyan"));//false
}

public static String get(){
    return "boyan";
}

与上面的例子类似,两个变量str1和str2都用了final修饰。不同的是,str2的值是通过方法来获得。在编译期间,无法确定最终的值,只能在运行时确定,因此str3和“jiaboyan”指向的是不同的内存区域。str3指向了堆中的内存地址,而“jiaboyan”指向的是字符创常量池中。

编译期无法确定:

public static void test8(){
    String str1 = "bo";
    String str2 = "yan";
    String str3 = "jia" + "www" + str1 + "qqq" + "xxx" + str2;
}

与前面的例子类似,本例子算是对上面的一个总结。在我们的程序中,是直接拼接字符串,还是字符串和变量共同连接使用。

通过,编译后的class文件来看,str3中使用了StringBuild来处理字符串之间的拼接,最后在通过toString的方式来返回给str3;

在字符串变量中,使用 + 连接符进行连接时,在编译期间,连接操作会将最左侧的字符串拼接,并创建StringBuilder对象,然后依次对右边进行append操作,最后将StringBuilder对象通过toString()方法转换成String对象。当使用 + 进行多个字符串连接时,实际上是产生了一个StringBuilder对象和一个String对象。

Java-String那些事_第5张图片
image

equals() 和 ==

关于 == 和 equals() 的使用,也是我们面试/日常工作中经常遇到的。对于这两种比较方式,我们需要有一个清晰的理解。

对于 == 来说,如果比较的是基本类型,例如:byte,short,char,int,long,float,double,boolean,那么实际比较的就是该变量真实值是否相同。但,如果比较的是引用类型,例如:new ArrayList(),new Obeject,那么实际比较的该变量实际在内存中的地址。

对于equals()来说,equals()是基类Object中定义的方法,所有对象都默认继承该类,所以也就默认继承了equals()方法。对于默认equals()来说,实际比较的两个对象在内存中的地址是否相同。

值得注意的是,由于equals()方法可以被重写,所以当类中对equals()重写时候,需要单独关注。例如:String类中就对对equals()进行了重写,实际比较的就是两个字符串中内容是否相同,而不是真实的内存地址。

String.intern()

在String类中,有一个intern()方法,该方法的作用是将在堆中的字符串,copy一份存放到字符串常量池中,设计的初衷其实是为了节省内存的使用,提高程序的性能,可以让程序重用String。

代码如下:

public class test {

    public static void main(String[] agrs){
        Integer[] sample = new Integer[10];
        sample[0] = 0;
        sample[1] = 1;
        sample[2] = 2;
        sample[3] = 3;
        sample[4] = 4;
        sample[5] = 5;
        sample[6] = 6;
        sample[7] = 7;
        sample[8] = 8;
        sample[9] = 9;
        String[] arr = new String[10000000];
        long t = System.currentTimeMillis();
        for (int i = 0; i < 10000000; i++) {
            arr[i] = new String(String.valueOf(sample[i % sample.length])).intern();    
            //arr[i] = new String(String.valueOf(sample[i % sample.length]));
        }
        System.out.println("总耗时:" + (System.currentTimeMillis() - t) + "ms");
    }
}

测试结果:

使用intern()方法的耗时,要比不使用intern()的耗时更长;

平均来看:1800ms 5500ms

在Java1.6中,String.intern()在调用后,会将在堆中生成的字符串,copy一份到字符串常量池中,进而在常量池中生成了一个新的对象;而在Java1.7中,String.intern()有所改变,不会在常量池中新生成对象,而是将在堆中的引用复制到常量池中。

将一下代码,分别在Java1.6和Java1.7下去执行:

public class test {

    public static void main(String[] agrs){
        String str1 = new String("1111") + new String("2222");
        str1.intern();
        String str2 = "11112222";
        System.out.println(str1 == str2);
    }
}

测试结果如下:

在Java1.6:false

在Java1.7:true
Java-String那些事_第6张图片
image
Java-String那些事_第7张图片
可伸缩服务架构-框架与中间件

京东购买链接:可伸缩服务架构-框架与中间件

你可能感兴趣的:(Java-String那些事)