String对象的创建过程中的内存分配

String对象的创建过程中的内存分配

1.JVM数据区内存模型

先来了解一下JVM运行时数据区的内存模型。
《深入Java虚拟机》书中是这样描述的:JVM运行时数据区的内存模型由五部分组成:

  1.  方法区(类型信息被存储在一个称为方法区的内存逻辑区中。类型信息是由类加载器在类加载时从类文件中提取出来的。类(静态)变量也存储在方法区中)
  2. 堆(存放所有new出来的对象。)
  3. Java栈(存放基本类型的变量数据和对象的引用,但对象本身不存放在栈中,而是存放在堆(new 出来的对象)或者常量池中(字符串常量对象存放在常量池中。))
  4. PC寄存器(最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.)
  5. 本地方法栈

这里我们主要关心栈,堆和常量池,对于栈和常量池中的对象可以共享,对于堆中的对象不可以共享。栈中的数据大小和生命周期 是可以确定的,当没有引用指向数据时,这个数据就会消失。堆中的对象的由垃圾回收器负责回收,因此大小和生命周期不需要确定,具有很大的灵活性。
对于字符串:其对象的引用都是存储在栈中的,如果是编译期已经创建好(直接用双引号定义的)的就存储在常量池中,如果是运行期(new出来的)才能确定的 就存储在堆中。对于equals相等的字符串,在常量池中永远只有一份,在堆中有多份

2.常量池

虚拟机必须为每个被装载的类型维护一个常量池。常量池就是该类型所用到常量的一个有序集和,包括直接常量(string,integer和 floating point常量)和对其他类型,字段和方法的符号引用。对于string常量,它的值是在常量池中的。而jvm中的常量池在内存当中是以表的形式存在的, 对于string类型,有一张固定长度的constant_string_info表用来存储文字字符串值,注意:该表只存储文字字符串值,不存储符号引 用。

 

对于String s = "hello"

其中"hello"值是在编译的时候就确定下来的,如果改成s = "hello" + 1;将程序编译期,jvm就将常量字符串的"+"连接优化为连接后的值,这里s被优化为"hello1"


而对于String s = new String("hello");

这里"hello"本身就是常量池中的一个对象,而在运行时执行new string()时,将常量池中的对象复制一份放到堆中,并且把堆中的这个对象的引用交给s持有。所以这条语句就创建了2个string对象。

 

 

3.String 常量池问题的几个例子

下面是几个常见例子的比较分析和理解:
【1】

String a = "a1"; String b = "a" + 1; System.out.println((a == b)); //result = true String a = "atrue"; String b = "a" + "true"; System.out.println((a == b)); //result = true String a = "a3.4"; String b = "a" + 3.4; System.out.println((a == b)); //result = true

分析:jvm对于字符串常量的"+"号连接,将程序编译期,jvm就将常量字符串的"+"连接优化为连接后的 值,拿"a" + 1来说,经编译器优化后在class中就已经是a1。在编译期其字符串常量的值就确定下来,故上面程序最终的结果都为true。

【2】

String a = "ab"; String bb = "b"; String b = "a" + bb; System.out.println((a == b)); //result = false

分析:jvm对于字符串引用,由于在字符串的"+"连接中,有字符串引用存在,而引用的值在程序编译期是无法确 定的,即"a" + bb无法被编译器优化,只有在程序运行期来动态分配并将连接后的新地址赋给b。所以上面程序的结果也就为false。

【3】

String a = "ab"; final String bb = "b"; String b = "a" + bb; System.out.println((a == b)); //result = true


分析:和[3]中唯一不同的是bb字符串加了final修饰,对于final修饰的变量,它在编译时被解析为常 量值的一个本地拷贝存储到自己的常量池中或嵌入到它的字节码流中。所以此时的"a" + bb和"a" + "b"效果是一样的。故上面程序的结果为true。
【4】

String a = "ab"; final String bb = getbb(); String b = "a" + bb; System.out.println((a == b)); //result = false private static string getbb() { return "b"; }


分析:jvm对于字符串引用bb,它的值在编译期无法确定,只有在程序运行期调用方法后,将方法的返回值 和"a"来动态连接并分配地址为b,故上面程序的结果为false。

通过上面4个例子可以得出得知:
string s = "a" + "b" + "c";  
就等价于string s = "abc";  

string a = "a";  
string b = "b";  
string c = "c";  
string s = a + b + c;  
这个就不一样了,最终结果等于:  
stringbuffer temp = new stringbuffer();  
temp.append(a).append(b).append(c);  
string s = temp.tostring();
由上面的分析结果,可就不难推断出string 采用连接运算符(+)效率低下原因分析,形如这样的代码:

public class test { public static void main (String args[]) { String s = null; for (int i = 0; i < 100; i++) { s += "a"; } } }

每做一次 + 就产生个stringbuilder对象,然后append后就扔掉。下次循环再到达时重新产生个stringbuilder对象,然后 append 字符串,如此循环直至结束。 如果我们直接采用 stringbuilder 对象进行 append 的话,我们可以节省 n - 1 次创建和销毁对象的时间。所以对于在循环中要进行字符串连接的应用,一般都是用stringbuffer或stringbulider对象来进行 append操作。

string对象的intern方法理解和分析:

public class test4 { private static String a = "ab"; public static void main (String[] args){ String s1 = "a"; String s2 = "b"; String s = s1 + s2; System.out.println(s == a);//false System.out.println(s.intern() == a);//true } }


这里用到java里面是一个常量池的问题。对于s1+s2操作,其实是在堆里面重新创建了一个新的对象,s保存 的是这个新对象在堆空间的的内容,所以s与a的值是不相等的。而当调用s.intern()方法,却可以返回s在常量池中的地址值,因为a的值存储在常量 池中,故s.intern和a的值相等。

 

你可能感兴趣的:(jvm,优化,String,存储,Class,编译器)