理解String 及 String.intern()的区别

一、String设计的初衷:

Java中的String被设计成不可变的,出于以下几点考虑:

1. 字符串常量池的需要。字符串常量池的诞生是为了提升效率和减少内存分配。可以说我们编程有百分之八十的时间在处理字符串,而处理的字符串中有很大概率会出现重复的情况。正因为String的不可变性,常量池很容易被管理和优化。

2. 安全性考虑。正因为使用字符串的场景如此之多,所以设计成不可变可以有效的防止字符串被有意或者无意的篡改。从java源码中String的设计中我们不难发现,该类被final修饰,同时所有的属性都被final修饰,在源码中也未暴露任何成员变量的修改方法。(当然如果我们想,通过反射或者Unsafe直接操作内存的手段也可以实现对所谓不可变String的修改)。

3. 作为HashMap、HashTable等hash型数据key的必要。因为不可变的设计,jvm底层很容易在缓存String对象的时候缓存其hashcode,这样在执行效率上会大大提升。

 

二、关于String的基本知识

       1. 首先String不属于8种基本数据类型,String是一个对象。 
     因为对象的默认值是null,所以String的默认值也是null;但它又是一种特殊的对象,有其它对象没有的一些特性。 

  2. new String()和new String(“”)都是申明一个新的空字符串,是空串不是null; 

  3. String str=”kvill”; 
    String str=new String (“kvill”);的区别: 

  在这里,我们不谈堆,也不谈栈,只先简单引入常量池这个简单的概念。 
  常量池(constant pool)指的是在编译期被确定,并被保存在已编译的.class文件中的一些数据。它包括了关于类、方法、接口等中的常量,也包括字符串常量。 

看例1: 

String s0=”kvill”; 
String s1=”kvill”; 
String s2=”kv” + “ill”; 
System.out.println( s0==s1 ); 
System.out.println( s0==s2 );

结果为: 

true 
true

  首先,我们要知道Java会确保一个字符串常量只有一个拷贝。 
  因为例子中的s0和s1中的”kvill”都是字符串常量,它们在编译期就被确定了,所以s0==s1为true;而”kv”和”ill”也都是字符串常量,当一个字符串由多个字符串常量连接而成时,它自己肯定也是字符串常量,所以s2也同样在编译期就被解析为一个字符串常量,所以s2也是常量池中”kvill”的一个引用。 
  所以我们得出s0==s1==s2; 


  用new String() 创建的字符串不是常量,不能在编译期就确定,所以new String() 创建的字符串不放入常量池中,它们有自己的地址空间。

例2:

String s0=”ab”; 
String s1=new String(”ab”); 
String s2=”a” + new String(“b”); 
System.out.println( s0==s1 ); 
System.out.println( s0==s2 ); //false
System.out.println( s1==s2 );

        
String s3="a"+"b";
System.out.println("s0==s3:"+(s0==s3));//true

String temp=new String("b");
String s4="a"+ temp;
System.out.println("s0==s4:"+(s0==s4));//fasle

结果为: 

false 
false 
false

s0==s3:true
s0==s4:false

例2中s0还是常量池中”ab”的应用,s1因为无法在编译期确定,所以是运行时创建的新对象”ab”的引用,s2因为有后半部分new String(“b”)所以也无法在编译期确定,所以也是一个新创建对象”ab”的应用;s3虽然是动态拼接出来的字符串,但是所有参与拼接的部分都是已知的字面量,在编译期间,这种拼接会被优化,编译器直接帮你拼好,因此String s3 = "a" + "b";在class文件中被优化成String s3 = "ab";

注:字符串直接常量相加的时候,例如: String c = "ab" + "cd";  其中的ab/cd只要有任何一个不是字符串字面常量形式,都不会在常量池生成"abcd". 且此时jvm做了优化,不会同时生成"ab"和"bcd"在字符串常量池中。

三、String.intern() 

       当调用 intern 方法时,如果池已经包含一个等于此 String 对象的字符串(用 equals(Object) 方法确定),则返回池中的字符串。否则,将此 String 对象添加到池中,并返回此 String 对象的引用。 
      它遵循以下规则:对于任意两个字符串 s 和 t,当且仅当 s.equals(t) 为 true 时,s.intern() == t.intern() 才为 true。 

      使用String.intern()得到的是常量池的字符串,也就是说两个String对象只要值相等,intern()返回的值就相等。

 

注:
  存在于.class文件中的常量池(像String name="king",则是直接在编译期间就将常量字符串"king"加入到class文件的常量池中),在运行期被JVM装载,并且可以扩充。String的intern()方法就是扩充常量池的一个方法;运行时常量池相对于CLass文件常量池的另外一个重要特征是具备动态性,Java语言并不要求常量一定只有编译期才能产生,也就是并非预置入CLass文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的就是String类的intern()方法。当一个String实例str调用intern()方法时,Java查找常量池中是否有相同Unicode的字符串常量,如果有,则返回其的引用,如果没有,则在常量池中增加一个Unicode等于str的字符串并返回它的引用;

例3

String s0= “kvill”; 
String s1=new String(”kvill”); 
String s2=new String(“kvill”); 
System.out.println( s0==s1 ); 
System.out.println( “**********” ); 
s1.intern(); 
s2=s2.intern(); //把常量池中“kvill”的引用赋给s2 
System.out.println( s0==s1); 
System.out.println( s0==s1.intern() ); 
System.out.println( s0==s2 );

结果为: 

false 
********** 
false //虽然执行了s1.intern(),但它的返回值没有赋给s1 
true //说明s1.intern()返回的是常量池中”kvill”的引用 
true

 

最后我再破除一个错误的理解:   

  有人说,“使用String.intern()方法则可以将一个String类的保存到一个全局String表中,如果具有相同值的Unicode字符串已经在这个表中,那么该方法返回表中已有字符串的地址,如果在表中没有相同值的字符串,则将自己的地址注册到表中“如果我把他说的这个全局的String表理解为常量池的话,他的最后一句话,“如果在表中没有相同值的字符串,则将自己的地址注册到表中”是错的:   

String s1=new String("kvill"); 
String s2=s1.intern(); 
System.out.println( s1==s1.intern() ); 
System.out.println( s1+" "+s2 ); 
System.out.println( s2==s1.intern() );

结果:

false 
kvill kvill 
true

在这个类中我们没有声名一个”kvill”常量,所以常量池中一开始是没有”kvill”的,当我们调用s1.intern()后就在常量池中新添加了一个”kvill”常量,原来的不在常量池中的”kvill”仍然存在,也就不是“将自己的地址注册到常量池中”了。 
  s1==s1.intern()为false说明原来的“kvill”仍然存在; 
  s2现在为常量池中“kvill”的地址,所以有s2==s1.intern()为true。 

参考链接:

https://www.cnblogs.com/Qian123/p/5707154.html

https://www.cnblogs.com/Kidezyq/p/8040338.html?tdsourcetag=s_pctim_aiomsg

你可能感兴趣的:(Java基础知识,面试常见问题总结)