String定义
- String是final类,派生类不可继承
- String是char的集合,它的value其实就是char数组
public final class String
implements java.io.Serializable, Comparable, CharSequence {
/** The value is used for character storage. */
private final char value[];
/** Cache the hash code for the string */
private int hash; // Default to 0
}
String特点
String的值发生变化都会导致对象引用发生变化,简单介绍就是new,例如:
public String replace(char oldChar, char newChar) {
if (oldChar != newChar) {
int len = value.length;
int i = -1;
char[] val = value; /* avoid getfield opcode */
while (++i < len) {
if (val[i] == oldChar) {
break;
}
}
if (i < len) {
char buf[] = new char[len];
for (int j = 0; j < i; j++) {
buf[j] = val[j];
}
while (i < len) {
char c = val[i];
buf[i] = (c == oldChar) ? newChar : c;
i++;
}
return new String(buf, true);//值发生变化时,new String
}
}
return this;//未发生值变化
}
public String substring(int beginIndex, int endIndex) {
if (beginIndex < 0) {
throw new StringIndexOutOfBoundsException(beginIndex);
}
if (endIndex > value.length) {
throw new StringIndexOutOfBoundsException(endIndex);
}
int subLen = endIndex - beginIndex;
if (subLen < 0) {
throw new StringIndexOutOfBoundsException(subLen);
}
return ((beginIndex == 0) && (endIndex == value.length)) ? this
: new String(value, beginIndex, subLen);//值发生变化时,new String
}
到String类中查看所有值操作方法就会发现,值发生变化都会导致对象引用发生变化,这里就不一一列举。
String问题及解析
问题1:观察下面代码,main方法中生成对象的个数?
public static void main(String[] args) {
String a = "test122222";
String b = "test122222";
}
分析:
笔者使用的是Mac OS,当前目录在该文件Test.java所在目录。
编译Test.java命令:
$ javac Test.java
对代码进行反汇编:
$ javap -c Test
class Test {
public static void main(java.lang.String[]);
Code:
0: ldc #2 // String test122222
2: astore_1
3: ldc #2 // String test122222
5: astore_2
6: return
}
观察,两次字节码指令ldc操作,都使用同一个资源String test122222,初步结论:生成一个对象。
继续,使用命令jps,jmap,jhat去分析
为方便分析,main方法中加入Thread.sleep代码:
class Test {
public static void main(String[] args) {
String a = "test122222";
String b = "test122222";
try {
Thread.sleep(3000000);
} catch (Exception e) {
}
}
}
查看Java运行进程PID命令:
$ jps
1363
5396 Launcher
5397 Test
5400 Jps
2239 Main
生成dump文件命令:
$ jmap -dump:format=b,file=/Users/lubixin/test/dump_test 5397
Dumping heap to /Users/lubixin/test/dump_test ...
Heap dump file created
使用jhat分析dump文件命令:
$ jhat /Users/lubixin/test/dump_test
Reading from /Users/lubixin/test/dump_test...
Dump file created Sun Feb 24 15:19:41 CST 2019
Snapshot read, resolving...
Resolving 20503 objects...
Chasing references, expect 4 dots....
Eliminating duplicate references....
Snapshot resolved.
Started HTTP server on port 7000
Server is ready.
默认7000端口,到浏览器访问http://localhost:7000
点击:Show heap histogram
点击:class java.lang.String
搜索test122222
发现只有一个对象,结论:
网上提到其他类似问题都可以通过命令jps,jmap,jhat去分析,触类旁通。
问题2:String中hashCode的作用?
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
分析:
观察源码,得出以下结论:
1.String的hashCode通过一定的算法计算出对应String的int值
2.两个相同的String,它的hashCode值一定相等
3.一一对应的关系,根据逆否命题,不相等的hashCode值,一定是两个不同的String
我们常常使用的HashMap类,get方法中的hash方法使用到hashCode方法
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
结论之一:
具体为什么HashMap执行get操作,效率之高,请查看相关介绍://TODO
String与StringBuilder
观察下面两个方法testString与testStringBuilder,字符串的拼接,最终结果都是:test1test2test2test2
public void testString() {
String a = "test1";
String b = "test2";
for (int i = 0;i < 3;i++) {
a = a + b;
}
//a = "test1test2test2test2"
}
public void testStringBuilder() {
StringBuilder a = new StringBuilder("test1");
String b = "test2";
for (int i = 0;i < 3;i++) {
a.append(b);
}
//a = "test1test2test2test2"
}
反编译javap -c
public void testString();
Code:
0: ldc #2 // String test1
2: astore_1
3: ldc #3 // String test2
5: astore_2
6: iconst_0
7: istore_3
8: iload_3
9: iconst_3
10: if_icmpge 38
13: new #4 // class java/lang/StringBuilder
16: dup
17: invokespecial #5 // Method java/lang/StringBuilder."":()V
20: aload_1
21: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
24: aload_2
25: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
28: invokevirtual #7 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
31: astore_1
32: iinc 3, 1
35: goto 8
38: return
从8-35行对应代码的for循环体
可以观察到,testString方法中a = a + b;
每次循环都会new StringBuilder,再执行两次append方法,最后再执行一次toString方法
查看StringBuilder的toString方法的实现
public String toString() {
// Create a copy, don't share the array
return new String(value, 0, count);
}
每次toString,都会new String
再查看testStringBuilder方法反编译结果
public void testStringBuilder();
Code:
0: new #4 // class java/lang/StringBuilder
3: dup
4: ldc #2 // String test1
6: invokespecial #8 // Method java/lang/StringBuilder."":(Ljava/lang/String;)V
9: astore_1
10: ldc #3 // String test2
12: astore_2
13: iconst_0
14: istore_3
15: iload_3
16: iconst_3
17: if_icmpge 32
20: aload_1
21: aload_2
22: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
25: pop
26: iinc 3, 1
29: goto 15
32: return
每次循环,只会执行一次append方法
比较testString与testStringBuilder
testString每次循环:new两次,append两次
testStringBuilder每次循环:append一次
可见两者效率上的差别,读者可以尝试增大循环次数,比较两者运行时间。
StringBuilder与StringBuffer
查看源码,StringBuilder中有的方法,对应的,StringBuffer中也有,例如append方法,区别在于,StringBuffer的append方法前的synchronized。
同步原语synchronized详解请点击://TODO
了解synchronized后,就明白,为什么StringBuffer是线程安全的,StringBuilder是非线程安全的。
总结
仅仅从简单的对比,执行的效率上,,原因是相同的操作,StringBuffer需要通过加锁来保证线程安全的额外开销。
,原因是多出new与append的额外开销。
网上评论说StringBuffer > String,,在超高并发下,StringBuffer不见得比String效率更高。