在Java编码过程中,经常需要将字符串拼接到一起,本文主要介绍Java中几种常见拼接方式。
- “+”
在java中,可以直接采用"+"进行字符串的拼接,例如:
String name = "lby" + "dcy";
原理:有些人会认为这是运算符重载1,但其实并不是,java中不支持运算符重载,这其实是一个语法糖2。
上面代码反编译如下:
String name = (new StringBuilder()).append("lby").append("dcy").toString();
所以,使用 “+” 进行字符串拼接,本质上是采用了StringBuilder.append
来进行的,关于StringBuilder
,下文会继续介绍。
- concat
第二中方法是采用concat进行拼接,示例如下:
String name = "lby";
String cp = "dcy";
String word = name.concat("x").concat(cp);
原理:关于concat实现原理,可以参考concat的源码:
public String concat(String str) {
int otherLen = str.length();
if (otherLen == 0) {
return this;
}
int len = value.length;
char buf[] = Arrays.copyOf(value, len + otherLen);
str.getChars(buf, len);
return new String(buf, true);
}
可以发现,concat是通过创建新的String对象来实现的。
- StringBuffer和StringBuilder
在Java中我们可以使用 StringBuffer和StringBuilder 两个类进行定义String变量,这两个类创建出来的对象是可以进行修改的,由于两者特性相似,就统一放在一个板块介绍。
//StringBuffer
StringBuffer name = new StringBuffer("lby");
String cp = "dcy";
StringBuffer word = name.append(",").append(cp);
//StringBuilder
StringBuilder name = new StringBuilder("lby");
String cp = "dcy";
StringBuilder word = name.append(",").append(cp);
运行原理:和String
类类似,StringBuilder
类也封装了一个字符数组,定义如下:
char[] value;
与String
不同的是,它并不是final
的,所以他是可以修改的。另外,与String
不同,字符数组中不一定所有位置都已经被使用,它有一个实例变量,表示数组中已经使用的字符个数,定义如下:
int count;
其append源码如下:
public StringBuilder append(String str) {
super.append(str);
return this;
}
该类继承了AbstractStringBuilder
类,看下其append
方法:
public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}
append会直接拷贝字符到内部的字符数组中,如果字符数组长度不够,会进行扩展。
StringBuffer
和StringBuilder
类似,最大的区别就是StringBuffer
是线程安全的,看一下StringBuffer
的append
方法。
public synchronized StringBuffer append(String str) {
toStringCache = null;
super.append(str);
return this;
}
该方法使用synchronized
进行声明,说明是一个线程安全的方法。而StringBuilder
则不是线程安全的。
StringJoiner
StringJoiner
是JDK8
中提供的一个字符串拼接方法,StringJoiner
类共有2个构造函数,5个公有方法。其中最常用的方法就是add方法和toString
方法,类似于StringBuilder
中的append方法和toString
方法。主要适用于集合拼接。
用法示例:
StringJoiner sj = new StringJoiner("x");
sj.add("lby");
sj.add("dcy");
System.out.println(sj.toString());
StringJoiner sj1 = new StringJoiner(":","[","]");
sj1.add("dcy").add("lby").add("cp");
System.out.println(sj1.toString());
输出结果:
lbyxdcy
[dcy:lby:cp]
StringJoiner(CharSequence delimiter)
初始化一个StringJoiner
的时候,这个delimiter
其实是分隔符,并不是可变字符串的初始值。
StringJoiner(CharSequence delimiter,CharSequence prefix,CharSequence suffix)
的第二个和第三个参数分别是拼接后的字符串的前缀和后缀。
实现原理:主要跟随源码来理解原理
public StringJoiner add(CharSequence newElement) {
prepareBuilder().append(newElement);
return this;
}
private StringBuilder prepareBuilder() {
if (value != null) {
value.append(delimiter);
} else {
value = new StringBuilder().append(prefix);
}
return value;
}
在上面add方法源码中,可以发现使用了StringBuilder
来实现。
在实际编码中,关于字符串拼接,我们该如何抉择呢?
首先,在大数据中,对其中拼接效率,应当有StringBuilder
<StringBuffer
<concat
<"+
"
为什么有如上比较结果?首先,对于StringBuilder
<StringBuffer
,是由于StringBuffer
做了同步处理,那么,效率会比StringBuilder
低上一点;而concat
每次使用都要重新创建一个String
对象,用时会比StringBuilder
和StringBuffer
多一些;而对于"+",上面说过每次运行都会创建一个新的StringBuilder
对象,再将String转换成StringBuilder
,然后进行append,所以用时自然是最长的,并且不仅仅会耗费时间,频繁的创建对象,还会造成内存资源的浪费。
经上述,可总结一下:
StringBuilder
是效率最高的,因为StringBuilder
本身就是为了字符串拼接而存在,但是如果是在高并发条件下,则要使用StringBuffer
来进行拼接,因为StringBuffer
是线程安全的。List
进行字符串拼接,则考虑使用StringJoiner
。运算符重载: 在计算机程序设计中,运算符重载(英语:operator overloading)是多态的一种。运算符重载,就是对已有的运算符重新进行定义,赋予其另一种功能,以适应不同的数据类型。 ↩︎
语法糖: 语法糖(Syntactic sugar),也译为糖衣语法,是由英国计算机科学家彼得·兰丁发明的一个术语,指计算机语言中添加的某种语法,这种语法对语言的功能没有影响,但是更方便程序员使用。语法糖让程序更加简洁,有更高的可读性。 ↩︎