背景
字符串拼接不管是在业务上,还是写算法时都会频繁使用到。对于Java来说,字符串拼接有着很多种方式,他们之间的区别是什么,对应不同的业务哪种更好用呢。
String底层原理
在讨论字符串拼接时,首先需要知道String的底层原理。
我们这里只讨论jdk1.8之后的情况,看下结构
private final byte[] value;
这一行代码已经可以说明很多东西。字符串实质就是不可变的byte数组。因为不可变,所以对他进行拼接对他拼接实际就是生成了多个对象,这就是不鼓励对字符串进行拼接的原因。但不可变也有很多好处,例如线程安全、可以存在字符串缓冲池复用字符串等。
拼接的方法
经典但有时不优雅的 +
String a = "123"; String b = "456"; String c = a + b;
c这个字符串就是ab拼接起来的字符串,“123456”
这段代码反编译出来的代码是
String c = (new StringBuilder()).append(a).append(b).toString();
可以看出这个 + 是Java的语法糖,他实际上是调用的StringBuilder,通过append()来进行拼接。关于StringBuilder我们后面再讲,先来讲下这个用法的优缺点。
优点
“+”,最大的优点就是简洁。如果两个字符串需要首尾拼接,+号义不容辞的成为了最好的使用方式。
缺点
说到缺点的话就多了。简洁也是他的最大缺点,也就是不够灵活。
业务一
有一个字符串List,我需要把他们拼接起来,怎么办?
for(String tmp:list){ s += tmp; }
简洁的一批,但是他隐藏着很大的问题!
上面说到这种拼接方式实际是通过StringBuilder的append的方法。你不需要知道他的原理,你只需要知道,每次循环,他都会new一个StringBuilder对象。创建对象的开销是很大的,如果List有几千几万,内存开销和时间开销是不能接受的!
所以阿里巴巴的规范说到:
表面上是推荐,实际就是禁止。写算法会消耗大量时间导致不通过,业务也会因为这种方式提高了无故的开销,属于领导看了想打死的代码。
业务二
大家好,我叫XX,我是来自XXX学校的大X学生,我的爱好是XXX。
一个经典的模板,我需要替换掉中间的XXX为controller的参数,怎么办呢?
String s = "大家好,我叫"+name+"我是来自"+school+"学校的大"+num+“学生,我的爱好是”+aihao;
属于可用但极其丑陋的代码。如果其他接口也需要这个模板,我还要把这段话复制到所有位置上吗?如果我要改动这个,我要对所有代码进行改动吗。
万能的StringBuilder
先介绍下StringBuilder的原理。把字符串拼接想象成数组就很好理解了,StringBuilder有点类似于ArrayList,可变数组。
/** * The value is used for character storage. */ char[] value;
区别就是没有final修饰,当到达阈值时进行扩容操作。append方法就是往后插入。
那么就可以解决上面业务一的问题了。
StringBuilder sb = new StringBuilder(); for(String tmp:list){ sb.append(tmp); } String s = sb.tostring();
相比于上面,只创建了一个StringBuilder对象,减少循环创建的开销。
线程安全的StringBuffer
StringBuffer与StringBuilder相比,有线程安全的优势,通过上锁的方式。同时导致效率略低于StringBuilder。
灵活的String.format()
这个严格来说应该叫做格式化,但也可以用来拼接。
熟悉c语言的应该能够懂,我这里举一个例子
String msg = String.format(“我是%s小学的学生,我爱吃%s”,"阳光","屎"); //输出 我是阳光小学的学生,我爱吃屎
使用字符串链代替%s,生成需要的字符串。也不仅可以拼接字符串,可以看下下图(偷的图,没全部验证过,错了别找我)
这种方式就解决了业务二的问题。通过编写枚举或者常量字符串留出对应的位置,使用时再用String.format()拼接。
有点绿色的concat
为什么说他绿色呢,就是我还没有找到他有什么优势。
String s = "123".concat("456"); //结果等价于 String s = "123" + "456";
concat方法的原理是数组扩容后复制之前的内容并写新的内容,和StringBuilder底层有点相像。
但是相比于“+”号来说,既不简便,又没有什么效率上的提高。在循环字符串拼接的条件,效率上会略有一点优势,但是这种情况是根本不被允许的,所以concat就很鸡肋。
JDK1.8优雅写法
刚才提到业务一的解决办法可以使用朴素的StringBuilder来解决,但是对于业务代码来说有一点冗长。
Jdk1.8给出了优雅的答案
String s = String.join("_", list);
一行代码,就可以把list里的字符串通过“_”拼接起来。
经典的Guava
guava是我们crud程序员的好伙伴,这里就不用多说了。我们最常接触到的其实就是guava的本地缓存和字符串操作。
String result = Joiner.on(",").join(list);
也是简洁的一句话,但是相比于jdk本土的字符串方法来说,他还有一些其他的特性。例如可以把为null的数组给跳过或者替换掉等等。功能要比jdk的要丰富一点。在正常的web项目里基本都会有Guava的依赖,使用起来还是很方便的。
总结
这篇文章偏重于代码编写方面,如何写出简洁高效的代码,是我们要追求的。不要让你写的垃圾代码恶心到接手的同事就好了。
到此这篇关于Java字符串拼接的优雅方式的文章就介绍到这了,更多相关Java字符串拼接内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!