Java 字符串拼接

Java 字符串拼接

本文为个人学习摘要笔记。
原文地址:羞,Java 字符串拼接竟然有这么多姿势

Java 字符串拼接常用有 6 种方式:

  1. “+”号操作符
  2. StringBuilder
  3. StringBuffer
  4. String 类的 concat 方法
  5. String 类的 join 方法
  6. StringUtils.join

“+”号操作符

举个栗子:

String chenmo = "沉默";
String wanger = "王二";

System.out.println(chenmo + wanger);

将这段代码使用反编译一下:

String chenmo = "\u6C89\u9ED8"; // 沉默
String wanger = "\u738B\u4E8C"; // 王二
System.out.println((new StringBuilder(String.valueOf(chenmo))).append(wanger).toString());

编译的时候把“+”号操作符替换成了 StringBuilderappend 方法。也就是说,“+”号操作符在拼接字符串的时候只是一种形式主义,让开发者使用起来比较简便,代码看起来比较简洁,读起来比较顺畅。算是 Java 的一种语法糖。

StringBuilder

先来看一下 StringBuilder 类的 append 方法的源码:

public StringBuilder append(String str) {
    super.append(str);
    return this;
}

父类 AbstractStringBuilderappend 方法:

public AbstractStringBuilder append(String str) {
    if (str == null)
        // 1.判断拼接的字符串是不是 null
        return appendNull();
    int len = str.length();
    // 2.判断是否需要扩容
    ensureCapacityInternal(count + len);
    // 3.将拼接的字符串复制到目标数组
    str.getChars(0, len, value, count);
    count += len;
    return this;
}

append 方法里有三步个操作:

  1. 判断拼接的字符串是不是 null,如果是,当做字符串“null”来处理。appendNull 方法实现。
  2. 拼接后的字符数组长度是否超过当前值,如果超过,进行扩容并复制。ensureCapacityInternal 方法实现。
  3. 将拼接的字符串 str 复制到目标数组 value 中。

appendNull 方法的源码如下:

private AbstractStringBuilder appendNull() {
    int c = count;
    ensureCapacityInternal(c + 4);
    final char[] value = this.value;
    value[c++] = 'n';
    value[c++] = 'u';
    value[c++] = 'l';
    value[c++] = 'l';
    count = c;
    return this;
}

ensureCapacityInternal 方法的源码如下:

private void ensureCapacityInternal(int minimumCapacity) {
    // overflow-conscious code
    if (minimumCapacity - value.length > 0) {
        value = Arrays.copyOf(value,
                newCapacity(minimumCapacity));
    }
}

StringBuffer

先有 StringBuffer 后有 StringBuilder,两者就像是孪生双胞胎,该有的都有,区别是StringBuffer 线程安全的

public synchronized StringBuffer append(String str) {
    toStringCache = null;
    super.append(str);
    return this;
}

StringBuffer 类的 append 方法比 StringBuilder 多了一个关键字 synchronizedsynchronized 是一种同步锁,它修饰的方法被称为同步方法,是线程安全的。

String 类的 concat 方法

单就姿势上来看,String 类的 concat 方法就好像 StringBuilder 类的 append

String chenmo = "沉默";
String wanger = "王二";

System.out.println(chenmo.concat(wanger));

那它们之间究竟有多大的差别呢,以下举个栗子:

chenmo += wanger
chenmo = chenmo.concat(wanger)

其中 chenmo += wanger 实际上相当于 (new StringBuilder(String.valueOf(chenmo))).append(wanger).toString()。要探究“+”号操作符和 concat 之间的差别,实际上要看 append 方法和 concat 方法之间的差别。

查看 concat 方法的源码:

public String concat(String str) {
    int otherLen = str.length();
    // 1.如果拼接的字符串的长度为 0 则返回当之前字符串
    if (otherLen == 0) {
        return this;
    }
    int len = value.length;
    // 2.复制原字符串的字符数组
    char buf[] = Arrays.copyOf(value, len + otherLen);
    // 3.将拼接的字符串复制到目标数组
    str.getChars(buf, len);
    return new String(buf, true);
}

concat 方法里有三步个操作:

  1. 如果拼接的字符串的长度为 0,那么返回拼接前的字符串。
  2. 将原字符串的字符数组 value 复制到变量 buf 数组中。
  3. 把拼接的字符串 str 复制到字符数组 buf 中,并返回新的字符串对象。

综上可得结论:

  1. 如果拼接的字符串是 null,concat 时候就会抛出 NullPointerException,“+”号操作符会当做是“null”字符串来处理。
  2. 如果拼接的字符串是一个空字符串(”“),那么 concat 的效率要更高一点。毕竟不需要 new StringBuilder 对象。
  3. 如果拼接的字符串非常多,concat 的效率就会下降,因为创建的字符串对象越多,开销就越大。

String 类的 join 方法

JDK 1.8 提供了一种新的字符串拼接姿势:String 类增加了一个静态方法 join

String chenmo = "沉默";
String wanger = "王二";
String cmower = String.join("", chenmo, wanger);

StringUtils.join

StringUtils.join 属于 org.apache.commons.lang3.StringUtils,使用方式:

String chenmo = "沉默";
String wanger = "王二";

StringUtils.join(chenmo, wanger);

该方法更善于拼接数组中的字符串,并且不用担心 NullPointerException

StringUtils.join(null)            = null
StringUtils.join([])              = ""
StringUtils.join([null])          = ""
StringUtils.join(["a", "b", "c"]) = "abc"
StringUtils.join([null, "", "a"]) = "a"

其源码内部使用的仍然是 StringBuilder

比较

阿里巴巴 Java 开发手册》上有一段内容说:循环体内,拼接字符串最好使用 StringBuilderappend 方法,而不是 + 号操作符。

举个栗子,在 for 循环中拼接字符串:

// 1. 使用 + 号拼接
String result = "";
for (int i = 0; i < 100000; i++) {
    result += "六六六";
}

// 2. 使用 append
StringBuilder sb = new StringBuilder();
for (int i = 0; i < 100000; i++) {
    sb.append("六六六");
}

实践结果第二段代码执行时间远比第一段代码要快得多,原因是第一段的 for 循环中创建了大量的 StringBuilder 对象,而第二段代码至始至终只有一个 StringBuilder 对象。


  转载请注明: 金点帝国 Java 字符串拼接

 上一篇
函数式替代 for 循环 函数式替代 for 循环
函数式替代 for 循环举个栗子以一个简单的循环打印为例: for(int i = 1; i < 4; i++) { System.out.print(i + "..."); } IntStream.range(1, 4)
下一篇 
HashMap 排序 HashMap 排序
HashMap 排序HashMap 的值是没有顺序的,它是按照 key 的 HashCode 来实现的,对于这个无序的 HashMap 我们要怎么来实现排序呢? 根据 key 排序TreeMap 基于红黑树实现,该映射根据其键的自然顺序进行
  目录