详细分析Java中String、StringBuffer、StringBuilder类的性能
我们先要记住三者的特征:
- String字符串常量
- StringBuffer字符串变量(线程安全)
- StringBuilder字符串变量(非线程安全)
一、定义
查看API会发现,String、StringBuffer、StringBuilder都实现了CharSequence接口,虽然它们都与字符串相关,但是其处理机制不同。
- String:是不可改变的量,也就是创建后就不能在修改了。
- StringBuffer:是一个可变字符串序列,它与String一样,在内存中保存的都是一个有序的字符串序列(char类型的数组),不同点是StringBuffer对象的值都是可变的。
- StringBuilder:与StringBuffer类基本相同,都是可变字符换字符串序列,不同点是StringBuffer是线程安全的,StringBuilder是线程不安全的。在性能方面,由于String类的操作是产生新的String对象,而StringBuilder和StringBuffer只是一个字符数组的扩容而已,所以String类的操作要远慢于StringBuffer和StringBuilder。
二、使用场景
使用String类的场景:在字符串不经常变化的场景中可以使用String类,例如常量的声明、少量的变量运算。
使用StringBuffer类的场景:在频繁进行字符串运算(如拼接、替换、删除等),并且运行在多线程环境中,则可以考虑使用StringBuffer,例如XML解析、HTTP参数解析和封装。
使用StringBuilder类的场景:在频繁进行字符串运算(如拼接、替换、和删除等),并且运行在单线程的环境中,则可以考虑使用StringBuilder,如SQL语句的拼装、JSON封装等。
三、分析
简要的说,String类型和StringBuffer类型的主要性能区别其实在于String是不可变的对象,因此在每次对String类型进行改变的时候其实都等同于生成了一个新的String对象,然后将指针指向新的String对象。所以经常改变内容的字符串最好不要用String,因为每次生成对象都会对系统性能产生影响,特别当内存中无引用对象多了以后,JVM的GC就会开始工作,那速度是一定会相当慢的。
而如果是使用StringBuffer类则结果就不一样了,每次结果都会对StringBuffer对象本身进行操作,而不是生成新的对象,再改变对象引用。所以在一般情况下我们推荐使用StringBuffer,特别是字符串对象经常改变的情况下。而在某些特别情况下,String对象的字符串拼接其实是被JVM解释成了StringBuffer对象的拼接,所以这些时候String对象的速度并不会比StringBuffer对象慢,而特别是以下的字符串对象生成中,String效率是远要比StringBuffer快的:
StringS1=“Thisisonlya"+“simple"+“test"; StringBufferSb=newStringBuilder(“Thisisonlya").append(“simple").append(“test");
你会很惊讶的发现,生成StringS1对象的速度简直太快了,而这个时候StringBuffer居然速度上根本一点都不占优势。其实这是JVM的一个把戏,在JVM眼里,这个
StringS1=“Thisisonlya"+“simple"+“test";
其实就是:
StringS1=“Thisisonlyasimpletest";
所以当然不需要太多的时间了。但大家这里要注意的是,如果你的字符串是来自另外的String对象的话,速度就没那么快了,譬如:
StringS2="Thisisonlya"; StringS3="simple"; StringS4="test"; StringS1=S2+S3+S4;
这时候JVM会规规矩矩的按照原来的方式去做。
四、深入JVM的优化处理
真的会有上面的性能代价么,字符串拼接这么常用,没有特殊的处理优化么,答案是有的,这个优化进行在JVM编译.java到bytecode时。
一个Java程序如果想运行起来,需要经过两个时期,编译时和运行时。在编译时,JavaJVM(Compiler)将java文件转换成字节码。在运行时,Java虚拟机(JVM)运行编译时生成的字节码。通过这样两个时期,Java做到了所谓的一处编译,处处运行。
我们实验一下编译期都做了哪些优化,我们制造一段可能会出现性能代价的代码。
publicclassConcatenation{ publicstaticvoidmain(String[]args){ StringuserName="Andy"; Stringage="24"; Stringjob="Developer"; Stringinfo=userName+age+job; System.out.println(info); } }
对Concatenation.java进行编译一下。得到Concatenation.class
javacConcatenation.java
然后我们使用javap反编译一下编译出来的Concatenation.class文件。javap-cConcatenation。如果没有找到javap命令,请考虑将javap所在目录加入环境变量或者使用javap的完整路径。
17:22:04-androidyue~/workspace_adt/strings/src$javap-cConcatenation Compiledfrom"Concatenation.java" publicclassConcatenation{ publicConcatenation(); Code: 0:aload_0 1:invokespecial#1//Methodjava/lang/Object."<init>":()V 4:return publicstaticvoidmain(java.lang.String[]); Code: 0:ldc#2//StringAndy 2:astore_1 3:ldc#3//String24 5:astore_2 6:ldc#4//StringDeveloper 8:astore_3 9:new#5//classjava/lang/StringBuilder 12:dup 13:invokespecial#6//Methodjava/lang/StringBuilder."<init>":()V 16:aload_1 17:invokevirtual#7//Methodjava/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 20:aload_2 21:invokevirtual#7//Methodjava/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 24:aload_3 25:invokevirtual#7//Methodjava/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 28:invokevirtual#8//Methodjava/lang/StringBuilder.toString:()Ljava/lang/String; 31:astore4 33:getstatic#9//Fieldjava/lang/System.out:Ljava/io/PrintStream; 36:aload4 38:invokevirtual#10//Methodjava/io/PrintStream.println:(Ljava/lang/String;)V 41:return }
其中,ldc,astore等为java字节码的指令,类似汇编指令。后面的注释使用了Java相关的内容进行了说明。我们可以看到上面有很多StringBuilder,但是我们在Java代码里并没有显示地调用,这就是JavaJVM做的优化,当JavaJVM遇到字符串拼接的时候,会创建一个StringBuilder对象,后面的拼接,实际上是调用StringBuilder对象的append方法。这样就不会有我们上面担心的问题了。
五、仅靠JVM优化?
既然JVM帮我们做了优化,是不是仅仅依靠JVM的优化就够了呢,当然不是。
下面我们看一段未优化性能较低的代码
publicvoidimplicitUseStringBuilder(String[]values){ Stringresult=""; for(inti=0;i<values.length;i++){ result+=values[i]; } System.out.println(result); }
使用javac编译,使用javap查看
publicvoidimplicitUseStringBuilder(java.lang.String[]); Code: 0:ldc#11//String 2:astore_2 3:iconst_0 4:istore_3 5:iload_3 6:aload_1 7:arraylength 8:if_icmpge38 11:new#5//classjava/lang/StringBuilder 14:dup 15:invokespecial#6//Methodjava/lang/StringBuilder."<init>":()V 18:aload_2 19:invokevirtual#7//Methodjava/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 22:aload_1 23:iload_3 24:aaload 25:invokevirtual#7//Methodjava/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 28:invokevirtual#8//Methodjava/lang/StringBuilder.toString:()Ljava/lang/String; 31:astore_2 32:iinc3,1 35:goto5 38:getstatic#9//Fieldjava/lang/System.out:Ljava/io/PrintStream; 41:aload_2 42:invokevirtual#10//Methodjava/io/PrintStream.println:(Ljava/lang/String;)V 45:return
其中8:if_icmpge38和35:goto5构成了一个循环。8:if_icmpge38的意思是如果JVM操作数栈的整数对比大于等于(i<values.length的相反结果)成立,则跳到第38行(System.out)。35:goto5则表示直接跳到第5行。
但是这里面有一个很重要的就是StringBuilder对象创建发生在循环之间,也就是意味着有多少次循环会创建多少个StringBuilder对象,这样明显不好。赤裸裸地低水平代码啊。
稍微优化一下,瞬间提升逼格。
publicvoidexplicitUseStringBuider(String[]values){ StringBuilderresult=newStringBuilder(); for(inti=0;i<values.length;i++){ result.append(values[i]); } }
对应的编译后的信息
publicvoidexplicitUseStringBuider(java.lang.String[]); Code: 0:new#5//classjava/lang/StringBuilder 3:dup 4:invokespecial#6//Methodjava/lang/StringBuilder."<init>":()V 7:astore_2 8:iconst_0 9:istore_3 10:iload_3 11:aload_1 12:arraylength 13:if_icmpge30 16:aload_2 17:aload_1 18:iload_3 19:aaload 20:invokevirtual#7//Methodjava/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder; 23:pop 24:iinc3,1 27:goto10 30:return
从上面可以看出,13:if_icmpge30和27:goto10构成了一个loop循环,而0:new#5位于循环之外,所以不会多次创建StringBuilder.
总的来说,我们在循环体中需要尽量避免隐式或者显式创建StringBuilder.所以那些了解代码如何编译,内部如何执行的人,写的代码档次都比较高。
六、结论
在大部分情况下StringBuffer>String
Java.lang.StringBuffer是线程安全的可变字符序列。一个类似于String的字符串缓冲区,但不能修改。虽然在任意时间点上它都包含某种特定的字符序列,但通过某些方法调用可以改变该序列的长度和内容。在程序中可将字符串缓冲区安全地用于多线程。而且在必要时可以对这些方法进行同步,因此任意特定实例上的所有操作就好像是以串行顺序发生的,该顺序与所涉及的每个线程进行的方法调用顺序一致。
StringBuffer上的主要操作是append和insert方法,可重载这些方法,以接受任意类型的数据。每个方法都能有效地将给定的数据转换成字符串,然后将该字符串的字符追加或插入到字符串缓冲区中。append方法始终将这些字符添加到缓冲区的末端;而insert方法则在指定的点添加字符。
例如,如果z引用一个当前内容是“start”的字符串缓冲区对象,则此方法调用z.append(“le”)会使字符串缓冲区包含“startle”(累加);而z.insert(4,“le”)将更改字符串缓冲区,使之包含“starlet”。
在大部分情况下StringBuilder>StringBuffer
java.lang.StringBuilder一个可变的字符序列是JAVA5.0新增的。此类提供一个与StringBuffer兼容的API,但不保证同步,所以使用场景是单线程。该类被设计用作StringBuffer的一个简易替换,用在字符串缓冲区被单个线程使用的时候(这种情况很普遍)。如果可能,建议优先采用该类,因为在大多数实现中,它比StringBuffer要快。两者的使用方法基本相同。