Java编译器对于String常量表达式的优化
首先把问题摆出来,先看这个代码
String a = "ab"; String b = "a" + "b"; System.out.println((a == b));
打印结果会是什么?类似这样的问题,有人考过我,我也拿来考过别人(蛮好玩的,大家也可以拿来问人玩),一般答案会是以下几种:
1.true
"a" + "b" 的结果就是"ab",这样a,b都是"ab"了,内容一样所以"相等",结果true
一般java新人如是答。
2.false
"a" + "a"会生成新的对象"aa",但是这个对象和String a = "ab";不同,(a == b)是比较对象引用,因此不相等,结果false
对java的String有一定了解的通常这样回答。
3.true
String a = "ab";创建了新的对象"ab"; 再执行String b = "a" + "b";结果b="ab",这里没有创建新的对象,而是从JVM字符串常量池中获取之前已经存在的"ab"对象。因此a,b具有对同一个string对象的引用,两个引用相等,结果true.
能回答出这个答案的,基本已经是高手了,对java中的string机制比较了解。
很遗憾,这个答案,是不够准确的。或者说,根本没有运行时计算b = "a" + "b";这个操作.实际上运行时只有String b = "ab";
3的观点适合解释以下情况:
String a = "ab"; String b = "ab"; System.out.println((a == b));
如果String b = "a" + "b";是在运行期执行,则3的观点是无法解释的。运行期的两个string相加,会产生新的对象的。(本文后面对此有解释)
4.true
下面是我的回答:编译优化+ 3的处理方式 = 最后的true
String b = "a" + "b";编译器将这个"a" + "b"作为常量表达式,在编译时进行优化,直接取结果"ab",这样这个问题退化
String a = "ab"; String b = "ab"; System.out.println((a == b));
然后根据3的解释,得到结果true
这里有一个疑问就是String不是基本类型,像
int secondsOfDay = 24 * 60 * 60;
这样的表达式是常量表达式,编译器在编译时直接计算容易理解,而"a" + "b" 这样的表达式,string是对象不是基本类型,编译器会把它当成常量表达式来优化吗?
下面简单证明我的推断,首先编译这个类:
public class Test { private String a = "aa"; }
复制class文件备用,然后修改为
public class Test { private String a = "a" + "a"; }
再次编译,用ue之类的文本编辑器打开,察看二进制内容,可以发现,两个class文件完全一致,连一个字节都不差.
ok,真相大白了.根本不存在运行期的处理String b = "a" + "b";这样的代码的问题,编译时就直接优化掉了。
下面进一步探讨,什么样的string + 表达式会被编译器当成常量表达式?
String b = "a" + "b";
这个String + String被正式是ok的,那么string + 基本类型呢?
String a = "a1"; String b = "a" + 1; System.out.println((a == b)); //result = trueString a = "atrue"; String b = "a" + true; System.out.println((a == b)); //result = trueString a = "a3.4"; String b = "a" + 3.4; System.out.println((a == b)); //result = true
可见编译器对string + 基本类型是当成常量表达式直接求值来优化的。
再注意看这里的string都是"**"这样的,我们换成变量来试试:
String a = "ab"; String bb = "b"; String b = "a" + bb; System.out.println((a == b)); //result = false
这个好理解,"a" + bb中的bb是变量,不能进行优化。这里很很好的解释了为什么3的观点不正确,如果String+String的操作是在运行时进行的,则会产生新的对象,而不是直接从jvm的string池中获取。
再修改一下,把bb作为常量变量:
String a = "ab"; final String bb = "b"; String b = "a" + bb; System.out.println((a == b)); //result = true
竟然又是true,编译器的优化好厉害啊,呵呵,考虑下面这种情况:
String a = "ab"; final String bb = getBB(); String b = "a" + bb; System.out.println((a == b)); //result = false private static String getBB() { return "b"; }
看来java(包括编译器和jvm)对string的优化,真的是到了极点了,string这个所谓的"对象",完全不可以看成一般的对象,java对string的处理近乎于基本类型,最大限度的优化了几乎能优化的地方。
另外感叹一下,string的+号处理,算是java语言里面唯一的一个"运算符重载"(接触过c++的人对这个不会陌生)吧?