浅谈JAVA中字符串常量的储存位置
在讲述这些之前我们需要⼀些预备知识:
Java的内存结构我们可以通过两个⽅⾯去看待它。
⼀、从抽象的JVM的⾓度去看。相关定义请参考JVM规范:
从该⾓度看的话Java内存结构包含以下部分:该部分内容可以结合:(更加详细深⼊的介绍)
1、栈区:由编译器⾃动分配释放,具体⽅法执⾏结束后,系统⾃动释放JVM内存资源。
其作⽤有保存局部变量的值,包括:1.⽤来保存基本数据类型的值;2.
2、堆区:⼀般由程序员分配释放,JVM不定时查看这个对象,如果没有引⽤指向这个对象就回收。
其作⽤为⽤来存放动态产⽣的数据,包括new出来的实例,数组等。注意创建出来的对象只包含属于各⾃的成员变量,并不包括成员⽅法。
因为同⼀个类的对象拥有各⾃的成员变量,存储在各⾃的堆中,但是他们共享该类的⽅法,并不是每创建⼀个对象就把成员⽅法复制⼀次。
3、代码区:存放程序中⽅法的⼆进制代码,⽽且是多个对象共享⼀个代码空间区域。
4、数据区:⽤来存放static定义的静态成员。
5、常量池:JVM为每个已加载的类型维护⼀个常量池,常量池就是这个类型⽤到的常量的⼀个有序集合。包括直接常量(基本类型,String)和对其他类型、⽅法、字段的符号引⽤。池中的数据和数组⼀样通过索引访问。由于常量池包含了⼀个类型所有的对其他类型、⽅法、字段的符号引⽤,所以常量池在Java的动态链接中起了核⼼作⽤。常量池存在于堆中。
下图⼤致描述了JAVA的内存分配
⼆、从操作系统上的进程的⾓度。相关定义请参考各种操作系统的资料,例如Linux的话可以参考这个简单的介绍:(此⽅⾯⼀般被较少地谈论到,本⽂对此仅仅做⼀个稍微的介绍)
这⾥切记⼀点:JVM规范所描述的抽象JVM概念与实际实现并不总⼀⼀对应。
接来下我们来看⼀段代码实例与注释:
1public class TestStringConstant {
2public static void main(String args[]) {
3// 字符串常量,分配在常量池中,编译器会对其进⾏优化,  Interned table
字符串长度和占用内存字节4// 即当⼀个字符串已经存在时,不再重复创建⼀个相同的对象,⽽是直接将s2也指向"hello".
5        String s1 = "hello";
6        String s2 = "hello";
7// new出来的对象,分配在heap中.s3与s4虽然它们指向的字符串内容是相同的,但是是两个不同的对象.
8// 因此==进⾏⽐较时,其所存的引⽤是不同的,故不会相等
9        String s3 = new String("world");
10        String s4 = new String("world");
11
12        System.out.println(s1 == s2);  // true
13        System.out.println(s3 == s4);  // false
14        System.out.println(s3.equals(s4));  // true
15// String中equals⽅法已经被重写过,⽐较的是内容是否相等.
16    }
17 }
那么对于上例代码中提到的编译器的优化,下⾯将进⾏更进⼀步的详细介绍。请看下例代码:
class A {
private String a = "aa";
public boolean methodB() {
String b = "bb";
final String c = "cc";
return false;
}
}
  "aa"、"bb"的String对象按JVM规范在Java heap上,在JDK8之前的HotSpot VM实现⾥在PermGen,在JDK7开始的HotSpot VM⾥在普通Java heap⾥(⽽不在PermGen⾥);"cc"如果存在的话也⼀样,但是可能会不存在。
这些String对象属于“interned String”。String是Java对象,根据JVM规范的定义它必须存在于Java heap中,interned String也不例外。Interned String特别的地⽅在于JVM会有个StringTable存着interned String的引⽤,保证内容相同的String对象不被重复intern。(这⾥便是编译器的优化)
这个StringTable怎样实现JVM规范⾥并没有规定,不过通常它并不保存String对象的内容,⽽只是保存String对象的引⽤⽽已。
从JVM规范看a、b、c变量:
a变量作为A类的对象实例字段,会跟随A的实例在Java heap上。
b变量作为局部变量会在Java线程栈上。
c变量虽然也是局部变量,但因为有final修饰并且有初始化为⼀个常量值,所以c是⼀个常量。它可能会被优化掉(就没有c这个变量了),也可能跟b⼀样作为局部变量在Java线程栈上。
从HotSpot VM的实现看:
当methodB()被解释执⾏时,输⼊的字节码是怎样的就会怎样执⾏,⽽由于javac的实现不会优化掉变量b,所以调⽤methodB()时它⼀定会在Java线程栈上的局部变量区⾥;当字节码⾥变量c存在时,它也跟b⼀样在Java线程栈的局部变量区。
当methodB()被JIT编译执⾏时,由于局部变量b、c都没有被使⽤,所以它们经过JIT编译后就消失了,调⽤methodB()不会在栈上给b或c变量分配任何空间。
通过以上相信⼤家对于字符串常量的分配区域以及java的内存分配有了⼀个较为形象的了解。
下⾯是⼀些相关知识点的补充与注意事项:
1.分清什么是实例什么是对象。Class a= new Class();此时a叫实例,⽽不能说a是对象。实例在栈中,对象在堆中,操作实例实际上是通过实例的指针间接操作对象。多个实例可以指向同⼀个对象。
2.栈中的数据和堆中的数据销毁并不是同步的。⽅法⼀旦结束,栈中的局部变量⽴即销毁,但是堆中对象不⼀定销毁。因为可能有其他变量也指向了这个对象,直到栈中没有变量指向堆中的对象时,它才销毁,⽽且还不是马上销毁,要等垃圾回收扫描时才可以被销毁。
3.以上的栈、堆、代码段、数据段等等都是相对于应⽤程序⽽⾔的。每⼀个应⽤程序都对应唯⼀的⼀个JVM实例,每⼀个JVM实例都有⾃⼰的内存区域,互不影响。并且这些内存区域是所有线程共享的。这⾥提到的栈和堆都是整体上的概念,这些堆栈还可以细分。
4.类的成员变量在不同对象中各不相同,都有⾃⼰的存储空间(成员变量在堆中的对象中)。⽽类的⽅法却是该类的所有对象共享的,只有⼀套,对象使⽤⽅法的时候⽅法才被压⼊栈,⽅法不使⽤则不占⽤内存。
对于String的相关补充:
对于String的修改其实是new了⼀个StringBuilder并调⽤append⽅法,然后调⽤toString返回⼀个新的String.
(注意:append⽅法并不会new⼀个新的对象.)
但是JVM是会对String进⾏优化的,⽐如:
String str = "I" + "love" + "java"
其中的字符串在编译的时候就能够确认,所以编译器会直接将其拼接成⼀个字符串放在常量池:"I love java"
但是若代码为下⾯这样:
String a = "I";
String b = "love";
String c = "java";
String str = a + b + c;
那么只有等到运⾏的时候才能够确定str最终是什么,编译器并不会对其进⾏优化,⽽是通过StringBuilder对字符串改变来实现的。
但是注意,要是此处给 a, b, c添加上 final 关键字,则编译器就能够对其进⾏优化。我们可以做下⾯这样⼀个测试:
关于final的详细说明可以参见:
public class foo{
public static void main(String[] args) {
String a = "I ";
String b = "love ";
String c = "java";
final String a1 = "I ";
final String b1 = "love ";
final String c1 = "java";
String str = a + b + c;
String str1 = a1 + b1 + c1;    // equals to str1 = "I " + "love " + "java"
String str2 = "I " + "love " + "java";
System.out.println(str == "I love java");  // output false
System.out.println(str1 == "I love java");  // output true
System.out.println(str2 == "I love java");  // output true
System.out.println(a + "love " + "java" == "I love java");  // output false
System.out.println(a1 + "love " + "java" == "I love java");  // output true
}
}
Note:
  StringBuilder 和 StringBuffer 的区别:
StringBuffer 是线程安全的;StringBuilder 是⾮线程安全的。
因为StingBuffer是在StringBuilder的基础上加锁,⽽加锁是⼀个重量级的操作,需要调⽤操作系统内核来实现。⽐较耗时。
故在效率上: StringBuilder > StringBuffer

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。