Java内存区域
根据《Java虚拟机规范》规定,Java虚拟机,即JVM所管理的内容将会包括以下几个运行时数据区域。
主要划分为五大块:程序计数器、虚拟机栈、本地方法栈、方法区和堆。
其中,程序计数器、虚拟机栈和本地方法栈是线程私有的,方法区和堆是共享数据。如下图:
接下来我们挨个看看这五块数据区域主要用来做什么。
程序计数器
程序计数器(Program Counter Register)是一块较小的内存空间,它可以看做是当前线程所执行的字节码的行号指示器。字节码解释器在工作时就是通过改变这个计数器的值来选取吓一跳需要执行的字节码指令,它是程序控制流的指示器,分支、循环、跳转、异常处理、线程恢复等基础功能都需要依赖这个计数器完成。
由于Java虚拟机的多线程是通过线程轮流切换、分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器都只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器。
如果线程正在执行一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址;如果正在执行的是本地(Native)方法,这个计数器值则应为空。另外,此内存区域是唯一一个在《Java虚拟机规范》中没有规定任何OutOfMemoryError情况的区域。
总结一下就是:
- 当前线程所执行的字节码行号指示器
- 每个线程都有各自的程序计数器
- 线程执行Java方法时,保存的是虚拟机字节码指令的地址
- 线程执行本地方法时,值为空
- 唯一在
Java
虚拟机规范中没有规定任何OutOfMemoryError
情况区域。
虚拟机栈
虚拟机栈描述的是Java方法执行的线程内存模型:每个方法被执行的时候,Java虚拟机都会同步创建一个栈帧(Stack Frame)用于存储局部变量表、操作数栈、动态连接和方法出口等信息。每一个方法被调用直至执行完毕的过程,都对应着各一个栈帧在虚拟机栈中从入栈到出栈的过程。
栈帧
局部变量表
操作数栈
动态连接
方法返回地址
附加信息
本地方法栈
本地方法栈与虚拟机栈所发挥的作用是非常相似的,其区别只是虚拟机栈为虚拟机执行Java方法服务,二本地方法栈则是为虚拟机使用到的本地方法服务。
方法区
方法区和 Java
堆一样,为多个线程共享,它用于存储类信息、常量、静态常量和即时编译后的代码等数据。
堆
Java
堆是被所有线程共享的最大的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配内存。
运行时常量池
运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池表(Constant Pool table),用于存放编译期生成的各种字面量与符号引用,这部分内容将在类加载后存放到方法去的运行时常量池中。
直接内存
直接内存(Direct Memory)并不是虚拟机运行时数据区的一部分,也不是《Java虚拟机规范》中定义的内存区域。在JDK1.4中新加入了NIO(New Input/Output)类,引入了一种基于通道(Channel)与缓冲区(Buffer)的I/o方式,它可以使用Native函数库直接分配对外内存,然后通过一个存储在Java堆里面的DitectByteBuffer对象作为这块内存的引用进行操作。
HotSpot虚拟机对象
对象的创建
对象创建大致可参考如下流程图:
对象内存布局
在HotSpot虚拟机里,对象在对没存中的存储布局可以划分为三个部分:对象头、实例数据和对齐填充。
HotSpot虚拟机对象的对象头部分包括两类信息。
第一类适用于存储对象自身运行时的数据,如哈希码、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等。
对象头的另外一部分是类型指针,即对象指向它的类型元数据的指针,Java虚拟机通过这个指针来确定该对象是哪个类的实例。
如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据。
存储内容 | 标志位 | 状态 |
---|---|---|
对象哈希码、对象分代年龄 | 01 | 未锁定 |
指向所记录的指针 | 00 | 轻量级锁定 |
指向重量级锁的指针 | 10 | 膨胀(重量级锁定) |
空,不需要记录信息 | 11 | GC标记 |
偏向线程ID、偏向时间戳、对象分代年龄 | 01 | 可偏向 |
对象的访问定位
《Java虚拟机规范》规定了,通过栈上的reference指针去操作堆上的具体对象,但没有定义这个引用应该通过什么方式去定位、访问到堆中对象的具体位置,所以对象访问方式也是由虚拟机实现而定,主流的访问方式主要有使用句柄和直接指针两种:
- 如果使用句柄访问的话,Java堆中将可能会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自具体的地址信息。
- 如果使用直接指针访问的话,Java堆中对象的内存布局就必须考虑如何放置访问类型数据的相关新消息,reference中存储的直接就是对象地址,如果只是访问对象本身的话,就不需要多一次间接访问的开销。
这两中对象访问方式各有优势,使用句柄来访问的最大好处就是reference中存储的是稳定句柄地址,在对象被移动(垃圾回收)时只会改变句柄中的实例数据指针,而reference本身不需要被修改。
使用直接直接指针来访问最大的好处就是速度更快,它节省了一次指针定位的时间开销。