前面的废话

这几天在看周志明的《深入理解Java虚拟机》,看到了内存模型这一章,感觉到有好多有用的知识点,为了备忘,同时也为了能加深一下印象,本文就Java内存模型进行一个总结。

虚拟机运行数据区模型

程序计数器

Program Counter Register,存储当前线程所执行的字节码。在虚拟机的概念模型里,字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令,来完成分支、循环、跳转、异常处理、线程恢复等基础都需要依赖这个计数器完成。

Java虚拟机的多线程都是通过线程的轮流切换并分配处理器执行时间来实现,在任何一个确定的时刻,一个处理器(更准确的说是一个内核)只会处理一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要一个独立的程序计数器,各条线程之间计数器互不影响,独立存储。

如果线程正在执行的是一个Java方法,这个计数器的记录是正在执行的虚拟机字节码指令的地址;如果正在执行native方法,计数器的值为空。

java native方法是指本地方法,当在方法中调用一些不是由java语言写的代码或者在方法中用 java语言
直接操纵计算机硬件时要声明为native方法。

Java 虚拟机栈

虚拟机栈是线程私有的,声明周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时会创建一个栈帧(Stack Frame),用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程就对应着一个栈帧在虚拟机栈中入栈出栈的过程。

局部变量表:存放了编译器可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double),对象引用和returnAddress类型。

如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverFlowError异常;如果虚拟机栈可以动态扩展,但扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。

本地方法栈

与虚拟机栈作用相同,但是它为Native方法服务。

Java 堆

是Java 虚拟机管理的内存最大的一块,被所有的线程共享的一块内存区域。在虚拟启动时创建,此内存区域的唯一目的就是存放对象实例。

Java 堆是垃圾收集器管理的主要区域,也被称作 GC 堆。是分代回收算法的实行场所。关于回收算法后面介绍。

Java 堆可以处于物理上不连续的内存空间中,只要逻辑上连续即可。

方法区

各个线程的共享区域,用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。

垃圾收集行为在这个区域较少出现,这个区域的内存回收目标主要是针对常量池的回收和类型的卸载。

直接内存

在JDK1.4 中新加入了NIO类,引入了一种基于通道(Channel)与缓存区(Buffer)的I/O方式,它可以使用Native函数库直接分配堆外内存,然后通过一个存储在Java堆中的 DirectByteBuffer对象作为这块内存的引用进行操作。避免了在Java堆和Native堆中来回复制数据。

下面是我自己画的一张Java 内存模型图

java

备注:图中全部灰色部分代表运行时数据区,橙色部分代表所有线程共享,而绿色部分则代表线程私有。


关于对象

对象创建

虚拟机遇到一条new指令:

1.类加载检查

首先检查这个指令的参数是否能在常量池中定位到一个符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化过,如果没有,必须先执行相应的类加载过程

2.分配内存

对象所需要的内存大小在加载后就可以完全确定。对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。

如果Java堆内存是绝对规整的,即所有用过的内存放在一边,空闲内存放在另一边,中间的指针作为分界点指示器,那么分配内存,只需要将指针向空闲内存一边移动与对象大小相等的距离即可。这种分配方式叫指针碰撞(Bump the Pointer);

如果Java 堆内存不规整,即使用内存和空闲内存相互交错,则虚拟机将维护一个list,记录那些内存块可以使用,在分配的时候从列表中找出一块足够大的空间划分给对象实例,并更新list。

堆的规整程度与垃圾回收机制有关系。

那么问题来了,如果在并发情况下对象是怎么分配的?(可能没等给对象A分配完内存,又要给B分配内存)

方案一:

对分配空间的动作进行同步处理。

方案二:

把内存分配的动作按照线程划分在不同的空间进行,即每个线程在Java堆中预先分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程需要分配内存就在哪个线程的TLAB上分配,只有用完时并分配新的TLAB时,才需要同步锁定。

这样看来,方案二似乎更优一点,因为同步的效率是很低的,需要上锁、解锁等操作。

3.初始化

内存分配完成之后,虚拟机分配到的内存空间被初始化为0,保证了实例字段在Java代码中可以不赋初值就直接使用。

接下来,虚拟机要设置有关对象的各种信息,包括对象所属的类的名称,如何才能找到类的元信息,对象的哈希码,对象的GC分代年龄等。这些信息将被保存到对象头(Object Header)中。

4.执行init方法,初始化字段

对象按照程序员的思路初始化。

对象的内存布局

以HotSpot虚拟机为例,对象在内存中的布局分为:对象头(Header),实例数据(Instance Data),对齐填充(Padding)等三块区域。

对象头分为两部分:第一部分存储对象自身运行时数据如哈希码、GC分代年龄、锁状态标识等;第二部分存储类型指针,即对象指向它的类元数据指针,虚拟机通过这个指针来确定这个对象是哪个类的实例。

实例数据是对象真正存储的有效信息,也是在程序代码中所定义的各种类型的字段内容,包括从父类继承下来的和子类中定义的。

对齐填充并不是必然存在的,也没有特别的含义,仅仅起着占位符的作用。

对象的访问

Java程序需要通过栈上的reference数据操作堆上的对象。

但是怎么样通过这个reference访问到堆上的对象呢?

目前主流的访问方式有两种:使用句柄和直接指针。

1.使用句柄:java堆上会划出一部分内存来作为句柄池,reference中存储的就是对象的句柄地址。

句柄中包含了对象实例数据与类型数据各自的具体地址信息。人们更倾向与将句柄认为是一个对对象的”引用”。

图:

default

2.直接指针访问:reference中直接存放的就是对象地址。

图:

default

比较:

使用句柄来访问的最大好处就是reference中存储的是稳定的句柄地址,在对象被移动时只会改变句柄的实例数据指针,而reference本身并不需要修改;
使用直接指针访问方式的最大好处是速度更快,节省了一次指针定位时间。

以上知识点都来自于《深入理解Java虚拟机》这本书。