Java垃圾回收机制
对象被判定为垃圾的算法
引用计数算法 和 可达性分析算法
引用计数算法
判断对象的引用数量
- 通过判断对象的引用数量来决定对象是否可以被回收
- 每个对象实例都有一个引用计数器,被引用+1,完成引用-1
- 任何引用计数为0的对象实例可以被当作垃圾收集
优点:执行效率高,程序执行受影响较小
缺点:无法检测出循环引用的情况,导致内存泄露
可达性分析算法(主流)
通过判断对象的引用链是否可达来决定对象是否可以被回收
- GC Root -> Object1 -> Object2
- Object3 -> Object4 (没有与GC Root相连,可以被垃圾回收)
可作为GC Root的对象
- 虚拟机栈中的引用对象(栈帧中的本地变量表)
- 方法区中的常量引用的对象(保存的是某个对象的地址)
- 方法区中的类静态属性引用的对象
- 本地方法中JNI(Native方法)的引用对象
- 活跃线程的引用对象
垃圾回收算法
标记-清除算法 , 复制算法 , 标记-整理算法 和 分代收集算法
标记-清除算法(Mark and Sweep)
- 标记:从根集合进行扫描,对存活的对象进行标记
- 清除:对堆内存从头到尾进行线性遍历,回收不可达对象内存
- 特点:碎片化
复制算法(Copying)年轻代常用
- 分为对象面和空闲面
- 对象在对象面上创建
- 对象面用尽后,存活的对象被从对象面顺序复制到空闲面
- 将对象面所有对象内存清除
- 特点:
- 解决碎片化问题
- 顺序分配内存,简单高效
- 适用于对象存活率低的场景(年轻代)
- 缺点:只能使用50%的内存空间
标记-整理算法(Compacting) 老年代常用
- 标记:从根集合进行扫描,对存活的对象进行标记
- 清除(整理):移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收
- 特点:
- 避免内存的不连续性
- 不需要设置两块内存互换
- 适用于存活率高的场景(老年代)
分代收集算法(Generational Collector)
- 上述垃圾回收算法的组合
- 按照对象生命周期的不同划分区域以采用不同的垃圾回收算法
- 目的:提高JVM垃圾回收效率
GC分类
- Minor GC:当Eden区被占满时,触发Minor GC
- Full GC:情况很多,后面单独讨论
年轻代垃圾回收过程
年轻代:尽可能快速地收集掉生命周期较短的对象
- Eden区(几乎所有对象都从Eden区生成,容量为年轻代的8/10)
- 两个Survivor区(容量各为年轻代的1/10)
程序在Eden区被创建
当Eden区被占满时,触发Minor GC,并将存活对象移动到Survivor区A(存活对象年龄+1),清空Eden区
当Eden区再次被占满时,再次触发Minor GC,并将Survivor-A和Eden区的存活对象复制到Survivor-B中(存活对象年龄+1),清空Eden区和Survivor-A区。两个Survivor区from和to性质调换。
当对象年龄达到某个值(默认是15,可通过-XX:MaxTenuringThreshold修改)进入老年代
注:如果对象过大,Eden区/Survivor区装不下,则直接进入老年代。
年轻代中的对象对象如何晋升到老年代
- 新生代对象经历一定Minor次数依然存活的对象
- Survivor区/Eden区中放不下的对象
- 新生成的大对象(-XX:+PretenuerSizeThreshold)
老年代垃圾回收过程
老年代:存放生命周期较长的对象,常用标记-清除算法,标记-整理算法
- Full GC 和 Major GC是等价的(也有说Major GC特指老年代回收,而不像Full GC一样包括Minor GC)
- Full GC比Minor GC慢得多,执行频率低
触发Full GC的条件
- 老年代空间不足
- 永久代空间不足(≤ JDK1.7)
- Minor GC晋升到老年代的平均大小大于老年代的剩余空间
- CMS(并发标记-清除算法) GC时,出现promotion failed(Minor GC时,Survivor放不下了,则需要将对象晋升到老年代,但老年代也放不下了), concurrent mode failure(并行时同时有多个对象放入老年代,但老年代空间不足)
- 调用System.gc()
- 使用RMI来进行RPC或管理的JDK应用,每小时执行1次Full GC
垃圾收集器(不同于垃圾收集算法)
两个概念Stop-the-World 和 Safepoint
Stop-the-World
- JVM由于要执行GC而停止了应用程序的执行
- 任何一种GC算法中都会发生
- 多数GC优化通过减少Stop-the-World发生的时间来提高程序性能
Safepoint
- 分析过程中对象引用关系不会发生变化的点
- 产生Safepoint的地方:方法调用;循环跳转;异常跳转等
当所有线程都运行到安全点,垃圾回收器才开始运行。
JVM运行模式
- Server:启动慢,运行快(优化较多)
- Client:启动快,运行慢
年轻代常见的垃圾收集器
各个收集器兼容性如下图所示,其中G1收集器不与任何其他收集器兼容:
Serial收集器(-XX:+UseSerialGC,复制算法)
- 单线程收集,进行垃圾收集时,必须暂停所有工作线程
- 简单高效,Client模式下默认的年轻代收集器
ParNew收集器(-XX:+UseParNewGC,复制算法)
- 多线程收集,进行垃圾收集时,必须暂停所有工作线程
- 单核执行效率不如Serial,在多核下执行有优势
Parallel Scavenge收集器(-XX:+UseParallelGC,复制算法)
- 比起关注用户线程停顿时间,更关注系统的吞吐量(后台运算有优势)
- 在多核下执行才有优势,Server模式下默认的年轻代收集器
老年代常见的垃圾收集器
Serial Old收集器(-XX:+UseSerialOldGC,标记-整理算法)
- 单线程收集,进行垃圾收集时,必须暂停所有工作线程
- 简单高效
Parallel Old收集器(-XX:+UseParallelOldGC,标记-整理算法)
- 多线程,吞吐量优先
CMS(Concurrent Mark Sweep)收集器(-XX:+UseConcMarkSweepGC,标记-清除算法)
垃圾收集器是一款以获取最短停顿时间为目标的收集器。由于现代互联网中的应用,比较重视服务的响应速度和系统的停顿时间,所以CMS收集器非常适合在这种场景下使用。
- 初始标记(JVM停顿):stop-the-world(虚拟机停顿正在执行的任务,从虚拟机根对象开始扫描到与之直接关联的对象,以及被存活的青年代对象所直接引用的对象,并做标记)
- 并发标记:并发追溯标记,程序不会停顿
- (并发预清理:查找执行并发标记阶段从年轻代晋升到老年代的对象)
- 重新标记(JVM停顿):暂停虚拟机,扫描CMS堆中的剩余对象
- 并发清理:清理垃圾对象,程序不会卡顿
- (并发重置:重置CMS收集器的数据结构)
年轻代和老年代均适用的收集器——Garbage First(G1)收集器(复制+标记-整理算法)
特点:
- 并行和并发
- 分代收集
- 空间整合(不像CMS用的是标记-清除算法)
- 可预测的停顿
将整个Java堆内存划分成多个大小相等的Region(不再划分年轻代和老年代,但仍然保留该概念)
- 年轻代和老年代不再物理隔离(内存中每个可用状态都可以自由地被分为年轻代/老年代)
Object的finalize()方法的作用
- 与C++的析构函数不同,析构函数调用确定,而finalize()是不确定的
- 将未被引用的对象放置于F-Queue队列
- 方法执行中随时可能会被终止
- 给予对象最后一次重生机会
Java中的强引用,软引用,弱引用,虚引用有什么区别
强引用(Strong Reference)
最普遍的引用:
1
Object o = new Object();
当内存空间不足时,即使抛出OutOfMemortError终止程序也不会回收具有强引用的对象
通过将对象设置为null来弱化引用,使其被回收
软引用(Soft Reference)
对象处在有用但非必须的状态
只有当内存空间不足时,GC会回收该引用的对象的内存
可以用来实现高速缓存
1
2String str = new String("hello"); // 强引用
SoftReference<String> sr = new SoftReference<String>(str); // 软引用
弱引用(Weak Reference)
非必需对象,比软引用更弱一些
GC时会被收回
被回收的概率也不大,因为GC线程优先级比较低
适用于引用偶尔被使用且不影响垃圾收集的对象
1
2String str = new String("hello"); // 强引用
WeakReference<String> wr = new WeakReference<String>(str); // 弱引用
虚引用(Phantom Reference)
不会决定对象的生命周期
类似于没有被引用,任何时候都可能被垃圾收集器回收
跟踪对象被垃圾收集器回收的活动
必须和引用队列ReferenceQueue联合使用
1
2
3String str = new String("hello"); // 强引用
ReferenceQueue q = new ReferenceQueue();
PhantomReference r = new PhantomReference(str, q); // 虚引用- 引用队列:
- 无实际存储结构,存储逻辑依赖于内部节点之间的关系来表达(类似链表)
- 存储关联的且被GC引用(回收)的软引用,弱引用以及虚引用
- 引用队列: