个人笔记,深入理解 JVM,很全!

  • 2021-11-20
  • Admin

6bbd66024cb7272045abb8115d2f989f.png

来源 | yinzige.com/2020/03/08/understanding-jvm-3ed/

01、前言

刷豆瓣看到《深入理解 JVM》出第三版了,遂买之更新 JVM 知识,本文为笔记,仅供个人 Review

02、Java 内存区域与内存溢出

03、运行时数据区域

1346f6dbdd79bf6621a95a864a6799a4.png

参考:JVM 规范,Memories of a Java Runtime

:JVM 启动时按-Xmx, -Xms大小创建的内存区域,用于分配对象、数组所需内存,由 GC 管理和回收

方法区:存储被 JVM 加载的类信息(字段、成员方法的字节码指令等)、运行时常量池(字面量、符号引用等)、JIT 编译后的 Code Cache 等信息;JDK8 前 Hotspot 将方法区存储于永久代堆内存,之后参考 JRockit 废弃了永久代,存储于本地内存的 Metaspace 区

如果您正在学习Spring Boot,推荐一个连载多年还在继续更新的免费教程:http://blog.didispace.com/spring-boot-learning-2x/

直接内存:JDK1.4 引入 NIO 使用 Native/Unsafe 库直接分配系统内存,使用 Buffer,Channel 与其交互,避免在系统内存与 JVM 堆内存之间拷贝的开销

线程私有内存

  • 程序计数器:记录当前线程待执行的下一条指令位置,上下文切换后恢复执行,由字节码解释器负责更新

  • JVM 栈

  • 描述 Java 方法执行的内存模型:执行新方法时创建栈帧,存储局部变量表、操作数栈等信息

  • 存储单位:变量槽 slot,long, double占 2 个 slot,其他基本数据类型、引用类型占 1 个,故表的总长度在编译期可知

  • 本地方法栈:执行本地 C/C++ 方法


04、JVM 对象

1. 创建对象

分配堆内存:类加载完毕后,其对象所需内存大小是确定的;堆内存由多线程共享,若并发创建对象都通过 CAS 乐观锁争夺内存,则效率低。故线程创建时在堆内存为其分配私有的分配缓冲区(TLAB:Thread Local Allocation Buffer)

  • 内存模型

e46b11972fff92d138fc301cec58169c.png

  • 分配流程

21f378a47c87ad03470886c3ea15bfc5.png

注:当 TLAB 剩余空间不足以分配新对象,但又小于最大浪费空间阈值时,才会加锁创建新的 TLAB

零值初始化对象的堆内存、设置对象头信息、执行构造函数 ()V

2. 对象的内存布局

对象头

  • Mark Word:记录对象的运行时信息,如 hashCode,GC 分代年龄,尾部 2 bit 用于标记锁状态

054d11e248fed2caacfb2e31ace8b284.png

  • Class Pointer:指向所属的类信息

  • 数组长度(可选,对象为数组):4 字节存储其长度

对象数据:各种字段的值,按宽度分类紧邻存储

对齐填充:内存对齐为 1 个字长整数倍,减少 CPU 总线周期

如果您正在学习Spring Boot,推荐一个连载多年还在继续更新的免费教程:http://blog.didispace.com/spring-boot-learning-2x/

验证:openjdk/jol 检查对象内存布局

  1. public class User {
  2. private int age = -1;
  3. private String name = "unknown";
  4. }
  5. // java -jar ~/Downloads/jol-cli-latest.jar internals -cp . com.jol.User
  6. OFF  SZ               TYPE DESCRIPTION               VALUE
  7. 0   8                    (object header: mark)     0x0000000000000001 (non-biasable; age: 0)
  8. 8   4                    (object header: class)    0xf8021e85 // User.class 引用地址
  9.  12   4                int User.age                  -1         // 基本类型则直接存储值
  10.  16   4   java.lang.String User.name                 (object)   // 引用类型,指向运行时常量池中的 String 对象
  11.  20   4                    (object alignment gap)               // 有 4 字节的内存填充
  12. Instance size: 24 bytes

05、内存溢出

堆内存-Xms指定堆初始大小,当大量无法被回收的对象所占内存超出-Xmx上限时,将发生内存溢出 OutOfMemoryError

  • 排查:通过 Eclipse MAT 分析 -XX:+HeapDumpOnOutOfMemory生成的 *.hprof 堆转储文件,定位无法被回收的大对象,找出其 GC Root 引用路径

  • 解决:若为内存泄露,则修改代码用null显式赋值、虚引用等方式及时回收大对象;若为内存溢出,大对象都是必须存活的,则调大-Xmx、减少大对象的生命周期、检查数据结构使用是否合理等

  1. // -Xms20m -Xmx20m -XX:+HeapDumpOnOutOfMemoryError
  2. public class HeapOOM {
  3.  static class OOMObject {}
  4.  public static void main(String[] args) {
  5.   List vs = new ArrayList<>();
  6.   while (true)
  7.      vs.add(new OOMObject());
  8.  }
  9. }

分析 GC Root 发现com.ch02.HeapOOM对象间接引用了大量的OOMObject对象,共占用 15.4MB 堆内存,无法回收最终导致 OOM

bb9ef39f5d4504a5d200d866252bd3b4.png

栈内存-Xss指定栈大小,当栈深度超阈值(比如未触发终止条件的递归调用)、本地方法变量表过大等,都可能导致内存溢出 StackOverflowError

方法区-XX:MetaspaceSize指定元空间初始大小,-XX:MaxMetaspaceSize指定最大大小,默认 -1 无限制,若在运行时动态生成大量的类,则可能触发 OOM

运行时常量池strObj.intern()动态地将首次出现的字符串对象放入字符串常量池并返回,JDK7 前会拷贝到永久代,之后则直接引用堆对象

  1. String s1 = "java"// 类加载时,从字节码常量池中拷贝符号到了运行时常量池,在解析阶段初始化的字符串对象
  2. String s2 = "j";
  3. String s3 = s2 + "ava"// 堆上动态分配的字符串对象
  4. println(s3 == s1);          // false
  5. println(s3.intern() == s1); // true // 已在字符串常量池中存在

直接内存-XX:MaxDirectMemorySize指定大小,默认与-Xmx一样大,不被 GC 管理,申请内存超阈值时 OOM


06、垃圾回收与内存分配

GC 可分解为 3 个子问题:which(哪些内存可被回收)、when(什么时候回收)、how(如何回收)

07、GC 条件

1. 引用计数算法(reference counting)

原理:每个对象都维护一个引用计数器rc,当通过赋值、传参等方式引用它时rc++,当引用变量修改指向、离开函数作用域等方式解除引用时rc--,递减到 0 时说明对象无法再被使用,可回收。伪代码:

  1. assign(var, obj):
  2. incr_ref(obj) # self = self # 先增再减,避免引用自身导致内存提前释放
  3. decr_ref(var)
  4. var = obj
  5.  
  6. incr(obj):
  7. obj.rc++
  8. decr(obj):
  9. obj.rc--
  10. if obj.rc == 0:
  11.   remove_ref(obj) # 断开 obj 与其他对象的引用关系
  12.   gc(obj)         # 回收 obj 内存

优点:思路简单,对象无用即回收,延迟低,适合内存少的场景

缺点:此算法中对象是孤立的,无法在全局视角检查对象的真实有效性,循环引用的双方对象需引入外部机制来检测和回收,如下图红色圈(图源:what-is-garbage-collection)

如果您正在学习Spring Boot,推荐一个连载多年还在继续更新的免费教程:http://blog.didispace.com/spring-boot-learning-2x/

2083955b18ea1f3950469bdbd5edb64c.png

2. 可达性分析算法(reachability analysis)

原理:从肯定不会被回收的对象(GC Roots)出发,向外搜索全局对象图,不可达的对象即无法再被使用,可回收;常见可作为 GC Root 的对象有:

  • 执行上下文:JVM 栈中参数、局部变量、临时变量等引用的堆对象

  • 全局引用:方法区中类的静态引用、常量引用(如 StringTable 中的字符串对象)所指向的对象

优点:无需对象维护 GC 元信息,开销小;单次扫描即可批量识别、回收对象,吞吐高

缺点:多线程环境下对象间的引用关系随时在变化,为保证 GC Root 标记的准确性,需在不变化的 snapshot 中进行,会产生 Stop The World(以下简称 STW) 卡顿现象

33d8b10e3c3b520d01ec3016dba55eff.png

3. 四种引用类型

引用类型回收时机
强引用-只要与 GC Root 存在引用链,则不被回收
软引用SoftReference只被软引用所引用的对象,当 GC 后内存依然不足,才被回收
弱引用WeakReference只被弱引用所引用的对象,无论内存是否足够,都将被回收
虚引用PhantomReference被引用的对象无感知,进行正常 GC,仅在回收时通知虚引用(回调)

示例:限制堆內存 50MB,其中新生代 30MB,老年代 20MB;依次分配 5 次 10MB 的byte[]对象,仅使用软引用来引用,观察 GC 过程

  1. public static void main(String[] args) {
  2. // softRefList --> SoftReference --> 10MB byte[] 
  3. Listbyte[]>> softRefList = new ArrayList<>();
  4. ReferenceQueue<byte[]> softRefQueue = new ReferenceQueue<>(); // 无效引用队列
  5. for (int i = 0; i < 5; i++) {
  6.   SoftReference<byte[]> softRef = new SoftReference<>(new byte[10*1024*1024], softRefQueue);
  7.   softRefList.add(softRef);
  8.   for (SoftReference<byte[]> ref : softRefList) // dump 所有软引用指向的对象,检查是否已被回收
  9.       System.out.print(ref.get() == null ? "gced " : "ok ");
  10.   System.out.println();
  11. }
  12. Referencebyte[]> ref = softRefQueue.poll();
  13. while (ref != null) {
  14.   softRefList.remove(ref); // 解除对软引用对象本身的引用
  15.   ref = softRefQueue.poll();
  16. }
  17. System.out.println("effective soft ref: " + softRefList.size()); // 2
  18. }
  19. // java -verbose:gc -XX:NewSize=30m -Xms50m -Xmx50m -XX:+PrintGCDetails com.ch02.DemoRef
  20. ok 
  21. ok ok 
  22. // 分配第三个 []byte 时,Eden GC 无效,触发 Full GC 将一个 []byte 晋升到老年区
  23. // 此时三个 byte[] 都只被软引用所引用,被标记为待二次回收(若为弱引用,此时 Eden 已被回收)
  24. [GC (Allocation Failure) --[PSYoungGen: 21893K->21893K(27136K)] 21893K->32141K(47616K), 0.0046324 secs]
  25. [Full GC (Ergonomics) [PSYoungGen: 21893K->10527K(27136K)] [ParOldGen: 10248K->10240K(20480K)] 32141K->20767K(47616K), [Metaspace: 2784K->2784K(1056768K)], 0.004 secs]
  26. ok ok ok
  27. // 再次 GC,前三个 byte[] 全部被回收
  28. [GC (Allocation Failure) --[PSYoungGen: 20767K->20767K(27136K)] 31007K->31007K(47616K), 0.0007963 secs]
  29. [Full GC (Ergonomics) [PSYoungGen: 20767K->20759K(27136K)] [ParOldGen: 10240K->10240K(20480K)] 31007K->30999K(47616K), [Metaspace: 2784K->2784K(1056768K)], 0.003 secs]
  30. [GC (Allocation Failure) --[PSYoungGen: 20759K->20759K(27136K)] 30999K->30999K(47616K), 0.0007111 secs]
  31. [Full GC (Allocation Failure) [PSYoungGen: 20759K->0K(27136K)] [ParOldGen: 10240K->267K(20480K)] 30999K->267K(47616K), [Metaspace: 2784K->2784K(1056768K)], 0.003 secs]
  32. gced gced gced ok
  33. gced gced gced ok ok

4. finalize

原理:若对象不可达,被标记为可回收后,会进行finalize()是否被重写、是否已执行过等条件筛选,若通过则对象会被放入 F-Queue 队列,等待低优先级的后台 Finalizer 线程触发其finallize() 的执行(不保证执行结束),对象可在finalize中建立与 GC Root 对象图上任一节点的引用关系,来逃脱 GC

使用:finalize 机制与 C++ 中的析构函数并不等价,其执行结果并不确定,不推荐使用,可用try-finally替代


08、GC 算法

分代收集理论

两个分代假说:符合大多数程序运行的实际情况

  • 弱分代假说:绝大多数对象是朝生夕灭,生存时间极短

  • 强分代假说:熬过越多次 GC 的对象,越可能被继续使用,越难以回收

对应地,JVM 堆被划分为 2 个不同区域,将对象按年龄分类,兼顾了 GC 耗时与内存利用率

  • 新生代:大量对象将被回收,只关注仍存活的对象,逐步晋升

  • 老年代:大量对象不被回收,只关注要被回收的对象

跨代引用

  • 问题:老年代会引用新生代,新生代 GC 时需遍历老年代中大量的存活对象,分析可达性,时间复杂度高

  • 背景:相互引用的对象倾向于同时存亡,比如跨代引用关系中的新生代必然会逐步晋升,最终消除跨代关系

  • 假说:跨代引用相比同代引用只占极少数,无需全量扫描老年代

  • 实现:新生代维护全局数据结构:记忆集(Remembered Set),将老年代分为多个子块,标记存在跨代引用的子块,等待后续扫描;代价:为保证记忆集的正确性,需在跨代引用建立或断开时保持同步

2fd4fe00a32f8ed02d90436fc7483e9a.png

09、标记清除:Mark-Sweep

  • 原理:标记不可达对象,统一清理回收,反之亦可

  • 缺点:执行效率不稳定,回收耗时取决于活跃对象的数量;内存碎片多,会出现内存充足但无法分配过大的连续内存(数组)

3dc4e88a1b1baa745ca739cfe9afe0ee.png

10、标记复制:Mark-Copy

  • 理论:将堆内存切为两等份 A, B,每次仅使用 A,用完后标记存活对象复制到 B,清空 A 后执行 swap

  • 优点:直接针对半区回收,无内存碎片问题;分配内存只需移动堆顶指针,高效顺序分配

  • 缺点:当 A 区有大量存活对象时,复制开销大;B 区长时间闲置,内存浪费严重

  • 实践:对于存活对象少的新生代,无需按 1:1 分配,而是按 8:1:1 的内存布局,其中 Eden 和 From 区同时使用,只有 To 区会被闲置(担保机制:若 To 区不够容纳 Minor GC 后的存活对象,则晋升到老年区)

bc7cfbf458fda74ba14662fa548f3b03.png

11、标记整理:Mark-Compact

  • 原理:标记存活对象后统一移动到内存空间一侧,再回收边界之外的内存

  • 优点:内存模型简单,无内存碎片,降低内存分配和访问的时间成本,能提高吞吐

  • 缺点:对象移动需 STW 同步更新引用关系,会增加延迟

67662d2863be5f82292069679fe5eeb0.png


12、HotSpot GC 算法细节

13、发起 GC:安全点与安全区域

  • 问题:为保证可达性分析结果的准确性,需挂起用户线程(STW),再从各线程的执行上下文中收集 GC Root,如何通知线程挂起?

  • 安全点:HotSpot 内部有线程中断标记;在各线程的方法调用、循环跳转、异常跳转等会长时间执行的指令处,额外插入检查该标记的test高效指令;若轮询发现标记为真,线程会主动在最近的 SafePoint 处挂起,此时其栈上对象的引用关系不再变化,可收集 GC Root 对象

  • 如果您正在学习Spring Boot,推荐一个连载多年还在继续更新的免费教程:http://blog.didispace.com/spring-boot-learning-2x/

  • 安全区域:引用关系不会变化的指令区域,可安全地收集 GC Root;线程离开此区域时,若 GC Root 收集过程还未结束,则需等待

示意图

4e3a847ebfd0cb0a1777c18e4d318551.png

14、加速 GC:CardTable

问题:非收集区域(老年代)会存在到收集区域(新生代)的跨代引用,如何避免对前者的全量扫描?

卡表:记忆集的字节数组实现;将老年代内存划分为 Card Page(512KB)大小的子内存块,若新建跨代引用,则将对应的 Card 标记为 dirty,GC 时只需扫描老年代中被标记为 dirty 的子内存块

3a4b29e59c377de840ab1ca255e1faa2.png

写屏障:有别于volatile禁用指令重排的内存屏障,GC 中的写屏障是在对象引用更新时执行额外 hook 动作的机制。简单实现:

  1. void oop_field_store(oop* field, oop new_val) { // oop: ordinary object pointer
  2. // pre_write_barrier(field, new_val); // 写前屏障:更新前先执行,使用 oop 旧状态
  3. *field = new_val;
  4. post_write_barrier(field, new_val); // 写后屏障:更新完才执行
  5. }

使用写屏障保证 CardTable 的实时更新(图源:The JVM Write Barrier - Card Marking)

4474d57242913401993731e33c303dd5.png

15、正确 GC:并发可达性分析

参考演讲:Shenandoah: The Garbage Collector That Could by Aleksey Shipilev

问题:GC Roots 的对象源固定,故枚举时 STW 时间短暂且可控。但后续可达性分析的时间复杂度与堆中对象数量成正相关,即堆中对象越多,对象图越复杂,堆变大后 STW 时间不可接受

解决:并发标记。引出新问题:用户线程动态建立、解除引用,标记过程中图结构发生变化,结果不可靠;证明:用三色法描述对象状态

如果您正在学习Spring Boot,推荐一个连载多年还在继续更新的免费教程:http://blog.didispace.com/spring-boot-learning-2x/

  • 白色:未被回收器访问过的对象;分析开始都是白色,分析结束还是白色则不可达

  • 灰色:被回收器访问过,但其上至少还有 1 个引用未被扫描(中间态)

  • 黑色:被回收器访问过,其上引用全部都已被扫描,存在引用链,为存活对象;若其他对象引用了黑色对象,则不必再扫描,肯定也存活;黑色不可能直接引用白色

STW 无并发的正确标记:顶部 3 个对象将被回收

b31f8c606d8c809395f1054a892cb096.png

用户线程并发修改引用,会导致标记结果无效,分 2 种情况:

  • 少回收,对象标记为存活,但用户解除了引用:产生浮动垃圾,可接受,等待下次 GC

e20dfbc616dd75121ec047d89f2024b7.png

  • 误回收,对象标记为可回收,但用户新建了引用:实际存活对象被回收,内存错误

a6dcb613aca4dfca769d507ef5ab2a76.png

论文《Uniprocessor Garbage Collection Techniques - Paul R. Wilson》§3.2 证明了「实际存活的对象被标记为可回收」必须同时满足两个条件(有时间序)

  • 插入一条或多条从黑色到白色的新引用

  • 删除所有灰色到该白色的直接、间接引用

为正确实现标记,打破其中一个条件即可(类比打破死锁四个条件之一的思想),分别对应两种方案:

  • 增量更新 Increment Update:记录黑到白的引用关系,并发标记结束后,以黑为根,重新扫描;A 直接存活

  • 原始快照 SATB(Snapshot At The Begining):记录灰到白的解引用关系,并发标记结束后,以灰为根,重新扫描;B 为灰色,最后变为黑色,存活。需注意,若没有步骤 3,则 B,C 变为浮动垃圾


16、经典垃圾回收器

搭配使用示意图:

c08e05f58fb707dd547d6af190cb8c66.png

17、Serial, SerialOld

原理:内存不足触发 GC 后会暂停所有用户线程,单线程地在新生代中标记复制,在老年代中标记整理,收集完毕后恢复用户线程

优点:全程 STW 简单高效

缺点:STW 时长与堆对象数量成正相关,且 GC 线程只能用到 1 core 无法加速

场景:单核 CPU 且可用内存少(如百兆级),JDK1.3 之前的唯一选择

58fefebd37483fce879e38f80597029a.png

18、ParNew

原理:多线程并行版的 Serial 实现,能有效减少 STW 时长;线程数默认与核数相同,可配置

另外,如果您正在学习Spring Cloud,推荐一个连载多年还在继续更新的免费教程:https://blog.didispace.com/spring-cloud-learning/

场景:JDK7 之前搭配老年代的 CMS 回收器使用

a083361602e92a596c172a8f1ffa6fd6.png

19、Parallel, Parallel Old

垃圾回收有两个通常不可兼得的目标

  • 低延迟:STW 时长短,响应快;允许高频、短暂 GC,比如调小新生代空间,加快收集延迟(吞吐下降)

  • 高吞吐量:用户线程耗时 /(用户线程耗时 + GC 线程耗时)高,GC 总时间低;允许低频、单次长时间 GC,(延迟增加)

8b92bd9d01d10674a1e1011263badefd.png

原理:与 ParNew 类似都是并行回收,主要增加了 3 个选项(倾向于提高吞吐量)

  • -XX:MaxGCPauseTime:控制最大延迟

  • -XX:GCTimeRatio:控制吞吐(默认 99%)

  • -XX:+UseAdaptiveSizePolicy :启用自适应策略,自动调整 Eden 与 2 个 Survivor 区的内存占比-XX:SurvivorRatio,老年代晋升阈值 -XX:PretenureSizeThreshold

aa50c78856294948095a870f034ac5fe.png

20、CMS

CMS:Concurrent Mark Sweep,即并发标记清除,主要有 4 个阶段

  • 初始标记(initial mark):STW 快速收集 GC Roots

  • 并发标记(concurrent mark):从 GC Roots 出发检测引用链,标记可回收对象;与用户线程并发执行,通过增量更新来避免误回收

  • 重新标记(remark):STW 重新分析被增量更新所收集的 GC Roots

  • 并发清除(concurrent sweep):并发清除可回收对象

74b68bddd6c7e360aab1f9f627a54168.png

优点:两次 STW 时间相比并发标记耗时要短得多,相比前三种收集器,延迟大幅降低

缺点

  • CPU 敏感:若核数较少(< 4core),并发标记将占用大量 CPU 时间,会导致吞吐突降

  • 无法处理浮动垃圾:-XX:CMSInitiatingOccupancyFration(默认 92%)指定触发 CMS GC 的阈值;在并发标记、并发清理的同时,用户线程会产生浮动垃圾(引用可回收对象、产生新对象),若浮动垃圾占比超过-XX:CMSInitiatingOccupancyFration;若 GC 的同时产生过多的浮动垃圾,导致老年代内存不足,会出现 CMS 并发失败,退化为 Serial Old 执行 Full GC,会导致延迟突增

  • 无法避免内存碎片:-XX:CMSFullGCsBeforeCompaction(默认 0)指定每次在 Full GC 前,先整理老年代的内存碎片

  • 另外,如果您正在学习Spring Cloud,推荐一个连载多年还在继续更新的免费教程:https://blog.didispace.com/spring-cloud-learning/

21、G1

特点:基于 region 内存布局实现局部回收;GC 延迟目标可配置;无内存碎片问题

f808a3e8be6a637304849b22f5d2d3fe.png


G1之前回收器
堆内存划分方式多个等大的 region, 各 region 分代角色并不固定,按需在 Eden, Survivor, Old 间切换固定大小、固定数量的分代区域
回收目标回收价值高的 region 动态组成的回收集合新生代、整个堆内存

跨代引用:各 region 除了用卡表标记各卡页是否为 dirty 之外,还用哈希表记录了各卡页正在被哪些 region 引用,通过这种“双向指针”机制,能直接找到 Old 区,避免了全量扫描(G1 自身内存开销大头)

bdf41232ad57ace00ec889a4254aad11.png

G1 GC 有 3 个阶段(参考其 GC 日志)

  • 新生代 GC:Eden 区占比超阈值触发;标记存活对象并复制到 Survivor 区,其内可能有对象会晋升到 Old 区

6fea2e1f6b320fdbdeaed9c1c5f8363d.png

  • 老年代 GC:Old 区占比达到阈值后触发,执行标记整理

  • 初始标记:枚举 GC Roots,已在新生代 GC 时顺带完成

  • 并发标记:并发执行可达性分析,使用 SATB 记录引用变更

  • 重新标记:SATB 分析,避免误回收

  • 筛选回收:将 region 按回收价值和时间成本筛选组成回收集,STW 将存活对象拷贝到空 regions 后清理旧 regions,完成回收

  • 混合 GC

828f97e4ddab7fb51ff6dfaa826e5a95.png

参数控制(文档:HotSpot GC Tuning Guide)

参数及默认值描述
‐XX:+UseG1GCJDK9 之前手动启用 G1
-XX:MaxGCPauseMillis=200预期的最大 GC 停顿时间;不宜过小,避免每次回收内存少而导致频繁 GC
-XX:ParallelGCThreads=NSTW 并行线程数,若可用核数 M < 8 则 N=1,否则默认 N=M*5/8
-XX:ConcGCThreads=N并发阶段并发线程数,默认是 ParallelGCThreads 的 1/4
-XX:InitiatingHeapOccupancyPercent=45老年代 region 占比超过 45% 则触发老年代 GC
-XX:G1HeapRegionSize=N单个 region 大小,1~32MB
-XX:G1NewSizePercent=5, -XX:G1MaxNewSizePercent=60新生代 region 最小占整堆的 5%,最大 60%,超出则触发新生代 GC
-XX:G1HeapWastePercent=5允许浪费的堆内存占比,可回收内存低于 5% 则不进行混合回收
-XX:G1MixedGCLiveThresholdPercent=85老年代存活对象占比超 85%,回收价值低,暂不回收
-XX:G1MixedGCCountTarget=8单次收集中混合回收次数

22、内存分配策略

使用 Serial 收集器 -XX:+UseG1GC 演示

1. 对象优先分配在 Eden 区

新对象在 Eden 区分配,空间不足则触发 Minor GC,存活对象拷贝到 To Survivor,若还是内存不足则通过分配担保机制转移到老年区,依旧不足才 OOM

  1. byte[] buf1 = new byte[6 * MB];
  2. byte[] buf2 = new byte[6 * MB]; // 10MB 的 eden 区剩余 4MB,空间不足,触发 minor GC
  3. // java -verbose:gc -Xms20m -Xmx20m -Xmn10m -XX:+PrintGCDetails -XX:+UseSerialGC com.ch03.Allocation
  4. // minor gc 后新生代内存从 6M 降到 0.2M,存活对象移到了老年区,总的堆内存用量依旧是 6MB
  5. [GC (Allocation Failure) [DefNew: 6823K->286K(9216K), 0.002 secs] 6823K->6430K(19456K), 0.002 secs] [Times: user=0.00 sys=0.00real=0.00 secs] 
  6. Heap
  7.  def new generation   total 9216K, used 6513
  8. eden space 8192K,  76% used // buf2
  9. from space 1024K,  28% used
  10. to   space 1024K,   0% used 
  11.  tenured generation   total 10240K, used 6144K
  12.  the space 10240K,  60% used // buf1

2. 大对象直接进入老年区

对于 Serial, ParNew,可配置超过阈值 -XX:PretenureSizeThreshold 的大对象(连续内存),直接在老年代中分配,避免触发 minor gc,导致 Eden 和 Survivor 产生大量的内存复制操作

  1. byte[] buf1 = new byte[4 * MB];
  2. // java -verbose:gc -Xms20m -Xmx20m -Xmn10m -XX:+PrintGCDetails -XX:+UseSerialGC
  3. // -XX:PretenureSizeThreshold=3145728 com.ch03.Allocation // 3145728 即 3MB
  4. Heap
  5.  def new generation   total 9216K, used 843
  6. eden space 8192K,  10% used 
  7. from space 1024K,   0% used 
  8. to   space 1024K,   0% used 
  9.  tenured generation   total 10240K, used 4096
  10.  the space 10240K,  40% used // buf1

3. 长期存活的对象进入老年代

对象头中 4bit 的 age 字段存储了对象当前 GC 分代年龄,当超过阈值-XX:MaxTenuringThreshold(默认 15,也即

原文:https://blog.csdn.net/j3T9Z7H/article/details/121433350

联系站长

QQ:769220720

Copyright © SibooSoft All right reserved 津ICP备19011444号