Java 虚拟机经典六问

OPEN编辑 5年前
   <p>大家好,我是郑雨迪。很荣幸,我开设的 <a href="https://time.geekbang.org/column/intro/108?utm_term=zeusBQ3UW&utm_source=website&utm_medium=infoq" rel="nofollow,noindex">《深入拆解 Java 虚拟机》</a> 专栏得到了大家的青睐,有了 20000+ 的订阅。很显然,现在越来越多的程序员意识到了 Java 虚拟机的重要性,渴望去了解底层,迫切想通过系统性的学习深入 Java 虚拟机,达到“知其然且知其所以然”的目的。 </p>    <p>在专栏开更到完结期间,我收到了不下几千条问题,尽量都做了解答。现特意整理出了 6 个高频问题,分享给大家,算做一篇加餐文。希望大家能继续深耕 JVM,提升日常编程的效率,实现技术进阶,挖掘到更多的宝藏。</p>    <h2>Java 是如何在保证可移植性的前提下提供高执行效率的?</h2>    <p><img src="https://simg.open-open.com/show/81a1a22df96e38bdd932cc7447972b04.png" alt="Java 虚拟机经典六问" width="550" height="344">Java 程序最为常见的执行方式,是预先编译为一种名为 Java 字节码的中间代码格式。这种代码格式无法直接运行在 CPU 之上,而是需要借助 JVM 来执行。换句话说,只要某个平台提供了合乎 JVM 规范的实现,它便能执行这份 Java 字节码。这也就是我们经常说的“一次编写,到处运行”。 </p>    <p>主流的 OpenJDK/OracleJDK 中所提供的 JVM 叫做 HotSpot。它同时采用了解释执行和即时编译。解释执行就好比同声传译,JVM 一边理解输入的字节码一边向 CPU 发出指令序列;即时编译则是“磨刀不误砍柴工”,JVM 会在运行过程中将热点代码编译成为可直接执行的二进制代码。</p>    <p>这种混合执行模式是建立在程序符合二八定律的假设上,即百分之二十的代码占据了百分之八十的计算资源。对于不常用代码,我们无需耗费时间将其编译成二进制代码,而是采取解释执行的方式运行;另一方面,对于仅占据小部分的热点代码,JVM 则会花费时间将其编译为二进制代码,以达到理想的运行效率。</p>    <h2>异常捕获是如何实现的?</h2>    <p><img src="https://simg.open-open.com/show/d87b6cb7a29a327b3ace0cd6c7ec4724.png" alt="Java 虚拟机经典六问" width="550" height="223"></p>    <p>在编译生成的 Java 字节码中,每个方法都附带一个异常表。异常表中的每一行均定义了一条异常执行路径,其中包括规定捕获范围的起始字节码索引、终止(不包含)字节码索引,异常处理代码的起始字节码索引,以及所捕获的异常类型。</p>    <p>当程序触发异常时,JVM 会从上至下遍历异常表中的所有条目。当触发异常的字节码的索引值在某行异常表条目的捕获范围内,JVM 会判断所抛出的异常和该条目想要捕获的异常是否匹配。如果匹配,JVM 会将控制流转移至该条目所指向的异常处理代码。</p>    <p>上述异常捕获机制还被用于 finally 从句的实现。通常,Java 程序的编译器 javac 会复制多份 finally 代码块,放置于生成的 Java 字节码之中,然后通过生成多行异常表条目,来实现完整的 finally 逻辑。</p>    <h2>反射调用为什么慢?</h2>    <p><img src="https://simg.open-open.com/show/53f3e666a671659418b817f212854830.png" alt="Java 虚拟机经典六问" width="550" height="173">默认情况下,反射调用首先会被委派给 native 方法来进行。可想而知,其运行效率低下。当某个反射调用的调用次数达到 15 之后,JDK 代码断定该调用属于热点调用。继而,JDK 将动态生成直接调用目标方法的字节码,并将反射调用的委派对象由原本的 native 方法实现切换至该动态生成的实现。这种方式的运行效率相对于 native 方法来说要高很多。 </p>    <p>之所以 JDK 不从一开始便采用动态生成字节码的方式,主要是因为生成过程需要耗费一定的时间。对于那些整个生命周期中仅执行数次的反射调用,动态生成字节码将得不偿失。</p>    <p>然而,即便是直接调用目标方法的动态实现,其峰值性能也无法跟真正的直接调用相媲美。这背后涉及到即时编译中的虚方法内联。</p>    <p>相关文章: <a href="/misc/goto?guid=5048130576395632329" rel="nofollow,noindex">< 方法内联(下)></a></p>    <h2>垃圾回收的基础思想是什么?</h2>    <p><img src="https://simg.open-open.com/show/83f54e33ecd77c92e530c49a3e8a47bd.png" alt="Java 虚拟机经典六问" width="550" height="175">目前 JVM 的主流垃圾回收器采取的都是可达性分析算法。该算法的实质是将一系列被称为 GC Roots 的对象作为初始的存活对象合集,然后从该合集出发探索所有能够被该集合引用到的对象,并标记为存活对象。当标记阶段结束之后,未被标记到的对象便是可以清除的。 </p>    <p>传统的垃圾回收算法在标记、清除过程中需要中止其他应用线程,即所谓的 Stop-The-World。新型的垃圾回收算法,如 CMS、G1 以及 ZGC,尽可能地实现并发标记、清除,从而让 Stop-The-World 的时间长度可控。</p>    <p>垃圾回收的另一基础思想则是分代回收。JVM 会将新生成的对象划为新生代,而将在多次垃圾回收中存活下来的对象划为老年代。JVM 会为不同的分代设置不同的回收算法,从而达到新生代多收集、快收集,老年代少收集、全收集的目标。</p>    <h2>如何理解 Java 内存模型?</h2>    <p>现代计算机多为对称多处理器的体系架构。每个处理器均有独立的寄存器组和缓存(这在 Java 内存模型中被抽象为工作内存);多个处理器可同时执行同一进程中的不同线程。</p>    <p>在 Java 程序中,不同线程可能访问同一变量或对象。如果任由编译器或处理器对这些访问进行优化,则很可能出现在单线程执行思维下无法想象的问题。因此,Java 语言规范引入了 Java 内存模型,通过定义多项规则对编译器和处理器进行限制。</p>    <p>这些规则所体现的最为重要的属性便是可见性,即对某一变量的访问能否被同一线程的其他操作,或者不同线程所观测到。Java 内存模型引入了多种 happens-before 关系,以实现上述可见性。以 volatile 字段为例,对其的写操作 happens before 这之后的读操作,也就是说,我们总能读到 volatile 字段的最新值。</p>    <h2>JVM 如何应对对象锁的各种场景?</h2>    <p>重量级锁是最为基础、最为低效的对象锁实现。JVM 会阻塞加锁失败的线程,并且在目标锁被释放的时候,唤醒这些线程。我们用等红灯作类比。Java 线程进入阻塞状态相当于熄火停车,再次点火启动必然耗费时间。JVM 会在进入阻塞状态之前进行自旋,也就是怠速停车。如果目标锁能够在短时间内被释放出来,该线程便能够不进入阻塞状态,直接获取该锁。</p>    <p>重量级锁针对的是多个线程同时竞争同一把锁的场景。在现实中,多个线程可能在不同时间段持有同一把锁。为了应对这种没有锁竞争的情况,JVM 采用了轻量级锁机制。在加锁时,JVM 将在锁对象处做标记,指向当前线程的栈上;在解锁时,上述标记会被清除。如果某线程在请求锁时,发现该锁为轻量级锁,并且指向另一线程所对应的栈,那么它会将该锁膨胀为重量级锁。</p>    <p>偏向锁所应对的场景则更为乐观:至始至终只有一个线程请求某把锁。JVM 采取的做法是在第一次加锁时为锁对象做标记,使其指向当前线程的地址;在解锁时则不做任何操作。如果下一次请求该锁的仍是同一线程,便直接跳过标记过程;否则,JVM 会将该锁膨胀为轻量级锁。</p>    <p>文章出自极客时间 <a href="https://time.geekbang.org/column/intro/108?utm_term=zeusBQ3UW&utm_source=website&utm_medium=infoq" rel="nofollow,noindex">《深入拆解 Java 虚拟机》</a> 专栏。</p>