0x01.一道面试题

请阐述Java自带哪些加载器以及对应的职责?

(1)Bootstrap ClassLoader(启动类加载器):负责加载<JAVA_HOME>\lib目录,或-Xbootclasspath指定目录下的jar。 特殊说明:JVM认为合理的jar文件名才会被加载,例如:rt.jar、tools.jar,文件名不符合的jar即使放在上述目录下也不会被加载。

(2)Extension ClassLoader(扩展类加载器):负责加载<JAVA_HOME>\lib\ext目录,或java.ext.dirs指定目录下的jar。 特殊说明:Java9以后引入了模块化机制,此加载器被此机制取代。

(3)Application ClassLoader(应用程序类加载器):负责加载用户类路径(ClassPath)上的jar包。

此题考察JVM的类加载机制,关于类加载机制可以衍生出的考察方式也很多: 例如:请你选出哪些不是Java自带的类加载器; 例如:给出各类类加载器的描述、职责,选错误的; 例如:将上述类加载器的特殊说明作为干扰选项;

0x02.不要背,要理解

至此,我们似乎没必要大费周章地解读这样一道记忆题。背下来不就可以了吗?笔者认为不是: 发展24年的Java及JVM,历经若干版本的商业斗争[1],衍生出若干语(语)言(法)特(陷)性(阱)。 “背下来就行"的前提有二,可惜对于Java这些语(语)言(法)特(陷)性(阱)都不成立:

(1)知识输入是无二义性的、与时俱进的。 (2)知识输入是有限集。

所以,笔者坚定的认为只有Java程序员最有资格喊出”我秃了,我也变强了"。 所以,笔者坚定的认为只有”深刻理解JVM"(即,深刻理解语法特性到JVM层,甚至操作系统层),是Java程序员的最有效的防秃良药。 1

[1]:A new future for Java:https://theboreddev.com/a-new-future-for-java/

0x03.从韩国星工厂看类加载机制的全貌

From《深入理解Java虚拟机》-周志明

Java虚拟机将描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终变成被虚拟机可以直接使用的Java类型,这个过程被称作Java虚拟机的类加载机制……与那些在编译时需要进行连接的语言不同,在Java语言里面,类型的加载、连接和初始化过程都是在程序运行期间完成的……用户可以通过Java预置的或自定义类加载器…作为其程序代码的一部分。

从这段经典且严谨的描述,我们可以抽象8个问题,以此宏观地获得类加载机制的全貌:

1
2
3
4
5
6
7
8
问题1:加载什么?
问题2:加载得到了什么?
问题3:从哪里加载?
问题4:加载到哪里去?
问题5:何时加载?
问题6:加载流程有几步?
问题7:加载流程如何实现?
问题8:类加载器的约束?

(1)加载什么?

我们在.java文件中编写了一堆代码,被转换成字节码(.class文件),JVM加载就是这个字节码。 这个字节码描述的信息[2]包括(但不限于):

1
2
3
4
有哪些类、哪些接口;
每个类有哪些属性、行为;
类和类的关系;
...

这些信息就是程序员定义的"模板”,在程序运行时,当需要基于类A创建实例对象a时,JVM就要先找到类A对应的"模板”。

这些"模板”,就像韩国星工场包装女团时的"剧本”,每个女星都是基于某个"模板"创建的实例对象,女星的身高、体重、才艺就是"模板"中描述的"属性、行为”。 2

[2]本文聚焦类加载机制的全貌,在后续文章中展开

(2)加载得到了什么?

字节码加载到内存后得到的信息内容还是(1)中提到的字节码中包含的信息,但信息形式变了,抽象、简单地理解为JVM能认识的数据结构[3]。

这就像娱乐公司的策划团队在电脑上写好了女团出道的"剧本”,女团的经纪人要无差错地仔细阅读"剧本"的电子件,把"剧本"存储在大脑中,以备后续使用。 3

[3]本文聚焦类加载机制的全貌,在后续文章中展开

(3)从哪里加载?

用一张表,说明字节码文件与经纪人的类比关系:

t1

这一点也是JVM给Java程序员的自由,很多著名的产品就是在这个点上做了文章。

(4)加载到哪里去?

这个问题最好回答:内存,具体指的是JVM的运行时数据区,再具体一点是运行时数据区中的方法区[4]

4

[4]本文聚焦类加载机制的全貌,在后续文章中展开

(5)何时加载?

类加载发生在运行时,这也是Java、C#这类语言推崇的动态性。

动态性是一把双刃剑,运行时加载意味着需要"边执行,边连接”。 这就好像女团经纪人不是提前把"剧本"烂熟于胸,而是到了女团演出现场,才掏出"剧本”,现场理解、现场执行。 以现实生活的经验,这样的经纪人,看起来不太靠谱。

当然,动态性一定是源于某些特定场景和需求,Java为了靠谱,也引出了虚拟机中另一个大的课题:JIT(即时编译),围绕着"如何提升运行时的编译效率"会有很多有趣的故事。

(6)加载流程有几步?

在(2)中我们提到女团的经纪人要无差错地仔细阅读"剧本"的电子件,关键词是无差错 我们再用一张表,类比一下[5]

image-20200905163221231

表格中存在不严谨(通俗)的表达,但相信读者已经关注到了两个核心要点:

1
2
(1)加载流程有几步
(2)每一步的作用是什么

[5]上述加载流程每一步存在一些JVM实现的细节,例如:上述步骤一定是顺序执行的吗?例如:直接引用需要反复解析吗?这些都有必要详细解读,本文暂不展开

5

(7)加载流程如何实现?

至此,终于可以和本文开头的面试题呼应上了,前文我们探讨了

1
加载什么=>加载得到了什么=>从哪里加载=>加载到哪里去=>何时加载=>加载流程有几步

那么这都是JVM的规范、规格,怎么实现?类加载器就是类加载机制的具体实现。 不同类型的加载器相当于公司不同的角色,都去自己专属的文件夹去查找并加载类

1
2
3
Bootstrap加载器相当于经济公司老板
Extension加载器相当于经纪人
Application加载器相当于女团艺人

(8)类加载器的约束?

既然有不同的类加载器,它们之间必然有配合关系,否则两个人干了同一个工作,对外口径还不同,咋办? JVM定义了这种配合关系,还取了个高大上的名字"双亲委派模型”,笔者认为这种模型应该叫"保姆式管理模型” 还是一张表类比一下:

image-20200905163353382

6

双亲委派模型,本质上是说"领导先上,领导不行我再上”。 这种管理风格,自然也有弊端。历史上有4次破坏双亲委派模型[6]的事件。 破坏双亲委派模型的本质,是"管理团队的风格多样化”,例如:“扁平化团队”、“先干了再说团队"等等。

[6]每种"管理风格"也各有利弊,这也是JVM发展历程中可以仔细学习的技术点,笔者在后续文章中再来探讨

0x03 小结

我们从一道面试题开始,通过8个问题看到了类加载机制的全貌。

1
加载什么->加载得到了什么->从哪里加载->加载到哪里去->何时加载->加载流程有几步->加载流程如何实现->类加载器的约束

本文篇幅有限,还留下了一些重要、有趣的细节,未来笔者还会继续展开

1
2
3
4
5
字节码描述的信息
JVM能认识的数据结构
方法区的结构
加载流程每一步存在一些JVM实现的细节
破坏双亲委派模型

最后,笔者还想谈谈"理解优于记忆"的个人观点:深入理解JVM的原理对于实战的意义就是"先验知识”,是"性能调优、内存泄露、OSGI"等疑难杂症、高级框架的"基础”,如果能看到这类面试题背后的Why、What、How,您就获得了探寻计算机秘境的不二法门。