如果说核心类库的 API 比做数学公式的话,那么 Java 虚拟机的知识就好比公式的推导过程
类生命周期
每本Java入门书籍在介绍Java这门语言的时候都会提到Java跨平台,“一次解释,到处运行的特点“,功臣就是jvm(Java Virtual Machine,Java虚拟机)。
但是,如果将jvm只与Java语言绑定在一起,那么理解就过于狭隘了,Java虚拟机发展到现在已经脱离了Java语言,形成了一套相对独立,高性能的执行方案。
除了以上提到的几种语言之外,scala,热门的kotlin都可以运行在jvm上面。
先简单看一下 JVM 内存结构,之后会详细讲解这一块的具体存储。
类从被加载到虚拟内存中开始,到卸载内存为止,它的整个生命周期包括:
小提示:
加载,是指查找字节流,并且据此创建类的过程。是类加载
过程的一个阶段。
虚拟机需要在这个过程完成三件事情:
从虚拟机的角度来说,只存在两种不同的类加载器:一种是启动类加载器(Bootstrap ClassLoader),该类加载器使用C++语言实现,属于虚拟机自身的一部分。另外一种就是所有其它的类加载器,这些类加载器是由Java语言实现,独立于JVM外部,并且全部继承自抽象类java.lang.ClassLoader。
启动类加载器负责加载最为基础、最为重要的类。负责将 JAVA_HOME/lib 下面的类库加载到内存中(比如rt.jar)。由于引导类加载器涉及到虚拟机本地实现细节,开发者无法直接获取到启动类加载器的引用,所以不允许直接通过引用进行操作。
注:启动类加载器是由 C++ 实现的,没有对应的 Java 对象,因此在 Java 中只能用 null 来指代。除了启动类加载器之外,其他的类加载器都是 java.lang.ClassLoader 的子类,因此有对应的 Java 对象。这些类加载器需要先由另一个类加载器,比如说启动类加载器,加载至 Java 虚拟机中,方能执行类加载。
它负责加载相对次要、但又通用的类,负责将 JAVA_HOME/jre/lib/ext 或者由系统变量 java.ext.dirs指定位置中的类库加载到内存中。
它负责将系统类路径(CLASSPATH) 中指定的类库加载到内存中。由于这个类加载器是ClassLoader中的 getSystemClassLoader()方法的返回值,因此一般称为系统(System)加载器
除了由 Java 核心类库提供的类加载器外,我们还可以加入自定义的类加载器,来实现特殊的加载方式。举例来说,我们可以对 class 文件进行加密,加载时再利用自定义的类加载器对其解密。
之所以写这个是因为平时开发中很少有人翻开这个文件夹来看,上面讲到这个目录顺便带着大家来看看。
双亲委派机制的工作流程:
每个类加载器都有自己的加载缓存,当一个类被加载了以后就会放入缓存,等下次加载的时候就可以直接返回了。
当前classLoader的缓存中没有找到被加载的类的时候,委托父类加载器去加载,父类加载器采用同样的策略,首先查看自己的缓存,然后委托父类的父类去加载,一直到bootstrp ClassLoader.
当所有的父类加载器都没有加载的时候,再由当前的类加载器加载,并将其放入它自己的缓存中,以便下次有加载请求的时候直接返回。
试想一下黑客自定义一个 java.lang.String 类,该 String 类具有系统的 String 类一样的功能,只是在某个函数稍作修改。 这个函数经常使用,假如在这这个函数中植入一些“病毒代 码”。并且通过自定义类加载器加入到 JVM 中。完了,程序凉凉,这是比较直观的理解。
要完全理解这个问题还需要引入一个概念,类的命名空间
。
类需要类的全限定名(类的全路径)以及加载此类的ClassLoader来共同确定。也就是说即使两个类的全限定名是相同的,但是因为不同的ClassLoader加载了此类,那么在JVM中它是不同的类。
比如上面说的,我们 JDK 本生提供的类库,比如 string,hashmap,linkedlist 等等,这些类由bootstrp 类加载器加载了以后,无论你程序中有多少个类加载器,那么这些类其实都是可以共享的,这样就避免了不同的类加载器加载了同样名字的不同类以后造成混乱。
概括:
当一个类被加载之后,必须要验证一下这个类是否合法,比如这个类是不是符合字节码的格式、变量与方法是不是有重复、数据类型是不是有效、继承与实现是否合乎标准等等。
我们平常写代码很多时候第一步都是写校验,jvm也是这个思路,Java 编译器生成的类文件必然满足 Java 虚拟机的约束条件,但是为了防止“解字节码注入”。
基于二进制字节流进行验证,只有通过了这个阶段的验证后,字节流才会进入内存的方法区中进行存储,所以后面的验证阶段全是基于方法区的存储结构进行的,不会再直接操作字节流。
如验证这个类是否有父类(除了java.lang.Object是所有类的父类),如果这个类不是抽象类是否实现了父类或者接口中要求实现的所有方法等。
如验证符号引用中通过字符串描述的全限定名是否能找到对应的类。
就是为类的静态变量分配内存并设为 jvm 默认的初值,而不是我们设置的
,我们设置的会在后面一个阶段“初始化”期间来做,对于非静态的变量,则不会为它们分配内存。
jvm默认的初值是这样的:
基本类型
(int、long、short、char、byte、boolean、float、double)的默认值为0。其中boolean只有true,false两种类型,对应到jvm值分别是数据1,0。
引用类型
(对象,数组)的默认值为null。
构造其他跟类层次相关的数据结构,比如说用来实现虚方法的动态绑定的方法表。
在 class 文件被加载至 Java虚拟机之前,这个类无法知道其他类及其方法、字段所对应的具体地址,甚至不知道自己方法、字段的地址。因此,每当需要引用这些成员时,Java 编译器会生成一个符号引用。在运行阶段,这个符号引用一般都能够无歧义地定位到具体目标上(因为验证阶段进行符号引用验证了)。
例外:public static final
int value=123,常量直接赋值为设置的123.
上面说到的“在运行阶段,这个符号引用一般都能够无歧义地定位到具体目标上”,就是在解析阶段进行的符号解析。
这个阶段目的正是将常量池中的符号引用转换解析成为实际引用。在解析阶段,jvm会将所有的类或接口名、字段名、方法名转换为具体的内存地址,从而让用到了别的类或者接口的类能找到和加载其他的类/接口。
如果符号引用指向一个未被加载的类,或者未被加载类的字段或方法,那么解析将触发这个类的加载(但未必触发这个类的链接以及初始化)
在 Java 代码中,如果要初始化一个静态字段,我们可以在声明时直接赋值,也可以在静态代码块中对其赋值。除了 final static 修饰的常量,直接赋值操作以及所有静态代码块中的代码,则会被 Java 编译器置于同一方法中,并把它命名为 < clinit >
。
类加载的最后一步是初始化,目的便是为标记为常量值的字段赋值,以及执行< clinit > 方法的过程。Java 虚拟机会通过加锁来确保类的 < clinit > 方法仅被执行一次。
当虚拟机启动时,初始化用户指定的主类(main函数);
当遇到用以新建目标类实例的 new 指令时,初始化 new 指令的目标类;
当遇到调用静态方法的指令时,初始化该静态方法所在的类;
子类的初始化会触发父类的初始化;
如果一个接口定义了 default 方法,那么直接实现或者间接实现该接口的类的初始化,会触发该接口的初始化;
使用反射 API 对某个类进行反射调用时,初始化这个类;
当初次调用 MethodHandle 实例时,初始化该 MethodHandle 指向的方法所在的类。
设计模式中单例延迟加载,便是充分利用了这个特点。
那么多的类,什么时候
卸载谁
呢?关于卸载谁,满足如下条件:
该类所有的实例都已经被回收,也就是java堆中不存在该类的任何实例;
加载该类的ClassLoader已经被回收;
该类对应的java.lang.Class对象没有任何地方被引用,无法在任何地方通过反射访问该类的方法。
关于什么时候卸载,当以上条件都满足了,垃圾回收时候回在方法区清空类信息进行卸载,英雄迟暮,这个类的一生也就走到了尽头了。