每个java开发同学不管是日常工作中还是面试里,都会遇到JDK、JVM和GC的问题。本文会从以下10个问题为切入点,带着大家一起全面了解一下JVM的方方面面。
这个基本是步入java世界的入门级知识认知,首先我们来看一下来自java官网的一张图:
从这张图里我们基本就可以看出“JRE”是运行Java语言编写的程序所不可缺少的运行环境。有了JRE我们写的java程序才可以运行起来被用户所使用。
而“JDK”俗称java开发工具包,它包括了Java运行环境JRE(Java Runtime Envirnment)以及一堆Java工具(javac/java/jdb等)和Java基础的类库(即Java API 包括rt.jar)。
但不管是JRE还是JDK都是以JVM为基石的。可以说JVM是java程序可以在某台机器上得以运行的最底层的保障。
JVM是Java Virtual Machine(Java虚拟机)的缩写,它的用途简单的说就是它能让我们写的java程序在不同的操作系统的不同CPU上运行。我们写的java程序会利用开发工具(如Intellij idea)把它编译成.class文件,但这个class文件是不能直接被操作系统识别运行的,需要利用jvm按jvm规范将编译好的.class文件转变成机器语言,再交由操作系统提交给cpu去执行。
用一句话评价JVM的主要作用就是:JVM屏蔽了与具体操作系统平台相关的信息,使得Java程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。
JVM中核心的功能总体有三块:
首先,我们谈谈开发工具编译生成的class文件是如何被JVM加载的。所谓的类加载机制其实就是:虚拟机(JVM)把class文件加载到内存中,然后对它进行正确性的校验,检查通过再进行解析和初始化,最终把class文件变成一个内存中可以直接使用的java.lang.Class对象。
从一个class文件的装载到销毁,它的生命周期基本可以分为以下五个阶段:装载、链接(验证、准备和解析)、初始化、使用和卸载。
(1)通过类的全限定名获取其定义的二进制字节流,需要借助类装载器(ClassLoader)完成;
(2)在运行时数据区的“方法区”中分配一块区域保存这个类的信息,包括类的基本信息、常量和静态变量等等;
(3)在“Java堆”内存上生成一个该类的java.lang.Class对象,用于对外暴露使用该类的入口。
(1)验证(Verify),验证文件格式、元数据、字节码和符号引用,以保证被加载类的准确性;
(2)准备(Prepare),为静态变量分配内存并初始化为默认值。
(3)解析(Resolve),解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符7类符号引用进行。
比如上面的静态变量age初始化之后的值变为了10。
在装载阶段的第(2),(3)步可以发现有运行时数据区,堆,方法区等名词,那么究竟什么是“运行时数据区”,它有哪些结构构成?
“运行时数据区”是JVM在执行Java程序的过程中出于内存管理方面的目的,在设计上把内存分为若干个不同的区域。这些区域有着各自的用途,有的区域生命周期跟虚拟机一样,随着虚拟机进程的启动而存在,伴随这虚拟机的进程结束而消亡。而有些区域则依赖用户线程的启动和结束而建立和销毁。具体如下图:
(1)用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据;
(2)方法区是各个线程共享的内存区域,在虚拟机启动时创建,因为同一个class类信息只需要加载一份就够了;
(3)java虚拟机规范中把方法区描述为堆内存的一个逻辑部分,但它有另外一个别名叫“非堆”,用于与java堆区分开来。在JDK8之前方法区叫做Perm space,在JDK8及以后叫做Metaspace(即元数据区)。
每一个被线程执行的方法,为虚拟机栈中的一个栈帧,调用一个方法,就会向栈中压入一个栈帧;一个方法调用完成,就会把该栈帧从栈中弹出。如下图解:
总结一下,就JVM的设计规范,从使用用途角度JVM的内存大体的分为:线程私有内存区 和 线程共享内存区。
线程私有内存区在类加载器编译某个class文件时就确定了执行时需要的“程序计数器”和“虚拟栈帧”等所需的空间,并且会伴随着当前执行线程的产生而产生,执行线程的消亡而消亡,因此“线程私有内存区”并不需要考虑内存管理和垃圾回收的问题。
线程共享内存区在虚拟机启动时创建,被所有线程共享,是Java虚拟机所管理内存中最应该关注的和最大的一块。
那么JVM内存模型是如何设计的?JVM又是如何进行内存管理(也就是垃圾回收)的?垃圾回收算法有哪些?目前常用的垃圾回收器又有哪些?我会在下篇文章跟您共同解答这些问题。
作者:宜信技术学院 谭文涛