昨天同事告诉我说,线上服务分配的内存 -Xss 大小是2G左右,但是使用top命令查看发现内存远远大于2g。将近4g了。为何堆外内存占这么大的内存空间。我刚开始也是有点一头雾水,然后搜索了下,记录下这个问题。
我以测试环境模拟了下这个问题,首先进入k8s服务器里面。找到自己的服务,top了下。测试环境我们分配的堆-Xss 是512M 。但是使用top 发现VSZ 虚拟内存是 2G 多。
ps -ef | grep java | grep -v grep 看服务器的堆内存:
严重的不匹配,而且堆外内存特别大。那么堆外内存被那些所占用呢?
搜索了下,答案如下:
为了维护加载类的元数据,JVM使用了一个专门的非堆区域,该区域称为元空间。在Java8之前,此区域等效于永久代。元空间或者永久代包含了加载类的元数据而非其实例,实例都保存在堆中。
这里值得强调的是:堆大小的配置不会影响元空间。因为元数据是非堆区域。为了限制元空间的大小,我们使用如下的标志:
最重要的内存数据区域之一是JVM的栈,每一条线程都有一个独立维护的栈。栈保存本地变量和部分的结果,扮演方法调用的重要角色。
默认的线程栈的大小是平台无关的,但是在大多数64位操作系统中,它的大小大约是1MB。该大小是通过*-Xss*标志设置。
相比于其他的数据区域,**只要线程的数量没限制,栈的内存分配通常是不受约束的。**同样值得说明的是JVM自身需要一些线程去执行一些内部操作如GC和即时编译。
为了在不同的平台上运行JVM字节码,它需要将其转换为机器码。JIT编译器负责其编译操作。
**当JVM编译字节码到汇编指令时,它保存这些指令在一个特殊的非堆区域,该区域称为CodeCache。*JVM可以像管理其他区域一样管理CodeCache。-XX:InitialCodeCacheSize和-XX:ReservedCodeCacheSize*标记决定了CodeCache的初始值和可能的最大值。
JVM有很多GC算法以针对不同的情形。所有的这些GC都有一个共同的特点:那就是它们需要一些非堆的结构来运行它们的任务。这些内部结构会消耗更多的本地内存。
让我们从String开始,这是在应用和库代码中使用最多的一种数据类型。因为它们的特殊性,它们通常会占据堆的很大一部分。如果很多的字符串共享同样的内容,则堆内存中的很大一部分都浪费了。
为了解决堆空间,我们保存每一个String的唯一版本然后让其它的变量引用这个版本。该过程称为*String Interning***。因为JVM只能intern编译时间字符串常量,我们能够手动调用intern()方法在我们想去intern的字符串上。
JVM stores interned strings in a special native fixed-sized hashtable called the String Table, also known as the *String Pool*. We can configure the table size (i.e. the number of buckets) via the -XX:StringTableSize tuning flag.
**JVM有一个本地固定大小的哈希表(该表称为String Table)来保存内部字符串,这个表也称为String Pool。**我们能够通过-XX:StringTableSize标志配置表的大小(例如桶的数量)。
除了String table,还有另外一个称为运行时常量池的内部区域。JVM使用该区域保存常量,例如编译时的数字字面量或者必须在运行时保存的方法和字段引用。
JVM通常是自己做本地分配,到有时开发者想直接分配本地内存。通常使用的方法是通过JNI调用malloc或者NIO的直接ByteBuffers.
(https://blog.csdn.net/JimFire/article/details/122060919)
线程、代码缓存、垃圾回收、编译时候的常量池、本地字节缓存,而从jdk1.8之后,堆外内存还包括metaspace元空间等。那么怎么查看堆外内存占用的大小呢? jdk1.8之后,需要再启动时候添加参数:
使得可以本地内存追踪:-XX:NativeMemoryTracking=off|summary|detail。默认地,NMT是关闭的
比如:如果通过docker进行部署,则可以在启动配置里面加上如下参数:
$ java -XX:NativeMemoryTracking=detail -Xms512m -Xmx512m -XX:+UseG1GC -jar yourApp.jar
启动后,就可以借助jcmd来进行查看了。
$ jcmd <pid> VM.native_memory
比如top或者jps -l 后,可以读取到我们的pid 。然后输入
$ jcmd 7VM.native_memory
会输出些下面的内容:
Total: reserved=3132MB, committed=2731MB
NMT打印我们的堆内存,确实像我们前面设置的一样:
Java Heap (reserved=307200KB, committed=307200KB) (mmap: reserved=307200KB, committed=307200KB)
下面是加载的类的类元数据的NMT信息:
Class (reserved=1091407KB, committed=45815KB) (classes #6566) (malloc=10063KB #8519) (mmap: reserved=1081344KB, committed=35752KB)
大约1GB的保留和45MB的使用空间区加载6566个类。
下面是线程的内存分配信息:
Thread (reserved=37018KB, committed=37018KB) (thread #37) (stack: reserved=36864KB, committed=36864KB) (malloc=112KB #190) (arena=42KB #72)
总共,36MB的内存被分配到了37个线程——大约每个栈有1MB的内存。JVM分配内存到线程是在JVM创建之初,所以保留内存和使用内存是相等的。
让我们看看JIT产生的汇编指令所占的空间:
Code (reserved=251549KB, committed=14169KB) (malloc=1949KB #3424) (mmap: reserved=249600KB, committed=12220KB)
当前,大约13MB的空间被会缓存了,并且能使用的空间大约在245MB。
下面是NMT报告的G1GC的内存使用情况:
GC (reserved=61771KB, committed=61771KB) (malloc=17603KB #4501) (mmap: reserved=44168KB, committed=44168KB)
我们能看到,大约60MB的空间是G1可以保留和使用的。
SerialGC仅仅使用1MB:
GC (reserved=1034KB, committed=1034KB) (malloc=26KB #158) (mmap: reserved=1008KB, committed=1008KB)
明显地,我们不应该挑选一个GC算法仅仅是因为内存使用,作为SerialGC的STW(stop-the-world)属性可能导致性能下降。然而,有其他几种GC可供选择,并且它们在不同情况下能够平衡内存和性能。
下面是NMT打印有关符号的分配,如同String table和常量池:
Symbol (reserved=10148KB, committed=10148KB) (malloc=7295KB #66194) (arena=2853KB #1)
大约10MB被分配给符号使用。
另外就是发现线上服务器这几天总是cpu飙到80%以上,可以通过arthas 的 heapdump /tmp/dump.hprof 命令生成dump文件,然后借助Jprofile进行dump文件的分析。这个稍后再做整理