前天应用反馈说有个集群的访问异常抖动,于是查看了一下配置。发现pod异常重启了。
于是怀疑是jmv异常,于是在pod中查看相关的日志。结果又重启了2次。
于是对这二次进
行分析
首先针对第二次的问题,应用日志有OOM的情况
第一反应是JVM内存异常
今天重新看了一下系统日志,确认是系统认为内存不足,把java进行给kill了。
目前pod的limit是2G
但仔细发现2次的重启是不一样的。
尤其是第二次
Java rss的空间为 332110*4K=1.36G,与2G的空间还有些差距。
于是看了一下其它的进程,看到了vi占用的空间也很多,累加超过了2G,所以OOM了。
这个vi就是第一次故障后,登录pod后查看日志的进程。