在docker中出现的僵尸进程怎么处理

本文主要是介绍在docker中出现的僵尸进程怎么处理，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

一、发现问题

小玲是一名数据库测试人员，这一天她尝试在docker环境中部署GreatDB集群，结果在对greatsqld进程进行kill操作后，意外发现greatsqld进程变成了僵尸进程（如下图所示）。

由于小玲成为测试人员的时间较短，她没有遇见过这种情况，所以无法第一时间判断这个现象，是她的操作失误导致的合理现象，还是一个新发现的bug。

于是她进行了以下尝试：

1.在物理机上重复上述操作，并没有出现僵尸进程。
2.在docker内，对MySQL的mysqld进程进行相同操作，出现了僵尸进程。

通过这样的尝试，小玲初步判断出docker环境才是产生僵尸进程的根源，但具体是什么原因，又该如何避免，还需要小玲的进一步探索。

二、僵尸进程简介

首先需要搞清楚的是：

僵尸进程是什么？
僵尸进程又是如何形成的？

以下定义内容和解决办法来自维基百科。

僵尸进程：

在类UNIX系统中，僵尸进程是指完成执行（通过exit系统调用，或运行时发生致命错误或收到终止信号所致），但在操作系统的进程表中仍然存在其进程控制块(PCB)，处于"终止状态"的进程。

僵尸进程不能被杀死，因为它们已经死亡，只等待它们的父进程回收它们。

通过这样的概念，和其他一些相关材料，小玲了解了僵尸进程的出现，问题多半是出现僵尸进程的父进程上。

这时，小玲看到了一个比较简单粗暴的解决办法，就是直接将僵尸进程的父进程杀死。她立刻去实践了一番，可惜她又失败了。

在docker中，她kill产生的僵尸进程的父进程PID是1，而1这个进程在docker内部是kill不掉的；如果在docker外部的物理机找到1的对应进程进行kill，则会将整个容器杀死。

三、孤儿进程的出现

小玲并不气馁，她继续通过搜索引擎进行探索学习，很快她就了解到更多的概念。

当进程的父进程id变为1的时候，这个进程也有了专门定义的称谓，叫做孤儿进程。

孤儿进程：

父进程结束后仍在运行的子进程。

没有了父进程总要有人“照顾”它。

在类UNIX操作系统中，为避免孤儿进程退出时无法释放所占用的资源而僵死，任何孤儿进程产生时都会立即被系统进程init或systemd自动接收为子进程，这一过程也被称为“收养”。

在此需注意，虽然事实上该进程已有init作为其父进程，但由于创建该进程的进程已不存在，所以仍应称之为“孤儿进程”。

根据上面的解释，又引出来一个概念，init 进程。我们也来看下它的定义。

init进程:

是 Unix 和 类Unix 系统中用来产生其它所有进程的程序。它以守护进程的方式存在，其进程号为1。

init进程是特殊的：它不获得它不想处理的信号，因此它可以忽略SIGKILL。

这里又有个新概念，SIGKILL信号。

一般我们kill进程是发信号给进程，然后被进程捕获之后执行对应操作。主要需要了解的信号有下面3种。都是来终止进程使用的。

四、整理现象发生的过程

小玲已经清楚这个现象跟GreatDB和MySQL都没有关系了，于是使用sleep命令继续尝试。

进入容器，执行命令。此时子进程PID是61，父进程PID是44，父进程是bash。

退出容器，再进入容器。PID是44的bash进程因为退出容器的操作被杀死，子进程61就被init收养了，父进程的PID就变成了1。

杀掉这个进程61，然后查看这个进程状态，发现它已经成为一个僵尸进程。

到这里，小玲就已经很接近问题的真相了：docker容器在默认的参数配置下，其init进程并没有处理孤儿进程的能力。

对于这个问题，docker的开发者们已经考虑到了。

五、如何处理docker中的僵尸进程

有两个解决办法可以让docker的init进程能够处理孤儿进程。

1.启动docker容器时，指定init进程为bash，由bash进程对孤儿进程的资源进行回收。

2.增加专门的 init 进程，比如 tini。

我们可以去docker官方文档找到答案：

The container’s main process is responsible for managing all processes that it starts.

In some cases， the main process isn’t well-designed， and doesn’t handle “reaping” (stopping) child processes gracefully when the container exits.

If your process falls into this category， you can use the --init option when you run the container.

The --init flag inserts a tiny init-process into the container as the main process， and handles reaping of all processes when the container exits.

Handling such processes this way is superior to using a full-fledged init process such as sysvinit， upstart， or systemd to handle process lifecycle within your container.

根据文档建议，可以在启动容器时候加上 --init 参数，开始使用tini。这样会有一个tiny的进程来负责进程"收养"之后的处理工作。

接下来我们分别对两种方法进行验证。