这里有一个和 Unix 纪元一样古老的故事。自从有了 C 和 Unix,以及(后来的)Linux,我们就有了“僵尸zombie”。具体来说,有一些进程被标记为“僵尸进程zombie process”。一些人误解它,另一些人忽视它,而它对我们许多人试图 “杀死” 这些进程的努力免疫,没有什么成效。这是为什么呢?
Linux 中的进程是什么?
这一切始于执行 Linux 中的一个程序时,当它被执行时,它的运行实例被称为进程。你可以用 ps 命令 查看你的 Linux 环境中的所有进程:
$ ps–ax PID TTY STAT TIME COMMAND 1?Ss0:01/usr/lib/systemd/systemd rhgb —switched–root —sys 2? S 0:00[kthreadd] 3? I<0:00[rcu_gp] 4? I<0:00[rcu_par_gp]有时一个进程启动另一个进程,使第一个进程成为第二个进程的父进程。pstree 命令是一个很好的工具,可以让你看到系统中进程的“家谱”:
$ pstree–psn systemd(1)─┬─systemd–journal(952) ├─systemd–udevd(963) ├─systemd–oomd(1137) ├─systemd–resolve(1138) ├─systemd–userdbd(1139)─┬─systemd–userwor(12707) │├─systemd–userwor(12714) │└─systemd–userwor(12715) ├─auditd(1140)───{auditd}(1141) ├─dbus–broker–lau(1164)───dbus–broker(1165) ├─avahi–daemon(1166)───avahi–daemon(1196) ├─bluetoothd(1167)每个进程在系统中都会被分配一个编号。进程编号(PID)1 被分配给启动过程中执行的第一个进程,PID 1 之后的每一个进程都是它的子孙。PID 1 进程是初始化进程,在大多数新版本的 Linux 中,它只是一个指向 systemd 程序的符号链接。
用 kill 命令结束一个进程
你可以用 kill 命令来终止 Linux 系统中的进程。尽管名字叫 “杀死”,但 kill 命令和其他一些命令,如 pkill 和 killall,都是为向一个或多个进程发送信号而编写/设计的。当没有指定信号时,它发送的默认信号是 SIGTERM 信号,以终止进程。
当一个父进程死亡或被杀死,而其子进程没有跟随其父进程的死亡,我们称该进程为“孤儿进程orphan process”。
如何杀死一个僵尸进程
另一方面,僵尸进程是不能被“杀死”的!你可能会问为什么?因为它们已经死了!
每一个子进程,当被终止时,都会成为一个僵尸进程,然后被父进程删除。当进程退出并释放它所使用的资源时,它的名字仍然在操作系统的进程表中。这时,父进程的工作就是把它的名字从进程表中删除。如果没有删除,我们就有了僵尸进程,它不再是一个真正的进程,而只是操作系统进程表上的一个条目。
这就是为什么试图对一个失效的defunct(僵尸)进程执行 “杀死” 命令,即使使用 -9(SIGKILL)选项也不起作用,因为没有什么可以杀死的。
因此,要杀死一个僵尸进程,比如从进程列表(进程表)中删除其名称,你必须杀死其父进程。例如,如果 PID 5878 是一个僵尸进程,而它的父进程是 PID 4809,那么要杀死僵尸进程(5878),就必须结束父进程(4809):
$ sudokill–94809#4809是父进程,而非僵尸我对僵尸的最后一句警告:在杀死父进程时要非常小心。如果一个进程的父进程是 PID 1,而你杀了它,你就会重新启动自己!
而这将是一个更可怕的故事!
原文链接:https://linux.cn/article-13941-1.html