一般在使用pytorch训练网络模型时,可能会不正确的终端训练,导致进程僵尸,GPU依然被占用的情况。
查看进程的ID及其父进程ID指令:
ps -ef | grep defunct | more
假设输出如下:
Tokey+ 7567 2959 4 01:06 ? 00:15:03 [python] <defunct>
Tokey+ 7675 2964 0 Oct18 ? 00:00:19 [python] <defunct>
Tokey+ 45815 27058 0 06:15 pts/3 00:00:00 grep --color=auto defunct
以上对应:UID PID PPID …
UID:用户ID
PID:进程ID
PPID:父进程ID
如果你使用命令 kill -9 7567
尝试杀死ID为7567的进程,可能会没效果。要想成功杀死该进程,需要对其父进程(ID为2959)执行kill命令 kill -9 2959
。