|
|
在维护服务器的时候,发现有多个nova-novncproxy的僵尸进程。9 F9 A) O6 k% w% J+ f. k4 ~ _- n
, B. M8 q2 V3 g3 k8 O
26327 ? S 0:05 \_ /usr/bin/python /usr/bin/nova-novncproxy --config-file=/etc/nova/nova.conf
: A9 Y9 G2 g2 W6 X; r' ^8 S0 N0 z 4765 ? Z 0:00 \_ [nova-novncproxy] <defunct>
/ a6 `9 F6 i U3 i7 o' o4 Y 4766 ? Z 0:00 \_ [nova-novncproxy] <defunct>
! | Y: ^5 y. C/ i0 |6 y 4767 ? Z 0:00 \_ [nova-novncproxy] <defunct>- @; {3 d) y, A9 P
4768 ? Z 0:00 \_ [nova-novncproxy] <defunct>
$ t0 U! g+ y3 l0 W' o 4769 ? Z 0:00 \_ [nova-novncproxy] <defunct>
" A; Z: D) n5 W+ c$ }* X之前对于僵尸进程的了解并不深,该如何处理。
* r/ ?6 ] h) c; h" M8 @+ ^$ q6 w x6 j+ Q) o4 V
定义
. g" T8 F7 G1 e$ z7 S/ p2 D$ H( q- G0 d# A) R3 u
In UNIX System terminology, a process that has terminated,but whose parent has not yet waited for it, is called a zombie.2 H0 r) a( J7 h' \5 W$ z
( ~; G! U5 C5 N- Z4 M% X( R3 F
在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他, 那么他将变成一个僵尸进程. 在fork()/execve()过程中,假设子进程结束时父进程仍存在,而父进程fork()之前既没安装SIGCHLD信号处理函数调用 waitpid()等待子进程结束,又没有显式忽略该信号,则子进程成为僵尸进程。
( J. i* C7 |" M# P/ ~: Y. Z) R4 { i8 [" a; c
如何查看linux系统上的僵尸进程,如何统计有多少僵尸进程?* e) O+ L! x3 Y9 e/ |* C
6 }2 f+ }7 b7 w
#ps -ef | grep defunct6 {0 I9 O1 y' J* O' E j* s
$ e! W5 ?9 b' R# t* v, M或者查找状态为Z的进程,Z就是代表zombie process,僵尸进程的意思。
- H: i+ M$ v0 {0 p
" c$ W8 e9 G3 l5 P! x另外使用top命令查看时有一栏为S,如果状态为Z说明它就是僵尸进程。) R$ g) L* X- i; o. J' R2 T
" x" p! O8 m; ?6 J
Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie
- L1 A5 M" ? U* F0 W$ G. l' ]" j- d* v& V
top命令中也统计了僵尸进程。或者使用下面的命令:
* A6 D k# X- R6 e9 c3 i+ P& h) a6 j6 Y5 m! s2 G2 e' d% I
ps -ef | grep defunct | grep -v grep | wc -l
) `; b! t+ s4 ]* s5 m& C4 d& {5 S, _. E
如何杀死僵尸进程呢?- H8 ~8 u0 I O! |
一般僵尸进程很难直接kill掉,不过您可以kill僵尸爸爸。父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会负责清理僵尸进程.它产生的所有僵尸进程也跟着消失。2 y k7 t' z! E$ ]) x/ y9 U( k. x
, Z& e+ M% @ k' J6 E& r
ps -e -o ppid,stat | grep Z | cut -d” ” -f2 | xargs kill -9
- ?* g+ F9 U5 U- X. J. r8 ]
9 V3 S8 c% r& \$ |+ c% H或
5 F0 Q! h% ~( _8 _9 q. O& J F- h1 {' z' e
( x0 z& y6 @2 s3 D# ekill -HUP `ps -A -ostat,ppid | grep -e ’^[Zz]‘ | awk ’{print $2}’`# n$ u- q1 U% l
9 ?' L% T7 [+ i" E. |- `9 }! i当然您可以自己编写更好的shell脚本,欢迎与大家分享。
) ^. R0 a6 u9 g, F5 D# k- m! a: G
( p$ Y- P" u9 K+ n' c& B我将nova-novncproxy stop后再start,僵尸进程即消失,问题解决。2 F9 m) y& @4 D- Q% K g
. r0 M: y/ W9 D v, W3 f7 o
另外子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信号后,执行waitpid()函数为子进程收尸。就是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD消息,而此时,尽管对它的默认处理是忽略,如果想响应这个消息,可以设置一个处理函数。6 w3 {' q/ e7 k' x
+ a$ E, F1 q+ M: W
如何避免僵尸进程呢?% V1 I; S7 \( f: d# {- a: y' A6 _
处理SIGCHLD信号并不是必须的。但对于某些进程,特别是服务器进程往往在请求到来时生成子进程处理请求。如果父进程不等待子进程结束,子进程将成为僵尸进程(zombie)从而占用系统资源。如果父进程等待子进程结束,将增加父进程的负担,影响服务器进程的并发性能。在Linux下 可以简单地将 SIGCHLD信号的操作设为SIG_IGN。% W: x, _" \" f* @8 B
signal(SIGCHLD,SIG_IGN);
$ n/ K2 i) I- n7 n Y这样,内核在子进程结束时不会产生僵尸进程。这一点与BSD4不同,BSD4下必须显式等待子进程结束才能释放僵尸进程4 U( ^* S9 J9 k' g
8 P# W K% G; Y" j或者
4 Q, |; i& r3 E+ [7 x- Q* v7 |* h1 Z1 |6 E+ N
用两次fork(),而且使紧跟的子进程直接退出,是的孙子进程成为孤儿进程,从而init进程将负责清除这个孤儿进程。 |
|