|
|
ceph 分布式存储有部分osd存在down状态恢复. j+ r% r$ q p* Q- ]2 [2 Y7 I
7 [! |/ U9 w$ J' n
+ }4 X0 z& h9 Z$ h$ b
1 d- h/ E& m8 n7 ]ceph osd tree 1 n3 S: O- r! @9 d
9 W: v' N. N# K; F) O0 hdd 1.00000 osd.0 up 1.00000 1.00000
3 d6 i; S1 j) h* V( P3 j' ~0 hdd 1.00000 osd.1 down 0 1.00000 b4 v. s- n- d
5 u* K+ ]9 b( ^ i
7 W* M& x) N( j& D. L! y2 x登录到该节点检查
8 M* C+ `% s+ D2 r6 ^/ ?systemctl status ceph-osd@1.service 2 W& z1 f& o$ B9 c+ X: A
% f( c( Y8 Q( f2 ]. W2 W+ P4 h+ C/ z
有的出现状态时正常的,导致这种原因极有可能是因为系统的时间不同步导致的。* Q; o$ U9 H! f+ K, Q' n: |- ~
8 I7 g( I2 H- m$ i* d! ^7 a
先同步时间,然后再执行
+ o3 t+ Z1 ?+ {% B$ _ceph osd in osd.1 in
, J' h7 x+ h2 ~! N: P( W3 N4 ^( v1 G1 s8 B) J
5 J& i5 D7 l) `" lceph osd tree
: s6 e# V7 j4 C
1 }1 v$ W" Q+ }8 C+ w0 hdd 1.00000 osd.0 up 1.00000 1.00000# i; n) r6 B: B/ X% a% A
0 hdd 1.00000 osd.1 down 1.00000 1.000003 U1 ?9 q3 b/ R4 L$ z
% `* A) e& h3 E6 j- W# ?
$ K7 a% H7 q+ c- O6 a/ d$ h7 R1 x
出现这样的,就可以使用systemctl restart ceph-osd@1.service % B. ]& T/ D+ g+ p+ U
9 r0 }2 T# e5 Y' A4 k, `) Z( A
, P, d) J. J. t7 m& n% U- J2 ^4 P3 Y
+ ~" T5 Q: w, t r5 ~' J( ~1 ^* I; l, P4 a1 v5 O3 Y
等待3到5分钟
b0 v1 K% T- V. ?& @
: Z+ v9 d% W% Aceph osd tree
/ k {4 ~+ H/ D( a# J' s# a9 @
6 N) G' C, P1 y6 f* s6 k0 hdd 1.00000 osd.0 up 1.00000 1.000008 `( @8 d! {- \; A. c" S, T+ q
0 hdd 1.00000 osd.1 up 1.00000 1.00000
0 i2 Z/ Z% t9 p' Z W0 F& s' a' {9 l9 R8 r6 R0 |. }5 A8 Y$ p$ a
$ i" ]' Z9 p! k8 c1 N5 b% [+ ]
剩下的正常了,即可使用ceph -s 观察ceph 存储是否开始恢复数据并进行均衡。
5 K m6 Z. h% e. R8 ~0 Z! u( A7 v, m
5 x8 N, U! Y3 \/ {/ F% J |
|