|
|
ceph 分布式存储有部分osd存在down状态恢复# ^5 T* ^% o; N4 U
) T ?/ b z9 C( L: B- m& o
8 a5 A* l: \( p% z
. @% I$ T6 X# b# Uceph osd tree
0 f- L2 M0 Q5 A& S
8 `' u0 s4 e# b2 l0 hdd 1.00000 osd.0 up 1.00000 1.00000
7 p) m4 s8 j2 k0 hdd 1.00000 osd.1 down 0 1.00000/ |* \) F! }( d! Y( ^/ b) ?+ E; q- c
3 j& `& a& l5 j% P# `1 `$ B+ D; V
5 e$ C/ C6 f% d3 N2 h( e `登录到该节点检查9 F0 _) |* C0 t% F6 T- Z g
systemctl status ceph-osd@1.service
9 T0 I, m1 V. i: z ]8 H" }2 \8 e! _- m% K8 R
有的出现状态时正常的,导致这种原因极有可能是因为系统的时间不同步导致的。6 y; i9 T. @5 [* ~
, v& |* y9 q2 D+ G
先同步时间,然后再执行
! C7 Q% D7 B' z. Y7 f+ ]ceph osd in osd.1 in! K( X% B/ T. V+ X. Z4 t! ]
! ]) Y3 c2 h( }0 z; T* V8 ?+ T3 U' C6 d O7 g
ceph osd tree
2 r1 E+ I. f% W4 ?9 X# T- J* x! a, Z8 p: }8 H, F5 A5 J
0 hdd 1.00000 osd.0 up 1.00000 1.00000) a; e& G5 y5 a5 L# Z' I% Y# |+ @* ]
0 hdd 1.00000 osd.1 down 1.00000 1.00000
1 T- u+ O( M8 b; ]
* O) u- C. R; J0 }% i0 U2 b2 E, U9 |4 `( L" `
出现这样的,就可以使用systemctl restart ceph-osd@1.service 8 S7 r* W# _6 p: E0 M" H& c
" `: t6 N8 y. Z Q* N: }8 u
! P+ r8 o) Y& X; o8 Z
$ H% s0 S* X; p* w% D2 E: |
5 T! L1 ^; {5 e5 |等待3到5分钟
e; W2 {5 V/ E, s' n* _. `3 m/ w" ]0 ?7 m- x! Q. v" x
ceph osd tree
6 N+ |. Z4 G% u! {* Z' I
; a7 M& c+ i( g6 S2 s) n2 O0 hdd 1.00000 osd.0 up 1.00000 1.00000
- A+ {/ c7 ~3 `& l) m, Y2 {5 t0 hdd 1.00000 osd.1 up 1.00000 1.000002 ~9 }7 C' o9 U7 Y
\' a& p0 F. s( j* b3 m
6 f: C4 B% ~" p2 l& T! C5 u, @( c6 h剩下的正常了,即可使用ceph -s 观察ceph 存储是否开始恢复数据并进行均衡。: c; C$ r/ ^% g# O9 c: e; E
) L0 _; H* o% o& @7 t7 A |
|