易陆发现互联网技术论坛

 找回密码
 开始注册
查看: 64|回复: 0
收起左侧

修复ceph分布式存储mon节点异常问题解决过程并重新加入到ceph平台

[复制链接]
发表于 2026-3-28 10:23:06 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?开始注册

x
停止有问题ceph的mon服务:
; r# O2 P! Z& {2 u+ s6 V5 \) N) r[root@host11 ~]# systemctl stop ceph-mon@host11
: H( h% H& V" i1 \! b3 n/ k- M4 a6 k: N. g& \/ [5 v; W
删除有问题的mon数据:
& x9 G5 {: }7 [  d! h[root@host11 ~]# rm -rf /var/lib/ceph/mon/ceph-host11/*3 R6 r8 L* O9 r

: e  s$ r6 X+ [- l0 I6 F尝试使用rsync方式同步:- N* c3 w/ I8 J1 H5 ]
[root@host11 ~]# rsync -avz root@host10:/var/lib/ceph/mon/ceph-host10/ /var/lib/ceph/mon/ceph-host11/. D  p9 t7 q1 q" q- G& p
-bash: rsync: command not found1 |: f0 G- u7 b6 E* T. c
[root@host11 ~]# dnf install -y rsync
/ O2 b/ V" K1 ^-bash: dnf: command not found
* o+ W: a" \. k8 }0 ]3 T报错:无法使用rsync方式同步:' s3 \: I1 D* t; |  a$ \$ J
5 |6 G/ T1 P, i) |- h+ i
使用scp方式复制:
! D0 M+ i. @: [0 ?  d* Z[root@host11 ~]# scp root@host10:/var/lib/ceph/mon/ceph-host10/ /var/lib/ceph/mon/ceph-host11/
$ a. r, Y, i/ W0 O9 Qscp: /var/lib/ceph/mon/ceph-host10: not a regular file
4 L7 T6 B- W& J4 B. |+ ^7 N* O% T0 h0 F1 K9 k0 U; v8 Q
& \8 V! \' _7 E. G

# \8 L5 J: D0 A  l( U8 B5 }+ `$ S[root@host11 ~]# scp -r root@host10:/var/lib/ceph/mon/ceph-host10/ /var/lib/ceph/mon/ceph-host11/; A$ q9 @: _  [9 R+ @4 M- s
kv_backend                                                                                                                             100%    8     9.3KB/s   00:00    : q! i) v1 v8 x7 f( `
LOCK                                                                                                                                   100%    0     0.0KB/s   00:00   
, J+ U( P4 _, H# Y  V# {, ?6 GCURRENT                                                                                                                                100%   17    24.8KB/s   00:00    + G: z: q- a- e% b9 x
IDENTITY                                                                                                                               100%   37     2.7KB/s   00:00   
% g$ B( ?& Q. n/ @2 QOPTIONS-9023316                                                                                                                        100% 4943     5.9MB/s   00:00    4 D4 |8 Z# t$ N) f5 F/ Y
MANIFEST-9024281                                                                                                                       100% 4822KB  49.2MB/s   00:00   
( r* H1 y) [! c6 B. S/ [' fOPTIONS-9024284                                                                                                                        100% 4943     6.8MB/s   00:00    ' P5 C9 B4 c7 r" k$ H- p; W/ P
9106767.log                                                                                                                            100%   14MB  51.4MB/s   00:00    + J) |. ~/ @9 ?7 _
9106769.sst                                                                                                                            100%   57MB  55.0MB/s   00:01    - N$ w1 Q- ]4 a" B
keyring                                                                                                                                100%   77    43.2KB/s   00:00    8 M( r) S/ R- v8 u4 p  m
done                                                                                                                                   100%    0     0.0KB/s   00:00    3 T1 w! Q# Z( x6 q9 }# }$ e
systemd                                                                                                                                100%    0     0.0KB/s   00:00   
) \6 p  b# b' T* c$ e+ Imin_mon_release                                                                                                                        100%    3     0.2KB/s   00:00    0 l6 C5 b5 M2 [' ]
& V: L6 S: F1 l' U- u
[root@host11 ceph-host10]# ls
  f( e! q+ w2 ^5 ^4 zdone  keyring  kv_backend  min_mon_release  store.db  systemd
( b& \! h$ P2 q[root@host11 ceph-host10]# mv * ..
- c, z. p: i' W. P3 }4 T[root@host11 ceph-host10]# ls. D/ y8 {$ J$ c- A( x
[root@host11 ceph-host10]# cd ..
2 b/ j* W6 f$ b, h- e8 m; d$ |[root@host11 ceph-host11]# ls
3 A/ ^4 H3 E7 N, b' j, uceph-host10  done  keyring  kv_backend  min_mon_release  store.db  systemd
; f2 M& s. ~" |9 m7 Y, Z! a9 K6 _6 ?1 v
[root@host11 ceph-host11]# ls. J4 |9 |9 p( K8 l
done  keyring  kv_backend  min_mon_release  store.db  systemd; ?* ~5 s, i) c0 u* q- r* ^- t* ?
[root@host11 ceph-host11]# ll, G' U7 t7 Z1 q0 n3 C  E
total 12$ q6 f2 d! {% K1 X
-rw-r--r-- 1 root root   0 Mar 28 07:20 done! v3 ^1 z; e! X1 O  N; T8 T
-rw------- 1 root root  77 Mar 28 07:20 keyring4 N6 `# `. y  ?* m5 C9 r; ~
-rw------- 1 root root   8 Mar 28 07:20 kv_backend
7 P0 E% F3 D1 }-rw------- 1 root root   3 Mar 28 07:20 min_mon_release
2 O9 r1 n) {( ldrwxr-xr-x 2 root root 157 Mar 28 07:20 store.db- ~5 I5 F& h1 e0 G% M
-rw-r--r-- 1 root root   0 Mar 28 07:20 systemd; ]& v- x7 H* {+ C6 f
[root@host11 ceph-host11]# cd ..# ^% T4 ]4 W- W$ B( T
[root@host11 mon]# ls6 Q, g* L" ], \' z
ceph-host11
$ A; e( V+ K! w3 L1 h( \2 d9 v[root@host11 mon]# ll
1 ^1 ^/ O; V' jtotal 0
* u% @! \* K+ b! R! e6 ^drwxr-xr-x 3 ceph ceph 105 Mar 28 07:20 ceph-host11; E* A  n, a5 j6 V1 i' l
[root@host11 mon]# chown -R ceph:ceph ceph-host11/2 y" I' o  A. U" o6 c; a2 m
[root@host11 mon]# cd ceph-host11/
- l! w7 d( z3 Q[root@host11 ceph-host11]# ls2 q- g( L* I  z
done  keyring  kv_backend  min_mon_release  store.db  systemd8 T# H0 I) w* d4 O" W' Q
[root@host11 ceph-host11]# ll( ?! O! E. t* u. p3 {$ m
total 12
. l, O) }( {) @, v: e-rw-r--r-- 1 ceph ceph   0 Mar 28 07:20 done: ^/ q( h1 k3 y
-rw------- 1 ceph ceph  77 Mar 28 07:20 keyring8 D7 S; |% f6 N- `) M8 Q6 |
-rw------- 1 ceph ceph   8 Mar 28 07:20 kv_backend
, g! H2 W5 Q* _* g-rw------- 1 ceph ceph   3 Mar 28 07:20 min_mon_release
3 n- |  ]+ q: L: fdrwxr-xr-x 2 ceph ceph 157 Mar 28 07:20 store.db
6 t7 \2 z' l, M! S8 F# R; m, q-rw-r--r-- 1 ceph ceph   0 Mar 28 07:20 systemd. y4 @, T8 p( s1 b* e3 l3 c$ r, x9 Z: k

* F0 U& F" T) V/ G# q启动mon服务:
! \' K+ X# l! ~: F+ R[root@host11 ceph-host11]# systemctl start ceph-mon@host11.service 2 o) {8 l; Y' Q1 o0 L. ?1 p9 E  F
Job for ceph-mon@host11.service failed because start of the service was attempted too often. See "systemctl status ceph-mon@host11.service" and "journalctl -xe" for details.& k1 c/ ]& b, u7 r
To force a start use "systemctl reset-failed ceph-mon@host11.service" followed by "systemctl start ceph-mon@host11.service" again.
- |' n/ g/ \: M+ w) E7 g6 [9 m2 m. e3 G
根据提示修改:! _' u$ f5 r- B6 u. K  R  k
[root@host11 ceph-host11]# systemctl reset-failed ceph-mon@host11.service0 C' X7 S' T( U5 K9 t6 e  z
) |/ |2 z) P3 m" d, k# i; j
再次启动:& j6 ?5 R+ W! a8 M8 ]0 h
[root@host11 ceph-host11]# systemctl start ceph-mon@host11.service 8 _. W; t" h9 ]4 @1 _
检查状态:8 u$ a6 z* r& b. d
[root@host11 ceph-host11]# systemctl status ceph-mon@host11.service * @) [. T6 w, p$ v* }3 J6 L
ceph-mon@host11.service - Ceph cluster monitor daemon
9 V7 u7 D; [6 f" |. V, X   Loaded: loaded (/usr/lib/systemd/system/ceph-mon@.service; enabled; vendor preset: disabled), n# n2 n& h9 p; ?- z6 R
   Active: active (running) since Sat 2026-03-28 07:22:00 CST; 11s ago" p! S6 y8 ?! c- e' y
Main PID: 68995 (ceph-mon)
4 M2 S' Z) c& K: w% I+ x   CGroup: /system.slice/system-ceph\x2dmon.slice/ceph-mon@host11.service/ s0 {9 v/ l0 }  ~) g& Y: Y2 o$ M
           └─68995 /usr/bin/ceph-mon -f --cluster ceph --id host11 --setuser ceph --setgroup ceph3 e/ Z/ d5 F" `, Q" [
$ J3 @5 r, t, U  f: S
Mar 28 07:22:00 host11 systemd[1]: Started Ceph cluster monitor daemon.' e! `8 p+ h3 q! L6 p
Mar 28 07:22:06 host11 ceph-mon[68995]: 2026-03-28 07:22:06.757 7fc8eef35700 -1 mon.host11@2(electing) e3 failed to get devid for : udev_device_new_from_sub...iled on ''
4 u5 T+ ]1 x3 q! u2 k0 jMar 28 07:22:06 host11 ceph-mon[68995]: 2026-03-28 07:22:06.793 7fc8eef35700 -1 mon.host11@2(electing) e3 failed to get devid for : udev_device_new_from_sub...iled on ''
( D8 X" f$ G5 ~Hint: Some lines were ellipsized, use -l to show in full.: w/ f7 ~* {7 ^( k$ M5 B4 p
[root@host11 ceph-host11]#
- P& R& C3 N! E! N[root@host11 ceph-host11]#
! ?. R9 G. v: t' h. x[root@host11 ceph-host11]# ceph -s( ]6 ^" D2 Z2 b) E% h, m
  cluster:" B0 w* ~7 K5 W! }" n
    id:     9d22e36a-2bdd-4d2d-8394-ead777" Y! k& W7 `9 y0 T1 O( f7 i3 A
    health: HEALTH_WARN
, f. |) v+ _- O6 x9 n            3 nearfull osd(s)' H, W1 h& S8 N) q: r+ J& G+ H
            5 pool(s) nearfull
  P! H: C0 x  w' Q  X3 C2 q            5 daemons have recently crashed
2 d1 a7 g3 ]% F0 V) t" g! n. P- m
  services:+ _9 d; D/ ?6 r: F9 m* k
    mon: 3 daemons, quorum host09,host10,host11 (age 22s)- I; [4 \) P3 n7 S3 y4 |
    mgr: host09(active, since 6w), standbys: host11, host10; v+ p/ j' n& o& O' E9 E
    osd: 40 osds: 40 up (since 6w), 40 in (since 6w)  }: Z/ O. P6 o$ e0 ]3 l0 }

& w& U/ R8 F/ c  data:
5 S0 g% ?$ \% J    pools:   16 pools, 3072 pgs" W  K4 e" ?# G! F( S
    objects: 7.15M objects, 27 TiB; y+ t; l( v5 T: E. r1 L! l$ E
    usage:   65 TiB used, 83 TiB / 147 TiB avail! ?) H  F* }) W( ^8 B4 Q
    pgs:     3069 active+clean
% ~4 C$ Y  Z5 k( S& X9 r             3    active+clean+scrubbing+deep
/ G: Q* t/ R2 R# w& c2 U2 f7 F9 p
% @$ F6 k2 _2 |! q, b$ J( k, I  io:
6 q+ S, E! L9 }5 T4 V$ _+ L    client:   16 MiB/s rd, 27 MiB/s wr, 339 op/s rd, 380 op/s wr
- W4 k, U' w8 W: k6 _1 x( ]. C4 ^8 V# O
mon问题解决。
  Y, |! `" |& h- U
: c0 @: M6 Q: x0 M
! G  a2 q; |$ y
您需要登录后才可以回帖 登录 | 开始注册

本版积分规则

关闭

站长推荐上一条 /4 下一条

北京云银创陇科技有限公司以云计算运维,代码开发

QQ|返回首页|Archiver|小黑屋|易陆发现技术论坛 点击这里给我发消息

GMT+8, 2026-3-9 00:31 , Processed in 0.048120 second(s), 22 queries .

Powered by Discuz! X3.4 Licensed

© 2012-2025 Discuz! Team.

快速回复 返回顶部 返回列表