- 积分
- 16841
在线时间 小时
最后登录1970-1-1
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?开始注册
x
3 P* R3 D |2 i: g& P
ceph -s
9 ~- ?# x3 D M1 O: Q2 c cluster:' A( [* g& O) q9 V. U
id: 5fa16469-8be4-4457-8a78-12b1910afff71 `7 x1 O$ ]9 \& @0 w v! \
health: HEALTH_WARN
# g7 b$ m r! g+ M 1 OSD(s) experiencing BlueFS spillover
7 Z& a. I _9 V % Y6 V+ d- ?8 X6 t
8 n7 [0 y* ?8 N
" h8 B% j; V; A, _ ceph health detail
$ O1 J! E! k# UHEALTH_WARN 1 OSD(s) experiencing BlueFS spillover/ q9 i; w, w- b4 \( d
[WRN] BLUEFS_SPILLOVER: 1 OSD(s) experiencing BlueFS spillover' K8 m$ r" y5 X( q$ b4 R: d, d# e8 l
osd.18 spilled over 39 GiB metadata from 'db' device (186 GiB used of 186 GiB) to slow device. }4 _% g4 U' p3 S0 i4 e
" U( F! n& R) m% G# W R2 Z
问题很奇怪,以前没有遇到过
+ g+ r8 b8 P1 C4 p, Y O) O8 X2 W! x& G; n: U
HEALTH_WARN 1 OSD(s) experiencing BlueFS spillover
; ?: R: N2 H: k0 A[WRN] BLUEFS_SPILLOVER: 1 OSD(s) experiencing BlueFS spillover
% `' T! K4 g9 S0 V* g# g osd.18 spilled over 39 GiB metadata from 'db' device (186 GiB used of 186 GiB) to slow device
9 K8 ]+ Y O: G7 m, F& F8 d, K
$ R7 i3 q% {+ s7 f2 N8 a( \
% t7 h, ~1 z; y5 N查看官方解答说明:1 A3 s5 ~/ |; H
# x; x- G9 ^$ D% |3 {, t6 ^5 M+ `3 b( V7 I& ^0 y5 q+ k
导致 BlueFS Spillover 的代码问题已在 RHCS 5.0 及更高版本中解决。
& Q V# x1 R1 w" \8 v请参阅 Root Cause 部分中的提及的 Bugzilla 和 Errata。
/ W0 o' z6 C4 p+ S1 E+ j6 B& f; E
如果您可以接受因为这个问题导致的 HEALTH_WARN,且您的 Ceph 集群计划很快会升级到 RHCS 5.3 或更高版本,则不需要进行任何操作。
$ P& @& B. T2 P1 t! m1 l+ ?0 @8 q. {- E8 d6 C, a6 v: c
如果您希望清除 HEALTH_WARN,请在每个 OSD 上执行以下操作(一次在一个 OSD 上执行)。8 o+ j% e% r3 S/ M/ O
- compact OSD
+ f* s9 `! H7 p0 v$ I- 保护到托管 OSD 节点的 shell,并重新启动 OSD- ?/ S6 v2 I0 F' n
- 再次 compact OSD y) ]+ o$ y4 U1 C3 Y. B2 c
- 保护到托管 OSD 节点的 shell,并重新启动 OSD
& t4 D1 e' h0 z% _# E
6 f0 ]# Z9 x. w/ V3 u9 Q解决办法:" z' e% ?+ A2 v9 [5 w$ n
) D' B# t) S. K; V j& b) I& S( q& }; y1 g) t) K* X2 K* [
# ceph daemon osd.<id> compact <--wait 2 minutes afterwards8 \* `" ^ Q% X' O# T, I
9 F% C; w( z% {0 v& w- Q
% {, w5 Z* ^% P! R3 p示例:$ i. @7 h% N {8 H d4 G# o# Q
ceph daemon osd.18 compact{ "elapsed_time": 22.966318924999999}
5 @8 }0 i3 Z% u4 K @0 S& D) \' n' X. }/ s; j
# systemctl stop ceph-osd@{id}; sleep 2; systemctl start ceph-osd@{id}
4 b% F) e3 C; ^! s" l, D: K" v示例:systemctl stop ceph-osd@18.service ;sleep 2 ;systemctl start ceph-osd@18.service & T7 O( r( v9 R8 A
. v. F) P: B) K1 J4 R# M2 SRemember to repeat both commands a second time after ~1 minute执行这两条命令要保证1分钟之后。% w6 q8 ^% R* Q* x3 i
! l- [: h P7 z) g( R# n) B3 s
再执行ceph -s状态恢复正常。
( r M" B9 `. |. M; P ceph -s cluster: id: 5fa16469-8be4-4457-8a78-12b1910afff7 health: HEALTH_OK
& e$ I- p0 Q7 M9 U. u
0 R9 \- j! A1 r
- x1 a# a7 A$ i# D! k, \; f# F, a+ T4 G9 I# `; k$ d
+ c5 f- u4 f4 M
|
|