- 积分
- 16843
在线时间 小时
最后登录1970-1-1
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?开始注册
x
% L- b% x& N& T# I+ F" ?) e ceph -s0 \ i) J% g h) J H; @& H
cluster:
2 A2 j; [1 f+ m2 A id: 5fa16469-8be4-4457-8a78-12b1910afff7
' t# t) l' T1 Q# v8 m health: HEALTH_WARN. B* g4 E* U5 O: Z+ |
1 OSD(s) experiencing BlueFS spillover- x6 A# h8 F8 T% b( {
. }2 x# Z% g' O; Y$ R" s2 Z; j$ D$ o4 A' s$ c# J* E8 s( U6 m1 e
. n' M1 w2 l" [8 i ceph health detail - U3 q% E, Z8 U7 C% C; s8 {) t
HEALTH_WARN 1 OSD(s) experiencing BlueFS spillover8 Q& O& n1 e5 K/ N' D
[WRN] BLUEFS_SPILLOVER: 1 OSD(s) experiencing BlueFS spillover
- k8 j% D$ w1 l8 J. I* g' J osd.18 spilled over 39 GiB metadata from 'db' device (186 GiB used of 186 GiB) to slow device
+ f) F9 H: B+ y# ~6 u7 H% {2 ]* c/ ^0 O- F0 r4 P
问题很奇怪,以前没有遇到过
* m- N! F, z9 E' r$ G" b) Z. G* [# v; t3 o+ C% y
HEALTH_WARN 1 OSD(s) experiencing BlueFS spillover
0 B0 A( P3 g$ s: a1 j9 M[WRN] BLUEFS_SPILLOVER: 1 OSD(s) experiencing BlueFS spillover
; c# E% A; [3 O5 [0 ]* F L! F2 e osd.18 spilled over 39 GiB metadata from 'db' device (186 GiB used of 186 GiB) to slow device8 H. ~, o" {1 y( j: P3 ^+ t6 ?
6 I0 Z% N3 a: W' a, U9 G
2 _5 f3 k8 U! ^& d/ S
查看官方解答说明:
* I4 {7 L8 h5 H9 r I! K% `' M; r( U' R
$ g4 Y0 K( Z" L8 x# I3 m, v
导致 BlueFS Spillover 的代码问题已在 RHCS 5.0 及更高版本中解决。% g6 R" ]$ G1 E
请参阅 Root Cause 部分中的提及的 Bugzilla 和 Errata。* S3 u5 \' v5 w/ v6 y9 z0 E2 V
$ o$ d" A* }7 Q+ J& P- @* u
如果您可以接受因为这个问题导致的 HEALTH_WARN,且您的 Ceph 集群计划很快会升级到 RHCS 5.3 或更高版本,则不需要进行任何操作。
( {- y7 i" E% B0 h* a5 w! S3 v2 ^9 e- l4 G' p9 r) u
如果您希望清除 HEALTH_WARN,请在每个 OSD 上执行以下操作(一次在一个 OSD 上执行)。
) r" M- [) `* @8 e0 y# p- e; z- compact OSD6 {* Q' }$ S/ S
- 保护到托管 OSD 节点的 shell,并重新启动 OSD
. a I9 E5 p9 R) L \! U- 再次 compact OSD
, j# n9 F J5 Y7 N! _- 保护到托管 OSD 节点的 shell,并重新启动 OSD; z3 A$ w. ~8 a8 B1 B0 H' N7 V8 l' p
0 E. Q j2 Y( g6 [0 U5 F
解决办法:, d9 q* h- k* U& N5 t7 x" {2 t4 i
0 v; E2 j8 x) Y
- `5 I: x6 r: O" Z# ceph daemon osd.<id> compact <--wait 2 minutes afterwards
8 x+ W% J9 S3 A7 m* E# ~# C" v, T" `; ?% \* i3 _2 m6 e# e' y# ]6 w
% Z3 L; w3 p9 _$ u% _示例:+ n8 `- _2 V7 z e7 o2 j6 v
ceph daemon osd.18 compact{ "elapsed_time": 22.966318924999999}
0 m2 Z% n0 H$ y& A2 [* P# M/ `: Z% {
" X* O3 \' z* ~4 \( E5 L% k e, L6 T5 A# systemctl stop ceph-osd@{id}; sleep 2; systemctl start ceph-osd@{id}
4 o( I% l5 \) C; w, `- g6 W& t示例:systemctl stop ceph-osd@18.service ;sleep 2 ;systemctl start ceph-osd@18.service 0 [: F" r" O! p6 [& v
' ]" `' P* ]. N6 \. g
Remember to repeat both commands a second time after ~1 minute执行这两条命令要保证1分钟之后。
) [! R$ }6 f" S ^ X+ Z) Z: ^( r1 k* D6 [$ { M
再执行ceph -s状态恢复正常。9 s; F8 i& m+ E! d; e
ceph -s cluster: id: 5fa16469-8be4-4457-8a78-12b1910afff7 health: HEALTH_OK
7 g) a$ K% L9 z1 ]
- X* H1 i$ v$ R! i" a
8 y6 F7 u4 Y* R" G# c$ |9 V& s7 y2 m" S$ g s
+ y; }7 @" G. Q& ?# u5 Q
|
|