找回密码
 注册
查看: 715|回复: 0

ceph分布式集群出现pgunfound objects处理过程记录

[复制链接]

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
发表于 2022-8-10 09:50:05 | 显示全部楼层 |阅读模式
当我们执行ceph  health detail 命令时报错:
6 H$ x5 W% J' X( Y/ r# N[root@mon1 ~]# ceph health detail 8 M; P" e0 U) K8 S) |. l
HEALTH_ERR 1 filesystem is degraded; 1 mds daemon damaged; noout flag(s) set; 1/16745475 objects unfound (0.000%); Degraded data redundancy: 2/33490950 objects degraded (0.000%), 1 pg degraded: V% I5 q. ~, K$ @
FS_DEGRADED 1 filesystem is degraded; g1 U3 P$ S& m! _2 V5 K' i
    fs cephfs is degraded
/ O2 K1 y- Q4 i# p0 a: i( kMDS_DAMAGE 1 mds daemon damaged, K' z/ h5 S9 T7 w: C# c* P8 g% N0 s
    fs cephfs mds.0 is damaged
8 {5 T: n. Q- F; f' l( T: @OSDMAP_FLAGS noout flag(s) set
: j6 s! `+ I  cOBJECT_UNFOUND 1/16745475 objects unfound (0.000%)
- |% K- ]/ G5 |    pg 7.123 has 1 unfound objects
# l# H4 b" p8 n6 a9 z2 YPG_DEGRADED Degraded data redundancy: 2/33490950 objects degraded (0.000%), 1 pg degraded9 {1 l# u$ l  v- [' U$ Y7 J. U
    pg 7.123 is active+recovery_wait+degraded, acting [5,15], 1 unfound8 j, N6 I, A& ^$ K7 W: z
3 r- G, ^" \! A% V3 U
确认哪些对象找不到了:( l& p. S& P" O4 ?1 x* D  l* t
[root@mon1 ~]# ceph pg 7.123 list_missing  q1 b5 o; m- G9 F  x! Q, u3 ^
{
* B* _6 R5 t$ V; b, D    "offset": {
. \: k/ y' I7 ?. e- n( U9 v2 S        "oid": "",
' [* x' @: y4 L        "key": "",4 F9 D( g8 u# w% O" B  C
        "snapid": 0,
! s# y7 ^7 i! G" v( C        "hash": 0,
2 H6 g  D" f9 r0 D$ w        "max": 0,
8 N4 ?2 }# [/ y' ~1 M# v* L! ]        "pool": -9223372036854775808,
2 o# t; q3 c0 |( d, M        "namespace": ""
. ^& n& m% s  q/ e    },
) ]( B3 S+ s! F! T    "num_missing": 1,
! c4 D" `5 g8 Q; _- k% ]) u8 S+ J    "num_unfound": 1,/ {: N8 l! q5 y2 d2 D8 q$ m! Y
    "objects": [
! z! T8 R8 R) B+ {1 [: b        {% d/ C2 T; a: S$ a- g: c
            "oid": {+ t' o% a$ l: _$ \$ m9 q! C" e% A
                "oid": "1000b73777d.00000000",0 a$ a, I- I: r5 w9 y  M6 U
                "key": "",4 x) y# G, C2 C5 r' y+ W! o) o* S! `
                "snapid": -2,
6 p: K" Z$ b- b                "hash": 4108226851," y  a0 u0 ]/ D
                "max": 0,
$ ^) l# e- W( R* _* k- J" J$ s4 l                "pool": 7,2 E) c8 X; n) r# r; o. I5 p! i' `) g
                "namespace": ""6 H* s8 E& K; \7 {
            },% i/ ~* G3 Z8 J4 P; J
            "need": "13279'1",
% x; m3 H: @% B+ j' ?" h2 n            "have": "0'0",  U8 m* c: U) `, l" K
            "flags": "none",
# ^- C/ ^% u) g& ~( b            "locations": []4 i* Q0 H3 I+ ?9 K1 j* C- }+ Q& i
        }' `! C6 a3 P! q! U
    ],
6 b' A$ ?7 M! ^3 J* N( l8 U8 c    "more": false
0 X" f- a: u9 E}
$ @# ^/ Q* p! v+ y  j: h, c0 g& `- l( p0 g
如果在一次查询里列出的对象太多, more 这个字段将为 true ,你就可以查询更多。
% k- B! H" w( j' ?9 W, ?其次,你可以找出哪些 OSD 上探测到、或可能包含数据:
/ t4 |/ h2 t  z- X2 v& D
1 X3 n# E9 R9 v/ U  \% h" }

4 G2 Z* |3 o' J4 n. b, H# dceph pg 7.123 query
; P7 o" m6 R' P/ a2 o% D0 t
# P% H  J5 `) [
' @" m( q3 e2 w3 m& S
5 s+ a: s# \4 E. \; p
[root@mon1 ~]# watch ceph -s
7 B- R1 q  g3 G6 u' f还无法恢复,只有放弃丢失的对象。执行如下命令回滚或删除对象:, D4 A: k7 j, P5 j8 @
4 ?( k% r  {5 V
ceph pg  {pgname}  mark_unfound_lost revert|delete
4 D4 Z  |/ x" P) R3 q9 m% R
4 o- Q* e9 Q7 y4 O0 g
  • revert选项:回滚到对象的前一个版本
  • delete选项:完全删除这个对象1 e4 @0 x. D1 w: N* v" {& M7 C
) e7 D, i! D  d& ?, G

3 V* f+ {: ]1 x! x4 r这里采用删除的方式解决:2 U3 K8 V% r, [1 z% k7 P
[root@mon1 ~]# ceph pg 7.123 mark_unfound_lost delete
+ C3 V7 o8 k$ y2 opg has 1 objects unfound and apparently lost marking
; s7 w% o/ [2 {5 f' x[root@mon1 ~]#( T6 [; Y0 \+ T( {& a4 J9 Z0 I9 W

0 |3 b( G) u7 v6 X& p1 Y! g; ~' T: _$ p, q3 J; v8 B( s
您需要登录后才可以回帖 登录 | 注册

本版积分规则

返回首页|Archiver|手机版|小黑屋|易陆发现技术论坛 ( 蜀ICP备2026014127号-1 )

GMT+8, 2026-6-11 23:03 , Processed in 0.026652 second(s), 23 queries .

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表