找回密码
 注册
查看: 10|回复: 4

关于drbd的状态使用说明

[复制链接]

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
发表于 2023-12-21 11:06:47 | 显示全部楼层 |阅读模式
近期遇到很早以前的crm管理服务( {0 D$ M  e2 b3 s. M9 @! N
按照常规的方式启动没有问题,但是后来发现有些状态是异常的。/ N( G5 ~! t9 F- k6 J5 K" e4 ^
5 C+ H) `- l+ g6 A
无意中接触到drbd这个组件,以及crm主键:7 X& R" v2 y, z$ a/ L
一:
, i6 H8 H6 Y# d还可以使用drbd-overview获取一些简单的信息。4 r0 m" u# {  P6 Y, m
正常的 :
: d( a/ Y; q+ q/ e' J9 }drbd-overview 7 S' C3 w4 U- x( F, e
NOTE: drbd-overview will be deprecated soon.
& T: g- o) \, w1 R! HPlease consider using drbdtop.
9 y( B& Y) H: f7 V0 g. Y/ P  U% N( x
0:rs0/0  Connected(2*) Second/Primar UpToDa/UpToDa   {6 w6 ?7 ]" `: ^" F
1:rs0/1  Connected(2*) Second/Primar UpToDa/UpToDa
; T4 W0 \# S0 D2 Y! u- Q8 w% K( y9 m& ~6 J9 @

$ u$ B% \# `$ O有问题的:
2 X* c- q2 ^2 L# v8 r7 bdrbd-overview
+ O7 z' Q, e- k 0:mysql/0  Connected Secondary/Primary UpToDate/UpToDate
6 K( ^3 c+ p  |" ?& Z) p  v' z 1:image/0  Connected Secondary/Primary Diskless/UpToDate
  w; R; _0 t0 B8 I; z% b$ G; Y) f/ S5 Z0 T. W) [

0 j9 r( p6 e$ x4 X. a* j6 h2.状态3 _9 H8 }1 ]. h% @* A' U
/proc/drbd文件中的状态信息如下:
' D' c) [: ?1 E cat /proc/drbd ! `% S2 _1 q1 a) g0 T9 g7 C
version: 8.4.5 (api:1/proto:86-101)& Y8 s5 u6 ?/ W+ o
GIT-hash: 1d360bde0e095d495786eaeb2a1ac76888e4db96 build by root@cucloud002, 2015-02-06 20:04:43- ]7 d$ n! Y3 v7 u3 s, G( a/ o
0: cs:Connected ro:Secondary/Primary ds:UpToDate/UpToDate C r-----
4 V0 h3 U; l0 I8 ]% `  C/ B; A    ns:0 nr:8359712 dw:8359712 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:f oos:0; c. p6 g5 w" U" Z$ d  j
1: cs:Connected ro:Secondary/Primary ds:Diskless/UpToDate C r-----
, U( o1 V2 h7 A! I- ?8 g    ns:0 nr:0 dw:0 dr:0 al:0 bm:0 lo:0 pe:0 ua:0 ap:0 ep:1 wo:b oos:0
! b$ ^. ]% \: Z: }: E( g( X% _2 K" j0 `3 X

' Q  o! W" M' G2 k: T% \" o其中第三行中:3 D, |) x8 {% z( X. R

8 w0 h* `; ]/ h5 I* n0是drbd的次设备号(minor),表示该行是/dev/drbd0资源的信息。% B! |' i) }" V' s
cs是connect state,即节点的连接状态。
7 f; U# S1 @% zro是roles,即节点的角色状态。
8 M  e: D7 S% a& \  r9 n, `ds是disk state,即磁盘的状态,也即drbd底层设备的状态。
. G8 h3 p; ^* J  z7 J, SC是drbd的复制协议,即A、B、C协议。
& ]1 O1 Z% x1 o0 wr-----是IO标记,反应的是该资源的IO状态信息。共有6种IO状态标记符号。5 d' D5 `- m9 M' ?, O& [9 ~
第四行是drbd同步过程中的状态,总体概括为"性能指标"。
7 A/ E1 o9 ~5 t8 N- j& b6 e8 p2 P" h+ O7 Y* A& W
以下翻译自官方手册: users-guide-8.4users-guide-9.0 。如果有疑问,可从官方手册自行查找答案。9 y+ F  T" o) C1 X; K
' }# ^* H8 v$ q3 N  }' ~7 Q

' a( j5 w: D( H0 R% n& ?
$ A3 D' x9 C# V$ h) h0 B  o4 O8 |' U) M
drbd-overview 4 [  b" a5 N: T: o( d
0:mysql/0  Connected Secondary/Primary UpToDate/UpToDate 0 K  ~& V' p( h4 [" r
1:image/0  Connected Secondary/Primary Diskless/UpToDate
# e! c8 \" [6 U3 O* d
% L  j, C) s# |8 w- r& y* ~二:
5 G( L/ _! ?- B, C/ D- T& I$ N2.1 连接状态(connect state,cs)和复制状态" E  m2 m; B- `4 O3 u# Q7 n
节点间通过TCP连接进行通信,在建立连接、断开连接、特殊情况下有很多种连接状态。, Y& P0 Z  |! k2 c" P/ {- [; K

& s+ `* B- J6 n4 A1 h' s  t+ Y/ I建立TCP连接后,还有称为"DRBD"的连接。DRBD连接建立完成,表示元数据区、数据区等一切都已准备好,可以进行任何数据同步的操作。
/ u. Q1 |+ ~% d& T! V5 `3 n( |  w2 W! W1 C$ F. j
节点间的连接状态既可以从/proc/drbd文件中获取,也可以使用下面的命令来获取。% t2 x# m9 v* r

! |" h, w( n3 G1 W+ P$ }7 w1 \/ Y( y* t3 I/ C
drbdadm cstate mysql
( @& k1 S' h7 L. ]9 K  X6 pConnected
% @, ?7 \/ n' E. e( J) K: _6 R/ T9 V' J6 ?
/ D& C. P# L8 l( \* [$ I; [: E
drbd84中,将连接状态和复制状态全部都归类为连接状态。但在drbd9中,由于可以通过net指令定义多个drbd节点,它更网络对端和volume的概念。因此它将和连接关系不大的状态独立划分为"复制状态(replication)"中,例如同步、验证相关的状态。本文就懒得去区分它们了,都放在一起解释吧。! h! m$ K, d- I% E7 C
5 S( P8 }1 C" E$ U6 l
有以下几种连接状态,其中最常捕获到的状态已经加粗显示。: U  }  I- Z/ E0 e: ^2 [, {
+ ^: J# v. u& x1 f. f5 Y
WFConnection:当前节点正在等待对端节点出现。例如对方节点drbdadm down后,本节点将处于本状态。$ |9 A# e7 {( b1 o1 O
StandAlone:无连接。出现这种状态可能是因为:未连接过、使用drbdadm disconnect断开连接、节点由于身份验证的原因未成功加入drbd集群使得连接被删除、脑裂后断开连接。
+ j- m/ Y3 [: I1 M$ _Disconnecting:断开连接的一个临时过渡状态。它很快就会切入下一状态就是StandAlone。
9 N0 ^7 T; e  k7 ]& F) m( W# U; K! RUnconnected:尝试再次发起TCP连接时的一个临时连接状态(是连接超时后再次发送连接请求产生的状态),它的下一个状态可能是WFConnection,也可能是WFReportParams。
9 z- V: m2 K. \4 XTimeout:和对端通信超时时的临时状态。下一个状态就是Unconnection。6 u2 w' |  m- n/ `
BrokenPipe:和对端连接丢失时的临时状态。下一个状态是Unconnection。. m6 F8 @! S1 ], J0 s7 T( _8 e- N
NetworkFailure:和对端连接丢失时的临时状态。下一个状态是Unconnection。(没错,和上面的一样)7 m7 a3 w* [7 L8 N: F
ProtocolError:和对端连接丢失时的临时状态。下一个状态是Unconnection。(没错,还是和上面的一样)
" z7 T7 c- G# _3 S  rTearDown:对端关闭TCP连接时的临时状态。下一个状态是Unconnection。
3 E" _: @9 M" C9 l$ K# K' XConnected:DRBD连接已经建立完成,数据镜像已经激活成功。这个状态是drbd正常运行时的状态。
! Q; s" c) \# l6 B8 U4 U' YWFReportParams:TCP连接已经建立完成,该节点正在等待对端的第一个数据包。
  N" ]$ O1 t# x7 _$ q7 r; vStartingSyncS:全盘数据同步中。只有在初始化时才应该全盘同步。下一个状态是:SyncSource或PauseSyncS。
6 `. j8 e1 e$ L/ q3 ~  qStartingSyncT:全盘数据同步中。只有在初始化时才应该全盘同步。下一个状态是:WFSyncUUID。1 O- b' ]- L* O% N" W( Q
WFBitMapS:部分数据正在同步。下一个状态是:SyncSource或PauseSyncS。8 f7 M) C% V( E" Q! E4 J: |% T0 A( f
WFBitMapT:部分数据正在同步。下一个状态是:WFSyncUUID。
9 k: P1 c% A# J+ P# |/ MWFSyncUUID:同步马上就要开始了。下一个状态:SyncTarget或PauseSyncT。4 `' v. g/ K: P3 J; o7 h
SyncSource:正在同步,且本节点是数据同步的源端。
2 w- O9 n4 ^' F2 ~& t8 K! ]SyncTartget:正在同步,且本节点是数据同步的目标端。, @+ }% V  v& P7 j) M5 k& C
PauseSyncS:本节点是同步的源端节点,但同步过程当前被暂停。出现这种状态的原因可能是当前同步进程依赖于另一个同步进程完成,或者使用drbdadm pause-sync手动中断了同步操作。, R5 @4 U! U/ A  \. L
PauseSyncT:本节点是同步的目标端,但同步过程当前被暂停。出现这种状态的原因可能是当前同步进程依赖于另一个同步进程完成,或者使用drbdadm pause-sync手动中断了同步操作。7 v$ n* d* Y% ^
VerifyS:正在进行在线设备验证,且本节点将成为验证的源端。- q0 n8 k/ b( a, ^. h% J' ]
VerifyT:正在进行在线设备验证,且本节点将成为验证的目标端。
; c0 p* k1 U) b$ C  j* P在drbd9中,WFConnection状态改为connecting状态。删除了WFReportParams状态。添加了以下几个同步相关的状态:2 n% F( _$ t0 z- d& _: M, ~
6 D* i) K! s0 b4 P2 R7 w: L  ?/ U, `! s
Off:该卷组还未同步,因为连接未建立。
5 U, V# K( i8 I5 n% qEstablished:所有对该卷组的写操作已经在线完成同步。这是drbd正常运行时的状态。
2 }% J8 |6 y3 ~, nAhead:数据同步操作被挂起,因为网络套接字中达到了一定的堵塞程度,无法应付更多的负载。该状态需要配置"on-congestion"选项来启用。
6 X9 L9 ~' G3 X6 i6 QBehind:对端将数据同步操作挂起,因为网络套接字中达到了一定的堵塞程度,无法应付更多的负载。该状态需要在对端节点上配置"on-congestion"选项来启用。4 @/ f6 Z8 N6 A6 B
- V) ~( C  Q1 U; e

8 O! r; u5 E1 z& b7 v* D2.1 角色状态(roles,ro)0 [/ Y7 O- a1 v0 z, M7 A. Y9 `
     资源的角色状态既可以从/proc/drbd文件中获取,也可以使用下面的命令来获取。
: c  ~1 p) F9 S2 i% z8 a1 C. u
' l5 I+ M, |5 h5 m1 s+ v0 m/ X, f; w! {4 A* C" H
drbdadm role mysql
  s' L1 v5 B. g& V, N# FSecondary/Primary
" e. V0 W/ D% o- v) J, \, c1 _6 f- T8 f  f' U8 X
% }. y1 q2 t% `5 ~7 n  {  v
drbdadm role image
  s6 i+ A. O  K4 wSecondary/Primary
$ {( K( w1 g% L" {- f# U; h7 Q' E
- v5 G# f5 ]! ^5 s& t+ o' [
在角色状态信息中,本地节点总是标记在第一位,远程节点标记在结尾。+ u- R6 p9 G% @/ W

3 y( g) U" p6 X4 o, j: V+ \+ C& u$ D可能的节点角色状态有:& k) K7 Z8 I' K/ b8 F9 k

- ~" P; `& q7 F5 WPrimary:资源的primary角色,该角色状态下的drbd设备可以进行挂载、读、写等。在没有启用多主复制模型(dual-primary mode),只能有一个primary节点。8 _" N( ~) K# h) {/ d
Secondary:资源的secondary角色。该角色状态下的drbd设备会接收来自primary端的数据更新(除非和对端不是primary)。且该角色的drbd设备不可挂载、不可读、不可写。. G( S2 |! R& E2 b3 X8 w2 @
Unknown:资源的角色未知。本地节点的角色状态绝对不可能会是这种状态。只有对端节点断开连接时对端节点才处于Unknown状态。& k$ \4 o) a0 p

; o" \5 j# ]' w' P) L& B
- d& c* x2 _) |' G  d磁盘状态(disk state,ds). r- q6 D; Y" ]6 a: q
, f8 H/ N! Y; s6 Z+ U
" s8 ]  g+ k( H  f. Q/ n
磁盘的状态既可以从/proc/drbd文件中获取,也可以使用下面的命令来获取。
  N  v) P& Z6 n# l2 o/ n8 g% v) ^% Z; T- w( }- Y! [
drbdadm dstate mysql
# \4 `+ O7 W& A3 {  mUpToDate/UpToDate
4 w: g, z5 O6 L" [# Z" {0 J  v. |: M; D  p
drbdadm dstate image
( l% H6 |+ o# H' {! JDiskless/UpToDate! E# f( G2 q- d$ c4 }- f
* \7 z8 d: d+ T" a  {+ `

9 }% c; s. g4 T$ n: `3 g# o1 i4 E. O
在磁盘状态信息中,本地节点的磁盘状态总是标记在第一位,远程节点标记在结尾。这两端节点的状态信息都可能为以下值:
  • Diskless:没有为DRBD驱动分配底层块设备。这意味着资源可能从没有和它的底层块设备进行关联绑定(attach),也可能是手动detach解除了关联,还可能是出现了底层IO错误时自动detach。
  • Attaching:读取元数据时的一个短暂的状态。
  • Failed:本地块设备故障时的一个短暂的状态,下一个状态是:Diskless。
  • Negotiating:在已连接的DRBD设备上还要进行Attach时的一个短暂的状态。
  • Inconsistent:数据不一致。在双方节点(还未进行全盘同步之前)刚创建新的资源时会立即进入此状态。在某一端(目标段)正接收同步数据时,也会进入不一致状态。
  • Outdated:资源的数据是一致的,但是数据过期了。(例如,已经同步后secondary下线了,之后又上线了,在还没开始重新同步的时候就是Outdated状态)
  • DUnknown:用于标识对端节点没有连接时的磁盘状态。
  • Consistent:连接断开时的数据处于一致性状态,当连接建立后,将决定数据是UpToDate还是Outdated状态。
  • UpToDate:资源的数据是一致的,且数据是最新的。这是drbd数据正常时的状态。
    5 l$ f- o8 i! Z7 y2 C  b

5 _! p  q9 q! t- Q8 I& i  \3 g% ~" D9 e1 J0 T" R

: z5 p5 R2 P. x: X3 M; k5 F

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2023-12-21 11:27:06 | 显示全部楼层
IO状态标记
IO状态标记表示的是当前资源的IO操作状态。共有6种状态:
  • IO挂起:r或s都可能表示IO挂起,一般是r。r=running,s=suspended。
  • 串行重新同步:资源正在等待进行重新同步,但被resync-after选项延迟了同步进度。该状态标记为"a",通常该状态栏应该处于"-"。
  • 对端初始化同步挂起:资源正在等待进行重新同步,但对端节点因为某些原因而IO挂起。该状态标记为"p",通常该状态栏应该处于"-"。
  • 本地初始化同步挂起:资源正在等待进行重新同步,但本节点因为某些原因而IO挂起。该状态标记为"u",通常该状态栏应该处于"-"。
  • 本地IO阻塞:通常该状态栏应该处于"-"。可能有以下几种标记:
    • d:因为DRBD内部原因导致的IO阻塞。
    • b:后端设备正处于IO阻塞。
    • n:网络套接字阻塞。
    • a:网络套接字和后端块设备同时处于阻塞状态。5 ]7 Y4 O, @, d- w4 u1 J! `0 P8 t% \
  • Activity Log更新挂起:当al更新被挂起时,处于该状态,标记为"s",通常该状态栏应该处于"-"。(如果不知道什么是Active Log,请无视本标记)+ j- p! Z; ^: t4 @* \+ c) E0 a
% e! S* h0 }) `3 F

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2023-12-21 11:27:44 | 显示全部楼层
性能指标
主要是一些计数器和计量器的值。
请结合drbd原理图进行理解:
drbd84中使用缩写符号来标记性能指标,而drbd9中使用全称来表示。例如drbd84中的ns和drbd9中的send是同一个意思。
  • ns/send (network send):通过网络连接发送给对端的数据量,单位为Kb。
  • nr/receive (network receive):通过网络连接接收到对端发送来的数据量,单位为Kb。
  • dw/written (disk write):该卷(volume)写入本地磁盘的数据量,单位为Kb。
  • dr/read (disk read):该卷(volume)从本地磁盘读取的数据量,单位为Kb。
  • al/al-writes (activity log):元数据区中al更新的次数。
  • bm/bm-writes (bit map):元数据区中bitmap更新的次数。
  • lo/lower-pending (local count):DRBD发起的打开本地IO子系统的请求次数。
  • pe/pending (pending):本地发送给对端但却没有回复的次数。
  • ua/unacked (unacknowledged):接收到对端发送的请求但却没有给予回复的请求数量。
  • ap/upper-pending (application pending):转发给DRBD的IO块的请求,但DRBD还没给予回复的请求数量。
  • ep (epochs):epoch对象的数量。通常为1。drbd9中没有该指标。
  • wo/write-ordering (write order):当前正在使用的write order方法:b(barrier), f(flush), d(drain)或n(none)。
  • oos/out-of-sync (out of sync):当前不同步的数据量,单位为Kb。; C  g  Q4 ~0 _. Q8 S2 S
上面所有"未给予回复"的指标数量都表示动作还未完成,需要回复后才表示操作完成。这些未回复数值不能太大。
此外,drbd9中添加了以下几个指标:
  • resync-suspended:重新同步操作当前是否被挂起。可能的值为no/user/peer/dependency。
  • blocked:本地IO的拥挤情况。
    • no:本地IO不拥挤。
    • upper:DRBD层之上的IO被阻塞。例如到文件系统上的IO阻塞。可能有以下几种原因:
      • 管理员使用drbdadm suspend-io命令挂起了IO操作。
      • 短暂的IO阻塞,例如attach/detach导致的。
      • 删除了缓冲区。
      • bitmap的IO等待。# L* I4 a3 N0 i3 B6 c! L% ]
    • lower:底层设备处于拥挤状态。: c! _6 g( p7 f5 L! C5 g

    0 _5 h4 l* [# {4 C* u6 |

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2023-12-21 11:30:55 | 显示全部楼层
crm status
# a- g* d/ V/ YLast updated: Thu Dec 21 03:30:22 20235 ^: d' w" E" \5 |8 r( b* Q( J/ R
Last change: Wed Dec 20 09:30:19 2023 via crm_attribute on cucloud002
: v3 r/ R* |! Q7 x: t0 C5 hStack: classic openais (with plugin)' u3 m( l+ y2 K
Current DC: cucloud001 - partition with quorum
3 Z; g8 G+ }1 [3 V, I& i2 t5 MVersion: 1.1.10-14.el6_5.2-368c726
* U- w* ]; I  X9 U2 Nodes configured, 3 expected votes
( U* l- X. D) y  b21 Resources configured
+ D- Y  H7 X* f+ Z
: n, b# f# L! X# f
5 Y& ~0 d$ c( D: [: bNode cucloud002: standby
/ H2 l5 q4 e/ v! d) v$ }8 yOnline: [ cucloud001 ]0 m* K1 S- U& S
, y) X& i* T$ ?. N/ T7 W
Master/Slave Set: ms_drbd_1 [res_drbd_drbd_mysql]  p2 Q/ e; O* t; @. Y/ U' w
     Masters: [ cucloud001 ]  Y5 v9 C7 W" a9 |
     Stopped: [ cucloud002 ]
8 D5 x% K8 H9 F& c2 [* Z Master/Slave Set: ms_drbd_1_2 [res_drbd_drbd_image]" _/ o& X" N6 Y, u: q: X, f5 m
     Masters: [ cucloud001 ]
  }# k+ _% f) u& o- U     Stopped: [ cucloud002 ]$ {2 {: A+ q& y4 H
Resource Group: openstack_g
' X- q) u+ _4 y* q     fs_glance        (ocf::heartbeat:Filesystem):        Started cucloud001 9 Q+ L2 N0 K' e
     fs_mysql        (ocf::heartbeat:Filesystem):        Started cucloud001 8 Z( q2 m! \. v! q, @
     mysqld        (lsb:mysqld):        Started cucloud001
3 a) k% }" o2 W+ q1 f2 Q  T     ip_openstack        (ocf::heartbeat:IPaddr2):        Started cucloud001
; T/ Z1 C( V, S, ?9 N3 f% ?. k& v     openstack_keystone        (ocf:: openstack:keystone):        Started cucloud001
( t8 G* a$ _: V" \! M* D     op-glance-reg        (ocf:: openstack:glance-registry):        Started cucloud001 7 U5 W$ p6 m) Z  d
     op-glance-api        (lsb: openstack-glance-api):        Started cucloud001 0 R6 X+ W% Y% s: s
     op-quantum        (ocf:: openstack:quantum-server):        Started cucloud001
8 m7 A$ M/ y, m     openstack-nova-conductor        (ocf:: openstack:nova-conductor):        Started cucloud001
( ^$ w! E8 U' ~; F. g     openstack-nova-consoleauth        (ocf:: openstack:nova-consoleauth):        Started cucloud001
+ }6 y0 O% }" }5 O$ I. I* _0 K0 {     openstack-nova-scheduler        (ocf:: openstack:nova-scheduler):        Started cucloud001
6 X- j7 s0 K, C! M     openstack-nova-api        (ocf:: openstack:nova-api):        Started cucloud001
; p* n8 A$ Z8 k4 w Resource Group: others_g
6 O% V+ ?3 S( `7 N     ip_others        (ocf::heartbeat:IPaddr2):        Started cucloud001 7 f- i+ W0 W7 l1 V+ l
     qpidd        (lsb:qpidd):        Started cucloud001 ' h. v5 E" r+ U1 v3 A5 V7 w; m. p, @
     qrj-keystonedb        (ocf::qrj:qrj_clean_keystonedb):        Started cucloud001
9 ~; c) F/ U& h: x% L" b# u# H ntpd        (lsb:ntpd):        Started cucloud001
6 N/ @9 r( q. {- r6 T% ~9 E
& z# j" O! ~) E# R8 vFailed actions:
8 z! f3 m1 \( Q: ^    res_drbd_drbd_image_start_0 on cucloud002 'unknown error' (1): call=14958, status=complete, last-rc-change='Wed Dec 20 09:18:22 2023', queued=1133ms, exec=0ms
+ r9 v4 w  y9 I9 U5 p6 S: p5 `
; t1 P) P. E# c% o; n

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2023-12-21 23:11:10 | 显示全部楼层
1、配置文件介绍
* d' Y, h" }- [. f) M, w( a
" @2 l" _+ \  ^    drbd的主配置文件为/etc/drbd.conf;为了管理的便捷性,目前通常会将些配置文件分成多个部分,且都保存至/etc/drbd.d目录中,主配置文件中仅使用"include"指令将这些配置文件片断整合起来。通常,/etc/drbd.d目录中的配置文件为global_common.conf和所有以.res结尾的文件。其中global_common.conf中主要定义global段和common段,而每一个.res的文件用于定义一个资源。
7 m4 U" a, l+ z+ l$ p/ A5 K" }- b7 f
    在配置文件中,global段仅能出现一次,且如果所有的配置信息都保存至同一个配置文件中而不分开为多个文件的话,global段必须位于配置文件的最开始处。目前global段中可以定义的参数仅有minor-count, dialog-refresh, disable-ip-verification和usage-count。! e. Y+ w2 k  n5 u$ f
5 |$ A, i- J/ E. N
    common段则用于定义被每一个资源默认继承的参数,可以在资源定义中使用的参数都可以在common段中定义。实际应用中,common段并非必须,但建议将多个资源共享的参数定义为common段中的参数以降低配置文件的复杂度。
1 {' Y: l& u2 T7 b3 D
1 G1 R( a) {1 G, d    resource段则用于定义drbd资源,每个资源通常定义在一个单独的位于/etc/drbd.d目录中的以.res结尾的文件中。资源在定义时必须为其命名,名字可以由非空白的ASCII字符组成。每一个资源段的定义中至少要包含两个host子段,以定义此资源关联至的节点,其它参数均可以从common段或drbd的默认中进行继承而无须定义。4 c: C6 w; R5 q/ `

* z( \) B  [( D! q以下是我的配置事例:( Y! G  J. }) E$ S
( M8 n9 [, v: f7 _3 I
#cat /etc/drbd.d/global-common.conf! \+ J& D5 G7 p  l

5 o. m6 j0 C* b6 p  p
" K% I. h) ~/ W) |6 f* T
/ Q1 b7 H0 A. S- A$ q5 Z6 {
+ E2 E+ Z$ _7 r7 |global {
1 i) T+ e3 w3 j! b& p1 W        usage-count no;
5 N8 y+ f- N) R: F: y        # minor-count dialog-refresh disable-ip-verification
, V! s# C' y' `% ]. A}
& \5 K4 U3 y5 k8 {" e, A" bcommon {
6 }5 T) ^, l: |1 {0 m* C        protocol C;
: ~( V+ K+ J+ g) V4 u        handlers {
; S8 {( U' @) K' z8 f" n) l9 G" P                pri-on-incon-degr "/usr/lib/drbd/notify-pri-on-incon-degr.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";- y- T+ V% n9 q' e3 y
                pri-lost-after-sb "/usr/lib/drbd/notify-pri-lost-after-sb.sh; /usr/lib/drbd/notify-emergency-reboot.sh; echo b > /proc/sysrq-trigger ; reboot -f";
. Y1 b# k) t  k6 k" X                local-io-error "/usr/lib/drbd/notify-io-error.sh; /usr/lib/drbd/notify-emergency-shutdown.sh; echo o > /proc/sysrq-trigger ; halt -f";
' }5 U. F+ o7 w- Y" h( U                # fence-peer "/usr/lib/drbd/crm-fence-peer.sh";
; `5 d! {6 \; c" {                # split-brain "/usr/lib/drbd/notify-split-brain.sh root";7 H8 Z# u- W) S  d
                # out-of-sync "/usr/lib/drbd/notify-out-of-sync.sh root";% i. W, J. c6 M; b* f3 |+ Z2 F" M  W
                # before-resync-target "/usr/lib/drbd/snapshot-resync-target-lvm.sh -p 15 -- -c 16k";
  d8 M7 G  I, x0 A' Z* ]7 [                # after-resync-target /usr/lib/drbd/unsnapshot-resync-target-lvm.sh;$ f% X: }& j0 w: R) n6 w: U
        }  E" p" \1 h; E1 U: Z+ p
        startup {
% B8 a: o( \6 K* c# M* y1 X                #wfc-timeout 120;
7 S: i7 \6 p' F& a1 q( c, x                #degr-wfc-timeout 120;3 |% P5 U, \# V* q+ J: A
        }! j# R5 P8 i, n# J" T9 e, |
        disk {' T$ _/ {1 x% `" X; }& c, ?1 I
                on-io-error detach;
. `) ?  }* a3 x% N* W                #fencing resource-only;
+ ~% e1 h* p6 W" v+ g& g* c        }6 P& o9 y: r# }, U: @4 k& g. W
        net {
+ T+ y6 G$ P' }( ~                cram-hmac-alg "sha1";  m3 G- h  y2 M3 u
                shared-secret "mydrbd";  {6 u& w2 q9 ]5 F" [, c/ v# ?- P
        }
, t' x0 o3 f, X        syncer {- u4 w' t7 k! g& @
                rate 1000M;
  X- X* u% e; E1 k" A+ v/ n        }
1 U* t3 W4 A# P$ j}1 j' L$ y6 u1 ?! ]( c
2、定义一个资源/etc/drbd.d/web.res,内容如下:
: S/ E4 L5 f0 k* x0 ~. A6 j2 B4 K$ B' n: |  ~) V

2 N- ]/ |8 M+ u9 h" h. C" h: [& G. {* L- y0 y
resource web {
% g+ L/ r3 w; x" h  on node1.wzlinux.com {# S4 s4 @3 W# Y* I0 D
    device    /dev/drbd0;$ s& G3 O& c: A1 |7 c
    disk      /dev/sdb;6 Q- O% b6 T4 L, L% s: M* G# M
    address   192.168.0.10:7789;
$ e; ?; S3 D! M  t    meta-disk internal;
: _7 ~' h  R3 K. i  }
0 Y' y7 q1 r0 I$ a' ^8 D  on node2.wzlinux.com {! ]% m* E( H% t0 w- w+ b2 W
    device    /dev/drbd0;# \6 q4 s& u& r, @. ?
    disk      /dev/sdb;
6 Y4 T6 z/ }7 i    address   192.168.0.11:7789;
( _; ^# \5 K% [% n! S& Y    meta-disk internal;
3 N5 u3 d9 @1 Z2 I1 u  }% j3 Z' o2 u+ ]3 H$ r+ ]' p
}
# c; {, O' q+ j" g7 F注:以上配置在两个节点上必须相同. b. Z2 Q+ n( `" x

8 [. G) b# D& \+ P# Q5 r; G
: U, n7 `4 M5 P6 M8 p9 j" y7 _& y% W
四、drbd启动和查看2 L+ L. Z6 {( y. o7 F5 ]" \

8 u  H/ W, E7 o% d/ z1、初始化资源9 f1 |+ Z8 s% W2 m0 F$ M( t! i0 p+ w

$ z! B/ j4 Q1 k# }在Node1和Node2上分别执行:' ]  z" Y' A4 ?, p, ?5 p# w* B

  z+ {- f( `. {4 X9 l/ y6 b' {" t; Y5 X# drbdadm create-md web
: n8 q3 i/ \0 y3 c4 l! Y. m( D$ u3 s' s8 K
wKiom1Zuaaezfc2oAABvnsE2UA0970.jpg; L* G: e: a1 k' m- Z

; s3 \' O9 Y1 J2 H3 i2、启动服务
: m: ?9 G: e7 d+ S4 {; H0 W+ H  q' g3 s  H3 U; Q' C8 @2 ^$ S
在Node1和Node2上分别执行:0 ^* Q8 A; G  _% z4 c

3 i9 a; l* J8 A( q. d5 E# service drbd start1 D/ z( F0 A1 C! O/ C2 V; n

: C! V3 _8 ]1 PwKiom1Zuad-yY6IVAAA5oMSEnj0629.jpg0 L: V" O" [% G
* `( E: A9 j$ J$ e0 X
3、查看启动状态
" l% L+ x; m* `( M8 ]" U$ U8 r* A/ [* R
; M5 S1 `$ L6 B
( Q4 f& z/ N6 t: x. }

, }) Z/ F$ x+ `cat  /proc/drbd        #或者直接使用命令drbd-overview
# O/ ?/ f4 L) Z9 o% Y$ G- bwKiom1ZubITTPfQFAABtRuKmbw0960.jpg. h7 j' G$ w& x) L" I; r
: w1 A, v0 j1 d  `, W
    从上面的信息中可以看出此时两个节点均处于Secondary状态。于是,我们接下来需要将其中一个节点设置为Primary。在要设置为Primary的节点上执行如下命令:
8 G- F- j& s& l2 t
: b( U0 w6 ]# K0 K) q  F) w! `% S  Y* M* x4 X5 ]5 a' m% B0 S
8 _/ X6 L; m3 a5 R+ j% S$ j1 t
: C3 |0 J$ |& t' ~. F4 c3 J
drbdadm primary --force web
& n. F: w3 ~' f# Y# n* L    然后我们再去查看状态,可以看到数据在同步中。4 H4 I, I, _# q$ {' J1 r' o
! [% L& c$ |7 w; ^1 t7 i& x' K
wKiom1Zub52A0x25AACE9DA7R5s955.jpg
+ [) d6 K. Q& }0 `" B  y1 U
6 q( k! U! K7 `' s; g+ q: R 注: 也可以在要设置为Primary的节点上使用如下命令来设置主节点:" \. N* C% n+ `; D, l# u
: t# f' l, P( T. T
     # drbdadm -- --overwrite-data-of-peer primary web
  s' L; a$ g- w7 Z0 r9 f
4 _# }. \/ H: W    等数据同步完成以后再次查看状态,可以发现节点已经牌实时状态,且节点已经有了主次:  p: J9 Y. ^/ D" _3 z2 j

0 b2 w" ~( g! A& R( K/ C7 J& ~7 FwKioL1ZucCri9IWoAABunqEsX6c581.jpg
. |: Q6 l6 E2 p9 |1 _. P( K+ O6 \1 U1 f8 ^9 E5 Q
4、创建文件系统6 H7 J+ O( \/ Z, f$ M$ K

5 e' I: z9 q/ Z& r0 ^' r% p. f    文件系统的挂载只能在Primary节点进行,因此,也只有在设置了主节点后才能对drbd设备进行格式化:
: u/ M6 u& ~0 {1 q" h  y
0 g9 }9 y0 t% q( [, N% o2 b
- E  V3 a; L5 ]7 s1 v9 Z3 Z* O2 P: Y" o% o! p% `

7 H& z- h* e; k! lmkfs.ext4 /dev/drbd0
' `4 C9 b! `( Z& j6 w# k: smount  /dev/drbd0  /var/www/html
' l: _1 t3 o/ ^, f! n5 v: kwKioL1ZucXTzM6dgAABh9dm3wdc516.jpg* M( p! g% _) |7 G

- f3 h" ~0 g$ p8 u' s5、切换Primary和Secondary节点
6 ~) K& ^* @! J% f
$ n9 X) l' _8 q5 v    对主Primary/Secondary模型的drbd服务来讲,在某个时刻只能有一个节点为Primary,因此,要切换两个节点的角色,只能在先将原有的Primary节点设置为Secondary后,才能原来的Secondary节点设置为Primary:! p2 g$ I4 H' T& O# Q1 Z
% `& ?! P% A) i* T2 J
Node1:
) h! W# j- P5 ~' T& A2 Z* j6 o+ f/ e( k; X# E# T9 I

+ W- {( L. |! m9 w5 H, H8 u0 X9 r
$ y* @% O4 \1 J' Y' P( z' n" u; _. ~7 m; z* f& ?* n9 r
cp  /etc/fstab  /var/www/html/        #复制一个测试文件- q/ ^* J) s- P
umount  /var/www/html- y0 \8 A" x" G
drbdadm secondary web              #设定为备节点/ e: d: j* |, C1 @6 V- D
查看状态:/ j" E3 ]/ ~' i
. ], e- o; m( T4 Q0 @/ t

! t. M8 _; d4 W
0 d3 b9 q. ~/ [0 W2 C- k8 A# drbd-overview
7 U8 u0 T6 ~' g: w: K9 e7 v  0:web  Connected Secondary/Secondary  UpToDate/UpToDate  C r----( @+ {3 C, I+ B$ o' o
Node2:# v) e6 z; ^, \2 V9 I! n: m' n! `; {
+ t7 Y7 u1 k6 d
1 ]! |! V$ g( A, a

/ Z1 ]# [. {! j' p$ U+ kdrbdadm primary web             #提升为主节点
$ g  U0 B) C9 }6 {" X3 Xdrbd-overview                   #查看状态是否提升成功
3 u4 T! P& N0 S( E, A% ymount  /dev/drbd0  /var/www/html   #挂载文件
, R' \, N6 s/ I# N    使用下面的命令查看在此前在主节点上复制至此设备的文件是否存在:
/ C2 Q0 K) x3 Y+ j. _: V1 }
+ m" h) G; K' w. \) J
: S. V3 l# s1 c) @5 K. D6 Y         1
+ F/ i# w- s8 s" \8 P# _9 w; H- f7 @5 }6 Y. b
ll /var/www/html/
4 M% Y& @7 l! ^! AwKiom1Zuc0Cgl5JqAAAw2zqGE2k492.jpg" ?2 N( g6 X8 W( G  ]9 F; W) I8 v
* S' ^6 l( Z' z$ q
    到目前为止WEB服务的数据可以实现实时同步,只要把WEB服务搭建起来就可以直接使用了,非常方便。
1 V: @1 W8 c' l  I1 R0 {' A! {9 n3 s
您需要登录后才可以回帖 登录 | 注册

本版积分规则

返回首页|Archiver|手机版|小黑屋|易陆发现技术论坛 ( 蜀ICP备2026014127号-1 )

GMT+8, 2026-6-12 03:04 , Processed in 0.025349 second(s), 23 queries .

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表