|
|
楼主 |
发表于 2023-12-25 20:48:51
|
显示全部楼层
8.1 crmsh - 概述 #
4 j. y0 D5 k [' G' a) [% _4 j U# S- vcrm 命令有多个子命令,这些子命令用于管理资源、CIB、节点和资源代理等。它提供了全面的帮助系统,并嵌入了示例。所有示例都遵循附录 B 中所述的命名约定。
9 F& ?3 B/ s) u! p
M4 U3 o) h+ a7 q# v提示提示:交互式 crm 提示符) E0 X* X, T7 W' B% `
使用不带自变量(或只带一个 sublevel 自变量)的 crm,crm 外壳将进入交互式模式。此模式由以下提示符指示:0 L6 R' x* E$ {! C' k
5 z [3 a1 R) O. l: A: z& t
COPY
/ K- s6 B8 u" g7 w1 O H$ z为了容易阅读,我们的文档在交互式 crm 提示符中省略了主机名。仅当您需要在特定的节点(如 alice)上运行交互式外壳时,才包含主机名,例如:
$ K% N& N; E9 e0 A4 b) P3 E/ c, _8 Z8 \
COPY* [/ x3 Q# U$ U7 D' C! {
8.1.1 获得帮助 #+ E7 \4 i, g& O, u
可通过以下方式之一访问帮助:4 g8 y- d% ^# Z7 B5 q
6 Y5 v e( Y7 W. f1 K: P: @: S输出 crm 及其命令行选项的用法:. D. m0 n% A. Z/ F8 U8 M, U( Z
7 S; v+ E8 G# J+ C5 A# D
crm --help6 e6 h) f: [' _" \, @; A8 R
COPY
6 b) u6 e2 A X" _# s# q列出所有可用的命令:1 ^; h: {: c, y- S% E( {
# c( {8 Z5 z: F5 Ocrm help3 ^1 H# @9 y* ?$ e! o% E1 n
COPY
5 R5 ~/ n$ |* p5 J& P访问其他帮助部分,而不只是命令参考:5 p. [: t( g$ g! d0 s' |
3 n4 u! F4 ^! W% a- J) Pcrm help topics
2 b2 E3 b, a& Z! y) d0 NCOPY
0 m6 P) \% @% z查看 configure 子命令的完整帮助文本:
- F0 e0 ^. ?4 E7 G0 C* o* M
! S6 J: L, e) W, q- }) l1 ^0 `crm configure help
, C7 K, l& g' N3 H& ?, F% MCOPY8 J0 V$ [8 u1 p& c" A N: u
要列显 configure 的 group 子命令的语法、用法及示例:
3 n, S V! ?+ x R5 s6 }+ K6 Z( L; b2 [
: d1 p7 b) ~# d& P. ^: \& ?: q7 ^3 Pcrm configure help group/ w% n8 f5 p# F. y d4 m
COPY
2 @3 U$ l& J' F! T以下命令的作用相同:
9 h) |8 x. o/ K! r( U
) `- Y0 f4 g$ P) Z! s, Vcrm help configure group
* s. w( j/ c/ [. M% ACOPY4 Y8 @# _2 {+ A Q
几乎所有 help 子命令(请不要与 --help 选项混淆)的输出都会打开文本编辑器。此文本编辑器允许您向上/向下滚动,以便更加方便地阅读帮助文本。要退出文本编辑器,请按 Q 键。
, B% p6 \- c8 `0 p2 q3 m y- S( w A- _
提示提示:在 Bash 和交互式外壳中使用 Tab 键补全
0 x2 ~2 \. k3 Rcrmsh 不仅为交互式外壳提供 Tab 键补全,还全面支持在 Bash 中直接使用此功能。例如,键入 crm help config→| 会补全文字(就像在交互式外壳中一样)。; W/ V. F8 N$ Z% `$ F- Y) ?
9 ^+ [, |4 N. H! c6 {, v& F
8.1.2 执行 crmsh 的子命令 #3 b; D9 ~+ x' X* |- [8 D Q+ ~- v
crm 命令本身可按以下方式使用:* _, |' e$ O9 I S! ^$ H' o$ b; G
8 ^: f2 D1 W6 R! ]+ G
直接:: 将所有子命令连接到 crm 中,按 Enter,您将立即看到输出。例如,输入 crm help ra 可获取有关 ra 子命令(资源代理)的信息。
1 @5 S( ^% B7 g' X, C0 o/ ^9 H# n4 {3 _# f' f6 [
可以缩写子命令,只要缩写后的子命令是唯一的即可。例如,可以将 status 缩写为 st,crmsh 可以识别该缩写。- W1 B1 s, E7 H* N/ C: X' p
0 h# A: T. T# x" [
另一项功能是缩写参数。通常,您是通过 params 关键字添加参数的。如果 params 部分是第一个且是唯一存在的部分,则您可以省略它。例如,下面一行:
7 N" R% z" T$ A( N1 h7 P. }% d9 d7 {( r5 z* s0 q" h5 n v" `
crm primitive ipaddr ocf:heartbeat:IPaddr2 params ip=192.168.0.553 R: X# `5 q+ H2 l# l
COPY
1 V3 F d: u! I2 O( j相当于下行:
4 o* M' s+ G7 { F- s/ ]5 Q& ^; c J4 R! ]) U% B. I" H
crm primitive ipaddr ocf:heartbeat:IPaddr2 ip=192.168.0.55
% E- J+ }4 V/ DCOPY! D1 Q& c( K: X/ f; X
作为 crm 外壳脚本: Crm 外壳脚本包含 crm 的子命令。有关详细信息,请参见第 8.1.4 节 “使用 crmsh 的外壳脚本”。; _% ~) j. s& G9 ~3 f$ u4 f5 R
1 }9 b H: F0 E9 J1 y; \' W* F. a% h作为 crmsh 群集脚本:: 此类脚本是元数据、对 RPM 包的参照、配置文件及多个 crmsh 子命令捆绑在一起并以单个描述性名称命名的集合。可以通过 crm script 命令管理这些内容。% r! I) W/ r# m' L m
6 x/ O3 _% w4 |) j0 c
请不要将它们与 crmsh 外壳脚本相混淆:尽管两者具有一些共同的目标,但 crm 外壳脚本只包含子命令,而群集脚本所包含的远远不只是简单的命令枚举。有关详细信息,请参见第 8.1.5 节 “使用 crmsh 的群集脚本”。) R, i. b8 w+ c% N2 W4 ^1 a* V
3 h( h9 A0 x4 p+ w8 v+ }- R5 E. N8 d
作为内部外壳交互: 输入 crm 以进入内壳。提示更改为 crm(live)。使用 help 可获取可用子命令的概述。由于内壳具有不同级别的子命令,您可以键入一个子命令然后按 Enter“进入”相应的级别。% L# \( N% G4 v; j, D5 D
5 O# v$ T9 b+ H4 N5 P/ @6 e" e
例如,如果输入 resource,则进入资源管理级别。提示符将更改为 crm(live)resource#。要退出内壳,可使用命令 quit、bye 或 exit。如果需要返回上一个级别,可使用 back、up、end 或 cd。' @4 ?( P, P% } S2 W- }
: C& u* I; m$ }1 P- H3 c您可以键入 crm 和相应的子命令(不含任何选项)直接输入级别,然后按 Enter。$ G0 F" ~' l( E8 I1 x
" N7 T. V9 o5 q: ^: d内壳还支持使用 Tab 键完成子命令和资源。输入命令的开头,按 →| 和 crm 完成相应对象。: Q0 `% d9 I5 ` p/ D& I
7 z! z. s1 ^/ `& @$ X- ?+ U除了前面说明的方法外,crmsh 还支持执行同步命令。使用 -w 选项可以激活该命令。如果已启动不带 -w 选项的 crm,则可以稍后通过将用户自选设置的 wait 设为 yes (options wait yes) 来启用它。如果此选项已启用,则 crm 将会等到事务完成为止。事务一经启用,就会打印出点以指示进度。同步命令执行仅适用于 resource start 之类的命令。' o0 N$ f' l' j( Z9 r; U
7 e+ [+ ]) [5 f9 P& I& I注意注意:管理和配置子命令之间的区别6 j! H, V' {5 |0 u' o
crm 工具有管理功能(子命令 resource 和 node),可用于配置(cib 和 configure)。. Y% t2 X+ D( N
6 w: [" i4 p0 H4 R# Y. ?9 ^3 T
以下小节概述了 crm 工具的一些重要方面。/ c& Z b Q2 i: q8 p
2 F" _/ e3 S t7 a7 T
8.1.3 显示有关 OCF 资源代理的信息 #( j, C) ~. L0 W
由于在群集配置中一直需要处理资源代理,crm 工具包含了 ra 命令。使用该命令可以显示有关资源代理的信息并对其进行管理(如需其他信息,另请参见第 6.3.2 节 “支持的资源代理类”):
7 D3 ~9 i/ _1 H: R6 |. `
% x( R4 r+ R0 K% w' _, Scrm ra
& s) U0 [& Q/ r, X, `0 XCOPY$ p* _" t D' d: z5 q
命令 classes 可列出所有类和提供程序:. \ L8 N$ l0 Q7 h5 n: V- r
( @5 l' O" A- C5 H2 A, ^; Q7 i7 q1 k/ ?* tclasses
' k! Y g' A# T4 U Y7 B, Z O/ P lsb
9 E" p0 f; Y+ {8 J ocf / heartbeat linbit lvm2 ocfs2 pacemaker
1 B$ a" ~& Y* |% k9 J6 W service
1 s! o8 Z" ?7 D4 b4 U% } stonith2 l! _$ K1 \ d- j" ^2 [. p* [
systemd, N+ X0 ~, s4 B0 i: A6 s& T
COPY
" f* z+ t' p9 Z; X0 d. {( m要获取某个类(和提供程序)的所有可用资源的概述,可使用 list 命令:# r; ?0 H! ~+ T" y7 `) h7 s
- s% P. o* g- X% b/ J% Slist ocf* b4 M: S: ~% s6 y: h
AoEtarget AudibleAlarm CTDB ClusterMon$ X% v7 @9 J9 i3 k) C
Delay Dummy EvmsSCC Evmsd9 ` a( _7 W3 c2 }6 }
Filesystem HealthCPU HealthSMART ICP& G( q- ~2 A% W. u; L7 d, {+ j: g: G
IPaddr IPaddr2 IPsrcaddr IPv6addr; k5 {2 M( w' _+ [0 n( a
LVM LinuxSCSI MailTo ManageRAID+ t; J7 a9 o* `3 ?- @
ManageVE Pure-FTPd Raid1 Route
% u% ^ U$ f$ z! T0 u% ySAPDatabase SAPInstance SendArp ServeRAID
: G- Q1 N( K" @! ^ j- J, V6 R...
) q2 S6 [) e; x* ^COPY
' o+ U& F9 k$ V( p; y+ o) V可使用 info 查看资源代理的概述:
8 c9 |! b& F% Z9 ^ O5 t) p) g; c% V- G t( y! X! a
info ocf:linbit:drbd1 t z+ T7 ]# Y# ~( }' l$ F
This resource agent manages a DRBD* resource
( U* u5 K- _6 uas a master/slave resource. DRBD is a shared-nothing replicated storage* B2 t. H: m$ z- a# \7 }3 K
device. (ocf:linbit:drbd)3 }/ P* {5 F5 n ]6 [$ F
; o. Q4 O0 L3 I! t6 s% z a% T$ {Master/Slave OCF Resource Agent for DRBD. N" k) g; \4 u( l
: ]& T @3 L# p! D* R7 W. H- {0 Q jParameters (* denotes required, [] the default):
5 }: _3 r) Y& y; i7 w) F+ H! V# D3 }- S6 ?; B8 W0 x+ C3 `; G5 l
drbd_resource* (string): drbd resource name
: \; h( F6 |4 j: l( }! u The name of the drbd resource from the drbd.conf file.
- s+ w) u: I( T8 V1 `+ n+ m1 }8 C1 Q9 F- T
drbdconf (string, [/etc/drbd.conf]): Path to drbd.conf
/ E" `( v' P4 ~8 k Full path to the drbd.conf file.0 [' \6 F* ? n# U, M
; P l9 g# b d7 b6 ?, {$ C7 vOperations' defaults (advisory minimum):" \ n! t" C9 r! ] x( o
3 K0 d" ]* p3 O# J
start timeout=240
! N& Z+ V# F- K6 L% ]+ x% X promote timeout=90 1 D% j' r/ {7 N& f3 b
demote timeout=90
9 \" Y( b9 T1 G3 G2 p$ j- W notify timeout=90 1 |# k0 M. t% }6 a n
stop timeout=100
, f+ H% u9 }& w# f( p' c6 N# s monitor_Slave_0 interval=20 timeout=20 start-delay=1m, s' \: h8 P7 x7 r) V% ^# C* k
monitor_Master_0 interval=10 timeout=20 start-delay=1m( S. d& T* ~: [7 o: B/ J9 x# h+ L
COPY
# u& q2 i4 P1 z& t4 }$ e ^按 Q 退出查看器。
" A+ u8 _) Y9 [, M/ D0 P
( N8 r/ P% t2 r6 }0 y0 l0 h2 j提示提示:直接使用 crm
_; {7 J. `1 z0 Q' _7 _' t; u" Y在之前的示例中,我们使用了 crm 命令的内壳。但是您不一定非要使用它。将相应子命令添加到 crm 中也可获得相同的结果。例如,在外壳中输入 crm ra list ocf 可以列出所有 OCF 资源代理。
1 p2 F8 a% u) L. C% G$ I
. \# a* j2 x1 g4 V& z, [3 {6 w" u8.1.4 使用 crmsh 的外壳脚本 #
$ q2 Z) P3 O5 H$ w) QCrmsh 外壳脚本提供了将 crmsh 子命令枚举到文件中的便捷方式。如此,您便可轻松地注释特定行或稍后重新运行这些行。请注意,crmsh 外壳脚本只能包含 crmsh 子命令,不允许包含任何其他命令。7 K4 ]5 x: T9 O0 a" ]) v7 P
8 Y& U' A# j- C2 X1 O& t7 a: p0 [您需要先创建包含特定命令的文件,然后才能使用 crmsh 外壳脚本。例如,下面的文件会列显群集的状态并提供所有节点的列表:$ b1 N2 ]3 c0 ~: f% u7 C
6 Y+ U& h- a- ~: n6 I4 E2 z4 O# y7 b例 8.1︰ 简单 CRMSH 外壳脚本 #
2 |3 N0 |/ c f# A small example file with some crm subcommands& m5 V; G4 M, O% ~9 v
status. @- l9 p2 _2 \) \# w% H& \
node list3 b" d+ ?) ~- r, J2 j
COPY- T4 t7 t3 _( v0 u7 Q' m" ~
以井字符号 (#) 开头的所有行都是注释,可忽略。如果行过长,可在结尾处插入反斜杠 (\),然后在下一行继续。建议缩进属于特定子命令的行以便于阅读。
& E& A6 S/ L R
- }) e' k' g4 t# A要使用此脚本,请使用以下其中一种方法:
7 B; n8 \- Q% y* F" S0 D+ q" h8 m/ q0 g7 p' E1 y
crm -f example.cli
/ w/ O$ w `& C, w/ x3 p! @0 \crm < example.cli4 f# D5 v4 n1 l
COPY) }# A2 d8 O" K/ L! P2 h/ S8 h
8.1.5 使用 crmsh 的群集脚本 #2 J. Y8 x" N, f* [- L ~7 d
从所有群集节点收集信息并部署任何更改是一项关键的群集管理任务。您不必在不同的节点上手动执行相同的过程(这很容易出错),可以使用 crmsh 群集脚本来代替该过程。 G Y' ~2 C2 ~5 R) w
( F' X# \1 X7 N请不要将它们与 crmsh 外壳脚本相混淆,第 8.1.4 节 “使用 crmsh 的外壳脚本”中对后者进行了介绍。
& t0 U8 k$ d+ }
( }! }& V1 u; m$ E" b2 ^6 ?2 ]. D5 \对比 crmsh 外壳脚本,群集脚本另外会执行如下任务:
8 R& G: i( g8 w4 j" F+ X+ t* ?$ `2 H4 T# T7 p$ |! x
安装特定任务所需的软件。
0 l5 E' P) H; y" M% j& U% ]* A9 B
: e N3 m% ~* q0 o创建或修改任何配置文件。' c- }9 P* U1 l" ~! L9 B
. A" T3 B! _4 e0 p/ Q, f收集信息并报告群集的潜在问题。
5 W4 a* ^; K3 y& a) |6 ]2 M
0 D) u$ ?: ~8 G) i将更改部署到所有节点。
) p4 p5 n4 }8 E' _. n6 F/ j3 E1 L8 j/ S9 s
crmsh 群集脚本并不能取代其他群集管理工具,它只是提供了一种集成的方式用于在群集中执行上述任务。有关详细信息,请参见http://crmsh.github.io/scripts/。4 \8 Z- Q6 L$ U+ I8 H; u
! E6 P" A1 o0 {2 P1 t8.1.5.1 使用 #
0 q2 y p% C( q$ ^8 S: j& x要获取所有可用群集脚本的列表,请运行:+ j g1 |! K" `8 u
! i6 E. S1 y6 P. [' M' j3 s
crm script list
0 y1 |6 p" y1 v9 \3 f! W' l( |COPY4 T7 z0 m' N: Q7 W H: {
要查看脚本的组成部分,请使用 show 命令和群集脚本的名称,例如:! Z3 G5 h4 S6 e: R& h) Y! L+ x
& _, X O F7 v# T( t9 mcrm script show mailto
* k# w2 Z: g' I1 gmailto (Basic)" J3 m6 H, I3 \. u3 D
MailTo
- E+ G' Z9 Z3 }. Z0 T4 F. @* }$ S6 T1 m. l9 z
This is a resource agent for MailTo. It sends email to a sysadmin" G! j; r% _5 `
whenever a takeover occurs.
d( d2 ]6 U) Q# u5 E7 d$ D+ p H. }. v* s2 m
1. Notifies recipients by email in the event of resource takeover2 s! Z/ O- R" v! |. x- B
! g, ]) I: N, a% z) V' J5 R, m+ x# l
id (required) (unique)
9 O3 ^9 {; }) z0 y5 p& w {1 Q Identifier for the cluster resource5 _$ Q8 Q' f% ?" [/ Y# o0 b
email (required)( z9 C+ m4 B- X1 o
Email address
8 k2 B" x8 ?$ Y# ^% c subject
% j B! }& P$ Z. @$ R- _( ? Subject- _) M! L) {3 @
COPY8 ]! l. E- w( o1 |' Q4 v& ^8 h* v
show 的输出包含标题、简要说明和过程。每个过程分为一系列按给定顺序执行的步骤。/ E6 t) i% c- V. l8 O. Y1 r
. l: k) P, H* m6 n每个步骤都包含一份必要参数与可选参数及其简要说明和默认值的列表。! O6 e7 J1 x. h! Z8 [) I" h% B
( j7 s5 M. ~& | o( z: ^6 D% |每个群集脚本都可识别一组通用参数。这些参数可传递给任何脚本:6 S3 I! g3 F" }% B, q. Z
4 ~5 l4 H" }& S( G表 8.1︰ 通用参数 #
T, z& @' L' t& [) t! W8 v参数 自变量 描述4 Q6 W, d7 \8 P
action INDEX 如果设置此参数,则只会执行单个操作(verify 会返回索引)
' Y- a' |! s$ L7 P" h. _6 Tdry_run BOOL 如果设置此参数,则只会模拟执行(默认值:no)
, x1 f G: o, B8 H! i$ ~5 w( Vnodes LIST 列出要对其执行脚本的节点3 u' C6 @& {' c" Q% g- [
port NUMBER 要连接的端口& e( r. J1 _& g) y" g
statefile FILE 在以单一步进方式执行时,状态将保存在给定文件中
# N( e4 @4 ^% xsudo BOOL 如果设置此参数,crm 将在适当的情况下提示输入 sudo 口令并使用 sudo(默认值:no)
9 ^/ W& E( `( \$ Q ^timeout NUMBER 以秒为单位的执行超时(默认值:600)
7 s/ c$ E' V* v, P) zuser USER 以给定用户的身份运行脚本; r$ s# ]1 U% h8 p i) U
8.1.5.2 校验和运行群集脚本 #
) `6 ]0 B) G6 B3 u9 W# H, j在运行某个群集脚本之前,请检查该脚本将要执行的操作并校验其参数,以免出现问题。群集脚本可能会执行一系列操作,并且可能会出于各种原因而失败。因此,在运行脚本之前校验参数有助于避免出现问题。
! i. N( b) @6 t, d5 C. E' {6 n8 y3 }" E& K1 }
例如,mailto 资源代理需要唯一的标识符和一个电子邮件地址。要校验这些参数,请运行:+ G8 B' }9 d% v7 j- Y
) u9 o R0 Q& k4 W7 k. I; ecrm script verify mailto id=sysadmin email=tux@example.org8 D# H+ b0 W% i
1. Ensure mail package is installed9 B# N/ A# G9 Y ^
J8 D6 ^% N; q" c0 ]9 H
mailx9 c i/ b9 C, i9 w2 D3 e% K
* ?; k/ D5 A7 V2. Configure cluster resources
+ U4 w2 y) k2 T7 C5 G, g, h+ @0 e: U1 `+ A- |- ~7 S5 ~) t: R
primitive sysadmin ocf:heartbeat:MailTo
( b; b1 U; c0 M* Y9 [' c G email="tux@example.org"
, _# a2 H; [: p9 E! D. I0 }. @ ] op start timeout="10"
`2 Q9 s6 V) Q$ h op stop timeout="10"( l! _8 K+ p/ z2 Z# M
op monitor interval="10" timeout="10") c C( K$ }. [- Y
2 P2 H$ v3 H2 P' |3 A& v clone c-sysadmin sysadmin+ E2 g! p9 D7 ?7 k- E( X
COPY
2 y, {; `5 y: z4 Qverify 将会列显步骤,并将所有占位符替换为您的给定参数。如果 verify 发现任何问题,将会报告问题。如果一切正常,请将 verify 命令替换为 run:+ y: z8 Q9 O7 y9 t
- L; j7 O9 B4 a I( }. W8 ~crm script run mailto id=sysadmin email=tux@example.org
6 k5 p7 g/ E' d& [INFO: MailTo& C% `# E, @; ~$ H$ A! y# C
INFO: Nodes: alice, bob: G* `6 R) b6 J/ J9 a( _
OK: Ensure mail package is installed
0 y9 {% g2 v DOK: Configure cluster resources2 P$ D" a$ a0 V9 Y* k8 D
COPY
+ Y5 F) j5 i4 h9 l使用 crm status 检查您的资源是否已集成到群集中:7 M4 F2 X9 e8 b" @- ]7 c1 j
" N! X. \. l, q$ x+ V
crm status: Q. E: H5 W2 \9 Q4 }
[...]
* C( y2 A W9 F# l8 o Clone Set: c-sysadmin [sysadmin], V g: e- T9 ^8 B7 f. ^: P" ?
Started: [ alice bob ]
) \) h1 q) z" X# O! BCOPY
" }) e9 M2 o9 d3 `8.1.6 使用配置模板 #
. O; r. l5 ~4 X: g注意注意:弃用通告; B* @9 r k: A: W1 \7 N
配置模板已弃用,将来会被去除。配置模板将由群集脚本取代,具体请参见第 8.1.5 节 “使用 crmsh 的群集脚本”。
% p3 V3 E. h; E0 J6 s' x* @, j
3 ?/ n( |- D( J配置模板可为 crmsh 提供即时可用的群集配置。请不要将其与资源模板(如第 8.3.3 节 “创建资源模板”中所述)混淆。资源模板只适用于群集,而不适用于 crm 外壳。/ } @: C3 k% R( k( @% z R& c
, k& |' }0 K1 [; S
配置模板只需稍作更改,即可满足特定用户的需要。每次使用模板创建配置时,都会出现警告消息,提示您哪些可以稍后编辑以供将来自定义。
8 u9 n H! U- ?. c* \5 p' J$ d" |9 n$ C
以下步骤显示了如何创建简单有效的 Apache 配置:, Y/ f; g0 F) Q
6 N9 L+ Q0 x$ M; W& E. Z以 root 用户身份登录,然后启动 crm 交互式外壳:
* v6 i' x0 r- P4 r7 y
8 t* }+ \# t' ocrm configure) c7 r) e2 \# M% C. q
COPY
( Y. | h9 A! q; ~2 t, i从配置模板创建一个新配置:0 S \- z! l% U$ m3 ~
8 i h2 e( Z# f9 ?! x切换到 template 子命令:
# b7 C8 o2 C4 V# q8 u' D; Q! S( w
: @* g/ a9 o* g$ r+ l2 Jtemplate
: x3 @2 n0 |& h; L) tCOPY
6 S2 ^; q. J% ~& I8 {4 D/ |列出可用的配置模板:
, w8 ], L) K _8 _+ {
- O. }0 c8 G9 Ilist templates
6 i- J1 [4 }& l3 T$ xgfs2-base filesystem virtual-ip apache clvm ocfs2 gfs20 w+ c0 `1 F* n+ L ?6 M
COPY
8 F6 d$ t7 w7 v" f* f2 A确定需要的配置模板。由于我们需要 Apache 配置,因此选择了 apache 模板并将其命名为 g-intranet:6 k& [/ Y: ~2 n/ k; c' l
) t/ ]! L" ?0 w! L! C3 Ynew g-intranet apache& J; f2 o& K4 S
INFO: pulling in template apache# f. B, h, J9 a. I9 Z: x
INFO: pulling in template virtual-ip4 x# T( N# A) V4 s" I0 b& {
COPY) {9 C p/ L+ i7 P$ P3 G
定义参数:. V4 t& N0 i5 x
- M/ A% A1 p) w* t/ N列出您创建的配置:" ~) X0 N u/ a$ X+ p4 d6 X
x8 y% p- [6 A* I% A& W ~3 y
list
7 n+ c4 K- O3 v4 ~# v4 Rg-intranet+ L3 k/ `0 z0 u
COPY
' j0 Y3 F0 S, M9 i' p4 e$ Q$ z显示需要由您填充的最少的必要更改: ]' L: b: \: v# s j- A4 O
9 D* L$ d& F1 K8 N: Gshow
, T0 F) ^4 M, }# G2 J" D. Q0 KERROR: 23: required parameter ip not set; V* l! R! I& a1 I: T* h% k
ERROR: 61: required parameter id not set
" R8 x. U* S- mERROR: 65: required parameter configfile not set% |; \, e4 Y* l+ Q# n% T
COPY
' Q' j0 I3 D$ q& N8 Z4 m5 X+ M调用首选的文本编辑器,填写显示为错误(如步骤 3.b 中所示)的所有行:
6 }- E! h$ b `) l' n* r2 T3 l6 E6 z/ y
edit' g4 A, B6 N% |) |) k; I+ V" W
COPY
( f/ x! C* z. t3 k; W显示配置并检查配置是否有效(粗体文本取决于您在步骤 3.c 中进入的配置):0 x9 t& x5 [/ k( B9 a: K0 s
, L' \* [9 p9 U8 N. `
show
) x9 P6 e* `6 z6 fprimitive virtual-ip ocf:heartbeat:IPaddr \
9 W# c% A! Q q% t params ip="192.168.1.101" L' E( k4 r* n! P" l
primitive apache ocf:heartbeat:apache \
% U' B+ W9 Y- |) o2 h# E params configfile="/etc/apache2/httpd.conf"
0 o" ~# ~* p! p" M monitor apache 120s:60s7 Q4 t3 Z2 E x4 {
group g-intranet \" V$ D1 Z T$ [
apache virtual-ip
0 W. K7 R! K, W: B4 wCOPY2 `8 y( O3 e& D2 q1 w
应用配置:- d! ^9 M/ X2 c
|7 s- _0 A9 b
apply
$ Q1 {8 K0 C" A$ Ncd ..0 ?8 P- s( P- B4 j3 _( s
show5 d' M, }! }9 v: m- P
COPY: V) Z7 ]2 S( h/ H4 ~
将更改提交到 CIB:
* s) b( _$ q; `) u) H; v& D { n z$ a! L
commit7 H: \5 i& _" \8 {/ `1 d$ @8 ?
COPY7 M: J; {# O6 O+ i' _
如果知道细节,可以更加简化命令。上述过程可汇总为外壳上的以下命令:
% s+ h" K/ }* M* a8 m' q" M! _: ?9 X+ _* s- b/ m- h$ n
crm configure template \6 B& d" p; f. C1 ^# s4 J
new g-intranet apache params \
/ N- T9 g, i& L configfile="/etc/apache2/httpd.conf" ip="192.168.1.101". o' I+ P7 y) }5 W: O" ?' R
COPY
7 t, x. n9 e; z$ G如果在 crm 内壳中,可使用以下命令:$ c; z. l* a* H% ~) f& L+ a
; L7 t4 V) _& b' u/ j5 onew intranet apache params \) B4 d7 P* j- Z! j2 p$ w( s
configfile="/etc/apache2/httpd.conf" ip="192.168.1.101"# `* a% v$ F0 O2 }+ S' |: E
COPY
$ b4 O! l# \$ v s, H7 t但是,前一条命令仅会从配置模板创建其配置。它不会将其应用或提交到 CIB。
+ [0 b' q0 T+ M( o- ` E4 f
8 H7 Y' m6 M6 K2 n% Z% x2 M5 H8.1.7 使用阴影配置进行测试 #
( {( l6 O) S0 C7 d. g Y阴影配置可用于测试不同的配置方案。如果创建了多个阴影配置,则可逐一测试这些配置,以查看更改的影响。
, ~6 x1 [ [. o4 i7 | ~$ W# _" [9 U
g/ T4 ]- A* t; J' P& Y一般的流程显示如下:9 e6 X) H& E5 k! \ F# N2 ]1 ]
- E6 J/ T2 E8 e* k
以 root 用户身份登录,然后启动 crm 交互式外壳:
. }2 B" |1 x4 u% a# b
# R7 T$ P. B1 h, ^9 q$ g' M! Ocrm configure- c7 |9 o9 U) j5 q3 D, y6 e
COPY
( p5 n1 H/ s, d: N创建新的阴影配置:
8 {6 c: I8 @' x8 C0 R
" Z% ~$ g# z( ^6 K z) N4 Rcib new myNewConfig
; r/ k. {/ C6 Q# }INFO: myNewConfig shadow CIB created
% G; C) T$ \, W+ |, QCOPY
2 X/ A& n; K, ]- k& c如果省略阴影 CIB 的名称,则会创建临时名称 @tmp@。
" @4 m. ], l2 R
- D/ H' U) O! k7 }/ v5 r/ x要将当前的活动配置复制到阴影配置中,可使用以下命令,否则请跳过此步骤:
- @; }9 u, W. r' q
( d& a9 l# P+ L/ ]- p. g$ Xcrm(myNewConfig)# cib reset myNewConfig
1 ?( T6 l+ \+ r# ]COPY
/ I' n. ~2 z8 I2 c) D! M( `使用上面的命令便于稍后修改现有资源。. W0 O$ P2 D6 W }
4 P' N- q* ]2 B2 m& e f h
照常进行更改。创建阴影配置后,会应用所有更改。要保存所有更改,请使用以下命令:
# M% }; n8 ?+ C4 z7 |
1 F; x, v; x6 J( `, H, ccrm(myNewConfig)# commit
# H8 {2 F) L5 p1 dCOPY. G2 Q4 h' [. \$ w7 S
如果再次需要活动群集配置,可使用以下命令切换回此配置:
* z; z* _: P) u( U: I
9 F8 m2 j1 f9 \. q5 I x7 `crm(myNewConfig)configure# cib use live4 M6 x8 \3 P% [' T% l
COPY$ i% d8 y$ _& T* w9 L
8.1.8 调试配置更改 #
; q: x& z2 y5 g& W将配置更改装载回群集之前,建议使用 ptest 复查更改。使用 ptest 命令可显示提交更改后产生的操作图。您需要 graphviz 包才能显示该图形。以下示例是一个抄本,添加了监视操作:
5 [, r& ]2 h) a7 b( {" t, {9 C! _# U4 r6 U. V9 [& a
crm configure# f" ?& x" ?5 n3 G/ Y) s
show fence-bob 4 T) Z8 e9 P' ^
primitive fence-bob stonith:apcsmart \
& l6 c7 m8 V7 s- L- | params hostlist="bob"
v* |" D; m( Smonitor fence-bob 120m:60s3 t' w/ \7 }) ?/ W+ ~
show changed
9 {( e! X, L8 ~7 S' Jprimitive fence-bob stonith:apcsmart \4 g: W1 L6 {0 D
params hostlist="bob" \
3 x5 n P8 _1 y; ] O op monitor interval="120m" timeout="60s"
5 n/ v* A: J5 y( B8 Sptest& V M8 w! v% @* g" v3 O
commit
% h0 B8 e) c3 E& z! I8 z, W1 pCOPY
& ^* O* o7 p4 |: c/ I8.1.9 群集图表 #
7 c a# |5 {% S8 F& x! ]要输出群集图表,请使用命令 crm configure graph。它会在当前的窗口上显示当前配置,因此需要配备 X11。
' f* F1 }7 ~( _( w$ d* w$ X6 I' F7 f
如果您希望使用可缩放矢量图 (SVG),请使用以下命令:
$ _5 y5 U c0 l8 N. C
8 r. E h G1 I% z4 m& i( Hcrm configure graph dot config.svg svg* o z5 J& u0 G5 b8 Y
COPY2 ~* G/ u0 D+ k5 s
8.2 管理 Corosync 配置 #6 v$ ?/ k0 C E ~5 W3 ^# y
Corosync 是大多数 HA 群集的基础讯息交换层。corosync 子命令提供了用于编辑和管理 Corosync 配置的命令。" M: [9 Q( o, c: R
6 \6 A. i/ r1 e+ R/ q# D; W例如,要列出群集的状态,请使用 status:
u! ~6 D: j6 v7 s8 B% Z: p3 w
7 p: Y6 Q+ D9 xcrm corosync status
5 w& F; j* b' a) x4 V9 ^Printing ring status.
% W7 J7 J+ l; XLocal node ID 175704363
) s6 o# A; s2 E$ M! h/ `4 bRING ID 0. `. { B/ P5 ]! V$ W- ~
id = 10.121.9.43 S/ v n7 J3 X f$ J2 \
status = ring 0 active with no faults/ b U( n8 G# @4 d1 j2 e3 L# X% y: Z
Quorum information9 l b- s' R: l6 F. ~& z3 ]& _4 K
------------------ d! b, e8 `4 Y3 C7 u
Date: Thu May 8 16:41:56 2014
# I3 a1 D& h; ?. L MQuorum provider: corosync_votequorum
& J0 @+ v M& J6 l' i2 }Nodes: 2
3 G; z( s+ E2 n* l, T* BNode ID: 1757043634 f0 f" g! ?: `" a% y+ d
Ring ID: 4032( h/ {' Q6 B5 T) l4 D1 W# y6 e
Quorate: Yes8 p# b" ^! B* B. [8 o
r$ L* }: b- RVotequorum information" ]0 ?5 t2 m: p
----------------------
. T" b" {) ]; fExpected votes: 26 j( a2 M* A2 \8 o% U9 Q( Q; P4 H
Highest expected: 2! X; _8 s8 N' F- F1 t+ b
Total votes: 2% p. K& O- ^6 q! C$ I
Quorum: 2
+ ~2 h: \0 L( ?' T; ?# U UFlags: Quorate 8 L- v) y2 P1 e: Z- H
5 r/ c2 g1 Q( u: p( {5 P
Membership information
; v: l" {/ z H, g$ Z1 g, K1 J----------------------" l; F3 a& C, w' F% N% s
Nodeid Votes Name
& |- [+ r4 f( N3 N1 ^! D 175704363 1 alice.example.com (local)
7 O) V7 x4 F8 T* X3 K3 K, n; j 175704619 1 bob.example.com
$ p) u+ n! `) k5 d0 ~! _( r1 HCOPY9 L" ~& |+ n( W+ u6 }' A: o, p
diff 命令非常有用:它可以比较所有节点上的 Corosync 配置(如果未另行指定)并打印出各自的差异:
9 W8 h: d- m5 S: j2 ^3 L: S: J6 j' O' Q4 s' E9 ?% W6 _
crm corosync diff3 S, n6 v% r/ d! P5 @
--- bob4 Y: W( r, F% i5 H" N1 V3 z
+++ alice
- |: R" S& x/ l$ D! P! ~7 X0 J" x1 @@@ -46,2 +46,2 @@# b7 k( S9 k8 z: J7 r
- expected_votes: 2
4 B- E9 x8 H1 L/ G1 o- two_node: 1
& c' @% {/ y; f' Y+ expected_votes: 1
4 P! p7 v) f5 q, S# y0 f+ two_node: 0$ q! T" x* p0 q+ o
COPY' C7 y. x9 N& V& j N, L; C
有关细节,请参见 http://crmsh.nongnu.org/crm.8.html#cmdhelp_corosync。% x$ x# H) z( E$ O
- f( I, s6 K* C: w5 b1 W7 b8.3 配置群集资源 #) Q" g+ U3 I: w5 ^ Q
作为群集管理员,您需要在群集中为服务器上运行的每个资源或应用程序创建群集资源。群集资源可以包括网站、电子邮件服务器、数据库、文件系统、虚拟机和任何其他基于服务器的应用程序或在任意时间对用户都可用的服务。
1 y0 J) c2 C0 D p+ ^
# F+ U. q0 t' ?! z有关可创建的资源类型的概述,请参见第 6.3.3 节 “资源类型”。( q4 j. x% r9 n. M# s/ p
~; c7 W& N, D, J- e9 q( v+ v
8.3.1 从文件装载群集资源 #. M! `- P% ^! I1 u; I% Q6 F
可从本地文件或网络 URL 装载部分或全部配置。可定义三种不同方法:
0 _& `. z1 g+ O8 m: m; Z, ~# c4 X" M
replace* z: b% }9 j( d: B% g! j5 c
此选项会将当前配置替换为新的源配置。
- p# [9 ]) P9 |5 l9 M- c( b: Q" }# p! U- L! T5 O
update+ w3 g1 b' m, L: n! T6 V" c
此选项会尝试导入源配置。它会向当前配置添加新项目或更新现有项目。# E7 Q/ u: H& i" {. z
! }* |' ^) V& n$ Q o* W1 Upush5 n$ D( `% t. w" U3 ^( R
此选项会将内容从来源导入到当前配置中(与 update 相同)。不过,它会去除在新配置中不可用的对象。6 z7 N4 ]+ L+ w
- w x* j0 J& K/ S7 @
要从文件 mycluster-config.txt 装载新配置,请使用以下语法:# ?; V- g( X6 u' t( X3 j
* J3 D6 u. A# J% \# mcrm configure load push mycluster-config.txt7 W1 b9 @* }$ d: q8 f6 Y
COPY! S; B, O1 f3 y Y
8.3.2 创建群集资源 #6 ]8 V( U5 D- ?; F6 y
有三种 RA(资源代理)类型可用于群集(有关背景信息,请参见第 6.3.2 节 “支持的资源代理类”)。要将新资源添加到群集,请按如下操作:, i/ D* `/ d- S3 X2 _
7 a$ M: E$ _$ m( q2 P% x4 c" Q以 root 用户身份登录,然后启动 crm 工具:
' ?0 X0 b3 y! z9 q5 b* t5 W- i3 O
crm configure R9 h1 c4 E) }5 B0 ~; h! T
COPY* Q$ Z2 ` o! H. k7 }* y
配置原始 IP 地址:2 I5 ^( t+ Y- n% l% Q+ q) N! |
0 D) M$ E( N: n) j$ ]primitive myIP ocf:heartbeat:IPaddr \
& V! L# U- D; @% I params ip=127.0.0.99 op monitor interval=60s
2 @- q0 T5 \' ?0 ]. c: M9 uCOPY
H' [* ^- h0 o' j5 A* H上一命令配置了名称为 myIP 的“原始资源”。需要选择一个类(此处为 ocf)、提供程序 (heartbeat) 和类型 (IPaddr)。此外,此原始资源还需要其他参数,如 IP 地址。根据设置更改地址。
6 T6 Y A4 t5 o6 J, Z9 R: n: ]0 H; T& m
显示您所做的更改并进行复查: S5 d( j# {- \, q7 O
( d3 s: x' j- C+ k8 R( v! |
show& |4 V% X1 b. _! u# l
COPY
* x0 C$ c9 a6 |2 p) x+ g: ~2 H提交更改使其生效:1 j) A1 U. F7 }# E! }" ]
' ] x! J h2 J5 `commit
5 z; h0 v; D+ k2 |' ^: s, _COPY9 ]" V; H; Z' k$ @
8.3.3 创建资源模板 #+ b0 u: R( ~( `
如果希望使用类似的配置创建多个资源,则资源模板可以简化此项任务。有关一些基本背景信息,另请参见第 6.5.3 节 “资源模板和约束”。不要将它们与第 8.1.6 节 “使用配置模板”中的“常规”模板相混淆。使用 rsc_template 命令可以熟悉其语法:
0 B( A( j' [+ J; K1 h; p
( t# O8 o% v; |1 b- ^crm configure rsc_template
( f6 ~9 x5 a, I3 v2 C) f. L/ Susage: rsc_template <name> [<class>:[<provider>:]]<type>
& [8 z6 L3 Z" J" k9 x6 c [params <param>=<value> [<param>=<value>...]]+ |/ o* y4 p7 w: R; @8 s9 E# y: G
[meta <attribute>=<value> [<attribute>=<value>...]]
0 Z7 G8 {6 n4 f" w! W [utilization <attribute>=<value> [<attribute>=<value>...]]
" L& d/ U1 _. E' H/ \ V, l [operations id_spec
3 l L( m: y6 ^1 y7 b [op op_type [<attribute>=<value>...] ...]]
' t7 U' P! J. WCOPY
* F1 f4 a' b1 Z& G9 E例如,以下命令将会根据 ocf:heartbeat:Xen 资源和一些默认值及操作新建一个名称为 BigVM 的资源模板:
) p7 d. z6 x% o7 s9 F5 D; z" C0 u
rsc_template BigVM ocf:heartbeat:Xen \' F, r' K3 v+ F ^! C' e- m, \. J
params allow_mem_management="true" \
) u1 s% F) J0 k9 `# F E$ a op monitor timeout=60s interval=15s \- p# s% ~' M7 q4 R$ a) [% [: i
op stop timeout=10m \
. X: }& m" J9 k+ M4 H% U p op start timeout=10m
0 K; Q$ ?* Q9 ]$ pCOPY
3 M1 t. h9 `& f2 q: \6 m; ^# K$ M定义了新的资源模板后,可以将其用作原始资源或在顺序、共置或 rsc_ticket 约束中引用。要引用资源模板,请使用 @ 符号:( _8 Y! q% Q0 p# _- K0 |
4 N( @$ b0 l3 T, `2 Nprimitive MyVM1 @BigVM \: `- \5 t" d1 }, X' d2 }$ ~
params xmfile="/etc/xen/shared-vm/MyVM1" name="MyVM1": h4 {( w: L/ A$ b
COPY( P- V4 g3 K2 h& T7 y4 _
新的原始资源 MyVM1 将继承 BigVM 资源模板中的所有配置。例如,上述两者的等效配置有:$ B0 J I+ I# _
2 T" q2 t8 r2 b1 O' _/ Oprimitive MyVM1 ocf:heartbeat:Xen \9 c% o/ l% v, M- P
params xmfile="/etc/xen/shared-vm/MyVM1" name="MyVM1" \
4 }. k& Z! W" r1 | params allow_mem_management="true" \
6 S% {+ `) k9 m op monitor timeout=60s interval=15s \- O6 K* ~/ m3 ~
op stop timeout=10m \, Y; [8 w# f2 G3 F; S V" G
op start timeout=10m
- E5 V& V. v4 i/ }1 I- a4 ?8 L7 eCOPY
, L H: \' g0 P. T; J) V" V9 u如果希望重写一些选项或操作,只需将它们添加到您的(原始)定义中。例如,下面这个新的原始资源 MyVM2 会让监视操作的超时增加一倍,而其他值保持不变:
! q3 S/ J; G5 |; O3 r _, Q) X& ~6 X# I& s+ c6 _9 F% V
primitive MyVM2 @BigVM \$ t( n# k0 g* I6 W8 {
params xmfile="/etc/xen/shared-vm/MyVM2" name="MyVM2" \
( g, [% ]7 `# }' V7 {! s5 O# Q op monitor timeout=120s interval=30s2 A/ ]5 c- |; H. E
COPY
u8 M7 L' a6 U( g. U7 N资源模板可以在约束中引用,以表示所有原始资源都派生自该模板。这有助于生成更加清晰明了的群集配置。除了位置约束外,允许在所有约束中进行资源模板引用。共置约束不能包含多次模板引用。
& }( \) F9 e" O" i0 i6 j
. B1 f1 ?- G, f/ A' m7 a" ]3 W9 A F8.3.4 创建 STONITH 资源 #
, l2 a1 I6 I G' [2 a7 Z就 crm 而言,STONITH 设备只是另一种资源。要创建 STONITH 资源,请执行以下操作:
0 Z. \2 S# x" H. M" C' ]( u
0 N# h; n: a; \# R! q0 C" ~* i& u以 root 用户身份登录,然后启动 crm 交互式外壳:
7 ]0 F f. a2 C5 t& I+ F) i& Q' w8 a* ]8 U) A3 \9 l/ E
crm configure/ _9 k! ]6 p' \/ s7 l- d
COPY
/ z# C. P T. h, y使用以下命令获取所有 STONITH 类型的列表:
j0 u% A6 x& p$ ^* v. t
& b" M) I8 G6 X! e& l* s$ H. `ra list stonith' k, a1 F4 k6 a/ i# G
apcmaster apcmastersnmp apcsmart; I" M# R; N. L' |3 l- G9 e4 {
baytech bladehpi cyclades
5 E% u) m! w J, p7 ^drac3 external/drac5 external/dracmc-telnet
' C2 T( Z% ~& C7 Iexternal/hetzner external/hmchttp external/ibmrsa
& x, m4 @. \4 Q, Nexternal/ibmrsa-telnet external/ipmi external/ippower9258
* n, n1 ]1 [% Z1 @' U7 |' \external/kdumpcheck external/libvirt external/nut0 J/ \: t# S! p+ e( _+ M, a
external/rackpdu external/riloe external/sbd" x% N7 f! j; R9 m/ ~( M0 _2 K3 T
external/vcenter external/vmware external/xen0
0 g/ ?. p0 O- }8 d0 Xexternal/xen0-ha fence_legacy ibmhmc' k. K* H; w- w1 {4 Y* L/ P2 t' ^
ipmilan meatware nw_rpc100s Z+ S1 ^9 p$ ~& y( G7 g4 T6 G9 ]7 }( [
rcd_serial rps10 suicide3 g1 g3 T9 A+ }7 \2 Y
wti_mpc wti_nps3 Q8 U& Q/ l4 m4 G: d
COPY
2 Q' {& U! l5 t从以上列表中选择 STONITH 类型并查看可用的选项列表。使用以下命令:) ?/ y# J+ |: L0 F" v3 j
8 h1 R/ n7 K1 R6 pra info stonith:external/ipmi
' [: C8 ? E( g: ~0 b IIPMI STONITH external device (stonith:external/ipmi)+ H' H, A. y% O! x. |
4 w, p1 B$ N ^! b1 ?" ]9 w2 aipmitool based power management. Apparently, the power off
) A' i9 C7 s) B/ ~. c8 Rmethod of ipmitool is intercepted by ACPI which then makes3 c6 u4 G j5 M/ k9 r, h4 z
a regular shutdown. If case of a split brain on a two-node9 b" c0 k7 l5 W8 B( B
it may happen that no node survives. For two-node clusters- l* X# D7 T- ], ]2 X7 k8 M
use only the reset method." P+ a& N. _7 S( s8 S
& O" B) J' g6 T: O- }# E A; \Parameters (* denotes required, [] the default):8 U5 N0 X% P' c1 O
, p# q z H6 R% t" {: x5 x
hostname (string): Hostname
! `. v7 W) Z/ { The name of the host to be managed by this STONITH device.) A N" \) V5 a7 m; g5 x
...
* R* D4 O& x* _6 F9 K6 dCOPY' [- o! N V1 t# T& P: r2 x- b
使用 stonith 类(您在步骤 3 中选择的类型)和相应的参数(如果需要)创建 STONITH 资源,例如:" v' s1 q5 I- r) K* V1 M% K
# L" ~2 Q5 t1 ?( G2 bconfigure; g b& s5 I1 x
primitive my-stonith stonith:external/ipmi \6 h, n& K% q( p% Z& T L) V0 i
params hostname="alice" \1 X0 h8 Q9 p+ f3 e+ h' H1 j: x
ipaddr="192.168.1.221" \) S5 w V8 m8 c* K
userid="admin" passwd="secret" \4 e5 J& m- M+ h7 M+ B, t
op monitor interval=60m timeout=120s8 ]! h2 m0 C, D; X/ L
COPY
8 u- W( Z* M, Y' N2 I0 j( @5 O% c8.3.5 配置资源约束 #
* k- }# b: Q; z$ ]# Q# i0 ~8 ?. P配置所有资源只是任务的一部分。即使群集了解所有需要的资源,它仍然不能正确处理它们。例如,尽量不要在 DRBD 的从属节点上装入文件系统(事实上,这将导致 DRBD 出现故障)。定义约束以使这些信息可用于群集。; l) g2 b. ?9 ~
* c" @: M' L- X# v- M# P
有关约束的更多信息,请参见第 6.5 节 “资源约束”。! M3 D. `! i4 \! w; l
/ \8 r2 {( w1 k8.3.5.1 位置约束 #
$ w3 G: T6 b3 b- x6 ^- A% flocation 命令定义资源可以、不可以或首选在哪些节点上运行。
4 }/ o/ k, C, P. G( r. o% A1 y) H$ n) e; H; ]0 o
每个资源可多次添加此类约束。对于给定资源,将评估所有 location 约束。下面是个简单的示例,它将首选在名为 alice 的节点上运行资源 fs1 的值设置为 100:
) j: k6 `5 w; y
' M" S! }6 V. u& elocation loc-fs1 fs1 100: alice6 H* w" j( o( D) f' [& J
COPY0 i6 L8 a- v: S L' y( u- w, j
另一个示例是使用 pingd 的位置:( v$ |. g8 p2 j
! s* A1 R$ s3 ]0 y9 H$ Q
primitive pingd pingd \3 N B, |) `2 M) t8 ~7 \
params name=pingd dampen=5s multiplier=100 host_list="r1 r2"3 s3 M$ i+ z0 }, I) r2 j
location loc-node_pref internal_www \$ j% D8 h, g) J: x$ R7 H
rule 50: #uname eq alice \
: ~: H6 C! Y* R. T) T2 l* ?. o. T+ D rule pingd: defined pingd4 W+ i4 Q' _# P& }5 \# \
COPY
& ]3 ]9 y5 @, j5 c位置约束的另一个用例是将基元资源分组为资源集。例如,如果多个资源依赖于 ping 属性来进行网络连接,则此功能会十分有用。以前,需要在配置中复制 -inf/ping 规则数次,因此不必要地增加了复杂性。4 p+ S" ?9 K2 Z9 b; X( I+ H
- J7 l+ u' k; _
以下示例将创建资源集 loc-alice,该资源集引用虚拟 IP 地址 vip1 和 vip2:
' r/ u. S1 C4 E/ k7 D6 h
( ?: N$ C, |2 n* Wprimitive vip1 ocf:heartbeat:IPaddr2 params ip=192.168.1.59 T: n9 v* Y( }0 a
primitive vip2 ocf:heartbeat:IPaddr2 params ip=192.168.1.6/ J" I9 h( W- B4 z1 N
location loc-alice { vip1 vip2 } inf: alice. {2 Y+ k; F, o9 a b/ L
COPY* `& b4 Q9 T! A
在某些情况下,为 location 命令使用资源模式会有效且方便得多。资源模式是用两个斜杠括起的正则表达式。例如,可以使用以下命令全部匹配上述虚拟 IP 地址:
8 t* \* K) b# o) G9 s# C; a9 m- D' z- V4 H% C& H
location loc-alice /vip.*/ inf: alice3 k& B) A1 z6 ^: w" u( w$ C
COPY3 w" }% v D- v% ]- J: F2 Z
8.3.5.2 共置约束 #
, ^$ l/ ^$ K- L# q c$ Y, H1 ncolocation 命令用于定义哪些资源应在相同主机上运行,哪些资源应在不同主机上运行。7 w0 d: D) N$ _& Y1 X
8 P- l( ]2 @& q6 r7 J只能设置 +inf 或 -inf 的分数,定义必须始终或不得在相同节点上运行的资源。还可以使用有限分数。在这种情况下,共置将称为建议,群集可决定不遵循它们,从而在出现冲突时不停止其他资源。) Q+ R( U5 z6 L B9 b7 S/ \
$ y3 P7 ^, ~. n7 y6 r$ l5 f, N
例如,要始终在同一个主机上运行 ID 为 filesystem_resource 和 nfs_group 的两个资源,可使用以下约束:8 F, v; y8 D5 n" x1 Y8 @ C3 l
! d+ l& b! p) U4 k E- ~
colocation nfs_on_filesystem inf: nfs_group filesystem_resource; d; _# `4 w9 M$ c& U
COPY+ M3 Z# f- x: m
对于主从属配置,除在本地运行资源以外,还有必要了解当前节点是否为主节点。) q5 i9 Z: C8 t& @1 E
; C$ [. X C1 k* D& t: o8.3.5.3 共置没有依赖性的资源集 #
& Z* J% W( d; ^' J* F9 R: ~0 U有时,将一组资源放置在同一个节点上(定义共置约束)会很有用,但前提是这些资源之间不存在硬依赖性。
7 y' n- F" Z1 C3 Q# G
' M! t) L4 Y7 B2 L如果您想要将多个资源放置在同一个节点上,但不想疲于应对每一个资源的故障,那么,您可以使用命令 weak-bond。
% s3 R5 ]& r6 M$ d$ C$ H2 S$ ~1 q2 I& X" d
crm configure assist weak-bond RES1 RES2
8 {' z6 D T# _COPY
( J4 Z6 h. ]2 z# bweak-bond 的实施将使用给定的资源自动创建虚设资源和共置约束。
% ` j8 s3 K$ {8 H+ g" _9 ?( }0 N Z4 Y& h
8.3.5.4 顺序约束 #
1 d d: g) g% T( O1 I6 Z) ^4 }order 命令定义操作顺序。$ V( f1 o; b C. V6 v; O
4 N J1 I0 \% V( x( P; }有时必需提供资源操作顺序。例如,在设备可用于系统之前,您不能装入文件系统。使用顺序约束可在另一个资源满足某个特殊条件之前或之后启动或停止某项服务,如已启动、已停止或已升级到主资源。
0 K2 U/ C% Y/ E) J& n7 [
/ s+ H3 M9 X: h; D y+ u9 B在 crm 外壳中使用以下命令配置顺序约束:0 }4 J- m# |% M
! \3 R6 q0 ^5 Z
order nfs_after_filesystem mandatory: filesystem_resource nfs_group
! @1 I5 }7 a; @% H$ D6 yCOPY
: }# e* P) R& u" k! T8.3.5.5 示例配置约束 #
# a% p* {& g3 @' W. z% O本节中使用的示例必须与其他约束结合使用。其中最基本的就是让所有资源与 DRBD 资源的主资源在同一台计算机上运行。在启动其他资源前,DRBD 资源必须是主资源。在 DRBD 设备不是主资源时尝试装入 DRBD 只会失败。必须实现以下约束:: z) [8 p& t0 x( W- z; r* ]
- H0 Q1 T" f) d0 u6 e文件系统必须始终与 DRBD 资源的主资源位于同一节点上。
* n5 g0 P. q4 X( h& r4 F& S$ C
1 z" @6 N! n7 _1 B9 R+ ccolocation filesystem_on_master inf: \
+ z5 E/ @6 \5 }. G( |$ N# [ filesystem_resource drbd_resource:Master
- C# @2 G& `5 ZCOPY
# k- F! a- f. o' N- z, [5 ONFS 服务器及 IP 地址必须与文件系统位于相同的节点上。( x' f) P8 @. S
4 |; G7 ~; q: W0 Y; W) W# Ecolocation nfs_with_fs inf: \( t# t5 `& d8 k
nfs_group filesystem_resource
3 F4 a M& `8 J2 _COPY1 \1 A/ O8 v4 u1 H+ H
NFS 服务器及 IP 地址在装入文件系统后启动:& [ w( R) @9 f( M6 H8 q( F
! W- G. |5 \( m( {order nfs_second mandatory: \9 y8 v% L. X/ o1 l2 N9 M h9 [) C6 _
filesystem_resource:start nfs_group
F+ @5 o2 W [( v$ FCOPY
% o3 B" z, } x! _& q- J" z必须在 DRBD 资源提升为节点上的主资源后才能在此节点上装入文件系统。
/ s" k8 [ y4 `3 G' h
$ s' ]8 j6 I7 d# `0 Torder drbd_first inf: \% u, c; J5 q. y
drbd_resource:promote filesystem_resource:start+ I& r2 z; o9 f: F/ `# V& G4 o
COPY) {6 C7 ^. v7 z% `" H1 D4 y
8.3.6 指定资源故障转移节点 #8 K" q: | T9 U. P" Y
要确定资源故障转移,可使用元属性 migration-threshold。如果所有节点上的故障计数超过 migration-threshold,资源将处于停止状态。例如:- J5 J" c( p) f2 G- p" d. U- J! H
/ H& a$ @0 S( r5 V
location rsc1-alice rsc1 100: alice7 \+ p2 V1 J1 I4 J
COPY
! _4 T J5 x4 m% @" \8 _" ]* g通常,rsc1 首选在 alice 上运行。如果失败,将检查 migration-threshold 并与将它与故障计数进行比较。如果故障计数 >= migration-threshold,则会将该资源迁移到具有下一个最佳自选设置的节点。
+ c/ F* h7 x! b+ j* `3 j5 z, r+ V( w! n- C% |
根据 start-failure-is-fatal 选项,启动失败会将失败计数设置为 inf。停止故障可导致屏蔽。如果未定义 STONITH,将不会迁移资源。
. y- q% m1 n) Y9 O( R- ~& ^
$ m6 @; o0 _& w9 G. `有关概述,请参见第 6.5.4 节 “故障转移节点”。
, ~6 T0 ~+ B% x1 |$ V4 S3 O- f4 c. c, C
% S3 M" _3 h$ [' ~9 e$ q: o8.3.7 指定资源故障回复节点(资源粘性) #
* Z! |. N1 k5 c- ]7 s当原始节点恢复联机并位于群集中时,资源可能会故障回复到该节点。为防止资源故障回复到之前运行它的节点,或者要指定让该资源故障回复到其他节点,请更改其资源粘性值。可以在创建资源时或之后指定资源粘性。
+ m6 F4 {& V+ s+ T) w8 c
, `4 w1 z8 q3 a9 d, s有关概述,请参见第 6.5.5 节 “故障回复节点”。
4 R2 A) P4 ~6 T; X- d5 U/ u# v9 D6 ~; |: `3 b' \( d p( D
8.3.8 根据负载影响配置资源放置 ## z4 y: p: M) r3 v& n o+ Y4 M7 i* v
某些资源可能具有特定的容量要求,如最低内存量。如果无法满足要求,资源可能无法完全启动或运行时性能下降。% Y7 J% k. E- K6 I1 ]# W
, F9 E$ f1 L" T- A
要考虑此情况,可使用 High Availability Extension 指定以下参数:: E$ Q' _0 p1 P6 [9 g7 H8 X
3 s0 L+ b; |6 {* t* D. l0 X7 u: G
特定节点提供的容量。6 T6 t1 o- ]0 J! c/ l
% q* ]; R* Q9 |* \- W6 g& m' Q: Y1 k
特定资源需要的容量。' s" @3 c$ L4 E
. ]2 r0 v$ x J6 u4 ?资源放置整体策略。
3 ~+ f" Q9 a! ]8 I: E. P! f4 D
" } E7 C' h$ B& U# v7 l有关参数的详细背景信息和配置示例,请参见第 6.5.6 节 “根据资源负载影响放置资源”。
9 Z) ]' \' M) {( U+ i
4 N6 F- ] E& p/ E2 |# Y要配置资源要求和节点提供的容量,请使用利用率属性。可根据个人喜好命名利用率属性,并根据配置需要定义多个名称/值对。在某些情况下,某些代理(例如 VirtualDomain)将自行更新利用率。
" P* A x3 z9 o$ F! x+ E5 i/ h0 C
在下例中,我们假定您已有群集节点和资源的基本配置,现在想要配置特定节点提供的容量以及特定资源需要的容量。
* q* r* H9 G0 {+ W" j u
# ?* p' G2 H' P, k: x1 |- u% Y4 `0 a0 f过程 8.1︰ 使用 crm 添加或修改利用率属性 #
/ T+ {/ g. x/ r9 w8 I U U" ^' `) B, L以 root 用户身份登录,然后启动 crm 交互式外壳:% t6 r) C6 M3 k% L y: a
2 b. [3 \0 ~; _crm configure2 n! ^0 K, B2 I! I
COPY
" x' v$ [; H) l9 {" F5 r要指定节点提供的容量,请使用以下命令并将占位符 NODE_1 替换为节点名称:
9 i# U4 n# l) ~3 _$ u/ Z* E) b3 d; |8 M5 m! l9 D; O
node NODE_1 utilization memory=16384 cpu=8$ X, B/ V( E, Z+ v
COPY3 G6 _1 p' c/ J* g
上例中的这些值将假定 NODE_1 向资源提供 16 GB 内存和 8 个 CPU 核心。 U* C1 n6 G2 O. h( f F L
) `8 P. L" z! M6 A
要指定资源需要的容量,请使用:
% A$ d$ y& ]4 g. R* c
" b1 b" S+ r: vprimitive xen1 ocf:heartbeat:Xen ... \
# T S' j4 N5 K/ L8 U utilization memory=4096 cpu=46 z$ B' g0 V6 r/ |! n0 p0 W; b
COPY- f+ ~+ S; X2 @# Y# q; a+ S4 @
这会使资源消耗 NODE_1 的 4096 个内存单元以及 4 个 CPU 单元。
; V; u) i2 W6 t. R8 m
; t6 ~ {' Q& J# B+ d* i使用 property 命令配置放置策略:! o1 @9 O1 G0 ?& }- O( i
7 n d6 C3 j/ a& q' F9 k6 k0 C8 h
property ...
$ h% c1 k4 h& r' ECOPY
0 X5 `& g# h% a2 o1 N可用值如下:* V# q4 Y& o; h1 X+ T- F% p8 u
5 u9 F H2 V: ^ e4 `0 D: rdefault(默认值)
$ S7 N& i7 \9 c. N2 w. \1 X+ c Q不考虑利用率值。根据位置得分分配资源。如果分数相等,资源将均匀分布在节点中。$ l# x3 ?4 j" v( i8 L0 [
7 k# h4 F- {* Q" t& Autilization
2 F' C" O0 V: m E: U6 e在确定节点是否有足够的可用容量来满足资源要求时考虑利用率值。但仍会根据分配给节点的资源数执行负载平衡。% ~' C/ m( G+ g
! @5 q( M/ y2 W8 E! i
minimal* }3 K! c) K' C* O, c) J
在确定节点是否有足够的可用容量来满足资源要求时考虑利用率值。尝试将资源集中到尽可能少的节点上(以节省其余节点上的能耗)。
; B2 b+ r8 ?* P
. K0 {- `9 A2 Y) }balanced. A s3 U) U7 D1 D
在确定节点是否有足够的可用容量来满足资源要求时考虑利用率值。尝试均匀分布资源,从而优化资源性能。! ]9 R- I. Y3 c6 V. s3 q" L
! U$ i6 w: K }, c5 z7 q注意注意:配置资源优先级
& A: g7 ]7 `% ?9 ~" M B7 s可用的放置策略是最佳方法 - 它们不使用复杂的启发式解析程序即可始终实现最佳分配结果。确保正确设置资源优先级,以便首选调度最重要的资源。
( {/ w6 I/ a2 j* S+ \
1 w1 g* W4 N! ^ g! j+ w: o; b- c退出 crmsh 之前提交更改:
5 N0 k! T2 \9 f. Z* a& s4 x6 l$ h8 T. Y* x& x* m
commit! O( Z9 R* z+ z( _
COPY+ H. E I% z; \4 i7 K* ]
以下示例演示了配有四台虚拟机、节点数相等的三节点群集:" u. ?, x ~ B1 P2 w# Q
4 V7 B! b5 C& j, @# d4 L
node alice utilization memory="4000"
& F8 y8 ?: t: d& X( t: ?- wnode bob utilization memory="4000"
; M* M) a" Z R3 j. `6 |. i3 ]node charlie utilization memory="4000"
$ x& |, B' V* I0 F; ?primitive xenA ocf:heartbeat:Xen \
( E8 j1 c6 ]' B utilization hv_memory="3500" meta priority="10" \" `: P4 v: d- W* P# z
params xmfile="/etc/xen/shared-vm/vm1"& C z( o3 H- ?4 u4 h* o- T
primitive xenB ocf:heartbeat:Xen \
; i: }" ?& e; G/ u utilization hv_memory="2000" meta priority="1" \- t% ~$ P, [: x
params xmfile="/etc/xen/shared-vm/vm2"- _" K% H+ T# f: j6 v
primitive xenC ocf:heartbeat:Xen \
$ ?% W, t: Q) H6 s7 ] g3 j4 P, _ utilization hv_memory="2000" meta priority="1" \
$ l& Q% r9 i" N params xmfile="/etc/xen/shared-vm/vm3" I4 R0 e) o) d# y! d. n' x% v
primitive xenD ocf:heartbeat:Xen \' o" w6 K D- [2 U; t' n- E# B! }( s7 L
utilization hv_memory="1000" meta priority="5" \
& b, i( M* Y/ X2 w* j. M params xmfile="/etc/xen/shared-vm/vm4"; ^" @4 C5 n" D g W
property placement-strategy="minimal" C. x4 [ x7 j) F* O; _2 ~
COPY2 ]( V# y0 P; }4 Z# d7 D
如果三个节点都处于正常状态,那么 xenA 将首先放置到一个节点上,然后是 xenD。xenB 和 xenC 将分配在一起或者其中一个与 xenD 分配在一起。
& }% m! I7 Z; D
, X# R7 H+ X) m* Z如果一个节点出现故障,可用的总内存将不足以托管所有资源。将确保分配 xenA,xenD 也同样如此。但是,只能再分配 xenB 和 xenC 中的一个,由于它们的优先级相同,结果不确定。要解决这种不确定性,需要为其中一个资源设置更高的优先级。, z4 d, v! ^5 ~0 D6 q
* V2 z0 ]! j6 G3 _5 j& }5 u: Q2 R7 D$ z8.3.9 配置资源监视 #$ E4 n0 K. K' O. d7 R
要监视资源,有两种可能性:使用 op 关键字或 monitor 命令定义监视操作。以下示例使用 op 关键字配置 Apache 资源并且每 60 分钟监视一次:
! S% W, j7 n2 l, Z+ B% x4 m/ M% N0 g: c4 }& u7 N+ F
primitive apache apache \
4 u4 t$ s, h3 e* Y- ]/ v1 n params ... \
" `) j3 q! `5 s: s; m op monitor interval=60s timeout=30s2 G7 r! K! a5 }" |/ t$ W; C) w
COPY
5 Z1 q7 u1 a* b `同样也可以使用以下方式来实现:
# [+ n. @. k% r& I0 y7 L* m. i* n/ ]+ |; h! M# \ u! m
primitive apache apache \
8 Z: m X: I) c- N4 L params ...3 O& b% h6 y! @. d6 N' r9 H3 Q9 ]0 m
monitor apache 60s:30s
$ @# H/ u r- v/ ?2 N5 b. z9 MCOPY! o; q1 w/ s: p7 Z
有关概述,请参见第 6.4 节 “资源监视”。
/ ?. i0 r, j( V2 A7 C8 t% J! Y) \# h' W3 ^: b* v. _$ X
8.3.10 配置群集资源组 #0 S) e$ P8 l5 E
群集的一个最常见元素是需要放置在一起的一组资源。按顺序启动,并按相反顺序停止。为了简化此配置,我们支持组的概念。以下示例创建了两个原始资源(一个 IP 地址和一个电子邮件资源):
2 i' `& _4 x0 ^* e0 e0 l4 D9 {, v# R- `+ N( a) v9 r
以系统管理员的身份运行 crm 命令。提示符更改为 crm(live)。( N4 V y7 [2 L V# A: x- y
; {: V0 q9 ^' v9 c: ?2 \) g7 A9 x配置这两个原始资源:5 v0 v. i" g$ ]# O! @9 Z$ }. s
+ r8 R$ y) G, E% Z6 M% i# n
configure
% }7 i X$ N9 n* M, N; R" tprimitive Public-IP ocf:heartbeat:IPaddr \+ R% q+ Y' b8 N
params ip=1.2.3.4 id= Public-IP( r: E- c3 M9 @5 T' a2 z1 m4 ?( a5 a
primitive Email systemd:postfix \
) M' {" [1 O) q( p5 [ params id=Email; w: q4 O A+ u2 ~
COPY
" _1 c% F& ]1 U/ @- ~- u以正确顺序按其相关标识符对原始资源进行分组:
. j" Q; y# w' m8 i/ G* v \
4 w% G& \: ~1 H3 u) i1 w' t. N" Rgroup g-mailsvc Public-IP Email
, z4 w) p0 e) D5 j" W- W9 GCOPY
* S3 W% C# F, r: j/ X* N5 U) |要更改组成员的顺序,请使用 configure 子命令中的 modgroup 命令。使用以下命令可将原来的 Email 移到 Public-IP 前面。(只供展示功能之用):' y3 S6 e( N7 W& H! B( g9 n
. N, l4 a& k1 z' o4 Gmodgroup g-mailsvc add Email before Public-IP
% ^4 T2 G' F9 b+ i7 g' XCOPY
8 ^9 I9 U5 |* U如果您要从某个组去除资源(例如 Email),则使用以下命令:4 S. I' B0 V5 \2 F4 s( ]" l! p
7 w5 P( y. D2 B6 S- ]
modgroup g-mailsvc remove Email6 S- s, J$ f. L* y% @7 N
COPY
6 u3 ^- }6 `; O( p) R/ Z有关概述,请参见第 6.3.5.1 节 “组”。
9 U/ o7 d3 Q( i
5 |% l$ q) A9 b) U) V- k3 M4 z* w& C5 ]8.3.11 配置克隆资源 #% t! Q$ Q6 I& b4 r
最初将克隆构想成便于启动一个 IP 地址的 N 个实例并使它们分布在群集各处以保持负载平衡的一种方法。事实证明,它们可用于多种用途,包括与 DLM 集成、屏蔽子系统和 OCFS2。您可以克隆资源代理支持的任何资源。9 d8 Q. n% o5 R& Y1 o8 B
7 T4 j+ f4 y% `/ T要了解有关克隆资源的更多信息,请参见第 6.3.5.2 节 “克隆资源”。
5 ]8 v& ^8 ~. t- s, l/ e* Q4 }0 R" F- z. r2 H3 y/ R5 M
8.3.11.1 创建匿名克隆资源 #
2 x' r# h) I4 Y( H要创建匿名克隆资源,首先要创建一个原始资源,然后使用 clone 命令来引用它。执行下列操作:" A; e5 N- n5 h/ l" R
" l; A) k+ T8 s" m7 _( P9 G
以 root 用户身份登录,然后启动 crm 交互式外壳:9 t# Z! t" q9 m* A7 g
m* q( m- k0 ^
crm configure- \5 D1 l3 W7 _; u7 {/ [9 d. [: X
COPY
! ^3 v1 Z! ~% _. w+ k! N! V9 L配置原始资源,例如:
! y. z( v; W+ _4 o: |+ u4 B7 |! m! ]" X8 f6 F8 F. z' z' o9 m+ [, H
primitive Apache ocf:heartbeat:apache
6 [8 a8 d1 A* k4 d$ lCOPY
; H) b& ^4 o% L3 U9 K! r" s克隆原始资源:$ k g( G$ |! S d- C% Z/ d. s
9 \$ U( X+ v; v2 M! r
clone cl-apache Apache/ f* f" F0 h/ E
COPY
" ^/ {1 s3 ?* M: T8.3.11.2 创建可升级克隆资源 #
0 A! E/ k$ P3 J* n: [8 j可升级克隆资源(以前称为多状态资源)是一种特殊的克隆。此类型允许实例处于两种运行模式中的其中一种,可以是主动/被动、主要/次要或主/从模式。
' x; H0 k9 J1 l( p5 I% R3 `4 B" t
要创建可升级克隆资源,首先要创建一个原始资源,然后再创建可升级克隆资源。可升级克隆资源必须至少支持升级和降级操作。
2 L. V1 x& t$ ?7 y8 C/ G
5 D( K) I( P2 a以 root 用户身份登录,然后启动 crm 交互式外壳:
4 K! }: G! m6 z! L( D% Q: i$ i$ i1 q7 f9 o7 E( k# I
crm configure
. B* g- r4 L( nCOPY4 _; C2 [4 I. l! w% Y _ x( O
配置原始资源。必要时更改时间间隔:7 p5 a4 U$ o1 `) C9 k# J
3 o& ]2 e: V: A/ F5 G8 @# Q9 L
primitive my-rsc ocf:myCorp:myAppl \
# B+ l9 u8 k: u+ d3 d) A$ q) C$ o op monitor interval=60 \
0 b# c/ V" x2 ~1 x op monitor interval=61 role=Master
5 z) L) Z' l7 {* T7 {! m wCOPY
% D: Y; p2 S0 F! y+ D3 O2 o创建可升级克隆资源:; {4 d0 l: @ j
* w7 g5 f; _7 Tms ms-rsc my-rsc1 {. {1 j5 n( \( a0 j' y
COPY
4 f% R$ K6 Y1 N2 z- a, p8.4 管理群集资源 #; S9 z: L3 r; I1 ?; C7 w/ u
除可用于配置群集资源外,crm 工具还可用于管理现有资源。以下小节进行了概述。3 X: O1 G/ A( ]' |
0 h: l4 D9 J) k1 t* V! S ^* i- _3 }
8.4.1 显示群集资源 #
3 @" s. S* t# R' n3 B& W+ y当管理群集时,crm configure show 命令会列出诸如群集配置、全局选项、原始资源及其他的当前 CIB 对象:
7 D: A0 [' x, K
7 g- b. ^* H9 v" K! wcrm configure show) B2 O: O8 |' x7 ^6 ^0 T) o
node 178326192: alice
1 V/ |+ ~; ~* B( Y& M/ B nnode 178326448: bob. K1 ^" T1 r' T( A5 B: _9 O
primitive admin_addr IPaddr2 \0 `' F* D5 C; X# J, p' \. M: z9 m
params ip=192.168.2.1 \
% |/ }0 @0 X% ]7 o, o op monitor interval=10 timeout=20' K2 W4 g% V) d, w2 k% O I3 S
primitive stonith-sbd stonith:external/sbd \
/ V* V/ K5 F& K3 M0 _) p/ C2 q7 E params pcmk_delay_max=30
, i9 F. U- b) \5 Y" x2 x/ }! t& b+ K. Hproperty cib-bootstrap-options: \
# Z3 v8 V6 Z' F. O9 d4 s have-watchdog=true \
/ Q7 m( m4 c; p2 U' l% H% V' x dc-version=1.1.15-17.1-e174ec8 \, n; K k q- N A
cluster-infrastructure=corosync \! P: `- y7 l9 v, {6 a; [7 z
cluster-name=hacluster \
5 P3 z6 g- Z% R& p stonith-enabled=true \0 Y/ @4 k2 d9 A- l% R
placement-strategy=balanced \
7 m# |4 i+ @; V, R/ _ standby-mode=true
+ _0 Q6 U+ k- ~" E; arsc_defaults rsc-options: \
; ^* p, l# z# ~/ W, D1 ~ resource-stickiness=1 \& R( O- B Z: O! w, b( D
migration-threshold=3: c( Z9 F K) N# `3 r; u
op_defaults op-options: \! ?) x$ k* @7 ?6 i0 f
timeout=600 \# m5 v% h9 [. B- D( w' @+ a- \
record-pending=true
7 D- O: O u4 s' t8 CCOPY
+ k+ c- C9 s/ q如果您有许多资源,show 的输出会十分冗长。为限制输出,请使用资源名称。例如,如果只想列出原始资源 admin_addr 的属性,请将资源名称追加到 show 后:
9 {$ x" ~% R- j1 M$ O6 t$ S5 P5 Q3 }9 U' E9 `- d0 j& Q( l4 \' S
crm configure show admin_addr3 _- j- }+ N* [
primitive admin_addr IPaddr2 \) J8 y2 Q3 }4 x2 D1 C
params ip=192.168.2.1 \
, C# n. b, {, p6 J op monitor interval=10 timeout=20: }- Q) \" _; q: c" l7 F6 z
COPY
6 N8 S& P+ k) U$ T. w3 L但在某些情况下,您可能希望更精确地限制特定资源的输出。那么,您可以使用过滤器。过滤器可将输出限定到特定组件。例如,要想仅列出节点,可使用 type:node:+ b. I+ N [% g6 N
: D( O7 S1 |+ a1 K& D" A- vcrm configure show type:node
8 o3 X" c; [. Knode 178326192: alice1 H' n" ~, f( c% K) @- \2 N9 i! y4 t
node 178326448: bob* `3 W2 l9 t* y+ P1 ?
COPY
3 V& R; y7 h6 Y如果您还对原始资源感兴趣,请使用 or 运算符:4 m: D9 }1 y \4 A. F- m
8 d4 K. ?; T+ W+ h& r) S
crm configure show type:node or type:primitive* j! S% _- g5 Z/ `
node 178326192: alice
: g m- T5 @1 Q. \+ Qnode 178326448: bob
# N! K8 B! x3 t- rprimitive admin_addr IPaddr2 \+ [* g! U5 A5 h) k, o
params ip=192.168.2.1 \3 z/ n! F1 h9 \% W& g
op monitor interval=10 timeout=203 ~) a0 ?' g0 a: C) a: j
primitive stonith-sbd stonith:external/sbd \
4 c6 A; W$ v2 M) W+ W params pcmk_delay_max=300 m& G, H$ ]- Q9 E, B0 F" D
COPY* C" v. J, Y! V0 C2 o, ?& B0 [
此外,要搜索以特定字符串开头的对象,请使用以下表示法:
% g/ ]/ y* @' `& w' M3 K0 O( Z9 V- }1 t% u' r' u
crm configure show type:primitive and and 'admin*'( T3 f( m$ t. Q9 @9 q1 Y g! f0 @
primitive admin_addr IPaddr2 \
6 F2 Z" ?$ G0 m3 j* z) ~4 d: v params ip=192.168.2.1 \7 y2 C5 e0 V- ]$ L9 t2 S1 W
op monitor interval=10 timeout=20
( Y5 `- C' V0 Q% Z$ G* vCOPY
7 q: _' z- q5 }$ F& T; N( n要列出所有可用类型,请输入 crm configure show type: 并按 →| 键。Bash 补全会为您提供所有类型的列表。6 v9 ?2 O' d/ V) B6 c* E" z6 f
; ~0 G6 B4 X" [! J' e8.4.2 启动新的群集资源 #3 I: k5 N) |" ^1 _7 H5 b3 ?2 }, H
要启动新的群集资源,您需要相应的标识符。按如下所示继续:
/ Z6 s: b/ U5 L: T# V) T1 j$ {# g8 n+ B- Z, J2 F% O7 |5 M
以 root 用户身份登录,然后启动 crm 交互式外壳:
2 T$ l7 r- z1 y- \8 T, J- ]8 t/ Y5 w$ @- o2 z8 \- o! y+ B
crm+ M3 y4 e3 Z5 k; O, j+ p- g7 t, {
COPY
6 n; b/ `% P0 E- U, I切换到资源级别:% t$ `% |4 ]; |
( B6 {8 v& L5 Eresource
4 `+ x3 k% y, _! _5 vCOPY* l' `; c0 A& {" O9 g! s: C, U
使用 start 启动资源,然后按 →| 键显示所有已知资源:* K$ ~' p9 P: ?7 l6 Z
4 C7 i d0 ^- r* b2 ^' Rstart ID1 D! {* t: J- X1 X5 C
COPY
: K0 ]+ p6 \/ `# H5 g7 p* J8.4.3 清理资源 #! [% I1 z9 T1 s9 v, `4 b
如果资源失败,它会自动重启动,但每次失败都会增加资源的失败计数。如果为资源设置了 migration-threshold,当故障计数达到该迁移阈值时,将不再允许节点运行该资源。" X& e! U( L: F: q" s
3 @/ b9 I7 @0 J" `# M& I
打开外壳并以 root 用户身份登录。
; g5 _" l3 I1 A+ W' J/ Z! y+ G, T7 M1 }, r
获取所有资源的列表。
2 b1 X5 ^; `4 Y0 P9 E1 Z3 t/ M. O8 f% r9 o& j& N
crm resource list
a' f; d7 N( M; G5 c ...; M) A7 \8 R, I, n, e6 l3 s
Resource Group: dlm-clvm:1
0 y$ H) H6 A( C( J, s! }3 S dlm:1 (ocf:pacemaker:controld) Started' z" R: J: O! X3 Y" V G
clvm:1 (ocf:heartbeat:clvm) Started
% V' a: Q, n, pCOPY$ W) I" I: T6 K4 w8 V% A
例如,要清理资源 dlm,请执行以下操作:
3 I, j e0 _) l( d) l) \; ?& k. X! W9 D
crm resource cleanup dlm( Y4 ], F4 V" h4 C- H
COPY
4 ~) A3 l" U& l, Q! f8 k6 t: M8.4.4 删除群集资源 #+ R4 U: h0 R4 A* u& `% O' k& o4 z
请按如下操作以删除群集资源:
Y% S. @$ V) q* P% D4 G5 Q0 p8 @; q, j
以 root 用户身份登录,然后启动 crm 交互式外壳:
0 F) }7 b z# U- q6 Q
4 m( T, g( B R: y) U8 B' kcrm configure4 j! Z! i' L" z. L" g
COPY4 f- C* @/ L5 K$ j
运行以下命令来获取您的资源列表:, G( J/ {6 \' T3 G9 u+ Q
, d& t# I" V/ O9 ]4 V" Y
resource status
; M+ }& M" @3 hCOPY
" q: S, G: h8 J" k* m, o例如,输出可能类似于以下内容(其中 myIP 是资源的相关标识符):3 C+ y$ \* _/ i
& `, a% R! ~8 s
myIP (ocf:IPaddr:heartbeat) ...; D# K0 Y3 O9 q% c
COPY
! z1 l+ o5 A- @* L删除具有相关标识符的资源(也暗指 commit):
& i8 g6 c) k' l9 J; q
2 e1 x: I, J# C: nconfigure delete YOUR_ID
; F; q: b. L$ q$ mCOPY# f0 Z3 h$ [' s1 r
提交更改:
$ o8 j3 i3 `4 c8 m
: n" }8 t- j( i) \- w9 ^& `- a1 Bconfigure commit+ Z4 u' O8 R# S
COPY
" _% l$ s3 v; R* f8.4.5 迁移群集资源 #
6 F: @% N$ j) O' |虽然资源已配置为在发生硬件或软件故障时自动故障转移(或迁移)到群集的其他节点,但您也可以使用 Hawk2 或命令行将资源手动迁移到其他节点。
$ x( L5 ^, g- }5 Z- N. K Y8 } u( p$ u, _% C, Q
对此任务使用 migrate 命令。例如,要将 ipaddress1 资源迁移到名为 bob 的群集节点,请使用以下命令:
8 v* ^9 _) c( p4 \: I( N; K! W: t2 f- k/ R, w* a
crm resource3 | j" v! e$ N! ^5 B
migrate ipaddress1 bob3 Q, Z+ J, Q. ~) D+ N
COPY
! z% ]! s/ N8 w# h9 u8.4.6 分组/标记资源 #
( W. I# ?: U' z1 L3 ~2 D使用标记可以一次性引用多个资源,而无需在这些资源之间创建任何共置或顺序关系。此功能十分适用于对概念上相关的资源进行分组。例如,如果有多个资源与某个数据库相关,您可以创建一个名为 databases 的标记,并将与该数据库相关的所有资源都添加到此标记:
; p/ [$ M# i7 C8 e- O
3 ?4 b, D) i. G+ `9 H; Scrm configure tag databases: db1 db2 db3
, M1 k C% H; \) cCOPY
6 v7 H4 g1 o+ s, C# V$ m4 \" w这样,只需使用一条命令就能启动所有这些资源:
, g0 D6 n4 |* z2 o; x. G) N5 a# D4 ^) R3 k! t' A
crm resource start databases
8 h) [4 }: `( x) h" y3 ZCOPY
O% o1 Z/ P5 [7 @; a同样,也可以一次性停止所有这些资源:
( ?/ B$ b, c) K
0 s2 {- }* Q o0 z: G2 _3 ~3 Zcrm resource stop databases6 N- C/ n/ f( w$ L5 B4 w
COPY6 h/ H3 R8 \: N( M7 P
8.4.7 获取运行状态 #9 z x+ K$ c: M4 d) }* f( }
可以使用所谓的脚本来显示群集或节点的“运行”状态。脚本可以执行不同的任务,并不局限于显示运行状态。不过,本节重点介绍如何获取运行状态。. B N: k+ k) y [1 y
1 f! _0 a4 Y/ a e/ _8 D, f要获取有关 health 命令的所有细节,请使用 describe:
1 v1 C+ N' E% k9 o
5 t) Z, A! y) B; F& h/ Bcrm script describe health
7 T$ h6 ]! v# @! c. [( ^COPY+ Q3 g8 q1 F; p5 n
该命令将显示所有参数及其默认值的说明和列表。要执行脚本,请使用 run:
# Q1 _8 _, P/ V8 B* i# J* ^( D& K. N
crm script run health
: S+ ~7 G z) nCOPY
+ k w! n/ [+ X6 X如果您希望只运行整套命令中的一个步骤,可以使用 describe 命令列出步骤类别中的所有可用步骤。' w4 z, i4 S; A
2 N& H W4 ? B: Y+ |2 ?+ e
例如,以下命令将执行 health 命令的第一个步骤。将在 health.json 文件中储存输出以供做进一步调查:
+ k' P6 Y9 n# e; |- {: T: g& T/ J. m' F( k; V6 Y" `
crm script run health5 k* `1 y2 I+ Q, s: C/ K! i
statefile='health.json'9 T, y3 O' }" x) C& g/ g: _
COPY
% e& y7 y( l7 W2 B您也可以使用 crm cluster health 运行以上命令。
9 K- N% O& _$ ~
k" D9 M- d2 x! ?5 d4 Z有关脚本的更多信息,请参见 http://crmsh.github.io/scripts/。 m2 ]: L3 S; D4 s
+ ?8 E a! N2 c2 _1 C8.5 设置独立于 cib.xml 的密码 #5 }, A. s! E: \- N& \) N
如果群集配置包含密码之类的敏感信息,应将其储存在本地文件中。这样的话,这些参数将永远不会记录到或导入支持报告中。
' r' E$ u; ]0 H1 Y& F& S& Z1 U4 w9 ?2 v' W
使用 secret 前,最好先运行 show 命令了解一下所有资源的概况:+ j0 X T+ @9 M( k" F% Z
2 m8 T6 Q) g* g& G- c {2 Bcrm configure show
8 y; \( H/ m) A* h4 {primitive mydb ocf:heartbeat:mysql \
$ k* `. t2 d3 Z6 y! f params replication_user=admin ...
2 s# f4 m2 q0 D7 KCOPY
4 f9 i8 U9 F4 q* ~; A要为上面的 mydb 资源设置口令,请使用以下命令:2 \; ^; R% E( f P- E" r
8 d0 {+ t4 ]9 K3 [7 Dcrm resource secret mydb set passwd linux7 b. l4 d) H# Y- l( L' k
INFO: syncing /var/lib/heartbeat/lrm/secrets/mydb/passwd to [your node list]
4 _* f: d' w' XCOPY7 @" m: T0 x% l$ ?2 f
使用以下命令可以取回保存的密码:9 l- E" r; L* ^; @; x; ?% G! K9 ?
/ W+ |; q% U" \# |5 x0 s. bcrm resource secret mydb show passwd
% m7 w n6 C# \- ?+ i4 Clinux* F: }4 a; D8 t* f1 @. i5 U
COPY3 Q! ?7 ?, t3 e7 ^2 ]$ g
请注意,节点之间需要同步参数,使用 crm resource secret 命令可以帮助您处理好同步问题。强烈建议仅使用此命令管理机密参数。
4 c5 P4 }: r& D. K
4 l- x* g- h- z# R `8 m$ r8.6 检索历史记录信息 #: h0 y8 D2 @* `! n" l# p
调查群集的历史记录是一项复杂的任务。为简化此任务,crmsh 包含了 history 命令及其子命令。假定已正确配置 SSH。
# q: d: N9 i8 v& A( L" Z) c8 V2 r+ K+ M8 z1 D Q
每个群集都会移动状态、迁移资源或启动重要进程。这些操作均可通过 history 子命令进行检索。: V/ {/ a& J' | c# `9 s
2 D% a+ V% O) E8 R+ V8 \5 M' y
默认情况下,所有 history 命令会查看最近一小时的事件。要更改此时间段,请使用 limit 子命令。语法为:9 ^: g+ Y) C: K1 [& X9 b0 i5 S
5 \) a3 X2 q2 lcrm history
, C) z- x5 L v* e* K! Llimit FROM_TIME [TO_TIME]9 C1 `2 Y/ @3 H( |$ N" {
COPY
. F7 H( Z5 D% E+ W& o有效示例如下所示:3 W6 E+ U7 f5 i% Q7 A$ l
. T. ~$ f2 z- M; X, h+ R1 n
limit4:00pm , limit16:00% ]. k! ^% W% y. K9 e
上述两个命令表达同一个意思:今天下午 4 点。2 ?$ |3 F4 c) s" ~
% y% G9 c. E, n& p) q
limit2012/01/12 6pm
3 H3 z: D$ P2 R8 n2012 年 1 月 12 日下午 6 点. }# U$ }: F5 t$ W9 W" X& o7 S
; y7 Q2 ], q8 y9 J" \limit"Sun 5 20:46"
: q% S4 \$ q+ U当年当月 5 日(星期日)晚上 8:46+ X- M! w6 Y) O$ y0 m$ P
; W6 @" q/ J1 W& i) U
要查找更多示例以及如何创建时间段的信息,请访问 http://labix.org/python-dateutil。/ K# C. R2 j: c! `5 A8 E
2 E( g5 `$ i" X9 J2 L( d$ ainfo 子命令显示 crm report 涵盖的所有参数:
. U% B0 z( K. N1 R N: M. z7 t8 M9 z5 ~! Y1 i
info7 Z2 t' x: B4 f: `- B
Source: live& T4 K% l% Q* k# H& A. ^0 o& I
Period: 2012-01-12 14:10:56 - end5 G9 @, [$ K& m/ u( Y2 J
Nodes: alice
( s. [$ e+ a6 L, J% D- ^& o2 FGroups:
( l$ A" v6 `5 zResources:
1 r' \* s$ z- o6 ^COPY9 j, _$ k: S1 r4 J
要将 crm report 限制为使用特定参数,请使用 help 子命令查看可用的选项。) Q( C$ s6 N5 h% Y5 I/ z1 s, l
8 M1 Z6 |5 s: a
要降低细节级别,请使用 detail 子命令及级别:
" `, z( g9 ^. r- ?$ S4 r% H6 U& _; M2 ]& E
detail 1
/ {- c; ~ C% hCOPY
' [; d/ P: B u级别数字越高,报告就越详细。默认值为 0(零)。* @% a! s0 q( W2 ~
; W. ?- e& ]6 Z# O. \% f
设置上述参数后,使用 log 显示日志消息。8 }: q! C# V: p- k# k; ^; i6 ^
! [* C) n$ K( l% h. g要显示上次转换操作,请使用以下命令:
/ ^% g5 e. F3 ^+ ?/ e8 c2 [$ ]/ d: u4 x& h! J
transition -1
) _# z2 t4 @# i; s, b% vINFO: fetching new logs, please wait ...
* R |. Q- A0 n7 J+ w7 o) P! f5 eCOPY }2 j+ y1 X, |5 l+ U
此命令会提取日志并运行 dotty(从 graphviz 包)以显示转换图。外壳会打开日志文件,您在其中可以使用 ↓ 和 ↑ 光标键浏览内容。
; @% }) @* F# `! }/ O! c( I/ Q
* k) a( d7 k* K# s8 ?% {+ D如果希望不要打开转换图,请使用 nograph 选项:
9 r N( I; X. X3 F
. }( ]# b( J% l" c2 b3 itransition -1 nograph6 \ s: W! b+ }) u9 ]8 A% e) R
# T5 C0 T* e2 {3 I7 w! v5 u( K |
|