|
|
楼主 |
发表于 2023-12-25 20:48:51
|
显示全部楼层
8.1 crmsh - 概述 #! x7 l: T+ O+ Y' j: o9 v% S9 H
crm 命令有多个子命令,这些子命令用于管理资源、CIB、节点和资源代理等。它提供了全面的帮助系统,并嵌入了示例。所有示例都遵循附录 B 中所述的命名约定。
# l% a9 n! _: D. H3 o) _; K% Z/ ~3 z7 [& @7 _) s* ]) e
提示提示:交互式 crm 提示符: ?7 j$ h, }# Q; s4 R2 v; g6 G: p
使用不带自变量(或只带一个 sublevel 自变量)的 crm,crm 外壳将进入交互式模式。此模式由以下提示符指示:
0 g2 L2 j1 d$ N2 e9 w
- q* E2 v6 _. H# GCOPY* I% K7 F% q6 q+ u( C+ ^
为了容易阅读,我们的文档在交互式 crm 提示符中省略了主机名。仅当您需要在特定的节点(如 alice)上运行交互式外壳时,才包含主机名,例如:
# a6 V- A3 n) A9 [+ I; R% u
. u; e, @" m3 `2 E- |+ DCOPY
. v. D( d! J% q; n8.1.1 获得帮助 #
: N* q$ h) F J! {' S可通过以下方式之一访问帮助:/ w4 j% N0 ^; z9 e9 q# p
& D `& r, l( E输出 crm 及其命令行选项的用法:0 l/ z' h- J) M+ P7 w4 }, p
7 c. P" a) z! L! Kcrm --help
5 x3 N7 q9 c. n& O! _+ oCOPY5 Z" Z" |" |+ a4 o
列出所有可用的命令:: [, D- y0 ?% y
- q+ \9 v- s: B, @ a
crm help
3 \# k9 H5 `! M9 {$ VCOPY+ U! o7 e* y7 v' i |1 Q0 p
访问其他帮助部分,而不只是命令参考:
! I/ d; ^1 [2 c* o
. Y4 M( l U* }$ g2 zcrm help topics
; I) J" l3 c1 S( o, _COPY, m- w, f' A: M9 Y1 c6 g
查看 configure 子命令的完整帮助文本:! Q' \3 v$ \2 H( v2 C
. W+ q8 h/ y" e5 S+ r
crm configure help
! p# n& Q3 l F2 B7 eCOPY
# |5 {0 t: L1 k要列显 configure 的 group 子命令的语法、用法及示例:; E1 L0 @# f& }4 s, i
8 t! O; S7 v* W; {* w9 g5 ?+ b
crm configure help group8 L- j% ?( `' P$ i% h5 i' B' E
COPY
+ S a) r) R: j! j以下命令的作用相同:8 t4 ^- s8 F* Q0 L3 w# l2 O- }
% C1 p. S" o! p1 |# fcrm help configure group
" ^8 E* e( ~/ L0 o' {COPY
w! ~( O. Q, V( E7 R$ V几乎所有 help 子命令(请不要与 --help 选项混淆)的输出都会打开文本编辑器。此文本编辑器允许您向上/向下滚动,以便更加方便地阅读帮助文本。要退出文本编辑器,请按 Q 键。
' l9 p& ]3 Z8 k f9 [ i% g3 |4 a$ D
提示提示:在 Bash 和交互式外壳中使用 Tab 键补全
" [1 j7 q) z( Z" kcrmsh 不仅为交互式外壳提供 Tab 键补全,还全面支持在 Bash 中直接使用此功能。例如,键入 crm help config→| 会补全文字(就像在交互式外壳中一样)。
+ f& [) G4 l: t- q0 y
4 Y8 I' K0 Y' h/ Y& @' z8.1.2 执行 crmsh 的子命令 #+ t4 O. ^6 V" n: u g, {
crm 命令本身可按以下方式使用:
/ I9 K" V6 M6 e9 |! s$ p1 I" d: x; {1 m- r# Z
直接:: 将所有子命令连接到 crm 中,按 Enter,您将立即看到输出。例如,输入 crm help ra 可获取有关 ra 子命令(资源代理)的信息。) T+ h# [1 h7 J1 a9 I: Q
' c" L4 w6 h7 x& Q3 X# e可以缩写子命令,只要缩写后的子命令是唯一的即可。例如,可以将 status 缩写为 st,crmsh 可以识别该缩写。1 \5 s* Z" b- c9 H
$ p( A3 c T+ t) m0 y8 H
另一项功能是缩写参数。通常,您是通过 params 关键字添加参数的。如果 params 部分是第一个且是唯一存在的部分,则您可以省略它。例如,下面一行:
Q5 J- K4 ^% a1 q4 T/ F) k2 c2 L# K* @& }* z- ~* R
crm primitive ipaddr ocf:heartbeat:IPaddr2 params ip=192.168.0.55$ F$ f# f) n4 @5 X
COPY
+ x3 n/ i! {9 {& }相当于下行:
8 p+ n* z: Y6 h1 Y6 a" I' x* o
' c5 n) b, T2 X: ~7 C- Scrm primitive ipaddr ocf:heartbeat:IPaddr2 ip=192.168.0.556 G: y5 h! M+ ~. v+ ?4 P' E* g3 k
COPY
4 [) ?( D" |+ G% P* t8 ^' J作为 crm 外壳脚本: Crm 外壳脚本包含 crm 的子命令。有关详细信息,请参见第 8.1.4 节 “使用 crmsh 的外壳脚本”。
/ T7 ^; G1 _( C( i
7 w- z# a6 }) P, F/ c作为 crmsh 群集脚本:: 此类脚本是元数据、对 RPM 包的参照、配置文件及多个 crmsh 子命令捆绑在一起并以单个描述性名称命名的集合。可以通过 crm script 命令管理这些内容。4 K0 C9 r4 `* W: U! g; G
0 f4 [0 k# ~. S m7 W) l请不要将它们与 crmsh 外壳脚本相混淆:尽管两者具有一些共同的目标,但 crm 外壳脚本只包含子命令,而群集脚本所包含的远远不只是简单的命令枚举。有关详细信息,请参见第 8.1.5 节 “使用 crmsh 的群集脚本”。3 I3 ?& k$ l& B& y% x0 L3 ~
" q/ Z4 f" e/ f9 j' }$ o0 [作为内部外壳交互: 输入 crm 以进入内壳。提示更改为 crm(live)。使用 help 可获取可用子命令的概述。由于内壳具有不同级别的子命令,您可以键入一个子命令然后按 Enter“进入”相应的级别。- Z+ y; |! z" h4 \$ a" X9 b
4 @/ B ^" }* o9 ?9 A+ d/ s. O
例如,如果输入 resource,则进入资源管理级别。提示符将更改为 crm(live)resource#。要退出内壳,可使用命令 quit、bye 或 exit。如果需要返回上一个级别,可使用 back、up、end 或 cd。; `3 ~: t+ o- W3 [/ X. C
( J- \) V+ b# y" e! {3 T; {
您可以键入 crm 和相应的子命令(不含任何选项)直接输入级别,然后按 Enter。; }/ v6 q8 f1 ~% z
. g8 \& M& U5 l内壳还支持使用 Tab 键完成子命令和资源。输入命令的开头,按 →| 和 crm 完成相应对象。
/ c( p. k! m% C) s. i
$ _3 w0 F8 m8 X, t除了前面说明的方法外,crmsh 还支持执行同步命令。使用 -w 选项可以激活该命令。如果已启动不带 -w 选项的 crm,则可以稍后通过将用户自选设置的 wait 设为 yes (options wait yes) 来启用它。如果此选项已启用,则 crm 将会等到事务完成为止。事务一经启用,就会打印出点以指示进度。同步命令执行仅适用于 resource start 之类的命令。' x6 A! f9 w) ~: z* B
1 B: ?1 I" y! P/ w+ N! B注意注意:管理和配置子命令之间的区别0 ^( H% `9 k3 B2 k5 @
crm 工具有管理功能(子命令 resource 和 node),可用于配置(cib 和 configure)。, D3 A; @1 h6 Y5 t) Y" Q
/ n, z+ D8 v4 ~$ m/ H' X& Z) R% a" B& R以下小节概述了 crm 工具的一些重要方面。
- y K5 e3 M+ }& @$ M) x. v" [8 l( W7 \0 t( a3 z3 S, x* n& i e
8.1.3 显示有关 OCF 资源代理的信息 #- Y+ ^' e5 ]$ i2 O; @
由于在群集配置中一直需要处理资源代理,crm 工具包含了 ra 命令。使用该命令可以显示有关资源代理的信息并对其进行管理(如需其他信息,另请参见第 6.3.2 节 “支持的资源代理类”):
+ S* R7 x4 I& f3 V) W* R% D/ d3 ?/ y# O" F( K0 N z5 N! _2 h- ?7 t
crm ra! U( h; r1 N, E/ p
COPY
( n: R5 m( n3 Y; b+ j" ^' P命令 classes 可列出所有类和提供程序:- V5 c% P% B I. y
, R+ m, \- K6 h2 gclasses! j; {5 I1 G7 j$ V) G) O: K. T
lsb
8 o R. ]8 v+ t' r) q9 g, I$ y ocf / heartbeat linbit lvm2 ocfs2 pacemaker
1 l' ? l2 z0 H5 g service
1 ]4 |! N/ `9 T: y1 p' A stonith" {$ J* q5 _4 R. W9 h1 f
systemd+ l8 g4 T% \ t3 J* k
COPY* j* _1 v0 V+ `: ^% J
要获取某个类(和提供程序)的所有可用资源的概述,可使用 list 命令:
+ ^$ y* j1 R1 V: c
2 |, c+ |; K2 g9 }+ _list ocf
* ]2 @. s1 E7 E h8 ?3 s( BAoEtarget AudibleAlarm CTDB ClusterMon: [ X: E3 `- [4 t5 `$ k
Delay Dummy EvmsSCC Evmsd: p2 j7 C6 v g
Filesystem HealthCPU HealthSMART ICP; O/ Y% d* Q0 f2 _" C5 n7 g
IPaddr IPaddr2 IPsrcaddr IPv6addr( l) q+ P/ R# } I% d) O
LVM LinuxSCSI MailTo ManageRAID
3 N' c x" u G- x8 S% xManageVE Pure-FTPd Raid1 Route5 ^5 Z" h2 J) [# o: \
SAPDatabase SAPInstance SendArp ServeRAID. N' z: `6 g, e5 O% H$ r" E( n- V* T! A
...( B$ B* ?6 _: d; G! e$ E+ V
COPY$ {5 q" J/ O: K8 B' `4 C
可使用 info 查看资源代理的概述:3 {; y5 e% b" P2 w9 l
4 H$ L# ~; Z9 vinfo ocf:linbit:drbd
8 l$ F" S4 R% r) F6 I1 S# k KThis resource agent manages a DRBD* resource
2 {8 ^7 P$ R1 f/ U/ @3 aas a master/slave resource. DRBD is a shared-nothing replicated storage
9 C: a X. z: |6 @; d9 i) ^' {device. (ocf:linbit:drbd)% q: u$ ~, W; ]& R8 R3 a2 n
( s$ ?% C- ?( K4 P" C
Master/Slave OCF Resource Agent for DRBD
9 @4 i& ]2 r% o) b$ _& M i8 e2 O" \9 [0 D) H6 J2 y- [7 H3 g
Parameters (* denotes required, [] the default):
1 d! F0 ]3 p1 M) `( R* r2 ~. M
+ k+ p7 _3 T2 Ndrbd_resource* (string): drbd resource name
3 V R# |% c+ }( B% W The name of the drbd resource from the drbd.conf file.4 }, ]6 q2 l. b
8 A' y/ L. U5 N% h3 Z3 V6 ydrbdconf (string, [/etc/drbd.conf]): Path to drbd.conf
$ B; r# X7 {- R9 Z5 y: P Full path to the drbd.conf file.
2 O% O; v$ L* ^# X
% ?. _0 E( l* p+ K* J h$ Q( ]Operations' defaults (advisory minimum):; N7 w# h) A4 ?% P
5 l" D( z% p. {, @5 [4 k start timeout=2407 y, U& M3 ^) a! N
promote timeout=90
8 I9 B9 M" p+ ?* ]! z0 t9 t demote timeout=90
( ~% v2 E: Y! \4 m$ b notify timeout=90
/ A2 ^" K7 ^- D; H1 P. x' Y stop timeout=100
. {/ Q$ }' T9 J0 N, x0 t5 t8 G monitor_Slave_0 interval=20 timeout=20 start-delay=1m
, ^$ i5 O" X1 D. t monitor_Master_0 interval=10 timeout=20 start-delay=1m
* E: G% M/ ?, z- q$ VCOPY8 c. ?' x& t) I
按 Q 退出查看器。
2 b' c4 ^* }4 o* ?6 S6 g) ^+ v% t# F7 V' Z* ?
提示提示:直接使用 crm
3 ?1 P4 |4 Y& U) O( i/ Q( N5 A在之前的示例中,我们使用了 crm 命令的内壳。但是您不一定非要使用它。将相应子命令添加到 crm 中也可获得相同的结果。例如,在外壳中输入 crm ra list ocf 可以列出所有 OCF 资源代理。* x4 Z7 v; @" T* o! P/ b7 m. B P& F
$ Q" w0 e7 C; d) Z, n8 t" t
8.1.4 使用 crmsh 的外壳脚本 #
$ k& @: z5 M5 R6 c1 ~, [3 PCrmsh 外壳脚本提供了将 crmsh 子命令枚举到文件中的便捷方式。如此,您便可轻松地注释特定行或稍后重新运行这些行。请注意,crmsh 外壳脚本只能包含 crmsh 子命令,不允许包含任何其他命令。' ], W* P! r' q% A; D
! `2 H9 |2 }' p" H k0 G0 e; G1 K9 ^- K
您需要先创建包含特定命令的文件,然后才能使用 crmsh 外壳脚本。例如,下面的文件会列显群集的状态并提供所有节点的列表:
' p( M+ x. d" D; G3 B
P! v0 L5 K2 @+ n$ K. J9 h例 8.1︰ 简单 CRMSH 外壳脚本 #1 n- c9 W2 `1 |% w( ?9 \8 o; W, y
# A small example file with some crm subcommands
( }: F, y. n* m# u: mstatus, v6 S4 l4 B$ L+ _& U
node list
; [( [" P6 b. O# U1 g: `COPY4 o7 y* ~+ J. e4 @
以井字符号 (#) 开头的所有行都是注释,可忽略。如果行过长,可在结尾处插入反斜杠 (\),然后在下一行继续。建议缩进属于特定子命令的行以便于阅读。
6 a6 k# T: h& ^3 |& C+ x" z+ Z0 [
要使用此脚本,请使用以下其中一种方法:/ w/ d" z8 ~# n" A7 Z% b. o
# V) y: v: ]# n) K& n& Ncrm -f example.cli
/ H! U% x7 L( ^" n! Acrm < example.cli
R! b2 F0 n. }$ d1 eCOPY- ]# H7 g1 _7 i( T/ H9 U
8.1.5 使用 crmsh 的群集脚本 #
9 D' Y- f8 \# N& i从所有群集节点收集信息并部署任何更改是一项关键的群集管理任务。您不必在不同的节点上手动执行相同的过程(这很容易出错),可以使用 crmsh 群集脚本来代替该过程。4 D2 W) M# q( G9 Z# O, d
. T* X- E6 J% e+ U. x- k+ I
请不要将它们与 crmsh 外壳脚本相混淆,第 8.1.4 节 “使用 crmsh 的外壳脚本”中对后者进行了介绍。
9 R4 |8 A& \+ h$ e( T
. _5 S2 G+ t( f! Q: p对比 crmsh 外壳脚本,群集脚本另外会执行如下任务: U$ R9 N6 _5 Z0 i# m- A5 F
) Y% L' V4 E* y$ U) o( w+ R
安装特定任务所需的软件。5 q- E, |& a& J0 H5 u$ o! ?
% K l3 O0 C1 V# R8 _; e
创建或修改任何配置文件。
2 P% I, p9 l/ |5 }0 S- h2 P4 ~9 R1 U6 o+ k" p' r5 f6 h
收集信息并报告群集的潜在问题。
+ A3 j% e( y5 R$ }
) Y9 U" x' D$ ?将更改部署到所有节点。* t# k6 G& r; c2 w$ L% t; f, b' A2 H
9 I; g) L0 e8 x% Y: Q* `. `0 Ocrmsh 群集脚本并不能取代其他群集管理工具,它只是提供了一种集成的方式用于在群集中执行上述任务。有关详细信息,请参见http://crmsh.github.io/scripts/。
; a8 ^' g' o1 r( ?9 h' W9 k- F' b8 {- @- N
8.1.5.1 使用 #
- v* K2 O& P! K. d; K. `: H要获取所有可用群集脚本的列表,请运行:1 z+ [. k @: R7 `, m, T! r3 k
: K# P2 { g4 `& H; \. W
crm script list" y- h! b% o* l- H' _' x
COPY
$ B# D0 Z; h! S% L% c' _. v要查看脚本的组成部分,请使用 show 命令和群集脚本的名称,例如:% b6 l- S' p! O" \, V+ S
C( I4 q& y6 B9 c
crm script show mailto
! d9 M8 ^; Y8 Z3 z0 M6 N6 Ymailto (Basic)4 n1 B- J, Y0 y$ V6 s3 ^
MailTo. {2 d2 x6 q' j) O7 T
1 D: V) _1 c& Q8 j* n This is a resource agent for MailTo. It sends email to a sysadmin
M) n# o3 a( p7 Jwhenever a takeover occurs.
$ k4 E* _: d6 p; U* u5 ^* b
2 g* G! ?( c. s4 i1. Notifies recipients by email in the event of resource takeover
' J4 T" C0 w& ~8 Y2 g% R$ [" p9 T1 P
id (required) (unique)) \# }+ M5 r" @/ f7 p3 h2 f3 W
Identifier for the cluster resource7 M7 j9 z" H. w, y j
email (required)
8 X8 t# t5 |6 N4 D, ] Email address8 ~. C& c% J( K$ h8 {: c" ]
subject
' A1 V+ D5 O1 w: {) m4 w Subject
! _+ |* D( j1 O- K/ w7 q% |1 xCOPY; C9 [, M2 R$ M( d3 r- ^. `( d* Y4 Z
show 的输出包含标题、简要说明和过程。每个过程分为一系列按给定顺序执行的步骤。- o6 h; O8 i% s/ K9 _5 Y
9 c6 z9 {! Y3 ^ Z& [$ o
每个步骤都包含一份必要参数与可选参数及其简要说明和默认值的列表。
( E1 i8 E" X" ], [8 m9 H+ f$ @: O3 y( f: p% V
每个群集脚本都可识别一组通用参数。这些参数可传递给任何脚本:
1 V. O E, o6 N3 \' t
, |5 J; C' c2 x" |表 8.1︰ 通用参数 #3 L" T+ l2 W9 C% D6 @
参数 自变量 描述. p& r; O1 I& j" \) M
action INDEX 如果设置此参数,则只会执行单个操作(verify 会返回索引)' t1 G/ y3 A5 N" O9 c
dry_run BOOL 如果设置此参数,则只会模拟执行(默认值:no)1 v* e6 M' M6 ?3 J( d
nodes LIST 列出要对其执行脚本的节点% g8 ?+ O2 V8 M7 ]7 r
port NUMBER 要连接的端口- N. I6 L2 `, J2 M- k5 O
statefile FILE 在以单一步进方式执行时,状态将保存在给定文件中
7 b# ?2 t2 v; A+ m+ Q- b0 q3 k" Lsudo BOOL 如果设置此参数,crm 将在适当的情况下提示输入 sudo 口令并使用 sudo(默认值:no)3 q4 P' j( b4 H3 }6 ^# Y! d' o
timeout NUMBER 以秒为单位的执行超时(默认值:600)7 C( `- H2 o) Z3 ^; ?
user USER 以给定用户的身份运行脚本* |6 V7 _+ U6 l; \
8.1.5.2 校验和运行群集脚本 #
9 X+ S6 Y2 Y J8 J ^在运行某个群集脚本之前,请检查该脚本将要执行的操作并校验其参数,以免出现问题。群集脚本可能会执行一系列操作,并且可能会出于各种原因而失败。因此,在运行脚本之前校验参数有助于避免出现问题。. s' W1 B; j) Q9 v' u3 X
$ H8 Q+ ~9 W5 x/ s/ I! g7 V8 U
例如,mailto 资源代理需要唯一的标识符和一个电子邮件地址。要校验这些参数,请运行:; X$ t$ Y$ {( K& E' j# p$ T4 N
+ I) ~0 x/ Q! I8 Jcrm script verify mailto id=sysadmin email=tux@example.org
* L; t, [8 B4 f$ W5 `' e a7 o1. Ensure mail package is installed
% m5 `, L) |" ]# W/ O) r
" K( {5 U- Q) c, T( v* p. ~: o mailx0 l1 A1 e! l, B% [9 }0 Y
0 C- p$ e1 w' ]* Y1 U6 J% F4 F2. Configure cluster resources
, V; O5 k( x8 ~0 {( N- V9 H4 q9 @/ Z! ~0 v8 l9 d5 d* ?3 Y
primitive sysadmin ocf:heartbeat:MailTo
: u7 n0 ?. f6 O: Q& ~4 |1 ^+ s email="tux@example.org"+ U3 x( Z3 {: t. i: T n
op start timeout="10"
0 l( {; B; o6 S* k op stop timeout="10"
* x# B1 w# z I: r p3 W: F- P op monitor interval="10" timeout="10"
5 o3 ]% H* h) f6 p
+ |. z( o, h8 Z: y clone c-sysadmin sysadmin3 E5 h* m m0 A' \' }, C
COPY8 i" v8 y8 Z; T9 B9 m; o+ u
verify 将会列显步骤,并将所有占位符替换为您的给定参数。如果 verify 发现任何问题,将会报告问题。如果一切正常,请将 verify 命令替换为 run:
. W7 R# o+ w; V+ g9 [7 ~9 A! c" J
. l# e4 [$ }# Y# Bcrm script run mailto id=sysadmin email=tux@example.org/ ^: B* a! g5 F: J m
INFO: MailTo0 t( }3 [$ H2 D0 m+ u
INFO: Nodes: alice, bob
4 K' M5 V& W: r% \" lOK: Ensure mail package is installed7 J, R r. O! C" N$ k7 h! J8 q3 G
OK: Configure cluster resources$ q( b. n# ~0 U) T4 Z
COPY5 U$ Y% z* ]+ N. P, m# F6 ]
使用 crm status 检查您的资源是否已集成到群集中:" [3 A0 b9 s5 \6 h, V) a
" P* C Q# L3 v9 \* W7 t: R9 Ccrm status# U, c. x6 c: U+ B2 k! m3 M7 g
[...]
& f. i. c5 u) [" A2 J4 `9 Z5 R Clone Set: c-sysadmin [sysadmin]
% m& a, ?$ b; c3 y9 ` Started: [ alice bob ]) ^3 F0 D5 b* C4 ^# t6 q' x: ?! M8 a
COPY
7 f/ i( H; ?+ S! S4 n! \$ {8.1.6 使用配置模板 #9 i7 R1 G; Q4 \6 \ a
注意注意:弃用通告7 L9 _+ B1 X$ B5 y1 L) M8 g$ v( ?
配置模板已弃用,将来会被去除。配置模板将由群集脚本取代,具体请参见第 8.1.5 节 “使用 crmsh 的群集脚本”。
2 K0 Q# I8 v1 ~% b0 \: ~$ T8 L9 K% F c/ Z: T
配置模板可为 crmsh 提供即时可用的群集配置。请不要将其与资源模板(如第 8.3.3 节 “创建资源模板”中所述)混淆。资源模板只适用于群集,而不适用于 crm 外壳。
# _# S! i$ M* r6 P& k5 C$ L3 Z0 w9 H, W$ U
配置模板只需稍作更改,即可满足特定用户的需要。每次使用模板创建配置时,都会出现警告消息,提示您哪些可以稍后编辑以供将来自定义。
. g/ c2 I% _& d) S) ]7 c
$ R. z% K" b5 b$ A U9 K8 y4 W$ `以下步骤显示了如何创建简单有效的 Apache 配置:& h% |. H6 P: c
+ r( Z% i2 k& k. Q/ o6 Q以 root 用户身份登录,然后启动 crm 交互式外壳:
q* l F+ X/ _% r9 U k4 ]4 H! p# |, W& e
crm configure' v% f, p) @. t2 o7 O
COPY s# t V1 ~' i( y/ v3 s) r
从配置模板创建一个新配置:
6 m5 }% t- t6 a- b2 f, l2 s2 N' T& z1 n6 a4 R& _8 l
切换到 template 子命令:
+ H: b, I" l. d( x O* w2 E
& h# E5 H h( b$ `template
% ^3 x& [" i! oCOPY
, ^. J" C4 T h2 ^列出可用的配置模板:
" p3 q D. `4 \) n+ x+ T
; D: c; \7 K1 @, clist templates
8 Q9 }" N. t, `9 _6 O1 O3 |! `' @gfs2-base filesystem virtual-ip apache clvm ocfs2 gfs2
6 {# t, a6 D Q7 ?COPY
% e" d3 i8 C& h% }& P确定需要的配置模板。由于我们需要 Apache 配置,因此选择了 apache 模板并将其命名为 g-intranet:
# ?( E; W0 R4 B# g
. B; l/ N" h1 Knew g-intranet apache# g0 |' [$ c& c8 y0 z, k0 ~" c
INFO: pulling in template apache- h0 R4 f4 O( C
INFO: pulling in template virtual-ip0 Z; s. \( f& g0 p! q& K1 b
COPY
+ s" |- F6 s1 p" z }3 N定义参数:1 j. Y; {* e. v
' j; T8 {! c; G8 |1 {
列出您创建的配置:
& i* P, i, {) G# W" w* E r
( J2 S4 L* ]( ?! m+ m6 R9 x7 o. [list$ `+ ]7 }" g# r5 Y& Q" |7 n
g-intranet) W; @3 ~9 ?& r/ S
COPY
1 ?, o# H( _- b4 |显示需要由您填充的最少的必要更改:
4 y0 I% a) [% _: I0 w( c& A6 W& T; T1 [; e& v' S2 v9 z0 p
show
( f: l. L& u* QERROR: 23: required parameter ip not set
/ T- U9 t* G8 \. M" {# GERROR: 61: required parameter id not set
" h( r: s& i1 z4 bERROR: 65: required parameter configfile not set
9 {" {+ I; ]3 X! H" w' k& [. ACOPY
5 j4 x# k4 k! k+ k# r2 s9 n调用首选的文本编辑器,填写显示为错误(如步骤 3.b 中所示)的所有行:$ h8 ^" y v# r% y* _' \
; J! E% p9 P. x/ t
edit
) \. y" u, p( X" b) L1 b5 CCOPY8 v' _% P- Y4 ~+ a2 A
显示配置并检查配置是否有效(粗体文本取决于您在步骤 3.c 中进入的配置):+ z! y/ z, C! [3 r, E% c `% r1 P
% ]" E3 _3 C$ F8 Q+ O
show# {& I# a% f2 F% Q' N
primitive virtual-ip ocf:heartbeat:IPaddr \
$ P. j# r: t" t- a; P/ F$ Q params ip="192.168.1.101"
2 r$ i& r1 G: W" p3 zprimitive apache ocf:heartbeat:apache \
3 w! H/ F% Q3 S0 M+ z! i9 \ params configfile="/etc/apache2/httpd.conf"
" Q# \' [" ~0 E. a monitor apache 120s:60s; B; {# q: r- F O ]
group g-intranet \
. g2 }/ i/ A+ `! a! A0 O4 K apache virtual-ip
9 x$ N' O0 z5 R+ Y2 S! j, F& dCOPY) W" r; r% J7 Y' h5 D
应用配置:! i7 C5 u3 ^) B: v
# S! {1 s- z6 F
apply
$ Q$ @6 E/ q4 e. [( l# W9 h% fcd ..( @6 _ `- s9 i
show
" f S4 b. @2 c* ^# I/ W' K) M7 ACOPY7 t: B, [9 Q/ @, J: v
将更改提交到 CIB:2 I9 P9 j6 {4 x n2 `- o
! F5 {/ W/ x9 Y1 h1 a- Ycommit
# m* B7 C* b% C7 d9 r$ ~: b$ ~$ fCOPY
5 Z* D4 T; \. c5 C7 n如果知道细节,可以更加简化命令。上述过程可汇总为外壳上的以下命令:
+ j! X# b `, c& K) m2 t$ u. S: f; a1 L
crm configure template \
) }% t5 c0 N. d/ a new g-intranet apache params \4 M' u2 R* ~2 e+ t
configfile="/etc/apache2/httpd.conf" ip="192.168.1.101"7 M7 L7 l$ t( p% I; r# o
COPY4 i0 o; l! a( k, \4 _) k; {# n2 A
如果在 crm 内壳中,可使用以下命令:( W) Z2 c9 G+ N* M6 c3 J
+ w) p" M8 z2 _; y& E" Pnew intranet apache params \
( ]& h+ B3 w7 \ configfile="/etc/apache2/httpd.conf" ip="192.168.1.101"
; S& |2 L( W& G0 v: ~! R; `COPY
5 }& h, m$ }" D. t但是,前一条命令仅会从配置模板创建其配置。它不会将其应用或提交到 CIB。
! m! } N" d1 P) C- b
7 x# t5 ]- ]4 w" T8.1.7 使用阴影配置进行测试 #. K* M s. `# B/ h
阴影配置可用于测试不同的配置方案。如果创建了多个阴影配置,则可逐一测试这些配置,以查看更改的影响。
! E' T& A# e7 o( @, X$ B; P& S
6 w' ]. _% E" o7 Y5 y5 p( ? i一般的流程显示如下:
% v5 ], Y, b; }! T: x5 k+ u/ z! c, P& P- ^0 l
以 root 用户身份登录,然后启动 crm 交互式外壳:
2 m% Y9 M$ D3 F7 P! t. F$ ?. e# p/ k3 f1 x
crm configure
' e% {/ d; T8 xCOPY; |% k$ I& V8 w/ j
创建新的阴影配置:' @9 i1 ~. Z& P8 a E; ^
1 H4 `/ C+ j2 j4 F. v
cib new myNewConfig
- W( W6 I6 V7 r/ h- L9 C2 a) PINFO: myNewConfig shadow CIB created8 }+ v/ X, E* ]# s
COPY3 t0 e* |( n4 R h, c6 P4 ?( F/ C
如果省略阴影 CIB 的名称,则会创建临时名称 @tmp@。! w; _; ]* ?; H& Q
/ s( f H6 R* @6 e1 c" ~) Z要将当前的活动配置复制到阴影配置中,可使用以下命令,否则请跳过此步骤:( y$ |0 }5 c; W
4 }; l2 C ]1 m( m+ x0 A% T7 @5 H
crm(myNewConfig)# cib reset myNewConfig
9 s4 J/ c, o6 Q5 r, VCOPY4 I, P# K" w* p N
使用上面的命令便于稍后修改现有资源。; ^' ~; u6 T9 @4 L2 G6 h/ }) K
$ y" \; z8 N2 j7 M3 c, P, S照常进行更改。创建阴影配置后,会应用所有更改。要保存所有更改,请使用以下命令:
! S% v t& P" r7 L# Y' q
9 r2 F4 E0 x5 @* I! {9 C7 K4 fcrm(myNewConfig)# commit
2 k( S) Q+ d! Q: o) Z8 [COPY
2 S4 Z, a% ^$ t0 w- [如果再次需要活动群集配置,可使用以下命令切换回此配置:6 P" j/ B2 X3 R: K
, G3 A# `; I% y. [7 M; J0 i6 ]crm(myNewConfig)configure# cib use live
/ y5 W: s" K1 C0 `' ]COPY4 q& a% ^8 r1 N1 w2 g% M
8.1.8 调试配置更改 #) V" ~3 b: b3 Y6 x8 v3 j3 G& P
将配置更改装载回群集之前,建议使用 ptest 复查更改。使用 ptest 命令可显示提交更改后产生的操作图。您需要 graphviz 包才能显示该图形。以下示例是一个抄本,添加了监视操作:
* j9 S4 u! ]$ c& [9 [# H% U2 P" D7 ?- P1 i. |$ R* O9 |
crm configure
$ O- C0 v2 T( J& V) Z9 Z% \show fence-bob
1 W% f4 n9 B4 |8 G5 mprimitive fence-bob stonith:apcsmart \
- Q- F( {. i, c params hostlist="bob". w9 ^2 c' R- s4 E2 s
monitor fence-bob 120m:60s, N2 a$ \* J9 K! S2 ^4 ~5 q
show changed& N$ f1 {2 z& `- F A! G# f
primitive fence-bob stonith:apcsmart \/ k! P, b. t4 f$ m7 O; R
params hostlist="bob" \) w# y, W9 ]5 l1 O
op monitor interval="120m" timeout="60s"
5 I2 n0 u9 ^ E$ x& g2 rptest3 e F% D2 V) i1 C
commit! j! U" j, |3 Z. E2 s
COPY
( f7 o4 i& D( `. T s# b. c" @8.1.9 群集图表 #
. ~2 B7 O% R, K要输出群集图表,请使用命令 crm configure graph。它会在当前的窗口上显示当前配置,因此需要配备 X11。
0 a' _ P2 V, g- K7 o7 f( }' o( _" n, x+ R
如果您希望使用可缩放矢量图 (SVG),请使用以下命令:
$ v$ S$ n+ C. d, M+ `3 `7 `2 b% f) b0 x6 s" H `, ~
crm configure graph dot config.svg svg
" u7 d- F' N0 Y" h3 i5 x8 XCOPY) v; r1 Q) v/ J# G* G" j
8.2 管理 Corosync 配置 #7 Y; _6 U p$ Y# X; c
Corosync 是大多数 HA 群集的基础讯息交换层。corosync 子命令提供了用于编辑和管理 Corosync 配置的命令。
/ C% V, W! W H" R0 F) Q: D+ o- P: R0 G* S% J9 Y$ t, N
例如,要列出群集的状态,请使用 status:) o! J% \; `/ U# w n
( Q/ s& X* A/ X- j/ T
crm corosync status, u7 n2 V( f. O \6 K
Printing ring status.
& x% F0 p% j8 M! x6 @/ ?% lLocal node ID 175704363$ @1 e1 f( C8 a6 N" ]
RING ID 0+ P r6 M3 H) g7 \0 N9 \) g
id = 10.121.9.430 c" Y6 P2 T$ j& r
status = ring 0 active with no faults
. @0 m3 e7 O0 GQuorum information
/ U6 O; ^4 ^: R. i* f------------------9 H+ p) l! T; R- M& U
Date: Thu May 8 16:41:56 2014) R. k' ?% Q) D0 Z
Quorum provider: corosync_votequorum
( z% X' ]& a2 c/ x( r Y+ {Nodes: 2; r" h8 [) Z- r0 \" h3 I( r
Node ID: 175704363
* S/ ^, q4 J- e9 t0 L/ SRing ID: 4032/ g- E! E2 ^% p$ ^% \, r
Quorate: Yes
- N6 T2 m2 [/ g) y! u4 m0 D, W+ d9 l7 z4 T% ^. f/ f
Votequorum information
% }$ B. D& W1 U; s( u' J----------------------4 S ^& I) e0 X* X
Expected votes: 2
) A2 g2 {4 l% L3 K R+ }1 \# l) mHighest expected: 2: i( |. | |2 S5 k
Total votes: 2
! u% m2 C. I3 C0 O, x0 aQuorum: 2 ! s+ ~! a6 Q {3 y
Flags: Quorate # Q5 k; I+ U, g4 d; W$ V! M8 |
* H+ [ E9 @# u( U |& t/ {
Membership information. b8 w3 j0 d# N. L U# X
----------------------3 X* N( t$ ~) O& u3 [
Nodeid Votes Name: M+ ~6 ~+ x, q; P; K$ _
175704363 1 alice.example.com (local)9 f: L1 V. U' f6 x B4 z4 L1 ?. P
175704619 1 bob.example.com- I9 _. f0 N: v$ B5 F% ?) h
COPY( e9 e% Y, P4 V6 R) R
diff 命令非常有用:它可以比较所有节点上的 Corosync 配置(如果未另行指定)并打印出各自的差异:
: t2 r& ^4 k6 V8 t
4 F1 [. s: M( a' u/ Scrm corosync diff, u9 X( [( J, r2 i/ E- [- `
--- bob; j) A9 ^ c0 R9 D5 O" T2 ]
+++ alice
$ Y( O3 Y5 `1 o( G- h& n* s@@ -46,2 +46,2 @@
: _1 K$ h. K3 o% q( e5 j' _" ]' r6 {- expected_votes: 2
% _2 Y# \! T) l) J- two_node: 1
. t- ]7 O$ v) _: {+ W: W+ expected_votes: 1
. m q( r* s: J" w5 J+ two_node: 0( W6 L/ i: g9 i* O" Q! g$ C
COPY a/ ]; B- A" \+ V
有关细节,请参见 http://crmsh.nongnu.org/crm.8.html#cmdhelp_corosync。! A" M1 Q" l8 l. J% s( u0 ^( A5 |
% ]1 r1 E9 @# x( c
8.3 配置群集资源 #) u' F+ |3 v. J% v- ?
作为群集管理员,您需要在群集中为服务器上运行的每个资源或应用程序创建群集资源。群集资源可以包括网站、电子邮件服务器、数据库、文件系统、虚拟机和任何其他基于服务器的应用程序或在任意时间对用户都可用的服务。4 ~, P6 q' L7 x; ]% x7 o
! x- L! H C: ?0 g5 [) i+ e+ ]
有关可创建的资源类型的概述,请参见第 6.3.3 节 “资源类型”。
* \$ w0 k, \% c* `/ w7 Z' o8 k7 K) M& k
8.3.1 从文件装载群集资源 #4 u1 D* O( z; Z0 n) d' Y
可从本地文件或网络 URL 装载部分或全部配置。可定义三种不同方法:5 K0 F: K6 Y: G9 S* ^% a
, G9 x f' b" G* `replace$ A6 Q2 }6 z/ M3 A
此选项会将当前配置替换为新的源配置。! D! A' P3 Z; b4 l3 R- T
5 V0 M5 \; f% F$ J- Cupdate
# x6 I d8 s% ?" V0 y此选项会尝试导入源配置。它会向当前配置添加新项目或更新现有项目。
9 K) r) w! V2 d |! i: K( S
6 I; v4 p. |+ Ypush1 ^9 m! F9 X# |6 ]
此选项会将内容从来源导入到当前配置中(与 update 相同)。不过,它会去除在新配置中不可用的对象。! h/ [. R* u7 O6 _5 R0 @
7 E5 i$ p }" e' s要从文件 mycluster-config.txt 装载新配置,请使用以下语法:$ {3 i F; O" _0 }6 t i
' h5 |0 X& c: jcrm configure load push mycluster-config.txt
& ]6 U* G+ G, \, D( D$ N9 ~) gCOPY
4 d/ P d" ?) q7 {3 d* W8.3.2 创建群集资源 #
! _9 F, Q9 H; D8 X* b4 X有三种 RA(资源代理)类型可用于群集(有关背景信息,请参见第 6.3.2 节 “支持的资源代理类”)。要将新资源添加到群集,请按如下操作:
J1 T) q( u% f) K- T8 j0 [. m8 {7 m( C P/ r. o' h
以 root 用户身份登录,然后启动 crm 工具:0 H5 [$ I8 U* R5 l& w% A% |
+ \! H0 l' X3 z! p
crm configure
* s: }/ u4 V9 _ m- bCOPY% Z. v$ w# o7 Z
配置原始 IP 地址:
: l( V: L: ^! U% v9 {# |$ V
& ?. m [. P! M; T+ m; [+ e# fprimitive myIP ocf:heartbeat:IPaddr \6 \) O7 r5 `$ L: I0 ~; @
params ip=127.0.0.99 op monitor interval=60s
1 C* w+ [' F) v7 VCOPY2 [- T, @" L. c9 r
上一命令配置了名称为 myIP 的“原始资源”。需要选择一个类(此处为 ocf)、提供程序 (heartbeat) 和类型 (IPaddr)。此外,此原始资源还需要其他参数,如 IP 地址。根据设置更改地址。4 d! j3 l, T1 {" S* a( n
" y7 l, f8 e0 N& {: c* e4 m
显示您所做的更改并进行复查:: e0 l# a) I/ n
, y! @6 I1 J7 @: Y) l7 Y
show' S. d- V w' g% n/ k- _1 ]
COPY
6 }: S0 v. C6 H7 e5 D5 L) D提交更改使其生效:* f3 Y, i( B, a1 x8 O: y+ p0 Y
8 g$ m2 c K5 a3 w3 w1 _1 Xcommit2 f/ x. d2 e: c* G4 {( I' L
COPY% j& s0 _; u' e8 ]
8.3.3 创建资源模板 #' ^" |. [4 B+ K" ]7 I8 v. v5 }
如果希望使用类似的配置创建多个资源,则资源模板可以简化此项任务。有关一些基本背景信息,另请参见第 6.5.3 节 “资源模板和约束”。不要将它们与第 8.1.6 节 “使用配置模板”中的“常规”模板相混淆。使用 rsc_template 命令可以熟悉其语法:
0 ]6 M# i3 R% Q" q% o* U! v
) d8 E+ \6 |1 I% [2 Vcrm configure rsc_template
* ]+ Q6 x! s: Yusage: rsc_template <name> [<class>:[<provider>:]]<type>
' L& l3 R8 ]' `. G [params <param>=<value> [<param>=<value>...]]
% }/ J6 U1 {/ k [meta <attribute>=<value> [<attribute>=<value>...]]
3 s- x2 P a" w4 j6 g4 V [utilization <attribute>=<value> [<attribute>=<value>...]]' t$ Y `7 A' n/ ^1 b
[operations id_spec1 ^/ ^" \( P/ M
[op op_type [<attribute>=<value>...] ...]]
4 _" s; z5 l& @: B9 hCOPY
3 [( F! R' k& J4 G2 Z例如,以下命令将会根据 ocf:heartbeat:Xen 资源和一些默认值及操作新建一个名称为 BigVM 的资源模板:
. t/ @) e& \7 v; X' ]0 ?2 u5 w* A9 _2 Z, z, K- x
rsc_template BigVM ocf:heartbeat:Xen \
3 D' R- ^* C7 j% [6 V9 h params allow_mem_management="true" \
5 f) U& v" g( n. b: ~" b W1 a op monitor timeout=60s interval=15s \
: u( I9 q2 N* [2 }1 @( C+ J( h op stop timeout=10m \
' [4 s% p8 o& s' y op start timeout=10m1 c! A- c4 K: s. x! S
COPY
, _1 P& a( X' i定义了新的资源模板后,可以将其用作原始资源或在顺序、共置或 rsc_ticket 约束中引用。要引用资源模板,请使用 @ 符号:( K' N$ G q, @, G2 N
/ s% A: ?4 m0 ^1 Q( C# l9 l/ Hprimitive MyVM1 @BigVM \' ^" Q( c/ F, y! X1 j
params xmfile="/etc/xen/shared-vm/MyVM1" name="MyVM1"
2 T/ O: m: k# g- ]; wCOPY* N( M( S4 M* Q7 ~0 N
新的原始资源 MyVM1 将继承 BigVM 资源模板中的所有配置。例如,上述两者的等效配置有:0 L, N, `' ?4 m* I5 _
# o! y$ T- }' w' `; mprimitive MyVM1 ocf:heartbeat:Xen \3 q/ K$ e0 @; m
params xmfile="/etc/xen/shared-vm/MyVM1" name="MyVM1" \7 ~1 y& ^# r, v _! t
params allow_mem_management="true" \7 d8 F! _& @, r e( }2 \. `* ?
op monitor timeout=60s interval=15s \
8 ~% q( q& z* r5 }3 t; I4 ? op stop timeout=10m \2 R8 k2 i' T( X7 L6 S r# ?
op start timeout=10m/ b& ?3 j) p; K# W/ y& \* D0 V" t
COPY
* `" _0 V7 u( C0 L A* C# P如果希望重写一些选项或操作,只需将它们添加到您的(原始)定义中。例如,下面这个新的原始资源 MyVM2 会让监视操作的超时增加一倍,而其他值保持不变:
% Q L; W' a ` a
' f# f9 t Z) W* H7 A0 d( O Zprimitive MyVM2 @BigVM \
7 s9 R* ?9 d% X4 T# n3 N params xmfile="/etc/xen/shared-vm/MyVM2" name="MyVM2" \
Z9 G) ]% T2 l3 l) } op monitor timeout=120s interval=30s
2 n% e5 E2 C% e6 h- c: KCOPY' P g. c1 T0 S, n! E$ B2 a
资源模板可以在约束中引用,以表示所有原始资源都派生自该模板。这有助于生成更加清晰明了的群集配置。除了位置约束外,允许在所有约束中进行资源模板引用。共置约束不能包含多次模板引用。/ I5 a @4 x2 ]. k1 N9 ~
3 q% r* t8 E9 z6 R6 t
8.3.4 创建 STONITH 资源 #) q+ V5 D3 U& X8 u& y) p7 ]7 W
就 crm 而言,STONITH 设备只是另一种资源。要创建 STONITH 资源,请执行以下操作:/ P0 p4 A( q( v% X- A* z
, r9 h' {* {5 e2 F以 root 用户身份登录,然后启动 crm 交互式外壳:" z- l: T/ V. I" ?* P
) l* \5 j) T. ?( J
crm configure
0 }+ ~: b& w; ~2 Y# L1 aCOPY- @1 D. w- O+ e4 P! u# P
使用以下命令获取所有 STONITH 类型的列表:+ K3 H% D2 t- ^
3 Q: `8 [7 \; K/ s$ t+ l2 ]
ra list stonith1 l% K( P4 D" }7 O: d2 Y5 K) s
apcmaster apcmastersnmp apcsmart
2 T5 ?2 e; W. x5 Z. k' Ubaytech bladehpi cyclades* ]" `1 g, g( t
drac3 external/drac5 external/dracmc-telnet
: ~. n4 v1 P e( V7 G5 |external/hetzner external/hmchttp external/ibmrsa
; ]5 b% g- F0 texternal/ibmrsa-telnet external/ipmi external/ippower9258
9 T- e, n0 m+ Q0 i3 cexternal/kdumpcheck external/libvirt external/nut
5 h% `7 q0 b: m9 eexternal/rackpdu external/riloe external/sbd/ h" i0 j8 V: h. Y* ?( J# _% J, h
external/vcenter external/vmware external/xen0
A. Y& \8 \! P: \- @& ?2 oexternal/xen0-ha fence_legacy ibmhmc) r9 c' }3 T1 @& [
ipmilan meatware nw_rpc100s
4 f0 ~( e" d$ d/ [6 d6 W( l* Hrcd_serial rps10 suicide
8 D: \$ _5 Q; D$ J) o3 q" [3 Awti_mpc wti_nps
. f1 F. X9 r* y! P" r- X; D5 g; SCOPY7 A6 |& z- ]2 ?* q' t
从以上列表中选择 STONITH 类型并查看可用的选项列表。使用以下命令:
& d+ b8 t2 r3 R2 M( V8 R9 x+ w6 c
ra info stonith:external/ipmi/ a7 l! [ R& e9 `2 k
IPMI STONITH external device (stonith:external/ipmi)# O$ B. w3 z b6 S5 D' p, D% R' \
0 x o& n2 K8 i+ S' a5 a2 gipmitool based power management. Apparently, the power off
/ ]! ?+ a1 h4 ~* X7 `3 \( S; P% u6 C8 emethod of ipmitool is intercepted by ACPI which then makes
9 M$ E7 w* v4 ?! |' Ea regular shutdown. If case of a split brain on a two-node
8 X; {! `0 [+ `% \5 cit may happen that no node survives. For two-node clusters; A9 ~0 S- Z9 A. n
use only the reset method.* {' |, E* k) R% s. X* g! @
- Y- r( C5 `- J" o3 }% h( A( }: `+ WParameters (* denotes required, [] the default):" t" v9 P) q" [" Q
' z2 E( F9 `' ~hostname (string): Hostname
5 |5 f3 H' M3 ` The name of the host to be managed by this STONITH device. ~! ?4 y6 p; n& g* H. a) p: M+ a
...+ ?6 q8 O5 h7 f& ?6 v
COPY5 E$ i/ {! B l
使用 stonith 类(您在步骤 3 中选择的类型)和相应的参数(如果需要)创建 STONITH 资源,例如:
+ e8 }: w3 q" Y" k7 N7 g2 Y$ g$ n3 G
configure
/ c8 `. v0 n2 x& @1 N1 K! o5 C' Mprimitive my-stonith stonith:external/ipmi \* a) B8 J( K& b# V# q2 F/ t
params hostname="alice" \
% [- B7 y6 c" G) O! e; [; L ipaddr="192.168.1.221" \3 y% M7 u8 @! p" f% d% F
userid="admin" passwd="secret" \
9 B4 x3 ?" c) t0 ~ op monitor interval=60m timeout=120s
7 J' Z- [- }4 O- F/ P& s0 n' oCOPY
- I; U0 o% }) a- u) ]! a8.3.5 配置资源约束 #4 S) G0 v& K2 d. V% }
配置所有资源只是任务的一部分。即使群集了解所有需要的资源,它仍然不能正确处理它们。例如,尽量不要在 DRBD 的从属节点上装入文件系统(事实上,这将导致 DRBD 出现故障)。定义约束以使这些信息可用于群集。' H2 P! p- C; a/ s& G+ n, k
2 A( S. H! D# Z8 z
有关约束的更多信息,请参见第 6.5 节 “资源约束”。
9 m; i4 y8 k% s5 {2 ]2 [; s9 l" z7 U# H, k# K$ b! M# Q
8.3.5.1 位置约束 #
& c6 p8 b. R' `location 命令定义资源可以、不可以或首选在哪些节点上运行。
0 h4 d- o$ R) o" A$ C
# S0 ?! Z6 y: o4 j# c4 \2 M$ E% w每个资源可多次添加此类约束。对于给定资源,将评估所有 location 约束。下面是个简单的示例,它将首选在名为 alice 的节点上运行资源 fs1 的值设置为 100:) ?3 O; |, G, B! g/ s
) [" u5 f2 N! q) n, h; {3 {0 H. Q
location loc-fs1 fs1 100: alice
' t7 g8 Y p* N& [2 ~COPY
, R/ Y# w+ t Y+ a/ s P. H另一个示例是使用 pingd 的位置:5 M6 }$ e; n, e0 ~% Z8 ~# ~4 f& H7 F4 P/ a
+ ~- K; b$ ?7 ~9 } ]
primitive pingd pingd \- c, m( G7 y$ J8 S, g. ~ h
params name=pingd dampen=5s multiplier=100 host_list="r1 r2"% R2 ^ |: _. b3 R) A% x0 u
location loc-node_pref internal_www \
# v! u$ V9 j9 F6 |+ G9 u9 C5 [, I rule 50: #uname eq alice \9 u0 H5 |: X; x. D* f- t! z
rule pingd: defined pingd5 V( O2 u$ f' N5 E" G% R/ d
COPY
4 ?9 ~5 F# ~0 R位置约束的另一个用例是将基元资源分组为资源集。例如,如果多个资源依赖于 ping 属性来进行网络连接,则此功能会十分有用。以前,需要在配置中复制 -inf/ping 规则数次,因此不必要地增加了复杂性。
8 A* w8 C8 E0 T0 m8 l, O
, [/ ?, e1 ^- N. Y) B以下示例将创建资源集 loc-alice,该资源集引用虚拟 IP 地址 vip1 和 vip2:
& P+ K7 z4 D( j- k- B, D j: h) V( V. g; w2 s# b5 D
primitive vip1 ocf:heartbeat:IPaddr2 params ip=192.168.1.5
+ ?# W- d& V! L* A: y0 W: J9 Qprimitive vip2 ocf:heartbeat:IPaddr2 params ip=192.168.1.6* l! I" t) C. l! b+ e
location loc-alice { vip1 vip2 } inf: alice
8 w7 C& f) l4 D9 n% g# TCOPY* a2 m/ @; k2 o# J* o A! }
在某些情况下,为 location 命令使用资源模式会有效且方便得多。资源模式是用两个斜杠括起的正则表达式。例如,可以使用以下命令全部匹配上述虚拟 IP 地址:& n4 Q/ H2 q# i8 c
$ u1 c" c' N. |location loc-alice /vip.*/ inf: alice% x7 @) O" M2 q- v" `
COPY
- X3 j6 c& W) h& u8.3.5.2 共置约束 #
+ Y/ J, @5 G( z! i: H7 Tcolocation 命令用于定义哪些资源应在相同主机上运行,哪些资源应在不同主机上运行。
4 ~8 U9 S9 b% z! W
4 j; L# X. u9 ^$ R9 J/ C9 R2 e只能设置 +inf 或 -inf 的分数,定义必须始终或不得在相同节点上运行的资源。还可以使用有限分数。在这种情况下,共置将称为建议,群集可决定不遵循它们,从而在出现冲突时不停止其他资源。
{- [: y/ W0 m8 a4 ~$ A0 T& J- N+ r$ t1 u+ I
例如,要始终在同一个主机上运行 ID 为 filesystem_resource 和 nfs_group 的两个资源,可使用以下约束:! z8 j* j5 U% v9 O3 e
1 |! t9 q# ]5 b* }/ q0 S, m+ S
colocation nfs_on_filesystem inf: nfs_group filesystem_resource
) R' x1 [5 A% T0 G) e! ?. m ICOPY$ d# J+ {1 S6 G2 `' _6 F+ K
对于主从属配置,除在本地运行资源以外,还有必要了解当前节点是否为主节点。
5 E4 h4 F, q* m9 ]# R+ F& V2 r7 [/ r$ }' |! f8 f- d0 d0 i
8.3.5.3 共置没有依赖性的资源集 #
& F2 [1 W% X9 P) w8 x有时,将一组资源放置在同一个节点上(定义共置约束)会很有用,但前提是这些资源之间不存在硬依赖性。' L* \$ g# y' a |5 M
2 Q( g1 U4 U) M. y如果您想要将多个资源放置在同一个节点上,但不想疲于应对每一个资源的故障,那么,您可以使用命令 weak-bond。
5 u- X3 G2 ~. n3 q% w1 g3 f! b
& q4 o' I* ]) |; dcrm configure assist weak-bond RES1 RES23 C7 ^; ?; `0 x
COPY# _- |% W2 w. k5 D$ O. l
weak-bond 的实施将使用给定的资源自动创建虚设资源和共置约束。; u5 i# B! Y3 s5 W6 \, h, J6 a
" G* J7 j6 h" G# V% i
8.3.5.4 顺序约束 #/ H1 e3 i* l' J
order 命令定义操作顺序。9 _$ Q( s; E. X6 v' O
! m& R: H) `3 u+ O5 c; B& T有时必需提供资源操作顺序。例如,在设备可用于系统之前,您不能装入文件系统。使用顺序约束可在另一个资源满足某个特殊条件之前或之后启动或停止某项服务,如已启动、已停止或已升级到主资源。0 u/ z U8 d' j4 O! L! O4 \! ~/ n. q
j6 u1 Z2 U# V P; k& S, O
在 crm 外壳中使用以下命令配置顺序约束:, ?" H% j: ~0 H- e" m" }0 g
% _% u+ v2 v4 J1 _' P: h
order nfs_after_filesystem mandatory: filesystem_resource nfs_group0 U1 x& i( G7 T2 ]5 A% C& D8 J
COPY
; e {" q6 q2 J$ ?' N8.3.5.5 示例配置约束 #3 i2 @$ V! P. g
本节中使用的示例必须与其他约束结合使用。其中最基本的就是让所有资源与 DRBD 资源的主资源在同一台计算机上运行。在启动其他资源前,DRBD 资源必须是主资源。在 DRBD 设备不是主资源时尝试装入 DRBD 只会失败。必须实现以下约束:; m$ N- i5 z8 \
% h2 d j+ U: A+ z文件系统必须始终与 DRBD 资源的主资源位于同一节点上。
. E9 B8 w9 f- z% m- M* H& s6 F/ z
colocation filesystem_on_master inf: \
; |: @" h: N7 j9 |1 Q8 H filesystem_resource drbd_resource:Master
- ^% P6 T( J4 [1 W% u2 QCOPY' x; ]" ~. s X$ u
NFS 服务器及 IP 地址必须与文件系统位于相同的节点上。
% y: I( J8 a8 s, O3 p9 I' x( I% {* B7 `' v$ D
colocation nfs_with_fs inf: \4 W! w! O; r) {3 {
nfs_group filesystem_resource
+ Y+ e# G: ?8 z$ `' e$ ~ wCOPY
; B- C0 y) M9 G- S) [NFS 服务器及 IP 地址在装入文件系统后启动:3 n0 A' | L0 b+ G) ~
/ U( J3 `8 \/ ^) `order nfs_second mandatory: \9 A$ i) m a9 a5 [( A+ E) T4 F
filesystem_resource:start nfs_group
h* J) B' t; H: E8 f1 o; |2 U# NCOPY
! t* N% _) _; m9 F4 _6 H必须在 DRBD 资源提升为节点上的主资源后才能在此节点上装入文件系统。
3 ?) k# ` \; n1 Y0 S4 {
, W1 x3 ~3 S1 i3 W3 Q2 F' forder drbd_first inf: \% i- A3 x0 n3 S! a4 V+ ]& |, |
drbd_resource:promote filesystem_resource:start! V, Y$ `- r+ a7 c- N2 D# H
COPY
0 j$ Q' h) |6 [" n) P3 g N8.3.6 指定资源故障转移节点 #8 o! A) m1 [2 K6 P9 M# e
要确定资源故障转移,可使用元属性 migration-threshold。如果所有节点上的故障计数超过 migration-threshold,资源将处于停止状态。例如:
" F( d* Z% b# @% E5 f7 w8 L1 p$ o# ?
location rsc1-alice rsc1 100: alice" N9 B! p* G* c) x6 |" F
COPY7 T% ?+ Z# m: G3 T
通常,rsc1 首选在 alice 上运行。如果失败,将检查 migration-threshold 并与将它与故障计数进行比较。如果故障计数 >= migration-threshold,则会将该资源迁移到具有下一个最佳自选设置的节点。. D- k X* u5 X4 C g
0 L( L! t: o8 @7 o
根据 start-failure-is-fatal 选项,启动失败会将失败计数设置为 inf。停止故障可导致屏蔽。如果未定义 STONITH,将不会迁移资源。
) z& t5 o; v9 G. g L6 k" v( i9 I% m+ \) a
有关概述,请参见第 6.5.4 节 “故障转移节点”。2 L8 t& U) I# f0 c$ m( A0 i* U
" c7 q) A1 F' r) }0 I8.3.7 指定资源故障回复节点(资源粘性) #
3 r5 u& _# i k' w当原始节点恢复联机并位于群集中时,资源可能会故障回复到该节点。为防止资源故障回复到之前运行它的节点,或者要指定让该资源故障回复到其他节点,请更改其资源粘性值。可以在创建资源时或之后指定资源粘性。5 b. \% I% C* |& A
9 K: L# K3 D1 @% u" K1 e有关概述,请参见第 6.5.5 节 “故障回复节点”。
3 g1 x$ S- o0 l+ `% s% J: t8 G+ U, v6 h3 s
8.3.8 根据负载影响配置资源放置 #* K& z2 U/ D2 ]5 ?
某些资源可能具有特定的容量要求,如最低内存量。如果无法满足要求,资源可能无法完全启动或运行时性能下降。
7 A6 E5 l3 C9 B: n) ]4 I3 q6 F/ s6 V0 @7 w5 \6 w! N. Y2 t2 i
要考虑此情况,可使用 High Availability Extension 指定以下参数:
# B! X1 B9 F" c
5 k' O* U) C2 l) y' D. p4 q特定节点提供的容量。
$ u7 O. R2 u6 e3 k4 [7 U2 v& M% \7 |4 x" F1 Z* Q8 Y$ \6 e8 o
特定资源需要的容量。
6 W) g( ]$ S$ a9 u6 }( i# o
+ b! \' s E: u8 E/ [% a& U资源放置整体策略。( n" H9 E6 J7 v% Q9 n1 x- c
3 z U; x3 w6 @ X8 ]
有关参数的详细背景信息和配置示例,请参见第 6.5.6 节 “根据资源负载影响放置资源”。
+ l# n3 G* w+ n' P+ S/ L0 z4 u) u' f+ a d' d1 ^+ ]! R+ N/ n/ L* g3 |
要配置资源要求和节点提供的容量,请使用利用率属性。可根据个人喜好命名利用率属性,并根据配置需要定义多个名称/值对。在某些情况下,某些代理(例如 VirtualDomain)将自行更新利用率。
' T! f% `3 ~. a. H; r7 ?& h( `
# g5 C8 ] Q3 z! y; k! z2 @& v在下例中,我们假定您已有群集节点和资源的基本配置,现在想要配置特定节点提供的容量以及特定资源需要的容量。
4 @3 W+ v0 a0 G( d
! v/ A- ]. C( C! M- X, D1 d* s过程 8.1︰ 使用 crm 添加或修改利用率属性 #
; _, b5 M a3 K3 S以 root 用户身份登录,然后启动 crm 交互式外壳:
) X0 x8 a. t- G% p
( S6 w1 ?& y( T$ v, t+ q8 q4 ]crm configure
, f* E' y6 m; j5 zCOPY
t1 s9 f# X. V5 H要指定节点提供的容量,请使用以下命令并将占位符 NODE_1 替换为节点名称:4 x1 r Z4 F8 b: R. |
8 \& h- @4 n5 v8 j
node NODE_1 utilization memory=16384 cpu=8! Z5 f8 v9 M8 \5 [: i
COPY) B4 a% _3 d5 N3 T
上例中的这些值将假定 NODE_1 向资源提供 16 GB 内存和 8 个 CPU 核心。6 ]( d8 e3 p' R& R6 e* w% v: ?
! H; n4 I( ^5 L2 v' G4 D
要指定资源需要的容量,请使用:
5 f" ?0 @1 K d& Y$ C0 n
* G6 u5 g2 J7 M7 V' ]0 eprimitive xen1 ocf:heartbeat:Xen ... \
" K: V( `7 Y" n( r/ W utilization memory=4096 cpu=4
7 Y/ Q. g4 m/ c/ v- k% vCOPY
7 C$ ?7 n$ S2 _% x6 M这会使资源消耗 NODE_1 的 4096 个内存单元以及 4 个 CPU 单元。
) ~/ r* v0 p6 s. i
1 N, ?2 }) Z P) x使用 property 命令配置放置策略:
2 i, F! U/ t' r4 J; m9 p# r& V% t& o
property ...
3 V8 V( v% Z2 C* l& |1 H: b4 NCOPY
" j$ ~9 Q) j- W8 R( V0 F可用值如下:
: ]7 t/ }( i' z2 ]0 s) w0 C2 [/ D$ ^6 s" G* a. ]. O
default(默认值)) ?8 g- {, k" ?, l3 W
不考虑利用率值。根据位置得分分配资源。如果分数相等,资源将均匀分布在节点中。
# G" b! w: z" K3 D" O# J
8 X8 b7 \6 F6 n3 o* U' putilization9 Q& z& t2 m4 H1 I
在确定节点是否有足够的可用容量来满足资源要求时考虑利用率值。但仍会根据分配给节点的资源数执行负载平衡。
S( ~, C/ P. n- ^) N( V! q$ z
# t5 ?! Q9 l* `9 d+ D- xminimal# F) z, w3 {+ I/ s7 h
在确定节点是否有足够的可用容量来满足资源要求时考虑利用率值。尝试将资源集中到尽可能少的节点上(以节省其余节点上的能耗)。
, U/ D% A; D9 H* l. E
$ w7 |* ?2 |8 [- \" m8 K1 Z9 }$ J. Abalanced
K7 V6 X: Z$ N' a" h0 E在确定节点是否有足够的可用容量来满足资源要求时考虑利用率值。尝试均匀分布资源,从而优化资源性能。" D7 E+ n' t# {! ~$ c6 T. h
" z7 G$ O1 }& S6 G( l O注意注意:配置资源优先级' d( l5 P: @' H6 B( V1 D) k5 Z
可用的放置策略是最佳方法 - 它们不使用复杂的启发式解析程序即可始终实现最佳分配结果。确保正确设置资源优先级,以便首选调度最重要的资源。
* \9 c7 c" P- v' d4 |
( ^- }- f W0 I1 n% D7 t0 z退出 crmsh 之前提交更改:
0 g3 {$ Q7 E( V* s8 s6 s: k& M0 b- x8 q& g9 u
commit: F, v5 T3 o+ Z
COPY3 f" |6 w0 l/ E: t$ {, H6 u
以下示例演示了配有四台虚拟机、节点数相等的三节点群集:
8 B) B* c) O3 {1 M/ T' C" \9 a& A' D+ u4 O) ?
node alice utilization memory="4000"# V4 f7 e! x5 Q! b7 m0 A0 S
node bob utilization memory="4000"
& o$ ~4 _. I2 u7 H; F8 d3 }/ vnode charlie utilization memory="4000"
8 H! M1 U2 O7 X+ @. v0 A6 Aprimitive xenA ocf:heartbeat:Xen \
8 Y; l) g# {0 Y. K utilization hv_memory="3500" meta priority="10" \7 }5 j9 i6 M2 h6 Y
params xmfile="/etc/xen/shared-vm/vm1"" M k+ Y3 r& k0 r
primitive xenB ocf:heartbeat:Xen \' ?0 b: A% s# K3 W, z ]* L
utilization hv_memory="2000" meta priority="1" \0 h3 I' [7 K2 q+ f
params xmfile="/etc/xen/shared-vm/vm2"
3 X" t+ ^4 b; I( C6 H+ i& Sprimitive xenC ocf:heartbeat:Xen \! g. Y( N* q' W1 t0 a5 p
utilization hv_memory="2000" meta priority="1" \
, P+ G9 v# o( V params xmfile="/etc/xen/shared-vm/vm3"; q8 A3 i& n. C, K. j/ l4 @5 U
primitive xenD ocf:heartbeat:Xen \
2 u' S R9 ^" Q# E I1 J utilization hv_memory="1000" meta priority="5" \3 \* h8 j( E& k0 f
params xmfile="/etc/xen/shared-vm/vm4"
: t% s ~6 ~: [6 T; q3 Dproperty placement-strategy="minimal"
/ N/ G$ m' z4 ?( o" W2 ZCOPY
& y2 I2 I& V. R# x2 C如果三个节点都处于正常状态,那么 xenA 将首先放置到一个节点上,然后是 xenD。xenB 和 xenC 将分配在一起或者其中一个与 xenD 分配在一起。( i' w2 E2 a1 W% o. i3 U0 C. K) [# p
4 r3 D" U$ z% h2 O如果一个节点出现故障,可用的总内存将不足以托管所有资源。将确保分配 xenA,xenD 也同样如此。但是,只能再分配 xenB 和 xenC 中的一个,由于它们的优先级相同,结果不确定。要解决这种不确定性,需要为其中一个资源设置更高的优先级。
3 F' S5 w7 T# h7 c5 m2 g5 r' W' H- G. {; n% a- I0 I1 P
8.3.9 配置资源监视 #/ N: m8 k4 w4 b
要监视资源,有两种可能性:使用 op 关键字或 monitor 命令定义监视操作。以下示例使用 op 关键字配置 Apache 资源并且每 60 分钟监视一次:% r6 {. H7 w; z2 B* b3 P: |1 {4 `
+ R) ~. O1 d/ l/ ?5 F( s5 Y& x( p
primitive apache apache \
7 q9 L; q8 R: {+ u params ... \
1 E5 K. Y1 @8 {/ b8 ^$ W& ]5 m op monitor interval=60s timeout=30s7 u; J4 Z5 H3 P! U K2 a; G
COPY5 p7 p* f: W0 K4 A# w2 e3 V O
同样也可以使用以下方式来实现:
3 l, ^: D Q6 z. F4 E# y/ K+ }8 T1 v0 X3 M8 k, {+ P/ E2 j" J
primitive apache apache \
2 g' q* Y: X! D params ...
5 u+ Q) c2 X. g2 `) ?4 Ymonitor apache 60s:30s% {# E7 k6 k% u' T
COPY0 K! g# R) Z) S1 j
有关概述,请参见第 6.4 节 “资源监视”。
5 t) s' X# y+ E; T' s6 ?( s Q6 s z4 t( c, a) A* L' `
8.3.10 配置群集资源组 #- |/ U0 m- q; h( E; A/ @
群集的一个最常见元素是需要放置在一起的一组资源。按顺序启动,并按相反顺序停止。为了简化此配置,我们支持组的概念。以下示例创建了两个原始资源(一个 IP 地址和一个电子邮件资源):- b; h# ~+ O& O$ k
' @+ L/ C* q$ F- X7 D- Y
以系统管理员的身份运行 crm 命令。提示符更改为 crm(live)。
' W: E7 E' Q. W' b9 E4 r3 r6 }1 S( |- U- g+ F7 I
配置这两个原始资源:
/ ~3 ?& K7 v+ z. _
4 `* J- C2 l/ u, Y2 c+ x) kconfigure
6 m% l& `4 o3 `3 L% \) W( Yprimitive Public-IP ocf:heartbeat:IPaddr \) y, |) a3 m7 [4 S) S3 k ]
params ip=1.2.3.4 id= Public-IP
- ]2 d' ~4 W1 @, ?( h+ Uprimitive Email systemd:postfix \
& J( l5 d9 M2 b( a/ f H6 f7 l8 R6 D/ E params id=Email
: K, C2 o4 O# D9 y, N% SCOPY, v3 z+ `+ [. J1 }% B0 m
以正确顺序按其相关标识符对原始资源进行分组:
' ]+ Y1 _4 a+ @8 H. ~
4 d7 R% A3 W/ Ngroup g-mailsvc Public-IP Email
' H; ~% L& ?! f' O. A: k3 SCOPY! i7 g1 v" H6 Q, b9 U+ m B# b
要更改组成员的顺序,请使用 configure 子命令中的 modgroup 命令。使用以下命令可将原来的 Email 移到 Public-IP 前面。(只供展示功能之用):1 s! p* @: b$ E5 c. i0 f
9 _4 I) s6 D& Y- i. g) jmodgroup g-mailsvc add Email before Public-IP
* F L! C- e2 n! bCOPY* P; @0 n% M6 k6 D
如果您要从某个组去除资源(例如 Email),则使用以下命令:
. {0 D: |1 x. K: Y& ^& t# M( y4 u S1 q% B
b6 J6 K- b% G Omodgroup g-mailsvc remove Email
7 {* F5 m& X0 K; Z5 o! lCOPY
& \+ }( u" g( q+ @$ M1 X/ F' R& O有关概述,请参见第 6.3.5.1 节 “组”。7 N% p, h4 Q3 K* P6 Y& X$ B% x
1 n$ a* P" ?' s/ \, w, x3 b
8.3.11 配置克隆资源 #
* A! B4 B+ G1 X* f最初将克隆构想成便于启动一个 IP 地址的 N 个实例并使它们分布在群集各处以保持负载平衡的一种方法。事实证明,它们可用于多种用途,包括与 DLM 集成、屏蔽子系统和 OCFS2。您可以克隆资源代理支持的任何资源。1 \8 I8 b# ~. z: c" W% ~
6 Q7 o( e: L4 F8 }要了解有关克隆资源的更多信息,请参见第 6.3.5.2 节 “克隆资源”。! M# f; E, X: ]; \ [3 r' M
( f& p |; Z$ ?
8.3.11.1 创建匿名克隆资源 #3 p; r/ M! p% \2 R: q2 b8 Y
要创建匿名克隆资源,首先要创建一个原始资源,然后使用 clone 命令来引用它。执行下列操作:
e/ T `) \8 T3 F( V& Q. r0 J+ ^6 ^
以 root 用户身份登录,然后启动 crm 交互式外壳:
6 f4 `) n' c( n+ R9 Y9 C% n8 I% V7 ~: h" }; J- O
crm configure, \0 [3 h8 h. @5 _/ j
COPY5 c1 z# X1 e; w/ e5 p5 t
配置原始资源,例如:
8 S H, N% b" Z9 o" K$ K3 N: Y" M3 K5 |6 p! X( r: J ]
primitive Apache ocf:heartbeat:apache
8 ~7 b& ~5 H& MCOPY
: v0 |+ C* ~7 I: D0 L) J克隆原始资源:) a" Z2 W' w9 N+ h7 I
1 m3 Q( q' I) l! a+ g0 c" F
clone cl-apache Apache
" U' j0 y ?0 g. b1 H% wCOPY, ?6 q% [( i. ^2 q5 _
8.3.11.2 创建可升级克隆资源 #. B8 G* w; n! ^
可升级克隆资源(以前称为多状态资源)是一种特殊的克隆。此类型允许实例处于两种运行模式中的其中一种,可以是主动/被动、主要/次要或主/从模式。
3 F6 d0 B2 j+ w$ T+ A7 G; o! h9 K' j1 I$ o/ G! \' p( A
要创建可升级克隆资源,首先要创建一个原始资源,然后再创建可升级克隆资源。可升级克隆资源必须至少支持升级和降级操作。
# X4 M* _* {# J ^: i; B5 T& Z5 W
以 root 用户身份登录,然后启动 crm 交互式外壳:& b. y e$ w7 C
0 o7 X% Q ^1 b* h
crm configure8 N- q# Y! A+ k2 J$ S* I$ ~. F
COPY
y/ I1 F% F8 L- a8 b9 J2 C配置原始资源。必要时更改时间间隔:+ P5 A6 j' x3 y* J- K
9 t4 y3 f2 }8 m9 F. B) R# y9 B
primitive my-rsc ocf:myCorp:myAppl \( g% g/ j3 `) A; m
op monitor interval=60 \+ h1 ~6 ~3 h( y5 Y1 M- F
op monitor interval=61 role=Master
! p- R7 T! e# r! f2 d6 ICOPY
( w( x, a4 c. {. B# j/ Z创建可升级克隆资源:2 ~$ {! o9 a# t, y, l
8 H+ w4 ^- e. }/ H& ?0 D/ ]7 R
ms ms-rsc my-rsc
' U' D. [1 \; a( I( m+ o( m% v/ gCOPY
! Z+ ?$ c* z$ B8.4 管理群集资源 #
8 ~. p# z% D7 e# h: J除可用于配置群集资源外,crm 工具还可用于管理现有资源。以下小节进行了概述。
. M! M; `0 j5 i/ x# X# f. E
) s7 Q+ y; a" t8.4.1 显示群集资源 #( s. j5 y% Z0 P/ {4 I- t
当管理群集时,crm configure show 命令会列出诸如群集配置、全局选项、原始资源及其他的当前 CIB 对象:
8 z6 Q+ B/ x0 T3 U( u; F g. k8 N" Z; R7 a/ i8 b; Q0 v N
crm configure show6 O$ R" M4 Y$ X f- j* L$ y5 Q ~
node 178326192: alice/ x- S3 h5 G8 y( i; Y( c+ ?7 P
node 178326448: bob7 U2 @ p' X( F( @4 l& Y; o- E" m
primitive admin_addr IPaddr2 \8 {- O) v3 V: w; G0 d/ w/ D
params ip=192.168.2.1 \: s" ], k2 h$ d1 E3 r
op monitor interval=10 timeout=20
' k0 x+ x) ]" P& {$ I- Tprimitive stonith-sbd stonith:external/sbd \) p/ l1 ~ r# Y Z- I: P* c
params pcmk_delay_max=30
" b. F& `" k8 w' r5 e& eproperty cib-bootstrap-options: \: @2 t3 `6 b5 |5 c" ^% A0 y
have-watchdog=true \
9 D. q6 k, ?4 a; d dc-version=1.1.15-17.1-e174ec8 \
5 `6 G, a( o/ @7 F2 U/ | cluster-infrastructure=corosync \
, z; P. p% n: o/ q- i2 {5 m cluster-name=hacluster \* M8 l7 f0 |5 A6 {: l
stonith-enabled=true \- F! @1 L. w+ s' f* p9 Q
placement-strategy=balanced \/ ^- N- M5 Q% o# O7 x6 Y! L3 Y
standby-mode=true- \ t+ |0 w! T" d9 T
rsc_defaults rsc-options: \
! n- Q9 r2 q5 V# f3 k! u resource-stickiness=1 \
7 n1 I) I& u- L5 J. l2 G! N migration-threshold=3
4 h* D+ S2 \- v% Q. k! Vop_defaults op-options: \
! R9 f( e) F# X; b" {# z2 M timeout=600 \4 T( F7 c& O! y# S
record-pending=true/ l( ]1 s0 h% _( u+ R+ Q
COPY
1 T Y4 K8 e( x0 j, |2 f. L如果您有许多资源,show 的输出会十分冗长。为限制输出,请使用资源名称。例如,如果只想列出原始资源 admin_addr 的属性,请将资源名称追加到 show 后:
% u) B0 M: w/ R! k- e
, G- P e5 U8 Z9 `1 kcrm configure show admin_addr
0 b: F* T( y2 s5 c8 s- r1 Xprimitive admin_addr IPaddr2 \
6 f5 \0 V9 C3 N% o' J: g% [ ?' g params ip=192.168.2.1 \0 p' h4 n4 O4 c5 T5 C. d
op monitor interval=10 timeout=20; j+ n# p/ g8 [4 R7 Y
COPY
' ?- l+ _) b. u! s/ n) J但在某些情况下,您可能希望更精确地限制特定资源的输出。那么,您可以使用过滤器。过滤器可将输出限定到特定组件。例如,要想仅列出节点,可使用 type:node:
+ e" ], L- @6 l4 k* `" M1 t2 z7 D) F# O+ U5 T' E0 ~
crm configure show type:node* w1 q. t* Y; ]' D4 ~$ r1 v
node 178326192: alice
% |7 O8 l& c! e$ u/ u5 o( q) hnode 178326448: bob
' N6 _ q& c! @1 f. uCOPY' _0 i! X1 V' p0 r/ N) T/ {7 a
如果您还对原始资源感兴趣,请使用 or 运算符:
& C, I* j) j3 }- W' |- I$ j7 W
. w N4 s* g$ acrm configure show type:node or type:primitive
6 P9 G# ]3 Y4 e+ m& ~# `node 178326192: alice3 G$ [+ A; [- j; Z- R% L
node 178326448: bob9 k3 |# P2 k0 F- l- k3 R
primitive admin_addr IPaddr2 \
! V1 F" {' P; T) G( j params ip=192.168.2.1 \
" p* m% h0 Y/ ~, Y; {& O+ N+ j op monitor interval=10 timeout=20
: `9 z# I( F0 gprimitive stonith-sbd stonith:external/sbd \
2 e, ]6 P) g4 F" @& U# \. B+ {! E params pcmk_delay_max=30$ p2 x: Y( w2 h7 \ |( |/ E
COPY( f4 _& [% x; M& W" Q
此外,要搜索以特定字符串开头的对象,请使用以下表示法:3 a& Z& K+ d8 M
6 j" X3 F$ t: K6 w4 c
crm configure show type:primitive and and 'admin*'! o" Y5 E! J, S' W8 {2 ]2 E' d6 a
primitive admin_addr IPaddr2 \
5 j3 ]6 u/ @( v- ^ params ip=192.168.2.1 \
6 C8 i* h$ m) H3 Q/ A# i' j- a+ A op monitor interval=10 timeout=20
% A3 ~; k$ ^/ _: S) rCOPY
) `+ E2 K. L+ q7 Q6 g2 F+ C要列出所有可用类型,请输入 crm configure show type: 并按 →| 键。Bash 补全会为您提供所有类型的列表。) e, }2 B3 ^ G+ l+ A5 ]. U$ o% s
4 P2 Z" o3 w# N Q: {8.4.2 启动新的群集资源 #
, D0 D( p/ z8 G% {要启动新的群集资源,您需要相应的标识符。按如下所示继续:0 Q$ K$ F1 e9 t
$ ~3 q6 R/ [3 \ y, { v
以 root 用户身份登录,然后启动 crm 交互式外壳:/ S6 z8 {+ e2 F
' d3 {6 I# \& o
crm
5 F. n$ d& L+ y0 HCOPY& [+ T+ h" t$ h/ x: `5 M. `2 B
切换到资源级别:
+ t: [; @* D. u. K. V4 o9 w" V6 g4 `$ u, b* ~1 ], g4 O& ^
resource
; s4 b7 R. v. W, O. d; RCOPY( W* v: W+ I+ K0 H4 u
使用 start 启动资源,然后按 →| 键显示所有已知资源:
8 n+ @* M0 f6 Q/ a, L
5 a& W, d9 @* r" B4 P* zstart ID
9 H, h/ U# t/ x# m4 RCOPY/ H* F& [& z7 G, o+ b' m
8.4.3 清理资源 #6 z7 w; \# [; C1 o2 B- q; v
如果资源失败,它会自动重启动,但每次失败都会增加资源的失败计数。如果为资源设置了 migration-threshold,当故障计数达到该迁移阈值时,将不再允许节点运行该资源。4 M, R5 r' Y* ^# s) Q# T
, A5 d2 k% k, P$ j A* Z; m打开外壳并以 root 用户身份登录。
4 P6 u( \% \" c; Q4 }; j/ ~, ~3 ]) |0 [: |6 ]* A6 u" q4 L' {
获取所有资源的列表。- f8 D% U7 J$ c1 B
* b! M2 B @6 t- k
crm resource list* F' j5 r, f$ w* g$ C: \
..., V9 L: P3 J& ]/ P& K* ]5 |
Resource Group: dlm-clvm:1: U$ @) `: c2 U: r
dlm:1 (ocf:pacemaker:controld) Started
1 T& d" l+ W! |: G, q8 e clvm:1 (ocf:heartbeat:clvm) Started
) K% L$ T/ f/ e: w3 ^, s2 g8 [3 hCOPY7 Y/ U( O. I! h4 e
例如,要清理资源 dlm,请执行以下操作:- o. \+ C% C$ o! R7 v0 }+ L
$ R1 I1 o$ A) g8 Ocrm resource cleanup dlm$ A* i" R7 k/ E( ^" {* a* A% Y
COPY
$ e6 h6 m# _) A) k4 u/ i6 J8.4.4 删除群集资源 #
I! k$ k- v) N. Z请按如下操作以删除群集资源:
& } ~' U4 I/ C* s2 j$ A
" J8 O" ]: }4 l6 t. u+ n以 root 用户身份登录,然后启动 crm 交互式外壳:
B2 O- T* Q& Z2 }) {+ Y& }) A0 J$ m1 c0 A' d- Z( j
crm configure f. Z8 z- U" R7 n- c
COPY
" s/ l+ o3 x9 ? i! g. o5 p4 B5 @% q运行以下命令来获取您的资源列表:: o$ r! w' P1 _5 q4 F9 Y1 s9 a* s
7 x2 S G( i0 r9 N/ ]0 g( E9 i
resource status0 ~% {) Q- [& g. ~4 S
COPY
% u0 X" E" d% v- t例如,输出可能类似于以下内容(其中 myIP 是资源的相关标识符):1 ? x" t! P1 ^7 i0 n" T
: {+ d$ l L: U; H6 D* W( y
myIP (ocf:IPaddr:heartbeat) ...
& \1 S( C% |6 G* k" {: SCOPY6 o2 B3 g! S) }: H( K3 K0 ]
删除具有相关标识符的资源(也暗指 commit):7 q! g$ x8 U# g7 n( f' \( m
6 k' ?% o+ F1 H- [" F
configure delete YOUR_ID
8 f& m* k) M+ H0 G8 v& W ?/ E$ _COPY
# ]& g. d: ]) w提交更改:: D; L% V+ a3 S) `4 [$ h* `& J
, q/ A( l; q( x4 V. h( n8 p
configure commit
: y- u5 [' o1 [- H; q) zCOPY# F7 c4 K4 d9 A0 l7 C* A, D2 Y
8.4.5 迁移群集资源 #9 G4 b. t) v3 C4 D3 W
虽然资源已配置为在发生硬件或软件故障时自动故障转移(或迁移)到群集的其他节点,但您也可以使用 Hawk2 或命令行将资源手动迁移到其他节点。6 D2 G1 `$ k- c; {4 `
* l* C/ o% F' ]& b% `对此任务使用 migrate 命令。例如,要将 ipaddress1 资源迁移到名为 bob 的群集节点,请使用以下命令:
, _* U( O" }3 @& z$ \6 Q3 m9 O& X7 q
4 o7 }/ U. r+ d) [crm resource( O; c0 X2 P% |7 x1 Z" t
migrate ipaddress1 bob
; I( \" _* t8 F& lCOPY
. `0 B- ^' F& k* S" b+ T8.4.6 分组/标记资源 #* Y% { ~) l! p" s3 g F
使用标记可以一次性引用多个资源,而无需在这些资源之间创建任何共置或顺序关系。此功能十分适用于对概念上相关的资源进行分组。例如,如果有多个资源与某个数据库相关,您可以创建一个名为 databases 的标记,并将与该数据库相关的所有资源都添加到此标记:5 y Y# h- b# B' r# N" K
7 o2 h- J( z) J8 @" S
crm configure tag databases: db1 db2 db31 j4 G! |! Z7 Z8 n) L. E3 K
COPY
! a" `9 W- H7 J6 v这样,只需使用一条命令就能启动所有这些资源:
5 a6 o( D! p7 q6 X7 g; O) y# b$ x( o
crm resource start databases
* E$ D& W6 d k9 ^COPY! Y S/ u# L7 Q* G# r; Q
同样,也可以一次性停止所有这些资源:
6 d! L1 p& a) R3 @% z; _ _ t
0 H6 n- I* |* `7 t+ x" gcrm resource stop databases- Z9 @) M! u! A1 B+ d0 i. H
COPY
% @+ w5 n- c* ~' T0 ~8.4.7 获取运行状态 #
/ L+ @0 F% {& S可以使用所谓的脚本来显示群集或节点的“运行”状态。脚本可以执行不同的任务,并不局限于显示运行状态。不过,本节重点介绍如何获取运行状态。3 w' B- ]) o# x- s" N
& G0 j. C( i3 [" `: S
要获取有关 health 命令的所有细节,请使用 describe:, Y7 D- r, h; p( U
! u8 v) _1 H" }2 e
crm script describe health c8 @4 Q, c& l" B
COPY
6 q6 x/ e7 H3 \8 L3 B) x该命令将显示所有参数及其默认值的说明和列表。要执行脚本,请使用 run:
0 k4 C+ J. {5 O% W# N2 D7 ] R ~/ o7 L+ a A. ^# g* f; d9 }5 U
crm script run health0 G6 W: [' Z6 Q+ `6 t' L
COPY
0 u f/ Q/ n+ j* k如果您希望只运行整套命令中的一个步骤,可以使用 describe 命令列出步骤类别中的所有可用步骤。, _! B# v* d; M4 H) D: C
/ s3 r2 }3 b, W8 b. \! H例如,以下命令将执行 health 命令的第一个步骤。将在 health.json 文件中储存输出以供做进一步调查:
; F$ F9 T: L' B' @2 H( d! q
2 i- h r$ @5 |" O. W) Ocrm script run health5 E8 f' W2 `* q( ]
statefile='health.json'8 _; Y2 P) h# Y/ _5 e7 | x8 t
COPY
; K2 C* T% u' q/ x您也可以使用 crm cluster health 运行以上命令。" K3 B- E( c1 W. L, i. p7 W
5 C: }; R/ _+ \* O o6 L/ ?- ~
有关脚本的更多信息,请参见 http://crmsh.github.io/scripts/。
" B7 f" v$ _' j. C# }
3 P' l. B5 ]. L: m8 ?3 t5 f8.5 设置独立于 cib.xml 的密码 #" f* t) C+ M4 X; k$ d! K8 @
如果群集配置包含密码之类的敏感信息,应将其储存在本地文件中。这样的话,这些参数将永远不会记录到或导入支持报告中。
3 U* r7 m2 y: p" T* \- x4 X' f1 g0 c
; b: S, t; E( y使用 secret 前,最好先运行 show 命令了解一下所有资源的概况:
9 a* c$ L, ^5 X0 e. d* D8 K4 g ~9 ^, T/ p$ u/ ?% d7 @9 q. V
crm configure show' h) i5 G4 L5 R
primitive mydb ocf:heartbeat:mysql \
7 O% W, g$ I/ c2 } K params replication_user=admin .... N( G4 c, _( |, F! V" @8 \: m
COPY
& g5 O J8 ]2 H1 v: b: C: V6 i ^# X要为上面的 mydb 资源设置口令,请使用以下命令:+ f& v# C' O+ P: m" G
0 }) T) p/ v0 p$ b$ y' \+ w. `1 Fcrm resource secret mydb set passwd linux
1 }- x) o$ q6 KINFO: syncing /var/lib/heartbeat/lrm/secrets/mydb/passwd to [your node list]9 p* R: _7 P; i( J
COPY
% Y: g. V# C b5 X7 J$ O使用以下命令可以取回保存的密码:( l, y3 V U; }# ?9 ~9 r6 k
T& ^( {, W3 _: ?: B# X, H5 q
crm resource secret mydb show passwd' t. T. P L/ q! L$ m$ m0 k D' ~$ w
linux
5 `, c% a$ q. K# q) M5 v- ]1 U% b {( kCOPY% O/ o* ?, C- t& `. m/ s
请注意,节点之间需要同步参数,使用 crm resource secret 命令可以帮助您处理好同步问题。强烈建议仅使用此命令管理机密参数。. Y& d. H L! t5 R8 {' R
) S7 s# L. F, A8.6 检索历史记录信息 #
6 {( M, ]4 C8 {/ O/ w) w调查群集的历史记录是一项复杂的任务。为简化此任务,crmsh 包含了 history 命令及其子命令。假定已正确配置 SSH。
9 d ~: p9 K0 F! J: @3 Q" d: n$ F/ [% ~/ j; `
每个群集都会移动状态、迁移资源或启动重要进程。这些操作均可通过 history 子命令进行检索。# Q7 p2 P& h4 c7 _/ w2 G* z3 I
3 e, @/ p# X6 `; E5 B
默认情况下,所有 history 命令会查看最近一小时的事件。要更改此时间段,请使用 limit 子命令。语法为:
0 P- r. R% a9 n+ |6 j- S! @/ a2 w* A% F4 j4 F$ @) t
crm history
- k6 S4 }% ~3 c( O8 L/ jlimit FROM_TIME [TO_TIME]- `$ P& ]7 n% j* P$ ?
COPY- X2 Q5 n) E% q' c; N4 g3 q
有效示例如下所示:
6 \, j& D( I A( _* p$ Y) W
1 T* E6 ~, O) m7 e t" Elimit4:00pm , limit16:00
1 C* A/ y; B4 [0 R) Q6 i6 Y上述两个命令表达同一个意思:今天下午 4 点。
5 Y5 h7 D" d3 ]# ^" F7 |
+ y3 N8 A* A0 L8 h% slimit2012/01/12 6pm
0 z8 w4 b# h# N! K2012 年 1 月 12 日下午 6 点; k1 T: G' r; j! W+ U
& B8 u+ S; T6 `4 { W7 s8 zlimit"Sun 5 20:46": Q9 i. c1 V; `
当年当月 5 日(星期日)晚上 8:46( ~) z* l7 T& _
" \, f' h+ {( o" G
要查找更多示例以及如何创建时间段的信息,请访问 http://labix.org/python-dateutil。
! O" {0 r: k; ~; K4 k8 {2 W) \ f1 A$ ?" E p" F. g4 i) b
info 子命令显示 crm report 涵盖的所有参数:
9 R U/ [+ l/ ?. f$ O/ H8 A& F( S% @
info; d& V, X, z* f B" x6 G% j1 H! R: r
Source: live
) u W/ Q% B) X8 ~Period: 2012-01-12 14:10:56 - end9 U7 r8 y& q6 Y! O" l3 o" l
Nodes: alice
# _, l3 k6 `! r$ ], f# A% E) U E6 K1 cGroups:
) S* z1 q: l: a! PResources:
$ h3 q. p8 R( |0 m( N8 JCOPY5 \1 |3 P @" h% `" P1 C8 x" l
要将 crm report 限制为使用特定参数,请使用 help 子命令查看可用的选项。8 i) k1 z2 @* B
. D7 M0 @% I- J# d$ @" h( A) j要降低细节级别,请使用 detail 子命令及级别:
, w3 U1 ~$ N7 G% \, o6 M' A# ]: d7 k" u' _
detail 1+ x6 t( v9 ~/ C, x' Q( Q+ ^7 `; J+ Z% k
COPY
* w# u. m0 Q# m! V- P d p/ Z级别数字越高,报告就越详细。默认值为 0(零)。
8 M% m6 Q8 j+ s5 `" [' M! O; f) W. H, ?" q: z% k" F2 q5 Q
设置上述参数后,使用 log 显示日志消息。6 E! m/ u# b9 v$ X( S% V
; u) D1 B3 \# {要显示上次转换操作,请使用以下命令:5 p* `7 z& R3 f; v7 c
' [6 j% V+ u1 r
transition -1
* A. {; p2 C- xINFO: fetching new logs, please wait ...
# Z4 I& B5 C/ ]8 {COPY
# c o; [/ o7 t& [. r4 c此命令会提取日志并运行 dotty(从 graphviz 包)以显示转换图。外壳会打开日志文件,您在其中可以使用 ↓ 和 ↑ 光标键浏览内容。- G( j+ j, R' }2 \: d
* ^" b2 i) K: h$ B
如果希望不要打开转换图,请使用 nograph 选项:
6 P( }; `: | }: [; h" W) B/ t# L1 _' {) Q6 J
transition -1 nograph
! o1 Z+ E5 r- r2 l# o# u6 f* S- s7 J9 B7 b
|
|