|
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控
% C- v; V3 w6 i1 k O( \/ z8 I8 ~# h5 R3 o T5 s# C' D2 |" W$ g$ L% O
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
; n- L Z, k2 w) n
5 x0 w* |0 b1 {- C; y9 R+ iGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。 L4 t% ], ?6 y$ X/ ~! j
' Z B3 `& h# d4 `) _
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。4 U5 t6 w5 B0 j9 ?1 k) L# L
: r6 F, A7 f. u r U2 D5 Y2 r8 Z9 V
. c% z$ i4 t1 d1 O3 Z图1 Ganglia的Overview界面
1 P4 u3 q4 k& N# a' [- U0 @+ Q0 y8 Z6 X
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
, @5 |5 J( j; h( s; p
- K& b. m1 R# T6 a- D# h* P. K5 V- s1 g/ a' |* q9 B/ o2 `
: y: k( _8 t; S: s3 K3 ^1 a( c
图2 Ganglia的聚合视图和节点视图
/ U' O1 ^$ L& c! l( K* s4 y$ w* ]- x' k# z o% }
图3是CPU详细监控项目。
Q) i5 K3 W3 B7 V0 F
! A" k4 ~6 N( s% X) W5 Y4 T' K0 T t p/ v% {; i: ^; N8 V7 J
- I" V" B7 \# T图3 Ganglia的CPU监控: X) Q* W& q: {
) h9 L9 C( D( v
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
3 q9 |# u/ }. O N7 F" u
' |1 X, i* g( s ~$ A- z, J _; W# _: S" P6 ]* A
图4 Ganglia监控虚拟机内存
0 Q- ]* h* k+ a3 R( s: r5 {- X1 t+ P# a1 \, u; m+ Q+ j; S
服务与资源监控4 a, h6 ]% K/ @" l, L
( t" \5 k' {+ M$ M
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。$ v( P: \3 M0 ?/ |& H: K3 c7 h
+ m" Y5 Y& [1 ]$ S7 R: J
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
' n9 a5 k! m \
2 x' v7 U4 f0 I' ]: e0 B$ s, k# i4 @9 F( _: ?
5 l( s) l9 l7 P9 e图5 Nagios的连接视图" R- J5 n9 U7 w8 d$ j5 z
' B2 v2 @0 j# O$ d: j! H另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
/ A* u( g) Q# Z% W9 y1 {6 {9 D3 A+ V1 L& V: u9 z
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。7 o; I8 D8 b% o
% B/ Y$ b+ X) u8 |/ u图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
* Q: F x8 ^9 z6 ]; }
, G- s! O1 E: l. P! ?9 J- e) h: I4 Y/ M
$ h; U( C" ~3 D/ Y$ {
# Y7 h* C, }5 A6 ]- Q Z图6 Nagios的主机视图
! V3 d5 y, R4 n. u3 r5 r4 m3 A8 y$ s: y1 P1 Y0 M# U8 R
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。# g6 T O9 T* u1 _
; y! k. Q# P+ `4 a7 ~7 m$ l8 l
, n( V5 ]" z4 d% I& @
" I; b* f4 m0 g1 J图7 Nagois的服务监控视图
9 b$ ^8 j: u5 t- |4 A2 M
8 T R# p- q+ k: v对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
' _2 a, w, D- ~/ q: K5 I |6 i4 `9 W" M
/ }" [* k6 {; b# [
消息中间件监控5 e5 @9 N; p' |8 T5 n) K& I
6 f; S( ~4 i& h8 D
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
9 z1 G9 X3 b3 g& t' C1 v r- y3 D# F! p0 l( u% y/ n" ?0 G7 `, l
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
( Z$ S |) J5 m: q+ }; X6 Z7 F/ r+ m4 ^2 c t! ?; M) a0 `0 K+ _
8 M; d9 |% @0 l' A4 a
; c% X' r8 ~! k: W) f图8 RabbitMQ的Overview视图3 X6 x8 ^4 W( y8 v' f
# M: \' }8 K- K% k2 P3 Y7 Q图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
$ h$ ~% J" O4 m6 v' Z. ^0 F9 G% Y$ o; b
4 M/ ]+ @3 i4 V0 |) N
0 |5 L4 |* Q1 p: q3 H图9 RabbitMQ的连接视图
5 X$ D% l% T3 F, r/ {+ f9 W" K/ X- h' D, [% P2 d
图10展示了消息中间件的通道视图。0 v( Z6 K. A' d: A
/ Y( A3 ?: g8 J
$ ~ f% l: a5 x8 j9 V! h& u2 j$ |/ s" l1 ~& n
图10 RabbitMQ的通道视图 Q- x! d" e" P" b2 w. ~6 l
) x0 Y, e% q/ ?, i9 e6 |
图11展示了消息中间件的交换(Exchange)视图。% _ f7 t) X; c; Z$ ]% k
1 R2 H7 h) O+ Z" J% Q4 E' Y2 @- O$ R: G0 W* C
6 U, c. v ~" ^1 d3 d# S! R+ j
图11 RabbitMQ的交换视图4 y7 P" t% Q* c1 u* U
$ o3 H4 \4 P" B9 R. i+ W- ?( Q
图12展示了消息中间件的队列视图,并包括了统计信息。: ]( [2 S+ S4 p" i' u
( z6 L+ H; ~3 V- y! ]5 K% j7 _
5 B, s& H$ Z! V3 v5 l) M: ~+ k2 c+ p
图12 RabbitMQ的队列视图1 T& |2 S+ w& c. |
2 U. l8 ~# t: q
图13是管理员视图,可以修改密码、增加用户等。
( }3 _: K3 P2 k% k
, m" u4 ] i/ r: z4 ~. Z, \- p, }: ~- O0 n
& |) {3 T. u, {; ~. _
图13 RabbitMQ的管理员视图- O8 O2 K8 T7 f4 n3 H
! \* c3 I% J$ X3 l% X! p
日志分析" r2 |8 z% S0 ?, P" c
+ z. l* T( z- cOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。2 D, Y$ X* ?; { j& O4 f. @
1 q0 T8 R1 L; |6 H# [' Q
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
$ J+ p$ u7 L: @9 O0 |/ V/ C7 b4 N" g8 \# I# }
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。5 V8 _2 b" T2 b6 ?- ^0 T
1 `, x" | }! `6 W/ h$ N9 G+ f) T
( v7 Q" Z, F4 \& D' F* D3 Z+ r8 Z0 T7 N7 N5 _5 k
图14 LogStash的Overview视图% Z0 P4 ^# K; k% F1 d
# e; l1 l3 V2 ~3 n5 L ?; {2 @
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。3 Q# i& [2 G( K0 E$ z
: h) M* J( f8 }" f) J
$ f& X6 ?1 P5 w) `/ R1 m. O# L1 d( a6 z* e0 {, t
图15 LogStash的消息视图1 r. f6 v9 v6 W+ \% A1 h. V
) O/ v; J4 _; }图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
5 \& l( h$ e+ J8 e; m R
$ a# x) F0 r& y! g n5 V6 F3 q" T! D9 ~% F4 D, o/ F$ w9 v$ T
3 ], T* `+ h& d9 a( ^
图16 LogStash的消息过滤视图+ {% b r6 O0 x; {
以上是“OpenStack企业云平台监控的示例分析
; {% z+ o- x: A0 f1 ^# Z" P3 H v3 T
2 K- }3 X9 C% o, Y5 t- E+ z$ R( i7 L; n* p8 P; N9 T" o
6 e- l7 _; C2 C. I6 h0 UOpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控
* Z) u9 c0 @: |" [9 X
) T- w5 K2 G& V) y) ]* O对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。9 y5 i$ Q0 u8 N( U' B& i/ q# r
: V1 T' c0 @! `+ m" W) cGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。3 [8 _9 ~) h; s+ r8 J3 p
! a4 `, X! T& }1 u4 H4 \0 C图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。8 O& u. }7 P9 Q/ }9 o" t3 {7 \3 o
4 E) S x: E0 K# _6 [. Q* k/ G9 e# g, t9 F
+ b5 B' i$ M! ]* l$ n. l图1 Ganglia的Overview界面# \( C; k' [' N1 g' E
' m$ |/ B" g; N0 b3 }0 D图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
" D4 o$ l' s) C2 G$ F5 w9 c
' y. [1 P: _5 m
; m; T. @! J2 L) B; J
& s1 K" O# Z( M5 |2 y8 n* r( n4 m/ |图2 Ganglia的聚合视图和节点视图2 U. H; D( ]- O; E9 D
( L" H# m7 I6 g9 @6 M# O ~2 N
图3是CPU详细监控项目。
6 u @% w8 [+ B! M- e. F7 n: I6 k* Z( m$ e ^
8 e0 ^ c* _ e& j% x* w
% h2 h( f' B: L; Q1 K7 Q7 o. a图3 Ganglia的CPU监控
0 _8 J9 C/ ]7 |7 c' C6 c" Y3 Z! p
) l6 s. x* F' e$ i4 |图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
$ C' B n9 m) `$ }3 P% t8 |2 C8 c" m0 L/ @$ k& p8 Z9 H6 ?. ?
* C8 u% ^+ q+ n8 \
图4 Ganglia监控虚拟机内存
`' T6 {% ~. D+ ] R, S5 N4 `5 Q- t. M! F- g% A2 k4 v2 _
服务与资源监控: j# V3 T$ I$ Q0 e1 M; v) L
0 D* x0 [) V7 F# q
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
' G% o4 d, e6 w: @
( t$ m3 V! V4 T/ S M1 Z- p图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。9 r4 G% f$ r5 _8 g5 \8 ?
) W& ^' J5 @2 \1 |5 Z5 l
: [* w# k3 _! t9 G1 X1 {# Y
' f, I+ G% f; j# ]图5 Nagios的连接视图: a- j# i/ ^- I4 s: \
: f f6 p3 Y6 u另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
' C- K7 u/ V( v/ ?- k4 a0 s# B- [$ |4 S5 a, O
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
/ X* x6 F" J' }% w
' Y0 `" Y( Z" o! P2 o图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
* H4 A- T: s5 \. G: N4 ?5 Y& ]! G; w, u$ {' x3 `
( D% p6 G) j$ e/ L1 c: N
' A; x @$ H# ~6 z% `7 z# ~图6 Nagios的主机视图
7 B& j) y7 a6 M) `; q! I, [! j
5 C2 N' B1 t1 e1 q7 E图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。5 h9 o1 b' Q7 ~ M5 w3 g+ ?
$ r( ]6 a& f4 t# {% W! |# ]3 b0 u R; F1 X: d8 b
! M2 ]9 f6 Y3 _9 \. |" m' f5 i
图7 Nagois的服务监控视图
1 Y/ F" H& d- _9 f" r/ S9 x( c% K3 \ F; X0 T/ K k2 D5 D
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
9 Z* v0 F* T# m, X. n: o$ O# w- N
+ Z' o- I, M% ~9 J$ K
( }$ z$ X1 G! _! ?! o6 [消息中间件监控+ c( I& c( G, T$ O) _+ d* b
0 {9 V( y+ R& c" J Z消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
5 ^" ]1 W' I" {- \1 C S* F( U
1 \/ X: b$ ~ w图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。& `8 B& g8 f9 U) D q, Z5 o
4 k# N1 i; ~ C$ n, E' r6 X4 p' j$ c( N+ J. A9 M% A9 s
: O' _& c: T& [! k) ^
图8 RabbitMQ的Overview视图
2 U8 b p5 l) d. x+ a; D* b2 h! e
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。$ a6 V% ~0 W' s; d0 P' u/ b
+ B! W; A( W7 }6 r- I
3 n$ m, {6 m0 I( m! I: m0 `+ t( W" o8 Q2 l8 c3 q( F3 S
图9 RabbitMQ的连接视图; A8 M8 m! v& d* Q/ w
U. g/ P, @ O* E4 M+ u/ j
图10展示了消息中间件的通道视图。0 @2 o% T8 R* k0 b3 z
. {- m. z) n E
7 W/ W3 W5 Q$ `6 G% l1 R3 c0 ^- C1 L7 j) E) r! X W6 t r
图10 RabbitMQ的通道视图; d7 J# T- s9 Y" ~ U. J
6 ?3 {* T: g, F/ i9 @图11展示了消息中间件的交换(Exchange)视图。
4 a4 ?/ Y2 A2 {* I( @$ w8 z) x
# Z( U1 Q% E* K* r' {& `' }5 X: Y* K8 C: S& @# G/ w
% z5 D k J- L
图11 RabbitMQ的交换视图4 g( T; P: Z: N2 J# Q: x+ d& N
# t D/ f+ | d3 ]" o7 {% K
图12展示了消息中间件的队列视图,并包括了统计信息。
" O T7 f7 J: a# N8 Z$ p" U; ~. a( V5 k; Z6 G" R8 `
& T3 t# h7 M2 m
4 h/ k% x+ C. e8 j) F. d
图12 RabbitMQ的队列视图, D8 M, b# k3 a8 O$ r4 Z( y1 |
n/ e; B3 u+ b7 W5 O+ C6 B$ u1 e图13是管理员视图,可以修改密码、增加用户等。
( K. I: D! l3 y
& X7 n. @! U5 g/ U1 ?9 `3 K7 B
2 E: e$ ~; I6 R4 W; x5 s }0 T3 q- n1 [
图13 RabbitMQ的管理员视图5 G' `, m2 [/ `( o, @
" e2 Q7 Z3 R) a# K! C4 }日志分析
" a) T( r+ L5 \+ p* B# @- O2 Q% V) H5 c& Z7 ^5 C
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。* Y( G+ I# F4 w* E
, `; ~- G( F6 O. ?, [% t5 u: pLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。' T2 j, r! }9 c# z
+ ^' t4 {) v5 V, C图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
1 i9 j$ s; T2 ]: L" B, q
$ L. \; W* B' _6 Z8 }) h2 W2 [; n8 A0 e/ `- K
# i" Y+ b, s$ x; I5 {
图14 LogStash的Overview视图
9 _* t# D% x! L& g8 a+ W8 @! x# A. Z# Q" s7 _
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
7 d6 r0 B; n. B& U7 G9 f W) H( r* N! p$ x, F4 B8 o
% n1 ~& p4 n# v, x E/ H9 [
" ?# |" j; b+ u+ c U图15 LogStash的消息视图* ~ a% ~6 i9 o* l& D( H: o. x3 |6 q" X
' \3 D7 }$ O. o* N8 e' I: r图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
1 r1 t6 g! X7 r3 R# r( ]! G, s) @( n" _. r
) l5 d0 Y- ?/ J1 U) A
0 \7 U: l8 g: Q5 ~; i& W1 R$ s/ G6 ?$ M3 I8 t' h w/ m1 [/ {
图16 LogStash的消息过滤视图# ~1 d1 J9 e! o# S% h
以上是“OpenStack企业云平台监控的示例分析 d/ y) U; {! O$ ?" e% E! A9 H. ]
\3 b. [# f8 m9 ~
|