|
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控
! c: n+ @ G# o. H3 K- \% y' U
9 D3 @+ l5 [- w& h3 k" e- H对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。1 A2 k& w- G( h
$ |6 Y" S) C; Y, \2 F5 s- hGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
" r* q3 J2 F! ^- m$ [* C: H% D& u- r
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。. r7 j! z" {% `, T K
1 q" Q% E3 b/ P( N7 U
" v9 f6 P2 G3 [- l
' C( C# J8 h) [1 e9 ]. [图1 Ganglia的Overview界面
8 b) H1 e1 k8 A. V/ w3 \& V7 J3 k! i5 L
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。4 S" S( M6 T3 \
0 x! D; z' y, G3 x" U
, n$ f- W. V4 ?% y B+ ]8 D9 ~
8 i( p& Q# d' v0 W+ x图2 Ganglia的聚合视图和节点视图
j& p# v' [5 \) A3 b* x4 y9 r, o
图3是CPU详细监控项目。+ O( J0 B. Z% l* t0 D& Z e
2 {+ u3 c4 U' h% D8 a. X- o) l0 Y( o+ O8 z, C4 U1 Z
6 T9 o" l/ H# M图3 Ganglia的CPU监控1 D# P# y3 D: F; H" d
, r% V7 n4 N; _ q, P图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。' ~9 m' i' c3 ?, i. A3 S
$ R$ [, |% O( y* ?7 B' m: e+ v
' `5 A" v5 V: ~( y5 a5 U
图4 Ganglia监控虚拟机内存
' y) P5 ~3 {# e1 k5 d3 |! S5 `! Z. i" ?' L; `. V9 b
服务与资源监控
5 E9 ?, p+ z- |$ [
+ C7 z2 a7 N- ?4 W1 V* Y; b6 mNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。8 L" ]) P/ r' B/ ^) M
/ J% k% ]) G. M" B1 e图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
- B2 s: ]9 X; z" [8 X$ V/ K; u" I1 F( ~- N+ Z
" T0 R k _, Y$ y( i
" ~7 _$ o! {9 U# H$ Y u, k- Q! I
图5 Nagios的连接视图
. a1 u" W _. v1 R \$ y5 c/ F2 }, f
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
' }/ \0 r( Y6 |
* {" i1 M6 M( C( t另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。2 B$ U6 c' p2 @% [& M1 I u( b
! V3 R2 q. r" ^0 {9 K! g
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
' _ p5 D- l9 i% H: @3 j& i8 B4 A8 R/ g+ E
N& L: B) Y O/ {3 p
, u# M# K: c$ G+ `图6 Nagios的主机视图
4 ~6 r$ H* f: L7 ~5 h' l" o. y- C" D( D" w/ `, h
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
; w- L( y# ~7 x. A m' M% X# Y1 i- J/ c, [
2 u7 g+ g0 q! J$ j
+ i2 a4 \( h; c图7 Nagois的服务监控视图
, ^" v, f+ r N
9 x* ~; f/ n# a0 F- T. v: `对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。' d5 Q9 s* Y$ i: z3 t
- W6 o5 ~! l) H' p2 H5 A& D
: S2 e7 n. V9 Z, `# l) {+ d5 l消息中间件监控) g3 i3 M0 {; G7 x m
1 S; U: @" G; N& u消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
; d) a4 [4 R8 P, k+ {# R9 @1 c: s: P9 Y3 ]) U* M6 A8 d' w" N
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。2 K* F4 _" u, V6 l5 Z: B
$ P# j2 Y0 {7 n
5 X# ^: ~6 o0 X
% ^4 t/ x8 r+ m" \
图8 RabbitMQ的Overview视图
# T" v7 `. a; E1 ], o0 e9 m
. P( E, @5 a" T {图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。, v0 d$ G& t, T* K5 w* x% ~
* F7 g4 B" w: Z0 }" R4 K% i1 S; Z+ n; a" {. O: X6 Z
6 @. ~/ Y4 x- t: ~4 f6 a+ U
图9 RabbitMQ的连接视图- y2 O# J5 d: o" \+ c) Q
9 N, j4 ?0 S% @$ @8 Q# O图10展示了消息中间件的通道视图。
- q" Y7 R& d* U! n# y
9 i0 d! V# t" ~* k4 V! ]/ Q- J: l7 k! C9 l5 s- e" T' J0 u
3 H2 D9 b% ~* ^8 t图10 RabbitMQ的通道视图" C$ j: E: l0 f+ Q6 @* F
! S! V" W# {+ h& ]2 v图11展示了消息中间件的交换(Exchange)视图。' l; k" X: n9 [0 D6 ^; R1 u
+ n& C# x- Q% ~3 Q2 k3 V
8 |1 N- b, u% n+ S5 u3 A- m) t
+ m7 s' a7 G# V7 @$ J+ v
图11 RabbitMQ的交换视图
W8 y! f0 A! h/ T- b$ D5 m: v- c* R! A
图12展示了消息中间件的队列视图,并包括了统计信息。
# \( e" y. q1 o% C& O( ^& u% S( U
4 \( s6 p+ `* V/ h& b4 z& m( s( ~$ \, w
2 _: _* l- |1 m8 U6 d, h& j
图12 RabbitMQ的队列视图
( H* k( k8 y) f5 b) l' K+ @4 B$ l8 J* c( d& M$ c
图13是管理员视图,可以修改密码、增加用户等。
" a3 f G% I* ~/ Q6 G* q A) ]" `' k- e0 A! o( O) R
! w! S1 M6 O* }/ x0 m" v9 j/ O$ ~/ U; ]3 Z/ M# Q/ x
图13 RabbitMQ的管理员视图+ Y9 Y; x I! A6 P8 n! W3 L) c: W
7 D( e1 h- d0 j& }日志分析( w( _, n- W) @7 ]& q' X
1 R3 g* w% E. g: X: c1 LOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。- ?' f8 t7 e7 Y$ D( w
, D9 y. | l' r. K: t
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
2 t }, D6 O1 W4 v# d8 A& D1 Z' O9 S5 V5 P; F& e
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。: E5 r7 t! {# y: L! r
: l0 X* H4 p/ M$ G% z8 V. B
8 \3 r9 p* h# h D. [* T7 a3 h) H
- k# W* {6 t$ G3 X/ B! X图14 LogStash的Overview视图
6 M) c% D; D( K p0 |9 F6 v
3 }4 q$ {) y! [/ d) n* q. H图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
, [+ i, @ u0 l' J$ K
8 a& x2 g/ k8 o8 i5 B
; D4 N1 X% f% n& |% ~! ` R* E, f" B; T# ~
图15 LogStash的消息视图( s) Z, A% C7 T5 C
' \. i9 m n+ K q4 o图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。4 l3 A4 R( X2 S' ]9 r1 y/ r* @# o
7 ?6 k G' j& @. v3 M e
8 r! p" G$ ]3 n# a' a5 X* m2 P6 c# y7 E' F+ f0 D; a
图16 LogStash的消息过滤视图
7 Z! p) v- n* v+ x5 U) J a' k 以上是“OpenStack企业云平台监控的示例分析 - _; d/ |0 T5 E+ P( l) H
) K& d. T8 ?. E( u ^8 W c1 `
9 {1 N, S" O$ J9 T' |6 X& D$ {
7 n. @! {! V T3 F: @1 J8 b+ P7 y" s; x3 H
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控
$ _% n* h' l2 ~ c$ ~
, r( K) S0 T* _% w) ?对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。6 C6 X0 c9 @9 w
$ q7 i4 c x0 O4 a5 @9 I t% ?% i) wGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。( g' x0 @2 p) _
" D- p/ P# c% T
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
9 ?2 l, A0 P" T, Q5 K: }! y; K3 ]4 a5 o" ?; D" i8 n% ?
3 z+ J2 e I& {5 \2 s0 |
; K; Q7 [) K9 A$ q* [+ u" `
图1 Ganglia的Overview界面
9 H! X4 q& N4 k7 R2 r; Z# B9 n. I7 W
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
( p- a$ G" J3 Y
4 C+ Y; e) R: Y8 f5 V) a1 p
4 Z6 v0 |% L5 o; _' U6 R2 H. h# e( j/ r
图2 Ganglia的聚合视图和节点视图2 H5 `) R7 n. w8 W: J, ~
% ?5 x4 {9 [8 H9 T8 v6 |2 ]4 Z图3是CPU详细监控项目。3 [$ E, F: h6 x @1 N1 z
4 w- t* p4 m( ?# X {) D4 x
+ d7 {* _. K: Q9 x: V" I( A: f( a# H2 T, a n/ a' @( j. g+ _9 v; S
图3 Ganglia的CPU监控
4 |" k. m1 z* v* W) ]! W Z5 U4 \# u" x- D
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
- S/ d6 [, g4 S0 x: p5 D. S) K3 H
4 q# r: W4 F: B! R3 F2 D: s% r* i' E$ }1 P( M- j. P4 R2 f
图4 Ganglia监控虚拟机内存
5 l O( a# p0 n; E) r$ T$ j* C; u0 V7 [8 c
服务与资源监控2 \( z4 H- `* G8 {/ l' E
8 U( h, i8 J7 l. x" |0 l5 r( ^
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。+ d: W) Y( U% D- x0 a. `. ^
2 ^& E; W( q$ B, l- E# H8 C& N
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。 ^' Z2 H4 U1 e% X
6 D% O5 [1 n4 P) _9 o
2 D. N1 ?0 M6 }3 Z9 f/ f& M ^% Y# R2 _5 j8 y. K# ^
图5 Nagios的连接视图4 ^- x9 n1 D( L. J
" j( y( b9 I* v0 i) F3 a
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
" u3 M0 d! T9 E2 t6 q3 H8 A- O. o
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。3 G! Q1 x5 q6 o. z
; l2 P4 F3 D0 C) T
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。! x) p. u( e. h) a
: f# N) T/ [- }: P! D' f" G( B8 c5 S2 d8 u
- @3 b& y% X: a; p图6 Nagios的主机视图
" T8 p3 {; e# U8 y$ M! j- ]* A
5 t4 n) Z. F/ C$ e' Y& k图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
. S5 C- ?- T2 r6 l, B6 V) |3 x; z0 l- X
/ a7 W6 x* l3 U* M5 Y) }# }- y9 C
* |8 ?! Q8 C& V$ `. k图7 Nagois的服务监控视图2 j" X* n3 C: L) t3 Y* e$ j7 u
7 h$ n! G/ [$ o: D( O" m6 B+ u6 r* X对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。. s# r2 t8 V; J# p! m$ H
/ v6 B. q5 p7 @8 }. v# E
* a4 z8 ]2 A1 Z" f$ G/ K7 n消息中间件监控
' B2 S" N+ Y1 k
( o/ u4 w4 v8 x; F' w. w+ O! B消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。/ \) F, C9 a0 g" p* g# s8 m
' z2 n3 Q0 w' X$ Q' O5 E9 D" f6 j# y
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。5 G% G e4 W4 U3 C8 N& F, B, Q
, L9 R# ?( M; s4 J6 `7 s* N9 u- d; H
( T$ b1 v- R# F3 P L7 s- e9 J) n4 s9 W
图8 RabbitMQ的Overview视图
0 {% X- e: c* V
" K$ P n+ M/ r+ R图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
) V; @* k: s) ?, \4 q! F* I. s* i
' E) O1 G5 M h: R& v8 W5 T4 j8 B
- F9 D5 j/ ]/ W9 L) L4 ?图9 RabbitMQ的连接视图9 L# x. I# L6 k; l8 f- I
8 y+ }# O0 o& D5 j1 ?
图10展示了消息中间件的通道视图。! e6 n! B) a7 Y! h1 M4 G
- O: g8 D4 l+ }# Q* G N6 z2 f$ D/ }. _7 f
& S& q% R0 k7 g' v3 q. f+ Z4 w5 C
图10 RabbitMQ的通道视图
7 h6 Y" {& E+ y, h4 e0 l2 z3 ?5 b& O- @3 r; h) I2 H
图11展示了消息中间件的交换(Exchange)视图。
" s. t2 v2 X" B5 c; | b
' P( u( q4 ?5 A: C% I) b& a7 m" Y9 x' e1 h9 Z& D; }
3 H4 o/ V& y; |8 V! S0 w图11 RabbitMQ的交换视图9 p0 m0 [/ O- @2 A
+ T, X# T6 I2 u8 f9 y6 L! c( V8 g
图12展示了消息中间件的队列视图,并包括了统计信息。
" b7 h! B; D3 a* S" l1 d* u( k
* b7 m! K9 y7 |5 s( U! @9 ~- ]" l+ p' x. x& ~
2 J1 @2 V; m$ \. w图12 RabbitMQ的队列视图$ t$ @. U5 P3 B* `
2 @$ P, J( c/ p- w- a. @图13是管理员视图,可以修改密码、增加用户等。2 B! l& {5 x$ k
) h1 o7 o& M& [6 k. t0 a
0 ?. X3 \; ?& u, ]4 x$ j. L
4 d& H9 j7 r9 E' H; e i6 w6 w5 \图13 RabbitMQ的管理员视图! a0 p8 w8 a" |4 o0 V. Y
# }! I# p; O" s, [& Y; Q* Z+ c5 _日志分析
/ Q5 G P( {6 \3 f3 d5 O5 ]9 f: c8 A) O
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。# G* z$ T1 T/ w5 [* u2 Y) h
7 L; c8 g3 q/ o7 G2 uLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。2 |* ?" E2 G7 s7 x5 Q
( Z" F k- V$ u/ J" d
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
2 T3 m: ~+ [0 z! G6 t( O) W
( W$ [; n! b1 y$ b! d- b
! s+ e# X: S3 j3 f2 y* Y+ Q6 ]5 l
图14 LogStash的Overview视图: `9 x6 F7 j7 t
, H* v) ?: c) K! C: X
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。" a! d K% W/ w+ h
( U1 v$ q- r2 ]: T
- Q. Q$ F: Q, ~7 w
8 f' A, X ?/ ~4 M; }! g9 R3 h; `图15 LogStash的消息视图
8 Z. F8 J4 d9 A$ M2 v& @' a/ c7 @% _! I
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
: n2 b6 f9 E0 H q' {
7 R4 q9 }' m0 ^, M0 g
. C; U1 f4 @. |7 [' k- M+ L4 Y4 G* F
' O7 S# h( ^2 F& L5 U# {0 c) Q9 `图16 LogStash的消息过滤视图
$ r# g9 F$ D8 ^) Y) d8 M 以上是“OpenStack企业云平台监控的示例分析 3 T" r) g* ~& E( c0 K
: {" [0 K& n# k( M4 {
|