OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控
) b' j5 X5 A4 r. t8 l
( X* p, r! O# R2 s* o对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
, ~% V4 T5 j3 \+ X
1 a5 @/ ~3 R2 z* x* I6 n' O0 lGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。1 g3 y( e0 d8 c% _
# R/ A$ _1 b5 E7 S, }' M2 K
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
" B. r/ M" Z- H: r
9 Q0 J6 h) X' @& m( ^$ x. d2 u5 p/ K6 W2 h8 x4 u( \
* q9 M& d; x* o5 E8 G4 y* n* f% |
图1 Ganglia的Overview界面* @1 `& Z5 k2 w. Q6 E$ }/ H
$ l- r8 b7 _% |; h
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
) X2 @& q& M& j5 O6 F3 B! k
' A0 T. i7 `; a5 D" ~0 n5 t! e5 `2 P, D, u* y
5 I( q8 o. u: W" J- c7 z5 a% e图2 Ganglia的聚合视图和节点视图
+ F4 s' k9 h3 I& C1 ~4 [9 F5 F- B7 x5 q1 w! ]* O( u
图3是CPU详细监控项目。% ^, { A4 Z2 k& c1 y% E9 }
. U) D0 G# f" @5 C3 t2 l. T `6 ^; u5 Q5 f. g9 ?: P
8 c( ~# D7 D" q5 s( p
图3 Ganglia的CPU监控
( L( y% d4 y5 o1 V4 [' Y/ w1 s& |& S3 I9 ~. ]' X" @
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。, j j/ b. P' C" N) J) k3 V) m
& a0 {5 G4 h$ ~7 B ]7 c; f4 I/ d- r% v& a! ]. Y
图4 Ganglia监控虚拟机内存
6 q& v" Q% d' b: V8 ]* ~( P! }9 G9 [
服务与资源监控5 P! E! {* k/ _" D* r# l
3 S+ a" t0 I( j8 e0 p6 h9 G6 ANagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
) ?& Y) \$ s" V1 d# v7 {/ `& u2 y+ C' s, p! p1 V
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。' x. @4 L j. {! _& S3 M) _! N! y
; {! }) D/ s1 q0 Y' x& P, R, B/ a" x7 g+ p8 W
# @! v- K- `3 G# H8 i- O8 U) y, p0 d
图5 Nagios的连接视图
( K0 d n: V4 {) a3 q
0 S" D4 Q! E2 n2 i' P, [另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
3 q; N# W6 f9 f" S' w( f( A2 s1 k: J6 O \# y4 O$ [
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
6 w. E) ~* y+ W" ]: J- Y1 F" q1 E* n# e3 V- _
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。; C* Q3 S) K+ `. I
3 i' j d/ h c9 N0 v
/ l" _' {& P7 i4 z0 x6 h
* ?7 r/ e$ ~$ M c: @
图6 Nagios的主机视图2 l* h. d0 s* ?9 e
6 I( G( V( L% S* N! |
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。4 h$ Y; O# D* Y# e. c, K" f7 j* u
* q7 a1 ]% |& H1 b( @9 V
# V/ o/ A* R4 s4 ~# E3 R- m: e
' {$ }) b5 z( F9 V图7 Nagois的服务监控视图) y" B6 e# J8 m; V9 @, T
4 q S; V/ K+ K- J& I& M9 S
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。1 \9 e, e' H& ^) K: C" T( a
; V# T+ c3 ` N% [" G
* J1 Q. }6 i; ?( v: I, b/ R消息中间件监控
2 ]4 H* X' P' f [/ A! a7 B* \
4 t1 w9 g7 k {* ?2 @消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
$ D% p1 z/ X+ r- A, q& Y
) |" s5 ^( k2 g+ q" |+ J2 t图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
4 M0 d0 ?0 u/ P3 B U$ X
4 c7 Y' g- X5 X! ~% i8 N3 S% |
3 g. k- E) e+ e; Y: c% m
/ e ]" N) V- p+ ~3 X6 O图8 RabbitMQ的Overview视图7 }6 }& ?. Z1 \; `! K4 F+ E
( a$ a6 D2 K1 ~4 b. P图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
* A0 f0 n1 L" h1 `! K+ ?1 r4 Q4 |$ u' ]4 e% q7 p- c
) }4 k; ^: l @+ l6 [
' U9 ~3 S+ m3 p x. {7 m8 @! t图9 RabbitMQ的连接视图
/ u' z: F0 ~7 v1 j& L% U: H8 y) x2 I7 M1 G
图10展示了消息中间件的通道视图。: R; o9 U% ~! W- n6 A$ F
7 S' u/ g. E8 I
" S7 U/ k( ?; q
& P) ~: M( l% X( K7 D; O图10 RabbitMQ的通道视图- n' b5 r, o8 P2 |! K- E
& v( p1 W2 B/ o0 d3 X- f( t图11展示了消息中间件的交换(Exchange)视图。
5 N' G% X- u/ c7 l& Y0 z( _' F8 a& M3 A1 O
+ J) G8 i2 p- x$ k
# u& ?/ n: E4 F, M$ k- w图11 RabbitMQ的交换视图6 V$ I0 B3 c& S6 }
7 C! D, Y( p/ R图12展示了消息中间件的队列视图,并包括了统计信息。
1 R h8 y |: h. ]9 @4 N$ e8 P" ^
! S& T# F- }& U" o3 |8 ]/ n7 a9 C: F- A4 ]" ~2 @
图12 RabbitMQ的队列视图9 D, A4 b# C7 e% T9 u$ u+ J& A
. |- v& i. y0 y5 V. \3 y3 l图13是管理员视图,可以修改密码、增加用户等。
, t) N. h3 V% M* P1 a. }. P. Z- l7 t- Y: W9 _7 \0 M0 |1 z8 x: W. S) L
, O5 \! O/ Y, v- R& i" d8 @. B6 ^5 H2 A% ] b4 D1 Q) l
图13 RabbitMQ的管理员视图& b$ a w* R( M( K0 ^
& {" g3 K, s0 ], m$ T' \
日志分析
% @ A8 j6 z3 S# r$ z8 p- _# r. b1 |* {2 M" w1 @
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。. [% g y7 `' q2 T# c) P0 \7 `
8 t4 Y: \2 F1 u/ P1 u/ o5 L& m3 J( v
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
% s( E( X" o& r- L
* J2 c. Y8 k5 k+ C& r' q7 F图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
5 S9 C9 C" h! W; i7 Y, _, T% T% N: Y9 A6 [+ ?! ]1 p' t5 X g3 z
, t% U+ I, `6 n6 w
5 T- S' k L: X1 s图14 LogStash的Overview视图
* [$ i' t# w2 t' r- ^
9 r8 C$ z [1 \/ R, k/ E图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。; y6 p" ?9 D; [+ z$ l+ ?
, w; [) W4 c2 o* S% z* [
+ N; L; |2 h+ P* ^! f
4 ]! S3 L# n, m
图15 LogStash的消息视图
& y' _' ~# O9 K) i; S1 y
( r. i! P- J, h# H5 O# S% F图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
8 ]# O1 ~) A& V& k2 Y: A3 M2 F' ?; `% u' e6 {0 o7 S
4 N4 l, h1 z$ K$ O
0 Y) Q9 [- {1 x3 p. G B3 f图16 LogStash的消息过滤视图. ^8 }, B* n% r6 O$ [' s- B" U% G
以上是“OpenStack企业云平台监控的示例分析
6 J3 t; T8 J% T$ I% x9 x6 L3 `' Z x, y) H- E5 y" c: q; k9 X
# K" J8 U7 |6 i
9 y4 y* m, Y& }* r- }# O4 W7 \
: j7 W/ \+ a/ M/ X7 |8 nOpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控, A; z- V* l9 m6 m; q& n
' Y9 Y/ H! Z7 k8 S6 K& P$ b对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
! u8 G& J, }$ J" R' |! ]( D# \' b6 n: d. C
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
4 D; u; U0 ^. q+ e3 O4 w& m& K9 v+ ~- L5 q: G9 N
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。" U" t8 G) T( Z
5 H7 L7 j. f" ^4 a
3 V. v, {4 S/ A% Y4 }. S# [& H G' \' H9 \: A
图1 Ganglia的Overview界面4 G/ W+ ]( g+ C- c" ?( b$ F
3 Y0 }; i1 ?; d4 s. K
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。% F; t4 T& ?* F! l) c
, T' T9 F8 s/ \
4 S% s0 O, G/ V+ k H7 U. L0 V0 v/ j7 J4 |" g
图2 Ganglia的聚合视图和节点视图8 I7 X- g2 E2 n* w
' L, Q+ [* t# |' o7 u m" h3 D图3是CPU详细监控项目。1 ~$ u0 M0 a$ z& P) [
* H1 k I" E+ ^ i# N+ P: }! \
' d/ i. X6 J. j9 U0 i
6 v+ y+ i8 d V/ {4 s, ~2 f图3 Ganglia的CPU监控
* ^! {" o/ E! C3 c% W( p0 @( x* E H6 |
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
( k: T! j9 C, {( i" ~+ l
' j/ o) n$ @. B' S1 J0 W2 u9 Q+ i5 J: U3 U! @4 O- i& g
图4 Ganglia监控虚拟机内存
! J4 x! l! k5 ^- [* U6 g1 J! j: O2 ^
服务与资源监控
3 c: {$ I, n: {: i; [
+ _- T& J$ [8 _4 D: ?Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
1 n! k9 q! W7 w* {4 T9 f0 x* x
/ e9 C) m5 U, I图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
) E: U* `! Y) I$ r( y! f6 B6 Z5 m, U, E- U
0 l( E' n! v( j. `9 j7 y. c
+ J8 c9 a* ?7 M图5 Nagios的连接视图
f9 Q: }! ~# ~0 H) s' h9 N9 a8 v* \& D
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。* A$ V6 t; n, c" U o& |6 L/ N- T% I
7 |/ E' K+ |( f) V2 \; {1 V2 s另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
) F9 C4 A o# T" a+ e
: Q* S% |0 j9 z9 [图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
/ O5 d9 p8 N# A
0 \) i- A$ x5 P7 q: _+ \6 z: B; ]3 j1 l# X- i& u; Z
: E! ]- i1 k6 [5 X图6 Nagios的主机视图- V7 _; V7 t4 a$ U: U( i
6 W! J0 \0 j; v# W% ~9 p图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。6 R! N; O! J4 \
. y7 G* C: g- Z1 V, x% _4 n
$ k- V( l8 v) J
' T" D& L5 j/ S% v1 w% T6 o+ O图7 Nagois的服务监控视图
4 \1 N4 `- H2 b. q' U; `0 j
! ~% H- H1 j1 ?2 t对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。9 @" l2 Q+ t+ d( R. }
* O. ]5 M. W \/ u n: t H
$ K H: @8 p, A3 Z6 m! y, }消息中间件监控 W# f$ E# y7 ^6 q1 Z/ j$ U3 }
3 u( z1 H c- ~5 v& z N7 G0 y
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
" t$ L2 h/ l4 D a( d
# j# p% R) D& `图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。- L% P% C M& r- y& Z, N' q
- v; m9 w1 V% U: o( {$ s- D8 T
- ~5 l3 a7 i/ H# V* l8 c7 X3 F9 d+ C3 S. j% I
图8 RabbitMQ的Overview视图2 i1 x; W- O: P& Q6 U
/ Q" a- P0 h$ c4 R( d- G$ O
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。% i% W, T$ K8 b1 o
4 ?+ k' r7 }+ I# }. \' `$ ]6 p4 [5 s8 @1 m' m4 t* v0 P& e
4 T$ S! ]2 b O2 u0 m图9 RabbitMQ的连接视图4 C, F" z$ G2 j" W: w: d, R
3 C* C" v# A ]2 A4 x图10展示了消息中间件的通道视图。! l. m6 F2 |% @
- C3 U7 ?) ?% r7 C' O! Q1 n
, b, j/ j4 i% I3 ]% |9 {0 F# T
" m- |% j, O0 S) s图10 RabbitMQ的通道视图
& x5 b( `$ ~8 f9 [; T/ J4 f" L. h
( V# o+ l7 W% P! N% s* _图11展示了消息中间件的交换(Exchange)视图。( `) m0 k q8 y/ l2 |
# a( e# s7 t4 x4 m! @/ B
/ e2 M+ `8 Y( x
P6 h& _- ~2 z" ]7 l& ~
图11 RabbitMQ的交换视图% p# l" W8 S( u. Z, `
( r7 i! F: X5 N0 B- c
图12展示了消息中间件的队列视图,并包括了统计信息。
5 q; T9 y. A3 [
$ H3 z: O6 _; \& o/ f4 }% H4 H E- a2 G
! @1 ^4 } Z/ D- `
图12 RabbitMQ的队列视图1 T% y6 t0 ?, k+ l( ~; O, n4 }
' f3 C% r* h$ M( g# `
图13是管理员视图,可以修改密码、增加用户等。6 j* S) T% X q% s9 R
$ a% G) y7 D! J V8 w
+ w5 V8 |9 q% v0 s, [& |+ d: ~
) W- d: S, I% s9 S7 A+ w8 i
图13 RabbitMQ的管理员视图0 ?' [' @# ]- V8 e3 f; k# G' y7 Z
2 T" H7 @- A, ]5 p1 ?3 I% H日志分析& V, ?, \ A2 {: e
1 h. ?" V% y4 a: Y( w8 y
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。% I! S9 I5 m1 Z4 ^) _
7 u. k4 ?( D# W) j
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。0 ^6 R5 ^9 a/ e5 u8 C7 x: N, L( I% |
/ G7 g% u3 |# Q7 D
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
: V' L% A6 @" a
1 p4 |3 ]: _, s( ~0 x4 Z' A, j- H% R* g) i, r
- O$ r1 `0 ?1 R+ Z* ~
图14 LogStash的Overview视图: R. p# M8 k) l! D
9 A. x7 G& q8 ?5 W% |$ v+ N
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。 U$ C. Y r" F0 r
* D* `' m2 h* V( f5 A! F7 r' T% Z9 E. ^/ J' i8 E& \
7 n# I q3 Q; [图15 LogStash的消息视图
" Y3 L$ P) T5 n k1 d( y x. g5 O* `7 T$ X
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。( i5 z6 j4 \& [& y& K3 J
2 {: G1 _( }4 \( k, u) i/ R! n7 P4 r
& \) T6 w" ~. R: i2 k+ a
w. @& a4 d5 U3 C% O; O图16 LogStash的消息过滤视图
% n( C, n& P' o3 a$ E' a 以上是“OpenStack企业云平台监控的示例分析
2 z# z1 q4 j! ^/ ` K3 E
+ E% }& M q( t8 F, W1 ?' T |