OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控2 S* {' y; W0 n# u$ I( Q0 [
) x; A. @5 S/ p- b+ S! |( e" |对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。. S3 e/ T( d" m) i/ a0 N* T
6 g+ U V* M/ e1 _) l; U& D
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
: g) V v) x, O4 K9 I6 w
6 ]& S1 ^' U; f, _2 R# v5 x& {图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。) F* F0 s% e D. G; E& C" x
X. z0 b; U$ s0 }3 r
+ O9 ]# G9 v, \: K9 ^) V/ k. l
! F: ~6 E5 Q/ N- ]5 k
图1 Ganglia的Overview界面& |, u& ?/ V, n. t
2 C9 r6 c, C4 h; b! U2 |! H$ Y! ^
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。' W, U, j$ _5 e* _+ x* A
% M4 a! `8 x+ q- v- @1 X" f6 c) \7 S( s6 ]8 a+ Y
0 t% S' {$ K4 ?% o图2 Ganglia的聚合视图和节点视图8 r; }. @2 ]9 @4 z7 N' z
: i) J/ W b1 [: ]: D! G4 t6 A
图3是CPU详细监控项目。. z4 o2 _5 g6 | w1 I/ v ^0 `. z
6 w4 W1 u- }9 _1 A% r0 W* X. y: U k4 ~5 `# {: R, O
, \- Q6 s" i7 O, `2 _
图3 Ganglia的CPU监控- j1 K8 b) L0 l
' n$ l& F9 G9 i+ i+ t# O
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
2 E! Y; [0 }9 w1 C0 T' ]1 q
4 W+ `. N7 V1 Z- H- O% A% p" x+ q% l% |$ |
图4 Ganglia监控虚拟机内存) ~# c$ I5 |4 _8 j7 K( K' K8 X
8 l7 s4 l& f) H8 z, }
服务与资源监控
3 I+ _2 y( w; }" `1 A/ G M% p( u2 f5 u" @- m. X
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。" F/ o' J( W3 v3 s
0 H6 X3 @- y8 ]0 G0 X9 {
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
% S0 n2 E1 q) |9 ?. l% V2 u$ [3 u% N; J
+ X$ s' V: D: K/ P* o& b' D
# p3 n4 p9 m1 |/ r& m' x图5 Nagios的连接视图
; o4 _/ j( F8 |% T
! \/ R- K3 _# e! v- @# t% d4 P# t: Z另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
, C% A0 t" {! M( ?+ S. G0 W2 o j. y: q1 S
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
% o2 l& @; m, M+ Y& v7 t
% I; F( D( a7 ^$ e图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
: M8 l/ J8 v m* U- Z* ]2 S' ?4 a5 T+ v
2 K, G- {; O# Q# N: D
$ H7 [' J& _( D图6 Nagios的主机视图
* s3 U" C$ k( p; Y8 i) y
4 F' Q; E0 K- X" a U图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。. `, J. `! C+ t) z
; i L" k# @7 e# [4 | B4 G" A
% c& R- Y/ `$ s; |" t& P: R# P! O- O0 d, V
图7 Nagois的服务监控视图
+ Z6 p; f/ t' M7 ?. d% ?2 P% d& ^2 E2 |# l( v* |* w: I4 i
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
4 q, n8 d! [. B+ K- z0 A$ c1 H0 v: f0 C0 }2 w
8 a5 t! N+ T$ C8 T
消息中间件监控
% g8 \& H7 s' l) i: O3 ^! R3 x$ P: u: |- ]' [4 G) x
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。' ~0 X$ o" x: c4 D8 a7 Z1 [2 Q
" f, I$ f1 h; ~( s% k7 B
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
* C0 e/ H: t+ l( a! T" j' V% H
- x+ f `" Z: Z( z* `/ [1 G3 t2 y' r I
/ r! F P4 Q& p8 O图8 RabbitMQ的Overview视图
3 W* T5 A+ G% A3 A1 @7 X+ o
4 C% R+ a8 O( `6 b7 ]5 ^图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。4 x; E/ k( a6 H3 `- {
) _/ k( ?# G& W6 i; S+ j/ l9 F9 Q/ `" ~% W2 A
' ^$ ^2 n7 c1 W8 c" g" _: c图9 RabbitMQ的连接视图- e ^/ c/ q7 J+ a6 ? g) h9 J$ E* O
9 f5 D: _; ^: |4 f: o6 }: g1 j
图10展示了消息中间件的通道视图。
0 c9 ]2 L, ^" Q! \. q" V
7 x9 Z D$ b5 Q+ ]
4 m0 a, s( X6 {7 E8 v+ _( a0 ^2 ^+ m7 X& u+ W3 |
图10 RabbitMQ的通道视图
+ j7 f5 Z( @# G3 k; {) {! N" B4 Y; T, Q" ^* s5 Y. ^6 L6 x
图11展示了消息中间件的交换(Exchange)视图。: l3 X+ ~( F6 R9 l6 g/ A1 M
! u; m# m: f/ a3 @- Y; i) M" @: C% ?7 ~5 c
2 F' h4 Y5 p6 \7 x- }
图11 RabbitMQ的交换视图
1 b2 o: L4 N: f2 \1 v
5 h5 a6 v( W3 L% h$ S' k0 f- l图12展示了消息中间件的队列视图,并包括了统计信息。
4 c# k# C& }! X, r; M
6 L' _( f( {* b7 {, O$ a* @7 q* U8 }% U T# a+ r
% T: m& B4 U- }) l3 {5 x
图12 RabbitMQ的队列视图
$ B' S) T( Y; \2 @8 Q Z# W7 ]! d$ T6 J
图13是管理员视图,可以修改密码、增加用户等。7 Y0 n1 s; X3 V4 k
b% s. R' B) V- I' r( {% j4 O6 {8 q [: n2 O+ U6 x
. D/ u) H/ C1 J图13 RabbitMQ的管理员视图
' b" X) ~2 Q" G& p2 M! i8 g r i: z2 k( i& N3 _
日志分析* `; t- B# d, U- W" [9 w7 k
% l [/ F" I' G; |& ~
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。! b: f5 F' o+ p5 v7 W
& r3 z. o3 x; g) ~% s
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
1 X) `# ~4 n- C8 S" Y$ _6 A3 L: Q; X) j7 Y2 t" Z5 |
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。. n# n6 r9 m( O0 r5 w5 N* ?
$ _" E1 K; v4 o2 h: D) O6 a4 \
3 h3 n$ s( c# w! a2 v2 I ]3 T! X9 e# q6 t
图14 LogStash的Overview视图
; A+ T# y3 K% k% a1 o# L/ K: w% u3 e0 [4 M2 o/ B) X
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。. l' C W( X( f. c8 `' n
' A& F1 v1 y. j- W7 o( H+ c
+ d: n, w% w6 n! A' {
, {9 S0 M- c" G# D$ z ^1 N
图15 LogStash的消息视图 B) c8 b- W6 M4 O+ h& K2 u2 U$ \5 o
3 j7 i T- i" P6 }% j图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
2 b3 z2 o9 }4 c5 u1 P5 Z( P2 j$ m+ d
( N0 L' h1 a3 j* z
! A$ w9 ?3 ?( l- m* g- G图16 LogStash的消息过滤视图
& ~0 E |2 u9 ~' V 以上是“OpenStack企业云平台监控的示例分析 ' A1 @) g: k+ c
( n$ b% o$ P% t; B
2 s$ X$ ~9 \6 u. f
) y- S. t# I, N# x$ d1 A
& u$ Q" P+ ?: @" d! p. K ]OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。 性能监控 y, c: g* I1 V& e! X1 d" p
2 R; J) _8 U- l y, g
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
' A8 |! e' ]2 p
h' e( ^% }9 l2 N: b6 O5 K, g7 EGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。# A; _5 s: p! z4 e+ X
& F/ f3 @' m ]4 }图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。7 B6 w/ }' v9 G1 E6 C. s+ E, p
: D' i. f5 h# K- x
. \# \8 M6 f4 j4 n# d X% a8 t, c+ U7 o9 @
图1 Ganglia的Overview界面0 n9 N; W, P7 N( l9 U% h# [0 ~' U
7 Y7 B1 U) P1 Z0 _) L图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
( y* G9 G% t) `4 i, [. p. v+ Y7 P) H2 c# w
1 q3 ~; t: ]1 X! z7 U1 u8 R; w( V8 ~. ?" |# x
图2 Ganglia的聚合视图和节点视图
% f( y' H: m, l1 g# a3 W
( s% I! }* i# \- s图3是CPU详细监控项目。) O! d9 S& k" a9 c
! i* |, E! K1 O8 q, l5 R5 s9 Z6 D( a" V' w4 G+ F% f* h
$ P) F& U: Q/ P" X N" }
图3 Ganglia的CPU监控% \$ K4 A& I+ Z" J& C& a
- n! G6 G$ C: ^) P, Q7 w+ r, t' h
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。6 V" V4 C1 r% d* o: N# a+ l7 v
! q3 v1 P9 _# D7 x, E# q0 G' U. i* Q+ w6 y7 w3 C
图4 Ganglia监控虚拟机内存' D$ Y( d4 U; X% O6 i% E; w
. o" g( D# N: X n7 Y7 ~1 M! u
服务与资源监控$ T" I. t y9 S, |$ A, G4 v/ Y
1 C/ O. }+ E& R6 r5 R) K- aNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
, u% Z% o- Y# y. _( B n; {# J
9 p+ Q/ z- P! M0 w/ Y" N8 f/ @图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。" K: ]$ `" m. p0 k Y/ b4 o
0 @' x4 D- p% f2 l
, D4 q# ~5 p/ ~4 ^0 ~: x9 m! L2 y }3 @. Z
图5 Nagios的连接视图
" p/ E! X; G4 f' ]! h5 a- ]- ~0 V# ~8 _2 N7 B$ R
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。, [1 w" H0 ~0 l
! m1 A: s& |$ r; `) b$ a# c
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。* C0 x0 K/ _9 t X
8 n, x( L( I6 A
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。3 y2 n/ O% R0 f/ K4 |% O! L
& p+ _! ] w0 l p4 Q* c2 Z; x, D2 E) ^3 f9 a
; D% X# L! K2 @1 e6 h" Y9 c图6 Nagios的主机视图9 I( x3 Y {' Z5 j2 a3 E! z
5 v! d# q; f1 s v: M# K图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。" }3 O; l. [4 u- s. T' ]
, f6 |% k5 Q. q2 A( c8 V& b
9 b* a. ]" s" r; g
5 d( ~% S& m+ N9 z/ B4 |5 t& c图7 Nagois的服务监控视图
$ y- h8 S: I% w3 _- ?* u6 f+ F [* B9 W! X, h' z9 c; t5 ^
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
! w0 } }; _! W) G0 e; A
- g7 e2 e: x8 R3 K" Q5 B1 t$ _! {( E" ^2 D* B6 y
消息中间件监控9 y6 N& v3 a) t ]
0 e% L+ S, M/ o& d) V消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
0 j7 y9 w3 Q; J: }( G- [$ m+ @/ d& C1 |3 p( b' n: I; {5 X2 C( `( t' q
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。& T) j4 o% _: g/ _! e
: [# I+ @1 u% n3 d0 x$ T, R! t. b% D9 y. ] X
( s% d& j I* s图8 RabbitMQ的Overview视图0 W* B; e2 b$ H$ v
! d6 i! [6 v, T- |3 S) X$ M
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
, D4 T- Q; _: A& W1 P4 _5 i3 m- w$ ^- ~' T$ K2 l' ]
) ~! Y, P/ e1 l/ l1 P9 j
* y. t8 |/ {" ]0 {8 q9 e图9 RabbitMQ的连接视图' T$ o& ^/ t, v6 z# `9 d
- c, a6 Q) W/ d4 l/ h2 C5 E/ M图10展示了消息中间件的通道视图。
: y) o$ a: q+ E5 I& ~. a
& G! W a- Y: d+ B) I, r
0 K* R5 J) O3 o9 o, p( n$ l# l) O7 T5 K9 \! X$ T" Q% H8 P
图10 RabbitMQ的通道视图
- m, y6 y$ ?; g, }
6 N' p+ C c% ]4 E/ Q1 M/ h图11展示了消息中间件的交换(Exchange)视图。+ g4 d5 v4 A" {7 ~ h" m
9 S7 k; M9 D, c8 [9 o
8 ?0 j4 v8 [! _" w7 p! c3 X' v
* p; G- _8 s5 \5 `' P4 J图11 RabbitMQ的交换视图( V9 J( e" o) `. D& y
6 H' T+ `& R6 b% g& I2 p" E3 |6 V图12展示了消息中间件的队列视图,并包括了统计信息。, I7 g2 J8 _& Y; a
1 Z0 C$ b8 }! ^) V7 T* @4 [8 ^) u8 y8 R3 L. B$ v
! t$ } I1 |: r5 f0 a+ z图12 RabbitMQ的队列视图: |3 T r# C7 E# g
9 W" O& B* |1 f# X
图13是管理员视图,可以修改密码、增加用户等。
% h$ `8 H5 R: l% y" \, L* H: `. C" h
2 `0 }5 ]$ ]$ K( B, ^
/ d/ B( }' H' E5 C# B+ O图13 RabbitMQ的管理员视图
_3 M# P/ n- q0 @# p6 p* @6 N
; s2 |% P! M, ^9 J8 j' N日志分析2 J8 A7 q0 w8 J8 ?4 m# p) h4 X, b# ?
2 G" H/ y. |. P) l. f1 F4 ?OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。$ S, g7 Z( n4 D5 E- P$ {' Q
" m! |/ C7 A$ |' p4 P& pLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
; {# o# e1 p3 g1 Z
( o6 c9 m+ y$ L# a* A图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。 i8 R; n1 @& u! E
( J( m+ D, s r; _
+ S4 e% j) y! N8 C4 v* l9 r
w# U. k0 S" `图14 LogStash的Overview视图" j* F3 D, k0 W: |- b7 J1 E/ r
2 x" F! v1 \/ G& N5 d' q1 ]) c图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。( t) N) A, o2 G" m3 @. O
" a' k! a0 b6 J7 m# I/ @9 q( t" x. ], M
* V; D* a# c0 O4 _图15 LogStash的消息视图7 v$ }$ f* o4 D1 U5 [* m2 Y
# t" c' J! U9 Z" L" u图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。6 E$ b% ]/ ]4 w4 g3 e$ ~# k8 p( N
" z; q; f, ?2 @6 \: h5 y" Z* V7 P. S: Q
5 k* x' b; B! r图16 LogStash的消息过滤视图( g- H, _/ O) F
以上是“OpenStack企业云平台监控的示例分析
& F# D5 a/ \1 j- ~4 F( V' I# ^# K: F9 `
|