找回密码
 注册
查看: 611|回复: 2

OpenStack 高性能监控工具

[复制链接]

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
发表于 2022-12-15 09:55:23 | 显示全部楼层 |阅读模式
购买主题 本主题需向作者支付 2 金钱 才能浏览

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2022-12-15 10:26:07 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
! c: n+ @  G# o. H3 K- \% y' U
9 D3 @+ l5 [- w& h3 k" e- H对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。1 A2 k& w- G( h

$ |6 Y" S) C; Y, \2 F5 s- hGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
" r* q3 J2 F! ^- m$ [* C: H% D& u- r
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。. r7 j! z" {% `, T  K
1 q" Q% E3 b/ P( N7 U

" v9 f6 P2 G3 [- l
' C( C# J8 h) [1 e9 ]. [图1  Ganglia的Overview界面
8 b) H1 e1 k8 A. V/ w3 \& V7 J3 k! i5 L
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。4 S" S( M6 T3 \
0 x! D; z' y, G3 x" U

, n$ f- W. V4 ?% y  B+ ]8 D9 ~
8 i( p& Q# d' v0 W+ x图2  Ganglia的聚合视图和节点视图
  j& p# v' [5 \) A3 b* x4 y9 r, o
图3是CPU详细监控项目。+ O( J0 B. Z% l* t0 D& Z  e

2 {+ u3 c4 U' h% D8 a. X- o) l0 Y( o+ O8 z, C4 U1 Z

6 T9 o" l/ H# M图3  Ganglia的CPU监控1 D# P# y3 D: F; H" d

, r% V7 n4 N; _  q, P图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。' ~9 m' i' c3 ?, i. A3 S
$ R$ [, |% O( y* ?7 B' m: e+ v
' `5 A" v5 V: ~( y5 a5 U
图4  Ganglia监控虚拟机内存
' y) P5 ~3 {# e1 k5 d3 |! S5 `! Z. i" ?' L; `. V9 b
服务与资源监控
5 E9 ?, p+ z- |$ [
+ C7 z2 a7 N- ?4 W1 V* Y; b6 mNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。8 L" ]) P/ r' B/ ^) M

/ J% k% ]) G. M" B1 e图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
- B2 s: ]9 X; z" [8 X$ V/ K; u" I1 F( ~- N+ Z
" T0 R  k  _, Y$ y( i
" ~7 _$ o! {9 U# H$ Y  u, k- Q! I
图5  Nagios的连接视图
. a1 u" W  _. v1 R  \$ y5 c/ F2 }, f
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
' }/ \0 r( Y6 |
* {" i1 M6 M( C( t另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。2 B$ U6 c' p2 @% [& M1 I  u( b
! V3 R2 q. r" ^0 {9 K! g
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
' _  p5 D- l9 i% H: @3 j& i8 B4 A8 R/ g+ E
  N& L: B) Y  O/ {3 p

, u# M# K: c$ G+ `图6  Nagios的主机视图
4 ~6 r$ H* f: L7 ~5 h' l" o. y- C" D( D" w/ `, h
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
; w- L( y# ~7 x. A  m' M% X# Y1 i- J/ c, [

2 u7 g+ g0 q! J$ j
+ i2 a4 \( h; c图7  Nagois的服务监控视图
, ^" v, f+ r  N
9 x* ~; f/ n# a0 F- T. v: `对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。' d5 Q9 s* Y$ i: z3 t

- W6 o5 ~! l) H' p2 H5 A& D
: S2 e7 n. V9 Z, `# l) {+ d5 l消息中间件监控) g3 i3 M0 {; G7 x  m

1 S; U: @" G; N& u消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
; d) a4 [4 R8 P, k+ {# R9 @1 c: s: P9 Y3 ]) U* M6 A8 d' w" N
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。2 K* F4 _" u, V6 l5 Z: B
$ P# j2 Y0 {7 n
5 X# ^: ~6 o0 X
% ^4 t/ x8 r+ m" \
图8  RabbitMQ的Overview视图
# T" v7 `. a; E1 ], o0 e9 m
. P( E, @5 a" T  {图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。, v0 d$ G& t, T* K5 w* x% ~

* F7 g4 B" w: Z0 }" R4 K% i1 S; Z+ n; a" {. O: X6 Z
6 @. ~/ Y4 x- t: ~4 f6 a+ U
图9  RabbitMQ的连接视图- y2 O# J5 d: o" \+ c) Q

9 N, j4 ?0 S% @$ @8 Q# O图10展示了消息中间件的通道视图。
- q" Y7 R& d* U! n# y
9 i0 d! V# t" ~* k4 V! ]/ Q- J: l7 k! C9 l5 s- e" T' J0 u

3 H2 D9 b% ~* ^8 t图10  RabbitMQ的通道视图" C$ j: E: l0 f+ Q6 @* F

! S! V" W# {+ h& ]2 v图11展示了消息中间件的交换(Exchange)视图。' l; k" X: n9 [0 D6 ^; R1 u
+ n& C# x- Q% ~3 Q2 k3 V
8 |1 N- b, u% n+ S5 u3 A- m) t
+ m7 s' a7 G# V7 @$ J+ v
图11  RabbitMQ的交换视图
  W8 y! f0 A! h/ T- b$ D5 m: v- c* R! A
图12展示了消息中间件的队列视图,并包括了统计信息。
# \( e" y. q1 o% C& O( ^& u% S( U
4 \( s6 p+ `* V/ h& b4 z& m( s( ~$ \, w
2 _: _* l- |1 m8 U6 d, h& j
图12  RabbitMQ的队列视图
( H* k( k8 y) f5 b) l' K+ @4 B$ l8 J* c( d& M$ c
图13是管理员视图,可以修改密码、增加用户等。
" a3 f  G% I* ~/ Q6 G* q  A) ]" `' k- e0 A! o( O) R

! w! S1 M6 O* }/ x0 m" v9 j/ O$ ~/ U; ]3 Z/ M# Q/ x
图13  RabbitMQ的管理员视图+ Y9 Y; x  I! A6 P8 n! W3 L) c: W

7 D( e1 h- d0 j& }日志分析( w( _, n- W) @7 ]& q' X

1 R3 g* w% E. g: X: c1 LOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。- ?' f8 t7 e7 Y$ D( w
, D9 y. |  l' r. K: t
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
2 t  }, D6 O1 W4 v# d8 A& D1 Z' O9 S5 V5 P; F& e
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。: E5 r7 t! {# y: L! r
: l0 X* H4 p/ M$ G% z8 V. B
8 \3 r9 p* h# h  D. [* T7 a3 h) H

- k# W* {6 t$ G3 X/ B! X图14  LogStash的Overview视图
6 M) c% D; D( K  p0 |9 F6 v
3 }4 q$ {) y! [/ d) n* q. H图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
, [+ i, @  u0 l' J$ K
8 a& x2 g/ k8 o8 i5 B
; D4 N1 X% f% n& |% ~! `  R* E, f" B; T# ~
图15  LogStash的消息视图( s) Z, A% C7 T5 C

' \. i9 m  n+ K  q4 o图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。4 l3 A4 R( X2 S' ]9 r1 y/ r* @# o

7 ?6 k  G' j& @. v3 M  e
8 r! p" G$ ]3 n# a' a5 X* m2 P6 c# y7 E' F+ f0 D; a
图16  LogStash的消息过滤视图
7 Z! p) v- n* v+ x5 U) J  a' k
以上是“OpenStack企业云平台监控的示例分析
- _; d/ |0 T5 E+ P( l) H
) K& d. T8 ?. E( u  ^8 W  c1 `

9 {1 N, S" O$ J9 T' |6 X& D$ {
7 n. @! {! V  T3 F: @1 J8 b+ P7 y" s; x3 H
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
$ _% n* h' l2 ~  c$ ~
, r( K) S0 T* _% w) ?对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。6 C6 X0 c9 @9 w

$ q7 i4 c  x0 O4 a5 @9 I  t% ?% i) wGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。( g' x0 @2 p) _
" D- p/ P# c% T
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
9 ?2 l, A0 P" T, Q5 K: }! y; K3 ]4 a5 o" ?; D" i8 n% ?
3 z+ J2 e  I& {5 \2 s0 |
; K; Q7 [) K9 A$ q* [+ u" `
图1  Ganglia的Overview界面
9 H! X4 q& N4 k7 R2 r; Z# B9 n. I7 W
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
( p- a$ G" J3 Y
4 C+ Y; e) R: Y8 f5 V) a1 p
4 Z6 v0 |% L5 o; _' U6 R2 H. h# e( j/ r
图2  Ganglia的聚合视图和节点视图2 H5 `) R7 n. w8 W: J, ~

% ?5 x4 {9 [8 H9 T8 v6 |2 ]4 Z图3是CPU详细监控项目。3 [$ E, F: h6 x  @1 N1 z

4 w- t* p4 m( ?# X  {) D4 x
+ d7 {* _. K: Q9 x: V" I( A: f( a# H2 T, a  n/ a' @( j. g+ _9 v; S
图3  Ganglia的CPU监控
4 |" k. m1 z* v* W) ]! W  Z5 U4 \# u" x- D
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
- S/ d6 [, g4 S0 x: p5 D. S) K3 H
4 q# r: W4 F: B! R3 F2 D: s% r* i' E$ }1 P( M- j. P4 R2 f
图4  Ganglia监控虚拟机内存
5 l  O( a# p0 n; E) r$ T$ j* C; u0 V7 [8 c
服务与资源监控2 \( z4 H- `* G8 {/ l' E
8 U( h, i8 J7 l. x" |0 l5 r( ^
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。+ d: W) Y( U% D- x0 a. `. ^
2 ^& E; W( q$ B, l- E# H8 C& N
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。  ^' Z2 H4 U1 e% X
6 D% O5 [1 n4 P) _9 o

2 D. N1 ?0 M6 }3 Z9 f/ f& M  ^% Y# R2 _5 j8 y. K# ^
图5  Nagios的连接视图4 ^- x9 n1 D( L. J
" j( y( b9 I* v0 i) F3 a
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
" u3 M0 d! T9 E2 t6 q3 H8 A- O. o
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。3 G! Q1 x5 q6 o. z
; l2 P4 F3 D0 C) T
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。! x) p. u( e. h) a

: f# N) T/ [- }: P! D' f" G( B8 c5 S2 d8 u

- @3 b& y% X: a; p图6  Nagios的主机视图
" T8 p3 {; e# U8 y$ M! j- ]* A
5 t4 n) Z. F/ C$ e' Y& k图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
. S5 C- ?- T2 r6 l, B6 V) |3 x; z0 l- X

/ a7 W6 x* l3 U* M5 Y) }# }- y9 C
* |8 ?! Q8 C& V$ `. k图7  Nagois的服务监控视图2 j" X* n3 C: L) t3 Y* e$ j7 u

7 h$ n! G/ [$ o: D( O" m6 B+ u6 r* X对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。. s# r2 t8 V; J# p! m$ H
/ v6 B. q5 p7 @8 }. v# E

* a4 z8 ]2 A1 Z" f$ G/ K7 n消息中间件监控
' B2 S" N+ Y1 k
( o/ u4 w4 v8 x; F' w. w+ O! B消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。/ \) F, C9 a0 g" p* g# s8 m
' z2 n3 Q0 w' X$ Q' O5 E9 D" f6 j# y
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。5 G% G  e4 W4 U3 C8 N& F, B, Q
, L9 R# ?( M; s4 J6 `7 s* N9 u- d; H

( T$ b1 v- R# F3 P  L7 s- e9 J) n4 s9 W
图8  RabbitMQ的Overview视图
0 {% X- e: c* V
" K$ P  n+ M/ r+ R图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
) V; @* k: s) ?, \4 q! F* I. s* i
' E) O1 G5 M  h: R& v8 W5 T4 j8 B

- F9 D5 j/ ]/ W9 L) L4 ?图9  RabbitMQ的连接视图9 L# x. I# L6 k; l8 f- I
8 y+ }# O0 o& D5 j1 ?
图10展示了消息中间件的通道视图。! e6 n! B) a7 Y! h1 M4 G

- O: g8 D4 l+ }# Q* G  N6 z2 f$ D/ }. _7 f
& S& q% R0 k7 g' v3 q. f+ Z4 w5 C
图10  RabbitMQ的通道视图
7 h6 Y" {& E+ y, h4 e0 l2 z3 ?5 b& O- @3 r; h) I2 H
图11展示了消息中间件的交换(Exchange)视图。
" s. t2 v2 X" B5 c; |  b
' P( u( q4 ?5 A: C% I) b& a7 m" Y9 x' e1 h9 Z& D; }

3 H4 o/ V& y; |8 V! S0 w图11  RabbitMQ的交换视图9 p0 m0 [/ O- @2 A
+ T, X# T6 I2 u8 f9 y6 L! c( V8 g
图12展示了消息中间件的队列视图,并包括了统计信息。
" b7 h! B; D3 a* S" l1 d* u( k
* b7 m! K9 y7 |5 s( U! @9 ~- ]" l+ p' x. x& ~

2 J1 @2 V; m$ \. w图12  RabbitMQ的队列视图$ t$ @. U5 P3 B* `

2 @$ P, J( c/ p- w- a. @图13是管理员视图,可以修改密码、增加用户等。2 B! l& {5 x$ k
) h1 o7 o& M& [6 k. t0 a
0 ?. X3 \; ?& u, ]4 x$ j. L

4 d& H9 j7 r9 E' H; e  i6 w6 w5 \图13  RabbitMQ的管理员视图! a0 p8 w8 a" |4 o0 V. Y

# }! I# p; O" s, [& Y; Q* Z+ c5 _日志分析
/ Q5 G  P( {6 \3 f3 d5 O5 ]9 f: c8 A) O
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。# G* z$ T1 T/ w5 [* u2 Y) h

7 L; c8 g3 q/ o7 G2 uLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。2 |* ?" E2 G7 s7 x5 Q
( Z" F  k- V$ u/ J" d
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
2 T3 m: ~+ [0 z! G6 t( O) W
( W$ [; n! b1 y$ b! d- b
! s+ e# X: S3 j3 f2 y* Y+ Q6 ]5 l
图14  LogStash的Overview视图: `9 x6 F7 j7 t
, H* v) ?: c) K! C: X
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。" a! d  K% W/ w+ h

( U1 v$ q- r2 ]: T
- Q. Q$ F: Q, ~7 w
8 f' A, X  ?/ ~4 M; }! g9 R3 h; `图15  LogStash的消息视图
8 Z. F8 J4 d9 A$ M2 v& @' a/ c7 @% _! I
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
: n2 b6 f9 E0 H  q' {
7 R4 q9 }' m0 ^, M0 g
. C; U1 f4 @. |7 [' k- M+ L4 Y4 G* F
' O7 S# h( ^2 F& L5 U# {0 c) Q9 `图16  LogStash的消息过滤视图
$ r# g9 F$ D8 ^) Y) d8 M
以上是“OpenStack企业云平台监控的示例分析
3 T" r) g* ~& E( c0 K
: {" [0 K& n# k( M4 {

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2022-12-15 10:26:22 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控7 d# |) [; f) b) {3 y

4 U$ v# y" f9 X5 ^+ Q2 k6 a对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。- Q3 e+ H; y6 {( ~# D( m" U7 Y

" O5 G1 g5 L/ R/ _+ O3 R" j1 @Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。' `# L- E9 V& T; v; Z6 v7 B8 r4 s
2 e6 v) O8 ^- o/ T1 s3 Z$ ]0 u
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
+ f0 ]4 T3 d: ]" S; Z
/ e' D, n# o$ V
( _  `0 x$ O$ X. u$ n  ^4 v% m2 d2 J! S/ u. H- E  H  G) M
图1  Ganglia的Overview界面
% j. `  a, f3 w3 H1 l% Z: e
  T4 {( R! R' F' T图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
+ J8 T7 g% V# W$ n' T
' F; L4 z+ g7 ?" P
. U9 c1 G+ `: i- _
2 b+ Z) R4 z2 `" ^) O/ |$ A图2  Ganglia的聚合视图和节点视图
; ^; I* E: M) B. s" r, e% F
' b9 J1 L( F) M: J5 a1 A图3是CPU详细监控项目。
0 M7 N* i( Z6 O3 R6 h4 `* F* S4 d8 A$ `6 w1 n5 Q: z. s: D( q5 K
/ ^/ Y) o8 A5 W" e7 ?7 g

; g4 Q. a. H+ y图3  Ganglia的CPU监控+ y" |) `4 y8 e; d* g2 [) h

3 M2 ^* D) v) _- e4 Z图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。" p0 o% A- w3 n  `9 r7 a! H4 f

0 w8 l! C/ @$ s& W$ A8 N6 T5 A- ]5 J+ v% p( ]* b* N+ E0 c
图4  Ganglia监控虚拟机内存( G' Z# `; R, _# R. J, b" ^' ^
3 c5 f: ^3 G* H2 ]. {
服务与资源监控& R1 s! X& ]8 S$ ?' L" T
8 w/ q3 i& y& J& I7 H
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
- Y, `; ^5 Y/ d$ k  M  n: U9 b' q: m0 B
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
) n+ U+ T; A" u5 y6 F8 j$ F1 }. }8 y
3 [8 h  w; N! X0 k+ M) r# x( z' ^- O9 o" c+ g

1 E3 I1 g  `" x9 }0 s: U2 G" K图5  Nagios的连接视图
% x: ]) a) n0 o8 i7 ~5 B: r
0 h7 A) T6 a+ |2 r! h7 I1 ^另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
2 L1 w. N( ~) E8 T. @0 ?- L8 }# p# C" ]1 h/ d
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。& d6 X  n# A  O9 q( F

1 L" W6 g  o; a' u图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。1 H" z% [. ?# _  A+ L
. I5 h% W8 V4 d. s3 A# {) x) V2 n: G
* d( L; [6 {0 F/ s8 K
7 b4 k' h: h: }$ M6 I
图6  Nagios的主机视图# W( ~9 t- X8 l: N

5 _$ ^. N9 O3 A. `5 o- Q图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
. ], Y  _7 s1 @0 }) k' V4 I" ~+ Z/ I0 ^9 n2 L$ G
% O+ a# J+ l# h* \' G! b

& h. I' Q, j8 s, x; i图7  Nagois的服务监控视图, ^5 Q" ]+ b; _' f; c  H
1 G2 |8 h9 q) H0 R
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。% l% P' J8 t9 u

  k9 G( n- L: g3 e
1 F. e) s% D, ]$ Y, k! z消息中间件监控
; i; \4 t5 E- n+ Y6 l! k4 m5 O3 D2 o' }: |: F
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。9 e/ I7 @. S3 H# n$ n

! V( f0 ~# x, E8 r7 ]( H; K图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。% w2 `0 s# r# V
* q$ @* o; g8 c) o2 T& B3 a+ d7 H' |' x, R
% G7 J# ^! g  s+ B1 g  w* @' s) v

" u! O0 B* o( D, u3 |图8  RabbitMQ的Overview视图
8 T2 R- I* d2 w9 V4 S5 S! M. c6 l5 B9 l. u
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。- \6 t  h1 |7 ^' Y6 W: V! [9 H) c
& v# |& R; w4 M

! c  q3 s, a3 M- B) c5 f( h- I  T# g# C* y3 a$ Y1 g) M( W5 v9 {/ D
图9  RabbitMQ的连接视图
: }; g  X2 N* E2 A5 V( q' q3 A% @0 e! R. k, z
图10展示了消息中间件的通道视图。8 i1 p9 ?4 f8 R0 @
- e8 L- Z( Y5 A5 C. s' H

2 c6 R; e, B# o$ G8 m0 F
9 n: a2 j: y7 E, K+ T, j9 q0 [图10  RabbitMQ的通道视图
/ c$ ~3 J0 |" f$ w/ s( H# a. A
+ Q2 p& E0 b. j图11展示了消息中间件的交换(Exchange)视图。& ?# ^6 v1 F( T

& T  F9 q( j! ^5 K( Y8 [' {. L9 I+ c( V2 g* f
: H* }- t- A, \, x
图11  RabbitMQ的交换视图' T' U  ~+ q  w5 w6 B9 L  x
/ V8 V- q8 [5 x/ `/ H; Q
图12展示了消息中间件的队列视图,并包括了统计信息。0 o  _8 ~9 ~  K) ]8 L+ c$ W5 L: c  K- y
% f$ R0 L. a2 P0 I. a( `; A

; G# I" n0 d- N0 j, I( [  b
' b( t+ W. h3 v图12  RabbitMQ的队列视图
! e: Q" L! ?: y0 p
6 I" p( C2 }! e% k1 u, Q2 q' h图13是管理员视图,可以修改密码、增加用户等。
9 y* Z& n/ a  ?5 _$ _3 _6 x! T" p% k9 W% O) s( x* _
, q2 f$ M+ V+ }
6 x. B4 K  F7 [) F0 E& K9 f
图13  RabbitMQ的管理员视图/ x* z9 q, r0 k; o

5 l* v6 q+ K# H日志分析4 w. ?8 W. X5 x. I! L
& d5 t& e1 O, G* J: V
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
- m. e5 @0 ~# f( V: \) i# _8 o
+ L$ E6 c% W" U( sLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
( Z5 W( e2 r; f) G( l; ?6 x1 a8 T( p3 k8 S; L' h
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
, v6 {& {( w1 d# n. t' F5 ~7 N5 k, l5 F, T5 ^3 E5 B2 a
) E1 ^4 `7 z! b" }% _+ O- F+ I% x

# @5 V9 @2 a4 U& G# L- _图14  LogStash的Overview视图
8 ~( J+ `# j1 A: _$ c( [4 `  y! Z7 }/ s+ ?$ {7 d& p$ Z" l, \
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。8 F9 i8 B* v: \3 d7 L
  Z" i. t; k/ N2 }: e

' G6 ?  V  @/ f
+ L7 |. g. d2 m3 d图15  LogStash的消息视图
* t! t2 [+ o, K. H6 B3 I7 |. r: B2 p# }3 B' i
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。, m" g! Z4 _0 r1 S9 r( g

% |, ^4 \" l0 d$ \: E1 W
3 k8 Q+ C$ t4 S# c2 D& p
) B: ?, L6 o& x- [3 W图16  LogStash的消息过滤视图  v8 m" k0 N8 ], t/ o
以上是“OpenStack企业云平台监控的示例分析
# g: E$ h$ r  ]3 W: d
您需要登录后才可以回帖 登录 | 注册

本版积分规则

返回首页|Archiver|手机版|小黑屋|易陆发现技术论坛 ( 蜀ICP备2026014127号-1 )

GMT+8, 2026-6-12 00:18 , Processed in 0.022231 second(s), 25 queries .

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表