找回密码
 注册
查看: 610|回复: 2

OpenStack 高性能监控工具

[复制链接]

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
发表于 2022-12-15 09:55:23 | 显示全部楼层 |阅读模式
购买主题 本主题需向作者支付 2 金钱 才能浏览

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2022-12-15 10:26:07 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
% C- v; V3 w6 i1 k  O( \/ z8 I8 ~# h5 R3 o  T5 s# C' D2 |" W$ g$ L% O
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
; n- L  Z, k2 w) n
5 x0 w* |0 b1 {- C; y9 R+ iGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。  L4 t% ], ?6 y$ X/ ~! j
' Z  B3 `& h# d4 `) _
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。4 U5 t6 w5 B0 j9 ?1 k) L# L

: r6 F, A7 f. u  r  U2 D5 Y2 r8 Z9 V

. c% z$ i4 t1 d1 O3 Z图1  Ganglia的Overview界面
1 P4 u3 q4 k& N# a' [- U0 @+ Q0 y8 Z6 X
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
, @5 |5 J( j; h( s; p
- K& b. m1 R# T6 a- D# h* P. K5 V- s1 g/ a' |* q9 B/ o2 `
: y: k( _8 t; S: s3 K3 ^1 a( c
图2  Ganglia的聚合视图和节点视图
/ U' O1 ^$ L& c! l( K* s4 y$ w* ]- x' k# z  o% }
图3是CPU详细监控项目。
  Q) i5 K3 W3 B7 V0 F
! A" k4 ~6 N( s% X) W5 Y4 T' K0 T  t  p/ v% {; i: ^; N8 V7 J

- I" V" B7 \# T图3  Ganglia的CPU监控: X) Q* W& q: {
) h9 L9 C( D( v
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
3 q9 |# u/ }. O  N7 F" u
' |1 X, i* g( s  ~$ A- z, J  _; W# _: S" P6 ]* A
图4  Ganglia监控虚拟机内存
0 Q- ]* h* k+ a3 R( s: r5 {- X1 t+ P# a1 \, u; m+ Q+ j; S
服务与资源监控4 a, h6 ]% K/ @" l, L
( t" \5 k' {+ M$ M
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。$ v( P: \3 M0 ?/ |& H: K3 c7 h
+ m" Y5 Y& [1 ]$ S7 R: J
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
' n9 a5 k! m  \
2 x' v7 U4 f0 I' ]: e0 B$ s, k# i4 @9 F( _: ?

5 l( s) l9 l7 P9 e图5  Nagios的连接视图" R- J5 n9 U7 w8 d$ j5 z

' B2 v2 @0 j# O$ d: j! H另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
/ A* u( g) Q# Z% W9 y1 {6 {9 D3 A+ V1 L& V: u9 z
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。7 o; I8 D8 b% o

% B/ Y$ b+ X) u8 |/ u图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
* Q: F  x8 ^9 z6 ]; }
, G- s! O1 E: l. P! ?9 J- e) h: I4 Y/ M
$ h; U( C" ~3 D/ Y$ {
# Y7 h* C, }5 A6 ]- Q  Z图6  Nagios的主机视图
! V3 d5 y, R4 n. u3 r5 r4 m3 A8 y$ s: y1 P1 Y0 M# U8 R
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。# g6 T  O9 T* u1 _

; y! k. Q# P+ `4 a7 ~7 m$ l8 l
, n( V5 ]" z4 d% I& @
" I; b* f4 m0 g1 J图7  Nagois的服务监控视图
9 b$ ^8 j: u5 t- |4 A2 M
8 T  R# p- q+ k: v对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
' _2 a, w, D- ~/ q: K5 I  |6 i4 `9 W" M
/ }" [* k6 {; b# [
消息中间件监控5 e5 @9 N; p' |8 T5 n) K& I
6 f; S( ~4 i& h8 D
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
9 z1 G9 X3 b3 g& t' C1 v  r- y3 D# F! p0 l( u% y/ n" ?0 G7 `, l
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
( Z$ S  |) J5 m: q+ }; X6 Z7 F/ r+ m4 ^2 c  t! ?; M) a0 `0 K+ _

8 M; d9 |% @0 l' A4 a
; c% X' r8 ~! k: W) f图8  RabbitMQ的Overview视图3 X6 x8 ^4 W( y8 v' f

# M: \' }8 K- K% k2 P3 Y7 Q图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
$ h$ ~% J" O4 m6 v' Z. ^0 F9 G% Y$ o; b

4 M/ ]+ @3 i4 V0 |) N
0 |5 L4 |* Q1 p: q3 H图9  RabbitMQ的连接视图
5 X$ D% l% T3 F, r/ {+ f9 W" K/ X- h' D, [% P2 d
图10展示了消息中间件的通道视图。0 v( Z6 K. A' d: A
/ Y( A3 ?: g8 J

$ ~  f% l: a5 x8 j9 V! h& u2 j$ |/ s" l1 ~& n
图10  RabbitMQ的通道视图  Q- x! d" e" P" b2 w. ~6 l
) x0 Y, e% q/ ?, i9 e6 |
图11展示了消息中间件的交换(Exchange)视图。% _  f7 t) X; c; Z$ ]% k

1 R2 H7 h) O+ Z" J% Q4 E' Y2 @- O$ R: G0 W* C
6 U, c. v  ~" ^1 d3 d# S! R+ j
图11  RabbitMQ的交换视图4 y7 P" t% Q* c1 u* U
$ o3 H4 \4 P" B9 R. i+ W- ?( Q
图12展示了消息中间件的队列视图,并包括了统计信息。: ]( [2 S+ S4 p" i' u

( z6 L+ H; ~3 V- y! ]5 K% j7 _
5 B, s& H$ Z! V3 v5 l) M: ~+ k2 c+ p
图12  RabbitMQ的队列视图1 T& |2 S+ w& c. |
2 U. l8 ~# t: q
图13是管理员视图,可以修改密码、增加用户等。
( }3 _: K3 P2 k% k
, m" u4 ]  i/ r: z4 ~. Z, \- p, }: ~- O0 n
& |) {3 T. u, {; ~. _
图13  RabbitMQ的管理员视图- O8 O2 K8 T7 f4 n3 H
! \* c3 I% J$ X3 l% X! p
日志分析" r2 |8 z% S0 ?, P" c

+ z. l* T( z- cOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。2 D, Y$ X* ?; {  j& O4 f. @
1 q0 T8 R1 L; |6 H# [' Q
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
$ J+ p$ u7 L: @9 O0 |/ V/ C7 b4 N" g8 \# I# }
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。5 V8 _2 b" T2 b6 ?- ^0 T

1 `, x" |  }! `6 W/ h$ N9 G+ f) T
( v7 Q" Z, F4 \& D' F* D3 Z+ r8 Z0 T7 N7 N5 _5 k
图14  LogStash的Overview视图% Z0 P4 ^# K; k% F1 d
# e; l1 l3 V2 ~3 n5 L  ?; {2 @
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。3 Q# i& [2 G( K0 E$ z

: h) M* J( f8 }" f) J
$ f& X6 ?1 P5 w) `/ R1 m. O# L1 d( a6 z* e0 {, t
图15  LogStash的消息视图1 r. f6 v9 v6 W+ \% A1 h. V

) O/ v; J4 _; }图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
5 \& l( h$ e+ J8 e; m  R
$ a# x) F0 r& y! g  n5 V6 F3 q" T! D9 ~% F4 D, o/ F$ w9 v$ T
3 ], T* `+ h& d9 a( ^
图16  LogStash的消息过滤视图+ {% b  r6 O0 x; {
以上是“OpenStack企业云平台监控的示例分析

; {% z+ o- x: A0 f1 ^# Z" P3 H  v3 T

2 K- }3 X9 C% o, Y5 t- E+ z$ R( i7 L; n* p8 P; N9 T" o

6 e- l7 _; C2 C. I6 h0 U
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
* Z) u9 c0 @: |" [9 X
) T- w5 K2 G& V) y) ]* O对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。9 y5 i$ Q0 u8 N( U' B& i/ q# r

: V1 T' c0 @! `+ m" W) cGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。3 [8 _9 ~) h; s+ r8 J3 p

! a4 `, X! T& }1 u4 H4 \0 C图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。8 O& u. }7 P9 Q/ }9 o" t3 {7 \3 o

4 E) S  x: E0 K# _6 [. Q* k/ G9 e# g, t9 F

+ b5 B' i$ M! ]* l$ n. l图1  Ganglia的Overview界面# \( C; k' [' N1 g' E

' m$ |/ B" g; N0 b3 }0 D图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
" D4 o$ l' s) C2 G$ F5 w9 c
' y. [1 P: _5 m
; m; T. @! J2 L) B; J
& s1 K" O# Z( M5 |2 y8 n* r( n4 m/ |图2  Ganglia的聚合视图和节点视图2 U. H; D( ]- O; E9 D
( L" H# m7 I6 g9 @6 M# O  ~2 N
图3是CPU详细监控项目。
6 u  @% w8 [+ B! M- e. F7 n: I6 k* Z( m$ e  ^
8 e0 ^  c* _  e& j% x* w

% h2 h( f' B: L; Q1 K7 Q7 o. a图3  Ganglia的CPU监控
0 _8 J9 C/ ]7 |7 c' C6 c" Y3 Z! p
) l6 s. x* F' e$ i4 |图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
$ C' B  n9 m) `$ }3 P% t8 |2 C8 c" m0 L/ @$ k& p8 Z9 H6 ?. ?
* C8 u% ^+ q+ n8 \
图4  Ganglia监控虚拟机内存
  `' T6 {% ~. D+ ]  R, S5 N4 `5 Q- t. M! F- g% A2 k4 v2 _
服务与资源监控: j# V3 T$ I$ Q0 e1 M; v) L
0 D* x0 [) V7 F# q
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
' G% o4 d, e6 w: @
( t$ m3 V! V4 T/ S  M1 Z- p图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。9 r4 G% f$ r5 _8 g5 \8 ?
) W& ^' J5 @2 \1 |5 Z5 l
: [* w# k3 _! t9 G1 X1 {# Y

' f, I+ G% f; j# ]图5  Nagios的连接视图: a- j# i/ ^- I4 s: \

: f  f6 p3 Y6 u另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
' C- K7 u/ V( v/ ?- k4 a0 s# B- [$ |4 S5 a, O
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
/ X* x6 F" J' }% w
' Y0 `" Y( Z" o! P2 o图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
* H4 A- T: s5 \. G: N4 ?5 Y& ]! G; w, u$ {' x3 `
( D% p6 G) j$ e/ L1 c: N

' A; x  @$ H# ~6 z% `7 z# ~图6  Nagios的主机视图
7 B& j) y7 a6 M) `; q! I, [! j
5 C2 N' B1 t1 e1 q7 E图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。5 h9 o1 b' Q7 ~  M5 w3 g+ ?

$ r( ]6 a& f4 t# {% W! |# ]3 b0 u  R; F1 X: d8 b
! M2 ]9 f6 Y3 _9 \. |" m' f5 i
图7  Nagois的服务监控视图
1 Y/ F" H& d- _9 f" r/ S9 x( c% K3 \  F; X0 T/ K  k2 D5 D
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
9 Z* v0 F* T# m, X. n: o$ O# w- N
+ Z' o- I, M% ~9 J$ K
( }$ z$ X1 G! _! ?! o6 [消息中间件监控+ c( I& c( G, T$ O) _+ d* b

0 {9 V( y+ R& c" J  Z消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
5 ^" ]1 W' I" {- \1 C  S* F( U
1 \/ X: b$ ~  w图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。& `8 B& g8 f9 U) D  q, Z5 o

4 k# N1 i; ~  C$ n, E' r6 X4 p' j$ c( N+ J. A9 M% A9 s
: O' _& c: T& [! k) ^
图8  RabbitMQ的Overview视图
2 U8 b  p5 l) d. x+ a; D* b2 h! e
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。$ a6 V% ~0 W' s; d0 P' u/ b

+ B! W; A( W7 }6 r- I
3 n$ m, {6 m0 I( m! I: m0 `+ t( W" o8 Q2 l8 c3 q( F3 S
图9  RabbitMQ的连接视图; A8 M8 m! v& d* Q/ w
  U. g/ P, @  O* E4 M+ u/ j
图10展示了消息中间件的通道视图。0 @2 o% T8 R* k0 b3 z
. {- m. z) n  E

7 W/ W3 W5 Q$ `6 G% l1 R3 c0 ^- C1 L7 j) E) r! X  W6 t  r
图10  RabbitMQ的通道视图; d7 J# T- s9 Y" ~  U. J

6 ?3 {* T: g, F/ i9 @图11展示了消息中间件的交换(Exchange)视图。
4 a4 ?/ Y2 A2 {* I( @$ w8 z) x
# Z( U1 Q% E* K* r' {& `' }5 X: Y* K8 C: S& @# G/ w
% z5 D  k  J- L
图11  RabbitMQ的交换视图4 g( T; P: Z: N2 J# Q: x+ d& N
# t  D/ f+ |  d3 ]" o7 {% K
图12展示了消息中间件的队列视图,并包括了统计信息。
" O  T7 f7 J: a# N8 Z$ p" U; ~. a( V5 k; Z6 G" R8 `
& T3 t# h7 M2 m
4 h/ k% x+ C. e8 j) F. d
图12  RabbitMQ的队列视图, D8 M, b# k3 a8 O$ r4 Z( y1 |

  n/ e; B3 u+ b7 W5 O+ C6 B$ u1 e图13是管理员视图,可以修改密码、增加用户等。
( K. I: D! l3 y
& X7 n. @! U5 g/ U1 ?9 `3 K7 B
2 E: e$ ~; I6 R4 W; x5 s  }0 T3 q- n1 [
图13  RabbitMQ的管理员视图5 G' `, m2 [/ `( o, @

" e2 Q7 Z3 R) a# K! C4 }日志分析
" a) T( r+ L5 \+ p* B# @- O2 Q% V) H5 c& Z7 ^5 C
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。* Y( G+ I# F4 w* E

, `; ~- G( F6 O. ?, [% t5 u: pLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。' T2 j, r! }9 c# z

+ ^' t4 {) v5 V, C图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
1 i9 j$ s; T2 ]: L" B, q
$ L. \; W* B' _6 Z8 }) h2 W2 [; n8 A0 e/ `- K
# i" Y+ b, s$ x; I5 {
图14  LogStash的Overview视图
9 _* t# D% x! L& g8 a+ W8 @! x# A. Z# Q" s7 _
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
7 d6 r0 B; n. B& U7 G9 f  W) H( r* N! p$ x, F4 B8 o
% n1 ~& p4 n# v, x  E/ H9 [

" ?# |" j; b+ u+ c  U图15  LogStash的消息视图* ~  a% ~6 i9 o* l& D( H: o. x3 |6 q" X

' \3 D7 }$ O. o* N8 e' I: r图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
1 r1 t6 g! X7 r3 R# r( ]! G, s) @( n" _. r
) l5 d0 Y- ?/ J1 U) A
0 \7 U: l8 g: Q5 ~; i& W1 R$ s/ G6 ?$ M3 I8 t' h  w/ m1 [/ {
图16  LogStash的消息过滤视图# ~1 d1 J9 e! o# S% h
以上是“OpenStack企业云平台监控的示例分析
  d/ y) U; {! O$ ?" e% E! A9 H. ]
  \3 b. [# f8 m9 ~

1

主题

0

回帖

12

积分

管理员

积分
12
QQ
 楼主| 发表于 2022-12-15 10:26:22 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
  h. v% ^& v- @' U: w3 x* K0 L
" `! f6 B+ M: W对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
) b1 q& b8 Q5 `. h5 c) O4 L) P5 p
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。5 S. r7 x- P+ \; R" Y9 I* o5 s

5 k' c0 m# l, ^; v: Q! w图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
/ @7 z6 k, u  F! r0 m& Q5 ~4 T& O( v: p5 G

7 f7 O* n% L; D1 ]% d7 |  l  S5 n3 o2 P# p8 G" [0 U" f' N% j. b' E
图1  Ganglia的Overview界面
3 Z$ S9 i4 ^8 e" t' x! t6 y
/ H+ @# E* R0 w. W$ O4 Y5 a6 r, O图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
: d& t( ]' ]' C5 c# b$ }6 b9 c* _0 x, T+ _* b

7 ^& J: h' o+ L$ Y7 s1 d9 d5 k  Z5 }
) _5 @9 i! V+ a& E9 t图2  Ganglia的聚合视图和节点视图
+ V! y+ B3 L" Y7 k$ _5 V
8 T8 y# Z6 f8 I  W; l' }, U图3是CPU详细监控项目。
" S5 |8 Q% x* V" X* U/ S) K9 H" P2 _2 C& @2 V( b) J
' c# b& e: `5 n6 z( b  W0 o

( P+ `/ Z% i% S: i, F& G9 |' r图3  Ganglia的CPU监控4 C' P- |  r) q* s+ T7 {6 n: E9 H
. h" e1 j& |% e/ n" g/ J1 q% t
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
; t$ p. |9 W3 {6 X" l9 Q9 `8 m5 m+ F2 P$ R$ j
' _% Z+ x% j/ k
图4  Ganglia监控虚拟机内存2 U" J! n& X9 f, I% H6 f6 i0 I6 t
( v/ {% C$ O) ^& l/ v
服务与资源监控
. d8 J0 x9 y4 ]1 g, H
2 r( H; L! Z8 a3 o6 G( kNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。: h6 ]5 g" O& _/ @: |* s  o$ I

" K& @! j( t0 ^图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。: I( s1 |) a1 D! O
; q2 Y. ^/ W' S9 H6 K
6 z1 p/ s) g7 w9 a* ^0 D
$ e$ M1 X& M- |9 t5 |; H( ?
图5  Nagios的连接视图9 V" Q& D' {5 {3 H. G! ]& K+ Z
! O- h. Q$ I5 @  _! C2 m  G. `# n3 ]
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。3 i9 j2 A, m% `1 n1 F, L, }; J( S
8 v4 C6 }* \1 r) Q1 E4 z4 j) g
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。: y" @8 U* O0 t/ \" J; N

1 r: X6 @8 @8 g  Y" P% S, w$ ^4 [图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。3 n/ S" y% n- z8 z
- _1 R1 ~+ Y* H; W7 z- i
5 z0 I  U# j  U& R* O8 d1 D7 I
5 [  P* c" D  j; `" a+ o
图6  Nagios的主机视图  o% T8 L) N" K9 t4 C5 W
& H  o% [. c3 f
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。  h: J! ]: J  g/ h; ]

' d8 P; Z- G" q# T4 [& `
3 w1 f2 d. b5 @& I6 X% J' s8 [/ T$ s9 y
图7  Nagois的服务监控视图
5 E' k1 B$ T& u- x1 p9 B0 w$ a/ p/ t0 t$ e! J' I; B
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。9 S  O  G: [# N

5 M8 H5 D/ r2 f7 t, @0 B1 f, j+ u0 o) X" z8 o  G
消息中间件监控$ N2 c; v$ Q% s3 F( n3 e- u
1 h" J) J6 X/ R6 z
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。- t: V: _% c; x7 W: _; T
9 K8 g- p  N' G
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。: G) j( ]; B/ T# Y4 }, F
* M  u- y; d1 Y5 L
& d/ H7 W: M# R: s

' S2 I/ Z. I5 t  A图8  RabbitMQ的Overview视图; y8 b( c7 f' n: M7 b$ t
- F$ N/ P  E) G  ?$ _8 k8 S9 v
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。# i! D6 x& J- F2 q; l' E# g$ S

1 M! y/ ]6 f( r: Y  _$ b% Q
: h- |6 x" }0 F. G9 J" V& {/ }7 D/ v# p5 n$ V/ u! {) Y& ~
图9  RabbitMQ的连接视图1 d6 r- j; {- H8 x
  @7 N2 j+ |/ p, q
图10展示了消息中间件的通道视图。( m- ?1 E' b) s- ^: ^
: ~! J1 L% B5 E# y9 `
0 ]1 r: d$ O+ L$ ^  t( a
. V8 {# `' }8 j/ w' Y! |. z
图10  RabbitMQ的通道视图9 U* d; H: p/ U2 g& p+ X

4 ?( Z: U: v' n5 R图11展示了消息中间件的交换(Exchange)视图。
+ V; X6 w* Q4 v# G9 v1 T5 j( ]' l0 k1 n& W2 y' V" G& p& N
( d' t# Q$ B! d$ m

7 `5 N2 X2 H* j图11  RabbitMQ的交换视图
# f  D2 S3 {& M; `  j6 n" @& v' C; a2 C
图12展示了消息中间件的队列视图,并包括了统计信息。. ^; S5 r4 u4 l! `8 U
7 L7 f6 x9 m$ n$ N- H+ `* M

- U4 {8 V6 \2 e; w. g8 F. m" v8 Z2 h
图12  RabbitMQ的队列视图# f4 s) }- m3 y9 a
, P4 N; y2 i: e) p2 J0 y
图13是管理员视图,可以修改密码、增加用户等。8 e& u. B+ P6 A7 w* C# H
' c9 R- f9 J. z3 K2 F
3 N+ \9 X# @. O* T6 X

! i/ w; y4 Y  r3 X* a9 ~图13  RabbitMQ的管理员视图1 b+ O; |: z( M& M
4 V- M1 S# D) U& Q0 g- z* g
日志分析
5 k# Z& q7 v  {0 @
+ K% s, g. Y& c: m9 TOpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
8 `. e6 W/ R- V3 ?8 H+ e
3 v$ p! P! Y! E8 JLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。* I4 a( c8 [6 Z$ z

! x3 {' M1 V: d/ G) }& l图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
) b7 C4 E/ M2 u* _
3 d# @  W3 }$ m4 C
& H8 O% m1 c1 M- H
) {7 v0 J$ v# Q4 W/ v/ E. R图14  LogStash的Overview视图" @: S  y2 ^2 M* P) u( k

& Q- [) x+ O' I5 [, u8 L6 j图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
$ l* p, `( s  O8 Q, l/ a
/ [6 a$ Z' P& W. C4 l& W. g3 S# D0 p: s! m. \/ y
4 Z6 |+ r$ _! s- d% s
图15  LogStash的消息视图
$ E" W! q+ [9 o% x: U! j5 {8 Y  g+ C( g8 J
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。" {3 u. V% H/ M0 z  o# O6 r8 A" j" ]

. m3 _% z" b- _% O9 U5 ?$ o, f- \, ?9 S& q6 P2 _/ ]) S

. u4 h' ~3 I2 O, }' `图16  LogStash的消息过滤视图
8 d0 G& ]8 F, h
以上是“OpenStack企业云平台监控的示例分析

# X5 i. ^3 q; j1 s- x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

返回首页|Archiver|手机版|小黑屋|易陆发现技术论坛 ( 蜀ICP备2026014127号-1 )

GMT+8, 2026-6-12 00:14 , Processed in 0.027562 second(s), 25 queries .

Powered by Discuz! X5.0

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表