开启辅助访问 天气与日历 收藏本站联系我们相册切换到窄版

易陆发现论坛

 找回密码
 开始注册
查看: 343|回复: 2
收起左侧

OpenStack 高性能监控工具

[复制链接]
发表于 2022-12-15 09:55:23 | 显示全部楼层 |阅读模式
购买主题 本主题需向作者支付 2 金钱 才能浏览
 楼主| 发表于 2022-12-15 10:26:07 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控2 S* {' y; W0 n# u$ I( Q0 [

) x; A. @5 S/ p- b+ S! |( e" |对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。. S3 e/ T( d" m) i/ a0 N* T
6 g+ U  V* M/ e1 _) l; U& D
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
: g) V  v) x, O4 K9 I6 w
6 ]& S1 ^' U; f, _2 R# v5 x& {图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。) F* F0 s% e  D. G; E& C" x
  X. z0 b; U$ s0 }3 r
+ O9 ]# G9 v, \: K9 ^) V/ k. l
! F: ~6 E5 Q/ N- ]5 k
图1  Ganglia的Overview界面& |, u& ?/ V, n. t
2 C9 r6 c, C4 h; b! U2 |! H$ Y! ^
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。' W, U, j$ _5 e* _+ x* A

% M4 a! `8 x+ q- v- @1 X" f6 c) \7 S( s6 ]8 a+ Y

0 t% S' {$ K4 ?% o图2  Ganglia的聚合视图和节点视图8 r; }. @2 ]9 @4 z7 N' z
: i) J/ W  b1 [: ]: D! G4 t6 A
图3是CPU详细监控项目。. z4 o2 _5 g6 |  w1 I/ v  ^0 `. z

6 w4 W1 u- }9 _1 A% r0 W* X. y: U  k4 ~5 `# {: R, O
, \- Q6 s" i7 O, `2 _
图3  Ganglia的CPU监控- j1 K8 b) L0 l
' n$ l& F9 G9 i+ i+ t# O
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
2 E! Y; [0 }9 w1 C0 T' ]1 q
4 W+ `. N7 V1 Z- H- O% A% p" x+ q% l% |$ |
图4  Ganglia监控虚拟机内存) ~# c$ I5 |4 _8 j7 K( K' K8 X
8 l7 s4 l& f) H8 z, }
服务与资源监控
3 I+ _2 y( w; }" `1 A/ G  M% p( u2 f5 u" @- m. X
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。" F/ o' J( W3 v3 s
0 H6 X3 @- y8 ]0 G0 X9 {
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
% S0 n2 E1 q) |9 ?. l% V2 u$ [3 u% N; J

+ X$ s' V: D: K/ P* o& b' D
# p3 n4 p9 m1 |/ r& m' x图5  Nagios的连接视图
; o4 _/ j( F8 |% T
! \/ R- K3 _# e! v- @# t% d4 P# t: Z另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
, C% A0 t" {! M( ?+ S. G0 W2 o  j. y: q1 S
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
% o2 l& @; m, M+ Y& v7 t
% I; F( D( a7 ^$ e图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
: M8 l/ J8 v  m* U- Z* ]2 S' ?4 a5 T+ v
2 K, G- {; O# Q# N: D

$ H7 [' J& _( D图6  Nagios的主机视图
* s3 U" C$ k( p; Y8 i) y
4 F' Q; E0 K- X" a  U图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。. `, J. `! C+ t) z

; i  L" k# @7 e# [4 |  B4 G" A
% c& R- Y/ `$ s; |" t& P: R# P! O- O0 d, V
图7  Nagois的服务监控视图
+ Z6 p; f/ t' M7 ?. d% ?2 P% d& ^2 E2 |# l( v* |* w: I4 i
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
4 q, n8 d! [. B+ K- z0 A$ c1 H0 v: f0 C0 }2 w
8 a5 t! N+ T$ C8 T
消息中间件监控
% g8 \& H7 s' l) i: O3 ^! R3 x$ P: u: |- ]' [4 G) x
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。' ~0 X$ o" x: c4 D8 a7 Z1 [2 Q
" f, I$ f1 h; ~( s% k7 B
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
* C0 e/ H: t+ l( a! T" j' V% H
- x+ f  `" Z: Z( z* `/ [1 G3 t2 y' r  I

/ r! F  P4 Q& p8 O图8  RabbitMQ的Overview视图
3 W* T5 A+ G% A3 A1 @7 X+ o
4 C% R+ a8 O( `6 b7 ]5 ^图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。4 x; E/ k( a6 H3 `- {

) _/ k( ?# G& W6 i; S+ j/ l9 F9 Q/ `" ~% W2 A

' ^$ ^2 n7 c1 W8 c" g" _: c图9  RabbitMQ的连接视图- e  ^/ c/ q7 J+ a6 ?  g) h9 J$ E* O
9 f5 D: _; ^: |4 f: o6 }: g1 j
图10展示了消息中间件的通道视图。
0 c9 ]2 L, ^" Q! \. q" V
7 x9 Z  D$ b5 Q+ ]
4 m0 a, s( X6 {7 E8 v+ _( a0 ^2 ^+ m7 X& u+ W3 |
图10  RabbitMQ的通道视图
+ j7 f5 Z( @# G3 k; {) {! N" B4 Y; T, Q" ^* s5 Y. ^6 L6 x
图11展示了消息中间件的交换(Exchange)视图。: l3 X+ ~( F6 R9 l6 g/ A1 M

! u; m# m: f/ a3 @- Y; i) M" @: C% ?7 ~5 c
2 F' h4 Y5 p6 \7 x- }
图11  RabbitMQ的交换视图
1 b2 o: L4 N: f2 \1 v
5 h5 a6 v( W3 L% h$ S' k0 f- l图12展示了消息中间件的队列视图,并包括了统计信息。
4 c# k# C& }! X, r; M
6 L' _( f( {* b7 {, O$ a* @7 q* U8 }% U  T# a+ r
% T: m& B4 U- }) l3 {5 x
图12  RabbitMQ的队列视图
$ B' S) T( Y; \2 @8 Q  Z# W7 ]! d$ T6 J
图13是管理员视图,可以修改密码、增加用户等。7 Y0 n1 s; X3 V4 k

  b% s. R' B) V- I' r( {% j4 O6 {8 q  [: n2 O+ U6 x

. D/ u) H/ C1 J图13  RabbitMQ的管理员视图
' b" X) ~2 Q" G& p2 M! i8 g  r  i: z2 k( i& N3 _
日志分析* `; t- B# d, U- W" [9 w7 k
% l  [/ F" I' G; |& ~
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。! b: f5 F' o+ p5 v7 W
& r3 z. o3 x; g) ~% s
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
1 X) `# ~4 n- C8 S" Y$ _6 A3 L: Q; X) j7 Y2 t" Z5 |
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。. n# n6 r9 m( O0 r5 w5 N* ?
$ _" E1 K; v4 o2 h: D) O6 a4 \

3 h3 n$ s( c# w! a2 v2 I  ]3 T! X9 e# q6 t
图14  LogStash的Overview视图
; A+ T# y3 K% k% a1 o# L/ K: w% u3 e0 [4 M2 o/ B) X
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。. l' C  W( X( f. c8 `' n
' A& F1 v1 y. j- W7 o( H+ c
+ d: n, w% w6 n! A' {
, {9 S0 M- c" G# D$ z  ^1 N
图15  LogStash的消息视图  B) c8 b- W6 M4 O+ h& K2 u2 U$ \5 o

3 j7 i  T- i" P6 }% j图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
2 b3 z2 o9 }4 c5 u1 P5 Z( P2 j$ m+ d

( N0 L' h1 a3 j* z
! A$ w9 ?3 ?( l- m* g- G图16  LogStash的消息过滤视图
& ~0 E  |2 u9 ~' V
以上是“OpenStack企业云平台监控的示例分析
' A1 @) g: k+ c
( n$ b% o$ P% t; B
2 s$ X$ ~9 \6 u. f
) y- S. t# I, N# x$ d1 A

& u$ Q" P+ ?: @" d! p. K  ]
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控  y, c: g* I1 V& e! X1 d" p
2 R; J) _8 U- l  y, g
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
' A8 |! e' ]2 p
  h' e( ^% }9 l2 N: b6 O5 K, g7 EGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。# A; _5 s: p! z4 e+ X

& F/ f3 @' m  ]4 }图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。7 B6 w/ }' v9 G1 E6 C. s+ E, p

: D' i. f5 h# K- x
. \# \8 M6 f4 j4 n# d  X% a8 t, c+ U7 o9 @
图1  Ganglia的Overview界面0 n9 N; W, P7 N( l9 U% h# [0 ~' U

7 Y7 B1 U) P1 Z0 _) L图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
( y* G9 G% t) `4 i, [. p. v+ Y7 P) H2 c# w

1 q3 ~; t: ]1 X! z7 U1 u8 R; w( V8 ~. ?" |# x
图2  Ganglia的聚合视图和节点视图
% f( y' H: m, l1 g# a3 W
( s% I! }* i# \- s图3是CPU详细监控项目。) O! d9 S& k" a9 c

! i* |, E! K1 O8 q, l5 R5 s9 Z6 D( a" V' w4 G+ F% f* h
$ P) F& U: Q/ P" X  N" }
图3  Ganglia的CPU监控% \$ K4 A& I+ Z" J& C& a
- n! G6 G$ C: ^) P, Q7 w+ r, t' h
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。6 V" V4 C1 r% d* o: N# a+ l7 v

! q3 v1 P9 _# D7 x, E# q0 G' U. i* Q+ w6 y7 w3 C
图4  Ganglia监控虚拟机内存' D$ Y( d4 U; X% O6 i% E; w
. o" g( D# N: X  n7 Y7 ~1 M! u
服务与资源监控$ T" I. t  y9 S, |$ A, G4 v/ Y

1 C/ O. }+ E& R6 r5 R) K- aNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
, u% Z% o- Y# y. _( B  n; {# J
9 p+ Q/ z- P! M0 w/ Y" N8 f/ @图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。" K: ]$ `" m. p0 k  Y/ b4 o

0 @' x4 D- p% f2 l
, D4 q# ~5 p/ ~4 ^0 ~: x9 m! L2 y  }3 @. Z
图5  Nagios的连接视图
" p/ E! X; G4 f' ]! h5 a- ]- ~0 V# ~8 _2 N7 B$ R
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。, [1 w" H0 ~0 l
! m1 A: s& |$ r; `) b$ a# c
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。* C0 x0 K/ _9 t  X
8 n, x( L( I6 A
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。3 y2 n/ O% R0 f/ K4 |% O! L

& p+ _! ]  w0 l  p4 Q* c2 Z; x, D2 E) ^3 f9 a

; D% X# L! K2 @1 e6 h" Y9 c图6  Nagios的主机视图9 I( x3 Y  {' Z5 j2 a3 E! z

5 v! d# q; f1 s  v: M# K图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。" }3 O; l. [4 u- s. T' ]

, f6 |% k5 Q. q2 A( c8 V& b
9 b* a. ]" s" r; g
5 d( ~% S& m+ N9 z/ B4 |5 t& c图7  Nagois的服务监控视图
$ y- h8 S: I% w3 _- ?* u6 f+ F  [* B9 W! X, h' z9 c; t5 ^
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。
! w0 }  }; _! W) G0 e; A
- g7 e2 e: x8 R3 K" Q5 B1 t$ _! {( E" ^2 D* B6 y
消息中间件监控9 y6 N& v3 a) t  ]

0 e% L+ S, M/ o& d) V消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
0 j7 y9 w3 Q; J: }( G- [$ m+ @/ d& C1 |3 p( b' n: I; {5 X2 C( `( t' q
图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。& T) j4 o% _: g/ _! e

: [# I+ @1 u% n3 d0 x$ T, R! t. b% D9 y. ]  X

( s% d& j  I* s图8  RabbitMQ的Overview视图0 W* B; e2 b$ H$ v
! d6 i! [6 v, T- |3 S) X$ M
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
, D4 T- Q; _: A& W1 P4 _5 i3 m- w$ ^- ~' T$ K2 l' ]

) ~! Y, P/ e1 l/ l1 P9 j
* y. t8 |/ {" ]0 {8 q9 e图9  RabbitMQ的连接视图' T$ o& ^/ t, v6 z# `9 d

- c, a6 Q) W/ d4 l/ h2 C5 E/ M图10展示了消息中间件的通道视图。
: y) o$ a: q+ E5 I& ~. a
& G! W  a- Y: d+ B) I, r
0 K* R5 J) O3 o9 o, p( n$ l# l) O7 T5 K9 \! X$ T" Q% H8 P
图10  RabbitMQ的通道视图
- m, y6 y$ ?; g, }
6 N' p+ C  c% ]4 E/ Q1 M/ h图11展示了消息中间件的交换(Exchange)视图。+ g4 d5 v4 A" {7 ~  h" m
9 S7 k; M9 D, c8 [9 o
8 ?0 j4 v8 [! _" w7 p! c3 X' v

* p; G- _8 s5 \5 `' P4 J图11  RabbitMQ的交换视图( V9 J( e" o) `. D& y

6 H' T+ `& R6 b% g& I2 p" E3 |6 V图12展示了消息中间件的队列视图,并包括了统计信息。, I7 g2 J8 _& Y; a

1 Z0 C$ b8 }! ^) V7 T* @4 [8 ^) u8 y8 R3 L. B$ v

! t$ }  I1 |: r5 f0 a+ z图12  RabbitMQ的队列视图: |3 T  r# C7 E# g
9 W" O& B* |1 f# X
图13是管理员视图,可以修改密码、增加用户等。
% h$ `8 H5 R: l% y" \, L* H: `. C" h

2 `0 }5 ]$ ]$ K( B, ^
/ d/ B( }' H' E5 C# B+ O图13  RabbitMQ的管理员视图
  _3 M# P/ n- q0 @# p6 p* @6 N
; s2 |% P! M, ^9 J8 j' N日志分析2 J8 A7 q0 w8 J8 ?4 m# p) h4 X, b# ?

2 G" H/ y. |. P) l. f1 F4 ?OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。$ S, g7 Z( n4 D5 E- P$ {' Q

" m! |/ C7 A$ |' p4 P& pLogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
; {# o# e1 p3 g1 Z
( o6 c9 m+ y$ L# a* A图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。  i8 R; n1 @& u! E

( J( m+ D, s  r; _
+ S4 e% j) y! N8 C4 v* l9 r
  w# U. k0 S" `图14  LogStash的Overview视图" j* F3 D, k0 W: |- b7 J1 E/ r

2 x" F! v1 \/ G& N5 d' q1 ]) c图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。( t) N) A, o2 G" m3 @. O

" a' k! a0 b6 J7 m# I/ @9 q( t" x. ], M

* V; D* a# c0 O4 _图15  LogStash的消息视图7 v$ }$ f* o4 D1 U5 [* m2 Y

# t" c' J! U9 Z" L" u图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。6 E$ b% ]/ ]4 w4 g3 e$ ~# k8 p( N

" z; q; f, ?2 @6 \: h5 y" Z* V7 P. S: Q

5 k* x' b; B! r图16  LogStash的消息过滤视图( g- H, _/ O) F
以上是“OpenStack企业云平台监控的示例分析

& F# D5 a/ \1 j- ~4 F( V' I# ^# K: F9 `
 楼主| 发表于 2022-12-15 10:26:22 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
6 i9 n. s7 K7 ~  ]. T8 J+ Q! d9 W- H
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。& l; V' _5 F0 u- o# G

7 i8 ~9 R8 o$ cGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。5 u5 A* A# j: {  c; A
2 y+ ^( F6 q# @/ v# u9 Q& i/ G% g
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。, E; A/ F& n) |! N% ]

* D2 R$ F0 E% y2 ]  Y7 C" p# E  d1 `                               
登录/注册后可看大图

1 g4 ?8 r6 j7 o
# H8 R+ Z+ n6 t% F
6 j2 B7 H9 [0 L( {/ T5 {0 B图1  Ganglia的Overview界面
: a0 L+ G0 H) t$ Z* k) l: [- k! r1 a
7 O8 S! {, d* V' i/ F$ A1 s( o; \: s7 |图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。6 j: L9 [' F4 m) V- W

5 z3 J% l6 }1 A0 C

+ h( Y' h: r7 Y2 R5 L                               
登录/注册后可看大图

) }& s9 G' Z, {2 V4 ^) {
+ f" X% f4 r! g4 M图2  Ganglia的聚合视图和节点视图
4 p9 V' o+ N, K# J- ?6 |. i$ P7 M
3 G' V( O. g# u4 Q图3是CPU详细监控项目。
2 e, c3 i2 `  i3 o1 b. O  Q( T1 \, j0 }0 F

, V( a7 b/ U4 k" s$ j                               
登录/注册后可看大图
4 c, Y% d1 a  \+ W7 k4 U8 I

- Z9 a  y0 O/ r( n/ R; Q1 J, h图3  Ganglia的CPU监控+ {3 ^5 V) c' T9 r2 N, z9 C

; }( U; [( P$ c( l图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
% \$ e, S5 H1 H& C- B7 W+ m# `' D
+ _" f$ d' ]. ~+ f
                               
登录/注册后可看大图

6 p1 T6 u9 V) h; ~4 n! K4 V6 ~$ v, L图4  Ganglia监控虚拟机内存2 X7 R5 u; }+ y1 \% ]& V
( e2 K* a- {( |6 m  M# s( o! L
服务与资源监控% H6 p, u6 Z; o8 t
! x2 O/ [" d# ]8 n# @. w- I5 k: Y
Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。( Y6 E2 w( I  B; N" l- F

( s$ N9 O& ?8 @  H图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
( Y! G+ z  J/ C: M: `  Q+ z) G, K
; e& M, \" _: G6 G! ]" b! a; n& J
) ]. [* m8 J* L3 b& p4 M  @

( y3 Z! N4 Z& k# H+ E                               
登录/注册后可看大图

$ D% m2 L. p8 I9 i6 R# x7 S图5  Nagios的连接视图) A. X! ~$ B+ C+ b1 ^2 _: I) t+ `
6 T6 }( @; f7 z$ L
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。$ C- k0 F+ O( [; z/ R
- C' `3 `) w$ [6 }" n
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
) v, y1 O2 K* Y, p  Z5 _- p% h# F# S/ i2 m/ D) G
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。( o; z  f# `! h5 D
0 D( j7 G8 O# I, A" g# w, }* [3 ]

& A: ]( X% a! S( E# B( r( [

2 |5 ]7 W9 o4 ?- W, e( Q                               
登录/注册后可看大图

: x6 S+ ~# B9 X图6  Nagios的主机视图; z, d4 _& p1 i* h- B3 @, V

7 y& B* ^3 R( Z* O* R% v图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。+ F0 L! D" l3 F+ q2 |" y

" H. _  U3 E: n" K6 P, |( Y' t
" m+ E- e, s" y/ K1 n6 H( T' _5 O+ b/ B
  O2 ^0 O9 ^; k1 P1 b: Y" n* o
                               
登录/注册后可看大图
& L  b4 I# x7 R0 c/ f! R6 T
图7  Nagois的服务监控视图1 i3 v! e) _' D& q! ~
. R- q$ `$ {' a' K& Q; R- M5 K+ ]
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。  e5 F1 @! S+ r; |8 T
/ n9 x$ e# k$ }9 A, m

& A  q" t5 G0 D3 c  g消息中间件监控( C, A+ u" w+ `
. W- l4 F  `, `+ J
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。$ H$ W* d- J1 I& R% W( c

  }  j0 s5 f+ \图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。( P  D( y+ i4 x
) T  [! r, L1 e

  C" P! c, w: ~  M6 Y                               
登录/注册后可看大图

: Z) v5 L- [5 n4 j! c1 G4 d- `- j+ U6 p
图8  RabbitMQ的Overview视图
2 E% U/ u8 Q1 g. ~5 ]  P
) D& G2 K+ e. u图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
1 Q# ?) Y' l( ~7 g# S
% S7 O* l+ W6 S" l! V6 M

8 q% H& D9 G9 w, I) R! j+ w                               
登录/注册后可看大图

4 Z0 |$ C2 S+ L) _6 d
2 P, }9 ~* [- z. r/ T$ M8 E9 m/ V图9  RabbitMQ的连接视图' @) c7 N& V7 @2 ]/ p( u

+ P) d& t8 Q! n, |) V  C2 H7 @图10展示了消息中间件的通道视图。- {" f. f" D# V$ ~; ]* B. t

& r2 s4 y# t; t4 \
2 x% I6 }6 C# V
                               
登录/注册后可看大图
+ k' r$ c# y0 T) X& @/ b2 i' `2 G
6 Z1 Z/ B. Q. F3 U) U+ `
图10  RabbitMQ的通道视图
! V0 Y" ?) v4 H2 O: q# R+ L+ G+ ]0 h% s/ G+ w: z  j4 k1 w- B( ?
图11展示了消息中间件的交换(Exchange)视图。9 I4 X$ Q/ v* Z
& A2 S% \- Z; b% c' L

* s2 d" d6 d! ~3 \# N                               
登录/注册后可看大图
# p6 s! y& _' v8 U& J
6 \+ I! X4 x3 }6 y5 w- H6 H5 @
图11  RabbitMQ的交换视图
( {7 S( p$ p1 R1 ^2 e) Q* m+ O4 t: y3 s6 S7 |! f/ Z
图12展示了消息中间件的队列视图,并包括了统计信息。. G7 L& ~  O( H/ O

0 g8 B8 _9 o: \4 C" v, Z; Z7 |/ ?7 {: D1 m( W5 I; z: V, R4 e
; y2 q1 i* O+ d+ d. g
                               
登录/注册后可看大图

" z8 Z) `. [# P2 [图12  RabbitMQ的队列视图/ S$ q% T7 Y4 `3 l

$ `* b$ s$ V; g0 y# W图13是管理员视图,可以修改密码、增加用户等。
, V9 y+ u# i3 v' S* |7 Y
* j5 M1 z3 D( C

. {% C$ y' b1 N5 F4 J                               
登录/注册后可看大图
" s8 o9 y3 ^, A+ t4 L
2 H& ]5 F  G$ t9 |/ t' B$ w6 g1 Q/ q
图13  RabbitMQ的管理员视图) ?9 U7 k9 l+ |7 w, X4 F" g9 u3 [

/ R8 Y3 u% v& Q3 W6 Y日志分析7 j$ n% h+ c/ _  a0 x

$ ~7 e; c" q5 e4 |4 ^9 u# {OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。7 A- ?4 C3 \2 o$ F; U0 W( J
4 P! P8 z/ u6 S) S# k
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。% l- n2 Q% Y+ R* y

& C( F/ i1 e) G# J图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。) Z0 y" Q8 `! B/ w( ?
! M  l5 I4 |$ l
+ f8 X5 C1 q* M5 T
                               
登录/注册后可看大图

% M, y8 O3 t; V" ~% l0 T0 K! V7 I+ w; U! o
图14  LogStash的Overview视图, T# I8 z. m' E
" `7 B9 S% ]) h$ c5 w6 a8 D
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。
6 A' V6 n! ?# z$ F- m) e1 `0 L8 I$ X- Z8 X$ x
0 t( l& u1 @- ?. B3 m
                               
登录/注册后可看大图

* d1 r9 D6 Z( Z/ o2 H, o/ h% W1 M2 r" [5 q% M3 e8 U7 L% E
图15  LogStash的消息视图
6 D3 D% s. L1 A% v$ f
* i6 A' z/ T* C图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。+ z# \$ j! `2 j4 y* Z2 X& _1 k7 q) O

1 a3 [6 m, t* ^$ s
6 v: \' p, Q9 i: ?, P3 N
                               
登录/注册后可看大图

3 ^/ k; t3 [/ U- t* T
3 d# z  D5 z. ]% p2 x; m图16  LogStash的消息过滤视图5 }0 }' z$ \$ h* ]1 ~1 P
以上是“OpenStack企业云平台监控的示例分析

9 b, t; H4 C& [$ ^) @* D; l7 r
您需要登录后才可以回帖 登录 | 开始注册

本版积分规则

关闭

站长推荐上一条 /4 下一条

如有购买积分卡请联系497906712

QQ|返回首页|Archiver|手机版|小黑屋|易陆发现技术论坛 点击这里给我发消息

GMT+8, 2023-9-24 06:19 , Processed in 0.058893 second(s), 23 queries .

Powered by LR.LINUX.cloud bbs168x X3.2 Licensed

© 2012-2025 Comsenz Inc.

快速回复 返回顶部 返回列表