将设为首页浏览此站
开启辅助访问 天气与日历 收藏本站联系我们切换到窄版

易陆发现论坛

 找回密码
 开始注册
查看: 60|回复: 2
收起左侧

OpenStack 高性能监控工具

[复制链接]
发表于 2022-12-15 09:55:23 | 显示全部楼层 |阅读模式
购买主题 本主题需向作者支付 2 金钱 才能浏览
 楼主| 发表于 2022-12-15 10:26:07 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控
) b' j5 X5 A4 r. t8 l
( X* p, r! O# R2 s* o对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
, ~% V4 T5 j3 \+ X
1 a5 @/ ~3 R2 z* x* I6 n' O0 lGanglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。1 g3 y( e0 d8 c% _
# R/ A$ _1 b5 E7 S, }' M2 K
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
" B. r/ M" Z- H: r
9 Q0 J6 h) X' @& m( ^$ x. d2 u5 p/ K6 W2 h8 x4 u( \
* q9 M& d; x* o5 E8 G4 y* n* f% |
图1  Ganglia的Overview界面* @1 `& Z5 k2 w. Q6 E$ }/ H
$ l- r8 b7 _% |; h
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
) X2 @& q& M& j5 O6 F3 B! k
' A0 T. i7 `; a5 D" ~0 n5 t! e5 `2 P, D, u* y

5 I( q8 o. u: W" J- c7 z5 a% e图2  Ganglia的聚合视图和节点视图
+ F4 s' k9 h3 I& C1 ~4 [9 F5 F- B7 x5 q1 w! ]* O( u
图3是CPU详细监控项目。% ^, {  A4 Z2 k& c1 y% E9 }

. U) D0 G# f" @5 C3 t2 l. T  `6 ^; u5 Q5 f. g9 ?: P
8 c( ~# D7 D" q5 s( p
图3  Ganglia的CPU监控
( L( y% d4 y5 o1 V4 [' Y/ w1 s& |& S3 I9 ~. ]' X" @
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。, j  j/ b. P' C" N) J) k3 V) m

& a0 {5 G4 h$ ~7 B  ]7 c; f4 I/ d- r% v& a! ]. Y
图4  Ganglia监控虚拟机内存
6 q& v" Q% d' b: V8 ]* ~( P! }9 G9 [
服务与资源监控5 P! E! {* k/ _" D* r# l

3 S+ a" t0 I( j8 e0 p6 h9 G6 ANagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
) ?& Y) \$ s" V1 d# v7 {/ `& u2 y+ C' s, p! p1 V
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。' x. @4 L  j. {! _& S3 M) _! N! y

; {! }) D/ s1 q0 Y' x& P, R, B/ a" x7 g+ p8 W
# @! v- K- `3 G# H8 i- O8 U) y, p0 d
图5  Nagios的连接视图
( K0 d  n: V4 {) a3 q
0 S" D4 Q! E2 n2 i' P, [另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
3 q; N# W6 f9 f" S' w( f( A2 s1 k: J6 O  \# y4 O$ [
另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
6 w. E) ~* y+ W" ]: J- Y1 F" q1 E* n# e3 V- _
图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。; C* Q3 S) K+ `. I
3 i' j  d/ h  c9 N0 v
/ l" _' {& P7 i4 z0 x6 h
* ?7 r/ e$ ~$ M  c: @
图6  Nagios的主机视图2 l* h. d0 s* ?9 e
6 I( G( V( L% S* N! |
图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。4 h$ Y; O# D* Y# e. c, K" f7 j* u
* q7 a1 ]% |& H1 b( @9 V
# V/ o/ A* R4 s4 ~# E3 R- m: e

' {$ }) b5 z( F9 V图7  Nagois的服务监控视图) y" B6 e# J8 m; V9 @, T
4 q  S; V/ K+ K- J& I& M9 S
对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。1 \9 e, e' H& ^) K: C" T( a
; V# T+ c3 `  N% [" G

* J1 Q. }6 i; ?( v: I, b/ R消息中间件监控
2 ]4 H* X' P' f  [/ A! a7 B* \
4 t1 w9 g7 k  {* ?2 @消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
$ D% p1 z/ X+ r- A, q& Y
) |" s5 ^( k2 g+ q" |+ J2 t图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
4 M0 d0 ?0 u/ P3 B  U$ X
4 c7 Y' g- X5 X! ~% i8 N3 S% |
3 g. k- E) e+ e; Y: c% m
/ e  ]" N) V- p+ ~3 X6 O图8  RabbitMQ的Overview视图7 }6 }& ?. Z1 \; `! K4 F+ E

( a$ a6 D2 K1 ~4 b. P图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。
* A0 f0 n1 L" h1 `! K+ ?1 r4 Q4 |$ u' ]4 e% q7 p- c

) }4 k; ^: l  @+ l6 [
' U9 ~3 S+ m3 p  x. {7 m8 @! t图9  RabbitMQ的连接视图
/ u' z: F0 ~7 v1 j& L% U: H8 y) x2 I7 M1 G
图10展示了消息中间件的通道视图。: R; o9 U% ~! W- n6 A$ F

7 S' u/ g. E8 I
" S7 U/ k( ?; q
& P) ~: M( l% X( K7 D; O图10  RabbitMQ的通道视图- n' b5 r, o8 P2 |! K- E

& v( p1 W2 B/ o0 d3 X- f( t图11展示了消息中间件的交换(Exchange)视图。
5 N' G% X- u/ c7 l& Y0 z( _' F8 a& M3 A1 O
+ J) G8 i2 p- x$ k

# u& ?/ n: E4 F, M$ k- w图11  RabbitMQ的交换视图6 V$ I0 B3 c& S6 }

7 C! D, Y( p/ R图12展示了消息中间件的队列视图,并包括了统计信息。
1 R  h8 y  |: h. ]9 @4 N$ e8 P" ^

! S& T# F- }& U" o3 |8 ]/ n7 a9 C: F- A4 ]" ~2 @
图12  RabbitMQ的队列视图9 D, A4 b# C7 e% T9 u$ u+ J& A

. |- v& i. y0 y5 V. \3 y3 l图13是管理员视图,可以修改密码、增加用户等。
, t) N. h3 V% M* P1 a. }. P. Z- l7 t- Y: W9 _7 \0 M0 |1 z8 x: W. S) L

, O5 \! O/ Y, v- R& i" d8 @. B6 ^5 H2 A% ]  b4 D1 Q) l
图13  RabbitMQ的管理员视图& b$ a  w* R( M( K0 ^
& {" g3 K, s0 ], m$ T' \
日志分析
% @  A8 j6 z3 S# r$ z8 p- _# r. b1 |* {2 M" w1 @
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。. [% g  y7 `' q2 T# c) P0 \7 `
8 t4 Y: \2 F1 u/ P1 u/ o5 L& m3 J( v
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。
% s( E( X" o& r- L
* J2 c. Y8 k5 k+ C& r' q7 F图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
5 S9 C9 C" h! W; i7 Y, _, T% T% N: Y9 A6 [+ ?! ]1 p' t5 X  g3 z
, t% U+ I, `6 n6 w

5 T- S' k  L: X1 s图14  LogStash的Overview视图
* [$ i' t# w2 t' r- ^
9 r8 C$ z  [1 \/ R, k/ E图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。; y6 p" ?9 D; [+ z$ l+ ?
, w; [) W4 c2 o* S% z* [
+ N; L; |2 h+ P* ^! f
4 ]! S3 L# n, m
图15  LogStash的消息视图
& y' _' ~# O9 K) i; S1 y
( r. i! P- J, h# H5 O# S% F图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。
8 ]# O1 ~) A& V& k2 Y: A3 M2 F' ?; `% u' e6 {0 o7 S

4 N4 l, h1 z$ K$ O
0 Y) Q9 [- {1 x3 p. G  B3 f图16  LogStash的消息过滤视图. ^8 }, B* n% r6 O$ [' s- B" U% G
以上是“OpenStack企业云平台监控的示例分析

6 J3 t; T8 J% T$ I% x9 x6 L3 `' Z  x, y) H- E5 y" c: q; k9 X
# K" J8 U7 |6 i
9 y4 y* m, Y& }* r- }# O4 W7 \

: j7 W/ \+ a/ M/ X7 |8 n
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控, A; z- V* l9 m6 m; q& n

' Y9 Y/ H! Z7 k8 S6 K& P$ b对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。
! u8 G& J, }$ J" R' |! ]( D# \' b6 n: d. C
Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
4 D; u; U0 ^. q+ e3 O4 w& m& K9 v+ ~- L5 q: G9 N
图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。" U" t8 G) T( Z
5 H7 L7 j. f" ^4 a

3 V. v, {4 S/ A% Y4 }. S# [& H  G' \' H9 \: A
图1  Ganglia的Overview界面4 G/ W+ ]( g+ C- c" ?( b$ F
3 Y0 }; i1 ?; d4 s. K
图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。% F; t4 T& ?* F! l) c
, T' T9 F8 s/ \

4 S% s0 O, G/ V+ k  H7 U. L0 V0 v/ j7 J4 |" g
图2  Ganglia的聚合视图和节点视图8 I7 X- g2 E2 n* w

' L, Q+ [* t# |' o7 u  m" h3 D图3是CPU详细监控项目。1 ~$ u0 M0 a$ z& P) [
* H1 k  I" E+ ^  i# N+ P: }! \

' d/ i. X6 J. j9 U0 i
6 v+ y+ i8 d  V/ {4 s, ~2 f图3  Ganglia的CPU监控
* ^! {" o/ E! C3 c% W( p0 @( x* E  H6 |
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。
( k: T! j9 C, {( i" ~+ l
' j/ o) n$ @. B' S1 J0 W2 u9 Q+ i5 J: U3 U! @4 O- i& g
图4  Ganglia监控虚拟机内存
! J4 x! l! k5 ^- [* U6 g1 J! j: O2 ^
服务与资源监控
3 c: {$ I, n: {: i; [
+ _- T& J$ [8 _4 D: ?Nagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
1 n! k9 q! W7 w* {4 T9 f0 x* x
/ e9 C) m5 U, I图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
) E: U* `! Y) I$ r( y! f6 B6 Z5 m, U, E- U
0 l( E' n! v( j. `9 j7 y. c

+ J8 c9 a* ?7 M图5  Nagios的连接视图
  f9 Q: }! ~# ~0 H) s' h9 N9 a8 v* \& D
另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。* A$ V6 t; n, c" U  o& |6 L/ N- T% I

7 |/ E' K+ |( f) V2 \; {1 V2 s另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
) F9 C4 A  o# T" a+ e
: Q* S% |0 j9 z9 [图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。
/ O5 d9 p8 N# A
0 \) i- A$ x5 P7 q: _+ \6 z: B; ]3 j1 l# X- i& u; Z

: E! ]- i1 k6 [5 X图6  Nagios的主机视图- V7 _; V7 t4 a$ U: U( i

6 W! J0 \0 j; v# W% ~9 p图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。6 R! N; O! J4 \
. y7 G* C: g- Z1 V, x% _4 n
$ k- V( l8 v) J

' T" D& L5 j/ S% v1 w% T6 o+ O图7  Nagois的服务监控视图
4 \1 N4 `- H2 b. q' U; `0 j
! ~% H- H1 j1 ?2 t对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。9 @" l2 Q+ t+ d( R. }

* O. ]5 M. W  \/ u  n: t  H
$ K  H: @8 p, A3 Z6 m! y, }消息中间件监控  W# f$ E# y7 ^6 q1 Z/ j$ U3 }
3 u( z1 H  c- ~5 v& z  N7 G0 y
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
" t$ L2 h/ l4 D  a( d
# j# p% R) D& `图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。- L% P% C  M& r- y& Z, N' q
- v; m9 w1 V% U: o( {$ s- D8 T

- ~5 l3 a7 i/ H# V* l8 c7 X3 F9 d+ C3 S. j% I
图8  RabbitMQ的Overview视图2 i1 x; W- O: P& Q6 U
/ Q" a- P0 h$ c4 R( d- G$ O
图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。% i% W, T$ K8 b1 o

4 ?+ k' r7 }+ I# }. \' `$ ]6 p4 [5 s8 @1 m' m4 t* v0 P& e

4 T$ S! ]2 b  O2 u0 m图9  RabbitMQ的连接视图4 C, F" z$ G2 j" W: w: d, R

3 C* C" v# A  ]2 A4 x图10展示了消息中间件的通道视图。! l. m6 F2 |% @
- C3 U7 ?) ?% r7 C' O! Q1 n
, b, j/ j4 i% I3 ]% |9 {0 F# T

" m- |% j, O0 S) s图10  RabbitMQ的通道视图
& x5 b( `$ ~8 f9 [; T/ J4 f" L. h
( V# o+ l7 W% P! N% s* _图11展示了消息中间件的交换(Exchange)视图。( `) m0 k  q8 y/ l2 |
# a( e# s7 t4 x4 m! @/ B
/ e2 M+ `8 Y( x
  P6 h& _- ~2 z" ]7 l& ~
图11  RabbitMQ的交换视图% p# l" W8 S( u. Z, `
( r7 i! F: X5 N0 B- c
图12展示了消息中间件的队列视图,并包括了统计信息。
5 q; T9 y. A3 [
$ H3 z: O6 _; \& o/ f4 }% H4 H  E- a2 G
! @1 ^4 }  Z/ D- `
图12  RabbitMQ的队列视图1 T% y6 t0 ?, k+ l( ~; O, n4 }
' f3 C% r* h$ M( g# `
图13是管理员视图,可以修改密码、增加用户等。6 j* S) T% X  q% s9 R
$ a% G) y7 D! J  V8 w
+ w5 V8 |9 q% v0 s, [& |+ d: ~
) W- d: S, I% s9 S7 A+ w8 i
图13  RabbitMQ的管理员视图0 ?' [' @# ]- V8 e3 f; k# G' y7 Z

2 T" H7 @- A, ]5 p1 ?3 I% H日志分析& V, ?, \  A2 {: e
1 h. ?" V% y4 a: Y( w8 y
OpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。% I! S9 I5 m1 Z4 ^) _
7 u. k4 ?( D# W) j
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。0 ^6 R5 ^9 a/ e5 u8 C7 x: N, L( I% |
/ G7 g% u3 |# Q7 D
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。
: V' L% A6 @" a
1 p4 |3 ]: _, s( ~0 x4 Z' A, j- H% R* g) i, r
- O$ r1 `0 ?1 R+ Z* ~
图14  LogStash的Overview视图: R. p# M8 k) l! D
9 A. x7 G& q8 ?5 W% |$ v+ N
图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。  U$ C. Y  r" F0 r

* D* `' m2 h* V( f5 A! F7 r' T% Z9 E. ^/ J' i8 E& \

7 n# I  q3 Q; [图15  LogStash的消息视图
" Y3 L$ P) T5 n  k1 d( y  x. g5 O* `7 T$ X
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。( i5 z6 j4 \& [& y& K3 J
2 {: G1 _( }4 \( k, u) i/ R! n7 P4 r

& \) T6 w" ~. R: i2 k+ a
  w. @& a4 d5 U3 C% O; O图16  LogStash的消息过滤视图
% n( C, n& P' o3 a$ E' a
以上是“OpenStack企业云平台监控的示例分析

2 z# z1 q4 j! ^/ `  K3 E
+ E% }& M  q( t8 F, W1 ?' T
 楼主| 发表于 2022-12-15 10:26:22 | 显示全部楼层
OpenStack企业云平台监控的示例分析”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“OpenStack企业云平台监控的示例分析”这篇文章吧。
性能监控! U9 I  s+ G3 ]! ~8 D0 B
7 b" Y2 `( }) t' L0 Y3 k
对于OpenStack云平台,主机、存储和网络的监控需求和传统IT环境是一样的,关注的主要指标包括 CPU、内存、磁盘、网络I/O等。本文对于监控并不会展开说明,这里展示在OpenStack部署中使用最多的一款开源软件Ganglia。$ L  K0 @$ x0 F) C# U9 g" |1 Z

, y' T$ b, }% [# }Ganglia需要在各个节点运行客户端程序,在中心节点部署服务器进程,来对整个集群的性能进行监控,并提供各种视图。另外,Ganglia服务器端进程还可以组成集群,提供高可靠性,用于支持大型或生产环境的监控。
2 O! d" f; c+ l: ^* @+ c
; [( z4 C/ w$ r8 l, }6 _图1展示了用Ganglia来展现一个由5节点组成的机群的Load、内存、CPU和网络I/O的视图,并以时间轴来显示。另外历史数据也被保留和查看。
' u, f; b. u2 A# u, a: f4 K! V) X
, b' D+ T, a: `: h5 `
                               
登录/注册后可看大图

& L" @  b! _5 K3 k# @2 K9 m% W5 H+ }
: {" I' Z6 H% S6 R0 j& W1 ]( T% W# X, C
图1  Ganglia的Overview界面
/ ^5 L+ t# ~) R
0 B8 k$ m) R3 P: I' u图2展示了4个节点的Load视图,并在一个视图中进行聚合展示。不同颜色标识不同节点的负载情况。
6 V3 n; m2 k9 b' J/ Y$ ^5 K' s' Q: g( S, ~9 l
6 B7 j3 j& g& Z; }) [5 C
                               
登录/注册后可看大图
3 n( n0 n/ f# i1 C5 b  n1 Z

! B# Z' }" {& l" ^* j) c* R图2  Ganglia的聚合视图和节点视图
. [; V6 q) _9 c4 E- Z! g, G5 h  Q2 s5 w' ^
图3是CPU详细监控项目。  O( i9 Y. Q3 `- D! H

: O8 E. v0 E) ?# x* s% l
1 I6 A/ V0 t3 A% f9 Q% Y
                               
登录/注册后可看大图
4 @' M' I. y/ p

5 n3 O7 ?6 Q+ X/ U# j0 t图3  Ganglia的CPU监控$ A. `9 Y, T- K( b9 E
+ p  c4 b( v9 A5 M: G. @
图4是一个二次开发的,可以用来监控节点运行的虚拟机的性能,本图展示的是监控一个虚拟机的视图。, C3 I/ s/ X  \2 f/ n9 Z
0 r3 W2 e/ X. G6 R
: P& m2 O* A/ X: l2 [) R; R  `
                               
登录/注册后可看大图

4 A4 [1 f4 g: n- k6 N# v! ]: u图4  Ganglia监控虚拟机内存' S/ E2 i5 ~: D: d  }
6 V4 I+ X6 l/ c4 V
服务与资源监控7 b( @2 z$ R! n1 e

) V& \& S9 h3 RNagios是在OpenStack部署中广泛使用的,用于监控云平台各种服务的开源工具,另外,它的扩展性良好,很容易加入自行开发的监控项目,为用户提供了很大的便利性和灵活性。
& Y: T9 i4 r9 i7 S0 s* x1 V+ x/ A; `3 E, A- }- K1 w7 t. P! A
图5展示了Nagios的连接视图,这里5个节点在同一个网络里。绿色代表该节点服务正常,而红色则说明该节点至少有一个以上的告警需要处理。
4 m& J. Q. ?# |5 T4 e- ], u3 z$ d  e! Z7 e4 f2 g/ @1 G& R  m
4 q$ O' m/ \% z

0 o0 g  x! G% A6 u! P2 p3 U                               
登录/注册后可看大图

# y. l7 B6 a( m. c- @图5  Nagios的连接视图
: a/ `1 i/ y* }
$ ~! N2 {3 P; p" Z另外,Nagios可以很容易地与邮件系统和短信平台集成,发送告警信息。
! }7 Z- d+ b! C( t: j  n
, {& Y" M  b$ ?: I* {, |8 X另外,本书展示的界面只是默认的,社区里有许多不同的展示界面,而且是免费的,可以根据自己的需要和偏好进行选择,提供不同的样式和数据展现形式。但数据本身则还是由Nagios服务提供。
+ B2 ^$ P6 c; b2 |0 O8 K
! f+ k" X( m- o# Q图6是Nagios的主机视图,该节点的健康状况,以及信息收集时间等信息一目了然。3 E3 s  U6 ?9 Y+ `' i

  e5 \% ~! M; X  S  r( G4 c$ {$ j' B6 |" M! V
3 n' Q( ]# m4 F: Z# [
                               
登录/注册后可看大图
, I* S  y4 r6 P
图6  Nagios的主机视图1 q( P4 {4 V6 s7 A8 e

7 a! w( v4 i7 Y0 c图7展示了Nagios的服务监控视图。默认的Nagios可以监控磁盘、SSH、ping等系统基本服务,但是Nagios对OpenStack却一无所知,这是需要自己进行开发和扩展的,另外网上也有不少免费的监控脚本可以集成进来。
% t8 L, \# j/ a. O+ Q- M$ n# _% j
% B0 g7 q+ o- W: L* V
$ S# d) @' v6 @2 q; D

! G& R% ?. L, |0 s/ ]! h                               
登录/注册后可看大图

$ R8 r% \& k  M  o1 x图7  Nagois的服务监控视图' I: s7 w$ K5 G

/ l9 Y. r% T: R, H) ^/ b. ^对于OpenStack服务的监控,最基本的可以从进程角度进行监控,如进程是否运行,响应速度如何等。更好的监控,可以结合不同服务的命令,通过查询来判断服务本身的质量如何。这需要初步了解各个服务的使用,以及用到租户、用户、密码等信息。但如果云平台修改密码,则这里也需要进行相应的修改。* \+ D+ U- W: b; c' u

( Z$ K. Z+ r: O, G8 U0 g. P  c& X2 R' r8 R4 u& |( X
消息中间件监控
% K5 h; }: `2 `9 a" o; v2 Z# [' S5 q! w5 m+ z
消息中间件在OpenStack云平台起着心脏的作用,运行不正常则整个云平台会运行不起来,因此监控消息中间件在OpenStack云平台至关重要。
; J3 F6 W$ f  `: B6 V1 u; q
' p2 P7 w3 B; O3 Z) W图8展示了一款免费软件,可以用于消息中间件统计信息的展现和一些基本管理。
5 O# Y# {1 ~5 |2 p% \  l+ t% ^  r) ?4 A" Z

+ e5 X$ [5 M; j0 t5 R                               
登录/注册后可看大图
5 c; n4 r5 @& T  E& s( i

: b' J8 ?! V2 R  U图8  RabbitMQ的Overview视图  o5 O4 h/ E  w3 s  l, `

7 d7 @0 A& V- U/ Z% X: j. g1 i图9显示了消息中间件当前的各种连接,这些连接从不同节点和不同服务而来。, ~: g7 i6 t! R- `3 v

4 c- I/ }: M  d7 n/ E) I0 C

' i2 h3 j9 _- O; H( {4 a4 O% r                               
登录/注册后可看大图

: B7 h3 ?; j" V! {+ o0 H% b  t$ i/ j9 u+ j/ @( f$ c2 I) ?
图9  RabbitMQ的连接视图
8 ~0 ~( a  W, m# U' Y. ?1 C* r9 T2 u* g, Y
图10展示了消息中间件的通道视图。
7 H: q. T! A1 G1 T6 _4 h/ M0 B: h  x( S, q* \' b
$ u/ h9 d* i! y/ L
                               
登录/注册后可看大图
- N) B. O/ m* V4 R+ C
, ^1 S! s& \6 B+ P( d* ?
图10  RabbitMQ的通道视图
% _7 N7 i# i" R# f8 k; S
7 A$ v2 O; [- ], M- R图11展示了消息中间件的交换(Exchange)视图。* X0 n: G( [1 F* c
0 F$ H7 K; a' k
. V& d* S: v6 F; t0 y8 U
                               
登录/注册后可看大图

8 i4 E! A* G0 r' ]" P( J5 D% A, ]( r3 m$ h8 H& Y9 t  s9 Y( F
图11  RabbitMQ的交换视图. o2 c( D' y5 i% V! C: ^* j( f
5 _) {# ^- x: N, V
图12展示了消息中间件的队列视图,并包括了统计信息。/ h0 k. M+ {& ^) Z% h8 L
& r$ F* n! E, z' y

' G! b6 _+ }4 K/ X6 ]$ o0 n3 y2 }

/ u/ m) L/ s5 l                               
登录/注册后可看大图

/ T' Q: C$ f( F图12  RabbitMQ的队列视图
3 [# y8 C% S4 Y/ O2 C$ T% S6 A4 ^, O. g1 Z( d9 P$ D5 `5 X
图13是管理员视图,可以修改密码、增加用户等。8 ]. T) T! B5 ?$ R
! j0 J  Z$ h; x+ M
( X3 |! f! y) V, C  c3 Y& U" r
                               
登录/注册后可看大图

: D8 V) G4 a2 u7 }$ t9 r# y
& ]* x* C& ?3 P/ `图13  RabbitMQ的管理员视图5 C5 R: _' n' y, N1 m  s

0 q! Q: s2 w9 t% r9 A7 ~% Q, N日志分析3 i; V* b# h. Y4 A6 V: N. ~% y" b

8 s/ N- `7 `/ ]9 k( ROpenStack云平台由于服务众多,会产生大量的日志输出,在云平台初建,涉及Debug时,日志量巨大,对于问题的调试非常不方便,因为关联的服务往往运行于不同节点之上。
; e7 z: \' c9 z7 F/ R5 B2 f3 e0 G. z9 p6 S4 b  D. `0 Z
LogStash在各个节点部署了代理程序,可以将日志输出汇聚到中心节点进行分析。中心节点本质上是个搜索引擎和信息统计工具。9 ?: u, L; U* t# d
9 F2 H3 Y4 e  B$ \8 i! |5 k
图14展示了LogStash的Overview视图,可以看到整个云平台日志产生的数量趋势。! g  i, d  i( Q+ c' I1 r8 @% {

2 Q8 Y1 @$ Z" n1 o" {8 O
% ~5 ~- Z* B, I- `0 A
                               
登录/注册后可看大图

: l' u/ O& V6 y0 G" M9 O$ T" `6 Q" W1 v6 b/ ~2 L
图14  LogStash的Overview视图
4 U; ^. o4 |6 \1 B4 q
) d& L8 H- {4 F% j: C图15展示了LogStash收集的OpenStack云平台的日志信息汇总,并按时间顺序显示,并可以按不同的维度进行排序、关键词搜索。& f3 f6 @) l6 @, E5 e# V2 N

" w0 b- s( t8 @
/ G6 R7 w# ^) @) C) I
                               
登录/注册后可看大图
( a  @" d+ q3 V$ Z
1 t8 M4 S; A: v2 H% V1 {
图15  LogStash的消息视图
5 W7 Z9 C/ @; G, F& ^. O  v- U# j3 q6 Z  ?. I9 F  I, k
图16展示了过滤后的视图,这里我们只关心哪个节点在什么时候发生了什么事情。LogStash可以很好地帮助我们实现这些。3 b* g* H: W8 |& L8 b8 q& O

2 c  P2 t6 j$ o7 \# y
. e% d  v; H& W' z' @; w& s
                               
登录/注册后可看大图

1 L: v  F4 P1 g7 B/ x6 `/ b$ Z$ ^' J) X9 c, D7 y, H  y7 K) y7 l
图16  LogStash的消息过滤视图
3 b" P9 m6 i0 R2 T+ r6 t6 B$ b
以上是“OpenStack企业云平台监控的示例分析
/ y: e0 F* H( |; l! T  R
您需要登录后才可以回帖 登录 | 开始注册

本版积分规则

关闭

站长推荐上一条 /4 下一条

如有购买积分卡请联系497906712

QQ|返回首页|Archiver|手机版|小黑屋|易陆发现 点击这里给我发消息

GMT+8, 2023-2-1 02:09 , Processed in 0.061912 second(s), 25 queries .

Powered by LR.LINUX.cloud bbs168x X3.2 Licensed

© 2012-2022 Comsenz Inc.

快速回复 返回顶部 返回列表