关于所有企业来说,系统的健康运行是基本,为包管系统稳定运转,运维监控系统和监控工具顺势而出,高效的监控工具可释放运维人员>80%的事情量,事前预警系统故障,事后用于溯源定位,运维监控系统以不可挡的趋势变为产品生命周期中最重要的环节。
与此同时,业界提供了诸多开源、功效强大的监控系统可供选择,如下列举。
开源运维监控系统
目前相比照较成熟的开源运维监控系统有zabbix、nagios和open-falcon。
Nagios是一个主要用于监控系统运行状态和网络信息的监控系统。Nagios能监控所指定的外地或远程主机以及效劳,同时提供异常通知等功效。
Open-Falcon是小米运维部离开发出来的互联网企业级监控系统,目前包括小米、金山云、美团、京东金融、赶集网等都在使用Open-Falcon。Open-Falcon 整体可以分为两部分,即绘图组件、告警组件。
zabbix是一个老牌监控系统,基于web界面的企业级开源监控软件。Zabbix效劳器需要LAMP情况或LNMP情况,提供漫衍式系统监控与网络监视功效。其具备主机的性能监控,网络设备性能监控,数据库性能监控,多种告警方法,详细报表、图表的绘制等功效。监测工具可以是Linux或Windows效劳器,也可以是路由器、交换机等网络设备,通过SNMP、zabbix Agent、PING、端口监视等要领提供对远程网络效劳器等监控、数据收集等功效。
Zabbix效劳基础架构
Zabbix属于C/S架构(被监控的server须要装置监控软件,既能够主动链接客户端,也能够被动的让客户端推送自己的状态),基于C++开发,监控中心支持web界面配置和治理。sql单server节点能够支持上万台客户端(可支持同时上万台的server监控,并发量高,若是凌驾肯定的量,性能可能会下降,可是咱们能够增长Proxy署理点来充当监控效劳器来减轻压力)
Zabbix的5个组件
?zabbix-server 监控中心,接收客户端上报信息,卖力配置、统计、操做数据。bootstrap;
?数据存储 存放数据,好比mysql;
?web界面 也叫web UI,在web界面下操做配置是zabbix简单易用的主要缘由;
?zabbix-proxy 可选组件,它能够取代zabbix-server的功效,减轻server的压力;
?zabbix-agent 客户端软件,卖力收罗各个监控效劳或项目的数据,并上报。
zabbix的主要特点
?装置与配置相对简单;
?支持多语言(包括中文);
?免费开源;
?自动发明效劳器与网络设备;
?漫衍式监视以及WEB集中治理功效;
?可以无agent监视;
?用户宁静认证和柔软的授权方法;
?通过WEB界面设置或检察监视结果;
?Email、短信、微信等通知功效。
监控实践
效劳器监控
某用户每日例行监控中需要提供50台机械的CPU、内存、磁盘使用率的信息截图,通过zabbix页面“最新数据”?榭梢陨秆〕鱿喙厥。
效劳器告警
由于用户内部系统均与外网隔离,通过配置“组态—行动”?槭迪执シ⑵鞲婢,并通过短信方法发送至用户组的手机号码,可配置告警解除后的短信通知。
通过“监控中—事件”?榭杉觳炖犯婢畔。
当某台主机频繁告警,可以通过“监测中—图形”?榈淖呤仆,快速资助定位并溯源问题原因。
关注数据 包管未来
扫码|关注我们
微信号|江苏ca88
网址|http://www.bwda.net