windows疑难解答排错包_Linux运维必知的Zabbix故障排错实
战
从0开始解决线上Zabbix监控平台故障
(1)学习Linux技术,后期从事Linux运维⽅⾯的⼯作,作为运维⼈员最主要的⼯作职责之⼀:保障企业门户⽹站、业务系统、数据库、服务器⾼效稳定的运⾏,⼀旦有异常或者故障能够第⼀时间去解决。
(2)作为运维⼈员是如何第⼀时间去获取门户⽹站、业务系统、数据库、服务器等运⾏状态呢?是通过⼿⼯7x24x365去刷新和访问吗?可以通过开源的监控软件平台7x24x365实时⾃动的去检测其运⾏的状态。
(3)互联⽹IT企业中,主流的开源监控软件有哪些种类呢?
MRTG;
Cacti;
Nagios;
Ganglia;
Zabbix;
Prometheus;
(4)通过线上云服务器构建了⼀套Zabbix监控平台,发现监控平台⽆法运⾏了,⽽且报错信息如图所⽰:
Zabbix server is running No localhost:10051
#根据上图的提⽰,表⽰Zabbix Server的运⾏状态是:No,没有监听本地localhost主机地址+10051端⼝,解决⽅法:
检测⼀下Zabbix Server服务进程和端⼝是否存在;
ps -ef|grep zabbix_server
netstat -tnlp|grep -w 10051
linux安装redis服务通过⼿⼯⽅式启动⼀下Zabbix server独⽴服务即可;
/etc/init.d/zabbix_server start
(5)启动Zabbix Server服务时,报错信息⼆如下所⽰:
Can't find file /usr/local/sbin/zabbix_server.
Zabbix server NOT started.
#根据如上的错误提⽰,表⽰启动Zabbix Server服务时,启动脚本⽂件会读取Zabbix Server主程序⽂
件:/usr/local/sbin/zabbix_server,该⽂件提⽰不能到,所以Zabbix Server服务不能启动。
解决⽅法:
检测Zabbix Server主程序⽂件/usr/local/sbin/zabbix_server是否存在;
if [ -f /usr/local/sbin/zabbix_server ];then echo ok ;fi
ls -l /usr/local/sbin/zabbix_server
可以通过find|locate⼯具查zabbix_server主程序⽂件的路径;
find / -name "zabbix_server"
find / -name "zabbix_server"|grep -vE "init|bak"
ln -s /usr/local/zabbix/sbin/zabbix_server /usr/local/sbin/
find / -name "zabbix_server"|grep -vE "init|bak" -exec ln -s {} /usr/local/sbin/ ;
(6)启动Zabbix Server服务时,报错信息三如下所⽰:
Zabbix_server [10775]: user zabbix does not exist
Zabbix_server [10775]: cannot run as root!
#根据如上的错误提⽰,表⽰启动Zabbix Server服务时,需要使⽤zabbix⽤户去启动,⽽Linux系统没有检测到该⽤户,该⽤户是不存在的,不能使⽤root⽤户直接启动。
解决⽅法:
检测⼀下Linux系统是否存在zabbix⽤户;
id zabbix
grep -w zabbix /etc/passwd
通过⼿⼯useradd命令创建zabbix⽤户即可;
useradd -s /sbin/nologin zabbix -M
(7)启动Zabbix Server服务时,报错信息四如下所⽰:
Connection to database 'zabbix' failed: [1045] Access denied for user 'zabbix'@'localhost' (using password: NO)
#根据如上的错误提⽰,表⽰启动Zabbix Server服务时,Zabbix Sever服务组件需要连接后端MYSQL数据库服务,要往数据库中持久化存储客户端监控数据,错误提⽰使⽤zabbix⽤户和空密码,通过localhost登陆数据库服务,访问zabbix库被拒绝。
解决⽅法:
检测⼀下后端MYSQL数据库是否授权&创建zabbix库;
show databases;
select user,host,password from mysql.user;
检测zabbix server配置⽂件,数据库连接信息是否填写密码或者密码是否正确;
基于Zabbix监控线上阿⾥云服务器
(1)根据如上的Zabbix故障排错,Zabbix监控平台可以正常使⽤了,作为运维⼈员能够利⽤Zabbix监控平台去监控哪些数据呢?监控哪些指标呢?能够给企业带来哪些好处呢?
(2)在企业中,可以使⽤Zabbix来监控四个层⾯的数据指标,哪四个层⾯呢?
硬件层⾯
Zabbix可以监控硬件服务器设备,例如监控硬件设备的CPU温度、硬盘异常情况、风扇转速、电源异常情况、机箱是否被⿊客⼊侵等。
软件层⾯
Zabbix可以监控软件服务,例如监控Nginx、Tomcat、MQ、ZK、ELK、Redis、MYSQL、LVS、Keepalived等服务的运⾏状态、PID、端⼝号,可以监控服务的返回值、状态码等。
系统层⾯
Zabbix可以监控Windows/Linux操作系统,监控指标:CPU、MEM、DISK、NET、I/O、Open files、Process、User、Port等。
⽹络层⾯
Zabbix可以监控⽹络设备,例如监控交换机、路由器、防⽕墙设备,监控其出⼝和⼊⼝的带宽,监控设备之间的⽹络连通性等。
往期⽂章精选:
官⽅调研重磅发布,Pandas或将重构?
想学python看这⾥!送给⼩⽩的六个建议
欢迎⼤家关注我的头条号,私信“python",学习资料包免费分享给需要的朋友,另有python学习交流,可以交流学习拓展⼈脉。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论