Linux系统监控之 Nagios配置教程详解(赵舜东)
实验目的:通过实验熟练掌握Nagios这个开源的监控解决方案的实施。
实验环境:Red Hat Enterprise Linux +nagios.3.2.0
实验步骤:
第一部分:Linux系统监控之 Nagios详解(一)
一、Nagios 简介
(一)什么是Nagios,Nagios有哪些特性。
(二)Nagios工作原理
二、部署Nagios监控服务器
(一)下载所需软件包
(二)安装Nagios
(三)安装Nagios的插件nagios-plugin
(四)配置检测主机是否存活
(五)第一部分功能测试
第二部分:Linux系统监控之 Nagios详解(二)
三、使用Nagios监控Linux 客户端
(一)Nagios监控服务器的配置
(二)Nagios监控客户端的配置
四、使用Nagios 监控Windows 客户端
(一)Nagios 监控服务器的配置
(二)Nagios 监控客户端的配置
第三部分:Linux系统监控之 Nagios详解(三)
五、Nagios 配置文件详解
实验简介:公司进行了机房改造,新系统也上线了,需要一个强大的监控方案,对服务器和各服务的运行情况进行有效的监控,我第一个想到的就是Nagios这个强大的开源解决方案,本文以监控八台服务器和Nagios服务器本身为例。根据先实现、后深入的方式,把本文分为三个部分,开始先实现了功能, 在第三个部分,在对配置的内容进行详细的讲解,
功能实现:实现Web浏览器监控,Mail报警邮件收发,手机短信收发。手机短信怎么收发呢?网上有很多很多的方法,我推荐一种就是使用139信箱,139信箱有一项免费的功能就是发邮件通知到您的手机上,可以在手机上看邮件内容,免费的哦。什么?还没有139信箱,那么别傻呆了,系统运维必备的信箱,快免费申请吧。
本作品为本站原创作品,如需转载请注明来自UnixHot 技术联盟实验答疑:zhaoshundong@hotmail
一、Nagios 简介
:/ (更多的详细说明请参考)
Nagios® is a system and network monitoring application. It watches hosts and services that you specif
y, alerting you when things go bad and when they get better.Nagios was originally designed to run under Linux, although it should work under most other unices as well.
Some of the many features of Nagios include:
1.Monitoring of network services (SMTP, POP3, HTTP, NNTP, PING, etc.) 监控网络资源
2.Monitoring of host resources (processor load, disk usage, etc.) 监控主机资源
3.Simple plugin design that allows users to easily develop their own service checks
4.Parallelized service checks
5.Ability to define network host hierarchy using "parent" hosts, allowing detection of and distinction between hosts that are down and those that are unreachable
6.Contact notifications when service or host problems occur and get resolved (via email, pager, or user-defined method)
7.Ability to define event handlers to be run during service or host events for proactive problem resolution
8.Automatic log file rotation 自动日志轮滚
9.Support for implementing redundant monitoring hosts 支持冗余
10.Optional web interface for viewing current network status, notification and problem history, log file, etc.
请参考Nagios 中文在线帮助文档:www.itnms/docs/nagios/cn/build/html/index.html
二、部署Nagios监控服务器
(一)下载所需软件包
1.nagios.3.
2. Nagios的主程序
[root@UnixHot src]# wget prdownloads.sourceforge/sourceforge/nagios/nagios.3.2.
2.nagios-plugins-1.4.1
Nagios 的插件
[root@UnixHot src]# wget prdownloads.sourceforge/sourceforge/nagiosplug/nagios-plugins-1.4.
[root@UnixHot src]# wget prdownloads.sourceforge/sourceforge/nagios/nrpe-2.
[root@UnixHot src]# ls
nagios-3.2. nagios-plugins-1.4. nrpe-2.
(二)安装Nagios
官方的安装文档:nagios.sourceforge/docs/3_0/quickstart-fedora.html
1.安装前的依赖检查
[root@UnixHot ~]# rpm -q httpd php gcc glibc glibc-common gd gd-devel
2.创建Nagios账户和组
[root@UnixHot src]# useradd -m nagios
[root@UnixHot src]#groupadd nagcmd
[root@UnixHot src]# usermod -a -G nagcmd nagios
[root@UnixHot src]#usermod -a -G nagcmd apache
3.编译安装
[root@UnixHot src]# tar xvf nagios-3.2.
[root@UnixHot src]# cd nagios-3.2.0
(至于每一步的具体意思,我不再详述,因为运行完毕后,提示信息会明确的告诉你,它干了什么,是怎么干的。当然,还有一个最好的办法,就是看Makefile文件,里面都会有注释的。)
参考Makefile文件
[root@UnixHot nagios-3.2.0]# less Makefile
[root@UnixHot nagios-3.2.0]# ./configure --with-command-group=nagcmd \
--with-nagios-user=nagios \
--with-nagios-group=nagios
[root@UnixHot nagios-3.2.0]# make all
[root@UnixHot nagios-3.2.0]# make install
[root@UnixHot nagios-3.2.0]# make install-init (生成init启动脚本)
[root@UnixHot nagios-3.2.0]# make install-config (生成一些模板配置文件)
[root@UnixHot nagios-3.2.0]# make install-commandmode (设置相应的权限)
[root@UnixHot nagios-3.2.0]# make install-webconf (生成Apache配置文件f)
4.为Nagios设置Web验证的密码。
(注意第一次添加用户用-c选项,以后再添加千万别在用这个选项了,会覆盖以前的所有用户的,这点之时在《RHCE考前冲刺》我已经讲过了。)
[root@UnixHot nagios-3.2.0]# htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin
5.设置Nagios的开机启动
[root@UnixHot ~]# chkconfig --add nagios
[root@UnixHot ~]# chkconfig nagios on
6.修改SELinux
两种方法:
第一种最直接,关闭SELinux,对于SELinux不是很熟悉的用户,请选择此。
[root@UnixHot nagios-3.2.0]# cat /etc/sysconfig/selinux
SELINUX=disabled
第二种给打上正确的安全脉络。
chcon -R -t httpd_sys_content_t /usr/local/nagios/sbin/
chcon -R -t httpd_sys_content_t /usr/local/nagios/share/
(三)安装Nagios的插件nagios-plugin
插件是Nagios扩展功能的强大武器,一般好的软件,都支持插件扩展,你可以根据实际的应用,自己开发插件。
[root@UnixHot src]# tar xvf nagios-plugins-1.4.
[root@UnixHot src]# cd nagios-plugins-1.4.13
[root@UnixHot nagios-plugins-1.4.13]# ./configure --prefix=/usr/local/nagios --with-nagios-user=nagios --with-nagios-group=nagios
[root@UnixHot nagios-plugins-1.4.13]# make && make install
(四)配置检测主机是否存活
1.配置文件概述
如果安装上面的步骤,安装完成后,配置文件在安装时放在了/usr/local/nagios/etc/目录下
[root@UnixHot ~]# cd /usr/local/nagios/etc
[root@UnixHot etc]# ls -l
-rw-rw-r-- 1 nagios nagios 11408 08-30 11:55 cgi.cfg (CGI配置文件)
-rw-r--r-- 1 root root 26 08-30 11:56 htpasswd.users (Apache的验证密码文件)
-rw-rw-r-- 1 nagios nagios 43776 08-30 11:55 nagios.cfg (主配置文件)
drwxrwxr-x 2 nagios nagios 4096 08-30 11:55 objects (对象定义文件目录)
-rw-rw---- 1 nagios nagios 1340 08-30 11:55 resource.cfg (资源配置文件)
我们修要修改的的是nagios.cfg 和 objects 目录下的文件,来检测主机是否存活。
2.主配置文件nagios.cfg的配置。
主配置文件的内容很多,对于这个版本,我们需要修改和添加的主要是对象配置文件,即:cfg_file=<file_name> cfg_file=/usr/local/nagios/etc/objects/commands.cfg (命令定义文件)
cfg_file=/usr/local/nagios/etc/objects/contacts.cfg (联系人信息定义文件)
cfg_file=/usr/local/nagios/etc/objects/contactgroups.cfg (添加此行联系人组定义文件)
cfg_file=/usr/local/nagios/etc/objects/hosts.cfg (添加此行主机定义文件)
cfg_file=/usr/local/nagios/etc/objects/hostgroups.cfg (添加此行主机组定义文件)
cfg_file=/usr/local/nagios/etc/objects/services.cfg (添加此行服务定义文件)
cfg_file=/usr/local/nagios/etc/objects/timeperiods.cfg (时间周期定义文件)
cfg_file=/usr/local/nagios/etc/objects/templates.cfg
cdrw的rw是什么意思# Definitions for monitoring the local (Linux) host
#cfg_file=/usr/local/nagios/etc/objects/localhost.cfg (注释掉此行)
3.主机定义文件的配置。
[root@UnixHot etc]# vi objects/hosts.cfg
define host{
host_name Nagios-Server
alias Nagios Server
address 192.168.0.206
check_command check-host-alive
check_interval 5
retry_interval 1
max_check_attempts 5
check_period 24x7
process_perf_data 0
retain_nonstatus_information 0
contact_groups sagroup
notification_interval 30
notification_period 24x7
notification_options d,u,r
}

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。