×

扫描二维码登录本站

QQ登录

只需一步,快速开始

从nagios上安装配置

标签: 暂无标签
来自:网络

第一步:
安装软件:分为nagios监控端和nagios被监控端
监控端软件列表
[ ttp://static.oschina.net/uploads/img/201511/05030030_5Yxe.jpg][/url]
Nagios安装包[ ttp://static.oschina.net/uploads/img/201511/05030030_tg29.jpg][/url]
Nagios插件安装包[ ttp://static.oschina.net/uploads/img/201511/05030030_SXjZ.jpg][/url]
Nagios中文支持包[ ttp://static.oschina.net/uploads/img/201511/05030030_T7ZK.jpg][/url]
Nrpe软件包[ ttp://static.oschina.net/uploads/img/201511/05030030_TvLO.jpg][/url]
nagios通过nrpe来远端管理服务
1. nagios执行安装在它里面的check_nrpe 插件,并告诉check_nrpe 去检测哪些服务。               nagios培训
2. 通过ssl,check_nrpe 连接远端机子上的nrpe daemon
3. nrpe运行本地的各种插件去检测本地的服务和状态
4. nrpe把检测的结果传给主机端的check_nrpe, 主机端的check_nrpe再把结果送到nagios状态队列中。
5. nagios 依次读取队列中的信息,再把结果显示出来。
解决编译软件时需要的依赖
[root[ ttp://my.oschina.net/licomernwater]@www[/url] ~]# yum install -y gcc glibc glibc-common gd gd-devel xinetd openssl-devel
添加nagios用户
添加目录 mkdir /usr/local/nagios
修改权限 chown -R nagios.nagios /usr/local/nagios
解压软件包 tar -xzvf nagios-3.2.0.tar.gz
开始安装1.   ./configure --prefix=/usr/local/nagios
2.   make all
3.   make install
4.   make install-init
5.    make install-commandmode
6.    make install-config
7.    chkconfig --add nagios
8.    chkconfig --level 35 nagios on
9.    tar -xzvf nagios-plugins-1.4.14.tar.gz
10.   ./configure --prefix=/usr/local/nagios
11.   make && make install
12.   yum install httpd
13.   yum install php
14.   vim /etc/httpd/conf/httpd.conf
添加以下内容
[ ttp://static.oschina.net/uploads/img/201511/05030030_VizB.jpg][/url]
修改用户
[ ttp://static.oschina.net/uploads/img/201511/05030030_rUum.jpg][/url]
15.   添加密码
htpasswd -c /usr/local/nagios/etc/htpasswd oracle
16.   /etc/init.d/httpd start
17.   tar -xjvf nagios-cn-3.2.0.tar.bz2
18.   ./configure
19.   make && make install
监控端nagios安装完毕
重启httpd和启动nagios
可以看到以下画面
[ ttp://static.oschina.net/uploads/img/201511/05030030_DmRk.jpg][/url]
这里你要输入刚才设置的用户和密码

在没有修改配置的情况下,默认只能查看到本机
[ ttp://static.oschina.net/uploads/img/201511/05030031_Eehy.jpg][/url]
好的 下面来添加主机
会用到以下几个文件,其他文件就由各位下去自己慢慢研究了,我手懒
[ ttp://static.oschina.net/uploads/img/201511/05030031_Lnd6.jpg][/url]
其中以下两个文件需要手动创建
[ ttp://static.oschina.net/uploads/img/201511/05030031_8PXl.jpg][/url]
定义被监控主机
[root[ ttp://my.oschina.net/licomernwater]@www[/url] objects]# cat hosts.cfg
define host{  
        use                     linux-server     使用templates.cfg定义的
        host_name             Nagios-Linux    自己取的名字并不一定是主机名                                  nagios实施
        alias                    Nagios-Linux    别名     
        address                 192.168.1.201  被监控主机      
        }  
定义监控内容也就是监控命令
[root[ ttp://my.oschina.net/licomernwater]@www[/url] objects]# cat services.cfg
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     Current Load
        check_command           check_nrpe!check_load
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     Check Disk sda1
        check_command           check_nrpe!check_sda1
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     Total Processes
        check_command           check_nrpe!check_total_procs
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     Current Users
        check_command           check_nrpe!check_users
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     Check Zombie Procs
        check_command           check_nrpe!check_zombie_procs
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     Check Swap
        check_command           check_nrpe!check_swap
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     HTTP
        check_command           check_nrpe!check_http
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     MYSQL
        check_command           check_nrpe!check_mysql
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     MYLOG
        check_command           check_nrpe!check_mylog
被监控端主机安装nrep、nagi-plugin软件包
与监控端安装类似,注意最好是以xinetd的方式来启动
安装nrep
  161  ./configure
  162  make all
  163  make install-plugin
  164  make install-daemon-config
  165  make install-xinetd
vim /etc/xinetd.d/nrpe
# default: on
# description: NRPE (Nagios Remote Plugin Executor)
service nrpe
{
        flags           = REUSE
        socket_type     = stream
        port            = 5666
        wait            = no
        user            = nagios
        group           = nagios
        server          = /usr/local/nagios/bin/nrpe
        server_args     = -c /usr/local/nagios/etc/nrpe.cfg --inetd                          监控软件
        log_on_failure  += USERID
        disable         = no
        only_from       = 127.0.0.1 192.168.1.200#服务器地址
测试
/usr/local/nagios/libexec/check_nrpe -H localhost
[root[ ttp://my.oschina.net/licomernwater]@www[/url] libexec]# vim /usr/local/nagios/etc/nrpe.cfg
log_facility=daemon
pid_file=/var/run/nrpe.pid
server_port=5666
nrpe_user=nagios
nrpe_group=nagios
allowed_hosts=127.0.0.1
dont_blame_nrpe=0
debug=0
command_timeout=60
connection_timeout=300
command[check_users]=/usr/local/nagios/libexec/check_users -w 5 -c 10
command[check_load]=/usr/local/nagios/libexec/check_load -w 15,10,5 -c 30,25,20
command[check_sda1]=/usr/local/nagios/libexec/check_disk -w 20% -c 10% -p /dev/sda1
command[check_zombie_procs]=/usr/local/nagios/libexec/check_procs -w 5 -c 10 -s Z
command[check_total_procs]=/usr/local/nagios/libexec/check_procs -w 150 -c 200
command[check_swap]=/usr/local/nagios/libexec/check_swap -w 20% -c 10%
command[check_http]=/usr/local/nagios/libexec/check_http -I 127.0.0.1
command[check_mysql]=/usr/local/nagios/libexec/check_mysql
command[check_mylog]=/usr/local/nagios/libexec/check_mylog
自己定义的插件
[root[ ttp://my.oschina.net/licomernwater]@www[/url] libexec]# cat check_mylog
#!/bin/bash
#
#
myfiles="`date +%F`.txt"
count=`sed -n '/fail/p' /tmp/$myfiles|wc -l`
if [ $count -eq 0 ];then
       echo "MYLOG IS OK"
       exit 0
elif [ $count -ge 1 -a $count -le 10 ] ;then
       echo "MYLOG IS WARNING"
       exit 1
elif [ $count -ge 11 ];then
       echo "MYLOG IS CRITICAL"
       exit 2
elif [ $count -lt 0 ];then
       echo "UNKNOWN"
       exit 3
If
0 表示OK
1 表示WARNNING
2 表示 CRITICAL
3 表示UNKNOWN
在服务端的services.cfg中使用这两个自己定义的插件
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     MYSQL
        check_command           check_nrpe!check_mysql
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     MYLOG
        check_command           check_nrpe!check_mylog
最后要在command.cfg中加入check_nrpe命令
# 'check_nrpe' command definition
define command{
        command_name    check_nrpe     
        command_line    $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$                 nagios配置
                       
        }
重启服务端服务
[ ttp://static.oschina.net/uploads/img/201511/05030031_blx2.jpg][/url]
就会出现我们定义的主机
[ ttp://static.oschina.net/uploads/img/201511/05030031_cUAn.jpg][/url]
例如我现在关闭mysql
[ ttp://static.oschina.net/uploads/img/201511/05030031_YScC.jpg][/url]
[ ttp://static.oschina.net/uploads/img/201511/05030031_xVPi.jpg][/url]
这里就可以看到mysql的监控状态为紧急
现在恢复mysql
[ ttp://static.oschina.net/uploads/img/201511/05030031_Zdag.jpg][/url]
[ ttp://static.oschina.net/uploads/img/201511/05030031_wvKW.jpg][/url]
可以看到mysql监控状态为ok
下面我来实现故障告警功能
使用邮件告警
[root@www objects]# cat contacts.cfg
###############################################################################
# CONTACTS.CFG - SAMPLE CONTACT/CONTACTGROUP DEFINITIONS
#
# Last Modified: 05-31-2007
#
# NOTES: This config file provides you with some example contact and contact
#        group definitions that you can reference in host and service
#        definitions.
#      
#        You don't need to keep these definitions in a separate file from your                                     开源监控软件
#        other object definitions.  This has been done just to make things
#        easier to understand.
#
###############################################################################
###############################################################################
###############################################################################
#
# CONTACTS
#
###############################################################################
###############################################################################
# Just one contact defined by default - the Nagios admin (that's you)
# This contact definition inherits a lot of default values from the 'generic-contact'
# template which is defined elsewhere.
define contact{
        contact_name            nagiosadmin            
              use                                      generic-contact               
        alias                           Nagios Admin                                                                                
        service_notification_period     24x7
        host_notification_period         24x7
        service_notification_options    w,u,c,r,f,s
        host_notification_options        d,u,r,f,s
        service_notification_commands   notify-service-by-email                           
        host_notification_commands        notify-host-by-email
        email                           15882026924@139.com       ;
        }
###############################################################################
###############################################################################
#
# CONTACT GROUPS
#
###############################################################################
###############################################################################
# We only have one contact in this simple configuration file, so there is
# no need to create more than one contact group.
define contactgroup{
        contactgroup_name       admins
        alias                   Nagios Administrators
        members                 nagiosadmin
        }
[root@www objects]# tail -20 services.cfg
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     HTTP
        check_command           check_nrpe!check_http
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     MYSQL
        check_command           check_nrpe!check_mysql
              contact_groups              admins
        }
define service{
        use                     local-service
        host_name               Nagios-Linux
        service_description     MYLOG
        check_command           check_nrpe!check_mylog
        }
Cat command.cfg
# 'notify-host-by-email' command definition
define command{
       command_name       notify-host-by-email
       command_line       /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\nHost: $HOSTNAME$\nState: $HOSTSTATE$\nAddress: $HOSTADDRESS$\nInfo: $HOSTOUTPUT$\n\nDate/Time: $LONGDATETIME$\n" | /bin/mail -s "** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is $HOSTSTATE$ **" $CONTACTEMAIL$
       }
# 'notify-service-by-email' command definition                                                 nagios安装
define command{
       command_name       notify-service-by-email
       command_line       /usr/bin/printf "%b" "***** Nagios *****\n\nNotification Type: $NOTIFICATIONTYPE$\n\nService: $SERVICEDESC$\nHost: $HOSTALIAS$\nAddress: $HOSTADDRESS$\nState: $SERVICESTATE$\n\nDate/Time: $LONGDATETIME$\n\nAdditional Info:\n\n$SERVICEOUTPUT$" | /bin/mail -s "** $NOTIFICATIONTYPE$ Service Alert: $HOSTALIAS$/$SERVICEDESC$ is $SERVICESTATE$ **" $CONTACTEMAIL$
       }
默认是配置好了这里就不用配置
直接在contact和services中使用就好了
把mysql停了
[ ttp://static.oschina.net/uploads/img/201511/05030032_cpxO.jpg][/url]

验证成功,但是要注意需要把发件人的地址设置为白名单才可以收到
[ ttp://static.oschina.net/uploads/img/201511/05030032_dWR4.jpg][/url]
由于是手机邮件就实现了邮件短信同时提醒的功能,当然有邮件达到短信提醒的邮箱都能实现这个功能不一定是手机邮箱



想做Nagios Zabbix,Cacti,iTop各种交流的,可以进入开源监控工具Nagios交流  QQ群号 476809427




上一篇:nagios安装配置
下一篇:Nagios上如何使用微信短信提醒
monicazhang

写了 2297 篇文章,拥有财富 12859,被 21 人关注

您需要登录后才可以回帖 登录 | 立即注册
B Color Link Quote Code Smilies

成为第一个吐槽的人

手机版|小黑屋|最新100贴|论坛版块|ITIL先锋论坛 |粤ICP备11099876号|网站地图
Powered by Discuz! X3.4 Licensed  © 2001-2017 Comsenz Inc.
返回顶部