centos中shell定时检测mysqld,nginx,httpd服务脚本

2024-08-27 23:59:12

字体：大中小

来源：转载

供稿：网友

现在我们会发现很多个人站长的博客都会有不定时的打不开,要不是mysql数据库停止了,要么是nginx 502了或者apache不运行了,为了防止网站出现此问题我们给各位整理了一些监控这些服务是不是正常工作的代码,希望可帮助大家.

前几天发现网站打不开,提示数据库连接错误,我登录linux 发现mysqld服务不知道什么时候停止了,幸好我即使发现.

于是决定写一个shell脚本每分钟自动检测mysqld服务,如果发现服务没起来就自动启动mysqld服务,也就是:通过cron定时任务执行检测脚本.

编写检测脚本 /root/bin/check,代码如下:

#!/bin/bash

check=`pgrep mysql`

if [ -n "$check" ]; then

        exit

else

        date=$(date +"%Y-%m-%d %H:%M:%S")

        /etc/init.d/mysqld  start  //Vevb.com

        echo 'error: mysqld at ' $date

fi

说明:也可以修改check=`pgrep mysql` 比如 check=`pgrep httpd` 或者 check=`pgrep nginx`来监测其他服务,

编辑cron执行:crontab -e

cron内容如下,其中注释掉了一行,可选择性编写.

#* * * * * sh /root/bin/check > /dev/null 2>&1 #执行后不发送结果邮件

* * * * * sh /root/bin/check >> /root/bin/log.txt #执行后发送结果到指定文件

由于cron每次执行后如果有输出则会默认发送邮件到 /var/spool/mail/root 长时间会导致此文件有很多无用记录,我们可以用 > /dev/null 2>&1 忽略结果写入,当然也可以用 >> /root/bin/log.txt 写入到指定文件(要事先建立好文件).

cron命令行简要说明:

分时日月星期命令行

例： */5 * * * * cmd #表示每5分钟执行一次命令

command > filename 把标准输出重定向到一个新文件中

command >> filename 把标准输出重定向到一个文件中(追加)

command 1 > fielname 把标准输出重定向到一个文件中

command > filename 2>&1 把标准输出和标准错误一起重定向到一个文件中

command 2 > filename 把标准错误重定向到一个文件中

command 2 >> filename 把标准输出重定向到一个文件中(追加)

command >> filename 2>&1 把标准输出和标准错误一起重定向到一个文件中(追加)

command < filename >filename2 把command命令以filename文件作为标准输入，以filename2文件作为标准输出

command < filename 把command命令以filename文件作为标准输入

command << delimiter 把从标准输入中读入，直至遇到delimiter分界符

command <&m 把文件描述符m作为标准输入

command >&m 把标准输出重定向到文件描述符m中

command <&- 把关闭标准输入

command 2>&1 把command命令标准错误重定向到标准输出

下面的shell通过一个while-do循环,用ps -ef|grep 检查loader进程是否正在运行,如果没有运行,则启动,这样就保证了崩溃挂掉的进程重新被及时启动.

必须注意两点:

1、ps |grep 一个进程时必须加上其路劲,否则容易grep到错误的结果.

2、必须用 -v 从结果中去除grep命令自身,否则结果非空,代码如下:

#!/bin/sh

#=====================

#Vevb.com

#khler@163.com

#=====================

while :

do

  echo "Current DIR is " $PWD

  stillRunning=$(ps -ef |grep "$PWD/loader" |grep -v "grep")

  if [ "$stillRunning" ] ; then

    echo "TWS service was already started by another way"

    echo "Kill it and then startup by this shell, other wise this shell will loop out this message annoyingly"   //Vevb.com

    kill -9 $pidof $PWD/loader

  else

    echo "TWS service was not started"

    echo "Starting service ..."

    $PWD/loader

    echo "TWS service was exited!"

  fi

  sleep 10

done

如果启动此shell时发现进程已经存在,说明以别的方式启动了进程而不是此shell,那么它会持续提醒找到进程,解决办法是,要么只用此shell启动服务,要么一经发现以其他方式启动的服务即kill掉,上面的语句就是这么干的:

kill -9 $pidof $PWD/loader

再补充一个监控nginx的shell脚本

Nginx 虽然处理并发量比 apache 确实要强点，但它这种 php-cgi 模式不是太稳定，这点网上也有朋友总结了，我在实现项目中也感受到了。

我们一台支付机，偶尔会出现以下情况的：php-cgi 进程突然消失了，造成PHP脚本无法访问；更不可思议的是明明是php-cgi 打开有两个端口在监听的，莫名其秒的突然有一个php-cgi 的端口被关闭了，造成所有请求全积在一个端口上，结果造成PHP脚本访问异常。

基本这种情况，我写了个监控shell脚本的解决方案，不管以上出现那种情况，都自动恢复Nginx的服务.该脚本在生产环境上运行正常,代码如下:

#!/bin/bash

#

# filename: webservermonitor.sh

# 功能:监控 nginx 的 php-cgi 是否正常

# 作者:V哥

# 运行: webservermonitor.sh &

#

# php-cgi 监听的IP和端口

V_PHP_CGI_PORT="127.0.0.1:9000 127.0.0.1:9001"

# nginx重启的脚本

V_NGINX="/usr/local/nginx/sbin/restart.sh"

# 日志文件

V_LOG="/tmp/webservermonitor.log"

# 函数定义:重启nginx

function restart_nginx(){

    echo "----- `date` -----" >> $V_LOG

    echo "------------------" >> $V_LOG

    echo "`ps aux |grep 'nginx'`" >> $V_LOG

    echo "------------------" >> $V_LOG

    echo "`ps aux |grep 'php-cgi'`" >> $V_LOG

    echo "------------------" >> $V_LOG

    echo "`netstat -nlpt | grep 'php-cgi'`" >> $V_LOG

    echo "------------------" >> $V_LOG

    $V_NGINX  >> $V_LOG

}

# 循环执行,不采用 crontab ,国为 crontab 最小单位是分钟,时间太长了

while :

do

    # 1:先检测 nginx 主进程是否存在

    V_NGINX_NUM=`ps axu |grep 'nginx' |grep -v 'grep' |wc -l`

    if [ $V_NGINX_NUM -lt 1 ];then

        restart_nginx

        continue

    fi

    # 2:再检查php-cgi是否有进程存在

    V_PHP_CGI_NUM=`ps axu |grep 'php-cgi' |grep -v 'grep' |wc -l`

    if [ $V_PHP_CGI_NUM -lt 1 ];then

        restart_nginx

        continue

    fi

    # 3:再判断端口是否正常

    for PORT in $V_PHP_CGI_PORT

    do

        V_NUM=`eval "netstat -nlpt | grep '${PORT}' | wc -l"`

        if [ $V_NUM -lt 1 ];then

            restart_nginx

            continue

        fi

    done

    # 休眠

    sleep 5

done