Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典

 Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典

最近收到一个工作要求,让我完成一个每天一次的Linux服务器巡检工作(服务器的版本为红帽6.4),不可以使用监控软件来操作。在这里,把我的巡检过程和巡检脚本放送给大家做一参考。

首先,巡检内容可以参考下表:

Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典

Linux服务器应用巡检

具体的巡检内容在这里做一说明:

1、 CPU占用率

检查脚本:top shift+m c

这里需要记录的参数是?%us,建议稍等几秒看下动态变化再记录。

Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典

cpu占用率

2、内存使用率

检查脚本:free-m /free -g

Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典

内存使用率

这里重点需要看的是swap内存是否被使用了,需要记录的是第二行的第二个,它和总内存量的比值就是内存的使用率。具体使用-m还是-g,就看服务器内存大小了

3、硬盘使用率

检查脚本:df

Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典

硬盘使用率

磁盘使用率看的就是磁盘使用率本身了,这里如果服务器下的应用单独使用了挂载的磁盘,还需要单独查看挂载磁盘的使用率

4、 I/O空闲

检查脚本:iostat -xm

Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典

I/O空闲

需要记录的值就是图中红色框住的,?%idle,这个就是I/O空闲 。这里可以使用iostat -xm 1,动态查看多个值了之后取一个比较平均的。

5、应用运行状况

查看应用的页面是否正常,用户是否使用正常。

6、应用服务状态

检查脚本:./应用服务 status

查看是否服务状态为running。

7、应用服务运行日志是否有报错

检查脚本:cat 应用服务运行日志| grep ERR

直观查看应用服务运行的日志中是否有报错,这里也可以直接打开查看:

vim 应用服务运行日志

然后用“/ERR”查看报错

8、应用内容记录日志是否有报错

检查脚本:cat 应用内容记录日志 grep ERR

9、数据文件大小

首先,打开应用数据文件所在的目录,然后运行:du -sh *

这里可以看到此目录下所有文件的大小。

10、归档文件状态

这个是我负责的应用的一个特殊功能,可以归档,所有有这个需求,大家可以忽略。

11、备份执行情况

相关推荐