运维基本功（十）：Linux计划任务以及进程检测与控制

本文主要是介绍运维基本功（十）：Linux计划任务以及进程检测与控制，对大家解决编程问题具有一定的参考价值，需要的程序猿们随着小编来一起学习吧！

本文是在黑马程序员网课课件基础上修改的学习笔记
课程原地址：https://www.bilibili.com/video/BV1nW411L7xm
如有侵删

运维基本功（一）：Linux系统安装
运维基本功（二）：Linux基本命令
运维基本功（三）：Linux文件管理
运维基本功（四）：Linux文件管理-Vim编辑器概述
运维基本功（五）：Linux文件管理-用户管理
运维基本功（六）：Linux用户管理-远程管理
运维基本功（七）：Linux的权限管理操作
运维基本功（八）：Linux自有服务与软件包管理
运维基本功（九）： Linux自有服务-防火墙&计划任务
运维基本功（十）： Linux计划任务以及进程检测与控制

一、Linux计划任务

1、计划任务权限

黑名单

crontab是任何用户都可以创建的计划任务，但是超级管理员可以通过配置来设置某些用户不允许设置计划任务。

提出问题：如果我们想限定某个用户（如itheima）使用计划任务，如何处理呢？

答：可以使用计划任务的黑名单，黑名单文件路径 => /etc/cron.deny文件

案例：把普通账号itheima加入到cron.deny黑名单中，禁止其创建计划任务

第一步：切换到超级管理员root

# su - root

第二步：使用vim打开/etc/cron.deny文件

# vim /etc/cron.deny

第三步：把你需要禁止的用户名单，加入此文件（如itheima）

itheima

切换到itheima账号，测试是否可以使用crontab命令

在这里插入图片描述

白名单

在Linux的计划任务中，除了拥有黑名单以外，还有白名单。作用：允许哪些用户使用计划任务。

白名单文件的路径 => /etc/cron.allow，但是要特别注意，此文件需要手工创建。

注意：白名单优先级高于黑名单，如果一个用户同时存在两个名单文件中，则会被默认允许创建计划任务。

2、查看计划任务的保存文件

问题：计划任务文件具体保存在哪里呢？

答：/var/spool/cron/用户名称，如果使用root用户编辑计划任务，则用户文件名为root

# ll /var/spool/cron
total 4
-rw-------. 1 itheima itheima  0 Mar 24 09:50 itheima
-rw-------. 1 root    root    40 Mar 24 10:21 root

3、计划任务的日志程序

问题：在实际应用中，我们如何查看定时任务运行情况？

答：通过计划任务日志，日志文件位于/var/log/cron

案例：演示计划任务的日志程序

第一步：使用root账号创建一个计划任务

# su - root
# crontab -e
* * * * * echo 1 >> ~/readme.txt

第二步：使用tail -f命令监控/var/log/cron日志程序

# tail -f /var/log/cron

4、扩展内容：at命令

在Linux系统下，有两个命令可以实现计划任务：crontab与at（第三方需要额外安装）

crontab ：每天定时执行计划任务（最小单元分钟）

at ：一次性定时执行任务

安装at命令

CentOS7自带，其他版本可能需要手工安装

# yum install at -y

启动底层服务

# systemctl start atd
# systemctl enable atd

atd = at + d = at命令 + daemon缩写

案例演示

案例1：三天后下午5点执行/bin/ls

# at 5pm+3 days
at>/bin/ls >/root/readme.txt
at>按Ctrl+D

am = 上午、pm = 下午、3 days = 3天

案例2：明天17点，输出时间到指定的文件中

# at 17:00 tomorrow
at>date>/root/readme.txt
at>按Ctrl+D

tomorrow = 明天

案例3：使用atq查看没有执行的计划任务

# atq

atq = at + q = at命令 + query查询

案例4：删除指定的计划任务

# atq
# atrm 任务号

atrm = at + rm = at命令 + remove移除

二、Linux进程与程序

1、了解一下进程与程序的关系

进程是正在执行的一个程序或命令，每个进程都是一个运行的实体，并占用一定的系统资源。程序是人使用计算机语言编写的可以实现特定目标或解决特定问题的代码集合。

简单来说，程序是人使用计算机语言编写的，可以实现一定功能，并且可以执行的代码集合。进程是正在执行中的程序。

举例：谷歌浏览器是一个程序，当我们打开谷歌浏览器，就会在系统中看到一个浏览器的进程，当程序被执行时，程序的代码都会被加载入内存，操作系统给这个进程分配一个 ID，称为 PID（进程 ID）。我们打开多个谷歌浏览器，就有多个浏览器子进程，但是这些进程使用的程序，都是chrome

PID = Process ID = 进程编号

在这里插入图片描述

2、Linux下的进程管理工作

进程查看，通过查看，判断健康状态

进程终止

进程优先级控制

三、Linux下进程管理命令

1、任务背景

工作场景：

小黑入职到一家公司，接到的第一项任务，就是监控生产服务器的性能，提到服务器性能，我们首先想到的就是CPU，内存和磁盘。

2、使用top命令动态监测CPU信息

基本语法：

# top

在这里插入图片描述

3、系统的整体情况

第一行

在这里插入图片描述

内容	说明
10:12:28	系统当前时间
up 13:05	系统的运行时间.本机己经运行 13 小时 05 分钟
3 users	当前登录了三个用户
load average: 0.00,0.01，0.05	系统在之前 1 分钟、5 分钟、15 分钟的平均负载。如果 CPU 是单核的，则这个数值超过 1 就是高负载：如果 CPU 是四核的，则这个数值超过 4 就是高负载

第二行

在这里插入图片描述

Tasks: 230 total	系统中的进程总数
1 running	正在运行的进程数
229 sleeping	睡眠的进程数
0 stopped	正在停止的进程数
0 zombie	僵尸进程数。如果不是 0，则需要手工检查僵尸进程

第三行

在这里插入图片描述

内容	说明
Cpu(s): 0.1 %us	用户模式占用的 CPU 百分比
0.1%sy	系统模式占用的 CPU 百分比
0.0%ni	改变过优先级的用户进程占用的 CPU 百分比
99.7%id	idle缩写，空闲 CPU 占用的 CPU 百分比
0.1%wa	等待输入/输出的进程占用的 CPU 百分比
0.0%hi	硬中断请求服务占用的 CPU 百分比
0.1%si	软中断请求服务占用的 CPU 百分比
0.0%st	st（steal time）意为虚拟时间百分比，就是当有虚拟机时，虚拟 CPU 等待实际 CPU 的时间百分比

问题：如果我的机器有4核CPU，我想查看每一核心分别的负载情况怎能办？

答：交换快捷键 “1”

在这里插入图片描述

CPU负载测试 => cat /dev/urandom |md5sum

第四行

在这里插入图片描述

内容	说明
Mem: 1863252 total	物理内存的总量，单位为KB
829960 used	己经使用的物理内存数量
68352 free	空闲的物理内存数量。我们使用的是虚拟机，共分配了 628MB内存，所以只有53MB的空闲内存
96490 buff/cache	作为缓冲的内存数量

扩展：真正剩余内存 = free + buff/cache，真正使用内存 = used - buff/cache

第五行

在这里插入图片描述

内容	说明
Swap: 2097148 total	交换分区（虚拟内存）的总大小
3336 used	已经使用的交换分区的大小
2093812 free	空闲交换分区的大小
622420 avail Mem	可用内存

在Linux操作系统分区时，最少需要3个分区：

① /boot分区：系统分区

② swap交换分区：一般情况下为内存的1~2倍，但是尽量不要超过2G

③ /分区：根分区，所有文件都存放于此

swap分区：就是当计算机的内存不足时，系统会自动从硬盘中划出一块区域充当内存使用。

我们通过 top 命令的整体信息部分，就可以判断服务器的健康状态。如果 1 分钟、5 分钟、15 分钟的平均负载高于CPU核数，说明系统压力较大。如果物理内存的空闲内存过小，则也证明系统压力较大。

问题：根据以上信息，目前我们的系统压力如何？

答：看CPU负载及内存的使用情况

问题：如果我们发现CPU负载过大，接下来怎么办？

答：如果1分钟、5分钟以及15分钟全部超过CPU的总核心数（必须引起警觉），这个时候就要查看底部的进程信息了。

经验之谈：如果一个总核数=8核心的CPU，理论上平均负载达到16，也还可以坚持很长一段时间。

4、系统的进程信息

在这里插入图片描述

PID	进程的 ID。
USER	该进程所属的用户。
PR	优先级，数值越小优先级越高。
NI	NICE优先级，数值越小优先级越高，取值范围-20到19，默认都是0
VIRT	该进程使用的虚拟内存的大小，单位为 KB。
RES	该进程使用的物理内存的大小，单位为 KB。
SHR	共享内存大小，单位为 KB。计算一个进程实际使用的内存 = 常驻内存（RES）- 共享内存（SHR）
S	进程状态。其中S 表示睡眠，R 表示运行
%CPU	该进程占用 CPU 的百分比。
%MEM	该进程占用内存的百分比。
TIME+	该进程共占用的 CPU 时间。
COMMAND	进程名

问题：如果我们发现CPU负载过大，接下来怎么办？

答：查看占用CPU最多的进程

问题：如何查看占用CPU最多的进程？

答：交互操作快捷键P，P（大写）：，表示将结果按照CPU 使用率从高到低进行降序排列

问题：如果我们发现内存可用量很小，接下来怎么办？

答：查看占用内存最多的进程，使用交互快捷键M（大写）：表示将结果按照内存（MEM）从高到低进行降序排列

在这里插入图片描述

问题：当我们查看完系统状态，需要做什么？

答：退出，使用q，按键盘上的q，就会回到#提示符的状态。

5、free查看内存使用情况

基本语法：

# free [选项]  1GB = 1024MB  1MB = 1024KB
选项说明：
-m : 以MB的形式显示内存大小

案例：显示计算机的内存使用情况

# free -m

和Centos6相比，buffer和cached被合成一组，加入了一个available。

关于此available，即系统可用内存，用户不需要去计算buffer/cache，即可以看到还有多少内存可用，更加简单直观

在这里插入图片描述

6、df查看磁盘剩余空间

基本语法：

# df [选项]
-h ：以较高的可读性显示磁盘剩余空间大小

df = disk free = 磁盘剩余

这几列依次是：

Filesystem	磁盘名称
Size	总大小
Used	被使用的大小
Avail	剩余大小
Use%	使用百分比
Mounted on	挂载路径（相当于Windows 的磁盘符）

7、ps查看系统进程信息

top ：动态查看系统进程的信息（每隔3s切换一次）

ps ：静态查看系统进程的信息（只能查询运行ps命令瞬间，系统的进程信息）

基本语法：

# ps [选项]
选项说明：
-e : 等价于“-A”，表示列出全部（all）的进程
-f : 表示full，显示全部的列（显示全字段）

案例：显示当前系统中所有进程的信息

# ps -ef

在这里插入图片描述

UID	该进程执行的用户ID
PID	进程ID
PPID	该进程的父级进程ID，如果找不到，则该进程就被称之为僵尸进程（Parent Process ID）
C	Cpu的占用率，其形式是百分数
STIME	进程的启动时间
TTY	终端设备，发起该进程的设备识别符号，如果显示“?”则表示该进程并不是由终端设备发起
TIME	进程实际使用CPU的时间
CMD	该进程的名称或者对应的路径

经验之谈：我们在实际工作中使用ps命令其实主要用于查询某个进程的PID或PPID

工作场景

小黑用学到的命令，发现某个进程占用CPU很高，希望进一步查看这个简称的信息。

ps -ef 会列出全部进程，但是我们发现进程非常多，我们很难找到自己想要看的进程。这里需要使用过滤命令grep，来过滤掉我们不需要的信息。

基本语法：

用法：ps -ef |grep 想要看到的进程名
示例代码：
# ps -ef |grep crond
含义：查看crond进程的详细情况
注意：查询结果中，如果只有一条则表示没查到对应的进程（这1 条表示刚才ps 指令的自身）。只有查到的结果多余1 条，才表示有对应的进程。

案例：查询crond的进程信息

# ps -ef |grep crond
root       7102      1  0 Mar23 ?        00:00:04 /usr/sbin/crond -n
root      24752  12881  0 16:34 pts/2    00:00:00 grep --color=auto crond

问题：以上信息只有第一行是crond的进程，第二行，实际是管道命令发起时，grep所启动的进程，如何去掉？

# ps -ef |grep crond |grep -v "grep"
root       7102      1  0 Mar23 ?        00:00:04 /usr/sbin/crond -n

grep -v 需要去除的相关信息：去除包含指定关键词的那一行

扩展：ps aux命令

# ps aux

# man ps

1 UNIX options, which may be grouped and must be preceded by a dash. ps -ef
2 BSD options, which may be grouped and must not be used with a dash. ps aux

在这里插入图片描述

USER：该 process 属于哪个使用者账号
PID ：该 process 的ID
%CPU：该 process 使用掉的 CPU 资源百分比
%MEM：该 process 所占用的物理内存百分比
VSZ ：该 process 使用掉的虚拟内存量 (Kbytes)
RSS ：该 process 占用的固定的内存量 (Kbytes)
TTY ：该 process 是在那个终端机上面运作，若与终端机无关，则显示 ?，另外， tty1-tty6 是本机上面的登入者程序，若为 pts/0 等等的，则表示为由网络连接进主机的程序。
STAT：该程序目前的状态，主要的状态有
R ：该程序目前正在运作，或者是可被运作
S ：该程序目前正在睡眠当中 (可说是 idle 状态)，但可被某些讯号 (signal) 唤醒。
T ：该程序目前正在侦测或者是停止了
Z ：该程序应该已经终止，但是其父程序却无法正常的终止他，造成 zombie (疆尸) 程序的状态
START：该 process 被触发启动的时间
TIME ：该 process 实际使用 CPU 运作的时间
COMMAND：该程序的实际指令

8、netstat/ss查询网络访问信息

基本语法：

# netstat [选项] |grep 进程名称
选项说明：
-t：表示只列出tcp 协议的连接（tcp协议与udp协议）
-n：表示将地址从字母组合转化成ip 地址，将协议转化成端口号来显示  10.1.1.10:80
-l：表示过滤出"state（状态）"列中其值为LISTEN（监听）的连接
-p：表示显示发起连接的进程pid 和进程名称

案例：查询Web Server（httpd）服务的端口信息

# netstat -tnlp |grep httpd

基本语法：

# ss -naltp |grep 进程名称

案例：查询sshd服务的端口信息

# ss -naltp |grep sshd

netstat与ss区别？① netstat信息比较简洁，ss更加丰富 ② ss执行效率比netstat略高一些

9、kill/killall杀死进程

根据pid杀掉进程

命令：kill
语法：kill [信号] PID
作用：kill 命令会向操作系统内核发送一个信号（多是终止信号）和目标进程的 PID，然后系统内核根据收到的信号类型，对指定进程进行相应的操作

经验：kill经常结合ps命令一起使用

kill命令用于杀死某个进程，这其实只是其一个功能。kill命令的实质是向进程发送信号

信号种类：

信号编号	含义
9	杀死进程，即强制结束进程。
15	正常结束进程，是 kill 命令的默认信号。

案例：使用kill命令杀死crond进程

# ps -ef |grep crond
7102
# kill 7102

备注：在互联网中，经常看到kill -9 进程PID，强制杀死某个进程，kill -9 pid

根据进程名称杀掉进程

基本语法：

# killall [信号编号] 进程名称

案例：使用killall命令杀死crond进程

# killall crond

案例：使用killall命令杀死httpd进程

# killall httpd

种类：

信号编号	含义
9	杀死进程，即强制结束进程。
15	正常结束进程，是 kill 命令的默认信号。

案例：使用kill命令杀死crond进程

# ps -ef |grep crond
7102
# kill 7102

备注：在互联网中，经常看到kill -9 进程PID，强制杀死某个进程，kill -9 pid

根据进程名称杀掉进程

基本语法：

# killall [信号编号] 进程名称

案例：使用killall命令杀死crond进程

# killall crond

案例：使用killall命令杀死httpd进程

# killall httpd

这篇关于运维基本功（十）：Linux计划任务以及进程检测与控制的文章就介绍到这儿，希望我们推荐的文章对大家有所帮助，也希望大家多多支持为之网！

运维基本功（十）：Linux计划任务以及进程检测与控制

一、Linux计划任务

1、计划任务权限

黑名单

白名单

2、查看计划任务的保存文件

3、计划任务的日志程序

4、扩展内容：at命令

安装at命令

启动底层服务

案例演示

二、Linux进程与程序

1、了解一下进程与程序的关系

2、Linux下的进程管理工作

三、Linux下进程管理命令

1、任务背景

2、使用top命令动态监测CPU信息

3、系统的整体情况

第一行

第二行

第三行

问题：如果我的机器有4核CPU，我想查看每一核心分别的负载情况怎能办？

第四行

第五行

4、系统的进程信息

问题：如果我们发现CPU负载过大，接下来怎么办？

问题：如何查看占用CPU最多的进程？

问题：如果我们发现内存可用量很小，接下来怎么办？

问题：当我们查看完系统状态，需要做什么？

5、free查看内存使用情况

6、df查看磁盘剩余空间

7、ps查看系统进程信息

8、netstat/ss查询网络访问信息

9、kill/killall杀死进程

根据pid杀掉进程

根据进程名称杀掉进程

根据进程名称杀掉进程

前端开发

后端开发

移动端开发

数据库

服务器运维

人工智能

区块链

游戏开发

网站运营

大数据/云计算

软件工程

软件/开发工具使用

资讯