问题:删除数据,数据量已经不大了,为什么使用 top 命令查看时,Redis 依然占用了很多内存?
因为当数据删除后,Redis 释放的内存空间会由内存分配器管理,并不会立即返回给操作系统。所以,操作系统仍然会记录着给 Redis 分配了大量内存。
潜在的风险点:Redis 释放的内存空间可能并不是连续的,这些不连续的内存空间很有可能处于一种闲置的状态。这就会导致一个问题:虽然有空闲空间,Redis 却无法用来保存数据,不仅会减少 Redis 能够实际保存的数据量,还会降低 Redis 运行机器的成本回报率。
通常情况下,内存空间闲置,往往是因为操作系统发生了较为严重的内存碎片。
假设一个车厢的座位总共有 60 个,现在已经卖了 57 张票。A、B、C 三人想要坐在一起,但剩下的三个座位是分散的,无法满足三人的要求。
类似的,应用申请的是一块连续地址空间的 N 字节,但在剩余的内存空间中,没有大小为 N 字节的连续空间,那么,这些剩余空间就是内存碎片(比如上图中的“空闲 2 字节”和“空闲 1 字节”)。
内存碎片的形成有内因和外因两个层面的原因。简单来说,内因是操作系统的内存分配机制(内存分配器的分配策略),外因是 Redis 的负载特征(键值对大小不一样和删改操作)。
内存分配器的分配策略就决定了操作系统无法做到“按需分配”。这是因为,内存分配器一般是按固定大小来分配内存,而不是完全按照应用程序申请的内存空间大小给程序分配。
Redis 可以使用 libc、jemalloc、tcmalloc 多种内存分配器来分配内存,默认使用 jemalloc。
jemalloc 的分配策略之一,是按照一系列固定的大小划分内存空间(2 的 N 次方),当程序申请的内存最接近某个固定值时,jemalloc 会给它分配相应大小的空间。假设 Redis 申请一个 30 字节的空间保存数据,jemalloc 就会分配 32 字节,如果此时应用想要存入 2 字节的数据,则刚好够用,这样的分配方式起到了减少分配次数的作用;若此时应用想要存入4个字节的数据,而剩余的空间无法满足要求,则成为了内存碎片。
Redis 是内存数据库,内存利用率的高低直接关系到 Redis 运行效率的高低。Redis 自身提供了 INFO 命令,可以用来查询内存使用的详细信息,命令如下:
INFO memory # Memory used_memory:1073741736 used_memory_human:1024.00M used_memory_rss:1997159792 used_memory_rss_human:1.86G … mem_fragmentation_ratio:1.86
mem_fragmentation_ratio 的指标,它表示的是 Redis 当前的内存碎片率。 等于指标 used_memory_rss 和 used_memory 相除的结果。
mem_fragmentation_ratio = used_memory_rss/ used_memory
used_memory_rss 是操作系统实际分配给 Redis 的物理内存空间,里面就包含了碎片; 而
used_memory 是 Redis 为了保存数据实际申请使用的空间。
经验阈值:
内存碎片清理,简单来说,就是“搬家让位,合并空间”。
碎片清理是有代价的,操作系统需要把多份数据拷贝到新位置,把原有空间释放出来,这会带来时间开销。因为 Redis 是单线程,在数据拷贝时,Redis 只能等着,这就导致 Redis 无法及时处理请求,性能就会降低。而且,有的时候,数据拷贝还需要注意顺序,就像上图清理内存碎片的例子,操作系统需要先拷贝 D,并释放 D 的空间后,才能拷贝 B。这种对顺序性的要求,会进一步增加 Redis 的等待时间,导致性能降低。
Redis 专门为自动内存碎片清理功机制设置了参数。可以通过设置参数,来控制碎片清理的开始和结束时机,以及占用的 CPU 比例,从而减少碎片清理对 Redis 本身请求处理的性能影响。
Redis 需要启用自动内存碎片清理,可以把 activedefrag 配置项设置为 yes,命令如下:
config set activedefrag yes
这个命令只是启用了自动清理功能,但是,具体什么时候清理,会受到下面这两个参数的控制。这两个参数设置了触发内存清理的条件,如果同时满足这两个条件,就开始清理。在清理的过程中,只要有一个条件不满足了,就停止自动清理。
为了尽可能减少碎片清理对 Redis 正常请求处理的影响,自动内存碎片清理功能在执行时,还会监控清理操作占用的 CPU 时间,而且还设置了两个参数,分别用于控制清理操作占用的 CPU 时间比例的上、下限,既保证清理工作能正常进行,又避免了降低 Redis 性能。这两个参数具体如下: