每当我们通过Redis命令在数据库新创建一个键值对时,我们至少会创建两个对象,分别是键对象和值对象,Redis中的对象都是用redisObject结构表示,该结构中保存数据有关的三个属性分别是type属性、encoding属性和ptr属性:
typedef struct redisObject { unsigned type:4;//类型 unsigned encoding:4; //编码 void *ptr;//指向底层实现数据结构的指针 ... }
type属性记录的是对象的类型,对于Redis来说键总是一个字符串类型对象,而值可以是以下五种对象类型:
类型常量 | 对象的名称 |
REDIS_STRING | 字符串对象 |
REDIS_LIST | 列表对象 |
REDIS_HASH | 哈希对象 |
REDIS_SET | 集合对象 |
REDIS_ZSET | 有序集合对象 |
在Redis中可以直接通过TYPE命令来看数据库键对应的值对象的类型。
对象的ptr指针指向底层实现的数据结构,而encoding表示这些数据结构的编码属性,如下(下面的编码属性是Redis3.0,现在的Redis有新的数据结构例如quicklist,基本不用linkedlist):
编码常量 | 编码所对应的底层数据结构 |
REDIS_ENCODING_INT | long类型的整数 |
REDIS_ENCODING_EMBSTR | embstr编码的简单动态字符串 |
REDIS_ENCODING_RAW | 简单动态字符串 |
REDIS_ENCODING_HT | 字典 |
REDIS_ENCODING_LINKEDLIST | 双端链表 |
REDIS_ENCODING_ZIPLIST | 压缩链表 |
REDIS_ENCODING_INTSET | 整数集合 |
REDIS_ENCODING_SKIPLIST | 跳跃表和字典 |
每种类型的对象至少使用了两种不同的编码,如下列出了每种对象可以使用的编码
REDIS_STRING | REDIS_ENCODING_INT | 整数值实现的字符串对象 |
REDIS_STRING | REDIS_ENCODING_EMBSTR | embstr编码实现的字符串对象 |
REDIS_STRING | REDIS_ENCODING_RAW | 简单动态字符串实现的字符串对象 |
REDIS_LIST | REDIS_ENCODING_ZIPLIST | 压缩列表实现的列表对象 |
REDIS_LIST | REDIS_ENCODING_LINKEDLIST | 双端列表实现的列表对象 |
REDIS_HASH | REDIS_ENCODING_ZIPLIST | 压缩列表实现的哈希对象 |
REDIS_HASH | REDIS_ENCODING_HT | 字典实现的哈希对象 |
REDIS_SET | REDIS_ENCODING_INTSET | 整数集合实现的集合对象 |
REDIS_SET | REDIS_ENCODING_HT | 字典实现的集合对象 |
REDIS_ZSET | REDIS_ENCODING_ZIPLIST | 压缩列表实现的有序集合对象 |
REDIS_ZSET | REDIS_ENCODING_SKIPLIST | 跳跃表和字典实现的有序集合对象 |
可以使用OBJECT ENCODING命令查看一个数据库键的值对象的编码。
OBJECT ENCODING对不同编码的输出如下
编码常量 | OBJECT ENCODING命令输出 |
REDIS_ENCODING_INT | "int" |
REDIS_ENCODING_EMBSTR | "embstr" |
REDIS_ENCODING_RAW | "raw" |
REDIS_ENCODING_HT | "hashtable" |
REDIS_ENCODING_LINKEDLIST | "linkedlist" |
REDIS_ENCODING_ZIPLIST | "ziplist" |
REDIS_ENCODING_INTSET | "intset" |
REDIS_ENCODING_SKIPLIST | "skiplist" |
通过不同的编码方式来处理对象,而不是为特定的对象指定一种固定的编码,极大提升的Redis的效率和灵活性。Redis可以根据使用场景来为一个对象设置不同的编码,从而优化对象在某一场景下的效率。
举个例子:列表对象的底层实现有两种:ziplist、linkedlist(现在被quicklist替代);当元素比较少且元素位数小时,Redis会用ziplist作为列表对象的底层实现,因为ziplist节约空间,并且在内存中是以连续块方式保存。而当元素变多的时候ziplist的优势就会逐渐消失(插入、删除元素耗时)这个时候linkedlist作为列表对象底层实现更加合适。
字符串对象的编码可以是int、raw或者embstr
如果一个字符串保存的是整数值,并且这个整数值可以用long类型来表示,那么字符串对象会将整数值保存在字符串对象结构体中的ptr属性里面(void*转换成long),这个时候字符串对象的编码方式设置为int。
redis> SET number 10086 OK redis> OBJECT ENCODING number "int"
如果保存的是一个字符串值,并且这个字符串的长度大于32字节,那么对象的编码方式是raw
redis> SET story "long, long ago there lived a king ... OK redis> STRLEN story (integer) 37 redis> OBJECT ENCODING story "raw"
如果字符串长度小于32字节,这个时候字符串对象的编码方式是embstr。
编码的转换:
int编码的字符串对象和embstr编码的字符串在条件满足的情况下会被转换成raw编码的字符串
下面列出字符串对象的部分命令,以及这些命令在不同编码下执行结果
命令 | int编码 | embstr编码 | raw编码 |
SET | 使用int编码保存值 | 使用embstr编码保存值 | 使用raw编码保存值 |
GET | 拷贝对象保存的整数值,将这个拷贝转换成字符串值,然后返回给客户端 | 直接向客户端返回字符串值 | 直接向客户端返回字符串值 |
INCRBYFLOAT | 取出整数值并将其转换成long double类型的浮点数,对这个浮点数进行加法运算 | 取出字符串并尝试转换成long double类型,如果不能被转换成浮点数向客户端返回错误 | 取出字符串并尝试转换成long double类型,如果不能被转换成浮点数向客户端返回错误 |
INCRBY | 对整数值进行加法计算 | 尝试转换,如果不能被转换就向客户端返回错误 | 尝试转换,如果不能被转换就向客户端返回错误 |
DECRBY | 同上 | 同上 | 同上 |
STRLEN | 拷贝对象保存的整数值,转换成字符串值,并计算字符串长度 | 调用sdslen函数 | 调用sdslen函数 |
APPEND | 将对象编码转换成raw,然后按raw编码方式执行此操作 | 将对象编码转换成raw,然后按raw编码方式执行此操作 | 调用sdscatlen函数 |
SETRANGE | 将对象编码转换成raw,然后按raw编码方式执行此操作 | 将对象编码转换成raw,然后按raw编码方式执行此操作 | 将字符串特定索引上的值设置为给定的字符串 |
GETRANGE | 拷贝 后转换成字符串返回 | 直接返回 | 直接返回 |
列表对象的编码可以是ziplist或者linkedlist(这里是旧版本用的,新版本会用quicklist)
哈希对象的另一个名字是散列表,编码可以是ziplist和hashtable
ziplist编码的哈希对象底层使用压缩列表,每当新的键值对要加入哈希对象的时候,Redis会先向压缩列表中推入保存键的压缩列表介电,然后再推入保存值的压缩列表的节点。所以在哈希对象中同一键值对的两个节点总是紧挨在一起的,保存键的节点在前,保存值的节点在后。
hashtable编码的哈希对象使用字典作为底层实现这里不展开。
当哈希对象同时满足以下两个条件时,哈希对象使用ziplist编码:
1.哈希对象保存的所有键值对的键和值的字符串都小于64字节;
2.哈希对象保存的键值对数量小于512个;
不能满足这两个条件的哈希对象使用hashtable编码。(当然这些上限是可以修改的,具体修改Redis的配置文件)
集合对象的编码可以是intset或者hashtable
当集合对象同时满足以下两个条件时,对象使用intset编码
1.集合对象保存的所有元素都是整数值
2.集合对象保存的元素数量不超过512个
有序集合对象的编码可以是ziplist或者skiplist(底层用到字典和跳跃表)
ziplist编码时,每个集合元素使用两个紧挨在一起的压缩列表的节点来保存,第一个节点保存成员(member)第二个节点保存分数(score);压缩列表会根据集合元素的分数从小到大进行排序。
skiplist编码时底层数据结构会用到跳跃表和字典,为什么同时使用呢?
在理论上可以单独使用跳跃表或者字典,为什么要将两个结合起来一起使用呢;这当然是Redis为了节约时间而采用的策略。如果单独使用字典,虽然查找成员的复杂度是O(1),但是字典是无序,每次执行范围操作(ZRANK、ZRANGE)是需要对所有元素排序则需要额外的时间复杂度和空间复杂度。如果单独使用跳跃表呢,那么查找成员这一操作时间复杂度就变成了O(logN)。所以Redis同时用了这两个结构来实现有序集合。