本章目录
1. 关系型数据库与非关系型数据库
1.1 关系型数据库
1.2 非关系型数据库
1.3 区别
2. Redis 数据库
2.1 特点
2.2 Memcached和Redis两款主流NoSQL数据库对比
2.3 Redis效率快的原因
3. Redis 部署及相关命令
3.1 Redis 安装部署
3.2 Redis 命令工具
3.3 redis-cli命令行工具(远程登录)
3.4 redis-benchmark 测试工具
4. Redis 数据库常用命令
5. Redis 多数据库常用命令
6. Redis 高可用
7. Redis 持久化
8. RDB 持久化
8.1 触发条件
8.2 执行流程
8.3 启动时加载
9. AOF持久化
9.1 开启AOF
9.2 执行流程
9.3 启动时加载
10. Redis 性能管理
10.1 查看Redis内存使用
10.2 内存碎片率
10.3 内存使用率
10.4 内回收 key
1. 关系型数据库与非关系型数据库
1.1 关系型数据库
关系型数据库是一个结构化的数据库,创建在关系模型(二维表格模型)基础上,一般面向于记录。
SQL语句(标准数据查询语言)就是一种基于关系型数据库的语言,用于执行对关系型数据库中数据的检索和操作。
主流的关系型数据库包括 Oracle、MySQL、SQL Server、Microsoft Access、DB2、PostqreSQL 等。
关系数据库的存储结构是二维表格,关系型数据库大部分将数据存放到硬盘中,可以将有关系的表放在一个库中。
在每个二维表格中,每一行称为一条记录,用来描述一个对象的信息;每一列称为一个字段,用来描述对象的一个属性。
1.2 非关系型数据库
NoSQL(NoSQL = Not Only SQL),意思是"不仅仅是 SQL",是非关系型数据库的总称。除了主流的关系型数据库外的数据库,都认为是非关系型。
不需要预先建库建表定义数据存储表结构,每条记录可以有不同的数据类型和字段个数 (比如微信群聊甲的文字、图片、视频、音乐等)
主流的 NoSQL数据库有 Redis、MongBD、Hbase、Memcached 等。
1.3 区别
(1)数据存储方式不同
关系型和非关系型数据库的主要差异是数据存储的方式。
天然就是表格式的,因此存储在数据表的行和列中。数据表可以彼此关联协作存储,也很容易提取数据。
与其相反,非关系型数据不适合存储在数据表的行和列中,而是大块组合在一起。非关系型数据通常存储在数据集中,就像文档、键值对或者图结构。数据及其特性是选择数据存储和提取方式的首要影响因素。
(2)扩展方式不同
SQL和NoSQL数据库最大的差别可能是在扩展方式上,要支持日益增长的需求当然要扩展赖支持更多并发量。
是纵向扩展的,扩展CPU等性能磁盘空间空间,也就是提高处理能力,使用速度更快速的计算机,这样处理相同的数据集就更快了。因为数据存储在关系表中,操作的性能瓶颈可能涉及很多个表,这都需要通过提高计算机性能来克服。虽然SOL数据库有很大扩展空间,但最终肯定会达到纵向扩展的上限。
是横向扩展的。因为非关系型数据存储天然就是分布式的,NoSQL数据库的扩展可以通过给资源池添加更多普通的数据库服务器(节点)来分担负载。
(3)对事务性的支持不同
如果数据操作需要高事务性或者复杂数据查询需要控制执行计划,那么传统的SQL数据库从性能和稳定性方面考虑是最佳选择。SQL,数据库支持对事务原子性细粒度控制,并且易于回滚事务。
虽然NoSQL数据库也可以使用事务操作, 但稳定性方面没法和关系型数据库比较,所以它们真正闪亮的价值是在操作的扩展性和大数据量处理方面。
关系型: 特别适合高事务性要求和需要控制执行计划的任务
非关系型: 此处会稍显弱势,其价值点在于高扩展性和大数据量处理方面
(4)非关系型数据库产生背景
可用于应对 Web2.0 纯动态网站类型的三高问题。
关系型数据库和非关系型数据库都有各自的特点与应用场景,两者的紧密结合将会给web2.0的数据库发展带来新的思略。让关系数据库关注在关系上,非关系型数据库关注在存储上。
例如,在读写分离的MySQL数据库环境中,可以把经常访问的数据存储在非关系型数据库中,提升访问速度。
(5)SQL和NoSQL数据的存储过程
实例-->数据库-->表(table)-->记录行(row)、数据字段(column)
实例-->数据库-->集合(collection)-->键值对(key-value)、文档、图结构
非关系型数据库不需要手动建数据库和集合 (表)。
2. Redis 数据库
Redis(远程字典服务器)是一个开源的、使用C语言编写的NoSQL数据库
Redis 基于内存运行并支持持久化,采用key-value(键值对)的存储形式,是目前分布式架构中不可或缺的一环。
Redis服务器程序是单进程模型,也就是在一台服务器上可以同时启动多个Redis进程,Redis的实际处理速度则是完全依靠于主进程的执行效率。
若在服务器上只运行一个Redis进程,当多个客户端同时访问时,服务器的处理能力是会有一定程度的下降; 若在同一台服务器上开启多个Redis进程,Redis在提高并发处理能力的同时会给服务器的CPU造成很大压力。
在实际生产环境中,需要根据实际的需求来决定开启多少个Redis进程。若对高并发要求更高一些,可能会考虑在同一台服务器上开启多个进程。若CPU资源比较紧张,采用单进程即可。
* Redis6.0之前都是单线程,6.0版本之后支持多线程,但一般只针对网络,读写方面还是使用单线程
2.1 特点
2.2 Memcached和Redis两款主流NoSQL数据库对比
类型 | Memcached | Reids |
Key-value数据库 | Key-value数据库 | |
过期策略 | 支持 | 支持 |
数据类型 | 单一数据类型(Strings) | 五大数据类型 |
持久化 | 不支持 | 支持 |
主从复制 | 不支持 | 支持 |
虚拟内存 | 不支持 | 支持 |
2.3 Redis效率快的原因
I/O多路复用程序虽然会同时监听多个 Socket 连接,但是其会将监听的 Socket 都放到一个队列里面,然后通过这个队列有序的,同步的将每个 Socket 对应的事件传送给文件事件分派器,再由文件事件分派器分派给对应的事件处理器进行处理,只有当一个 Socket 所对应的事件被处理完毕之后,I/O多路复用程序才会继续向文件事件分派器传送下一个 Socket所对应的事件,这也可以验证上面的结论,处理客户端的命令请求是单线程的方式逐个处理,但是事件处理器内并不是只有一个线程。
3. Redis 部署及相关命令
3.1 Redis 安装部署
(1)关闭防火墙和SElinux
1 systemctl stop firewalld 2 setenforce 0
(2)安装gcc gcc-c++ 编译器
1 yum install -y gcc gcc-c++ make
(3)将redis-5.0.7.tar.gz压缩包上传到/opt目录中,解压,并编译安装
1 tar zxvf redis-5.0.7.tar.gz -C /opt/ 2 3 cd /opt/redis-5.0.7/ 4 make 5 make PREFIX=/usr/local/redis install
(4)执行软件包提供的installserver.sh脚本文件设置Redis服务所需要的相关配置文件
1 cd /opt/redis-5.0.7/utils 2 ./install_server.sh 3 ...... 4 #一直回车. 5 Please select the redis executable path [/usr/local/bin/redis-server] 6 /usr/local/redis/bin/redis-server 7 #需要手动修改为/usr/local/redis/bin/redis-server 注意要一次性正确输入 8 9 Selected config: 10 Port : 6379 #默认侦听端口为6379 11 Config file : /etc/redis/6379.conf #配置文件路径 12 Log file : /var/log/redis_6379.log #日志文件路径 13 Data dir : /var/lib/redis/6379 #数据文件路径 14 Executable : /usr/local/redis/bin/redis-server #可执行文件路径 15 Cli Executable : /usr/local/bin/redis-cli #客户端命令工具
(5)把redis的可执行程序文件放入路径环境变量的目录中便于系统识别
1 ln -s /usr/local/redis/bin/* /usr/local/bin/ 2 3 #当install_server.sh 脚本运行完毕,Redis 服务就已经启动,默认侦听端口为6379 4 netstat -natp | grep redis
(6)Redis服务控制
1 /etc/init.d/redis_6379 stop 2 #停止 3 /etc/init.d/redis_6379 start 4 #启动 5 /etc/init.d/redis_6379 restart 6 #重启 7 /etc/init.d/redis_6379 status 8 #状态
1 chmod +x /etc/init.d/redis_6379 #加入全局系统环境,使用systemctl命令管理 2 3 chkconfig --add /etc/init.d/redis_6379 4 5 systemctl start redis_6379.service
(7)修改配置/etc/redis/6379.conf参数
1 vim /etc/redis/6379.conf 2 bind 127.0.0.1 192.168.226.129 3 #70行,添加监听的主机地址 4 port 6379 5 #93行,Redis默认的监听端口 6 daemonize yes 7 #137行,启用守护进程 8 pidfile /var/run/redis_6379.pid 9 #159行,指定PID文件 10 loglevel notice 11 #167行,日志级别 12 logfile /var/log/redis_6379.log 13 #172行,指定日志文件 14 15 /etc/init.d/redis_6379 restart
3.2 Redis 命令工具
3.3 redis-cli命令行工具(远程登录)
1 语法: redis-cli -h host -p port -a password 2 选项: 3 -h :指定远程主机 4 -p :指定Redis 服务的端口号 5 -a :指定密码,未设置数据库密码可以省略-a选项 6 若不添加任何选项表示,则使用127.0.0.1:6379 连接本机上的 Redis 数据库, 7 8 redis-cli -h 192.168.229.60 -p 6379
3.4 redis-benchmark 测试工具
redis-benchmark 是官方自带的 Redis 性能测试工具,可以有效的测试 Redis 服务的性能。
1 -h:指定服务器主机名 2 -p:指定服务器端口 3 -s:指定服务器 socket 4 -c:指定并发连接数 5 -n:指定请求数 6 -d:以字节的形式指定 SET/GET 值的数据大小 7 -k:1=keep alive 0=reconnect 8 -r: SET/GET/INCR 使用随机 key, SADD 使用随机值 9 -P:通过管道传输<numred>请求 10 -q:强制退出 redis。仅显示 query/sec 值 11 –csv:以 CSV 格式输出 12 -l:生成循环,永久执行测试 13 -t:仅运行以逗号分隔的测试命令列表 14 -I:Idle 模式。仅打开 N 个 idle 连接并等待 15 16 17 #向 IP 地址为 192.168.229.60、端口为 6379 的 Redis 服务器发送 100 个并发连接与 100000 个请求测试性能 18 redis-benchmark -h 192.168.229.60 -p 6379 -c 100 -n 100000 19 20 #测试存取大小为 100 字节的数据包的性能 21 redis-benchmark -h 192.168.229.60 -p 6379 -q -d 100 22 23 #测试本机上 Redis 服务在进行 set 与 lpush 操作时的性能 24 redis-benchmark -t set,lpush -n 100000 -q
4. Redis 数据库常用命令
命令 | 解释 |
set [key] [value] | 存放数据 |
get [key] | 获取某个key的数据 |
keys [*/?] | 查找符合的键值列表,可搭配(*)、(?)使用 |
exists key [key...] | 判断键值是否存在,返回0为不存在,1为存在 |
del key [key ...] |
删除指定的key |
type [key] | 查看key对应的value值类型 |
rename 源key 目标key | 对已有的key进行重命名,改名后会覆盖同名的key的值 |
renamenx源key目标key |
对已有的key进行重命名,但会判断新名字是否存在,存在则不执行 |
dbszie | 查看当前数据库key的数目 |
config set requirepass [密码] | 设置密码 |
auth [密码] |
设置密码后需要验证否则无法进行任何操作 |
config get requirepass |
查看密码 |
config set requirepass ' ' |
删除密码(即设置空密码) |
(1)set与get用法
(2)keys 命令
(3)exists 命令
(4)del 命令
(5)type 命令
(6)rename 命令
(7)renamenx 命令
(8)dbsize命令
(9)使用config set requirepass 命令设置密码
(10)使用config get requirepass 命令查看密码
(11)使用config set requirepass ''删除密码
5. Redis 多数据库常用命令
Redis支持多数据库,Redis 默认情况下包含16个数据库,数据库名称是用数字0-15 来依次命名的
多数据库相互独立,互不干扰
(1)多数据库间切换
1 192.168.229.60:6379> select 0 2 OK 3 192.168.229.60:6379> keys * 4 1) "a3" 5 2) "key:__rand_int__" 6 3) "myset:__rand_int__" 7 4) "mylist" 8 5) "name" 9 6) "b2" 10 7) "counter:__rand_int__" 11 192.168.229.60:6379> select 6 12 OK 13 192.168.229.60:6379[6]> keys * 14 (empty list or set)
(2)多数据库间移动数据
1 192.168.229.60:6379> keys * 2 1) "a3" 3 2) "key:__rand_int__" 4 3) "myset:__rand_int__" 5 4) "mylist" 6 5) "name" 7 6) "b2" 8 7) "counter:__rand_int__" 9 192.168.229.60:6379> get a3 10 "1" 11 192.168.229.60:6379> move a3 6 12 (integer) 1 13 192.168.229.60:6379> select 6 14 OK 15 192.168.229.60:6379[6]> keys * 16 1) "a3" 17 192.168.229.60:6379[6]> get a3 18 "1" 19 192.168.229.60:6379[6]> select 0 20 OK 21 192.168.229.60:6379> keys * 22 1) "key:__rand_int__" 23 2) "myset:__rand_int__" 24 3) "mylist" 25 4) "name" 26 5) "b2" 27 6) "counter:__rand_int__"
(3)清除数据库内数据
1 192.168.229.60:6379[6]> keys * 2 1) "a3" 3 2) "aa2" 4 3) "aa1" 5 192.168.229.60:6379[6]> flushdb 6 OK 7 192.168.229.60:6379[6]> keys * 8 (empty list or set) 9 192.168.229.60:6379[6]> flushall 10 OK 11 192.168.229.60:6379[6]> select 0 12 OK 13 192.168.229.60:6379> keys * 14 (empty list or set)
6. Redis 高可用
在web服务器中,高可用是指服务器可以正常访问的时间,衡量的标准是在多长时间内可以提供正常服务(99.9%、99.99%、99.999%等等)。
但是在Redis语境中,高可用的含义似乎要宽泛一些,除了保证提供正常服务(如主从分离、快速容灾技术),还需要考虑数据容量的扩展,数据安全不会丢失等。
在Redis中,实现高可用的技术主要包括持久化、主从复制、哨兵和集群,作用如下:
7. Redis 持久化
Redis是内存数据库,数据都是存储在内存中,为了避免服务器断电等原因导致Redis进程异常退出后数据的永久丢失,需要定期将Redis中的数据以某种形式( 数据或命令)从内存保存到硬盘;当下次Redis重启时,利用持久化文件实现数据恢复。
除此之外,为了进行灾难备份,可以将持久化文件拷贝到一个远程位置(NFS)
由于AOF持久化的实时性更好,即当进程意外退出时丢失的数据更少,因此AOF是目前主流的持久化方式,不过RDB持久化仍然有其用武之地。
8. RDB 持久化
RDB持久化是指在指定的时间间隔内将内存中当前进程中的数据生成快照保存到硬盘(因此也称作快照持久化),用二进制压缩存储,保存的文件后缀是rdb;当Redis重新启动时,可以读取快照文件恢复数据。
8.1 触发条件
RDB持久化的触发分为手动触发和自动触发两种。
save命令和bgsave命令都可以生成RDB文件
save命令会阻塞Redis服务器进程,直到RDB文件创建完毕为止,在Redis服务器阻塞期间,服务器不能处理任何命令请求
而bgsave命令会创建一个子进程,由子进程来负责创建RDB文件,父进程 (即Redis主进程) 则继续处理请求
bgsave命令执行过程中,只有fork 子进程时会阻塞服务器,而对于save命令,整个过程都会阻塞服务器,因此save已基本被废弃,线上环境要杜绝save的使用;
往往生产环境 bgsave 依然不允许轻易使用。
在自动触发RDB持久化时,Redis也 会选择bgsave而不是save来进行持久化
自动触发最常见的情况是在配置文件中通过save m n,指定当m秒内发生n次变化时,会触发bgsave
除了 save m n 以外,还有一些其他情况会触发bgsave:
在主从复制场景下,如果从节点执行全量复制操作,则主节点会执行bgsave命令,并将rdb文件发送给从节点
执行shutdown命令时,自动执行rdb持久化
8.2 执行流程
8.3 启动时加载
9. AOF持久化
RDB持久化是将进程数据写入文件,而AOF持久化,则是将Redis执行的每次写、删除命令记录到单独的日志文件中,查询操作不会记录; 当Redis重启时再次执行AOF文件中的命令来恢复数据。
与RDB相比,AOF的实时性更好,因此已成为主流的持久化方案
9.1 开启AOF
1 Redis服务器默认开启RDB,关闭AOF: 要开启AOF,需要在配置文件中配置 2 3 vim /etc/redis/6379.conf 4 - 700行--修改, 开启AOF 5 appendonly yes 6 --704行--指定A0F文件名称 7 appendfilename "appendonly.aof" 8 --796行--是否忽略最后一条可能存在问题的指令 9 aof-load-truncated yes 10 11 /etc/init.d/redis_6379 restart
9.2 执行流程
由于需要记录Redis的每条写命令,因此A0F不需要触发,AOF的执行流程如下:
AOF缓存区的同步文件策略存在三种同步方式,它们分别是:
1 vim /etc/redis/6379.conf 2 ---729--- 3 ● appendfsync always: 4 命令写入aof_buf后立即调用系统fsync操作同步到AOF文件,fsync完成后线程返回。这种情况下,每次有写命令都要同步到AOF文件,硬盘IO成为性能瓶颈,Redis只能支持大约几百TPS写入,严重降低了Redis的性能;即便是使用固态硬盘(SSD),每秒大约也只能处理几万个命令,而且会大大降低SSD的寿命。 5 6 ● appendfsync no: 7 命令写入aof_buf后调用系统write操作,不对AOF文件做fsync同步;同步由操作系统负责,通常同步周期为30秒。这种情况下,文件同步的时间不可控,且缓冲区中堆积的数据会很多,数据安全性无法保证。 8 9 ● appendfsynceverysec: 10 命令写入aof_buf后调用系统write操作,write完成后线程返回; fsync同步文件操作由专门的线程每秒调用一次。everysec是前述两种策略的折中,是性能和数据安全性的平衡,因此是Redis的默认配置,也是我们推荐的配置。
9.3 启动时加载
10. Redis 性能管理
10.1 查看Redis内存使用
1 192.168.229.60: 7001> info memory
10.2 内存碎片率
操作系统分配的内存值used_ memory_ rss除以Redis使用的内存值used_ memory计算得出内存碎片是由操作系统低效的分配/回收物理内存导致的 (不连续的物理内存分配)
跟踪内存碎片率对理解Redis实例的资源性能是非常重要的:
10.3 内存使用率
redis实例的内存使用率超过可用最大内存,操作系统将开始进行内存与swap空间交换
避免内存交换发生的方法:
10.4 内回收 key
配置文件中修改maxmemory- policy属性值:
1 vim /etc/redis/6379.conf 2 --598-- 3 maxmemory-policy noenviction 4 ●volatile-lru :使用LRU算法从已设置过期时间的数据集合中淘汰数据 5 ●volatile-ttl :从已设置过期时间的数据集合中挑选即将过期的数据淘汰 6 ●volatile-random :从已设置过期时间的数据集合中随机挑选数据淘汰 7 ●allkeys-lru :使用LRU算法从所有数据集合中淘汰数据 8 ●allkeys-random :从数据集合中任意选择数据淘汰 9 ●noenviction :禁止淘汰数据
-