数据无价,MySQL作为一个数据库系统,其备份自然也是非常重要且有必要去做。备份的理由千千万,预防故障,安全需求,回滚,审计,删了又改的需求等等,备份的重要性不言而喻。除了备份本身,如何使用备份来恢复服务也是一项重点内容,不能用来恢复的备份没有意义。本文主要会针对备份和恢复这两方面做一些简单的介绍。
本文为《高性能MySQL》备份相关章节的读书笔记。
正如简介所说,备份人尽皆知,也很容易引起人的重视。根据需求写定期脚本,或者使用其他方式都是比较常见的。但是恢复就没有那么引人注目了。比如说,也许会每周/每天定期进行自动备份。但是多久会进行一次备份的恢复测试?备份的内容是否完成?是否可用于恢复?如果出现故障,恢复的流程是否易操作?
备份只是数据源,如何使用数据源,彻底恢复系统这个过程。也非常重要。备份与恢复,都是MySQL运维中需要掌握的内容。
备份的意义在于恢复。如果不能恢复,那就不叫备份(比如RAID阵列不是备份,如果DROP DATABASE,RAID阵列不能恢复)
[还原] 和 [恢复] 的区别:
也就是说,恢复是要恢复到异常出前,采取的所有操作(比如修改参数,重启服务等)。不仅仅只是还原备份。
恢复计划在设计的时候,需要考虑一些因素,从而根据不同的需求进行更好的规划。可以根据RPO(恢复点目标)和RTO(恢复时间目标)这两个需求来协助制定合适的恢复策略。
也许还需考虑:需要恢复什么?(整个服务器,单个库,单个表,还是事务)
其次,恢复计划需要定期进行测试,抽出数据测试备份确实有效、实际进行一次完整的备份恢复,熟悉整个恢复流程,确保真正发生问题时,可以有条不紊的完成恢复。
最简单的策略就是只备份数据和表定义。但是恢复数据库需要更多内容,如果能备份的越充足,那么恢复起来也就更容易。(主要还是根据需求)
比如可以根据实际情况,考虑备份如下内容:
1、Binlog和InnoDB事务日志。
2、主/从库配置文件。
3、数据库操作系统配置(cron、脚本、内核参数)
或者说,根据需要进行备份内容的扩展。如果对于数据库恢复、甚至重建有很高需求(比如要求更快恢复),那么备份更多的内容也必不可少。如果需要有从0恢复数据库的能力,那需要做更多工作。
备份种类 | 逻辑备份 | 物理备份 |
---|---|---|
简介 | 利用mysqldump等命令实现备份 | 直接复制数据库文件 |
优点 | 可以文本编辑,恢复简单,使用mysqldump备份灵活。 | 足够直观,备份和恢复过程,本质上就是文件的移动。恢复速度更快。MySQL服务器几乎不需要执行操作。 |
缺点 | 备份和恢复都需要MySQL服务参与、且占用CPU资源。有可能很慢 | InnoDB的原始文件通常比逻辑备份大得多。 |
物理备份和逻辑备份的一点抉择:
物理备份简单高效,逻辑备份尽量也要做。【两者都要有,看具体需求和资源分配】
其次:除非经过测试,否则不能假设备份可用。比如使用mysqlcheck -A
测试数据库。
Binlog也是备份中的重要一环,因为基于时间点的恢复需要用到它。而且Binlog一般很小,频繁的备份也较容易实现。如果有某个时间点的数据备份,加上自那以后的所有Binlog,就可以回滚所有变动。
4.3.1、备份Binlog的一些策略
FLUSH LOGS
创建新的Binlog(这样就只需要备份最新的Binlog了) --log_slave_updata
的只读备库。需要注意的是,expire_log_days是通过日志文件的修改时间来判断的,而不是内容。(如果一直只有一个Binlog文件,可能就不会清理)。所以一定要使用FLUSH LOGS
定期刷新Binlog。
4.3.2、老Binlog的清理
最好使用expire_log_days来进行自动的清理,保留一定天数。如果需要用cron清理。那么不要使用 find+rm配置的cron清理日志。0 3 * * * /usr/bin/mysql /var/log/mysql -mtime +N -name "mysql-bin.[0-9]"* | xargs rm
使用如下cron代替:0 3 * * * /usr/bin/mysql -e "PURGE MASTER LOGS BEFORE CURRENT_DATE - INTERVAL N DAY"
4.3.3、Binlog备份的几点注意事项
增量备份:自任意类型备份后,改动的所有内容的备份。
差异备份:特指自上次全备份之后,改动的所有内容的备份。
也就是说,差异备份基于全备份。而增量备份基于任意备份(比如某一个指定的差异备份。
下面举一个例子:周日进行一次全备份,周一针对周日的全备份做一次差异备份。周二开始就可以有两种选择:1、基于周日的全备份做备份(差异)。2、基于周一的差异备份做备份(增量)
差异备份可选项:
虽然这样做差异备份可以提高恢复速度。但是全备份还是很有必要的。(全备份可以频率低,但是必须有)。
在从库中备份,有时候是一个可选项,不会干扰到主库,避免给主库增加更多的负载。其次,当计划从从库备份的时候,要保存更多信息,比如从库相对于主库的位置(偏移)等。
首先从库不等于备份,从库和主库数据不匹配是很常见的。其次、从从库备份确实可以减轻主库备份时的负载,但是不够好。稳定起见,还是建议进行主库备份、全备份。
4.6.1、在线备份与离线备份
离线备份是最简单最安全的。也是一致性最好的。问题就是,大部分数据库不能接受停机备份。所以基本还是用在线备份,或者说不停机备份
可以考虑在业务低峰期进行在线备份,即使负载增大也不会有太大影响。
4.6.2、数据一致性
数据一致性:对于多个表之间数据的一致性要求。(比如两个逻辑相关的操作分在了两个事务内,而备份在两个事务之间执行,就会导致数据不一致)
InnoDB可以在转储一组相关表的时候,开始一个事务,这样可以很大程度上保证数据的一致性。
但是也要注意,如果事务设置的不合理,比如一组相关表的修改分在了两个事务内,这仍然会导致数据不一致。(一组表的相关操作需要确保在一个事务内)
4.6.3、定期进行备份恢复测试,确认整个恢复过程需要的资源
能恢复的备份才有价值,不是有备份就可以
本文讲解了一些备份的基本知识和概念,包括一些基本概念、恢复的重要性、备份和恢复的简单策略。还提及到了备份内容的选择、差异/增量备份、Binlog备份等。后续还需要继续学习,了解备份和恢复的具体操作方法和实践。