Redis支持RDB和AOF两种持久化机制。

RDB

RDB持久化是把当前进程数据生成快照保存到硬盘的过程，可以通过手动和自动两种方式进行RDB持久化。

触发方式

手动触发

命令	执行流程	执行进程	阻塞
save	阻塞当前Redis服务器，直到RDB过程完成为止，对于内存比较大的实例会造成长时间阻塞，线上环境不建议使用 ,由于该命令会阻塞Redis服务进程，因此已被废弃，更多的还是使用`bgsave`	父进程处理	阻塞
bgsave	Redis进程执行`fork`操作创建子进程，RDB持久化过程由子进程负责，完成后自动结束。阻塞只发生在`fork`阶段，一般时间很短。`bgsave`是当前主流触发RDB持久化的方式	子进程处理	只有`fork`阶段阻塞，其余由子进程处理不会阻塞

自动触发

使用save相关配置，如save m n。表示m秒内数据集存在n次修改时，自动触发bgsave。
如果从节点执行全量复制操作，主节点自动执行bgsave生成RDB文件并发送给从节点
执行debug reload命令重新加载Redis时，也会自动触发save操作。
默认情况下执行shutdown命令时，如果没有开启AOF持久化功能则自动执行bgsave。

执行流程

在这里插入图片描述

如下是bgsave的主要方法的执行逻辑：

执行bgsave命令， Redis父进程判断当前是否存在正在执行的子进程，如RDB/AOF子进程，如果存在直接返回
父进程执行fork操作创建子进程， fork操作过程中父进程会阻塞
父进程fork完成后， bgsave命令返回“Background saving started”信息并不再阻塞父进程，可以继续响应其他命令
子进程创建RDB文件，根据父进程内存生成临时快照文件，完成后对原有文件进行原子替换
进程发送信号给父进程表示完成，父进程更新统计信息

rdb相关参数

命令	功能
`info stats`命令查看`latest_fork_usec`	获取最近一个`fork`操作的耗时，单位为微秒
`lastsave`命令查看`rdb_last_save_time`	获取最后一次生成RDB的时间
`info persistence`命令查看rdb*相关参数	-

优点

RDB是一个紧凑压缩的二进制文件，代表Redis在某个时间点上的数据快照。非常适用于备份，全量复制等场景进行有效灾备。
由于是紧凑压缩的二进制文件，因此Redis加载RDB恢复数据远远快于AOF的方式。

缺点

数据无法实时持久化/秒级持久化。因为bgsave每次运行都要执行fork操作创建子进程，属于重量级操作，频繁执行成本过高。
存在老版本无法兼容新版RDB格式。RDB文件使用特定二进制格式保存，演进过程中有多个格式的RDB版本。

AOF

AOF（append only file）与RDB保持数据库键值对对象的二进制文本不同，它采用记录Redis的文本格式命令的形式进行持久化。

执行频率

可以通过appendfsync控制

参数值	执行效果	刷盘策略	性能	数据安全
always	每次写入都要同步AOF文件，在一般的SATA硬盘上，Redis只能支持大约几百TPS写入，显然跟Redis高性能特性背道而驰，不建议配置	命令写入aof_buff缓冲区后立刻调用系统`fsync`进行刷盘进行持久化后返回	低	高
everysec	建议的同步策略，也是默认配置，做到兼顾性能和数据安全性。理论上只有在系统突然宕机的情况下丢失1秒的数据。（严格来说最多丢失1秒数据是不准确的)	命令写入`aof_buff`缓冲区后，调用系统`write`后返回，由专门线程控制调用`fsync`进行刷盘持久化	一般	较安全
no	由于操作系统每次同步AOF文件的周期不可控，而且会加大每次同步硬盘的数据量，虽然提升了性能，但数据安全性无法保证	命令写入`aof_buff`缓冲区后，调用系统`write`后返回，刷盘由操作系统控制，一般同步周期为30秒	高	低

write操作会触发延迟写（delayed write）机制。Linux在内核提供页缓冲区用来提高硬盘IO性能。write操作在写入系统缓冲区后直接返回。同步硬盘操作依赖于系统调度机制，例如：缓冲区页空间写满或达到特定时间周期。同步文件之前，如果此时系统故障宕机，缓冲区内数据将丢失。
fsync针对单个文件操作（比如AOF文件），做强制硬盘同步，fsync将阻塞直到写入硬盘完成后返回，保证了数据持久化
感兴趣的话，可以参考下mysql的刷盘机制进行对比

执行流程

AOF的执行流程主要有：命令写入（append）、文件同步（sync）、文件重写（rewrite）、重启加载（load）

在这里插入图片描述

所有的写入命令会追加到aof_buf（缓冲区）中。
AOF缓冲区根据对应的策略向硬盘做同步操作。
随着AOF文件越来越大，需要定期对AOF文件进行重写，达到压缩的目的。
当Redis服务器重启时，可以加载AOF文件进行数据恢复。

重写压缩

随着命令不断写入AOF，文件会越来越大，为了减少存储占用和更快地在重启阶段加载Redis，Redis 引入AOF重写机制压缩文件体积。

压缩文件空间的来源：

过期数据不再写入
覆盖重复执行命令后只保留最终命令。如set key aaa，set key bbb
合并命令，如lpush list a、lpush list b、lpush list c可以转化为lpush list a b c

触发机制

如下图，是重写压缩的执行流程

在这里插入图片描述

fork子进程处理aof文件重写工作
父进程接收命令后会双写aof_buff、aof_rewrite_buff这两块缓冲区，以确保重写过程也可以接收新命令，防止命令丢失
最终新重写压缩的AOF文件会覆盖旧AOF文件，达到节省空间的目的

重写机制的触发也分为手动和自动两种。

手动触发

直接调用bgrewriteaof命令。

自动触发

根据auto-aof-rewrite-min-size和auto-aof-rewrite-percentage参数确定自动触发时机。

auto-aof-rewrite-min-size 表示运行AOF重写时文件最小体积，默认为64MB。
auto-aof-rewrite-percentage 代表当前AOF文件空间（aof_current_size）和上一次重写后AOF文件空间（aof_base_size）的比值。
自动触发时机 = aof_current_size>auto-aof-rewrite-min- size &&（aof_current_size-aof_base_size）/aof_base_size>=auto-aof-rewrite- percentage

优缺点

优点
- 基于Redis命令文本格式，有较好的可读性
- 不需要像rdb那样进行序列化二次处理，实现简单
- 提供了较为灵活的appendfsync刷盘策略控制
缺点
- 直接存储，没有进行压缩，占用空间大（但是也提供了rewrite机制进行压缩控制）
- 由于是文本命令的直接操作回放，重载恢复数据比rdb时间长

重启加载

如下是重启加载持久化文件数据到内存的执行流程，会优先加载AOF文件，如果加载不成功会尝试加载RDB文件

/* Function called at startup to load RDB or AOF file in memory. */
void loadDataFromDisk(void) {
    // 记录开始时间
    long long start = ustime();
    // AOF 持久化已打开？
    if (server.aof_state == REDIS_AOF_ON) {
        // 尝试载入 AOF 文件
        if (loadAppendOnlyFile(server.aof_filename) == REDIS_OK)
            // 打印载入信息，并计算载入耗时长度
            redisLog(REDIS_NOTICE,"DB loaded from append only file: %.3f seconds",(float)(ustime()-start)/1000000);
    // AOF 持久化未打开
    } else {
        // 尝试载入 RDB 文件
        if (rdbLoad(server.rdb_filename) == REDIS_OK) {
            // 打印载入信息，并计算载入耗时长度
            redisLog(REDIS_NOTICE,"DB loaded from disk: %.3f seconds",
                (float)(ustime()-start)/1000000);
        } else if (errno != ENOENT) {
            redisLog(REDIS_WARNING,"Fatal error loading the DB: %s. Exiting.",strerror(errno));
            exit(1);
        }
    }
}

总结

基于rdb文件的bgsave和基于aof文件的bgrewriteaof会彼此阻塞，当有一方执行时另一方被禁止执行，双方都是通过fork子进程进行的并不存在冲突，这里只是性能考虑而这样进行设计的
Redis无论在哪种持久化机制下，即使在Redis中最可靠的持久化方式也无法保证100%可靠，只能是相对可靠。当appendfsync刷盘策略开启为always可以保证每次写入缓冲区后立刻调用fsync刷盘持久化，但是这并不是一个原子性操作，中间出现异常便持久化失败
我们通常会充分利用Redis的高性能，把它作为一个支持多种数据结构的纯缓存中间件来进行使用，一般情况下为了追求高性能会牺牲持久性方面的考虑