Redis源码剖析之AOF

书接上回，上回我们详细讲解了Redis的RDB机制，RDB解决了redis数据持久化一部分的问题，为什么说一部分？因为rdb是redis中某一时刻的快照，那么在这次快照后如果数据有新的变更，它是不会被持久化下来的，必须得等到下次rdb备份。然而，生成rdb是和消耗性能的，所以它就不适合很频繁生成。Redis为了弥补这一不足提供了AOF。

AOF的全称是AppendOnlyFile，源码在aof.c。其实关键就是Append(追加)，核心原理很简单，就是如果执行完命令(set,del,expire……)后，发现有数据变动，就将这次操作作为一条日志记录到aof文件里，如果有宕机就重新加载aof文件，重放所有的改动命令就可以恢复数据了。只要日志被完整刷到了磁盘上，数据就不会丢失。

配置

AOF的配置比较简单，只有如下几项。

appendonly no  # aof开关，默认关闭
appendfilename &quot;appendonly.aof&quot;  # 保存的文件名，默认appendonly.aof
# 有三种刷数据的策略
appendfsync always  # always是只要有数据改动，就把数据刷到磁盘里，最安全但性能也最差
appendfsync everysec  # 每隔一秒钟刷一次数据，数据安全性和性能折中，这也是redis默认和推荐的配置。 
appendfsync no # 不主动刷，什么时候数据刷到磁盘里取决于操作系统，在大多数Linux系统中每30秒提交一次，性能最好，但数据安全性最差。

源码

AOF的触发

aof如何实现，又是怎么被触发的，让我们详细看下源码。
server.c中的void call(client *c, int flags) 是redis接受到client请求后处理请求的入口，其中会检测Redis中的数据有没有发生变化。如果有变化就会执行propagate()函数。

    dirty = server.dirty;
    prev_err_count = server.stat_total_error_replies;
    updateCachedTime(0);
    elapsedStart(&amp;call_timer);
    c-&gt;cmd-&gt;proc(c); // 执行命令
    const long duration = elapsedUs(call_timer);
    c-&gt;duration = duration;
    dirty = server.dirty-dirty;
    if (dirty &lt; 0) dirty = 0;

void propagate(struct redisCommand *cmd, int dbid, robj **argv, int argc,
               int flags)
{
    if (server.in_exec &amp;&amp; !server.propagate_in_transaction)
        execCommandPropagateMulti(dbid);

    /* This needs to be unreachable since the dataset should be fixed during 
     * client pause, otherwise data may be lossed during a failover. */
    serverAssert(!(areClientsPaused() &amp;&amp; !server.client_pause_in_transaction));

    if (server.aof_state != AOF_OFF &amp;&amp; flags &amp; PROPAGATE_AOF)
        feedAppendOnlyFile(cmd,dbid,argv,argc); // 如果aof开启了，就会向aof传播该命令。
    if (flags &amp; PROPAGATE_REPL)
        replicationFeedSlaves(server.slaves,dbid,argv,argc);
}

propagate函数的作用就是将带来数据改动的命令传播给slave和AOF，这里我们只关注AOF，我们来详细看下feedAppendOnlyFile()函数。

AOF数据生成

void feedAppendOnlyFile(struct redisCommand *cmd, int dictid, robj **argv, int argc) {
    sds buf = sdsempty();
    /* The DB this command was targeting is not the same as the last command
     * we appended. To issue a SELECT command is needed. */
    if (dictid != server.aof_selected_db) {
        char seldb[64];

        snprintf(seldb,sizeof(seldb),&quot;%d&quot;,dictid);
        buf = sdscatprintf(buf,&quot;*2\r\n$6\r\nSELECT\r\n$%lu\r\n%s\r\n&quot;,
            (unsigned long)strlen(seldb),seldb);
        server.aof_selected_db = dictid;
    }

    if (cmd-&gt;proc == expireCommand || cmd-&gt;proc == pexpireCommand ||
        cmd-&gt;proc == expireatCommand) {
        /* 把 EXPIRE/PEXPIRE/EXPIREAT 命令转化为 PEXPIREAT 命令*/
        buf = catAppendOnlyExpireAtCommand(buf,cmd,argv[1],argv[2]);
    } else if (cmd-&gt;proc == setCommand &amp;&amp; argc &gt; 3) {
        robj *pxarg = NULL;
        /* When SET is used with EX/PX argument setGenericCommand propagates them with PX millisecond argument.
         * So since the command arguments are re-written there, we can rely here on the index of PX being 3. */
        if (!strcasecmp(argv[3]-&gt;ptr, &quot;px&quot;)) {
            pxarg = argv[4];
        }
        /* 把set命令的expired所带的相对时间转化为绝对时间(ms). */
        if (pxarg) {
            robj *millisecond = getDecodedObject(pxarg);
            long long when = strtoll(millisecond-&gt;ptr,NULL,10);
            when += mstime();

            decrRefCount(millisecond);

            robj *newargs[5];
            newargs[0] = argv[0];
            newargs[1] = argv[1];
            newargs[2] = argv[2];
            newargs[3] = shared.pxat;
            newargs[4] = createStringObjectFromLongLong(when);
            buf = catAppendOnlyGenericCommand(buf,5,newargs);
            decrRefCount(newargs[4]);
        } else {
            buf = catAppendOnlyGenericCommand(buf,argc,argv);
        }
    } else {
        /* 其他的命令都不需要转化 */
        buf = catAppendOnlyGenericCommand(buf,argc,argv);
    }

    /* 追加到AOF缓冲区。在重新进入事件循环之前，数据将被刷新到磁盘上，因此在客户端在执行前就会得到回复。*/
    if (server.aof_state == AOF_ON)
        server.aof_buf = sdscatlen(server.aof_buf,buf,sdslen(buf));

    /* 如果后台正在进行AOF重写，我们希望将子数据库和当前数据库之间的差异累积到缓冲区中，
     * 以便在子进程执行其工作时，我们可以将这些差异追加到新的只追加文件中。 */
    if (server.child_type == CHILD_TYPE_AOF)
        aofRewriteBufferAppend((unsigned char*)buf,sdslen(buf));

    sdsfree(buf);
}

这里没有啥太复杂的逻辑，就是将命令转化为RESP协议格式的字符串(RESP协议后续会详解)，然后追加到server.aof_buf中，这时候AOF数据还都在缓冲区中，并没有写入到磁盘中，那buf中的数据何时写入磁盘呢？

刷数据

刷数据的核心代码在flushAppendOnlyFile()中，flushAppendOnlyFile在serverCron、beforeSleep和prepareForShutdown中都有被调用，它的作用就是将缓冲区的数据写到磁盘中，代码比较长且复杂，但大部分都是异常处理和性能监控，忽略掉这部分后代码也比较容易理解，这里就不再罗列了，详见aof.c。

RDB vs AOF

最后，我们来对比下RDB和AOF，他们各自都有啥优缺点，该如何选用。

RDB的优势

RDB是压缩的后紧凑数据格式，比较很适合备份，
同样的数据量下，rdb的文件大小会很小，比较适合传输和数据恢复。
RDB对Redis的读写性能影响小，生成RDB的时redis主进程会fork出一个子进程，不会影响到主进程的读写。
RDB数据加载更快，恢复起来更快。

RDB的缺点

RDB是定期备份，如果备份前发生宕机，数据可能会丢失。
RDB的生成依赖于linux的fork，如果数据量比较大的话，很影响服务器性能。

AOF的优势

AOF是持续性备份，可以尽可能保证数据不丢失。
Redis太大时，Redis可以在后台自动重写AOF。重写是完全安全的，因为Redis继续追加到旧文件时，会生成一个全新的文件，其中包含创建当前数据集所需的最少操作集，一旦准备好第二个文件，Redis会切换这两个文件并开始追加到新的那一个。
AOF文件格式简单，易于解析。

AOF的缺点

对于同一数据集，AOF文件大小通常大于等效的RDB文件。
如果使用fsync策略，AOF可能比RDB慢。

RDB和AOF该如何选

如果是要求极致的性能，但对数据恢复不敏感，二者可以都不要，如果是关注性能且关注数据可用性，但不要求数据完整性，可以选用RDB。如果说非常关注数据完整性和宕机恢复的能力，可以RDB+AOF同时开启。

参考资料

本文是Redis源码剖析系列博文，同时也有与之对应的Redis中文注释版，有想深入学习Redis的同学，欢迎star和关注。
Redis中文注解版仓库：https://github.com/xindoo/Redis
Redis源码剖析专栏：https://zxs.io/s/1h
如果觉得本文对你有用，欢迎一键三连。

Redis源码剖析之AOF

配置

源码

AOF的触发

AOF数据生成

刷数据

RDB vs AOF

RDB的优势

RDB的缺点

AOF的优势

AOF的缺点

RDB和AOF该如何选

参考资料

xindoo

相关推荐

评论抢沙发

热门文章

热门标签

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续给力更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫

配置

源码

AOF的触发

AOF数据生成

刷数据

RDB vs AOF

RDB的优势

RDB的缺点

AOF的优势

AOF的缺点

RDB和AOF该如何选

参考资料

xindoo

相关推荐

评论 抢沙发

热门文章

热门标签

觉得文章有用就打赏一下文章作者

非常感谢你的打赏，我们将继续给力更多优质内容，让我们一起创建更加美好的网络世界！

支付宝扫一扫

微信扫一扫

评论抢沙发