主机数据更新后根据配置和策略,自动同步到备机的master/slaver 机制
,Master 以写为主,Slave以读为主。
注意: 只有一对一或一对多。
作用:
主从服务器之间的第一次同步过程可分为三个阶段:
注: 由于博主画的图不堪入目,所以此处借鉴 小林 大神的图。非常感谢!
我们来逐一分析每一个步骤:
第一阶段:
执行了 replicaof 命令后,从服务器就会给主服务器发送 psync
命令,表示要进行数据同步。
psync 命令包含两个参数,分别是主服务器的 runID 和复制进度 offset。
主服务器收到 psync 命令后,会用 FULLRESYNC
作为响应命令返回给对方。
并且这个响应命令会带上两个参数:主服务器的 runID 和主服务器目前的复制进度 offset。从服务器收到响应后,会记录这两个值。
FULLRESYNC
响应命令的意图是采用全量复制的方式,也就是主服务器会把所有的数据都同步给从服务器。
也就是说第一阶段是为 全量复制 做准备的。
第二阶段:
主服务器使用 bgsave
命令来生成RDB
文件,然后发送给从服务器。此时从服务器清空当前数据并载入RDB
。
注意: 如果在这期间,主服务器收到 写操作 命令时是不会记录到RDB
中的,那么此时就会导致 主从不一致 的问题。那么为了保证 主从数据一致 ,主服务器在下面这三个时间间隙中将收到的写操作命令,写入到 replication buffer 缓冲区里。
第三阶段:
在主服务器生成的 RDB
文件发送完,从服务器加载完 RDB
文件后,然后将 replication buffer
缓冲区里所记录的写操作命令发送给从服务器,然后「从服务器」重新执行这些操作,至此主从服务器的数据就一致了。
至此,主从服务器的第一次同步的工作就完成了。
当第一次同步完后,主从服务器之间就会建立起来一个 TCP长链接
。
那为什么是 长连接 呢?
答: 目的是避免频繁的 TCP 连接和断开带来的性能开销。(如果不明白这块知识,小伙伴可以去补一下http的长连接那块知识点!)
上述中我们直到在创建RDB
和发送RDB
文件时会十分消耗时间。
当从服务器过多而且都与主服务器进行全量同步的话,则就会出现下列问题:
bgsave
命令来生成 RDB
文件的,那么主服务器就会忙于使用 fork()
创建子进程,如果主服务器的内存数据非大,在执行 fork()
函数时是会阻塞主线程的,从而使得 Redis
无法正常处理请求;RDB
文件会占用主服务器的网络带宽,会对主服务器响应命令请求产生影响。级联结构图:
这就就能为主服务器分担RDB
编写和传输的压力了。
我们知道服务器有时候说延时就延时,说断开就断开。
如果主从服务器间的网络连接断开了,那么就无法进行命令传播了,这时从服务器的数据就没办法和主服务器保持一致了,客户端就可能从「从服务器」读到旧的数据。
一般的解决办法有:
当然如果在进行一次 全量复制 会消耗很大的资源,这显然不是我们想要的结果。所以也就有了 增量复制 。
也就是只会把网络断开期间主服务器接收到的写操作命令,同步给从服务器。
网络恢复后的 增量复制 过程图如下:
上图中的三个主要步骤:
psync
命令给主服务器,此时的psync
命令里的 offset
参数不是 -1
;CONTINUE
响应命令告诉从服务器接下来采用增量复制的方式同步数据;那么主服务器怎么知道将哪些增量数据发送给从服务器呢?
slave_repl_offset
来记录自己「读」到的位置。那repl_backlog_buffer
缓冲区是什么时候写入的呢?
在主服务器进行命令传播时,不仅会将写命令发送给从服务器,还会将写命令写入到 repl_backlog_buffer
缓冲区里,因此 这个缓冲区里会保存着最近传播的写命令。
网络断开后,当从服务器重新连上主服务器时,从服务器会通过 psync 命令将自己的复制偏移量 slave_repl_offset 发送给主服务器,主服务器根据自己的 master_repl_offset 和 slave_repl_offset 之间的差距,然后来决定对从服务器执行哪种同步操作:
1、Redis主从链接是什么链接?
采用HTTP之间的长连接。
2、Redis是同步复制还是异步复制?
首先主服务器收到写命令后,会先写入到 缓存区 ,然后在 异步 发送给从服务器。
3、replication buffer 、repl backlog buffer 两者之间的区别
- replication buffer 是在全量复制阶段会出现,主库会给每个新连接的从库,分配一个 replication buffer;repl backlog buffer 是在增量复制阶段出现,一个主库只分配一个repl backlog buffer;
- 这两个 Buffer 都有大小限制的,当缓冲区满了之后。repl backlog buffer,因为是环形结构,会直接覆盖起始位置数据,replication buffer则会导致连接断开,删除缓存,从库重新连接,重新开始全量复制。
非常感谢 小林 大佬提供的免费文章!!!
在这里非常的感谢啦!!!
本篇文章也是在小林大佬的文章基础上面按照自己的理解写了一些,其中还有一些是小林大佬文章中的原话(因为感觉自己写不出来那么好的哈哈哈)。
也希望本篇文章能够帮助到屏幕前的你,当然来个三联最棒嘿嘿嘿!!!
OK那今天的分享就到这里了,我们下期见!!!