• linux环境下使用rsync命令完成数据同步


    前言

    linux 环境下说到数据复制第一个映入脑海的命令还是 cp,毕竟它用起来很方便,但是只能完成本地数据的拷贝,如果想实现本地和远程主机之间的数据拷贝可以使用 scp,有些文章会把它翻译成 “ssh copy”,但实际上它的全称是 “secure copy”,不过它确实利用了ssh协议,缺点就是只能全量拷贝,如果想完成增量拷贝可以选择 rsync命令,官网 rsync.samba.org 比较简陋,但很符合GNU的风格。

    rsync的特点

    • 可实现增量同步,即只同步发生变化的数据
    • 可保持原文件或目录的权限、时间、软硬连接、属主、组等所有属性均保持不变
    • 支持拷贝特殊文件,如连接文件、设备等
    • 排除指定文件或目录同步的功能,相当于打包命令tar的排除功能
    • rsync本身不对数据加密,可使用rcp/rsh/ssh等方式来配合传输文件
    • 支持匿名的活认证的进程模式传输,可实现方便安全的数据备份和镜像

    rsync 传输模式

    • 本地方式,类似cp,可完成本机数据的拷贝复制
    • 远程方式,类似scp,但可实现增量复制,可以将数据从本地推送至服务端,也可以将数据从服务端拉取到本地
    • 守护进程方式,区分客户端和服务端,可以启动 rsyncd 服务(未使用过需研究)

    rynsc 命令格式

    Local:  rsync [OPTION...] SRC... [DEST]
    
    Access via remote shell:
      Pull: rsync [OPTION...] [USER@]HOST:SRC... [DEST]
      Push: rsync [OPTION...] SRC... [USER@]HOST:DEST
    
    Access via rsync daemon:
      Pull: rsync [OPTION...] [USER@]HOST::SRC... [DEST]
            rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]
      Push: rsync [OPTION...] SRC... [USER@]HOST::DEST
            rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11

    常用的还是第2种和第3种,第一种是本地复制,一般用cp代替就够了,4~7用于守护进程模式,至今我还没用过

    rsync 命令选项

    -v, --verbose 详细模式输出。
    -q, --quiet 精简输出模式。
    -c, --checksum 打开校验开关,强制对文件传输进行校验。
    -a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD。
    -r, --recursive 对子目录以递归模式处理。
    -R, --relative 使用相对路径信息。
    -b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
    --backup-dir 将备份文件(如~filename)存放在在目录下。
    -suffix=SUFFIX 定义备份文件前缀。
    -u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件,不覆盖更新的文件。
    -l, --links 保留软链结。
    -L, --copy-links 想对待常规文件一样处理软链结。
    --copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结。
    --safe-links 忽略指向SRC路径目录树以外的链结。
    -H, --hard-links 保留硬链结。
    -p, --perms 保持文件权限。
    -o, --owner 保持文件属主信息。
    -g, --group 保持文件属组信息。
    -D, --devices 保持设备文件信息。
    -t, --times 保持文件时间信息。
    -S, --sparse 对稀疏文件进行特殊处理以节省DST的空间。
    -n, --dry-run现实哪些文件将被传输。
    -w, --whole-file 拷贝文件,不进行增量检测。
    -x, --one-file-system 不要跨越文件系统边界。
    -B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节。
    -e, --rsh=command 指定使用rsh、ssh方式进行数据同步。
    --rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息。
    -C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件。
    --existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件。
    --delete 删除那些DST中SRC没有的文件。
    --delete-excluded 同样删除接收端那些被该选项指定排除的文件。
    --delete-after 传输结束以后再删除。
    --ignore-errors 及时出现IO错误也进行删除。
    --max-delete=NUM 最多删除NUM个文件。
    --partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输。
    --force 强制删除目录,即使不为空。
    --numeric-ids 不将数字的用户和组id匹配为用户名和组名。
    --timeout=time ip超时时间,单位为秒。
    -I, --ignore-times 不跳过那些有同样的时间和长度的文件。
    --size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间。
    --modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0。
    -T --temp-dir=DIR 在DIR中创建临时文件。
    --compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份。
    -P 等同于 --partial。
    --progress 显示备份过程。
    -z, --compress 对备份的文件在传输时进行压缩处理。
    --exclude=PATTERN 指定排除不需要传输的文件模式。
    --include=PATTERN 指定不排除而需要传输的文件模式。
    --exclude-from=FILE 排除FILE中指定模式的文件。
    --include-from=FILE 不排除FILE指定模式匹配的文件。
    --version 打印版本信息。
    --address 绑定到特定的地址。
    --config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件。
    --port=PORT 指定其他的rsync服务端口。
    --blocking-io 对远程shell使用阻塞IO。
    -stats 给出某些文件的传输状态。
    --progress 在传输时显示传输过程。
    --log-format=formAT 指定日志文件格式。
    --password-file=FILE 从FILE中得到密码。
    --bwlimit=KBPS 限制I/O带宽,KBytes per second。
    -h, --help 显示帮助信息。
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12
    • 13
    • 14
    • 15
    • 16
    • 17
    • 18
    • 19
    • 20
    • 21
    • 22
    • 23
    • 24
    • 25
    • 26
    • 27
    • 28
    • 29
    • 30
    • 31
    • 32
    • 33
    • 34
    • 35
    • 36
    • 37
    • 38
    • 39
    • 40
    • 41
    • 42
    • 43
    • 44
    • 45
    • 46
    • 47
    • 48
    • 49
    • 50
    • 51
    • 52
    • 53
    • 54
    • 55
    • 56
    • 57
    • 58
    • 59
    • 60
    • 61

    常用组合

    从上面描述的选项可以看到,这个命令的参数特别多,但实际使用时只需要掌握一些常用组合即可:

    保留文件原属性拷贝

    rsync -avz jerry@82.156.125.169:/data/logs /data/backuplogs
    
    • 1

    从远程主机将目录 /data/logs 拷贝到本地,对应目录为 /data/backuplogs,保留文件原有属性,包括权限、时间、软硬连接、属主、组等

    删除目标目录中S再原目录不存在的文件

    rsync -avz --delete --progress /data/logs 82.156.125.169:/data/backuplogs
    
    • 1

    将本地 /data/logs 目录推送到远程目录 82.156.125.169:/data/backuplogs 下,同时删除在原目录下不存在的文件,这个参数组合特别适合用来完全同步两个目录的内容

    限制网速传输

    rsync -avz --bwlimit=1024 /data/logs 82.156.125.169:/data/backuplogs/
    
    • 1

    同步数据时限制传输速度为1024kBytes/s(就是1MB/s),防止占用过多带宽,可以根据需要调整数值,注意末尾加了一个斜杠 / 表示将原目录同步到目标目录下,而不是与目标目录完全同步,这一点在实践中要注意

    断点续传

    rsync -avz --partial /data/logs root@82.156.125.169:/data/backuplogs
    
    • 1

    传输时保留那些因故没有完全传输的文件,来是加快随后的再次传输

    总结

    • 本地拷贝数据用 cp,远程拷贝选 scp,如果想实现增量复制拷贝可以使用 rsync
    • rsync 可以将数据从本地推送至服务端,也可以将数据从服务端拉取到本地,也可以使用 daemon 模式
    • rsync 最常用的命令组合就是 avz,可以保留文件原有属性进行递归拷贝
    • 使用 rsync 命令传输数据时注意目录末尾的斜杠 /,加上它表示目录下的内容,使用时要注意不要覆盖错了
    ==>> 反爬链接,请勿点击,原地爆炸,概不负责!<<==

    “人类一思考,上帝就发笑”。虽然我们已经总结了万物,终究还是渺小和无知的代表,但我们可以利用这些渺小的总结,在有限的生命内过的更好,一些看似无法到达和接触的领域,在被划分整理之后显得那么苍白,他想笑就让他去笑吧,毕竟我们只需要为自己的有限生命而负责~

  • 相关阅读:
    【JVM】 类加载器 ClassLoader
    VPP创建主HEAP内存
    linux进行rbash逃逸的方法
    寻找两个正序数组的中位数
    从零开始写 Docker(五)---基于 overlayfs 实现写操作隔离
    【十】【SQL】合并查询和内连接
    Java中的异步日志记录与性能优化
    【C语言刷LeetCode】56. 合并区间(M)
    手机cpu架构查看及armeabi、armeabi-v7a、arm64-v8a及x86等说明
    [源码解析] NVIDIA HugeCTR,GPU版本参数服务器--- (6) --- Distributed hash表
  • 原文地址:https://blog.csdn.net/shihengzhen101/article/details/127840091