一、rsync的介绍
rsync 是linux系统下的数据镜像备份工具。使用快速增量备份工具 Remote Sync可以远程同步,也支持本地复制,或者与其他ssh、rsync主机同步。
rsync(remote synchronize)是一个远程数据同步工具,可通过 LAN/WAN 快速同步多台主机之间的文件。也可以使用 rsync 同步本地硬盘中的不同目录。
rsync 是用于替代 rcp 的一个工具,rsync 使用所谓的 rsync算法 进行数据同步,这种算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。
rsync 支持大多数的类 Unix 系统,无论是 Linux、Solaris 还是 BSD上 都经过了良好的测试。 CentOS系统默认就安装了 rsync 软件包。 在 windows 平台下也有相应的版本,如 cwrsync 和DeltaCopy 等。
1.1rsync的特点
rsync 具有如下的基本特性:
可以镜像保存整个目录树和文件系统
可以很容易做到保持原来文件的权限、时间、软硬链接等
无须特殊权限即可安装
优化的流程,文件传输效率高
可以使用 rsh、ssh 方式来传输文件,当然也可以通过直接的 socket 连接
支持匿名传输,以方便进行网站镜象
在使用 rsync 进行远程同步时,可以使用两种方式:远程 Shell 方式(建议使用 ssh,用户验证由 ssh 负责)和 C/S 方式(即客户连接远程 rsync 服务器,用户验证由 rsync 服务器负责)。
无论本地同步目录还是远程同步数据,首次运行时将会把全部文件拷贝一次,以后再运行时将只拷贝有变化的文件(对于新文件)或文件的变化部分(对于原有文件)。
rsync 在首次复制时没有速度优势,速度不如 tar,因此当数据量很大时您可以考虑先使用 tar 进行首次复制,然后再使用 rsync 进行数据同步。
二、rsync命令
1 -v, --verbose 详细模式输出
2 -q, --quiet 精简输出模式
3 -c, --checksum 打开校验开关,强制对文件传输进行校验
4 -a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
5 -r, --recursive 对子目录以递归模式处理
6 -R, --relative 使用相对路径信息
7 -b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
8 --backup-dir 将备份文件(如~filename)存放在在目录下。
9 -suffix=SUFFIX 定义备份文件前缀
10 -u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
11 -l, --links 保留软链结
12 -L, --copy-links 想对待常规文件一样处理软链结
13 --copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
14 --safe-links 忽略指向SRC路径目录树以外的链结
15 -H, --hard-links 保留硬链结
16 -p, --perms 保持文件权限
17 -o, --owner 保持文件属主信息
18 -g, --group 保持文件属组信息
19 -D, --devices 保持设备文件信息
20 -t, --times 保持文件时间信息
21 -S, --sparse 对稀疏文件进行特殊处理以节省DST的空间
22 -n, --dry-run现实哪些文件将被传输
23 -W, --whole-file 拷贝文件,不进行增量检测
24 -x, --one-file-system 不要跨越文件系统边界
25 -B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节
26 -e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
27 --rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
28 -C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
29 --existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
30 --delete 删除那些DST中SRC没有的文件
31 --delete-excluded 同样删除接收端那些被该选项指定排除的文件
32 --delete-after 传输结束以后再删除
33 --ignore-errors 及时出现IO错误也进行删除
34 --max-delete=NUM 最多删除NUM个文件
35 --partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
36 --force 强制删除目录,即使不为空
37 --numeric-ids 不将数字的用户和组ID匹配为用户名和组名
38 --timeout=TIME IP超时时间,单位为秒
39 -I, --ignore-times 不跳过那些有同样的时间和长度的文件
40 --size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
41 --modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
42 -T --temp-dir=DIR 在DIR中创建临时文件
43 --compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
44 -P 等同于 --partial
45 --progress 显示备份过程
46 -z, --compress 对备份的文件在传输时进行压缩处理
47 --exclude=PATTERN 指定排除不需要传输的文件模式
48 --include=PATTERN 指定不排除而需要传输的文件模式
49 --exclude-from=FILE 排除FILE中指定模式的文件
50 --include-from=FILE 不排除FILE指定模式匹配的文件
51 --version 打印版本信息
52 --address 绑定到特定的地址
53 --config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
54 --port=PORT 指定其他的rsync服务端口
55 --blocking-io 对远程shell使用阻塞IO
56 -stats 给出某些文件的传输状态
57 --progress 在传输时现实传输过程
58 --log-format=formAT 指定日志文件格式
59 --password-file=FILE 从FILE中得到密码
60 --bwlimit=KBPS 限制I/O带宽,KBytes per second
61 -h, --help 显示帮助信息
常用选项 avz、avzH、avH
a保持文件属性,v显示详细信息,q静默模式和v相反,z压缩,r递归,p保持原有的权限属性,H保持硬链接
三、rsync的ssh认证协议
rsync命令来同步系统文件之前要先登录remote认证,认证过程中用到的协议有两种:
ssh协议
rsync协议
四、ssh协议方式使用方法
ssh协议用法:跟scp的原理一样,同步过程中如果不想输入密码就提前进行ssh密钥认证
rsync 是一个功能非常强大的工具,其命令也有很多功能选项。rsync 的命令格式为:
1)本地使用:
rsync [OPTION...] SRC... [DEST]
2)通过远程 Shell 使用:
rsync [OPTION...] [USER@]HOST:SRC... [DEST]
rsync [OPTION...] SRC... [USER@]HOST:DEST
3)访问 rsync 服务器:
rsync [OPTION...] [USER@]HOST::SRC... [DEST]
rsync [OPTION...] SRC... [USER@]HOST::DEST
rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]
rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST
其中:
SRC: 是要复制的源位置
DEST: 是复制目标位置
若本地登录用户与远程主机上的用户一致,可以省略 USER@
使用远程 shell 同步时,主机名与资源之间使用单个冒号“:”作为分隔符
使用 rsync 服务器同步时,主机名与资源之间使用两个冒号“::”作为分隔符
当访问 rsync 服务器时也可以使用 rsync:// URL
五、rsync协议方式使用方法即 (rsync + inotifu-tools)
sync与传统的cp、tar备份方式相比,rsync具有安全性高、备份迅速、支持增量备份等优点,通过rsync可以解决对实时性要求不高的数据备份需求,例如定期的备份文件服务器数据到远端服务器,对本地磁盘定期做数据镜像等。
随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出的更好的要求,rsync在高端业务系统中也逐渐暴露出了很多不足,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的。而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时的去监测、同步数据,虽然它可以通过linux守护进程的方式进行触发同步,但是两次触发动作一定会有时间差,这样就导致了服务端和客户端数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,rsync+inotify组合出现了!
Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件。
在前面有讲到,rsync可以实现触发式的文件同步,但是通过crontab守护进程方式进行触发,同步的数据和实际数据会有差异,而inotify可以监控文件系统的各种变化,当文件有任何变动时,就触发rsync同步,这样刚好解决了同步数据的实时性问题。
rsync协议用法:和正常的C/S服务器一样,server端启动服务进程,client端使用时通过rsync命令连接server端,需设置配置文件
六、rsync协议方式使用示例:
server端 --> client端
server端 192.168.43.143
(只需要修改配置文件)
yum install rsync (centos7默认已安装 )
systemctl stop firewalld
systemctl disable firewalld
getenforce 0
cat >> /etc/rsyncd.conf << EOF
log file = /var/log/rsyncd.log
pidfile =/var/run/rsyncd.pid
locak file = /var/run/rsync.lock
secrets file = /etc/rsync.pass
[test]
path = /tmp/test
comment = sync test from client
uid = root
gid = root
port = 873
ignore errors
use chroot = no
read only = no
list = no
max connections = 200
timeout = 600
auth users = admin
> EOF
echo 'admin:123456' > /etc/rsync.pass
chmod 600 /etc/rsync.pass
systemctl start rsyncd
systemctl enable rsyncd
client端 192.168.43.247
1.修改rsync配置文件
2.下载inotify-tools(需epel源)
3.脚本同步资源
yum install rsync inotify-tools
systemctl stop firewalld
systemctl disabl firewalld
getenforce 0
echo '123456' > /etc/rsync.pass
chmod 600 /etc/rsync.pass
mkdir /tmp/test
rsync -avH --port 873 --progress --delete /root/test/ admin@192.168.43.143::test --password-file=/etc/rsync.pass
mkdir /scripts
vim /scripts/inotify.sh
host=192.168.43.143
dir=/tmp/test
des=test
password=/etc/rsync.pass
usr=admin
inotifywait=/usr/bin/inotifywait
$inotifywait -mrq --timefmt '%Y%m%d %H:%M' --format '%T %w%f%e' -e modify,delete,create,attrib $dir
| while read files ;do
rsync -avzP --delete --timeout=100 --password-file=${password} $dir $user@$host::$des
echo "${files} was rsynced" >>/tmp/rsync.log 2>&1
done
chmod 755 /scripts/inotify.sh
chmod +x /scripts/inotify.sh
echo "nohup /bin/bash /scripts/inotify.sh" >> /etc/rc.d/rc.d/rc.local