小知识:linux下使用rsync同步目录

本文描述了linux下使用rsync单向同步两个机器目录的问题。 使用rsync同步后可以保持目录的一致性(含删除操作)。

数据同步方式

1、从主机拉数据

备机上启动的流程

同步命令:

?
1
rsync -avzP –delete root@{remoteHost}:{remoteDir} {localDir}

参数说明:

-a 参数,相当于-rlptgoD(-r 是递归 -l 是链接文件,意思是拷贝链接文件;-p 表示保持文件原有权限;-t 保持文件原有时间;-g 保持文件原有用户组;-o 保持文件原有属主;-D 相当于块设备文件); -z 传输时压缩; -P 传输进度; -v 传输时的进度等信息;

示例:

?
1
rsync -avzP –delete root@192.168.1.100:/tmp/rtest1 /tmp/

2、向备机推数据

主机上启动的流程

同步命令:

?
1
rsync -avzP –delete {localDir} root@{remoteHost}:{remoteDir}

示例:

?
1
rsync -avzP –delete /tmp/rtest1 root@192.168.1.101:/tmp/

自动同步配置

描述同步时不输入密码的配置的方法。

1、使用ssh key

该方法可以直接使用rsync命令进行同步,同步过程中无需输入密码。

在主机上产生ssh key :

?
1
ssh-keygen -t rsa

在备机上加入pubkey

?
1
ssh-copy-id -i ~/.ssh/id_rsa.pub root@192.168.1.101

或者手动添加:

在主机上执行以下命令获取pubkey:

?
1
cat ~/.ssh/id_rsa.pub

在备机上加入key内容:

?
1
vi ~/.ssh/authorized_keys

使用pexpect自动输入密码

示例代码如下:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import pexpect
import time
import traceback
def doRsync(user,passwd,ip,srcDir,dstDir,timeout=3600):
cmd = “rsync -azPq –delete {srcDir} {rUser}@{rHost}:{dstDir}”.format(
rUser = user,rHost=ip,srcDir=srcDir,dstDir=dstDir
)
try:
ssh = pexpect.spawn(cmd,timeout=timeout)
print cmd
i = ssh.expect([password:, continue connecting (yes/no)?], timeout=5)
if i == 0 :
ssh.sendline(passwd)
elif i == 1:
ssh.sendline(yes)
ssh.expect(password: )
ssh.sendline(passwd)
ssh.read()
ssh.close()
except :
#print traceback.format_exc()
pass
if __name__ == __main__:
doRsync(“root”,”123456″,”192.168.1.101″,”/tmp/rtest1″,”/tmp”)

上面是使用python实现的代码,大家可根据情况用其它语言实现该功能。

其它

1、rsync在执行过程中被kill掉会怎么样;

It is safe to kill an rsync process and run the whole thing again; it will continue where it left off. It may be a little inefficient, particularly if you havent passed –partial (included in -P), because rsync will check all files again and process the file it was interrupted on from scratch.

rsync被kill掉是安全的,下次启动时还可以正常工作。

2、rsync不能指定时间段;

1)该问题可以通过kill来解决

2)或者使用pexpect的timeout参数来控制

3)可以先通过find查找过滤出文件夹的名字,然后使用rsync进行同步 这个可以根据现有业务的特征进行,比如:

find /tmp -name * -newermt 2016-03-08 ! -newermt 2016-03-20

3、rsync在写文件过程中同步(比如录音过程中执行rsync操作)

经测试,rsync会同步部分文件内容,文件写入完成后再执行rsync会保持文件的一致

4、当文件数量达到百万级以上时,rsync同步时扫描改变的文件非常耗时

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。

声明: 猿站网有关资源均来自网络搜集与网友提供,任何涉及商业盈利目的的均不得使用,否则产生的一切后果将由您自己承担! 本平台资源仅供个人学习交流、测试使用 所有内容请在下载后24小时内删除,制止非法恶意传播,不对任何下载或转载者造成的危害负任何法律责任!也请大家支持、购置正版! 。本站一律禁止以任何方式发布或转载任何违法的相关信息访客发现请向站长举报,会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。本网站的资源部分来源于网络,如有侵权烦请发送邮件至:2697268773@qq.com进行处理。
建站知识

小知识:解决nginx+uwsgi部署Django的所有问题(小结)

2023-4-19 2:19:41

建站知识

小知识:Nginx为已安装nginx动态添加模块

2023-4-19 2:28:56

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索