shell脚本备份mysql数据库

笑着哭i 提交于 2019-12-05 09:52:06

https://github.com/aminglinux/shell20

一台MySQL服务器,跑着5个数据库,在没有做主从的情况下,需要对这5个库进行备份,具体要求如下:

1)每天备份一次,需要备份所有的库
2)把备份数据存放到/data/backup/下
3)备份文件名称格式示例:database_name-2018-11-11.sql
4)需要对1天以前的所有sql文件压缩,格式为gzip
5)本地数据保留1周
6)需要把备份的数据同步到远程备份中心,假如本机可以直接通过rsync命令同步,同步目标地址为rsync://10.10.20.100/mysqlbak/
7)远程备份数据要求保留1个月

拿到需求后,我们不应该马上就动手,而是应该先分析需求点,准备好储备知识。如果你没有足够的储备知识,无论脚本语法掌握的多么熟练,这个脚本也是不能完成的。本脚本的核心知识点是如何备份所有的库。

 

知识点一:MySQL数据库备份


假设已知备份数据的用户为backup,密码为34KpmyzUq,要备份的5个数据库分别为db1-db5。

备份数据库的命令为:

mysqldump -ubackup -p34KpmyzUq db1 > db1.sql

如果是远程的MySQL服务,还可以加上IP和Port,例如:

mysqldump -ubackup -p34KpmyzUq -h192.168.100.100 -P3308 db1 > db1.sql

mysqldump工具常用的几个用法,如下:

1)只备份表结构,不备份数据

mysqldump -ubackup -p34KpmyzUq -h192.168.100.100 -P3308 -d db1 > db1.sql

2)只备份数据,不备份表结构

mysqldump -ubackup -p34KpmyzUq -h192.168.100.100 -P3308 -t db1 > db1.sql

3)只备份指定表

mysqldump -ubackup -p34KpmyzUq -h192.168.100.100 -P3308 db1 tb1 > db1_tb1.sql

4)导出全部数据库

mysqldump -ubackup -p34KpmyzUq -h192.168.100.100 -P3308 -A > all_db.sql

5)导出指定多个库

mysqldump -ubackup -p34KpmyzUq -h192.168.100.100 -P3308 -B db1 db2 > db12.sql

6)--master-data

我们在使用mysqldump工具备份时,偶尔会用到--master-data选项,它可以在导出时增加binlog文件的位置和change master语句(这样有助于我们做从库)。
这个选项有两个值,分别为--master-data=1和--master-data=2。
如果值等于1,就会添加一个CHANGE MASTER语句,如果值等于2,就会在CHANGE MASTER语句前添加注释,这个参数会--lock-all-tables锁表,除非你指定了--single-transaction。

若MySQL数据量很大,比如有几十GB,使用mysqldump备份工具会特别慢,推荐使用percona-xtrabackup备份工具。
该工具官方下载地址为:https://www.percona.com/software/mysqldatabase/percona-xtrabackup
它包含两个备份工具:     xtrabackup和innobackupex。
如果数据引擎为myisam或者个别表的数据引擎为myisam,则需要使用innobackupex。

在本例中,我们将使用mysqldump作为备份工具。

知识点二:date命令

date在Linux系统里可以显示当前的系统日期和时间。示例命令如下:

[root@aminglinux ~]# date
2018年 09月 15日 星期六 20:36:37 CST

在shell脚本中,date命令非常有用,就比如本例,要求备份文件名称要带有日期,我们就可以用date命令来实现,示例命令如下:

[root@aminglinux ~]# date +%F
2018-09-15

对于本例的第7点要求,也可以用date的日期来实现,示例命令如下:

[root@aminglinux ~]# date +%d
15

下面列出一些date命令常见的用法,如表1所示。

 表1 date命令用法:

命令

显示结果  

说明

date +%T

21:01:26

时间

date +%H

21

小时

date +%M

02

分钟

date +%S

10

date +%s

1537016549

时间戳(距离1970-01-0100:00:00 GMT过去多少秒)

date +%m

09

date +%d

15

date +%y

18

两位的年份

date +%Y

2018

四位的年份

date +%w

6

周几

date +%W

37

本年度第几周

date -d "-1 day" +%F

2018-09-14

昨天的日期

date -d "1 month ago" +%F

2018-08-15

一个月以前的日期

date -d "-1 min" +"%Y:%H:%M"

2018:21:09

格式化输出指定日期和时间

知识点三:找出一天以前的文件

在Linux系统里找文件有一个很厉害的工具 — find,从字面意思上看就知道这个工具就是用来“查找”符合要求文件的。

下面这几种用法会经常在shell脚本中使用:


1)找到logs目录下一周以前的老文件

find logs/ -type f -mtime +7

2)找到/etc/目录下所有文件名以.cnf结尾的文件

find /etc/ -type f -name "*.cnf"

3)找到当前目录下所有权限为777的目录

find . -type d -perm 777

4)找到/tmp/下大小超过1MB的文件

find /tmp/ -size +1M

5)找到当前目录下10天以前的文件并删除

find . -type f -mtime +10 -exec rm -f {} \;

还可以使用管道+xargs命令的形式:

find . -type f -mtime +10 |xargs rm

本例中,要求把一天以前的备份文件找到,可以这样做:

find /data/backup/ -name "*.sql" -mtime +1

知识点四:gzip压缩


gzip支持压缩文件,但不支持压缩目录,压缩一个文件的命令是:

gzip file

此时,该文件被压缩为file.gz,也就是说该文件被压缩后也会被删除掉。

解压.gz的文件,使用gzip命令的-d选项,如:

gzip -d file.gz

在Linux系统里,常见的压缩工具除了gzip外,还有bzip2,xz,zip等,其中bzip2和xz用法和gzip类似,而zip支持压缩目录。


结合知识点三和知识点四,把一天以前的备份文件压缩,命令为:

find /data/backup/ -name "*.sql" -mtime +1 |xargs gzip

知识点五:rsync

rsync是一个远程同步数据的工具,多用在备份脚本中。
rsync同步数据有两种方式,一种是通过ssh协议,需要知道对方机器用户密码或者通过密钥认证,此方式相对来说安全性稍差,毕竟知道了对方机器的密码或者建立了密钥认证,那么就能登录到对方机器上去,并可以执行命令。
另外一种方式是通过在远程机器上开启一个rsyncd的服务,通过它特有的通信协议进行数据传输,该方式不用密码或建立密钥认证,但可以设置虚拟用户以及密码,这样就安全多了。
本例中给出的远程备份地址,属于第二种方式。

rsync同步一个目录,最常用的命令为:

rsync -av /source_dir/ user@ip::module_name/dest_dir/

rsync有几个常用的选项,如下:

-a 归档模式,表示以递归方式传输文件,并保持所有属性,等同于-rlptgoD, -a选项后面可以跟一个 --no-OPTION 这个表示关闭-rlptgoD中的某一个,例如 -a--no-l 等同于-rptgoD
-r 对子目录以递归模式处理,主要是针对目录来说的,如果单独传一个文件不需要加-r,但是传输的是目录必须加-r选项
-v 打印一些信息出来,比如速率,文件数量等
-l 保留软链结
-L 像对待常规文件一样处理软链结,如果是SRC中有软连接文件,则加上该选项后将会把软连接指向的目标文件拷贝到DST
-p 保持文件权限
-o 保持文件属主信息
-g 保持文件属组信息
-D 保持设备文件信息
-t 保持文件时间信息
--delete 删除那些DST中SRC没有的文件
--exclude=PATTERN 指定排除不需要传输的文件,等号后面跟文件名,可以是万用字符模式(如*.txt)
--progress 在同步的过程中可以看到同步的过程状态,比如统计要同步的文件数量、同步的文件传输速度等等
-u 加上这个选项后将会把DST中比SRC还新的文件排除掉,不会覆盖

选项确实有点多,常用的选项仅仅那么几个: (-a -v --delete --exclude )。

下面针对这些选项做一些列小实验:

1) 准备工作(建立目录以及文件):

# mkdir rsync
# cd rsync
# mkdir test1
# cd test1
# touch 1 2 3
# ln -s /root/123.txt ./123.txt
# ls -l
总用量 0
-rw-r--r-- 1 root root 0 6月 10 12:58 1
lrwxrwxrwx 1 root root 13 6月 10 12:59 123.txt -> /root/123.txt
-rw-r--r-- 1 root root 0 6月 10 12:58 2
-rw-r--r-- 1 root root 0 6月 10 12:58 3
# cd ..

2)使用 -a 选项

# rsync -a test1 test2
# ls test2
test1
# ls test2/test1/
1 123.txt 2 3

这里有一个问题,就是本来想把test1目录直接拷贝成test2目录,可结果rsync却新建了test2目录 ,然后把test1放到test2当中。

为了避免这样的情况发生,可以这样做:

# rm -rf test2
# rsync -a test1/ test2/
# ls -l test2/
总用量 0
-rw-r--r-- 1 root root 0 6月 10 12:58 1
lrwxrwxrwx 1 root root 13 6月 10 12:59 123.txt -> /root/123.txt
-rw-r--r-- 1 root root 0 6月 10 12:58 2
-rw-r--r-- 1 root root 0 6月 10 12:58 3

加一个斜杠就好了,所以建议你在使用rsync备份目录时要养成加斜杠的习惯。

在上面讲了-a选项 等同于-rlptgoD,而且 -a 还可以和 --no-OPTIN 一并使用。

下面看看-l选项的作用:

# rsync -av --no-l test1/ test2/
sending incremental file list
created directory test2
./
1
skipping non-regular file "123.txt"
2
3
sent 200 bytes received 72 bytes 544.00 bytes/sec
total size is 13 speedup is 0.05

使用-v选项看来就是方便,上例告诉我们跳过了非普通文件123.txt,其实123.txt是一个软连接文件,如果不使用-l选项则不理会软连接文件的。

虽然加上-l选项会把软连接文件给拷贝过去,但是 软连接的目标文件却没有拷贝过去,有时候咱们指向拷贝软连接文件所指向的目标文件,那这时候该怎么办呢?

3)使用-L选项

# rsync -avL test1/ test2/
sending incremental file list
created directory test2
./
1
123.txt
2
3
sent 231 bytes received 91 bytes 644.00 bytes/sec
total size is 0 speedup is 0.00
# ls -l test2/
总用量 0
-rw-r--r-- 1 root root 0 6月 10 12:58 1
-rw-r--r-- 1 root root 0 6月 10 12:39 123.txt
-rw-r--r-- 1 root root 0 6月 10 12:58 2
-rw-r--r-- 1 root root 0 6月 10 12:58 3

加上 -L 选项就可以把SRC中软连接的目标文件给拷贝到DST

4) 使用-u选项

首先查看一下test1/1 和test2/1的创建时间(肯定是一样的),然后使用touch修改一下test2/1的创建时间(此时test2/1要比test1/1的创建时间晚了一些),如果不加-u选项的话,会把test2/1的创建时间变成和test1/1的创建时间一样。

# ll test1/1 test2/1
-rw-r--r-- 1 root root 0 6月 10 12:58 test1/1
-rw-r--r-- 1 root root 0 6月 10 12:58 test2/1

两者之间的创建时间是一样的,下面修改test2/1 的创建时间,然后不加-u同步:

# touch test2/1
# ll test2/1
-rw-r--r-- 1 root root 0 6月 10 13:20 test2/1
# rsync -a test1/1 test2/
# ll test2/1
-rw-r--r-- 1 root root 0 6月 10 12:58 test2/1

test2/1 的创建时间又变成和test1/1的创建时间一样了。

下面加上 -u 再看看结果是怎么样的:

# touch test2/1
# ll test2/1
-rw-r--r-- 1 root root 0 6月 10 13:31 test2/1
# rsync -avu test1/ test2/
sending incremental file list
./
123.txt -> /root/123.txt

sent 100 bytes received 18 bytes 236.00 bytes/sec
total size is 13 speedup is 0.11
[root@localhost rsync]# ll test2/1
-rw-r--r-- 1 root root 0 6月 10 13:31 test2/1
ll test1/1
-rw-r--r-- 1 root root 0 6月 10 12:58 test1/1

加上-u 选项后,不会再把 test1/1 同步为 test2/1了。
 

5)使用 --delete 选项
首先删除test1/123.txt:

# rm -f test1/123.txt
# ls test1/
1 2 3

然后把test1/ 目录 同步到 test2/ 目录下:

# rsync -av test1/ test2/
sending incremental file list
./
1

sent 94 bytes received 34 bytes 256.00 bytes/sec
total size is 0 speedup is 0.00
[root@localhost rsync]# ls test2/
1 123.txt 2 3

test2/目录并没有删除掉123.txt, 下面加上 --delete 选项:

# rsync -av --delete test1/ test2/
sending incremental file list
deleting 123.txt

sent 52 bytes received 12 bytes 128.00 bytes/sec
total size is 0 speedup is 0.00
[root@localhost rsync]# ls test2/
1 2 3

test2/ 目录里的123.txt也被删除了,这就是 --delete 选项的用处。还有一种情况就是如果在DST增加文件了,而SRC当中没有这些文件,同步时加上 --delete 选项后同样会删除新增的文件:

# touch test2/4
# ls test1/
1 2 3
# ls test2/
1 2 3 4
# rsync -a --delete test1/ test2/
# ls test1/
1 2 3
# ls test2/
1 2 3

6)使用 --exclude 选项

# touch test1/4
# rsync -a --exclude="4" test1/ test2/
# ls test1/
1 2 3 4
# ls test2/
1 2 3

另外还可以使用匹配字符 *

# touch test1/1.txt test1/2.txt
# ls test1/
1 1.txt 2 2.txt 3 4
# rsync -a --progress --exclude="*.txt" test1/ test2/
sending incremental file list
./
4
     0 100% 0.00kB/s 0:00:00 (xfer#1, to-check=0/5)

sent 104 bytes received 34 bytes 276.00 bytes/sec
total size is 0 speedup is 0.00
# ls test2/
1 2 3 4

上例中,也连带着使用了--progress 选项,这个主要是用来观察rsync同步过程的状态的。

最后简 单总结一下,平时使用rsync同步数据的时候,使用-a选项基本上就可以达到我们想要的效果了,只是有时候会有个别的需求,

会用到 -a --no-OPTION, -u, -L, --delete, --exclude 以及-- progress 这些选项,还有些选项没有介绍,如果在以后的工作中遇到特殊需求了,就去查一下 rsync的man文档吧。

本案例参考脚本

有了以上的背景知识点,再去写最终的shell脚本就很容易了。

参考脚本,内容如下:

#!/bin/bash
##该脚本用来备份本机数据库
##本地保留一周,远程保留一个月
##作者:
##日期:2018-09-15
##版本:v0.1

mysqldump="/usr/local/mysql/bin/mysqldump"
bakuser="backup"
passwd="34KpmyzUq"
bakdir="/data/backup"
remote_dir="rsync://10.10.20.100/mysqlbak"
d1=`date +%F`
d2=`date +%d`

#定义日志,以下的执行的所有输出,不管正确的还是错误的,全部写入到/tmp/mysql_bak.log 文件中
exec &> /tmp/mysql_bak.log        

echo "mysql backup begin at `date`"

#对所有数据库进行遍历
for db in db1 db2 db3 db4 db5
do
    $mysqldump -u$bakuser -p$passwd $db >$bakdir/$db-$d1.sql
done

#对1天前的所有sql文件压缩
find $bakdir/ -type f -name "*.sql" -mtime +1 |xargs gzip

#查找一周以前的老文件,并删除
find $bakdir/ -type f -mtime +7 |xargs rm

#把当天的备份文件同步到远程
for db in db1 db2 db3 db4 db5
do
    rsync -a $bakdir/$db-$d1.sql $remote_dir/$db-$d2.sql
done

echo "mysql backup end at `date`"

脚本中,有几个点需要解释一下。

1)脚本第一行#!/bin/bash是固定格式,用来指定解释器bash的具体位置,前面的"#!"是必须要加上的。
2)所有以"#"开头的行,都是解释说明的文字,为了便于大家理解,所以我都用了中文,建议大家尽可能地用英文,因为中文可能会出现乱码。
这些注释文字用来对该脚本的描述,通常会写脚本的作用、作者以及时间或者版本等信息。
3)脚本中我用了大量的变量,这是因为这些信息可能会改变,把它们定义到变量里方便修改。
4)shell脚本中,可以使用反引号来引用一条命令的结果,然后将其保存到变量中
5)&>指定正确输出和错误输出到/tmp/mysql_bak.log
6)在shell脚本中一旦遇到了exec命令,则它会接管该shell脚本中后续所有的命令,我们可以理解为从exec那行以下所有的命令都“被拉到了一个盒子里去执行”,
而这个“盒子”就是exec本身,所以exec &> 1.txt,就可以理解为这个“盒子”里所有的操作的输出全部都到1.txt里。
7)shell脚本中循环遍历,可以使用for,语法是for ... ; do ...; done
8)本例中要求远程备份文件保存1个月,由于脚本不能到远程机器上执行find命令,所以在这我想了一个“曲线救国”的方法,
date +$d表示日期,一个月的所有日期都有了,每天一个新sql文件。
例如,本月15日sql文件将会覆盖上个月15日的,同理,下个月会覆盖本月的相同日期的文件,因为文件名是一样的。但无论如何,总能保存一个月。
9)本例中,我并没有考虑要把当天的sql文件压缩后再同步到远程机器上,如果想要压缩,也可以这样做:a)压缩;b)同步;c)解压缩。
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!