tarfile文件压缩、解压、归档指令教程

打包与压缩是我们在计算机系统日常使用中必备的一个工具,就如我们在使用Windows系统,也需要类似WinRAR的压缩软件来将许多数据、文件打包成一个文件,并压缩其占用空间。我们在Linux下也需要这样的工具,Linux下有类似gzip、bzip2之类的压缩工具,不过,这两个命令对目录的压缩指的是将目录内的所有文件“分别”进行压缩。

那Linux下有没有类似WinRAR一样强大的打包工具呢?那就是大名鼎鼎的tar了。tar可以将多个目录或文件打包成一个大文件,同时还可以通过gzip/bzip2的支持,将该文件同时进行压缩。更有趣的是,由于tar的使用太广泛了,以致于目前WinRAR也支持tar.gz文件名的解压缩。本文我将介绍tar命令的语法构成、参数说明、具体使用以及进阶操作。

一、语法构成与参数说明

1. tar语法构成

tar的参数非常多,这里只讲几个常用参数,更多参数可通过man tar查询。

[root@centos7-master ~]# tar [-j|-z] [cv] [-f 新建的文件名] filename... <==打包与压缩
[root@centos7-master ~]# tar [-j|-z] [tv] [-f 新建的文件名] <==查看文件名
[root@centos7-master ~]# tar [-j|-z] [xv] [-f 新建的文件名] [-C 指定目录] <==解压缩

2. tar参数说明

-j:通过bzip2的支持进行压缩/解压缩,此时文件名最好为*.tar.bz2,这种压缩方式效果比gzip压缩效果更好(压缩后的文件更小)
-z:通过gzip的支持进行压缩/解压缩,此时文件名最好为*.tar.gz

-c:新建打包文件,可搭配 -v 来查看过程中被打包的文件名(filename)
-t:查看打包文件的内容含有哪些文件名,重点在查看文件名。
-x:解打包或解压缩的功能,可以搭配 -C(大写)在特定目录解开。

特别留意:-c、-t、-x 不可同时出现在一串命令行中。

-v:在压缩/解压缩的过程中,将正在处理的文件名显示出来

-f filename:-f 后面要接被处理的文件名,建议 -f 单独写一个参数

-C 指定目录:这个参数用在解压缩时,若要在特定目录解压缩,可以使用这个参数

-p:保留备份数据原本权限与属性,常用于备份(-c)重要的配置文件
-P:保留绝对路径,即允许备份数据中包含有根目录/
-exclude=FILE: 在压缩过程中,排除FILE,不要将FILE打包

3. tarfile与tarball的区别

我们知道tar是一个打包&压缩命令,它支持仅打包而不压缩,也支持即打包又压缩。

如果仅打包,就是tar -cv -f file.tar而已,这个文件我们称为tarfile

如果即打包又压缩,就是tar -jcv -f file.tar.bz2而已,这个文件我们称为tarball

二、tar的具体使用

tar最常用的三个命令形式如下:

打包:tar -cv -f filename.tar filename
压缩:tar -jcv -f filename.tar.bz2 filename
      tar -zcv -f filename.tar.gz filename
查询:tar -jtv -f filename.tar.bz2
解压缩:tar -jxv -f filename.tar.bz2 -C 指定解压缩目录

这里说明一下,-f filename是紧接在一起的,但很多文章会写成-jcvf filename,这样也是对的。但由于参数的顺序理论上可调整,有些同学会写成-jvfc filename,其实也可以运行,但是会导致产生的文件名变为x,因为f后面紧跟的是c,系统会将f后面的内容识别为文件名。

所以建议还是把-f filename与其他参数独立开来写,可以避免不必要的问题出现。

但经过在Centos7上的实验,若参数f不写在最后(filename前面),会无法执行,说明Centos7对tar命令做了优化处理,具体如下:

[root@centos7-master ~]# tar -jvfc test_tar.tar.bz2 ./test_tar
tar: You must specify one of the `-Acdtrux' or `--test-label'  options
Try `tar --help' or `tar --usage' for more information.

三、tar进阶

1. -p 参数:保留文件的权限与属性信息,且去掉根目录进行打包&压缩

使用tar -p保留备份数据的原本权限与属性。下面以备份etc目录为例:

[root@centos7-master ~]# tar -jpcv -f /root/etc.tar.bz2 /etc
tar: Removing leading `/' from member names <==注意这个警告消息
# -p参数会保留原文本文件的权限与属性

我们查阅一下刚刚备份的etc目录长什么样。

[root@centos7-master ~]# tar -jtv -f /root/etc.tar.bz2
...前面省略...
-rw-r--r-- root/root      2000 2019-08-06 21:44 etc/ntp.conf
drwxr-xr-x root/root         0 2020-05-01 20:25 etc/smartmontools/
-rw-r--r-- root/root      6774 2020-04-01 12:32 etc/smartmontools/smartd.conf
drwxr-xr-x root/root         0 2020-04-01 12:32 etc/smartmontools/smartd_warning.d/
-rwxr-xr-x root/root      5586 2020-04-01 12:32 etc/smartmontools/smartd_warning.sh

我们发现一个有趣的事情,那就是每个文件名都没了根目录。这也是上面我们在打包etc目录时遇到的那个警告消息tar: Removing leading `/' from member names(删除了文件名开头的`/')所告知的情况。

那为什么要去掉根目录呢?

主要是为了安全。我们知道,使用tar备份的数据可能会需要解压缩回来使用,tar -jtvf命令所查看到的文件名就是解压缩后的实际文件名。

设想一下,如果没有去掉根目录,解压缩后的文件名就会是绝对路径,即解压缩后的数据一定会被放置到/etc/xxx去。如此一来,系统原本的/etc/下面的数据就会被备份数据所覆盖掉了,这是一件很可怕的事情。

但如果我们在压缩的时候使用-p参数,即可去掉根目录,假设我们将备份数据在/tmp中解开,那么解压缩后文件所在的路径就会是/tmp/etc/xxx。这样系统本身的/etc/就不会被覆盖了~

2. -P参数:保留根目录进行打包&压缩

如果你确实有需要备份根目录到tar文件中,那可以使用-P(大写)参数。

[root@centos7-master ~]# tar -jpPcv -f /root/etc.and.root.tar.bz2 /etc
...省略中间过程...
[root@centos7-master ~]# tar -jtf /root/etc.and.root.tar.bz2
...省略前面的输出...
/etc/smartmontools/
/etc/smartmontools/smartd.conf
/etc/smartmontools/smartd_warning.d/
/etc/smartmontools/smartd_warning.sh

可以看到,使用-P参数后,文件名内的根目录就会存在。

3.仅解压单一文件的方法

(1) 找到我们想要的文件名,如shadow文件

[root@centos7-master ~]# tar -jtv -f /root/etc.tar.bz2 | grep 'shadow'
---------- root/root       422 2020-05-01 20:34 etc/gshadow
---------- root/root       409 2020-05-01 20:25 etc/gshadow-
---------- root/root       786 2020-05-01 20:34 etc/shadow <==这是我们要的
---------- root/root       762 2020-05-01 20:25 etc/shadow-

(2) 将该文件解开,语法与实际方法如下:

[root@centos7-master ~]# tar -jxv -f 打包的文件.tar.bz2 待解开文件名
[root@centos7-master ~]# tar -jxv -f /root/etc.tar.bz2 etc/shadow

4. --exclede=FILE:打包某目录,但不包含某些文件的方法

这里我们打包/etc/ /root 这几个目录,但排除/root/etc*开发的文件,排除我们本次打包新生成的文件/root/system.tar.bz2(不要打包自己),以此为例。

[root@centos7-master ~]# tar -jcv -f /root/system.tar.bz2 --exclude=/root/etc* 
> --exclude=/root/system.tar.bz2 /etc /root

5. --newer-mtime=time 仅备份比time时刻还要新的文件

(1) 先由find找出比/etc/passwd还要新的文件

[root@centos7-master ~]# find /etc -newer /etc/passwd
...过程省略...
# 此时会显示出比/etc/passwd这个文件的mtime还要新的文件名

[root@centos7-master ~]# ll /etc/passwd
-rw-r--r-- 1 root root 1107 May  1 20:34 /etc/passwd

(2) 使用tar进行打包,日期为上面看到的2020/05/01

[root@centos7-master ~]# tar -jcv -f /root/etc.newer.then.passwd.tar.bz2 
> --newer-mtime="2020/05/01" /etc/*
...中间省略...
/etc/X11/
/etc/X11/applnk/ <==这些是成功备份的文件
/etc/X11/fontpath.d/
...中间省略...
tar: /etc/yum.repos.d/CentOS-Vault.repo: file is unchanged; not dumped
tar: /etc/yum.repos.d/CentOS-fasttrack.repo: file is unchanged; not dumped #这些是没有被备份的文件

(3) 显示出文件

[root@centos7-master ~]# tar -jtv -f /root/etc.newer.then.passwd.tar.bz2 | 
> grep -v '/$'
#grep -v 表示排除掉符合后面所跟条件的文件

6. 使用tar将文件打包到某些特殊设备中

磁带机(tape)由于是一次性读取/写入设备,因此我们不能够使用类似cp等命令来复制。如果想要将/home/etc/root 备份到磁带机(/dev/st0)时,可以用以下命令:

[root@centos7-master ~]# tar -cv -f /dev/st0 /home /root /etc

7. 特殊应用:利用管道命令与数据流

tar有一种特殊的使用方式,那就是通过标准输入输出的数据流重定向(standard input/standard output),以及管道命令(pipe)的方式,将待处理的文件一边打包一边解压缩到目标目录去 

# 将/etc整个目录一边打包一边在/tmp中解开
[root@centos7-master ~]# cd /tmp
[root@centos7-master ~]# tar -cvf - /etc | tar -xvf -
# 要注意到,前面的压缩命令中,输入文件变成 - ;后面的解压缩命令中,输出命令也变成 - ;且中间有 | 作为管道
# 对于 - 的理解,可以将 - 想象成在内存中的一个设备(缓冲区—)
# 这种方式类似于cp -r /etc /tmp 但无需中间文件存在,可以将其看作是另一种方式进行复制的行为

 

作者: JasonCeng

出处:tar命令基本、进阶使用指北 - JasonCeng - 博客园

版权:本文采用「CC BY 4.0」知识共享许可协议进行许可。

你可能感兴趣的:(linux,服务器,文档资料)