• Linux上的压缩与归档


    非常非常非常简要的描述而已。

    压缩

    压缩的简要原理是通过一些算法,拿CPU的计算时间去换磁盘上存储的空间。同时还可节省网络传输中的带宽。

    对于文本文件的压缩效果比较好,对二进制程序、图片等文件的压缩效果就很差。

    compress, uncompress

    文件名:*.Z

    古老的压缩工具,目前已经不使用。

    gzip, gunzip, zcat

    文件名:*.gz

    gzip用于压缩文件,简要语法。

    # gzip [OPTION] FILE...

    FILE是待压缩的文件名,可多个。

    [root@C7 tmp]# ls -l
    total 364
    -rw-r--r--. 1 root root  18104 Jan  3  2018 functions
    -rw-r--r--  1 root root  22384 Apr 17 14:20 lvm_mount_point.xfsdump
    -rw-------  1 root root 327049 Apr 23 16:20 messages
    [root@C7 tmp]# gzip functions lvm_mount_point.xfsdump messages 
    [root@C7 tmp]# ls -l
    total 64
    -rw-r--r-- 1 root root  5021 Jan  3  2018 functions.gz
    -rw-r--r-- 1 root root   769 Apr 17 14:20 lvm_mount_point.xfsdump.gz
    -rw------- 1 root root 50126 Apr 23 16:20 messages.gz

    压缩后,会自动删除源文件,并生成.gz名称的压缩文件。

    -d:用于解压缩。等同于gunzip命令。

    [root@C7 tmp]# gzip -d functions.gz
    [root@C7 tmp]# gunzip functions.gz

    同理,解压后,压缩文件消失,压缩前的源文件生成。

    -# --fast --best:“#”表示一个数字,取值为1~9,表示压缩的效果。1表示最快--fast,9表示最好--best。默认是6。

    -c:表示将压缩后的数据流输出到STDOUT,不会修改源文件。结合重定向可以实现压缩文件时不删除源文件。

    [root@C7 tmp]# ls -l functions*
    -rw-r--r-- 1 root root 18104 Jan  3  2018 functions
    [root@C7 tmp]# gzip -c functions > functions.gz
    [root@C7 tmp]# ls -l functions*
    -rw-r--r-- 1 root root 18104 Jan  3  2018 functions
    -rw-r--r-- 1 root root  5021 Apr 23 16:51 functions.gz

    对于文本文件压缩后的文件,是无法使用诸如cat等文本查看器直接查看了,想基于压缩文件查看的话,可使用zcat。

    [root@C7 tmp]# zcat functions.gz | tail
                  "x$1" = xcondrestart ] ; then
    
            systemctl_redirect $0 $1
            exit $?
        fi
    fi
    
    strstr "$(cat /proc/cmdline)" "rc.debug" && set -x
    return 0

    bzip2, bunzip2, bzcat

    文件名:*.bz2

    命令功能与用法等同于gzip系列。

    在gzip中想要在压缩的时候保留源文件,需要通过-c选项结合重定向,而在bzip2中,可直接通过-k选项。

    -k --keep:压缩时,不删除源文件。

    [root@C7 tmp]# bzip2 -k lvm_mount_point.xfsdump
    [root@C7 tmp]# ls -l lvm_mount_point.xfsdump*
    -rw-r--r-- 1 root root 22384 Apr 17 14:20 lvm_mount_point.xfsdump
    -rw-r--r-- 1 root root   764 Apr 17 14:20 lvm_mount_point.xfsdump.bz2

    xz, unxz, xzcat

    文件名:*.xz

    命令功能与用法等同于bzip2系列。含-k选项。

    压缩小结

    压缩效果:xz>bzip2>gzip。

    可通过file命令查看压缩文件的实际/内部格式,不可以仅通过文件的扩展名来判断一个文件的类型,扩展名仅作为用户识别。

    [root@C7 tmp]# file functions.gz lvm_mount_point.xfsdump.bz2 messages.xz 
    functions.gz:                gzip compressed data, was "functions", from Unix, last modified: Wed Jan  3 00:29:40 2018
    lvm_mount_point.xfsdump.bz2: bzip2 compressed data, block size = 900k
    messages.xz:                 XZ compressed data

    归档

    上述的压缩命令,是无法实现将多个文件合并压缩为一个压缩文件,或者针对目录进行压缩的。

    [root@C7 tmp]# file init.d/
    init.d/: directory
    [root@C7 tmp]# gzip init.d/
    gzip: init.d/ is a directory -- ignored
    [root@C7 tmp]# bzip2 init.d/
    bzip2: Input file init.d/ is a directory.
    [root@C7 tmp]# xz init.d/
    xz: init.d/: Is a directory, skipping

    想实现该需求,就需要归档。

    归档的作用是可以将多个文件/目录合并为一个档案文件(archive),即类似于Windows上的WinRAR的打包操作。

    归档工具有两种,cpio和tar,前者是比较古老的命令,已逐渐被后者所取代,因此本文简述一下后者的使用即可。

    创建档案

    档案文件名:*.tar、*.tar.gz、*.tar.bz2、*.tar.xz

    # tar -c[zjJ]f ARCH_FILE FILE...

    -c:表示创建档案。

    -f:指定档案文件名(ARCH_FILE),后面必须跟上档案文件名,否则报错。例如“-fc”会报错。

    FILE:待归档文件/目录。

    在归档的时候,可以指定压缩。tar的压缩本质上是调用了上文所说到的压缩工具,而不是它本身就具备了压缩的能力。

    -z:使用gzip压缩。

    -j:使用bzip2压缩。

    -J:使用xz压缩。

    [root@C7 tmp]# tar -czf test.tar.gz functions init.d/ lvm_mount_point.xfsdump messages 
    [root@C7 tmp]# file test.tar.gz 
    test.tar.gz: gzip compressed data, from Unix, last modified: Tue Apr 23 17:48:25 2019

    归档操作不会删除源文件。因此归档压缩后,源文件“functions init.d/ lvm_mount_point.xfsdump messages”还存在。

    展开档案

    # tar -xf ARCH_FILE [-C EXTRACT_DIR]

    tar展开归档,会自动覆盖已有文件。不需要指定原压缩格式,tar会自动识别。

    [root@C7 tmp]# rm -rf functions lvm_mount_point.xfsdump messages init.d/
    [root@C7 tmp]# tar -xf test.tar.gz
    [root@C7 tmp]# ls -ld functions lvm_mount_point.xfsdump messages init.d/
    -rw-r--r-- 1 root root  18104 Jan  3  2018 functions
    drwxr-xr-x 2 root root     70 Apr 23 17:31 init.d/
    -rw-r--r-- 1 root root  22384 Apr 17 14:20 lvm_mount_point.xfsdump
    -rw------- 1 root root 327049 Apr 23 16:20 messages

    -C EXTRACT_DIR:用于指定归档展开的路径,默认不指定的话,是在当前目录下。

    [root@C7 tmp]# mkdir new_dir
    [root@C7 tmp]# tar -xf test.tar.gz -C new_dir/
    [root@C7 tmp]# ls -l new_dir/
    total 364
    -rw-r--r-- 1 root root  18104 Jan  3  2018 functions
    drwxr-xr-x 2 root root     70 Apr 23 17:31 init.d
    -rw-r--r-- 1 root root  22384 Apr 17 14:20 lvm_mount_point.xfsdump
    -rw------- 1 root root 327049 Apr 23 16:20 messages

    查看档案

    # tar -tf ARCH_FILE
    [root@C7 tmp]# tar -tf test.tar.gz 
    functions
    init.d/
    init.d/README
    init.d/functions
    init.d/netconsole
    init.d/network
    lvm_mount_point.xfsdump
    messages
  • 相关阅读:
    坑爹啊 StringDictionary 居然是不区分大小写的
    .NET平台OLEDB类型映射到Access数据类型 (转)
    国内省选乱做
    计算几何做题记录
    P6634 [ZJOI2020] 密码 解题报告
    AT2704 [AGC019E] Shuffle and Swap 解题报告
    ARC110F Esoswap 解题报告
    P6631 [ZJOI2020] 序列 解题报告
    P6633 [ZJOI2020] 抽卡 解题报告
    CF1605F PalindORme 解题报告
  • 原文地址:https://www.cnblogs.com/alongdidi/p/compress_and_archive.html
Copyright © 2020-2023  润新知