• [Linux] diff 查找文件的异同


      diff 命令是 linux上非常重要的工具,用于比较文件的内容,特别是比较两个版本不同的文件以找到改动的地方。diff在命令行中打印每一个行的改动。最新版本的diff还支持二进制文件。diff程序的输出被称为补丁 (patch),因为Linux系统中还有一个patch程序,可以根据diff的输出将a.c的文件内容更新为b.c。diff是svn、cvs、git等版本控制工具不可或缺的一部分。

    1.命令格式:
      diff[参数][变动前:文件1或目录1] [变动后:文件2或目录2]

    2.命令功能:
      diff命令能比较单个文件或者目录内容。

      如果指定比较的是文件,则只有当输入为文本文件时才有效。以逐行的方式,比较文本文件的异同处。

      如果指定比较的是目录的的时候,diff 命令会比较两个目录下名字相同的文本文件。列出不同的二进制文件、公共子目录和只在一个目录出现的文件。

    3.命令参数:
    - 指定要显示多少行的文本。此参数必须与-c或-u参数一并使用。
    -a或--text  diff预设只会逐行比较文本文件。
    -b或--ignore-space-change  不检查空格字符的不同
    -B或--ignore-blank-lines  不检查空白行
    -c  显示全部内文,并标出不同之处。
    -C或--context  与执行"-c-"指令相同。
    -d或--minimal  使用不同的演算法,以较小的单位来做比较。
    -D或ifdef  此参数的输出格式可用于前置处理器巨集。
    -e或--ed  此参数的输出格式可用于ed的script文件。
    -f或-forward-ed  输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处。
    -H或--speed-large-files  比较大文件时,可加快速度。
    -l或--ignore-matching-lines  若两个文件在某几行有所不同,而这几行同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异。
    -i或--ignore-case  不检查大小写的不同。
    -l或--paginate  将结果交由pr程序来分页。
    -n或--rcs  将比较结果以RCS的格式来显示。
    -N或--new-file  在比较目录时,若文件A仅出现在某个目录中,预设会显示:Only in目录:文件A若使用-N参数,则diff会将文件A与一个空白的文件比较。
    -p  若比较的文件为C语言的程序码文件时,显示差异所在的函数名称。
    -P或--unidirectional-new-file  与-N类似,但只有当第二个目录包含了一个第一个目录所没有的文件时,才会将这个文件与空白的文件做比较。
    -q或--brief  仅显示有无差异,不显示详细的信息。
    -r或--recursive  比较子目录中的文件。
    -s或--report-identical-files  若没有发现任何差异,仍然显示信息。
    -S或--starting-file  在比较目录时,从指定的文件开始比较。
    -t或--expand-tabs  在输出时,将tab字符展开。
    -T或--initial-tab  在每行前面加上tab字符以便对齐。
    -u,-U或--unified=  以合并的方式来显示文件内容的不同。
    -v或--version  显示版本信息。
    -w或--ignore-all-space  忽略全部的空格字符
    -W或--width  在使用-y参数时,指定栏宽
    -x或--exclude  不比较选项中所指定的文件或目录。
    -X或--exclude-from  您可以将文件或目录类型存成文本文件,然后在=中指定此文本文件。
    -y或--side-by-side  以并列的方式显示文件的异同之处
    --help  显示帮助。
    --left-column  在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容。
    --suppress-common-lines  在使用-y参数时,仅显示不同之处。

    4. 实例

    4.1 diff的三种格式

      由于历史原因,diff有三种格式:

      * 正常格式(normal diff)

      * 上下文格式(context diff)

      * 合并格式(unified diff)

    我们依次来看。

    4.2 示例文件

      为了便于讲解,先新建两个示例文件。

      第一个文件叫做f1,内容是每行一个a,一共7行。

      a
      a
      a
      a
      a
      a
      a

      第二个文件叫做f2,修改f1而成,第4行变成b,其他不变。

      a
      a
      a
      b
      a
      a
      a

    4.3 正常格式的diff

      对f1和f2进行比较:

      $ diff f1 f2

      这时,diff就会显示正常格式的结果:

      4c4
      < a
      ---
      > b

      第一行是一个提示,用来说明变动位置。

      4c4

      它分成三个部分:

        前面的"4",表示f1的第4行有变化;

        中间的"c"表示变动的模式是内容改变(change),其他模式还有"增加"(a,代表addition)和"删除"(d,代表deletion);

        后面的"4",表示变动后变成f2的第4行。

      第二行分成两个部分。

      < a

      前面的小于号,表示要从f1当中去除该行(也就是第4行),后面的"a"表示该行的内容。

      第三行用来分割f1和f2。

      ---

      第四行,类似于第二行。

      > b

      前面的大于号表示f2增加了该行,后面的"b"表示该行的内容。

    4.4 上下文格式的diff

      上个世纪80年代初,加州大学伯克利分校推出BSD版本的Unix时,觉得diff的显示结果太简单,最好加入上下文,便于了解发生的变动。因此,推出了上下文格式的diff。

      它的使用方法是加入c参数(代表context)。

      $ diff -c f1 f2

      显示结果如下:

      *** f1 2012-08-29 16:45:41.000000000 +0800
      --- f2 2012-08-29 16:45:51.000000000 +0800
      ***************
      *** 1,7 ****
       a
       a
       a
      !a
       a
       a
       a
      --- 1,7 ----
       a
       a
       a
      !b
       a
       a
       a

      这个结果分成四个部分。

      第一部分的两行,显示两个文件的基本情况:文件名和时间信息。

      *** f1 2012-08-29 16:45:41.000000000 +0800
      --- f2 2012-08-29 16:45:51.000000000 +0800

      "***"表示变动前的文件,"---"表示变动后的文件。

      第二部分是15个星号,将文件的基本情况与变动内容分割开。

      ***************

      第三部分显示变动前的文件,即f1。

      *** 1,7 ****
       a
       a
       a
      !a
       a
       a
       a

      这时不仅显示发生变化的第4行,还显示第4行的前面三行和后面三行,因此一共显示7行。所以,前面的"*** 1,7 ****"就表示,从第1行开始连续7行。

      另外,文件内容的每一行最前面,还有一个标记位。如果为空,表示该行无变化;如果是感叹号(!),表示该行有改动;如果是减号(-),表示该行被删除;如果是加号(+),表示该行为新增。

      第四部分显示变动后的文件,即f2。

      --- 1,7 ----
       a
       a
       a
      !b
       a
       a
       a

      除了变动行(第4行)以外,也是上下文各显示三行,总共显示7行。

    4.5 合并格式的diff

      如果两个文件相似度很高,那么上下文格式的diff,将显示大量重复的内容,很浪费空间。1990年,GNU diff率先推出了"合并格式"的diff,将f1和f2的上下文合并在一起显示。

      它的使用方法是加入u参数(代表unified)。

      $ diff -u f1 f2

      显示结果如下:

      --- f1 2012-08-29 16:45:41.000000000 +0800
      +++ f2 2012-08-29 16:45:51.000000000 +0800
      @@ -1,7 +1,7 @@
       a
       a
       a
      -a
      +b
       a
       a
       a

      它的第一部分,也是文件的基本信息。

      --- f1 2012-08-29 16:45:41.000000000 +0800
      +++ f2 2012-08-29 16:45:51.000000000 +0800

      "---"表示变动前的文件,"+++"表示变动后的文件。

      第二部分,变动的位置用两个@作为起首和结束。

      @@ -1,7 +1,7 @@

      前面的"-1,7"分成三个部分:减号表示第一个文件(即f1),"1"表示第1行,"7"表示连续7行。合在一起,就表示下面是第一个文件从第1行开始的连续7行。同样的,"+1,7"表示变动后,成为第二个文件从第1行开始的连续7行。

      第三部分是变动的具体内容。

       a
       a
       a
      -a
      +b
       a
       a
       a

      除了有变动的那些行以外,也是上下文各显示3行。它将两个文件的上下文,合并显示在一起,所以叫做"合并格式"。每一行最前面的标志位,空表示无变动,减号表示第一个文件删除的行,加号表示第二个文件新增的行。

    4.6 实例

    实例1:比较两个文件

    root@localhost test3]# diff log2014.log log2013.log 
    3c3
    < 2014-03
    ---
    > 2013-03
    8c8
    < 2013-07
    ---
    > 2013-08
    11,12d10
    < 2013-11
    < 2013-12

    说明:上面的“3c3”和“8c8”表示log2014.log和log20143log文件在第3行和第8行内容有所不同;"11,12d10"表示第一个文件比第二个文件多了第11和12行。
    diff 的normal 显示格式有三种提示:

    a - add
    c - change
    d - delete 

    实例2:并排格式输出
    命令:diff log2013.log log2014.log  -y -W 50

    [root@localhost test3]# diff log2014.log log2013.log -y -W 50
    2013-01 2013-01
    2013-02 2013-02
    2014-03 | 2013-03
    2013-04 2013-04
    2013-05 2013-05
    2013-06 2013-06
    2013-07 2013-07
    2013-07 | 2013-08
    2013-09 2013-09
    2013-10 2013-10
    2013-11 <
    2013-12 <
    [root@localhost test3]# diff log2013.log log2014.log -y -W 50
    2013-01 2013-01
    2013-02 2013-02
    2013-03 | 2014-03
    2013-04 2013-04
    2013-05 2013-05
    2013-06 2013-06
    2013-07 2013-07
    2013-08 | 2013-07
    2013-09 2013-09
    2013-10 2013-10
    > 2013-11
    > 2013-12
    
    说明:
    “|”表示前后2个文件内容有不同
    “<”表示后面文件比前面文件少了1行内容
    “>”表示后面文件比前面文件多了1行内容

    实例3:上下文输出格式
    命令:diff log2013.log log2014.log  -c

    [root@localhost test3]# diff log2013.log log2014.log -c
    *** log2013.log 2012-12-07 16:36:26.000000000 +0800
    --- log2014.log 2012-12-07 18:01:54.000000000 +0800
    ***************
    *** 1,10 ****
    2013-01
    2013-02
    ! 2013-03
    2013-04
    2013-05
    2013-06
    2013-07
    ! 2013-08
    2013-09
    2013-10
    --- 1,12 ----
    2013-01
    2013-02
    ! 2014-03
    2013-04
    2013-05
    2013-06
    2013-07
    ! 2013-07
    2013-09
    2013-10
    + 2013-11
    + 2013-12[root@localhost test3]# diff log2014.log log2013.log -c
    *** log2014.log 2012-12-07 18:01:54.000000000 +0800
    --- log2013.log 2012-12-07 16:36:26.000000000 +0800
    ***************
    *** 1,12 ****
    2013-01
    2013-02
    ! 2014-03
    2013-04
    2013-05
    2013-06
    2013-07
    ! 2013-07
    2013-09
    2013-10
    - 2013-11
    - 2013-12
    --- 1,10 ----
    2013-01
    2013-02
    ! 2013-03
    2013-04
    2013-05
    2013-06
    2013-07
    ! 2013-08
    2013-09
    2013-10[root@localhost test3]#
    
    说明:
    这种方式在开头两行作了比较文件的说明,这里有三中特殊字符:
    “+” 比较的文件的后者比前着多一行
    “-” 比较的文件的后者比前着少一行
    “!” 比较的文件两者有差别的行

    实例4:统一格式输出
    命令:diff log2014.log log2013.log  -u

    [root@localhost test3]# diff log2014.log log2013.log -u
    --- log2014.log 2012-12-07 18:01:54.000000000 +0800
    +++ log2013.log 2012-12-07 16:36:26.000000000 +0800
    @@ -1,12 +1,10 @@
    2013-01
    2013-02
    -2014-03
    +2013-03
    2013-04
    2013-05
    2013-06
    2013-07
    -2013-07
    +2013-08
    2013-09
    2013-10
    -2013-11
    -2013-12
    
    说明:
    它的第一部分,也是文件的基本信息:
    --- log2014.log 2012-12-07 18:01:54.000000000 +0800
    +++ log2013.log 2012-12-07 16:36:26.000000000 +0800
    "---"表示变动前的文件,"+++"表示变动后的文件。
    第二部分,变动的位置用两个@作为起首和结束。
       @@ -1,12 +1,10 @@
    前面的"-1,12"分成三个部分:减号表示第一个文件(即log2014.log),"1"表示第1行,"12"表示连续12行。合在一起,就表示下面是第一个文件从第1行开始的连续12行。同样的,"+1,10"表示变动后,成为第二个文件从第1行开始的连续10行。

    实例5:比较文件夹不同
    命令:diff  test3 test6

    [root@localhost test]# diff test3 test6
    Only in test6: linklog.log
    Only in test6: log2012.log
    diff test3/log2013.log test6/log2013.log
    1,10c1,3
    < 2013-01
    < 2013-02
    < 2013-03
    < 2013-04
    < 2013-05
    < 2013-06
    < 2013-07
    < 2013-08
    < 2013-09
    < 2013-10
    ---
    > hostnamebaidu=baidu.com
    > hostnamesina=sina.com
    > hostnames=true
    diff test3/log2014.log test6/log2014.log
    1,12d0
    < 2013-01
    < 2013-02
    < 2014-03
    < 2013-04
    < 2013-05
    < 2013-06
    < 2013-07
    < 2013-07
    < 2013-09
    < 2013-10
    < 2013-11
    < 2013-12
    Only in test6: log2015.log
    Only in test6: log2016.log
    Only in test6: log2017.log
    [root@localhost test]# 

    实例6:比较两个文件不同,并生产补丁
    命令:diff -ruN log2013.log log2014.log >patch.log

    [root@localhost test3]# diff -ruN log2013.log log2014.log >patch.log
    [root@localhost test3]# ll
    总计 12
    -rw-r--r-- 2 root root 80 12-07 16:36 log2013.log
    -rw-r--r-- 1 root root 96 12-07 18:01 log2014.log
    -rw-r--r-- 1 root root 248 12-07 21:33 patch.log
    [root@localhost test3]# cat patc.log
    cat: patc.log: 没有那个文件或目录
    [root@localhost test3]# cat patch.log 
    --- log2013.log 2012-12-07 16:36:26.000000000 +0800
    +++ log2014.log 2012-12-07 18:01:54.000000000 +0800
    @@ -1,10 +1,12 @@
    2013-01
    2013-02
    -2013-03
    +2014-03
    2013-04
    2013-05
    2013-06
    2013-07
    -2013-08
    +2013-07
    2013-09
    2013-10
    +2013-11
    +2013-12[root@localhost test3]#

    实例7:打补丁
    命令: cat log2013.log

    [root@localhost test3]# cat log2013.log
    2013-01
    2013-02
    2013-03
    2013-04
    2013-05
    2013-06
    2013-07
    2013-08
    2013-09
    2013-10[root@localhost test3]# patch log2013.log patch.log 
    patching file log2013.log
    [root@localhost test3]# 
    [root@localhost test3]# cat log2013.log 
    2013-01
    2013-02
    2014-03
    2013-04
    2013-05
    2013-06
    2013-07
    2013-07
    2013-09
    2013-10
    2013-11
    2013-12[root@localhost test3]#
  • 相关阅读:
    axios 进行类库封装
    vue的中vuex为何需要mutation更新状态,vue-router的路由的理解
    发布订阅者模式、观察者模式总结
    es 模块的基础知识,深度了解
    绑定事件的模型
    rem+media+jquery布局结局方案
    VDOM总结
    react-redux
    发布网站配置文件和SSL
    css3d旋转
  • 原文地址:https://www.cnblogs.com/xiaofeiIDO/p/6559303.html
Copyright © 2020-2023  润新知