转自:http://zhouliang.pro/2012/03/05/linux-dif/
http://www.cnblogs.com/cute/archive/2011/04/29/2033011.html
一、介绍
diff和patch是一对工具,在数学上来说,diff是对两个集合的差运算,patch是对两个集合的和运算。
diff比较两个文件或文件集合的差异,并记录下来,生成一个diff文件,这也是我们常说的patch文件,即补丁文件。
patch能将diff文件运用于 原来的两个集合之一,从而得到另一个集合。举个例子来说文件A和文件B,经过diff之后生成了补丁文件C,那么着个过程相当于 A -B = C ,那么patch的过程就是B+C = A 或A-C =B。
因此我们只要能得到A, B, C三个文件中的任何两个,就能用diff和patch这对工具生成另外一个文件。
这就是diff和patch的妙处。下面分别介绍一下两个工具的用法(待续)
1. diff的用法
diff后面可以接两个文件名或两个目录名。 如果是一个目录名加一个文件名,那么只作用在那么个目录下的同名文件。
如果是两个目录的话,作用于该目录下的所有文件,不递归。如果我们希望递归执行,需要使用-r参数。
命令diff A B > C ,一般A是原始文件,B是修改后的文件,C称为A的补丁文件。
不加任何参数生成的diff文件格式是一种简单的格式,这种格式只标出了不一样的行数和内容。我们需要一种更详细的格式,可以标识出不同之处的上下文环境,这样更有利于提高patch命令的识别能力。这个时候可以用-c开关。
2. patch的用法
patch用于根据原文件和补丁文件生成目标文件。还是拿上个例子来说
patch A C 就能得到B, 这一步叫做对A打上了B的名字为C的补丁。
之一步之后,你的文件A就变成了文件B。如果你打完补丁之后想恢复到A怎么办呢?
patch -R B C 就可以重新还原到A了。
所以不用担心会失去A的问题。
其实patch在具体使用的时候是不用指定原文件的,因为补丁文件中都已经记载了原文件的路径和名称。patch足够聪明可以认出来。但是有时候会 有点小问题。比如一般对两个目录diff的时候可能已经包含了原目录的名字,但是我们打补丁的时候会进入到目录中再使用patch,着个时候就需要你告诉 patch命令怎么处理补丁文件中的路径。可以利用-pn开关,告诉patch命令忽略的路径分隔符的个数。举例如下:
A文件在 DIR_A下,修改后的B文件在DIR_B下,一般DIR_A和DIR_B在同一级目录。我们为了对整个目录下的所有文件一次性diff,我们一般会到DIR_A和DIR_B的父目录下执行以下命令
diff -rc DIR_A DIR_B > C
着个时候补丁文件C中会记录了原始文件的路径为 DIR_A/A
现在另一个用户得到了A文件和C文件,其中A文件所在的目录也是DIR_A。 一般,他会比较喜欢在DIR_A目录下面进行patch操作,它会执行
patch < C
但是这个时候patch分析C文件中的记录,认为原始文件是./DIR_A/A,但实际上是./A,此时patch会找不到原始文件。为了避免这种情况我们可以使用-p1参数如下
patch -p1 < C
此时,patch会忽略掉第1个”/”之前的内容,认为原始文件是 ./A,这样就正确了。
最后有以下几点注意:
二、为单个文件进行补丁操作
1、建立测试文件test0、test1
[armlinux@lqm patch]$ cat >>test0< > 111111 > 111111 > 111111 > EOF [armlinux@lqm patch]$ more test0 111111 111111 111111 [armlinux@lqm patch]$ cat >>test1< > 222222 > 111111 > 222222 > 111111 > EOF [armlinux@lqm patch]$ more test1 222222 111111 222222 111111 2、使用diff创建补丁test1.patch [armlinux@lqm patch]$ diff -uN test0 test1 > test1.patch 【注:因为单个文件,所以不需要-r选项。选项顺序没有关系,即可以是-uN,也可以是-Nu。】 [armlinux@lqm patch]$ ls test0 test1 test1.patch [armlinux@lqm patch]$ more test1.patch ************************************************************ patch文件的结构 补丁头 补丁头是分别由---/+++开头的两行,用来表示要打补丁的文件。---开头表示旧文件,+++开头表示新文件。 一个补丁文件中的多个补丁 一个补丁文件中可能包含以---/+++开头的很多节,每一节用来打一个补丁。所以在一个补丁文件中可以包含好多个补丁。 块 块是补丁中要修改的地方。它通常由一部分不用修改的东西开始和结束。他们只是用来表示要修改的位置。他们通常以@@开始,结束于另一个块的开始或者一个新的补丁头。 块的缩进 块会缩进一列,而这一列是用来表示这一行是要增加还是要删除的。 块的第一列 +号表示这一行是要加上的。 -号表示这一行是要删除的。 没有加号也没有减号表示这里只是引用的而不需要修改。 ************************************************************ ***diff命令会在补丁文件中记录这两个文件的首次创建时间,如下*** --- test0 2006-08-18 09:12:01.000000000 +0800 +++ test1 2006-08-18 09:13:09.000000000 +0800 @@ -1,3 +1,4 @@ +222222 111111 -111111 +222222 111111 [armlinux@lqm patch]$ patch -p0 < test1.patch patching file test0 [armlinux@lqm patch]$ ls test0 test1 test1.patch [armlinux@lqm patch]$ cat test0 222222 111111 222222 111111 3、可以去除补丁,恢复旧版本 [armlinux@lqm patch]$ patch -RE -p0 < test1.patch patching file test0 [armlinux@lqm patch]$ ls test0 test1 test1.patch [armlinux@lqm patch]$ cat test0 111111 111111 111111 三、为多个文件进行补丁操作 1、创建测试文件夹 [armlinux@lqm patch]$ mkdir prj0 [armlinux@lqm patch]$ cp test0 prj0 [armlinux@lqm patch]$ ls prj0 test0 test1 test1.patch [armlinux@lqm patch]$ cd prj0/ [armlinux@lqm prj0]$ ls test0 [armlinux@lqm prj0]$ cat >>prj0name< > -------- > prj0/prj0name > -------- > EOF [armlinux@lqm prj0]$ ls prj0name test0 [armlinux@lqm prj0]$ cat prj0name -------- prj0/prj0name -------- [armlinux@lqm prj0]$ cd .. [armlinux@lqm patch]$ mkdir prj1 [armlinux@lqm patch]$ cp test1 prj1 [armlinux@lqm patch]$ cd prj1 [armlinux@lqm prj1]$ cat >>prj1name< > --------- > prj1/prj1name > --------- > EOF [armlinux@lqm prj1]$ cat prj1name --------- prj1/prj1name --------- [armlinux@lqm prj1]$ cd .. 2、创建补丁 [armlinux@lqm patch]$ diff -uNr prj0 prj1 > prj1.patch [armlinux@lqm patch]$ more prj1.patch diff -uNr prj0/prj0name prj1/prj0name --- prj0/prj0name 2006-08-18 09:25:11.000000000 +0800 +++ prj1/prj0name 1970-01-01 08:00:00.000000000 +0800 @@ -1,3 +0,0 @@ --------- -prj0/prj0name --------- diff -uNr prj0/prj1name prj1/prj1name --- prj0/prj1name 1970-01-01 08:00:00.000000000 +0800 +++ prj1/prj1name 2006-08-18 09:26:36.000000000 +0800 @@ -0,0 +1,3 @@ +--------- +prj1/prj1name +--------- diff -uNr prj0/test0 prj1/test0 --- prj0/test0 2006-08-18 09:23:53.000000000 +0800 +++ prj1/test0 1970-01-01 08:00:00.000000000 +0800 @@ -1,3 +0,0 @@ -111111 -111111 -111111 diff -uNr prj0/test1 prj1/test1 --- prj0/test1 1970-01-01 08:00:00.000000000 +0800 +++ prj1/test1 2006-08-18 09:26:00.000000000 +0800 @@ -0,0 +1,4 @@ +222222 +111111 +222222 +111111 [armlinux@lqm patch]$ ls prj0 prj1 prj1.patch test0 test1 test1.patch [armlinux@lqm patch]$ cp prj1.patch ./prj0 [armlinux@lqm patch]$ cd prj0 [armlinux@lqm prj0]$ patch -p1 < prj1.patch patching file prj0name patching file prj1name patching file test0 patching file test1 [armlinux@lqm prj0]$ ls prj1name prj1.patch test1 [armlinux@lqm prj0]$ patch -R -p1 < prj1.patch patching file prj0name patching file prj1name patching file test0 patching file test1 [armlinux@lqm prj0]$ ls prj0name prj1.patch test0 ------------------- 总结: 单个文件 diff –uN from-file to-file >to-file.patch patch –p0 < to-file.patch patch –RE –p0 < to-file.patch 多个文件 diff –uNr from-docu to-docu >to-docu.patch patch –p1 < to-docu.patch patch –R –p1 不过,diff的输出让人读起来很废劲,因为这个输出本来就不是给人看的,如果你知道一点关于ed编辑器的用法,就容易理解了。最开始的时候diff的输出不是这种格式的,后来受到ed编辑器的影响才变成这个样子,至于其发展历程请移步维基百科,因此在解释diff的输出之前,先简单介绍一下ed编辑器。 ed是一个交互式的文本编辑器,类Unix系统中有很多很神奇的编辑器,号称神器的有vi、vim、emacs,还有常规意义的编辑器nano、gedit,还有看起来很诡异的sed(Stream Editor)、awk,ed这是另一个很诡异的编辑器,不同于前面的任何一种。 打开shell,按次序输入如下的命令(需要一句一句的敲): 使用cat命令查看c.c,该文件的内容就是上面代码中“0a”和“.”之前代码。 和vim一样,ed通过一系列的命令来编辑文件: ed编辑器的好处在于可以将一系列命令写成一个文件,然后进行批量执行。比如需要在所有的源代码开头加上版权信息,则可以编写如下的ed文件,保存为add_header: 然后写一段shell脚本对源代码文件进行遍历,对每个代码执行如下代码即可批量对源代码文件添加版权信息: 关于ed的命令和其他方法请参考Unix ed Editor Command Set本文不详述。 diff的输出格式是对ed脚本(ed script)的一种扩展,遵循ed的命令语法,添加了"<"和">"分别用于表示新文件的内容和旧文件的内容,比如前文中diff的输出可以按如下方式理解: 当然还有更复杂的情况,如“3c3,6”、“6d8”,前者表示旧版本文件中的第3行被修改,对应新文件中的第3-6行,后者表示旧版本文件的第6行被删除,在新文件中是第8行。 可以通过参数指定diff输出格式,有兴趣的笔者可以分别进行尝试: 除以上选项外,diff的有用的选项还包括: ed 编辑器
touch c.c
ed c.c
0a
#include
0a
/**
* © 2012 zhlwish.com
*/
.
w
q
ed a.c < add_header
diff的输出
diff的选项
参考资料