程序打补丁以及在shell里面写c代码

转自:http://zhouliang.pro/2012/03/05/linux-dif/

http://www.cnblogs.com/cute/archive/2011/04/29/2033011.html

一、介绍

diff和patch是一对工具,在数学上来说,diff是对两个集合的差运算,patch是对两个集合的和运算。 
diff比较两个文件或文件集合的差异,并记录下来,生成一个diff文件,这也是我们常说的patch文件,即补丁文件。 
patch能将diff文件运用于 原来的两个集合之一,从而得到另一个集合。举个例子来说文件A和文件B,经过diff之后生成了补丁文件C,那么着个过程相当于 A -B = C ,那么patch的过程就是B+C = A 或A-C =B。 
因此我们只要能得到A, B, C三个文件中的任何两个,就能用diff和patch这对工具生成另外一个文件。

这就是diff和patch的妙处。下面分别介绍一下两个工具的用法(待续)

1. diff的用法

diff后面可以接两个文件名或两个目录名。 如果是一个目录名加一个文件名,那么只作用在那么个目录下的同名文件。

如果是两个目录的话,作用于该目录下的所有文件,不递归。如果我们希望递归执行,需要使用-r参数。

命令diff A B > C ,一般A是原始文件,B是修改后的文件,C称为A的补丁文件。 
不加任何参数生成的diff文件格式是一种简单的格式,这种格式只标出了不一样的行数和内容。我们需要一种更详细的格式,可以标识出不同之处的上下文环境,这样更有利于提高patch命令的识别能力。这个时候可以用-c开关。 


2. patch的用法

patch用于根据原文件和补丁文件生成目标文件。还是拿上个例子来说

patch A C 就能得到B, 这一步叫做对A打上了B的名字为C的补丁。

之一步之后,你的文件A就变成了文件B。如果你打完补丁之后想恢复到A怎么办呢?

patch -R B C 就可以重新还原到A了。

所以不用担心会失去A的问题。

其实patch在具体使用的时候是不用指定原文件的,因为补丁文件中都已经记载了原文件的路径和名称。patch足够聪明可以认出来。但是有时候会 有点小问题。比如一般对两个目录diff的时候可能已经包含了原目录的名字,但是我们打补丁的时候会进入到目录中再使用patch,着个时候就需要你告诉 patch命令怎么处理补丁文件中的路径。可以利用-pn开关,告诉patch命令忽略的路径分隔符的个数。举例如下:

A文件在 DIR_A下,修改后的B文件在DIR_B下,一般DIR_A和DIR_B在同一级目录。我们为了对整个目录下的所有文件一次性diff,我们一般会到DIR_A和DIR_B的父目录下执行以下命令

diff -rc DIR_A DIR_B > C

着个时候补丁文件C中会记录了原始文件的路径为 DIR_A/A

现在另一个用户得到了A文件和C文件,其中A文件所在的目录也是DIR_A。 一般,他会比较喜欢在DIR_A目录下面进行patch操作,它会执行

patch < C

但是这个时候patch分析C文件中的记录,认为原始文件是./DIR_A/A,但实际上是./A,此时patch会找不到原始文件。为了避免这种情况我们可以使用-p1参数如下

patch -p1 < C

此时,patch会忽略掉第1个”/”之前的内容,认为原始文件是 ./A,这样就正确了。

最后有以下几点注意:

  1. 一次打多个patch的话,一般这些patch有先后顺序,得按次序打才行。
  2. 在patch之前不要对原文件进行任何修改
  3. 如果patch中记录的原始文件和你得到的原始文件版本不匹配(很容易出现),那么你可以尝试使用patch, 如果幸运的话,可以成功。大部分情况下,会有不匹配的情况,此时patch会生成rej文件,记录失败的地方,你可以手工修改。

二、为单个文件进行补丁操作

1、建立测试文件test0、test1

[armlinux@lqm patch]$ cat  >>test0<

> 111111

> 111111

> 111111

> EOF

[armlinux@lqm patch]$ more test0

111111

111111

111111

[armlinux@lqm patch]$ cat >>test1<

> 222222

> 111111

> 222222

> 111111

> EOF

[armlinux@lqm patch]$ more test1

222222

111111

222222

111111

2、使用diff创建补丁test1.patch

[armlinux@lqm patch]$ diff -uN test0 test1 > test1.patch

【注:因为单个文件,所以不需要-r选项。选项顺序没有关系,即可以是-uN,也可以是-Nu。】

[armlinux@lqm patch]$ ls

test0  test1  test1.patch

[armlinux@lqm patch]$ more test1.patch

************************************************************

patch文件的结构

补丁头

补丁头是分别由---/+++开头的两行,用来表示要打补丁的文件。---开头表示旧文件,+++开头表示新文件。

一个补丁文件中的多个补丁

一个补丁文件中可能包含以---/+++开头的很多节,每一节用来打一个补丁。所以在一个补丁文件中可以包含好多个补丁。

块是补丁中要修改的地方。它通常由一部分不用修改的东西开始和结束。他们只是用来表示要修改的位置。他们通常以@@开始,结束于另一个块的开始或者一个新的补丁头。

块的缩进

块会缩进一列,而这一列是用来表示这一行是要增加还是要删除的。

块的第一列

+号表示这一行是要加上的。

-号表示这一行是要删除的。

没有加号也没有减号表示这里只是引用的而不需要修改。

************************************************************

***diff命令会在补丁文件中记录这两个文件的首次创建时间,如下***

--- test0       2006-08-18 09:12:01.000000000 +0800

+++ test1       2006-08-18 09:13:09.000000000 +0800

@@ -1,3 +1,4 @@

+222222

111111

-111111

+222222

111111

[armlinux@lqm patch]$ patch -p0 < test1.patch

patching file test0

[armlinux@lqm patch]$ ls

test0  test1  test1.patch

[armlinux@lqm patch]$ cat test0

222222

111111

222222

111111

3、可以去除补丁,恢复旧版本

[armlinux@lqm patch]$ patch -RE -p0 < test1.patch

patching file test0

[armlinux@lqm patch]$ ls

test0  test1  test1.patch

[armlinux@lqm patch]$ cat test0

111111

111111

111111

三、为多个文件进行补丁操作

1、创建测试文件夹

[armlinux@lqm patch]$ mkdir prj0

[armlinux@lqm patch]$ cp test0 prj0

[armlinux@lqm patch]$ ls

prj0  test0  test1  test1.patch

[armlinux@lqm patch]$ cd prj0/

[armlinux@lqm prj0]$ ls

test0

[armlinux@lqm prj0]$ cat >>prj0name<

> --------

> prj0/prj0name

> --------

> EOF

[armlinux@lqm prj0]$ ls

prj0name  test0

[armlinux@lqm prj0]$ cat prj0name

--------

prj0/prj0name

--------

[armlinux@lqm prj0]$ cd ..

[armlinux@lqm patch]$ mkdir prj1

[armlinux@lqm patch]$ cp test1 prj1

[armlinux@lqm patch]$ cd prj1

[armlinux@lqm prj1]$ cat >>prj1name<

> ---------

> prj1/prj1name

> ---------

> EOF

[armlinux@lqm prj1]$ cat prj1name

---------

prj1/prj1name

---------

[armlinux@lqm prj1]$ cd ..

2、创建补丁

[armlinux@lqm patch]$ diff -uNr prj0 prj1 > prj1.patch

[armlinux@lqm patch]$ more prj1.patch

diff -uNr prj0/prj0name prj1/prj0name

--- prj0/prj0name       2006-08-18 09:25:11.000000000 +0800

+++ prj1/prj0name       1970-01-01 08:00:00.000000000 +0800

@@ -1,3 +0,0 @@

---------

-prj0/prj0name

---------

diff -uNr prj0/prj1name prj1/prj1name

--- prj0/prj1name       1970-01-01 08:00:00.000000000 +0800

+++ prj1/prj1name       2006-08-18 09:26:36.000000000 +0800

@@ -0,0 +1,3 @@

+---------

+prj1/prj1name

+---------

diff -uNr prj0/test0 prj1/test0

--- prj0/test0  2006-08-18 09:23:53.000000000 +0800

+++ prj1/test0  1970-01-01 08:00:00.000000000 +0800

@@ -1,3 +0,0 @@

-111111

-111111

-111111

diff -uNr prj0/test1 prj1/test1

--- prj0/test1  1970-01-01 08:00:00.000000000 +0800

+++ prj1/test1  2006-08-18 09:26:00.000000000 +0800

@@ -0,0 +1,4 @@

+222222

+111111

+222222

+111111

[armlinux@lqm patch]$ ls

prj0  prj1  prj1.patch  test0  test1  test1.patch

[armlinux@lqm patch]$ cp prj1.patch ./prj0

[armlinux@lqm patch]$ cd prj0

[armlinux@lqm prj0]$ patch -p1 < prj1.patch

patching file prj0name

patching file prj1name

patching file test0

patching file test1

[armlinux@lqm prj0]$ ls

prj1name  prj1.patch  test1

[armlinux@lqm prj0]$ patch -R -p1 < prj1.patch

patching file prj0name

patching file prj1name

patching file test0

patching file test1

[armlinux@lqm prj0]$ ls

prj0name  prj1.patch  test0

-------------------

总结:

单个文件

diff –uN  from-file  to-file  >to-file.patch

patch –p0 < to-file.patch

patch –RE –p0 < to-file.patch

多个文件

diff –uNr  from-docu  to-docu  >to-docu.patch

patch –p1 < to-docu.patch

patch –R –p1

不过,diff的输出让人读起来很废劲,因为这个输出本来就不是给人看的,如果你知道一点关于ed编辑器的用法,就容易理解了。最开始的时候diff的输出不是这种格式的,后来受到ed编辑器的影响才变成这个样子,至于其发展历程请移步维基百科,因此在解释diff的输出之前,先简单介绍一下ed编辑器。

ed 编辑器

ed是一个交互式的文本编辑器,类Unix系统中有很多很神奇的编辑器,号称神器的有vi、vim、emacs,还有常规意义的编辑器nano、gedit,还有看起来很诡异的sed(Stream Editor)、awk,ed这是另一个很诡异的编辑器,不同于前面的任何一种。

打开shell,按次序输入如下的命令(需要一句一句的敲):

touch c.c
ed c.c
0a
#include 
int main(int argc, char *argv[])
{
    // add code here
    return 0;
}
.
w
q

使用cat命令查看c.c,该文件的内容就是上面代码中“0a”和“.”之前代码。

和vim一样,ed通过一系列的命令来编辑文件:

  • “ed c.c”表示用ed对文件c.c进行编辑
  • “0a”表示在第0行后进行添加(a表示add,同样,d表示删除,c表示修改)
  • 接着输入需要添加的内容,输入完成后换一行,输入“.”(表示回车),表示输入完成
  • 输入“w”表示保存文件
  • 输入“q”表示退出编辑器

ed编辑器的好处在于可以将一系列命令写成一个文件,然后进行批量执行。比如需要在所有的源代码开头加上版权信息,则可以编写如下的ed文件,保存为add_header:

0a
/**
 * © 2012 zhlwish.com
 */
.
w
q

然后写一段shell脚本对源代码文件进行遍历,对每个代码执行如下代码即可批量对源代码文件添加版权信息:

ed a.c < add_header

关于ed的命令和其他方法请参考Unix ed Editor Command Set本文不详述。

diff的输出

diff的输出格式是对ed脚本(ed script)的一种扩展,遵循ed的命令语法,添加了"<"和">"分别用于表示新文件的内容和旧文件的内容,比如前文中diff的输出可以按如下方式理解:

  • “5c5”表示a.c的第5行有改动(change),改动后为b.c的第5行
  • “< // add code here”表示a.c的第5行的内容
  • “--- ”是分隔符
  • “> printf("Hello world");”表示b.c文件的第5行的内容

当然还有更复杂的情况,如“3c3,6”、“6d8”,前者表示旧版本文件中的第3行被修改,对应新文件中的第3-6行,后者表示旧版本文件的第6行被删除,在新文件中是第8行。

可以通过参数指定diff输出格式,有兴趣的笔者可以分别进行尝试:

  • -e --ed 输出为ed命令格式
  • -n --rcs 输出为rcs命令格式
  • -y 输出为两列对照模式
  • -c 输出为上下文模式

diff的选项

除以上选项外,diff的有用的选项还包括:

  • -r:当diff的参数为文件夹时,diff会遍历整个文件夹对新旧文件夹下同名的文件进行比较
  • -w:忽略所有空格和制表符,将所有其他空白字符串视为一致。例如,if ( a == b ) 与 if(a==b) 相等。
  • -i:忽略字母大小写。例如,小写 a 被认为同大写 A 一样。

参考资料

  • Linux命令diff
  • Sed学习笔记
  • Editing files with the ed text editor from scripts
  • Unix ed Editor Command Set
  • Hello World" with ed editor(Youtube)
  • 用Diff和Patch工具维护源码

你可能感兴趣的:(shell,C)