苏云南雁

Linux学习笔记25——正则表达式与文件格式化处理

一、什么是正则表达式

什么是正则表达式

正则表达式对于系统管理员的用途

正则表达式的广泛用途

正则表达式与 Shell 在 Linux 当中的角色定位

延伸的正则表达式

二、基础正则表达式

1，语系对正则表达式的影响

2，grep 的一些进阶选项

3，基础正则表达式练习

例题一、搜寻特定字串

例题二、利用中括号 [] 来搜寻集合字符

例题三、行首与行尾字符 ^ $

例题四、任意一个字符 . 与重复字符 *

例题五、限定连续 RE 字符范围 {}

4，基础正则表达式字符汇整（ characters）

5，sed 工具

以行为单位的取代与显示功能

部分数据的搜寻并取代的功能

直接修改文件内容（危险动作）

三，延伸正则表达式

四、文件的格式化与相关操作

1，格式化打印： printf

2，awk：好用的数据处理工具

awk 的逻辑运算字符

3，文件比对工具

diff

cmp

patch

4，文件打印准备： pr

正则表达式这个东东，学java的时候一直觉得好麻烦啊动不动n个\\，看起来都烦，也是在啃过几版正则表达式的用法之后，发觉这东西真的不错。在用sublime的时候，多行游标+正则表达式感觉贼好用，python也偶尔用用，js在验证登录的时候也不错，总之这是个运用广泛的东东，配合文本编辑器，有神效。接下来，进入一下linux版的正则表达式（使用）。（学东西，有时候真的不懂的有个印象，之后回过来再搞一轮，就容易懂了，贼爽！）

正则表达式（ Regular Expression, RE, 或称为常规表达式）是通过一些特殊字符的排列，用以“搜寻/取代/删除”一列或多列文字字串，简单的说，正则表达式就是用在字串的处理上面的一项“表示式”。正则表达式并不是一个工具程序，而是一个字串处理的标准依据，如果您想要以正则表达式的方式处理字串，就得要使用支持正则表达式的工具程序才行，这类的工具程序很多，例如 vi, sed, awk 等等。

正则表达式对于系统管理员来说实在是很重要！因为系统会产生很多的讯息，这些讯息有的重要有的仅是告知，此时，管理员可以通过正则表达式的功能来将重要讯息撷取出来，并产生便于查阅的报表来简化管理流程。此外，很多的套装软件也都支持正则表达式的分析，例如邮件服务器的过滤机制（过滤垃圾信件）就是很重要的一个例子。所以，您最好要了解正则表达式的相关技能，在未来管理主机时，才能够更精简处理您的日常事务！

本章节使用者需要多加练习，因为目前很多的套件都是使用正则表达式来达成其“过滤、分析”的目的，为了未来主机管理的便利性，使用者至少要能看的懂正则表达式的意义！

一、什么是正则表达式

约略了解了 Linux 的基本指令（ BASH）并且熟悉了 vim 之后，相信你对于敲击键盘的打字与指令下达比较不陌生了吧？接下来，下面要开始介绍一个很重要的观念，那就是所谓的“正则表达式（ Regular Expression） ”啰！

什么是正则表达式

任何一个有经验的系统管理员，都会告诉你：“正则表达式真是挺重要的！” 为什么很重要呢？因为日常生活就使用的到啊！举个例子来说，在你日常使用 vim 作文书处理或程序撰写时使用到的“搜寻/取代”等等的功能，这些举动要作的漂亮，就得要配合正则表达式来处理啰！

简单的说，正则表达式就是处理字串的方法，他是以行为单位（其实嘛要是有\n就不一定以行未单位了，比如这个正则表达式： .*[\n].*）来进行字串的处理行为，正则表达式通过一些特殊符号的辅助，可以让使用者轻易的达到“搜寻/删除/取代”某特定字串的处理程序！

举例来说，我只想找到 VBird（前面两个大写字符）或 Vbird（仅有一个大写字符）这个字样，但是不要其他的字串（例如 VBIRD, vbird 等不需要），该如何办理？如果在没有正则表达式的环境中（例如 MS word），你或许就得要使用忽略大小写的办法，或者是分别以VBird 及 Vbird 搜寻两遍。但是，忽略大小写可能会搜寻到 VBIRD/vbird/VbIrD 等等的不需要的字串而造成困扰。

再举个系统常见的例子好了，假设你发现系统在开机的时候，老是会出现一个关于 mail 程序的错误，而开机过程的相关程序都是在 /lib/systemd/system/ 下面，也就是说，在该目录下面的某个文件内具有 mail 这个关键字，你想要将该文件捉出来进行查询修改的动作。此时你怎么找出来含有这个关键字的文件？你当然可以一个文件一个文件的打开，然后去搜寻 mail 这个关键字，只是.....该目录下面的文件可能不止 100 个说～如果了解正则表达式的相关技巧，那么只要一行指令就找出来啦：“grep 'mail' /lib/systemd/system/*” 那个 grep 就是支持正则表达式的工具程序之一！如何～很简单吧！

谈到这里就得要进一步说明了，正则表达式基本上是一种“表达式”，只要工具程序支持这种表达式，那么该工具程序就可以用来作为正则表达式的字串处理之用。例如 vi, grep, awk,sed 等等工具，因为她们有支持正则表达式，所以，这些工具就可以使用正则表达式的特殊字符来进行字串的处理。但例如 cp, ls 等指令并未支持正则表达式，所以就只能使用 bash 自己本身的万用字符而已。

正则表达式对于系统管理员的用途

那么为何我需要学习正则表达式呢？对于一般使用者来说，由于使用到正则表达式的机会可能不怎么多，因此感受不到他的魅力，不过，对于身为系统管理员的你来说，正则表达式则是一个“不可不学的好东西！” 怎么说呢？由于系统如果在繁忙的情况之下，每天产生的讯息信息会多到你无法想像的地步，而我们也都知道，系统的“错误讯息登录文件（第十八章） ”的内容记载了系统产生的所有讯息，当然，这包含你的系统是否被“入侵”的记录数据。

但是系统的数据量太大了，要身为系统管理员的你每天去看这么多的讯息数据，从千百行的数据里面找出一行有问题的讯息，呵呵～光是用肉眼去看，想不疯掉都很难！这个时候，我们就可以通过“正则表达式”的功能，将这些登录的信息进行处理，仅取出“有问题”的信息来进行分析，哈哈！如此一来，你的系统管理工作将会 “快乐得不得了”啊！当然，正则表达式的优点还不止于此，等你有一定程度的了解之后，你会爱上他喔！

正则表达式的广泛用途

正则表达式除了可以让系统管理员管理主机更为便利之外，事实上，由于正则表达式强大的字串处理能力，目前一堆软件都支持正则表达式呢！最常见的就是“邮件服务器”啦！

如果你留意网际网络上的消息，那么应该不难发现，目前造成网络大塞车的主因之一就是“垃圾/广告信件”了，而如果我们可以在服务器端，就将这些问题邮件剔除的话，用户端就会减少很多不必要的带宽耗损了。那么如何剔除广告信件呢？由于广告信件几乎都有一定的标题或者是内容，因此，只要每次有来信时，都先将来信的标题与内容进行特殊字串的比对，发现有不良信件就予以剔除！嘿！这个工作怎么达到啊？就使用正则表达式啊！目前两大邮件服务器软件 sendmail 与 postfix 以及支持邮件服务器的相关分析软件，都支持正则表达式的比对功能！

当然还不止于此啦，很多的服务器软件都支持正则表达式呢！当然，虽然各家软件都支持他，不过，这些“字串”的比对还是需要系统管理员来加入比对规则的，所以啦！身为系统管理员的你，为了自身的工作以及用户端的需求，正则表达式实在是很需要也很值得学习的一项工具呢！

正则表达式与 Shell 在 Linux 当中的角色定位

说实在的，我们在学数学的时候，一个很重要、但是粉难的东西是一定要“背”的，那就是九九乘法表，背成功了之后，未来在数学应用的路途上，真是一帆风顺啊！这个九九乘法表我们在小学的时候几乎背了一整年才背下来，并不是这么好背的呢！但他却是基础当中的基础！你现在一定受惠相当的多呢 ^_^！

而我们谈到的这个正则表达式，与前一章的 BASH 就有点像是数学的九九乘法表一样，是Linux 基础当中的基础，虽然也是最难的部分，不过，如果学成了之后，一定是“大大的有帮助”的！这就好像是金庸小说里面的学武难关：任督二脉！打通任督二脉之后，武功立刻成倍成长！所以啦，不论是对于系统的认识与系统的管理部分，他都有很棒的辅助啊！请好好的学习这个基础吧！ ^_^

延伸的正则表达式

唔！正则表达式还有分喔？没错喔！正则表达式的字串表示方式依照不同的严谨度而分为：基础正则表达式与延伸正则表达式。延伸型正则表达式除了简单的一组字串处理之外，还可以作群组的字串处理，例如进行搜寻 VBird 或 netman 或 lman 的搜寻，注意，是“或（ or） ”而不是“和（ and） ”的处理，此时就需要延伸正则表达式的帮助啦！借由特殊的“ （”与“ | ”等字符的协助，就能够达到这样的目的！不过，我们在这里主力仅是介绍最基础的基础正则表达式而已啦！好啦！清清脑门，咱们用功去啰！

Tips 有一点要向大家报告的，那就是：“正则表达式与万用字符是完全不一样的东西！” 这很重要喔！因为“万用字符（ wildcard）代表的是 bash 操作接口的一个功能”，但正则表达式则是一种字串处理的表示方式！这两者要分的很清楚才行喔！所以，学习本章，请将前一章bash 的万用字符意义先忘掉吧！

老实说，鸟哥以前刚接触正则表达式时，老想着要将这两者归纳在一起，结果就是...错误认知一大堆～所以才会建议您学习本章先忘记万用字符再来学习吧！

二、基础正则表达式

既然正则表达式是处理字串的一种表示方式，那么对字符排序有影响的语系数据就会对正则表达式的结果有影响！此外，正则表达式也需要支持工具程序来辅助才行！所以，我们这里就先介绍一个最简单的字串撷取功能的工具程序，那就是 grep 啰！前一章已经介绍过 grep的相关选项与参数，本章着重在较进阶的 grep 选项说明啰！介绍完 grep 的功能之后，就进入正则表达式的特殊字符的处理能力了。

1，语系对正则表达式的影响

为什么语系的数据会影响到正则表达式的输出结果呢？我们在第零章计算机概论的文字编码系统里面谈到，文件其实记录的仅有 0 与 1，我们看到的字符文字与数字都是通过编码表转换来的。由于不同语系的编码数据并不相同，所以就会造成数据撷取结果的差异了。举例来说，在英文大小写的编码顺序中，zh_TW.big5 及 C 这两种语系的输出结果分别如下（当然我们用的是伟大祖国的gbk系列编码啦）：

LANG=C 时：0 1 2 3 4 ... A B C D ... Z a b c d ...z

LANG=zh_TW 时：0 1 2 3 4 ... a A b B c C d D ... z Z

上面的顺序是编码的顺序，我们可以很清楚的发现这两种语系明显就是不一样！如果你想要撷取大写字符而使用 [A-Z] 时，会发现 LANG=C 确实可以仅捉到大写字符（因为是连续的），但是如果 LANG=zh_TW.big5 时，就会发现到，连同小写的 b-z 也会被撷取出来！因为就编码的顺序来看， big5 语系可以撷取到“ A b B c C ... z Z ”这一堆字符哩！所以，使用正则表达式时，需要特别留意当时环境的语系为何，否则可能会发现与别人不相同的撷取结果喔！

由于一般我们在练习正则表达式时，使用的是相容于 POSIX 的标准，因此就使用“ C ”这个语系[1]！因此，下面的很多练习都是使用“ LANG=C ”这个语系数据来进行的喔！另外，为了要避免这样编码所造成的英文与数字的撷取问题，因此有些特殊的符号我们得要了解一下的！这些符号主要有下面这些意义：

特殊符号	代表意义
[:alnum:]	代表英文大小写字符及数字，亦即 0-9, A-Z, a-z
[:alpha:]	代表任何英文大小写字符，亦即 A-Z, a-z
[:blank:]	代表空白键与 [Tab] 按键两者
[:cntrl:]	代表键盘上面的控制按键，亦即包括 CR, LF, Tab, Del.. 等等
[:digit:]	代表数字而已，亦即 0-9
[:graph:]	除了空白字符（空白键与 [Tab] 按键）外的其他所有按键
[:lower:]	代表小写字符，亦即 a-z
[:print:]	代表任何可以被打印出来的字符
[:punct:]	代表标点符号（ punctuation symbol），亦即：" ' ? ! ; : # $...
[:upper:]	代表大写字符，亦即 A-Z
[:space:]	任何会产生空白的字符，包括空白键, [Tab], CR 等等
[:xdigit:]	代表 16 进位的数字类型，因此包括： 0-9, A-F, a-f 的数字与字符

尤其上表中的[:alnum:], [:alpha:], [:upper:], [:lower:], [:digit:] 这几个一定要知道代表什么意思，因为他要比 a-z 或 A-Z 的用途要确定的很！好了，下面就让我们开始来玩玩进阶版的grep 吧！

2，grep 的一些进阶选项

我们在第十章 BASH 里面的 grep 谈论过一些基础用法，但其实 grep 还有不少的进阶用法喔！下面我们仅列出较进阶的 grep 选项与参数给大家参考，基础的 grep 用法请参考前一章的说明啰！

[dmtsai@study ~]$ grep [-A] [-B] [--color=auto] '搜寻字串' filename

选项与参数：

-A ：后面可加数字，为 after 的意思，除了列出该行外，后续的 n 行也列出来；

-B ：后面可加数字，为 befer 的意思，除了列出该行外，前面的 n 行也列出来；

--color=auto 可将正确的那个撷取数据列出颜色

范例一：用 dmesg 列出核心讯息，再以 grep 找出内含 qxl 那行

[dmtsai@study ~]$ dmesg | grep 'qxl'

[ 0.522749] [drm] qxl: 16M of VRAM memory size

[ 0.522750] [drm] qxl: 63M of IO pages memory ready （ VRAM domain）

[ 0.522750] [drm] qxl: 32M of Surface memory size

[ 0.650714] fbcon: qxldrmfb （ fb0） is primary device

[ 0.668487] qxl 0000:00:02.0: fb0: qxldrmfb frame buffer device

# dmesg 可列出核心产生的讯息！包括硬件侦测的流程也会显示出来。

# 鸟哥使用的显卡是 QXL 这个虚拟卡，通过 grep 来 qxl 的相关信息，可发现如上信息。

范例二：承上题，要将捉到的关键字显色，且加上行号来表示：

[dmtsai@study ~]$ dmesg | grep -n --color=auto 'qxl'

515:[ 0.522749] [drm] qxl: 16M of VRAM memory size

516:[ 0.522750] [drm] qxl: 63M of IO pages memory ready （ VRAM domain）

517:[ 0.522750] [drm] qxl: 32M of Surface memory size

529:[ 0.650714] fbcon: qxldrmfb （ fb0） is primary device

539:[ 0.668487] qxl 0000:00:02.0: fb0: qxldrmfb frame buffer device

# 除了 qxl 会有特殊颜色来表示之外，最前面还有行号喔！其实颜色显示已经是默认在 alias 当中了！

范例三：承上题，在关键字所在行的前两行与后三行也一起捉出来显示

[dmtsai@study ~]$ dmesg | grep -n -A3 -B2 --color=auto 'qxl'

# 你会发现关键字之前与之后的数行也被显示出来！这样可以让你将关键字前后数据捉出来进行分析啦！

grep 是一个很常见也很常用的指令，他最重要的功能就是进行字串数据的比对，然后将符合使用者需求的字串行印出来。需要说明的是“grep 在数据中查寻一个字串时，是以 "整行" 为单位来进行数据的撷取的！”也就是说，假如一个文件内有 10 行，其中有两行具有你所搜寻的字串，则将那两行显示在屏幕上，其他的就丢弃了！

在 CentOS 7 当中，默认已经将 --color=auto 加入在 alias 当中了！使用者就可以直接使用有关键字显色的 grep 啰！非常方便！

3，基础正则表达式练习

要了解正则表达式最简单的方法就是由实际练习去感受啦！所以在汇整正则表达式特殊符号前，我们先以下面这个文件的内容来进行正则表达式的理解吧！先说明一下，下面的练习大前提是：

语系已经使用“ export LANG=C; export LC_ALL=C ”的设置值；

grep 已经使用 alias 设置成为“ grep --color=auto ”

至于本章的练习用文件请由下面的链接来下载。需要特别注意的是，下面这个文件是鸟哥在MS Windows 系统下编辑的，并且已经特殊处理过，因此，他虽然是纯文本文件，但是内含一些 Windows 系统下的软件常常自行加入的一些特殊字符，例如断行字符（ ^M）就是一例！所以，你可以直接将下面的文字以 vi 储存成 regular_express.txt 这个文件，不过，还是比较建议直接点下面的链接：

http://linux.vbird.org/linux_basic/0330regularex/regular_express.txt

如果你的 Linux 可以直接连上 Internet 的话，那么使用如下的指令来捉取即可：

wget http://linux.vbird.org/linux_basic/0330regularex/regular_express.txt

至于这个文件的内容如下：

[dmtsai@study ~]$ vi regular_express.txt

"Open Source" is a good mechanism to develop programs.

apple is my favorite food.

Football game is not use feet only.

this dress doesn't fit me.

However, this dress is about $ 3183 dollars.^M

GNU is free air not free beer.^M

Her hair is very beauty.^M

I can't finish the test.^M

Oh! The soup taste good.^M

motorcycle is cheap than car.

This window is clear.

the symbol '*' is represented as start.

Oh! My god!

The gd software is a library for drafting programs.^M

You are the best is mean you are the no. 1.

The world is the same with "glad".

I like dog.

google is the best tools for search keyword.

goooooogle yes!

go! go! Let's go.

# I am VBird

这文件共有 22 行，最下面一行为空白行！现在开始我们一个案例一个案例的来介绍吧！

例题一、搜寻特定字串

搜寻特定字串很简单吧？假设我们要从刚刚的文件当中取得 the 这个特定字串，最简单的方式就是这样：

[dmtsai@study ~]$ grep -n 'the' regular_express.txt

8:I can't finish the test.

12:the symbol '*' is represented as start.

15:You are the best is mean you are the no. 1.

16:The world is the same with "glad".

18:google is the best tools for search keyword.

那如果想要“反向选择”呢？也就是说，当该行没有 'the' 这个字串时才显示在屏幕上，那就直接使用：

[dmtsai@study ~]$ grep -vn 'the' regular_express.txt

你会发现，屏幕上出现的行列为除了 8,12,15,16,18 五行之外的其他行列！接下来，如果你想要取得不论大小写的 the 这个字串，则：

[dmtsai@study ~]$ grep -in 'the' regular_express.txt

8:I can't finish the test.

9:Oh! The soup taste good.

12:the symbol '*' is represented as start.

14:The gd software is a library for drafting programs.

15:You are the best is mean you are the no. 1.

16:The world is the same with "glad".

18:google is the best tools for search keyword.

除了多两行（ 9, 14行）之外，第 16 行也多了一个 The 的关键字被撷取到喔！

例题二、利用中括号 [] 来搜寻集合字符

如果我想要搜寻 test 或 taste 这两个单字时，可以发现到，其实她们有共通的 't?st' 存在～这个时候，我可以这样来搜寻：

[dmtsai@study ~]$ grep -n 't[ae]st' regular_express.txt

8:I can't finish the test.

9:Oh! The soup taste good.

了解了吧？其实 [] 里面不论有几个字符，他都仅代表某“一个”字符，所以，上面的例子说明了，我需要的字串是“tast”或“test”两个字串而已！而如果想要搜寻到有 oo 的字符时，则使用：

[dmtsai@study ~]$ grep -n 'oo' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

2:apple is my favorite food.

3:Football game is not use feet only.

9:Oh! The soup taste good.

18:google is the best tools for search keyword.

19:goooooogle yes!

但是，如果我不想要 oo 前面有 g 的话呢？此时，可以利用在集合字符的反向选择来达成：

[dmtsai@study ~]$ grep -n '[^g]oo' regular_express.txt

2:apple is my favorite food.

3:Football game is not use feet only.

18:google is the best tools for search keyword.

19:goooooogle yes!

意思就是说，我需要的是 oo ，但是 oo 前面不能是 g 就是了！仔细比较上面两个表格，你会发现，第 1,9 行不见了，因为 oo 前面出现了 g 所致！第 2,3 行没有疑问，因为 foo 与 Foo 均可被接受！但是第 18 行明明有 google 的 goo 啊～别忘记了，因为该行后面出现了 tool 的too 啊！所以该行也被列出来～也就是说， 18 行里面虽然出现了我们所不要的项目（ goo）但是由于有需要的项目（ too），因此，是符合字串搜寻的喔！

至于第 19 行，同样的，因为 goooooogle 里面的 oo 前面可能是 o ，例如： go（ ooo） oogle，所以，这一行也是符合需求的！

再来，假设我 oo 前面不想要有小写字符，所以，我可以这样写 abcd....zoo ，但是这样似乎不怎么方便，由于小写字符的 ASCII 上编码的顺序是连续的，因此，我们可以将之简化为下面这样：

[dmtsai@study ~]$ grep -n '[^a-z]oo' regular_express.txt

3:Football game is not use feet only.

也就是说，当我们在一组集合字符中，如果该字符组是连续的，例如大写英文/小写英文/数字等等，就可以使用[a-z],[A-Z],[0-9]等方式来书写，那么如果我们的要求字串是数字与英文呢？呵呵！就将他全部写在一起，变成：[a-zA-Z0-9]。例如，我们要取得有数字的那一行，就这样：

[dmtsai@study ~]$ grep -n '[0-9]' regular_express.txt

5:However, this dress is about $ 3183 dollars.

15:You are the best is mean you are the no. 1.

但由于考虑到语系对于编码顺序的影响，因此除了连续编码使用减号“ - ”之外，你也可以使用如下的方法来取得前面两个测试的结果：

[dmtsai@study ~]$ grep -n '[^[:lower:]]oo' regular_express.txt

# 那个 [:lower:] 代表的就是 a-z 的意思！请参考前两小节的说明表格

[dmtsai@study ~]$ grep -n '[[:digit:]]' regular_express.txt

啥？上头在写啥东西呢？不要害怕！分开来瞧一瞧。我们知道 [:lower:] 就是 a-z 的意思，那么 [a-z] 当然就是 [[:lower:]] 啰（这个部分应该算linux比较有特色的东东啦）！鸟哥第一次接触正则表达式的时候，看到两层中括号差点昏倒～完全看不懂！现在，请注意那个叠代的意义，自然就能够比较清楚了解啰！

这样对于 [] 以及以及 [] 当中的 - ，还有关于前面表格提到的特殊关键字有了解了吗？^_^！

例题三、行首与行尾字符 ^ $

我们在例题一当中，可以查询到一行字串里面有 the 的，那如果我想要让 the 只在行首列出呢？这个时候就得要使用定位字符了！我们可以这样做：

[dmtsai@study ~]$ grep -n '^the' regular_express.txt

12:the symbol '*' is represented as start.

此时，就只剩下第 12 行，因为只有第 12 行的行首是 the 开头啊～此外，如果我想要开头是小写字符的那一行就列出呢？可以这样：

[dmtsai@study ~]$ grep -n '^[a-z]' regular_express.txt

2:apple is my favorite food.

4:this dress doesn't fit me.

10:motorcycle is cheap than car.

12:the symbol '*' is represented as start.

18:google is the best tools for search keyword.

19:goooooogle yes!

20:go! go! Let's go.

你可以发现我们可以捉到第一个字符都不是大写的！上面的指令也可以用如下的方式来取代的：

[dmtsai@study ~]$ grep -n '^[[:lower:]]' regular_express.txt

好！那如果我不想要开头是英文字母，则可以是这样：

[dmtsai@study ~]$ grep -n '^[^a-zA-Z]' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

21:# I am VBird

# 指令也可以是： grep -n '^[^[:alpha:]]' regular_express.txt

注意到了吧？那个 ^ 符号，在字符集合符号（括号[]）之内与之外是不同的！在 [] 内代表“反向选择”，在 [] 之外则代表定位在行首的意义！要分清楚喔！反过来思考，那如果我想要找出来，行尾结束为小数点（ .）的那一行，该如何处理：

[dmtsai@study ~]$ grep -n '\.$' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

2:apple is my favorite food.

3:Football game is not use feet only.

4:this dress doesn't fit me.

10:motorcycle is cheap than car.

11:This window is clear.

12:the symbol '*' is represented as start.

15:You are the best is mean you are the no. 1.

16:The world is the same with "glad".

17:I like dog.

18:google is the best tools for search keyword.

20:go! go! Let's go.

特别注意到，因为小数点具有其他意义（下面会介绍），所以必须要使用跳脱字符（ \）来加以解除其特殊意义！不过，你或许会觉得奇怪，但是第 5~9 行最后面也是 . 啊～怎么无法打印出来？这里就牵涉到 Windows 平台的软件对于断行字符的判断问题了！我们使用 cat -A将第五行拿出来看，你会发现：

[dmtsai@study ~]$ cat -An regular_express.txt | head -n 10 | tail -n 6

5 However, this dress is about $ 3183 dollars.^M$

6 GNU is free air not free beer.^M$

7 Her hair is very beauty.^M$

8 I can't finish the test.^M$

9 Oh! The soup taste good.^M$

10 motorcycle is cheap than car.$

我们在第九章内谈到过断行字符在 Linux 与 Windows 上的差异，在上面的表格中我们可以发现 5~9 行为 Windows 的断行字符（ ^M$），而正常的 Linux 应该仅有第 10 行显示的那样（ $）。所以啰，那个 . 自然就不是紧接在 $ 之前喔！也就捉不到 5~9 行了！这样可以了解 ^与 $ 的意义吗？好了，先不要看下面的解答，自己想一想，那么如果我想要找出来，哪一行是“空白行”，也就是说，该行并没有输入任何数据，该如何搜寻？

[dmtsai@study ~]$ grep -n '^$' regular_express.txt

22:

因为只有行首跟行尾（ ^$），所以，这样就可以找出空白行啦！再来，假设你已经知道在一个程序脚本（ shell script）或者是配置文件当中，空白行与开头为 # 的那一行是注解，因此如果你要将数据列出给别人参考时，可以将这些数据省略掉以节省保贵的纸张，那么你可以怎么作呢？我们以 /etc/rsyslog.conf 这个文件来作范例，你可以自行参考一下输出的结果：

[dmtsai@study ~]$ cat -n /etc/rsyslog.conf

# 在 CentOS 7 中，结果可以发现有 91 行的输出，很多空白行与 # 开头的注解行

[dmtsai@study ~]$ grep -v '^$' /etc/rsyslog.conf | grep -v '^#'

# 结果仅有 14 行，其中第一个“ -v '^$' ”代表“不要空白行”，

# 第二个“ -v '^#' ”代表“不要开头是 # 的那行”喔！

是否节省很多版面啊？另外，你可能也会问，那为何不要出现 # 的符号的那行就直接舍弃呢？没办法！因为某些注解是与设置写在同一行的后面，如果你只是抓 # 就予以去除，那就会将某些设置也同时移除了！那错误就大了～

例题四、任意一个字符 . 与重复字符 *

在第十章 bash 当中，我们知道万用字符 * 可以用来代表任意（ 0或多个）字符，但是正则表达式并不是万用字符，两者之间是不相同的！至于正则表达式当中的“ . ”则代表“绝对有一个任意字符”的意思！这两个符号在正则表达式的意义如下：

. （小数点）：代表“一定有一个任意字符”的意思；

*（星星号）：代表“重复前一个字符， 0 到无穷多次”的意思，为组合形态

这样讲不好懂，我们直接做个练习吧！假设我需要找出 g??d 的字串，亦即共有四个字符，起头是 g 而结束是 d ，我可以这样做：

[dmtsai@study ~]$ grep -n 'g..d' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

9:Oh! The soup taste good.

16:The world is the same with "glad".

因为强调 g 与 d 之间一定要存在两个字符，因此，第 13 行的 god 与第 14 行的 gd 就不会被列出来啦！再来，如果我想要列出有 oo, ooo, oooo 等等的数据，也就是说，至少要有两个（含） o 以上，该如何是好？是 o 还是 oo 还是 ooo* 呢？虽然你可以试看看结果，不过结果太占版面了 @_@ ，所以，我这里就直接说明。

因为代表的是“重复 0 个或多个前面的 RE 字符”的意义，因此，“o”代表的是：“拥有空字符或一个 o 以上的字符”，特别注意，因为允许空字符（就是有没有字符都可以的意思），因此，“ grep -n 'o*' regular_express.txt ”将会把所有的数据都打印出来屏幕上！

那如果是“oo*”呢？则第一个 o 肯定必须要存在，第二个 o 则是可有可无的多个 o ，所以，凡是含有 o, oo, ooo, oooo 等等，都可以被列出来～

同理，当我们需要“至少两个 o 以上的字串”时，就需要 ooo* ，亦即是：

[dmtsai@study ~]$ grep -n 'ooo*' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

2:apple is my favorite food.

3:Football game is not use feet only.

9:Oh! The soup taste good.

18:google is the best tools for search keyword.

19:goooooogle yes!

这样理解 * 的意义了吗？好了，现在出个练习，如果我想要字串开头与结尾都是 g，但是两个g 之间仅能存在至少一个 o ，亦即是 gog, goog, gooog.... 等等，那该如何？

[dmtsai@study ~]$ grep -n 'goo*g' regular_express.txt

18:google is the best tools for search keyword.

19:goooooogle yes!

如此了解了吗？再来一题，如果我想要找出 g 开头与 g 结尾的字串，当中的字符可有可无，那该如何是好？是“g*g”吗？

[dmtsai@study ~]$ grep -n 'g*g' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

3:Football game is not use feet only.

9:Oh! The soup taste good.

13:Oh! My god!

14:The gd software is a library for drafting programs.

16:The world is the same with "glad".

17:I like dog.

18:google is the best tools for search keyword.

19:goooooogle yes!

20:go! go! Let's go.

但测试的结果竟然出现这么多行？太诡异了吧？其实一点也不诡异，因为 gg 里面的 g 代表“空字符或一个以上的 g” 在加上后面的 g ，因此，整个 RE 的内容就是 g, gg, ggg, gggg ，因此，只要该行当中拥有一个以上的 g 就符合所需了！

那该如何得到我们的 g....g 的需求呢？呵呵！就利用任意一个字符“.”啊！亦即是：“g.g”的作法，因为可以是 0 或多个重复前面的字符，而 . 是任意字符，所以： “.* 就代表零个或多个任意字符”的意思啦！

[dmtsai@study ~]$ grep -n 'g.*g' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

14:The gd software is a library for drafting programs.

18:google is the best tools for search keyword.

19:goooooogle yes!

20:go! go! Let's go.

因为是代表 g 开头与 g 结尾，中间任意字符均可接受，所以，第 1, 14, 20 行是可接受的喔！这个 .* 的 RE 表示任意字符是很常见的，希望大家能够理解并且熟悉！再出一题，如果我想要找出“任意数字”的行列呢？因为仅有数字，所以就成为：

[dmtsai@study ~]$ grep -n '[0-9][0-9]*' regular_express.txt

5:However, this dress is about $ 3183 dollars.

15:You are the best is mean you are the no. 1.

虽然使用 grep -n '[0-9]' regular_express.txt 也可以得到相同的结果，但鸟哥希望大家能够理解上面指令当中 RE 表达式的意义才好！

例题五、限定连续 RE 字符范围 {}

在上个例题当中，我们可以利用 . 与 RE 字符及 * 来设置 0 个到无限多个重复字符，那如果我想要限制一个范围区间内的重复字符数呢？举例来说，我想要找出两个到五个 o 的连续字串，该如何作？这时候就得要使用到限定范围的字符 {} 了。但因为 { 与 } 的符号在 shell 是有特殊意义的，因此，我们必须要使用跳脱字符 \ 来让他失去特殊意义才行。至于 {} 的语法是这样的，假设我要找到两个 o 的字串，可以是：

[dmtsai@study ~]$ grep -n 'o\{2\}' regular_express.txt

1:"Open Source" is a good mechanism to develop programs.

2:apple is my favorite food.

3:Football game is not use feet only.

9:Oh! The soup taste good.

18:google is the best tools for search keyword.

19:goooooogle yes!

这样看似乎与 ooo* 的字符没有什么差异啊？因为第 19 行有多个 o 依旧也出现了！好，那么换个搜寻的字串，假设我们要找出 g 后面接 2 到 5 个 o ，然后再接一个 g 的字串，他会是这样：

[dmtsai@study ~]$ grep -n 'go\{2,5\}g' regular_express.txt

18:google is the best tools for search keyword.

嗯！很好！第 19 行终于没有被取用了（因为 19 行有 6 个 o 啊！）。那么，如果我想要的是2 个 o 以上的 goooo....g 呢？除了可以是 gooo*g ，也可以是：

[dmtsai@study ~]$ grep -n 'go\{2,\}g' regular_express.txt

18:google is the best tools for search keyword.

19:goooooogle yes!

呵呵！就可以找出来啦～

4，基础正则表达式字符汇整（ characters）

经过了上面的几个简单的范例，我们可以将基础的正则表达式特殊字符汇整如下：

RE 字符	意义与范例
^word	意义：待搜寻的字串（ word）在行首！范例：搜寻行首为 # 开始的那一行，并列出行号 > grep -n '^#' regular_express.txt
word$	意义：待搜寻的字串（ word）在行尾！范例：将行尾为 ! 的那一行打印出来，并列出行号 > grep -n '!$' regular_express.txt
.	意义：代表“一定有一个任意字符”的字符！范例：搜寻的字串可以是（ eve）（ eae）（ eee）（ e e），但不能仅有（ ee）！亦即 e 与 e 中间“一定”仅有一个字符，而空白字符也是字符！ > grep -n 'e.e' regular_express.txt
\	意义：跳脱字符，将特殊符号的特殊意义去除！范例：搜寻含有单引号 ' 的那一行！ > grep -n \' regular_express.txt
*	意义：重复零个到无穷多个的前一个 RE 字符范例：找出含有（ es）（ ess）（ esss）等等的字串，注意，因为可以是 0 个，所以 es 也是符合带搜寻字串。另外，因为为重复“前一个 RE 字符”的符号，因此，在之前必须要紧接着一个 RE 字符喔！例如任意字符则为 “.” ！> grep -n 'ess*' regular_express.txt
[list]	意义：字符集合的 RE 字符，里面列出想要撷取的字符！范例：搜寻含有（ gl）或（ gd）的那一行，需要特别留意的是，在 [] 当中“谨代表一个待搜寻的字符”，例如“ a[afl]y ”代表搜寻的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f或 l 的意思！ > grep -n 'g[ld]' regular_express.txt
[n1-n2]	意义：字符集合的 RE 字符，里面列出想要撷取的字符范围！范例：搜寻含有任意数字的那一行！需特别留意，在字符集合 [] 中的减号 - 是有特殊意义的，他代表两个字符之间的所有连续字符！但这个连续与否与 ASCII 编码有关，因此，你的编码需要设置正确（在 bash 当中，需要确定 LANG 与 LANGUAGE的变量是否正确！）例如所有大写字符则为 [A-Z]> grep -n '[A-Z]' regular_express.txt
[^list]	意义：字符集合的 RE 字符，里面列出不要的字串或范围！范例：搜寻的字串可以是（ oog）（ ood）但不能是（ oot），那个 ^ 在 [] 内时，代表的意义是“反向选择”的意思。例如，我不要大写字符，则为 [^A-Z]。但是，需要特别注意的是，如果以 grep -n [^A-Z] regular_express.txt 来搜寻，却发现该文件内的所有行都被列出，为什么？因为这个 [^A-Z] 是“非大写字符”的意思，因为每一行均有非大写字符，例如第一行的 "Open Source" 就有 p,e,n,o.... 等等的小写字 > grep -n 'oo[^t]' regular_express.txt
{n,m}	意义：连续 n 到 m 个的“前一个 RE 字符” 意义：若为 {n} 则是连续 n 个的前一个 RE 字符，意义：若是 {n,} 则是连续 n 个以上的前一个 RE 字符！范例：在g 与 g 之间有 2 个到 3 个的 o 存在的字串，亦即（ goog）（ gooog）> grep -n 'go\{2,3\}g' regular_express.txt

再次强调：“正则表达式的特殊字符”与一般在命令行输入指令的“万用字符”并不相同，例如，在万用字符当中的代表的是“ 0 ~ 无限多个字符”的意思，但是在正则表达式当中，则是“重复0 到无穷多个的前一个 RE 字符”的意思～使用的意义并不相同，不要搞混了！

举例来说，不支持正则表达式的 ls 这个工具中，若我们使用 “ls -l ” 代表的是任意文件名的文件，而 “ls -l a ”代表的是以 a 为开头的任何文件名的文件，但在正则表达式中，我们要找到含有以 a 为开头的文件，则必须要这样：（需搭配支持正则表达式的工具）

ls | grep -n '^a.*'

例题：以 ls -l 配合 grep 找出 /etc/ 下面文件类型为链接文件属性的文件名答：由于 ls -l 列出链接文件时标头会是“ lrwxrwxrwx ”，因此使用如下的指令即可找出结果：

> ls -l /etc | grep '^l'

若仅想要列出几个文件，再以“ |wc -l ” 来累加处理即可。

其实博主有写过python的正则表达式，大同小异，仅仅在处理{}之类的部分需要区分是不是要加\进行转义。

5，sed 工具

在了解了一些正则表达式的基础应用之后，再来呢？呵呵～两个东西可以玩一玩的，那就是sed 跟下面会介绍的 awk 了！这两个家伙可是相当的有用的啊！举例来说，鸟哥写的logfile.sh 分析登录文件的小程序（第十八章会谈到），绝大部分分析关键字的取用、统计等等，就是用这两个宝贝蛋来帮我完成的！那么你说，要不要玩一玩啊？^_^

我们先来谈一谈 sed 好了， sed 本身也是一个管线命令，可以分析 standard input 的啦！而且 sed 还可以将数据进行取代、删除、新增、撷取特定行等等的功能呢！很不错吧～我们先来了解一下 sed 的用法，再来聊他的用途好了！

[dmtsai@study ~]$ sed [-nefr] [动作]

选项与参数：

-n ：使用安静（ silent）模式。在一般 sed 的用法中，所有来自 STDIN 的数据一般都会被列出到屏幕上。

但如果加上 -n 参数后，则只有经过 sed 特殊处理的那一行（或者动作）才会被列出来。

-e ：直接在命令行界面上进行 sed 的动作编辑；

-f ：直接将 sed 的动作写在一个文件内， -f filename 则可以执行 filename 内的 sed 动作；

-r ：sed 的动作支持的是延伸型正则表达式的语法。（默认是基础正则表达式语法）

-i ：直接修改读取的文件内容，而不是由屏幕输出。

动作说明： [n1[,n2]]function

n1, n2 ：不见得会存在，一般代表“选择进行动作的行数”，举例来说，如果我的动作是需要在 10 到 20 行之间进行的，则“ 10,20[动作行为] ”

function 有下面这些咚咚：

a ：新增， a 的后面可以接字串，而这些字串会在新的一行出现（目前的下一行）～

c ：取代， c 的后面可以接字串，这些字串可以取代 n1,n2 之间的行！

d ：删除，因为是删除啊，所以 d 后面通常不接任何咚咚；

i ：插入， i 的后面可以接字串，而这些字串会在新的一行出现（目前的上一行）；

p ：打印，亦即将某个选择的数据印出。通常 p 会与参数 sed -n 一起运行～

s ：取代，可以直接进行取代的工作哩！通常这个 s 的动作可以搭配正则表达式！

例如 1,20s/old/new/g 就是啦！

sed 光是用看的是看不懂的啦！所以又要来练习了！先来玩玩删除与新增的功能吧！

范例一：将 /etc/passwd 的内容列出并且打印行号，同时，请将第 2~5 行删除！

[dmtsai@study ~]$ nl /etc/passwd | sed '2,5d'

1 root:x:0:0:root:/root:/bin/bash

6 sync:x:5:0:sync:/sbin:/bin/sync

7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown

.....（后面省略）.....

看到了吧？sed 的动作为 '2,5d' ，那个 d 就是删除！因为 2-5 行给他删除了，所以显示的数据就没有 2-5 行啰～另外，注意一下，原本应该是要下达 sed -e 才对，没有 -e 也行啦！同时也要注意的是， sed 后面接的动作，请务必以 '' 两个单引号括住喔！

如果题型变化一下，举例来说，如果只要删除第 2 行，可以使用“ nl /etc/passwd | sed '2d' ”来达成，至于若是要删除第 3 到最后一行，则是“ nl /etc/passwd | sed '3,$d' ”的啦，那个钱字号“ $ ”代表最后一行！

范例二：承上题，在第二行后（亦即是加在第三行）加上“drink tea?”字样！

[dmtsai@study ~]$ nl /etc/passwd | sed '2a drink tea'

1 root:x:0:0:root:/root:/bin/bash

2 bin:x:1:1:bin:/bin:/sbin/nologin

drink tea

3 daemon:x:2:2:daemon:/sbin:/sbin/nologin

.....（后面省略）.....

嘿嘿！在 a 后面加上的字串就已将出现在第二行后面啰！那如果是要在第二行前呢？“ nl/etc/passwd | sed '2i drink tea' ”就对啦！就是将“ a ”变成“ i ”即可。增加一行很简单，那如果是要增将两行以上呢？

范例三：在第二行后面加入两行字，例如“Drink tea or .....”与“drink beer?”

[dmtsai@study ~]$ nl /etc/passwd | sed '2a Drink tea or ......\

> drink beer ?'

1 root:x:0:0:root:/root:/bin/bash

2 bin:x:1:1:bin:/bin:/sbin/nologin

Drink tea or ......

drink beer ?

3 daemon:x:2:2:daemon:/sbin:/sbin/nologin

.....（后面省略）

这个范例的重点是“我们可以新增不只一行喔！可以新增好几行”但是每一行之间都必须要以反斜线“ \ ”来进行新行的增加喔！所以，上面的例子中，我们可以发现在第一行的最后面就有 \存在啦！在多行新增的情况下， \ 是一定要的喔！

以行为单位的取代与显示功能

刚刚是介绍如何新增与删除，那么如果要整行取代呢？看看下面的范例吧：

范例四：我想将第2-5行的内容取代成为“No 2-5 number”呢？

[dmtsai@study ~]$ nl /etc/passwd | sed '2,5c No 2-5 number'

1 root:x:0:0:root:/root:/bin/bash

No 2-5 number

6 sync:x:5:0:sync:/sbin:/bin/sync

.....（后面省略）.....

通过这个方法我们就能够将数据整行取代了！非常容易吧！sed 还有更好用的东东！我们以前想要列出第 11~20 行，得要通过“head -n 20 | tail -n 10”之类的方法来处理，很麻烦啦～ sed则可以简单的直接取出你想要的那几行！是通过行号来捉的喔！看看下面的范例先：

范例五：仅列出 /etc/passwd 文件内的第 5-7 行

[dmtsai@study ~]$ nl /etc/passwd | sed -n '5,7p'

5 lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

6 sync:x:5:0:sync:/sbin:/bin/sync

7 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown

上述的指令中有个重要的选项“ -n ”，按照说明文档，这个 -n 代表的是“安静模式”！那么为什么要使用安静模式呢？你可以自行下达 sed '5,7p' 就知道了（5-7 行会重复输出）！有没有加上 -n 的参数时，输出的数据可是差很多的喔！你可以通过这个 sed 的以行为单位的显示功能，就能够将某一个文件内的某些行号捉出来查阅！很棒的功能！不是吗？

部分数据的搜寻并取代的功能

除了整行的处理模式之外， sed 还可以用行为单位进行部分数据的搜寻并取代的功能喔！基本上 sed 的搜寻与取代的与 vi 相当的类似！他有点像这样：

sed 's/要被取代的字串/新的字串/g'

上表中特殊字体的部分为关键字，请记下来！至于三个斜线分成两栏就是新旧字串的替换啦！我们使用下面这个取得 IP 数据的范例，一段一段的来处理给您瞧瞧，让你了解一下什么是咱们所谓的搜寻并取代吧！

步骤一：先观察原始讯息，利用 /sbin/ifconfig 查询 IP 为何？

[dmtsai@study ~]$ /sbin/ifconfig eth0

eth0: flags=4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500

inet 192.168.1.100 netmask 255.255.255.0 broadcast 192.168.1.255

inet6 fe80::5054:ff:fedf:e174 prefixlen 64 scopeid 0x20<link>

ether 52:54:00:df:e1:74 txqueuelen 1000 （Ethernet）

.....（以下省略）.....

# 因为我们还没有讲到 IP ，这里你先有个概念即可啊！我们的重点在第二行，

# 也就是 192.168.1.100 那一行而已！先利用关键字捉出那一行！

步骤二：利用关键字配合 grep 撷取出关键的一行数据

[dmtsai@study ~]$ /sbin/ifconfig eth0 | grep 'inet '

inet 192.168.1.100 netmask 255.255.255.0 broadcast 192.168.1.255

# 当场仅剩下一行！要注意， CentOS 7 与 CentOS 6 以前的 ifconfig 指令输出结果不太相同，

# 鸟哥这个范例主要是针对 CentOS 7 以后的喔！接下来，我们要将开始到 addr: 通通删除，

# 就是像下面这样：

# inet 192.168.1.100 netmask 255.255.255.0 broadcast 192.168.1.255

# 上面的删除关键在于“ ^.*inet ”啦！正则表达式出现！ ^_^

步骤三：将 IP 前面的部分予以删除

[dmtsai@study ~]$ /sbin/ifconfig eth0 | grep 'inet ' | sed 's/^.*inet //g'

192.168.1.100 netmask 255.255.255.0 broadcast 192.168.1.255

# 仔细与上个步骤比较一下，前面的部分不见了！接下来则是删除后续的部分，亦即：

192.168.1.100 netmask 255.255.255.0 broadcast 192.168.1.255

# 此时所需的正则表达式为：“ ' *netmask.*$ ”就是啦！

步骤四：将 IP 后面的部分予以删除

[dmtsai@study ~]$ /sbin/ifconfig eth0 | grep 'inet ' | sed 's/^.*inet //g' \

> | sed 's/ *netmask.*$//g'

192.168.1.100

通过这个范例的练习也建议您依据此一步骤来研究你的指令！就是先观察，然后再一层一层的试做，如果有做不对的地方，就先予以修改，改完之后测试，成功后再往下继续测试。以鸟哥上面的介绍中，那一大串指令就做了四个步骤！对吧！ ^_^

让我们再来继续研究 sed 与正则表达式的配合练习！假设我只要 MAN 存在的那几行数据，但是含有 # 在内的注解我不想要，而且空白行我也不要！此时该如何处理呢？可以通过这几个步骤来实作看看：

步骤一：先使用 grep 将关键字 MAN 所在行取出来

[dmtsai@study ~]$ cat /etc/man_db.conf | grep 'MAN'

# MANDATORY_MANPATH manpath_element

# MANPATH_MAP path_element manpath_element

# MANDB_MAP global_manpath [relative_catpath]

# every automatically generated MANPATH includes these fields

....（后面省略）....

步骤二：删除掉注解之后的数据！

[dmtsai@study ~]$ cat /etc/man_db.conf | grep 'MAN' | sed 's/#.*$//g'

MANDATORY_MANPATH /usr/man

....（后面省略）....

# 从上面可以看出来，原本注解的数据都变成空白行啦！所以，接下来要删除掉空白行

[dmtsai@study ~]$ cat /etc/man_db.conf | grep 'MAN' | sed 's/#.*$//g' | sed '/^$/d'

MANDATORY_MANPATH /usr/man

MANDATORY_MANPATH /usr/share/man

MANDATORY_MANPATH /usr/local/share/man

....（后面省略）....

直接修改文件内容（危险动作）

你以为 sed 只有这样的能耐吗？那可不！ sed 甚至可以直接修改文件的内容呢！而不必使用管线命令或数据流重导向！不过，由于这个动作会直接修改到原始的文件，所以请你千万不要随便拿系统配置文件来测试喔！我们还是使用你下载的 regular_express.txt 文件来测试看看吧！

范例六：利用 sed 将 regular_express.txt 内每一行结尾若为 . 则换成 !

[dmtsai@study ~]$ sed -i 's/\.$/\!/g' regular_express.txt

# 上头的 -i 选项可以让你的 sed 直接去修改后面接的文件内容而不是由屏幕输出喔！

# 这个范例是用在取代！请您自行 cat 该文件去查阅结果啰！

范例七：利用 sed 直接在 regular_express.txt 最后一行加入“# This is a test”

[dmtsai@study ~]$ sed -i '$a # This is a test' regular_express.txt

# 由于 $ 代表的是最后一行，而 a 的动作是新增，因此该文件最后新增啰！

sed 的“ -i ”选项可以直接修改文件内容，这功能非常有帮助！举例来说，如果你有一个 100 万行的文件，你要在第 100 行加某些文字，此时使用 vim 可能会疯掉！因为文件太大了！那怎办？就利用 sed 啊！通过 sed 直接修改/取代的功能，你甚至不需要使用 vim 去修订！很棒吧！

总之，这个 sed 不错用啦！而且很多的 shell script 都会使用到这个指令的功能～ sed 可以帮助系统管理员管理好日常的工作喔！要仔细的学习呢！

三，延伸正则表达式

事实上，一般读者只要了解基础型的正则表达式大概就已经相当足够了，不过，某些时刻为了要简化整个指令操作，了解一下使用范围更广的延伸型正则表达式的表示式会更方便呢！举个简单的例子好了，在上节的例题三的最后一个例子中，我们要去除空白行与行首为 # 的行列，使用的是

grep -v '^$' regular_express.txt | grep -v '^#'

需要使用到管线命令来搜寻两次！那么如果使用延伸型的正则表达式，我们可以简化为

egrep -v '^$|^#' regular_express.txt

延伸型正则表达式可以通过群组功能“ | ”来进行一次搜寻！那个在单引号内的管线意义为“或or”啦！是否变的更简单呢？此外，grep 默认仅支持基础正则表达式，如果要使用延伸型正则表达式，你可以使用 grep -E ，不过更建议直接使用 egrep ！直接区分指令比较好记忆！其实 egrep 与 grep -E 是类似命令别名的关系啦！

熟悉了正则表达式之后，到这个延伸型的正则表达式，你应该也会想到，不就是多几个重要的特殊符号吗？ ^^y 是的～所以，我们就直接来说明一下，延伸型正则表达式有哪几个特殊符号？由于下面的范例还是有使用到 regular_express.txt ，不巧的是刚刚我们可能将该文件修改过了 @@，所以，请重新下载该文件来练习喔！

RE字符	意义与范例
+	意义：重复“一个或一个以上”的前一个 RE 字符范例：搜寻（god）（good）（goood）... 等等的字串。那个 o+ 代表“一个以上的 o ”所以，下面的执行成果会将第 1, 9, 13 行列出来。 > egrep -n 'go+d' regular_express.txt
?	意义：“零个或一个”的前一个 RE 字符范例：搜寻（gd）（god）这两个字串。那个 o? 代表“空的或 1 个 o ”所以，上面的执行成果会将第 13, 14 行列出来。有没有发现到，这两个案例（ 'go+d' 与 'go?d' ）的结果集合与 'go*d' 相同？想想看，这是为什么喔！ ^_^ > egrep -n 'go?d' regular_express.txt
\|	意义：用或（ or ）的方式找出数个字串范例：搜寻 gd 或 good 这两个字串，注意，是“或”！所以，第 1,9,14 这三行都可以被打印出来喔！那如果还想要找出dog 呢？ > egrep -n 'gd\|good' regular_express.txt> egrep -n 'gd\|good\|dog' regular_express.txt
（）	意义：找出“群组”字串范例：搜寻（glad）或（good）这两个字串，因为 g 与d 是重复的，所以，我就可以将 la 与 oo 列于（）当中，并以 \| 来分隔开来，就可以啦！ > egrep -n 'g（la\|oo）d' regular_express.txt
（）+	意义：多个重复群组的判别范例：将“AxyzxyzxyzxyzC”用 echo 叫出，然后再使用如下的方法搜寻一下！ > echo 'AxyzxyzxyzxyzC' \| egrep 'A（xyz）+C'

上面的例子意思是说，我要找开头是 A 结尾是 C ，中间有一个以上的 "xyz" 字串的意思～

以上这些就是延伸型的正则表达式的特殊字符。另外，要特别强调的是，那个 ! 在正则表达式当中并不是特殊字符，所以，如果你想要查出来文件中含有 ! 与 > 的字行时，可以这样：

> grep -n '[!>]' regular_express.txt

这样可以了解了吗？常常看到有陷阱的题目写：“反向选择这样对否？ '[!a-z]'？”，呵呵！是错的呦～要 'a-z 才是对的！至于更多关于正则表达式的进阶文章，请参考文末的参考数据[2]

四、文件的格式化与相关操作

接下来让我们来将文件进行一些简单的编排吧！下面这些动作可以将你的讯息进行排版的动作，不需要重新以 vim 去编辑，通过数据流重导向配合下面介绍的 printf 功能，以及 awk 指令，就可以让你的讯息以你想要的模样来输出了！试看看吧！

1，格式化打印： printf

在很多时候，我们可能需要将自己的数据给他格式化输出的！举例来说，考试卷分数的输出，姓名与科目及分数之间，总是可以稍微作个比较漂亮的版面配置吧？例如我想要输出下面的样式：

Name Chinese English Math Average

DmTsai 80 60 92 77.33

VBird 75 55 80 70.00

Ken 60 90 70 73.33

上表的数据主要分成五个字段，各个字段之间可使用 tab 或空白键进行分隔。请将上表的数据转存成为 printf.txt 文件名，等一下我们会利用这个文件来进行几个小练习的。因为每个字段的原始数据长度其实并非是如此固定的（ Chinese 长度就是比 Name 要多），而我就是想要如此表示出这些数据，此时，就得需要打印格式管理员 printf 的帮忙了！ printf 可以帮我们将数据输出的结果格式化，而且而支持一些特殊的字符～下面我们就来看看！

[dmtsai@study ~]$ printf '打印格式' 实际内容

选项与参数：

关于格式方面的几个特殊样式：

\a 警告声音输出

\b 倒退键（ backspace）

\f 清除屏幕（ form feed）

\n 输出新的一行

\r 亦即 Enter 按键

\t 水平的 [tab] 按键

\v 垂直的 [tab] 按键

\xNN NN 为两位数的数字，可以转换数字成为字符。

关于 C 程序语言内，常见的变量格式

%ns 那个 n 是数字， s 代表 string ，亦即多少个字符；

%ni 那个 n 是数字， i 代表 integer ，亦即多少整数码数；

%N.nf 那个 n 与 N 都是数字， f 代表 floating （浮点），如果有小数码数，

假设我共要十个位数，但小数点有两位，即为 %10.2f 啰！

接下来我们来进行几个常见的练习。假设所有的数据都是一般文字（这也是最常见的状态），因此最常用来分隔数据的符号就是 [Tab] 啦！因为 [Tab] 按键可以将数据作个整齐的排列！那么如何利用 printf 呢？参考下面这个范例：

范例一：将刚刚上头数据的文件（ printf.txt）内容仅列出姓名与成绩：（用 [tab] 分隔）

[dmtsai@study ~]$ printf '%s\t %s\t %s\t %s\t %s\t \n' $（ cat printf.txt）

Name Chinese English Math Average

DmTsai 80 60 92 77.33

VBird 75 55 80 70.00

Ken 60 90 70 73.33

由于 printf 并不是管线命令，因此我们得要通过类似上面的功能，将文件内容先提出来给printf 作为后续的数据才行。如上所示，我们将每个数据都以 [tab] 作为分隔，但是由于Chinese 长度太长，导致 English 中间多了一个 [tab] 来将数据排列整齐！啊～结果就看到数据对齐结果的差异了！

另外，在 printf 后续的那一段格式中，%s 代表一个不固定长度的字串，而字串与字串中间就以 \t 这个 [tab] 分隔符号来处理！你要记得的是，由于 \t 与 %s 中间还有空格，因此每个字串间会有一个 [tab] 与一个空白键的分隔喔！

既然每个字段的长度不固定会造成上述的困扰，那我将每个字段固定就好啦！没错没错！这样想非常好！所以我们就将数据给他进行固定字段长度的设计吧！

范例二：将上述数据关于第二行以后，分别以字串、整数、小数点来显示：

[dmtsai@study ~]$ printf '%10s %5i %5i %5i %8.2f \n' $（ cat printf.txt | grep -v Name）

DmTsai 80 60 92 77.33

VBird 75 55 80 70.00

Ken 60 90 70 73.33

上面这一串格式想必您看得很辛苦！没关系！一个一个来解释！上面的格式共分为五个字段， %10s 代表的是一个长度为 10 个字符的字串字段，%5i 代表的是长度为 5 个字符的数字字段，至于那个 %8.2f 则代表长度为 8 个字符的具有小数点的字段，其中小数点有两个字符宽度。我们可以使用下面的说明来介绍 %8.2f 的意义：

字符宽度： 12345678 %8.2f意义：00000.00

如上所述，全部的宽度仅有 8 个字符，整数部分占有 5 个字符，小数点本身（ .）占一位，小数点下的位数则有两位。这种格式经常使用于数值程序的设计中！这样了解乎？自己试看看如果要将小数点位数变成 1 位又该如何处理？

printf 除了可以格式化处理之外，他还可以依据 ASCII 的数字与图形对应来显示数据喔[3]！举例来说 16 进位的 45 可以得到什么 ASCII 的显示图（其实是字符啦）？

范例三：列出 16 进位数值 45 代表的字符为何？

[dmtsai@study ~]$ printf '\x45\n'

# 这东西也很好玩～他可以将数值转换成为字符，如果你会写 script 的话，

# 可以自行测试一下，由 20~80 之间的数值代表的字符是啥喔！ ^_^

printf 的使用相当的广泛喔！包括等一下后面会提到的 awk 以及在 C 程序语言当中使用的屏幕输出，都是利用 printf 呢！鸟哥这里也只是列出一些可能会用到的格式而已，有兴趣的话，可以自行多作一些测试与练习喔！ ^_^

Tips 打印格式化这个 printf 指令，乍看之下好像也没有什么很重要的～不过，如果你需要自行撰写一些软件，需要将一些数据在屏幕上头漂漂亮亮的输出的话，那么 printf 可也是一个很棒的工具喔！

2，awk：好用的数据处理工具

awk 也是一个非常棒的数据处理工具！相较于 sed 常常作用于一整个行的处理， awk 则比较倾向于一行当中分成数个“字段”来处理。因此，awk 相当的适合处理小型的数据数据处理呢！awk 通常运行的模式是这样的：

[dmtsai@study ~]$ awk '条件类型1{动作1} 条件类型2{动作2} ...' filename

awk 后面接两个单引号并加上大括号 {} 来设置想要对数据进行的处理动作。 awk 可以处理后续接的文件，也可以读取来自前个指令的 standard output 。但如前面说的， awk 主要是处理“每一行的字段内的数据”，而默认的“字段的分隔符号为 "空白键" 或 "[tab]键" ”！举例来说，我们用 last 可以将登陆者的数据取出来，结果如下所示：

[dmtsai@study ~]$ last -n 5 #==仅取出前五行

dmtsai pts/0 192.168.1.100 Tue Jul 14 17:32 still logged in

dmtsai pts/0 192.168.1.100 Thu Jul 9 23:36 - 02:58 （03:22）

dmtsai pts/0 192.168.1.100 Thu Jul 9 17:23 - 23:36 （06:12）

dmtsai pts/0 192.168.1.100 Thu Jul 9 08:02 - 08:17 （00:14）

dmtsai tty1 Fri May 29 11:55 - 12:11 （00:15）

若我想要取出帐号与登陆者的 IP ，且帐号与 IP 之间以 [tab] 隔开，则会变成这样：

[dmtsai@study ~]$ last -n 5 | awk '{print $1 "\t" $3}'

dmtsai 192.168.1.100

dmtsai Fri

上表是 awk 最常使用的动作！通过 print 的功能将字段数据列出来！字段的分隔则以空白键或[tab] 按键来隔开。因为不论哪一行我都要处理，因此，就不需要有 "条件类型" 的限制！我所想要的是第一栏以及第三栏，但是，第五行的内容怪怪的～这是因为数据格式的问题啊！所以啰～使用 awk 的时候，请先确认一下你的数据当中，如果是连续性的数据，请不要有空格或 [tab] 在内，否则，就会像这个例子这样，会发生误判喔！

另外，由上面这个例子你也会知道，在 awk 的括号内，每一行的每个字段都是有变量名称的，那就是 $1, $2... 等变量名称。以上面的例子来说， dmtsai 是 $1 ，因为他是第一栏嘛！至于 192.168.1.100 是第三栏，所以他就是 $3 啦！后面以此类推～呵呵！还有个变量喔！那就是 $0 ，$0 代表“一整列数据”的意思～以上面的例子来说，第一行的 $0 代表的就是“dmtsai.... ”那一行啊！由此可知，刚刚上面五行当中，整个 awk 的处理流程是

1. 读入第一行，并将第一行的数据填入 $0, $1, $2.... 等变量当中；

2. 依据 "条件类型" 的限制，判断是否需要进行后面的 "动作"；

3. 做完所有的动作与条件类型；

4. 若还有后续的“行”的数据，则重复上面 1~3 的步骤，直到所有的数据都读完为止。

经过这样的步骤，你会晓得， awk 是“以行为一次处理的单位”，而“以字段为最小的处理单位”。好了，那么 awk 怎么知道我到底这个数据有几行？有几栏呢？这就需要 awk 的内置变量的帮忙啦～

变量名称	代表意义
NF	每一行（$0）拥有的字段总数
NR	目前 awk 所处理的是“第几行”数据
FS	目前的分隔字符，默认是空白键

我们继续以上面 last -n 5 的例子来做说明，如果我想要：

列出每一行的帐号（就是 $1）；

列出目前处理的行数（就是 awk 内的 NR 变量）

并且说明，该行有多少字段（就是 awk 内的 NF 变量）

Tips 要注意喔，awk 后续的所有动作是以单引号“ ' ”括住的，由于单引号与双引号都必须是成对的，所以， awk 的格式内容如果想要以 print 打印时，记得非变量的文字部分，包含上一小节 printf 提到的格式中，都需要使用双引号来定义出来喔！因为单引号已经是 awk 的指令固定用法了！

[dmtsai@study ~]$ last -n 5 | awk '{print $1 "\t lines: " NR "\t columns: " NF}'

dmtsai lines: 1 columns: 10

dmtsai lines: 2 columns: 10

dmtsai lines: 3 columns: 10

dmtsai lines: 4 columns: 10

dmtsai lines: 5 columns: 9

# 注意喔，在 awk 内的 NR, NF 等变量要用大写，且不需要有钱字号 $ 啦！

这样可以了解 NR 与 NF 的差别了吧？好了，下面来谈一谈所谓的 "条件类型" 了吧！

awk 的逻辑运算字符

既然有需要用到 "条件" 的类别，自然就需要一些逻辑运算啰～例如下面这些：

运算单元	代表意义
>	大于
<	小于
>=	大于或等于
<=	小于或等于
==	等于
!=	不等于

值得注意的是那个“ == ”的符号，因为：

逻辑运算上面亦即所谓的大于、小于、等于等判断式上面，习惯上是以“ == ”来表示；

如果是直接给予一个值，例如变量设置时，就直接使用 = 而已。

好了，我们实际来运用一下逻辑判断吧！举例来说，在 /etc/passwd 当中是以冒号 ":" 来作为字段的分隔，该文件中第一字段为帐号，第三字段则是 UID。那假设我要查阅，第三栏小于10 以下的数据，并且仅列出帐号与第三栏，那么可以这样做：

[dmtsai@study ~]$ cat /etc/passwd | awk '{FS=":"} $3 < 10 {print $1 "\t " $3}'

root:x:0:0:root:/root:/bin/bash

bin 1

daemon 2

....（以下省略）....

有趣吧！不过，怎么第一行没有正确的显示出来呢？这是因为我们读入第一行的时候，那些变量 $1, $2... 默认还是以空白键为分隔的，所以虽然我们定义了 FS=":" 了，但是却仅能在第二行后才开始生效。那么怎么办呢？我们可以预先设置 awk 的变量啊！利用 BEGIN 这个关键字喔！这样做：

[dmtsai@study ~]$ cat /etc/passwd | awk 'BEGIN {FS=":"} $3 < 10 {print $1 "\t " $3}'

root 0

bin 1

daemon 2

......（以下省略）......

很有趣吧！而除了 BEGIN 之外，我们还有 END 呢！另外，如果要用 awk 来进行“计算功能”呢？以下面的例子来看，假设我有一个薪资数据表文件名为 pay.txt ，内容是这样的：

Name 1st 2nd 3th

VBird 23000 24000 25000

DMTsai 21000 20000 23000

Bird2 43000 42000 41000

如何帮我计算每个人的总额呢？而且我还想要格式化输出喔！我们可以这样考虑：

第一行只是说明，所以第一行不要进行加总（NR==1 时处理）；

第二行以后就会有加总的情况出现（NR>=2 以后处理）

[dmtsai@study ~]$ cat pay.txt | \

> awk 'NR==1{printf "%10s %10s %10s %10s %10s\n",$1,$2,$3,$4,"Total" }

> NR>=2{total = $2 + $3 + $4

> printf "%10s %10d %10d %10d %10.2f\n", $1, $2, $3, $4, total}'

Name 1st 2nd 3th Total

VBird 23000 24000 25000 72000.00

DMTsai 21000 20000 23000 64000.00

Bird2 43000 42000 41000 126000.00

上面的例子有几个重要事项应该要先说明的：

awk 的指令间隔：所有 awk 的动作，亦即在 {} 内的动作，如果有需要多个指令辅助时，可利用分号“;”间隔，或者直接以 [Enter] 按键来隔开每个指令，例如上面的范例中，鸟哥共按了三次 [enter] 喔！

逻辑运算当中，如果是“等于”的情况，则务必使用两个等号“==”！

格式化输出时，在 printf 的格式设置当中，务必加上 \n ，才能进行分行！

与 bash shell 的变量不同，在 awk 当中，变量可以直接使用，不需加上 $ 符号。

利用 awk 这个玩意儿，就可以帮我们处理很多日常工作了呢！真是好用的很～此外， awk的输出格式当中，常常会以 printf 来辅助，所以，最好你对 printf 也稍微熟悉一下比较好啦！另外， awk 的动作内 {} 也是支持 if （条件）的喔！举例来说，上面的指令可以修订成为这样：

[dmtsai@study ~]$ cat pay.txt | \

> awk '{if（NR==1） printf "%10s %10s %10s %10s %10s\n",$1,$2,$3,$4,"Total"}

> NR>=2{total = $2 + $3 + $4

> printf "%10s %10d %10d %10d %10.2f\n", $1, $2, $3, $4, total}'

你可以仔细的比对一下上面两个输入有啥不同～从中去了解两种语法吧！我个人是比较倾向于使用第一种语法，因为会比较有统一性啊！ ^_^

除此之外， awk 还可以帮我们进行循环计算喔！真是相当的好用！不过，那属于比较进阶的单独课程了，我们这里就不再多加介绍。如果你有兴趣的话，请务必参考延伸阅读中的相关链接喔 [4]。

3，文件比对工具

什么时候会用到文件的比对啊？通常是“同一个套装软件的不同版本之间，比较配置文件与原始文件的差异”。很多时候所谓的文件比对，通常是用在 ASCII 纯文本文件的比对上的！那么比对文件的指令有哪些？最常见的就是 diff 啰！另外，除了 diff 比对之外，我们还可以借由cmp 来比对非纯文本文件！同时，也能够借由 diff 创建的分析档，以处理补丁（patch）功能的文件呢！就来玩玩先

diff

diff 就是用在比对两个文件之间的差异的，并且是以行为单位来比对的！一般是用在 ASCII 纯文本文件的比对上。由于是以行为比对的单位，因此 diff 通常是用在同一的文件（或软件）的新旧版本差异上！举例来说，假如我们要将 /etc/passwd 处理成为一个新的版本，处理方式为：将第四行删除，第六行则取代成为“no six line”，新的文件放置到 /tmp/test 里面，那么应该怎么做？

[dmtsai@study ~]$ mkdir -p /tmp/testpw # ==先创建测试用的目录

[dmtsai@study ~]$ cd /tmp/testpw

[dmtsai@study testpw]$ cp /etc/passwd passwd.old

[dmtsai@study testpw]$ cat /etc/passwd | sed -e '4d' -e '6c no six line' > passwd.new

# 注意一下， sed 后面如果要接超过两个以上的动作时，每个动作前面得加 -e 才行！

# 通过这个动作，在 /tmp/testpw 里面便有新旧的 passwd 文件存在了！

接下来讨论一下关于 diff 的用法吧！

[dmtsai@study ~]$ diff [-bBi] from-file to-file

选项与参数：

from-file ：一个文件名，作为原始比对文件的文件名；

to-file ：一个文件名，作为目的比对文件的文件名；

注意，from-file 或 to-file 可以 - 取代，那个 - 代表“Standard input”之意。

-b ：忽略一行当中，仅有多个空白的差异（例如 "about me" 与 "about me" 视为相同

-B ：忽略空白行的差异。

-i ：忽略大小写的不同。

范例一：比对 passwd.old 与 passwd.new 的差异：

[dmtsai@study testpw]$ diff passwd.old passwd.new

4d3 <==左边第四行被删除（d）掉了，基准是右边的第三行

< adm:x:3:4:adm:/var/adm:/sbin/nologin <==这边列出左边（<）文件被删除的那一行内容

6c5 <==左边文件的第六行被取代（c）成右边文件的第五行

< sync:x:5:0:sync:/sbin:/bin/sync <==左边（<）文件第六行内容

---

> no six line <==右边（>）文件第五行内容

# 很聪明吧！用 diff 就把我们刚刚的处理给比对完毕了！

用 diff 比对文件真的是很简单喔！不过，你不要用 diff 去比对两个完全不相干的文件，因为比不出个啥咚咚！另外， diff 也可以比对整个目录下的差异喔！举例来说，我们想要了解一下不同的开机执行等级（runlevel）内容有啥不同？假设你已经知道执行等级 0 与 5 的启动脚本分别放置到 /etc/rc0.d 及 /etc/rc5.d ，则我们可以将两个目录比对一下：

[dmtsai@study ~]$ diff /etc/rc0.d/ /etc/rc5.d/

Only in /etc/rc0.d/: K90network

Only in /etc/rc5.d/: S10network

我们的 diff 很聪明吧！还可以比对不同目录下的相同文件名的内容，这样真的很方便喔～

cmp

相对于 diff 的广泛用途， cmp 似乎就用的没有这么多了～ cmp 主要也是在比对两个文件，他主要利用“字节”单位去比对，因此，当然也可以比对 binary file 啰～（还是要再提醒喔， diff主要是以“行”为单位比对， cmp 则是以“字节”为单位去比对，这并不相同！）

[dmtsai@study ~]$ cmp [-l] file1 file2

选项与参数：

-l ：将所有的不同点的字节处都列出来。因为 cmp 默认仅会输出第一个发现的不同点。

范例一：用 cmp 比较一下 passwd.old 及 passwd.new

[dmtsai@study testpw]$ cmp passwd.old passwd.new

passwd.old passwd.new differ: char 106, line 4

看到了吗？第一个发现的不同点在第四行，而且字节数是在第 106 个字节处！这个 cmp 也可以用来比对 binary 啦！ ^_^

patch

patch 这个指令与 diff 可是有密不可分的关系啊！我们前面提到，diff 可以用来分辨两个版本之间的差异，举例来说，刚刚我们所创建的 passwd.old 及 passwd.new 之间就是两个不同版本的文件。那么，如果要“升级”呢？就是“将旧的文件升级成为新的文件”时，应该要怎么做呢？其实也不难啦！就是“先比较先旧版本的差异，并将差异档制作成为补丁文件，再由补丁文件更新旧文件”即可。举例来说，我们可以这样做测试：

范例一：以 /tmp/testpw 内的 passwd.old 与 passwd.new 制作补丁文件

[dmtsai@study testpw]$ diff -Naur passwd.old passwd.new > passwd.patch

[dmtsai@study testpw]$ cat passwd.patch

--- passwd.old 2015-07-14 22:37:43.322535054 +0800 <==新旧文件的信息

+++ passwd.new 2015-07-14 22:38:03.010535054 +0800

@@ -1,9 +1,8 @@ <==新旧文件要修改数据的界定范围，旧文件在 1-9 行，新文件在 1-8 行

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

-adm:x:3:4:adm:/var/adm:/sbin/nologin <==左侧文件删除

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

-sync:x:5:0:sync:/sbin:/bin/sync <==左侧文件删除

+no six line <==右侧新文件加入

shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown

halt:x:7:0:halt:/sbin:/sbin/halt

mail:x:8:12:mail:/var/spool/mail:/sbin/nologin

为什么这里会使用 -p0 呢？因为我们在比对新旧版的数据时是在同一个目录下，因此不需要减去目录啦！如果是使用整体目录比对（diff 旧目录新目录）时，就得要依据创建 patch 文件所在目录来进行目录的删减啰！

更详细的 patch 用法我们会在后续的第五篇的源代码编译（第二十一章）再跟大家介绍，这里仅是介绍给你，我们可以利用 diff 来比对两个文件之间的差异，更可进一步利用这个功能来制作修补文件（patch file），让大家更容易进行比对与升级呢！很不赖吧！ ^_^

4，文件打印准备： pr

如果你曾经使用过一些图形接口的文书处理软件的话，那么很容易发现，当我们在打印的时候，可以同时选择与设置每一页打印时的标头吧！也可以设置页码呢！那么，如果我是在Linux 下面打印纯文本文件呢可不可以具有标题啊？可不可以加入页码啊？呵呵！当然可以啊！使用 pr 就能够达到这个功能了。不过， pr 的参数实在太多了，鸟哥也说不完，一般来说，鸟哥都仅使用最简单的方式来处理而已。举例来说，如果想要打印 /etc/man_db.conf呢？

[dmtsai@study ~]$ pr /etc/man_db.conf

2014-06-10 05:35 /etc/man_db.conf Page 1

# This file is used by the man-db package to configure the man and cat paths.

# It is also used to provide a manpath for those without one by examining

# configure script.

.....（以下省略）......

上面特殊字体那一行呢，其实就是使用 pr 处理后所造成的标题啦！标题中会有“文件时间”、“文件文件名”及“页码”三大项目。更多的 pr 使用，请参考 pr 的说明啊！ ^_^

你可能感兴趣的:(linux)

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
RK3229_Android9.0_Box 4G模块EC200A调试 suifen_ 网络
0、kernel修改这部分完全可以参考Linux的移植：RK3588EC200A-CN【4G模块】调试_rkec200a-cn-CSDN博客1、修改device/rockchip/rk322xdiff--gita/device.mkb/device.mkindexec6bfaa..e7c32d1100755---a/device.mk+++b/device.mk@@-105,6+105,8@@en
linux 安装Sublime Text 3 hhyiyuanyu Python学习 linux sublime text
方法/步骤打开官网http://www.sublimetext.com/3，选择64位进行下载执行命令wgethttps://download.sublimetext.com/sublime_text_3_build_3126_x64.tar.bz2进行下载3、下载完成进行解压,执行tar-xvvfsublime_text_3_build_3126_x64.tar.bz解压4、解压完成以后，移动到
KVM虚拟机源代码分析【转】 xidianjiapei001 #虚拟化技术
1.KVM结构及工作原理1.1KVM结构KVM基本结构有两部分组成。一个是KVMDriver，已经成为Linux内核的一个模块。负责虚拟机的创建，虚拟内存的分配，虚拟CPU寄存器的读写以及虚拟CPU的运行等。另外一个是稍微修改过的Qemu，用于模拟PC硬件的用户空间组件，提供I/O设备模型以及访问外设的途径。KVM基本结构如图1所示。其中KVM加入到标准的Linux内核中，被组织成Linux中标准
史上最全git命令,git回滚,git命令大全騒周其他 git
git命令大全一、Git整体理解二、由暂存区本地仓库三、由本地仓->远程仓库四、冲突处理五、Git分支操作六、bug的分支七、feature分支八、暂存的使用九、远程仓的操作十、标签的使用十一、Git配置全局信息十二、Linux的一些简单操作和一些符号的解释十三、符号解释十四、显示安装详细信息十五、gitconfig十六、Gitclone十七、Gitinit十八、gitstatus十九、gitre
【显示后台运行 & 的命令】晨春计 debug linux 服务器运维
目录背景步骤详解示例背景当你在Linuxshell中使用&符号将一个命令放到后台运行时，你可以使用jobs命令来查看这些后台进程的状态。但是，jobs命令并不会直接显示进程的PID（进程ID）。它会显示一个作业列表，其中包括每个作业的状态和一个作业标识符（通常是百分号%后面跟着一个数字），但不会直接显示PID。获取后台进程的PID步骤：1、使用jobs命令查看后台作业。2、使用ps命令配合grep
Android shell 常用 debug 命令晨春计 Audio debug android linux
目录1、查看版本2、am命令3、pm命令4、dumpsys命令5、sed命令6、log定位查看APK进程号7、log定位使用场景1、查看版本1.1、Android串口终端执行getpropro.build.version.release#获取Android版本uname-a#查看linux内核版本信息uname-r#单独查看内核版本1.2、linux服务器执行lsb_release-a#查看Lin
【nginx】ngx_http_proxy_connect_module 正向代理等风来不如迎风去网络服务入门与实战 nginx http 运维
50.65无法访问服务器，(403错误)50.196可以访问服务器。那么，配置65通过196访问。需要一个nginx作为代理【nginx】搭配okhttp配置反向代理发送原生的nginx是不支持okhttp的CONNECT请求的。大神竟然给出了一个java工程GINX编译ngx_http_proxy_connect_module及做正向代理是linux构建的。是windows构建的：编译Windo
linux下好用的任务管理器htop WittXie Linux linux 服务器运维
给大家推荐个好用的任务管理器htop，简直好用的不得了。完虐top。不解释了，看文章！！！在Linux系统中，top命令用来显示系统中正在运行的进程的实时状态，它显示了一些非常有用的信息，比如CPU利用情况、内存消耗情况，以及每个进程情况等。但是，你知道吗？还有另外一个命令行工具'htop'，它与传统的top命令功能一样，但它有更加强大的功能及能显示更多的信息。这篇文章，我们会用实例来讨论这个'h
Linux下使用U盘 WittXie Linux linux 运维服务器
第一步：插入U盘，如果能够识别出U盘，则会打印出一些信息；第二步：查看U盘系统分配给U盘的设备名；输入如下命令进行查看：fdisk-l/dev/sda如果打印出如下信息：Disk/dev/sda:4233MB,4233101312bytes165heads,34sectors/track,1473cylindersUnits=cylindersof5610*512=2872320bytesDevi
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&

Linux学习笔记25——正则表达式与文件格式化处理

一、什么是正则表达式

什么是正则表达式

正则表达式对于系统管理员的用途

正则表达式的广泛用途

正则表达式与 Shell 在 Linux 当中的角色定位

延伸的正则表达式

二、基础正则表达式

1，语系对正则表达式的影响

2，grep 的一些进阶选项

3，基础正则表达式练习

例题一、搜寻特定字串

例题二、利用中括号 [] 来搜寻集合字符

例题三、行首与行尾字符 ^ $

例题四、任意一个字符 . 与重复字符 *

例题五、限定连续 RE 字符范围 {}

4，基础正则表达式字符汇整 （ characters）

5，sed 工具

以行为单位的取代与显示功能

部分数据的搜寻并取代的功能

直接修改文件内容（危险动作）

三，延伸正则表达式

四、文件的格式化与相关操作

1， 格式化打印： printf

2，awk：好用的数据处理工具

awk 的逻辑运算字符

3，文件比对工具

diff

cmp

patch

4，文件打印准备： pr

你可能感兴趣的:(linux)

4，基础正则表达式字符汇整（ characters）

1，格式化打印： printf