shell脚本编程基础

本文转自 http://mprc.pku.edu.cn/mentors/training/TrainingCourses/material/ShellProgramming.HTM#_Toc37518063
七种文件类型

正则表达式

字符类描述

shell的引号类型

变量设置时的不同模式:

条件测试

命令执行顺序

脚本调试

一些常用的小TRICK

打印一些头信息

创建一个长度为0的空文件

一些常用的shell变量

$0的使用

Shift的运用

用head或tail指令指定查阅的行数

AWK使用规则

第一个 awk

多个字段

外部脚本

BEGIN 和 END 块

规则表达式和块

条件语句

数值变量

字符串化变量

众多运算符

字段分隔符

字段数量

记录号

多行记录

OFS 和 ORS

将多行转换成用 tab 分隔的格式

循环结构

for 循环

break 和 continue

数组下标字符串化

数组工具

格式化输出

字符串函数

一些更耐人寻味的函数

字符串替换

特殊字符串形式

SED使用规则

sed 示例

另一个 sed 示例

地址范围

带规则表达式的地址

有关地址的更多内容

替换

规则表达式混乱

更多字符匹配

高级替换功能

组合使用

一个地址的多个命令

附加、插入和更改行

使用 sed 的几个示例

LINUX常用脚本和函数

LINUX常用命令

关于文件/目录处理的指令:

关于 Process 处理的指令:

关于字符串处理的指令:

联机查询的指令:

网络运用指令:

VI常用技巧

Shell脚本编程的常识

七种文件类型

d            目录                                                    
l            符号链接
s            套接字文件       
b            块设备文件
c            字符设备文件     
p            命名管道文件
-            普通文件

正则表达式

从一个文件或命令输出中抽取或过滤文本时。可使用正则表达式(RE),正则表达式是一些特殊或不很特殊的字符串模式的集合。
** 基本的元字符集:**

^                   只匹配行首。
$                   只匹配行尾。
*                   一个单字符后紧跟*,匹配0个或多个此单字符。
[]                  匹配[]内字符,可以是一个单字符,也可以是字符序列。可以使用-来表示[]内范围,如[1-5]等价于[1,2,3,4,5]。
\                   转义字符,屏蔽一个元字符的特殊含义,如\$表示字符$,而不表示匹配行尾。
.                   匹配任意单字符。
       
pattern\{n\}        匹配pattern出现的次数n
pattern\{n,\}       匹配pattern出现的次数,但表示次数最少为n
pattern\{n,m\}      匹配pattern出现的次数在n与m之间(n,m为0-255)

几个常见的例子:

显示可执行的文件:        ls –l | grep …x...x..x
只显示文件夹:            ls –l | grep  ^d
匹配所有的空行:          ^$
匹配所有的单词:          [A-Z a-z]*
匹配任一非字母型字符:     [^A-Z a-z]
包含八个字符的行:         ^……..$(8个.)

字符类描述

以下是可用字符类的相当完整的列表:
[:alnum:] 字母数字 [a-z A-Z 0-9]
[:alpha:] 字母 [a-z A-Z]
[:blank:] 空格或制表键
[:cntrl:] 任何控制字符
[:digit:] 数字 [0-9]
[:graph:] 任何可视字符(无空格)
[:lower:] 小写 [a-z]
[:print:] 非控制字符
[:punct:] 标点字符
[:space:] 空格
[:upper:] 大写 [A-Z]
[:xdigit:] 十六进制数字 [0-9 a-f A-F]

尽可能使用字符类是很有利的,因为它们可以更好地适应非英语 locale(包括某些必需的重音字符等等).
shell的引号类型

shell共有四种引用类型:
“” 可引用除 $、` 、\ 、外的任意字符或字符串,“ ”中的变量能够正常显示变量值。
‘’ 与“ ”类似,不同在于shell会忽略任何的引用值。
              例如: GIRL=‘girl’
                        echo “The ‘$GIRL’ did well”
              则打印:The ‘girl’ did well
`` 用于设置系统命令的输出到变量,shell会将``中的内容作为一个系统命令并执行质。
              例如:echo `date` 则打印当前的系统时间。
\  转义字符,用来屏蔽特殊含义的字符:&  *  +  ^  $  `  “  |  ?
              例如:expr 12 \* 12 将输出144

单引号和双引号都能关闭shell对特殊字符的处理。不同的是,双引号没有单引号严格,单引号关闭所有有特殊作用的字符,而双引号只要求shell忽略大多数,具体的说,就是①美元符号②反引号③反斜杠,这3种特殊字符不被忽略。 不忽略美元符号意味着shell在双引号内部也进行变量名替换。

变量设置时的不同模式:

valiable_name=value           设置实际值到 variable_name中
valiable_name+value           如果设置了variable_name,则重设其值
valiable_name:?value          如果未设置variable_name,则先显示未定义用户错误信息
valiable_name?value           如果未设置variable_name,则显示系统错误信息
valiable_name:=value          如果未设置variable_name,则设置其值
valiable_name-value           同上,但取值并不设置到variable_name

条件测试
test命令用于测试字符串、文件状态和数字,expr测试和执行数值输出。

Test格式:test condition 或 [ condition ](需要特别注意的是condition的两边都要有一个空格,否则会报错),test命令返回0表示成功。
下面将分别描述test的三种测试:
文件状态测试(常用的)
-d           测试是否文件夹
-f           测试是否一般文件
-L           测试是否链接文件
-r           测试文件是否可读
-w           测试文件是否可写
-x           测试文件是否可执行
-s           测试文件是否非空

 字符串测试
五种格式: 
test  “string”
test  string_operator  “string”
test  “string”  string_operator  “string”
[ string_operator  “string” ]
[ “string”  string_operator  “string” ]
其中string_operator可以为:       =     两字符串相等
                                                               !=    两字符串不等
                                                               -z   空串
                                                               -n   非空串

数值测试
两种格式:
 “number”  number_operator  “number”
其中:number_operator 可以为:-eq  、-ne、-gt、-lt、-ge
例如:  NUMBER=130
                     [ “990”  –le  “995”  –a  “NUMBER”  -gt  “133” ]
                     (其中-a表示前后结果相“与”)

expr命令一般用于整数值,但也可以用于字符串。
格式:  expr srgument operator operator argument
例如:  expr 10 + 10
              expr 10 ^ 2 (10的平方)
              expr $value + 10

增量计数――expr在循环中最基本的用法
例如:  LOOP=0
              LOOP=`expr $LOOP + 1`
模式匹配:通过指定的冒号选项计算字符串中的字符数
例如:  value=account.doc
              expr $value : `\(.*\).doc`
              输出 account

命令执行顺序

&&               成功执行一个命令后再执行下一个
||               一个命令执行失败后再执行另一个命令
( )              在当前shell中执行一组命令(格式:(命令1;命令2; ……))
{ }              同( )
例如:  comet mouth_end || ( echo “hello” | mail dave ;exit )
             如果没有( ),则shell将直接执行最后一个命令(exit)

脚本调试
最有用的调试脚本的工具是echo命令,可以随时打印有关变量或操作的信息,以帮助定位错误。也可使用打印最后状态($?) 命令来判断命令是否成功,这时要注意的是要在执行完要测试的命令后立即输出$?,否则$?将会改变。
Set命令也可以用来辅助脚本测试:
Set –n 读命令但是不执行
Set –v 显示读取的所有的行
Set –x 显示所有的命令及其参数
(要关闭set选项,只要把-换成+就可以了,这里有点特殊,要注意一下)

一些常用的小trick
打印一些头信息

command  <<  dilimiter
……
……
dilimiter

以分界符号dilimiter中的内容作为命令的标准输入
常用在echo命令中,这样就避免了没输出一行就要使用一个echo命令,同时,输出格式的调整也相应变得简单了。

创建一个长度为0的空文件
执行 cat < file_name 命令或 touch file_name 命令。
一些常用的shell变量
$# 传递到脚本的参数个数
$* 以一个单字符串显示所有向脚本传递的参数(可大于9个)
$$ 脚本运行的当前进程的ID号
$! 后台运行的最后一个进程的ID号
$@ 与$#相同,但使用时加引号,并在引号中返回每个参数
$- 显示shell使用的当前选项
$? 显示最后命令的退出状态,0表示无错误(这个变量也常常用来打印输出,在脚本调试时标记某个shell命令或某个函数是否正确执行,但是要注意,$?记载的是最近的函数或命令的退出状态,因此打印时应该立即打印以获得正确的信息)
$0的使用
在变量中有一种位置变量$n,用来存放函数调用或脚本执行时传入的参数,其中$0表示函数名或脚本名,需要注意的是,这时的脚本名传递的是包含全路径的脚本名。从$1-$9表示传入的第一到第九个参数,这样的参数表示不能多于九个,如果多于九个,可以使用下面将要提到的shift指令来读取。
因为$0存放函数名或脚本名,因此我们可以通过echo $0来输出调用信息,但是,由于存放的是全路径名,我们可以利用一个shell命令来得到脚本名,basename $0 将得到$0中名字的部分,而与之相反的,dirname $0将得到$0中路径的部分。
Shift的运用

你可能感兴趣的:(shell脚本编程基础)