从解决问题开始(1):
1. 计算文件unix 中单词UNIX, Ritchie, Thompson 出现的次数
2. 计算文件unix 中所有单词出现的次数
3. 写成一个脚本(有什么好处?可重用,可调整参数,封装起来方便使用)
4. 给脚本添加选项和参数(忽略大小写,排序)
5. 把脚本放到适当位置,使系统上所有用户都可以使用 (PATH 变量)
6. 添加命令別名,方便调用 (alias)
1. shell 是什么,它能做什么
shell 是一个程序,在文件系统里的位置一般是 /bin/bash,shell 程序与其它程序一样都是程序,不同的是它的功能,它的功能是管理別的程序。wget 可以下载文件,vim 可以编辑文件,useradd 可以创建用户,而shell 可以管理这些完成具体任务的应用程序。
用户不会直接使用操作系统,用户使用的是应用程序,用户通过应用程序间接地使用操作系统(内核)来完成具体的任务。shell 就好像内核外面的一层壳 (英文叫做shell),用户通过这层壳来和内核交互,管理各种应用程序。
shell 是用户和内核交互的一种渠道,此外它还有一个突出的特征就是能够组合各种各样的应用程序,完成复杂强大的功能,仿佛“胶水”一样。
2. shell 脚本是什么
shell 脚本是一种程序,这种程序由shell 程序解释执行,有別於需要编译才能执行的二进制程序。shell 程序(就是shell 解释器)是二进制程序,shell 脚本是文本文件。与shell 脚本类似的程序有Python 脚本,PHP 脚本等。这些所谓的“脚本”都有共同的地方,它们都是按照解释器(通常是二进制程序)的语法编写的文本文件。
3. 除了bash shell,还有別的吗?
第一个UNIX shell,osh, 叫做V6 shell,Ken Thompson 写的,缺少脚本功能,它的目的是做命令行解释,就是启动程序,观察结果。
1977, Bourne shell, 能用于命令行解释和脚本之中,提供了流程控制,循环,变量等功能。Bourne shell 是shell 发展史上一个标记性的成果,后续许多的shell 皆衍生它。
C shell, 语法像C 语言,它引入了命令历史的功能。
Korn shell,向后兼容Bourne shell,支持小数计算。
Bourne-Again shell, 就是bash,是一个GNU 项目,向后兼容Bourne shell,许多Bourne shell 的脚本可以不经修改就直接用bash 来执行。
4. shell 脚本的结构和运行方式
结构:
1. 首行
2. 代码
3. 注释
运行方式:
1. 直接运行解释器,以脚本为参数。
2. 给脚本添加执行权限,直接执行脚本本身。
man bash
1. shell 的工作原理 (1)
内核 <---> shell <---> 用户
父进程 fork --> wait
子进程 exec --> exit
相关man文档:
fork(2)
clone(2)
execve(2)
exit_group(2)
exit4(2)
strace(1) -->strace -e
2. shell 语法 (2)
1. 简单命令 (kw: Simple Commands)
基本形式:command [arg]...
范例:
cd
ls -l
cp /data/log /backup/log
2. 管道 (kw: Pipelines)
基本形式:cmd1 | cmd2 | cmd3 -->管道+小命令=复杂命令
左边命令的标准输出作为右边命令的标准输入
用|&代替|,可以把标准错误也一起传给右边
管道中的每一个命令都在子进程中执行
管道中的命令同时运行
管道的返回状态是管道最右边的命令的返回状态
范例:
ls /students|wc -l
ip a| grep -w inet
3. 列表 (kw: Lists)
一系列的管道就是列表
列表中用于分割管道的符合有:
;: 命令按顺序从左到右执行
&: 命令同时执行
&&: 左边成功才执行右边
||: 左边失败才执行右边
列表的结尾可以有; &,如果是&,则最右边的管道放在后台执行
4. 复合命令 (kw: Compound Commands)
(list) 列表作为一个整体在子进程中执行
{ list; } 列表作为一个整体在当前进程中执行
((expression)) 算术运算
((n++))
((total=$first + $last))
[[ expression ]] 当表达式为真时,返回0,否则返回非0,支持正则
if, case, for, while 这些都是shell的流程控制指令
3. 引用 (1), (kw: QUOTING)
shell 中的引用符号用于去除特殊字符的特殊意义
1. 双引号 不能转义 $
2. 单引号 转义所有的符合,除了'本身
3. 反斜杠 单个字符
4. 参数 (2), (kw: PARAMETERS)
Shell 参数是存放“值”的“东西”,它可以是一个名字,一个数字,或者是一些特殊符号。
1. 变量
2. 位置参数 (kw: Positional Parameters)
3. 特殊参数 (kw: Special Parameters)
$*: 所有位置参数合并成的一个字符串
$@: 所有位置参数,如果放在双引号里面,则保存参数的边界
4. shell 内置变量 (kw: Shell Variables)
5. 阵列 (kw: Arrays)
a=(e1 e2 e3)
declare -A a
a[x]=1
a[y]=2
${name[0]} <-- 获取第0个元素
${#name[*]} <-- 阵列的长度
${!name[*]} <-- 阵列的keys
${name[*]} <-- 阵列的values
unset name <-- 删除整个阵列
unset name[0] <-- 删除阵列中的一个元素
5. 展开 (2), (kw: EXPANSION)
shell 在执行命令之前,会对读到的命令行字符串做一系列的展开操作,常见的展开操作有:
1. 大括号展开 (kw: Brace Expansion)
{1..10}, {1..10..2}, {a..z}
d{1,2,3} -> d1 d2 d3
$ cp -v /tmp/a/b/c/deep{,2}
‘/tmp/a/b/c/deep’ -> ‘/tmp/a/b/c/deep2’
2. 波浪号展开 (kw: Tilde Expansion)
~: 当前用户的家目录
~user:指定用户的家目录
~+: 当前工作目录
~-: 上一个工作目录
3. 参数展开 (kw: Parameter Expansion)
$, ${name}
${name:-default} <-- 默认值
${name:offset} <-- 截取字符串
${name:offset:length} <-- 截取一定长度的字符串
${#name} <-- 计算字符串长度
${name#word} <-- 删除字符串头部
${name%word} <-- 删除字符串尾部
${name/pattern/string} <-- 字符串替换
${name^pattern} <-- 转换成大写
${name,pattern} <-- 转换成小写
4. 命令替换 (kw: Command Substitution)
$(cmd list) <-- 当前应该使用这个
`cmd list` <-- 过时语法
5. 算术展开 (kw: Arithmetic Expansion)
$((expression)) <-- 当前应该使用这个
$[expression] <-- 过时语法
6. 进程替换 (kw: Process Substitution)
<(cmd list)
>(cmd list)
7. 路径名展开 (kw: Pathname Expansion)
*, ?, []
能展开则展开,不能展开则保持原样
6. 重定向 (1.5), (kw: REDIRECTION)
在一个命令执行之前,它的输入和输出可能被shell重定向,重定向操作有以下功能:
重定向输入 (kw: Redirecting Input, Here Documents, Here Strings)
wc -l < file
cmd < .. EOF cmd <<< "string" 重定向输出 (kw: Redirecting Output) 复制文件描述符 (kw: Duplicating File Descriptors) exec 4>&3 <-- 把3 复制成4 移动文件描述符 (kw: Moving File Descriptors) exec 4>&3- <-- 把3 移动到4 关闭文件描述符 exec 3>&- <-- 关闭3 以读写方式打开文件描述符 (kw: Opening File Descriptors for Reading and Writing) exec 3<>file <-- 以读写形式打开 0 stdin 1 stdout 2 stderr 7. 算术运算 (0.5) bash shell 支持整数算术运算 1. ((expression)) (kw: ARITHMETIC EVALUATION) 2. $((expression)) (kw: Arithmetic Expansion) 3. 小数运算 bc, python, awk 8. 简单命令的展开 (0.5), (kw: SIMPLE COMMAND EXPANSION) shell 执行简单命令时,在实际执行之前,会做以下操作: 1. 取出变量赋值和重定向部分 2. 对余下部分做展开操作 3. 执行重定向操作 4. 执行变量赋值操作 简单命令展开完后,如果展开的结果中有命令名,则流程去到“命令的执行”阶段。 9. 命令的执行 (1), (kw: COMMAND EXECUTION) 1. 如果命令名不包含斜杠,就按顺序搜索命令: 1. 函数 2. 内部命令 3. 搜索PATH 中的目录 2. 如果搜索成功,或者命令名包含了斜杠,则开始执行。 3. 如果搜索失败,或者程序文件不存在,则返回127。 10. 命令的执行环境 (0.5), (kw: COMMAND EXECUTION ENVIRONMENT) 1. 打开的文件 2. 当前工作目录 3. umask 4. 信号trap -->进程通讯 5. shell 变量 6. shell 函数 7. shell 的功能选项(set, shopt) set -o vim/emacs 8. shell 別名 9. 各种进程ID ($$, $PPID) 11. 环境变量 (0.5), (kw: ENVIRONMENT) 当一个命令被执行的时候,会有一个字符串阵列(列表)传给它,这个阵列叫做“环境”,也叫“环境变量”。 shell 的环境变量可以传给子进程。设置shell 的环境变量的命令: 1. export export time <-- 把time 设置成环境变量 export -n time <-- 使time 编程非环境变量 2. declare declare -x time <-- 把time 设置成环境变量 declare +x time <-- 使time 编程非环境变量 12. shell 的内部命令 (4.5), (kw: SHELL BUILTIN COMMANDS) shell的内部命令默认在当前进程执行,常用的有 01. : 空命令 02. ., source 点命令(source)把文件里面的代码读到“当前进程”中执行。 03. break, continue break <-- 结束整个循环 continue <-- 结束当前循环,进入下一轮循环 04. cd, pwd cd <-- 必须是内部命令 05. declare, export, readonly, local 06. set, unset, shopt -》set改变shell的开关 07. echo, read, printf 08. exec 09. exit, return 10. kill, trap 11. shift 12. test, [ 13. wait