(一)文件创建命令
1.touch命令
例如:touch abc命令在本地目录中创建了一个名为abc的空文件
2.cp命令
cp命令允许我们把一个文件的内容复制到同名或不同名的文件中,复制得到的文件可以在任何目录。使用cp命令的一个风险是它会在不提示用户的情况下很容易覆盖掉不同目录中的文件
-r选项支持递归复制。例如:cp -ar /usr/share/doc/. /doc/ 将复制源目录中所有子目录以及相关文件
3.mv命令
mv命令实质上市给文件贴上不同的标签,例如:mv file1 file2 命令就是把file1的名字改为file2
mv命令也可以用于目录
4.ln命令
链接文件允许用户编辑不同目录中的同一个文件
硬链接包含了文件的一个副本。只要硬链接文件是在同一个分区中,则它们的索引号相同 ln /etc/samba/smb.conf smb.conf
软连接起着重定向的作用。当我们打开一个用软链接创建的文件时,则链接把我们重定向到原来的文件。ln -s /etc/samba/smb.conf smb.conf
5.rm命令
-r开关选项可以按递归方式进行
-f开关选项可以覆盖掉任何安全措施 rm -rf /root/a/b
6.目录创建和删除
mkdir和rmdir命令用于创建和删除目录
-p no error if existing, make parent directories as needed
例如 mkdir -p /test1/test2/test3
rmdir -p /test1/test2/test3
7.alias命令
可以用来简化几个命令。对于root用户,默认的别名可以提供一点安全性
(二)文件搜索
1.find命令
find / -name name.conf 此命令从根目录开始搜索
find /usr -name name.conf 从/usr目录下开始搜索
2.locate命令
RHEL允许用户创建一个数据库,它保存了全部的安装文件和目录。locate命令的缺点是此数据库通常每天只更新一次,这在/etc/cron.daily/mlocate.cron脚本文件中有记录
这个脚本文件可以直接由root用户从命令行接口中执行。只要输入这个文件的完整目录就行
(三)文本文件的管理
1.cat命令
最简单的文本文件读取命令是cat。cat filename命令可以翻页显示filename文件的内容。
2.less和more命令
用more filename命令可以翻页显示文本文件的内容,每次一个屏幕从头到尾显示
用less filename命令,我们可以用PAGE UP和PAGE DOWN键向前或向后翻页查看铜件的文本,按q退出
less命令有几个功能是more和cat这两个命令所没有的。它可以读取用Gzip格式压缩的文本文件,通常这种文件的扩展名为.gz
3.head和tail命令
head 命令读取文件的头部
语法:$ head –n N file 打印前N行 $ head –n -N file 打印除最后N行外的所有行
tail命令总是读取文件的尾部
语法:$ tail –n N file 打印后N行 $ taill –n +N file 打印除了前N行之外的所有行
(四)处理文本流的命令
文本流就是数据的流动。例如,cat filename命令把来自filename的数据流输出到屏幕上。当这些文件变大时,最好先用过滤器命令对这些流进行处理。
1.sort命令
可以用多种方法对文件的内容进行排序。默认情况下,sort命令按照字母顺序将文件内容按每行首字符进行排序。
2.grep命令
grep命令用于文本搜索,默认读取一个文件的所有行
$ grep match_pattern filename 或者 $ grep “match_pattern” filename
一个grep命令也可以对多个文件进行搜索 $grep "match_text" file1 file2 file3 ...
grep命令通常将match_pattern视为通配符。如果要使用正则表达式,需要添加-E选项——这意味着使用扩展(extended)正则表达式,或者使用默认允许正则表达式的egrep命令。 例如: $ grep -E "[a-z]+" 或者 $egrep "[a-z]" 匹配url的正则表达式 $ egrep -o "http://[a-zA-Z0-9.]+\.[a-zA-z]{2,3}" index.html
--color=atuto 选项:可以在输出行中重点标记出匹配到的单词
-o选项:只输出文件中匹配到的文本部分。 例如:输出每个单词 echo this is a test file | egrep -o "\b[[:alpha:]]+\b"
-v选项:打印包含match_pattern的行之外的所有行
-c选项:统计文件或文本中包含匹配字符串的行数
-b选项: 打印样式匹配所位于的字符或字节偏移,选项-b总是和-o配合使用 例如:$echo gnu is not unix | grep -b -o "not"
其他选项:
1)递归搜索文件 $ grep "text' . -R -n
2) 忽略样式中的大小写 $ echo hello world | grep -i "HELLO"
3) 用grep匹配多个样式 $ grep -e "pattern1" -e "pattern2" 或者 在样式文件中逐行写下需要匹配的样式,然后用选项-f执行grep。 $echo hello this is cool | grep -f pat_file
4) 在grep搜索中包括或排除文件
只在目录中递归搜索所有的.c和.cpp文件: $ grep "main()" . -r --include *.{c,cpp} 注意:some{string1,string2}会扩展成somestring1 somestring2
在搜索中排除所有的README文件: $ grep "main()" . -r --exclude "README"
如果要排除目录,可以使用 --exclude-dir 选项
如果需要从文件中读取所需要排除的文件列表,使用 --exclude-from FILE
5) 使用0值字节后缀的grep与xargs
在下面的命令序列中,grep输出以0值字节作为终结符的文件(\0)。这可以用grep的-Z选项来指定。xargs -0 读取输入并用0值字节终结符分割文件名:
$ grep "test" file* -lZ | xargs -0 rm 。-Z通常和-l结合使用
6)grep的静默输出:在静默模式(quiet mode)中,grep命令不会向标准输出打印任何输出。它仅是运行命令,然后根据命令执行成功与否返回退回状态。使用-q
7) 打印出匹配文本之前或之后的行
要打印匹配某个结果之后的3行,使用-A选项 -A NUM, --after-context=NUM。例如 $seq 10 | grep -A 3 5
要打印匹配某个结果之前的3行,使用-B选项 -B NUM, --before-context=NUM。例如 $seq 10 | grep -B 3 5
要打印匹配某个结果之前以及之后的3行,使用-C选项 -C NUM, -NUM, --context=NUM。例如 $seq 10 | grep-C 3 5
如果有多个匹配,那么以一行“--”作为各匹配之间的定界符。例如 $ echo -e "a\nb\nc\na\nb\nc" | grep a -A 1
3.diff命令
diff命令可以找出两个文件的差别。
diff /root/ifcfg-eth0 /etc/sysconfig/network-scripts/ifcfg-eth0
4.wc命令
wc是一个用于统计的工具。它是Word Count(单词统计)的缩写。
1)统计行数$ wc -l file
2)统计单词数 $ wc -w file
3)统计字符数 $ wc -c file
4)当不适用任何选项执行wc时:$ wc file 它只会打印文件的行数、单词数和字符数,彼此之间用制表符分割
5.sed命令
sed命令是流编辑(stream editor)的缩写符,用于搜索并修改文件中指定的单词甚至文本流。
如果要替换所有内容,需要在命令尾部加上参数g 其方法如下:$ sed 's/pattern/replace_string/g' file 后缀/g意味着sed会替换每一处匹配。但是有时候我们不需要替换前N处匹配,而是需要替换剩下的匹配。当需要从第N处匹配开始替换时,可以使用/Ng 例如: $echo this thisthisthisthis | sed 's/this/THIS/4g'
sed常用组合命令
1)移除空白行
2) 已匹配字符串标记&
$ echo this is an example | sed 's/\w\+/[&]/g' 正则表达式 \w\+ 匹配每一个单词,然后我们用[&]替换它,&对应于之前所匹配到的单词
3) 子串匹配标记\1 &代表匹配给定样式的字符串
4)组合多个表达式
5) 引用
sed可以替换给定文本中的字符串。 $ sed 's/pattern/replace_string/' file
-i选项:将替换结构应用于原文件。 例如:$ sed -i 's/text/replace/' file 等价于 $ sed 's/text/replace/' file > newfile ; $mv newfile file
$ sed '/^$/d' file
在sed中,用&标记匹配样式的字符串,就能够在替换字符串时使用已匹配的内容
$ echo seven EIGNT | sed 's/\([a-z]\+\) \([A-Z]\+\)/\2 \1/' ([a-z]\+\)匹配第一个单词 ([A-Z]\+\)匹配第二个单词 \1和、2用来引用它们。这种医用被称为向后引用(back referencing)。在替换部分,它们的次序被更改为 \2 \1 因此结果就呈现出逆序的形式。
$ sed 'expression' | sed "expression' 等价于 $ sed 'expression; expression'
sed表达式通常用单引号引用。不过也可以使用双引号。双引号会通过对表达式求值来对其进行扩展。当我们想在sed表达式中使用一些变量字符串时,双引号就有用武之地了。例如: $ text=hello $echo hello world | sed "s/$text/HELLO/" 结果HELLO word, $text的求值结果是hello
6.awk命令
一个awk脚本通常由3部分组成: BEGIN语句块、END语句块和能够使用模式匹配的通用语句块。
例如 echo -e "line1\nline2" | awk 'BEGIN {print "Start"} {print} END{print "End"}‘
关于print,需要记住两件重要的事情:当print的参数是以逗号进行分割时,参数打印时则以空格作为定界符;在awk的print语句中,双引号是被当做拼接操作符(concatenation operator)使用的。例如:
$ echo | awk '{ var1="v1"; var2="v2"; var3="v3"; \ print var1,var2,var3;}' 输出 v1 v2 v3
$ echo | awk '{ var1="v1"; var2="v2"; var3="v3"; \ print var1 "-" var2 "-" var3;}' 输出 v1-v2-v3
补充内容
1)特殊变量
NF:表示字段数量(number of fields ),在执行过程中对应于当前的字段数。
$0 :这个变量包含执行过程中当前行的文本内容
$1 :这个变量包含第一个字段的文本内容
$2 :这个变量包含第二个字段的文本内容
例如 我们可以用print $NF打印一行中最后一个字段,用$(NF-1)打印倒数第二个字段,其他字段依次类推即可。
要打印从M行到N行这个范围内的所有文本,语法 $ awk 'NR==M, NR==N' filename
要打印处于start_pattern与end_pattern之间的文本,语法 $ awk '/start_pattern/, /end_pattern/' filename 用于awk中的样式为正则表达式
2)将外部变量值传递给awk
还有另一种灵活的方法可以将多个外部变量传递给awk 例如:
$ var1="Variable1" ;var2="Variable2" $ echo | awk '{ print v1,v2 }' v1=$var1 v2=$var2
在上面的方法中,变量之间用空格分隔,以键-值对的形式(v1=$var1 v2=$var2 )作为awk的命令行参数紧随在BEGIN、{ }和END语句块之后。
3)用getline读取行
例如:seq 5| awk 'BEGIN { getline;print $0}{print $0}'
4)用样式对awk处理的行进行过滤
$ awk 'NR < 5' # 行号小于5的行
$ awk 'NR==1,NR==4' #行号在1到5之间的行
$ awk '/linux/' # 包含样式linux的行(可以用正则表达式来指定样式)
$ awk '!/linux/' # 不包含样式linux的行
5)设置字段定界符
在BEGIN语句块中则可以用FS=“delimiter” 设置输出字段的定界符 $ awk 'BEGIN {FS=":"} {print $NF }' /etc/passwd
6) 从awk中读取命令输出
awk支持以文本作为索引的关联数组
7) 在awk中使用循环
awk有很多内建的字符串控制函数:
length(String)
index(string,search_string)
split(string,array,delimiter)
substr(string,start-position,end-position)
sub( regex, replacement_str, string) 将正则表达式匹配到的第一处内容替换成replacement_str
gsub( regex, replacement_str, string) 将正则表达式匹配到的所有内容替换成replacement_str
match( regex, string) 检查正则表达式是否能够匹配字符串。如果能够匹配,返回非0值;否则,返回0。match()有两个相关的特殊变量,RSTART包含正则表达式所匹配内容的起始位置,而RLENGTH包含正则表达式所匹配内容的长度。
awk被设计用于数据流。它非常有趣,其原因就在于它可以对列和行进行操作。
awk脚本的结构基本如下所示: awk ' BEGIN { print "start" } pattern { commands } END { print "end" } file
NR:表示记录数量(number of records),在执行过程中对应于当前行号。
。。。
$N :这个变量包含第N个字段的文本内容
例如:$var=10000 $ echo | awk -v VARIABLE=$var '{ print VARIABLE }'
通常,grep默认读取一个文件的所有行。如果只想读取某一行,可以使用geiline函数。有时候,我们需要从BEGIN语句块中读取第一行。
我们可以为需要处理的行指定一些条件,例如:
默认的字段定界符是空格。我们可以用-F “delimiter”明确指定一个界定符: $ awk -F: '{ print $NF }' /etc/passwd
$echo | awk '{ "grep root /etc/password" | getline cmdout; print cmdout }' 通过使用getline,能够将外部shell命令的输出读入变量cmdout
在awk中可以使用for循环,其格式: for( i=0;i<10;i++) { print $i; } 或者 for( i in array) { print array[i] }