linux下find查找文件和grep查找文件内容

grep命令

格式:grep 参数 要查内容 路径
常用参数: -r:递归  -n:显示行号   -i:忽略大小写  -c:匹配到的行数  -w:全词匹配  -v:显示不包含匹配文本的所有行

递归搜索文件:grep -r "from" ./

aaa@hadoopslave16:~/data/hive/aaa$ grep -r "from" ./
./2.sql: from tmp.tmp_*** where dt between '20190101' and '20190228';
./6.sql: from
./6.sql: from tmp.tmp_***

递归、显示行号、忽略大小写、全词匹配:grep -r -n -i -w 'risk' ./

aaa@hadoopslave16:~/data/hive/aaa$ grep -r -n -i -w 'risk' ./
./2.sql:3:insert overwrite table risk.*** partition(dt)
./6.sql:4:insert overwrite table risk.*** partition(dt)
./4.sql:4:insert overwrite table risk.*** partition(dt)
./8.sql:6:insert overwrite table risk.*** partition(dt)

排除文件或文件夹: --exclude=file  --exclude={file1,file2...}  --exclude-dir= dir  --exclude-dir={dir1,dir2...}

aaa@hadoopslave16:~/data/hive/aaa$ grep -r -n -i -w 'risk' ./ --exclude=2.sql
./6.sql:4:insert overwrite table risk.*** partition(dt)
./4.sql:4:insert overwrite table risk.*** partition(dt)
./8.sql:6:insert overwrite table risk.*** partition(dt)
aaa@hadoopslave16:~/data/hive/aaa$ grep -r -n -i -w 'risk' ./ --exclude={2.sql,4.sql}
./6.sql:4:insert overwrite table risk.*** partition(dt)
./8.sql:6:insert overwrite table risk.*** partition(dt)

aaa@hadoopslave16:~/data/hive$ grep -r -n -i -w 'risk' ./ --exclude-dir=bbb
./aaa/2.sql:3:insert overwrite table risk.*** partition(dt)
./aaa/6.sql:4:insert overwrite table risk.*** partition(dt)
./aaa/4.sql:4:insert overwrite table risk.*** partition(dt)
./aaa/8.sql:6:insert overwrite table risk.*** partition(dt)
aaa@hadoopslave16:~/data/hive$ grep -r -n -i -w 'risk' ./ --exclude-dir={bbb,ccc}
./aaa/2.sql:3:insert overwrite table risk.*** partition(dt)
./aaa/6.sql:4:insert overwrite table risk.*** partition(dt)
./aaa/4.sql:4:insert overwrite table risk.*** partition(dt)
./aaa/8.sql:6:insert overwrite table risk.*** partition(dt)

find命令

格式:find 路径 参数 文件名

按文件名查找:
find ./ -name 2.sql
find / -name 2.sql 2>/dev/null
注意:root用户将某些文件目录设置成禁止访问模式,普通用户就没权限用find命令来查这些目录或文件。往往出现“Permission denied”,为避免这种情况,可转移错误提示,把查找错误提示转移到特定的目录中去。系统执行这个命令后,遇到错误的信息就直接输送到stderrstream 2 中,2.log 2就是表明系统将把错误信息输送到stderrstream 2中,/dev/null是一个特殊的文件,表明空的或者错误的信息,这样查询到的错误信息将被转移了,不会再显示了。
参考:https://blog.csdn.net/ydfok/article/details/1486451 

#按名称查找
aaa@hadoopslave16:~/data/hive$ find ./ -name 2.sql
./aaa/2.sql
./bbbbb/2.sql

#有访问限制
aaa@hadoopslave16:~/data/hive$ find / -name 2.sql
find: ‘/boot/grub2’: Permission denied
find: ‘/proc/tty/driver’: Permission denied
find: ‘/proc/1/task/1/fd’: Permission denied

#转移访问限制
aaa@hadoopslave16:~/data/hive$ find / -name 2.sql 2>/dev/null
/home/aaa/data/hive/aaa/2.sql
/home/aaa/data/hive/bbbbb/2.sql

按文件特性查找:
find / -size +10000c    #查找出大于10000字节的文件(c:字节,w:双字,k:KB,M:MB,G:GB)
find / -size -1000k     #查找出小于1000KB的文件
find / -amin -10        # 查找在系统中最后10分钟访问的文件(access time)
find / -atime -2        # 查找在系统中最后48小时访问的文件
find / -empty           # 查找在系统中为空的文件或者文件夹
find / -group cat       # 查找在系统中属于 group为cat的文件
find / -mmin -5         # 查找在系统中最后5分钟里修改过的文件(modify time)
find / -mtime -1        #查找在系统中最后24小时里修改过的文件
find / -user fred       #查找在系统中属于fred这个用户的文件

aaa@hadoopslave16:~/data/hive/aaa$ ll
total 180
-rw-rw-r-- 1 aaa aaa  6918 Jul  9 16:15 1.sql
-rw-rw-r-- 1 aaa aaa 15331 Jul  9 16:18 2.sql
-rw-rw-r-- 1 aaa aaa  6284 Jul  9 16:57 3.sql
-rw-rw-r-- 1 aaa aaa 84134 Jul  9 21:17 4.sql
-rw-rw-r-- 1 aaa aaa  6520 Jul  9 20:31 5.sql
-rw-rw-r-- 1 aaa aaa 14861 Jul  9 21:04 6.sql
-rw-rw-r-- 1 aaa aaa  6520 Jul  9 20:54 7.sql
-rw-rw-r-- 1 aaa aaa 24070 Jul  9 22:11 8.sql
-rw-rw-r-- 1 aaa aaa    13 Jul 13 11:58 ads
drwxrwxr-x 2 aaa aaa     6 Jul 13 12:01 jjj
-rw-rw-r-- 1 aaa aaa   853 Jul 11 18:14 loan.csv

aaa@hadoopslave16:~/data/hive/aaa$ find ./ -size -1000c
./
./loan.csv
./ads
./jjj
aaa@hadoopslave16:~/data/hive/aaa$ find ./ -size +10000c
./2.sql
./6.sql
./4.sql
./8.sql
aaa@hadoopslave16:~/data/hive/aaa$ find ./ -size +10k
./2.sql
./6.sql
./4.sql
./8.sql

find、grep、xargs组合查找

find ./ -name '*'|xargs grep -i test

aaa@hadoopslave16:~/data/hive$ find ./ -name '*'|xargs grep -r -n -i risk.***
./aaa/6.sql:4:insert overwrite table risk.*** partition(dt)
./aaa/6.sql:4:insert overwrite table risk.*** partition(dt)
./aaa/6.sql:4:insert overwrite table risk.*** partition(dt)

xargs命令是给其他命令传递参数的一个过滤器,常作为组合多个命令的一个工具。它主要用于将标准输入数据转换成命令行参数,xargs能够处理管道或者标准输入并将其转换成特定命令的命令参数。也就是说find的结果经过xargs后,其实将find找出来的文件名逐个作为了grep的参数。grep再在这些文件内容中查找关键字test。


 

你可能感兴趣的:(Linux)