1. shell 中判断文件是否存在或者是否为空文本
在lunix中写脚本时,总免不了判断文件是否存在,文件内容是否为空的等操作。而这些操作都可以用test指令来实现,可通过man test进行查看相关指令。
#! /bin/sh
if test -s file.txt;then
echo "hi"
else
echo "empty"
fi
### 另外一个等同的
#! /bin/sh
if [ -s file.txt ];then
echo "hi"
else
echo "empty"
fi
-f判断是不是文件; -d判断是不是目录;-e判断文件/目录是否存在;-s判断文件长度是否不为0,当-s后面跟目录是,总是返回真
2. R语言文件操作
R语言的基础函数中也囊括了文件夹和文件的基本操作函数,由于使用R的过程中会常常需要与文件打交道,因此一些基本的文件操作函数在实际使用中是十分常见的,这里做了一些简单的整理。
2.1 构建文件路径:
file.path(..., fsep = .Platform$file.sep)
file.path用于构建文件路劲,默认会使用.Platform$file.sep作为文件分隔符,因此可以实现跨平台操作,该函数实际较为常用。
#按向量中元素对应的位置生成文件路劲
file.path(c('C:', 'D:'), c('R_script', 'R_data'))
2.2 列出路劲下的文件/目录 :
#列出当前目录下的文件和文件夹
list.files(path = ".", pattern = NULL, all.files = FALSE,
full.names = FALSE, recursive = FALSE, ignore.case = FALSE,include.dirs = FALSE, no.. = FALSE)
#列出当前目录下的文件和文件夹
dir(path = ".", pattern = NULL, all.files = FALSE,
full.names = FALSE, recursive = FALSE, ignore.case = FALSE,include.dirs = FALSE, no.. = FALSE)
#列出当前目录下的所有子目录,默认recursive = TRUE
list.dirs(path = ".", full.names = TRUE, recursive = TRUE)
- path – 字符串表示的路劲全名,默认为当前工作路劲;
- pattern – 查找的文件名,支持正则表达式;
- all.files – 逻辑值,FALSE(默认)仅仅返回可见的文件名,TRUE返回文件全名;
- full.names – 逻辑值,FALSE(默认)仅返回文件名,TRUE返回文件名包括路劲;
- recursive – 逻辑值,FALSE(默认)仅返回当前目录下文件,TRUE递归的扫描所有目录下的文件;
- ignore.case – 逻辑值,FALSE(默认)文件名大小写敏感,TRUE忽略大小写;
- include.dirs -逻辑值,FALSE(默认)不添加子目录名,TRUE加入子目录名称;
- no.. – 逻辑值,FALSE(默认)不排除‘.’和‘..’,TRUE为排除;
返回给定路劲下文件名或文件夹组成的字符向量,如果没有返回空字符。如果给定的路劲不存在,或为非法路劲或没有读取权限,返回空字符。list.dirs隐式的包含all.files = TRUE。
2.3 创建文件夹及设置权限
path.expand(path)
dir.create(path, showWarnings = TRUE, recursive = FALSE, mode = "0777")
dir.exists(paths)
Sys.chmod(paths, mode = "0777", use_umask = TRUE)
Sys.umask(mode = NA)
path – 字符串表示的路劲,路劲已经过path.expand处理
paths – 字符向量包含文件名或路劲, 路劲已经过path.expand处理
showWarnings – 逻辑值,是否提示错误信息;
recursive – 逻辑值,是否创建子目录
mode – 八进制表示的权限,r=4,w=2,x=1 (windows环境下该参数无效)
use_umask – 逻辑值,mode是否受umask 设置的限制;
#例子
#读取环境变量R_USER,返回C:/Users/XXXX/Documents
Sys.getenv('R_USER')
#使用home path替换波浪号,返回C:/Users/XXXX/Documents/foo
path.expand("~/foo")
#在当前工作目录下创建文件夹testfolder
dir.create(file.path(getwd(), 'testfolder'))
#默认的recursive为FALSE,创建子目录失败
dir.create(file.path(getwd(), 'testfolder2', 'subfolder'))
#文件夹不存在返回FALSE
dir.exists(file.path(getwd(), 'testfolder2', 'subfolder'))
#设置recursive为TRUE,创建子目录
dir.create(file.path(getwd(), 'testfolder2', 'subfolder'), recursive = TRUE)
#创建成功返回TRUE
dir.exists(file.path(getwd(), 'testfolder2', 'subfolder'))
#设置文件目录的最大权限
Sys.chmod(list.dirs("."), "777")
2.4 查询和设置R包使用路径
.libPaths(new)
不带参数时.libPaths()会显示当前使用的R包路劲,设置参数可用于设置当前R包路径,对于安装多版本R语言的情况,可以通过使用.libPaths设置使用的R包路劲。
#例子
#设置R包路劲为R-3.2.2下的library
.libPaths("C:/Users/XXXX/Documents/R/R-3.2.2/library")
2.5文件处理
file.create(..., showWarnings = TRUE)
file.exists(...)
#成功返回0,失败返回-1
file.access(names, mode = 0)
file.remove(...)
#删除文件及目录
unlink(x, recursive = FALSE, force = FALSE)
file.rename(from, to)
file.append(file1, file2)
file.copy(from, to, overwrite = recursive, recursive = FALSE, copy.mode = TRUE, copy.date = FALSE)
file.show(..., header = rep("", nfiles),title = "R Information", delete.file = FALSE, pager = getOption("pager"), encoding = "")
file.symlink(from, to)
file.link(from, to)
Sys.junction(from, to)
- from, to - 字符串向量表示的文件或路径
- overwrite - 逻辑值,是否覆盖已存在的文件
- showWarnings – 逻辑值,出错是否显示warning信息
- recursive – 逻辑值,是否复制子目录文件
- copy.mode - 逻辑值,是否同时复制文件权限
- copy.date – 逻辑值,是否保留文件日期
- mode – 接入模式,0,是否存在;1,是否可执行(windows没有可执行概念, 后缀为.exe, .bat, .cmd或.com的文件会被视为可执行文件);2,是否可写;4,是否可读;
#文件不存在则创建文件,存在则覆盖之前的文件
file.create('cretestfile.txt')
#判断文件是否存在,返回TRUE
file.exists('cretestfile.txt')
#默认mode = 0判断文件是否存在,存在返回0
file.access('cretestfile.txt')
#删除文件cretestfile.txt,文件不存在会返回warning信息
file.remove('cretestfile.txt')
#读取bin目录下所有文件及目录
d <- dir(file.path(R.home(), "bin"))
#读取bin目录下所有文件及目录(包含全路径)
df <- dir(file.path(R.home(), "bin"), full.names = TRUE)
#列出所有存在的文件
d[file.access(df, 0) == 0]
#列出所有可执行文件
d[file.access(df, 1) == 0]
#列出所有可写文件
d[file.access(df, 2) == 0]
#列出所有可读文件
d[file.access(df, 4) == 0]
#创建并写入数据到文件A.txt和B.txt
cat("file A\n", file = "A.txt")
cat("file B\n", file = "B.txt")
cat("file C\n", file = "C.txt")
#添加文件C.txt的内容到A.txt和B.txt
file.append(c("A.txt", "B.txt"), "C.txt")
#修改文件名C.txt为D.txt
file.rename("C.txt", "D.txt")
#复制D.txt中的内容10遍,添加到文件A.txt和B.txt各5次
file.append(c("A.txt", "B.txt"), rep("D.txt", 10))
#读取文件A.txt和B.txt的内容
file.show(c("A.txt", "B.txt"))
#复制文件D.txt到C.txt
file.copy("D.txt", "C.txt")
#C.txt已存在,设置overwrite = TRUE进行覆盖
file.copy("D.txt", "C.txt", overwrite = TRUE)
#新建tmp文件夹,并拷贝A.txt和B.txt到tmp文件夹下
dir.create("tmp")
file.copy(c("A.txt", "B.txt"), "tmp")
#删除tmp文件夹
unlink("tmp", recursive = TRUE)
#删除文件
unlink(c("A.txt", "B.txt", "C.txt","D.txt"))
文件信息查询
file.info(..., extra_cols = TRUE)
file.mode(...)
file.mtime(...)
file.size(...)
file.info返回文件相关信息:
size – doule类型,表示文件大小Bytes
isdir – 逻辑值,表示是否文件夹或者文件
mode – 8进制表示的权限,r=4,w=2,x=1
mtime – 最近一次修改的时间
ctime – 最近一个状态改变的时间,例如在写入文件、更改所有者、权限、属性或链接设置,mtime的改变必然导致ctime的改变
atime -读取文件或者执行文件时更改
exe – 可执行类型,返回值包含no,msdos, win16, win32, win64 和unknown
~~~R
#返回当前目录下所有文件及目录的信息
file.info(list.files())
#返回当前目录下所有文件的mode
file.mode(list.files())
file.info(list.files())$mode
#返回当前目录下所有文件的最近一次修改时间
file.mtime(list.files())
file.info(list.files())$mtime
#返回当前目录下所有文件的大小,目录size返回为0
file.size(list.files(()))
file.info(list.files())$size