2022-04-26

day5 R数据结构知识——罗wb

R数据处理.png

数据的输入

1.键盘输入

edit()
先创建一空数据框或矩阵:data.frame(),参数设置其变量名及变量类型——赋值对象 <- edit(),在调用的编辑器中键入数据后关闭编辑器——fix(),参数为赋值对象

2.从带分隔符的文本文件如cvs、txt、tsv等导入数据(其中csv为逗号分隔文件,txt为空格分隔文件,tsv为制表符分隔文件)

read.table() 读取txt、tsv文件
read.csv() 读取csv文件
赋值对象 <- read.table(files, options) #用于处理字符串并返回数据框或读入一个表格形式的文件并将其保存为一个数据框
options有:
header 是否指定文件第一行为变量名
sep 默认值为sep=" ",表示一或多个空格、制表符、换行或回车; sep=","可读取用逗号分隔行内数据的文件,sep="\t"读取使用制表符分隔行内数据的文件

3.从excel中导入

3.1 在excel中将其导出为cvs文件,并用2导入
3.2 xlsx包,read.xlsx(file,n),file为excel簿的所在路径,n则为导入的工作表序号

4.导入(上次)R格式的数据

load("文件名.RData") #再次使用RData时的加载命令

数据的处理

1.元素提取

其中X可为元素、向量或数据框


参考自生信星球.jpg

生信星球.jpg

2.设置行名、列名

参考自生信星球.jpg

同理col.names 可指定一个包含变量名的字符向量,若header=F且col.names未设置,则变量会被分别命名为V1、V2等。
row.names=F则不需要行标记符

3.赋值

生信星球.jpg

ps:赋值为<-

数据保存与导出

数据保存

save.image("bioinfoplanet.RData") #保存当前环境的所有/全局变量
save(X, "文件名.RData")#保存其中一个变量(X为欲保存的变量的名称)

数据导出

write.table(X, file,options) #X可为变量或数据框,file的类型为txt或tsv
write.csv(X, file,options) #X可为变量或数据框,file的类型为csv

代码报错

1.确实不存在X这个对象;
2.x的大小写错误

你可能感兴趣的:(2022-04-26)