R语言入门2—数据载入篇

一、入门级函数

c, nchar, data, str, dim, names, row.names, head, tail, $, mean

create变量:dataName <- c("","")
字符数量:nchar()
导入数据:data(dataName)
print数据:dataName
数据结构:str(dataName)
数据维度:dim(dataName)
列名称:names(dataName)
行名称:row.names(dataName)
查看头6行:head(dataName)
查看尾6行:tail(dataName)
选择列:dataName$colName
查看均值:mean(dataName$colName)

二、载入数据

read.csv()

dataName <- read.csv('filepath or url')

与pandas类似,需要随时检查验证数据。用str、dim、head、tail、sample
再高级点的用summary、table。summary类似pd的describe,table有些类似value_counts。

三、数据子集化

常用:subset()

dataSubset() <- subset(data, yourcondition)

补充使用:[ ]

dataSubset() <- dataName[ROWs_conditon, COLs_condition] //行或列的选择条件为空时,表明选择所有数据

四、保存数据

write.table()

write.table(income_total, "data/income-totals.csv", row.names=FALSE, sep=",")
注意:别忘了设置参数sep,同时row.names推荐设置为FALSE(默认为TRUE)。


R技能高级水平资料:
使用R进行数据转化实例
R高级入门指南 ]

参考:
Loading Data and Basic Formatting in R | FlowingData
Quick-R: Subsetting Data

你可能感兴趣的:(R语言入门2—数据载入篇)