R语言学习笔记(6)(循环)

R语言中的*aplly函数主要是是采用split-apply-combine策略。其过程为先将传入*apply函数中的数据分割开,然后将传入*apply函数中的函数对每一个小部分进行调用,最后将结果整合成一个整体输出。

针对dataset(class:data.frame)的几种操作:

       1.dim(dataset)查看维度(几行,几列)。

       2.head(dataset)查看前六行数据(不包含变量名称)。

       3.如果知道每一列的名字,引用某一列的数据可以使用$ 符号,例如flags$orange引用了orange列的元素。 

       4.也可以采用引用matrix的策略例如flags[ ,11:17]引用11-17列的所有行的元素。

lappy的用法:lappy(data.frame|list,函数名(不带())),返回一个list包含着传入数据每一个元素经过函数处理后的结果。

sapply的用法与lapply相同,“s”代表simplify的意思会将返回的list直接转换为一个更加小巧的vector,如果无法转换则会同样返回一个list。

vapply的用法与sapply相差不大,都是将返回值简化成为一个vector。但是vapply允许定义返回的vector的格式,并且运行速度更快。

如:vapply(flags, unique, numeric(1))

将返回的vector的每个值的长度都定义为1。如果没有达到要求会报错。

tapply的用法与其他的循环函数用法都不相同。他允许按照某些标准或者因子对数据进行分割,基本形式为:tapply(被分割数据,分割数据的因子,函数)。

例如: tapply(flags$animate, flags$landmass, mean)。

几种统计函数:

mean(),对数据取平均值。

range(),返回数据的最大和最小值。

sum(),返回数据之和。

unique(),返回一个不包含重复元素的vector。

table(),统计一个容器中不同元素的出现次数。

summary(),统计最大最小中值和平均。

你可能感兴趣的:(R语言学习笔记(6)(循环))