R语言—因子

一.介绍

  类比:性别:男、女

             年纪:一年级、二年级、三年级

二.基本语法

  factor(x=character(),levels,labels=levels,exclude=NA,order=is.ordered(x),nmax=NA)

  levels:用来指定因子可能的水平(缺省值是向量x中互异的值)

  labels:用来指定水平的名字

  exclude:表示从向量x中剔除的水平值

 1)

      因子为 A B C

 2)

R语言—因子_第1张图片

   指定因子是 A B,C的地方显示空,因子只有A B

 3)

R语言—因子_第2张图片

      指定因子代表的名字

 4)

R语言—因子_第3张图片

      剔除某一因子

三.创建因子

 colour<-c('G','G','R','Y','Y','R')

R语言—因子_第4张图片

  col<-factor(colour)

   colour是字符串类型,col是因子类型

R语言—因子_第5张图片

 col<-factor(colour,labels = c('green','red','yellow'))

 指定因子名字

R语言—因子_第6张图片

  as.vector  转化为向量

  R语言—因子_第7张图片

ps:

 R语言—因子_第8张图片

当调换因子型数据的取值水平(levels)或字符标签(labels)时,所得向量取值发生相应变化,即levels与labels有对应关系成立,但当不对levels或labels进行设置时,各个字符的数字代码则按照字母表顺序从1开始依此取值,如:

R语言—因子_第9张图片

R语言—因子_第10张图片

   因子型数据不可进行数值运算

   转换为数值型数据后可参与运算

四.有序因子

  1.ordered()

 R语言—因子_第11张图片

  2.cut()函数

 R语言—因子_第12张图片

   分组后,每个数值以组的形式出现

五.常用函数

 tapply()

R语言—因子_第13张图片

  根据gender分组求age的平均值

你可能感兴趣的:(R语言)