R语言cut函数

功能:数值型变量转变为因子变量
cut将x的范围划分为若干个区间,并根据这些区间对x中的值进行编码。最左边的区间对应于第一级,第二左的区间对应第二级。
cut(x, breaks, labels = NULL,
    include.lowest = FALSE, right = TRUE, dig.lab = 3,
    ordered_result = FALSE, ...)

x:数值型向量

break 可以为自定义的分组也可以为大于等于2的数字,如果是数字,则软件会自动均分数值间的距离,如果不想均分,可以自定义分类距离
right 代表区间的左右端开和闭 默认为true,代表左开又闭,当设置成False的时候,为左闭右开
label 为标签向量,代表给每段间距设置一个标签,相当于每个间距给一个名字

Z <- stats::rnorm(10000)
table(cut(Z, breaks = -6:6))
(-6,-5] (-5,-4] (-4,-3] (-3,-2] (-2,-1]  (-1,0]   (0,1]   (1,2]   (2,3]   (3,4]   (4,5] 
      0       0      17     232    1348    3457    3317    1393     227       9       0 
  (5,6] 
      0 

sum(table(cut(Z, breaks = -6:6, labels = FALSE)))
sum(graphics::hist(Z, breaks = -6:6, plot = FALSE)$counts)

 

你可能感兴趣的:(R语言)