R语言sample函数

随机抽样又分为重复随机抽样(又称为“重抽样”或者“有放回抽样”)不重复随机抽样(又称为“没有放回的抽样”)两种。

  • 重复抽样是指:本次从整体中抽取出的数据样本,在下一次抽取时同样有机会被抽取。
  • 不重复抽样就是:一旦被抽取为样本,下次就不能再被抽取了。

sample函数可以完成随机抽样处理,其基本形式为:
sample(x, size, replace = FALSE)
具体参数说明:

  • x 整体数据,以向量形式给出
  • size 抽取样本的数目
  • replace
    • 如果为F(默认),则是不重复抽样,此时size不能大于x的长度;
    • 如果为T,则是重复抽样,此时size允许大于x的长度
  • prob 抽样向量中元素被抽到的可能性

相应的示例代码如下:

sample(c(1:20),size=10)  #在1~20数据中不重复地随机抽取10个元素作为样本
[1] 13  7  4  5  2 19 14  6 10  3
sample(c(1:20),size=30,replace=T)  #重复地随机抽取30个元素作为样本
[1]  7 11  2 11  7  3  1 13 12  4 19 11 16  4 18 13 13  5 17 11  3 15 17  5  1
[26] 15  5 12 10 10

参考:

R语言sample()函数 - 简书 (jianshu.com)

你可能感兴趣的:(R编程练习,r语言,笔记)