R语言随机抽样sample

在模拟实际数据情况时,常常会使用随机抽样函数来从整体中挑出部分样本数据。随机抽样又分为重复随机抽样和不重复随机抽样两种。重复抽样是指:本次从整体中抽取出的数据样本,在下一次抽取时同样有机会被抽取。不重复抽样就是:一旦被抽取为样本,下次就不能再被抽取了。

sample函数可以完成随机抽样处理,其基本形式为:
sample(x, size, replace = FALSE)

具体参数的含义如表2-21所示。

表2-21 sample函数参数说明
参数 说明
x 整体数据,以向量形式给出
size 抽取样本的数目
replace 如果为F(默认),则是不重复抽样,此时size不能大于x的长度;
如果为T,则是重复抽样,此时size允许大于x的长度

相应的示例代码如下:
3 sample(c(1:20),size=10)  #在1~20数据中不重复地随机抽取10个元素作为样本
4  [1]  8  2 20 11 14  6 19  1 12  9
5 sample(c(1:20),size=30,replace=T)  #重复地随机抽取30个元素作为样本
6  [1]  8 20 12 15  8  6 13  9  2 10  7  2 11  8 17  3 16  7 11  9 15 18  9  5
7 [25] 16  1 18  1 11  2

你可能感兴趣的:(R)