R语言sample函数

sample函数在机器学习中的作用比较大,因为它可以将数据按7:3或5:5等比例随机的分为训练集和测试集。


R语言sample函数_第1张图片
image.png

按其官方用法,


![image.png](https://upload-images.jianshu.io/upload_images/15565422-ea46affc8593cf41.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

X是要取的数据集,size是要取的个数,若size的个数大于X的个数,则replace=T,如果我们要把数据集按7:3的比例划分,则命令如下

ind <- sample(2, n, replace = TRUE,
prob = c(0.7, 0.3))
train <- dat[ind==1, ] 

你可能感兴趣的:(R语言sample函数)