DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
n是要抽取的行数。(例如n=20000时,抽取其中的2W行)
frac是抽取的比列。(有一些时候,我们并对具体抽取的行数不关系,我们想抽取其中的百分比,这个时候就可以选择使用frac,例如frac=0.8,就是抽取其中80%)
replace:是否为有放回抽样,取replace=True时为有放回抽样。replace=False(默认就是False)是无放回的采样,当采样数n大于样本数且没有设置replace=True时,会出现异常
weights:指定样本抽中的概率,默认等概论抽样;
random_state:指定抽样的随机种子,可以使得每次抽样的种子一样,每次抽样结果一样