python随机生成高斯分布_机器学习中会涉及到的随机选择样本

今日分享

随机抽样

机器学习中会涉及到随机选择样本的问题,在python中random模块能解决,使用sample函数从数据集中选择指定个数的样本。

使用sample抽样

本篇小例子仅先试用python的内置模块,同时为了方便大家观察,生成100个随机整数,而不是0~1的随机浮点数。

1 生成100个随机整数randint两个参数表示[0,50]间的随机整数

from random import randint
lst = [randint(0,50) for _ in range(100)]
print(lst[:5])# [38, 19, 11, 3, 6]

2 从中随机选择10个样本

sample第二个参数是选择样本的个数

from random import sample
lst_sample = sample(lst,10)
print(lst_sample) # [33, 40, 35, 49, 24, 15, 48, 29, 37, 24]

random模块其他有用的方法

1 shuffle用来重洗数据集,比如打乱lst:

from random import shuffle
shuffle(lst)
print(lst[:5]) # [50, 3, 48, 1, 26]

可看到与之前的lst前五个元素已经不同

值得注意shuffle是对lst就地(in place)洗牌,节省存储空间

2 random()生成0~1内均匀分布的随机数

from random import random
print(random()) # 0.18433776565885795

3 生成高斯分布的随机数 gauss(0,1):均值为0,标准差为1的高斯分布

from random import Random
print(Random().gauss(0,1)) # 0.5373139942865103
print(Random().gauss(0,1)) # -0.37857290369435453

近期小例子:使用namedtuple的小例子; pkuseg 做分词,超级nice~; 写一个装饰器:统计异常发生次数和时间;对象可被调用的实现方法;求任意维度两点间距离; 两种合并字典的方法对比; 计算和聚合同时进行; groupby 分组; plotly画柱状图+折线图;

最新总结:82页《Python之路1.1.pdf》下载方式,关注《Python小例子》并在其后台回复 mypy,即可下载。

python随机生成高斯分布_机器学习中会涉及到的随机选择样本_第1张图片

Python小例子,长按关注

后期计划:不断深入Python小例子,添加更多基于Python的小例子,不限于:PyQt制作GUINumPy数值计算Pandas数据分析Sklearn机器学习实战Keras+TensorFlow深度学习等。2.0版本预计在春节前发出来。

如果你想每天看到小例子的更新动态,欢迎star这个小例子库,我们也真诚欢迎你贡献小例子,直接点击文章最下的阅读原文

你可能感兴趣的:(python随机生成高斯分布)