sklearn学习笔记(1)—make_blobs函数及参数

sklearn学习笔记(1)—make_blobs函数及参数

  • make_blobs函数

make_blobs函数

make_blobs函数是为聚类产生数据集,产生一个数据集和相应的标签
make_blobs(n_samples=100,n_features=2, centers=3, cluster_std=1.0, center_box=(-10.0,10.0), shuffle=True, random_state=None )

  1. n_samples=100 ,表示数据样本点个数,默认值100;
  2. n_features=2 ,是每个样本的特征(或属性)数,也表示数据的维度,默认值是2;
  3. centers=3 ,表示类别数(标签的种类数),默认值3;
  4. cluster_std=1.0 ,表示每个类别的方差,例如我们希望生成2类数据,其中一类比另一类具有更大的方差,可以将cluster_std设置为[1.0,3.0],浮点数或者浮点数序列,默认值1.0;
  5. center_box=(-10.0,10.0) ,中心确定之后的数据边界,默认值(-10.0, 10.0);
  6. shuffle=True ,将数据进行洗乱,默认值是True;
  7. random_state=None ,官网解释是随机生成器的种子,可以固定生成的数据,给定数之后,每次生成的数据集就是固定的。若不给定值,则由于随机性将导致每次运行程序所获得的的结果可能有所不同。在使用数据生成器练习机器学习算法练习或python练习时建议给定数值。

你可能感兴趣的:(sklearn,机器学习)