SKlearn 随机生成测试样本——分类样本

from sklearn.datasets.samples_generator import make_classification
 
X, y = make_classification(n_samples=200, n_features=4, n_informative=2,
    n_redundant=2, n_classes=2, n_clusters_per_class=2, scale=7.0,
    random_state=3)
# n_samples:指定样本数
# n_features:指定特征数
# n_classes:指定几分类
# random_state:随机种子,使得随机状可重
plt.scatter(X[:,1:2],X[:,0:1])
plt.show()
#for x_,y_ in zip(X,y):
#    print y_,"  ",x_ 

 

n_features :特征个数= n_informative() + n_redundant + n_repeated
n_informative:多信息特征的个数
n_redundant:冗余信息,informative特征的随机线性组合
n_repeated :重复信息,随机提取n_informative和n_redundant 特征
n_classes:分类类别
n_clusters_per_class :某一个类别是由几个cluster构成的

你可能感兴趣的:(机器学习算法代码,数据生成)