sklearn.datasets.make_circles

目录

  • 参考资料

sklearn.datasets.make_circles(n_samples = 100,shuffle = True,noise = None,random_state = None,factor = 0.8)

作用:在 2d 中创建一个包含较小圆的大圆的样本集。

from sklearn.datasets import make_circles
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

X, y = make_circles(n_samples=1_000, factor=0.3, noise=0.05, random_state=0)
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=0)
_, (train_ax, test_ax) = plt.subplots(ncols=2, sharex=True, sharey=True, figsize=(8, 4))

train_ax.scatter(X_train[:, 0], X_train[:, 1], c=y_train)
train_ax.set_ylabel("Feature #1")
train_ax.set_xlabel("Feature #0")
train_ax.set_title("Training data")

test_ax.scatter(X_test[:, 0], X_test[:, 1], c=y_test)
test_ax.set_xlabel("Feature #0")
_ = test_ax.set_title("Testing data")
plt.show()

sklearn.datasets.make_circles_第1张图片

一个简单的玩具数据集,用于可视化聚类和分类算法。

参数:

n_samples : int,optional(默认值= 100# 生成的总点数。如果是奇数,则内圆将比外圆具有一个点。

shuffle : bool,optional(默认值= True# 是否洗牌样品。

noise: 双倍或无(默认=无)
# 高斯噪声的标准偏差加到数据上。

random_state : int,RandomState实例或None(默认)
# 确定数据集重排和噪声的随机数生成。传递一个int,用于跨多个函数调用的可重现输出。见术语表。

factor : 0 <double <1(默认值= .8# 内圈和外圈之间的比例因子。

返回值:
X : 形状数组 [n_samples,2] 生成的样本。

y : 形状数组[n_samples]
每个样本的类成员资格的整数标签(0 或 1)。

参考资料

[1] 官方链接;

你可能感兴趣的:(#,sklearn,sklearn,python,机器学习)