sklearn.datasets.make_circles()函数和make_moons()函数

sklearn.datasets.make_circles(n_samples = 100,shuffle = True,noise = None,random_state = None,factor = 0.8 )
作用:在2d中创建一个大圆包含小圆的的样本集。

一个简单的数据集,用于可视化聚类和分类算法。

	n_samples : int,optional(默认值= 100)
	生成的总点数。如果是奇数,则内圆将比外圆具有一个点。
	
	shuffle : bool,optional(默认值= True)
	是否洗牌样品。
	
	noise: 双倍或无(默认=无)
	高斯噪声的标准偏差加到数据上。
	
	random_state : int,RandomState实例或None(默认)
	确定数据集重排和噪声的随机数生成。传递一个int,用于跨多个函数调用的可重现输出。见术语表。
	
	factor : 0 <double <1(默认值= .8)
	内圈和外圈之间的比例因子。

返回值
X:[n_samples, 2]形状的数组,生成的样本

y:[n_samples]形状的数组,每个样本的标签(01

shuffle参数

为了便于查看,这里生成6个样本

当shuffle为True时,内外圆的数据是交叉出现

当shuffle为False时,内外圆的数据没有出现交叉
sklearn.datasets.make_circles()函数和make_moons()函数_第1张图片
sklearn.datasets.make_circles()函数和make_moons()函数_第2张图片
random_state参数

当random_state参数值相同时,生成的样本都相同

当random_state参数值不同时,生成的样本不相同

但是前提是shuffle参数必须为True
sklearn.datasets.make_circles()函数和make_moons()函数_第3张图片
sklearn.datasets.make_circles()函数和make_moons()函数_第4张图片
noise参数

当noise参数比较小时,取样点比较集中

当noise参数比较大时,取样点比较分散
sklearn.datasets.make_circles()函数和make_moons()函数_第5张图片
sklearn.datasets.make_circles()函数和make_moons()函数_第6张图片
factor参数

当factor较大时,内圆半径较大

当factor较小时,内圆半径较小
sklearn.datasets.make_circles()函数和make_moons()函数_第7张图片
sklearn.datasets.make_circles()函数和make_moons()函数_第8张图片
make_moons是函数用来生成2个月亮型数据集,在sklearn.datasets里,具体用法如下:

Parameters:	

n_samples : int, optional (default=100)

    The total number of points generated.
shuffle : bool, optional (default=True)

    Whether to shuffle the samples.
noise : double or None (default=None)

    Standard deviation of Gaussian noise added to the data.
random_state : int, RandomState instance or None (default)

    Determines random number generation for dataset shuffling and noise. Pass an int for reproducible output across multiple function calls. See Glossary.

Returns:	

X : array of shape [n_samples, 2]

    The generated samples.
y : array of shape [n_samples]

    The integer labels (0 or 1) for class membership of each sample.

主要参数作用如下:
n_numbers:生成样本数量

shuffle:是否打乱,类似于将数据集random一下

noise:默认是false,数据集是否加入高斯噪声

random_state:生成随机种子,给定一个int型数据,能够保证每次生成数据相同。

sklearn.datasets.make_moons(n_samples=100, shuffle=True, noise=None, random_state=None)
for example:

X, y = datasets.make_moons(500, noise=0.5)

你可能感兴趣的:(神经网络,sklearn,聚类,机器学习)