API:class sklearn.mixture.
(n_components=1, covariance_type=’full’, tol=0.001, reg_covar=1e-06, max_iter=100, n_init=1, init_params=’kmeans’, weights_init=None, means_init=None, precisions_init=None, random_state=None, warm_start=False, verbose=0, verbose_interval=10)
n_components :混合元素(聚类)的数量,默认为1
covariance_type:描述要使用的协方差参数类型的字符串,必选一个(‘full’ , ‘tied’, ‘diag’, ‘spherical’),默认为full。
tol:float类型, 默认值: 0.001.收敛阈值,当平均增益低于这个值时迭代停止。
reg_covar:float类型, 协方差对角线上的非负正则化参数,默认值: 1e-6 接近于0.
init_params :可选 {‘kmeans’, ‘random’}, 默认值为 ‘kmeans’.初始化权重、均值及精度的方法,作用:用随机方法还是用kmeans方法初始化
precisions_init: 初始化精度列表,如果没有给定,那么使用init_params参数给定的方法来进行创建,默认为None,它的形状依靠协方差类型,
协方差类型 | 初始化精度形状 |
'spherical' | (n_components,) |
'tied' | (n_features, n_features) |
'diag' | (n_components, n_features) |
'full' | (n_components, n_features, n_features) |
random_state : 类型int, 随机数种子,默认为None.
verbose : int类型, 默认为0.作用:可以冗余输出,如果为1,它会打印正确的初始化结果和每一次迭代步骤。如果大于1,则打印日志概率和每一步所需的时间。
verbose_interval : int类型, 默认为 10.作用:下一次打印之前的迭代发生次数
weights_ : array-like, shape (n_components,),每个混合元素权重
means_ : array-like, shape (n_components, n_features),每个混合元素均值
covariances_ : array-like,每个混合元素的协方差,它的形状依靠协方差类型,
协方差类型 | 协方差形状 |
'spherical' | (n_components,) |
'tied' | (n_features, n_features) |
'diag' | (n_components, n_features) |
'full' | (n_components, n_features, n_features) |
precisions_ : array-like,每个混合元素精度矩阵,精度矩阵是协方差矩阵的逆。协方差矩阵是对称正定的,因此高斯混合可以用精度矩阵等价地参数化。存储精度矩阵而不是协方差矩阵使得在测试时间计算新样本的对数似然更有效。它的形状依靠协方差类型,
协方差类型 | 精度形状 |
'spherical' | (n_components,) |
'tied' | (n_features, n_features) |
'diag' | (n_components, n_features) |
'full' | (n_components, n_features, n_features) |
precisions_cholesky_ : array-like (同上)
converged_ : bool类型,在fit()中达到收敛时为true,否则为false。
lower_bound_ : float类型,EM最佳拟合的对数似然(与模型相关的训练数据)的下限值。
aic (self, X) |
Akaike information criterion for the current model on the input X. 在当前模型上输入X的Akaike信息准则 |
bic (self, X) |
Bayesian information criterion for the current model on the input X. 在当前模型上输入X的贝叶斯信息准则。 |
fit (self, X[, y]) |
Estimate model parameters with the EM algorithm. 用EM算法估计模型参数。 |
fit_predict (self, X[, y]) |
Estimate model parameters using X and predict the labels for X. 用X估计模型参数,并预测X的标签。 |
get_params (self[, deep]) |
Get parameters for this estimator. 获取这个算法的参数 |
predict (self, X) |
Predict the labels for the data samples in X using trained model. 使用训练模型预测X中数据样本的标签。 |
predict_proba (self, X) |
Predict posterior probability of each component given the data. 在给定数据的情况下,预测每个分量的后验概率。 |
sample (self[, n_samples]) |
Generate random samples from the fitted Gaussian distribution. 从拟合的高斯分布生成随机样本。 |
score (self, X[, y]) |
Compute the per-sample average log-likelihood of the given data X. 计算给定数据X的每个样本平均log似然函数 |
score_samples (self, X) |
Compute the weighted log probabilities for each sample. 计算每个样本的加权log概率。 |
set_params (self, \*\*params) |
Set the parameters of this estimator. 为算法设置参数 |
