sklearn.linear_model.LogisticRegression参数使用

class sklearn.linear_model.LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1)

参数:penalty : 字符串, ‘l1’ or ‘l2’, 默认: ‘l2’

                             用于指定惩罚中使用的规范。“牛顿CG”、“SAG”和“LBFGS”解算器只支持L2惩罚。

                             版本0.19:La1惩罚与SAGA求解器(允许“多项”+L1)

dual : 布尔值, 默认: False

          双重或原始公式。双公式只适用于使用L2惩罚的线性求解器。当样本数> 特征数时,更推荐False。

tol : 浮点数, 默认: 1e-4

        两次迭代误差停止阈值。

C : 浮点数, 默认: 1.0

      正则化强度的逆;必须是正浮点。像支持向量机一样,较小的值指定更强的正则化。

fit_intercept :布尔值, 默认: True

       指定是否应将常数(A.K.偏差或截距)添加到决策函数中。建议设置 fit_intercept=True 并增大 intercept_scaling

intercept_scaling : 浮点数, 默认 1.

       只有在使用求解器“Libliear”和Self.fit_intercept截距被设置为true时才有用。在这种情况下,x变成[x,self.intercept_scaling],即,在实例向量中附加一个具有常数值等于intercept_scaling的“合成”特征。截距变为截距标度*综合特征权重.

       注意!合成特征权重与所有其他特征一样受L1/L2正则化的影响。为了减少正则化对合成特征权重的影响,因此intercept_scaling 必须增大。

class_weight :字典 or ‘balanced’, default: None

       与字典形式{类标签:权重}相关联的权重。如果没有给出,所有的类都设置为权重1。

       “平衡”模式使用y的值以n_.samples/(n_classes*np.bincount(y))的形式自动调整与输入数据中的类频率成反比的权重。

random_state :int,随机状态实例或无,可选,默认:无

       伪随机数生成器的种子,用于清洗数据。如果int,random_state是随机数生成器使用的种子;如果randomstate实例,random_state是随机数发生器;如果没有,随机数生成器使用的np.random的randomstate实例。当求解器="sag"或“linear”时使用。

solver : {‘newton-cg’, ‘lbfgs’, ‘liblinear’, ‘sag’, ‘saga’},

        注意,“洼地”和“传奇”的快速收敛仅保证具有近似相同尺度的特征。您可以用SkReln.PrimeCurror的标尺对数据进行预处理。

max_iter : int, default: 100

        仅适用于牛顿CG,SAG和LBFGS求解器。求解器收敛的最大迭代次数。

multi_class : str, {‘ovr’, ‘multinomial’}, default: ‘ovr’

        多选项可以是“OVR”或“多项式”。如果选择的选项是“OVR”,那么每个标签都适用于二进制问题。否则损失最小的是多项式损失拟合整个概率分布。不适用于线性求解器。

verbose : int, default: 0

        冗长0:不输出训练过程,静默输出;1:类似静默输出,只输出简洁信息;>1:对每个子模型都输出详细信息

warm_start : bool, default: False

        当设置为true时,重用一个以前的解决方案以适合初始化,否则,只是擦除以前的解决方案。对于线性求解器是没有用的。

n_jobs : int, default: 1

         如果multi_class =“OVR”,代表在类间并行化时使用的CPU核数。当将`solver`设置为'libli.'时,忽略此参数,而不管是否指定了'multi_class'。如果给定值为-1,则使用所有的核。

属性:

coef_ :决策函数中的特征系数,即权重系数。当给定的问题是二进制时,coef_形状是(1,n-特征)

intercept_:截距(a.k.a. bias)添加到决策函数中,即B值。如果fit_intercept截距设置为false,则截距设置为零。当问题是二进制时,截距是(1,)的形状。

n_iter_:所有类的实际迭代次数。如果是二进制或多项式,它只返回元素1。对于线性求解器,只给出了所有类的最大迭代次数。

你可能感兴趣的:(机器学习)