class sklearn.linear_model.
LogisticRegression
(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, intercept_scaling=1, class_weight=None, random_state=None, solver='liblinear', max_iter=100, multi_class='ovr', verbose=0, warm_start=False, n_jobs=1)
参数:penalty : 字符串, ‘l1’ or ‘l2’, 默认: ‘l2’
用于指定惩罚中使用的规范。“牛顿CG”、“SAG”和“LBFGS”解算器只支持L2惩罚。
版本0.19:La1惩罚与SAGA求解器(允许“多项”+L1)
dual : 布尔值, 默认: False
双重或原始公式。双公式只适用于使用L2惩罚的线性求解器。当样本数> 特征数时,更推荐False。
tol : 浮点数, 默认: 1e-4
两次迭代误差停止阈值。
C : 浮点数, 默认: 1.0
正则化强度的逆;必须是正浮点。像支持向量机一样,较小的值指定更强的正则化。
fit_intercept :布尔值, 默认: True
指定是否应将常数(A.K.偏差或截距)添加到决策函数中。建议设置 fit_intercept=True
并增大 intercept_scaling
intercept_scaling : 浮点数, 默认 1.
只有在使用求解器“Libliear”和Self.fit_intercept截距被设置为true时才有用。在这种情况下,x变成[x,self.intercept_scaling],即,在实例向量中附加一个具有常数值等于intercept_scaling的“合成”特征。截距变为截距标度*综合特征权重.
注意!合成特征权重与所有其他特征一样受L1/L2正则化的影响。为了减少正则化对合成特征权重的影响,因此intercept_scaling 必须增大。
class_weight :字典 or ‘balanced’, default: None
与字典形式{类标签:权重}相关联的权重。如果没有给出,所有的类都设置为权重1。
“平衡”模式使用y的值以n_.samples
/(n_classes*np.bincount(y))的形式自动调整与输入数据中的类频率成反比的权重。
random_state :int,随机状态实例或无,可选,默认:无
伪随机数生成器的种子,用于清洗数据。如果int,random_state是随机数生成器使用的种子;如果randomstate实例,random_state是随机数发生器;如果没有,随机数生成器使用的np.random的randomstate实例。当求解器="sag"或“linear”时使用。
solver : {‘newton-cg’, ‘lbfgs’, ‘liblinear’, ‘sag’, ‘saga’},
注意,“洼地”和“传奇”的快速收敛仅保证具有近似相同尺度的特征。您可以用SkReln.PrimeCurror的标尺对数据进行预处理。
max_iter : int, default: 100
仅适用于牛顿CG,SAG和LBFGS求解器。求解器收敛的最大迭代次数。
multi_class : str, {‘ovr’, ‘multinomial’}, default: ‘ovr’
多选项可以是“OVR”或“多项式”。如果选择的选项是“OVR”,那么每个标签都适用于二进制问题。否则损失最小的是多项式损失拟合整个概率分布。不适用于线性求解器。
verbose : int, default: 0
冗长0:不输出训练过程,静默输出;1:类似静默输出,只输出简洁信息;>1:对每个子模型都输出详细信息
warm_start : bool, default: False
当设置为true时,重用一个以前的解决方案以适合初始化,否则,只是擦除以前的解决方案。对于线性求解器是没有用的。
n_jobs : int, default: 1
如果multi_class =“OVR”,代表在类间并行化时使用的CPU核数。当将`solver`设置为'libli.'时,忽略此参数,而不管是否指定了'multi_class'。如果给定值为-1,则使用所有的核。
属性:
coef_ :决策函数中的特征系数,即权重系数。当给定的问题是二进制时,coef_形状是(1,n-特征)
intercept_:截距(a.k.a. bias)添加到决策函数中,即B值。如果fit_intercept截距设置为false,则截距设置为零。当问题是二进制时,截距是(1,)的形状。
n_iter_:所有类的实际迭代次数。如果是二进制或多项式,它只返回元素1。对于线性求解器,只给出了所有类的最大迭代次数。