线性回归中关于特征收缩与选择的方法比较（七种常用的线性回归)（python-sklearn实现）

文章目录

什么是特征收缩或者特征选择
设置和数据加载
线性回归（Linear Regression）
偏差方差均衡
最佳子集回归（Best Subset Regression）
岭回归（Ridge Regression）
LASSO
弹性网（Elastic Net）
最小角度回归（Least Angle Regression）
主成分回归（Principal Components Regression）
偏最小二乘法（Partial Least Squares）
总结与回顾

本文讨论了线性回归中七种常用的特征收缩和选择方法的数学属性和实际的 Python 应用。

什么是特征收缩或者特征选择

在线性回归中，特征收缩或者特征选择意味着从可用特征中选择要包含在模型中的子集特征，从而减少其维数。另一方面，收缩意味着减小系数估计的大小（可将它们缩小到零）。请注意，如果系数缩小到恰好为零，则相应的变量将退出模型。因此，这种情况也可以看作是特征选择。

特征收缩或者特征选择旨在改进简单的线性回归。有两个主要原因可能需要改进：

预测准确性：线性回归估计倾向于具有低偏差和高方差（过拟合）。降低模型复杂性（需要估计的参数数量）以降低方差，增强模型的稳定性，但代价是引入更多偏差。如果我们能找到总误差的最佳位置，那么偏差导致的误差加上最小化方差的误差，便可以改进模型的预测精度。
模型的可解释性：由于预测变量太多，很难掌握变量之间的所有关系。在某些情况下，我们愿意确定影响最大的一小部分变量，从而牺牲一些变量以增强模型的可解释性。

设置和数据加载

先看看将要分析的数据集。它来自 Stamey 等人的一项研究。（1989）研究了不同临床测量对前列腺特异性抗原（PSA）水平的影响。任务是根据一组临床和人口统计学变量确定前列腺癌的风险因素。数据以及变量的一些描述可以在Hastie等人的网站上找到。或者这里给出数据或者评论邮箱地址发邮箱。

我们将首先导入本文中使用的模块，加载数据并将其拆分为训练和测试集，分别保留标签和特征。然后，我们将讨论每种特征收缩和选择方法，使其适合训练数据，并使用测试集检查它如何能够预测新数据的 PSA 水平。

# Import necessary modules and set options
import pandas as pd
import numpy as np
import itertools

from sklearn.linear_model import LinearRegression, RidgeCV, LassoCV, ElasticNetCV, LarsCV
from sklearn.cross_decomposition import PLSRegression
from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
from sklearn.model_selection import GridSearchCV

import warnings
warnings.filterwarnings("ignore")

# Load data
data = pd.read_csv("prostate_data.txt", sep = "\t")
print(data.head())

# Train-test split
y_train = np.array(data[data.train == "T"]['lpsa'])
y_test = np.array(data[data.train == "F"]['lpsa'])
X_train = np.array(data[data.train == "T"].drop(['lpsa', 'train', 'Unnamed: 0'], axis=1))
X_test = np.array(data[data.train == "F"].drop(['lpsa', 'train', 'Unnamed: 0'], axis=1))

线性回归（Linear Regression）

从简单的线性回归开始，它将目标变量 $y$ 建模为 $p$ 个预测变量或特征 $X$ 的线性组合：
$\mathcal{f}(X) = \beta_0 + \sum_{j=1}^{p}X_j \beta_j$

该模型具有必须从训练数据估计的 $p + 2$ 个参数：

$p$ 个特征的 $p$ 个 $\beta$ 系数，表示相应的特征对预测目标的影响;
一个截距参数，表示为上面的 $β_0$ ，它是在所有X都为零的情况下的预测。没有必要将它包含在模型中，实际上在某些情况下应该将其删除（例如，如果想要包含表示分类变量级别的全部虚拟对象），如果你将在下面看到它，通常它会给模型更大的灵活性;
高斯误差项的一个方差参数。

通常使用普通最小二乘法（OLS）估计这些参数。OLS最小化均方误差，由下式给出
$RSS(\beta) = \sum_{i=1}^{N}(y_i - f(x_i))^2$
$=\sum_{i=1}^{N}(y_i -\beta_0-\sum_{j=1}^{p}x_{ij}\beta_j)^2$

可视化：只有一个预测变量X，我们处于由预测变量和目标形成的 2D 空间中。在此设置中，模型在 X，Y 中拟合这样的线最接近所有数据点的空间，接近度测量为所有数据点的垂直距离平方和，如左图。如果有两个预测变量X1和X2，则空间增长到3D，现在模型拟合最接近3D空间中所有点的平面，如右图。有了两个以上的特征，就变成了有点抽象的超平面。可视化也有助于了解截距如何为模型提供更大的灵活性：如果包含它，它允许线或平面不跨越空间的原点。

上述最小化问题证明具有解析解，并且β参数可以计算为：
$\hat{\beta} = (X^TX)^{-1}X^Ty$
证明参见

在 X 矩阵中包括一列 1 ，允许表达上述公式中的β帽矢量的截距部分。“β”上方的“帽子”表示它是基于训练数据的估计值。

偏差方差均衡

在统计学中，要考虑估计量的两个关键特征：偏差和方差。偏差是真实总体参数和预期估计量之间的差异。它衡量估计数的不准确性。另一方面，方差衡量它们之间的差异。

显然，如果模型太简单，偏差和方差都会损害模型的预测性能。然而，线性回归倾向于受到方差的影响，同时具有低偏差。如果模型中存在许多预测特征或者它们彼此高度相关，则尤其如此。这就是子集化和正则化来拯救的地方。它们允许以引入一些偏差为代价来减少方差，最终减少模型的总误差。

在详细讨论这些方法之前，让我们将线性回归拟合到前列腺数据中并检查其样本外的平均预测误差（MAE）。

linreg_model = LinearRegression(normalize=True).fit(X_train, y_train)
linreg_prediction = linreg_model.predict(X_test)
linreg_mae = np.mean(np.abs(y_test - linreg_prediction))
linreg_coefs = dict(
    zip(['Intercept'] + data.columns.tolist()[1:-2],
        np.round(np.concatenate((linreg_model.intercept_, linreg_model.coef_),
        axis=None), 3))
)
print(data.columns.tolist()[1:-2], (linreg_model.intercept_, linreg_model.coef_))
print('Linear Regression MAE: {}'.format(np.round(linreg_mae, 3)))
print('Linear Regression coefficients:', linreg_coefs)

Linear Regression MAE: 0.523
Linear Regression coefficients: {'Intercept': 0.429, 'lcavol': 0.577, 'lweight': 0.614, 'age': -0.019, 'lbph': 0.145, 'svi': 0.737, 'lcp': -0.206, 'gleason': -0.03, 'pgg45': 0.009}

最佳子集回归（Best Subset Regression）

选择线性回归变量子集的直接方法是尝试所有可能的组合，并选择一个最小化某些标准的组合。这就是 Best Subset Regression 的目标。对于每一个 $\in {1，2，...，P}$ ，其中 p 是可用特征的总数，它选择大小的子集 ķ 给出最小的均方误差。然而，平方和不能用作确定 k 本身的标准，因为它必然随 k 减小：模型中包含的变量越多，其残差越小。但这并不能保证更好的预测性能。这就是为什么应该使用另一个标准来选择最终模型的原因。对于预测模型，测试测试数据上的（可能是交叉验证的）均方误差是常见的选择。

由于最佳子集回归没有在任何Python包中实现，我们必须手动循环 k 和 k 大小的所有子集。以下代码块完成了这项工作。

results = pd.DataFrame(columns=['num_features', 'features', 'MAE'])

# Loop over all possible numbers of features to be included
for k in range(1, X_train.shape[1] + 1):
    # Loop over all possible subsets of size k
    for subset in itertools.combinations(range(X_train.shape[1]), k):
        linreg_model = LinearRegression(normalize=True).fit(X_train[:, subset], y_train)
        linreg_prediction = linreg_model.predict(X_test[:, subset])
        linreg_mae = np.mean(np.abs(y_test - linreg_prediction))
        results = results.append(pd.DataFrame([{'num_features': k,
                                                'features': subset,
                                                'MAE': linreg_mae}]))

# Inspect best combinations
results = results.sort_values('MAE').reset_index()
print(results.head())

# Fit best model

# get corresponding feature describe
feature_describe = data.columns.tolist()[1:-2]
best_subset_feature_index = results['features'][0]
best_subset_feature_describe = []
for index in best_subset_feature_index:
    best_subset_feature_describe.append(feature_describe[index])


best_subset_model = LinearRegression(normalize=True).fit(X_train[:, results['features'][0]], y_train)
best_subset_coefs = dict(
    zip(['Intercept'] + best_subset_feature_describe,
        np.round(np.concatenate((best_subset_model.intercept_, best_subset_model.coef_), axis=None), 3))
)

print('Best Subset Regression MAE: {}'.format(np.round(results['MAE'][0], 3)))
print('Best Subset Regression coefficients:', best_subset_coefs)

results = pd.DataFrame(columns=['num_features', 'features', 'MAE'])

# Loop over all possible numbers of features to be included
for k in range(1, X_train.shape[1] + 1):
    # Loop over all possible subsets of size k
    for subset in itertools.combinations(range(X_train.shape[1]), k):
        subset = list(subset)
        linreg_model = LinearRegression(normalize=True).fit(X_train[:, subset], y_train)
        linreg_prediction = linreg_model.predict(X_test[:, subset])
        linreg_mae = np.mean(np.abs(y_test - linreg_prediction))
        results = results.append(pd.DataFrame([{'num_features': k,
                                                'features': subset,
                                                'MAE': linreg_mae}]))

# Inspect best combinations
results = results.sort_values('MAE').reset_index()
print(results.head())

# Fit best model
best_subset_model = LinearRegression(normalize=True).fit(X_train[:, results['features'][0]], y_train)
best_subset_coefs = dict(
    zip(['Intercept'] + data.columns.tolist()[1:-1],
        np.round(np.concatenate((best_subset_model.intercept_, best_subset_model.coef_), axis=None), 3))
)

print('Best Subset Regression MAE: {}'.format(np.round(results['MAE'][0], 3)))
print('Best Subset Regression coefficients:', best_subset_coefs)

   index       MAE            features num_features
0      0  0.466876     (0, 1, 2, 4, 7)            5
1      0  0.467043  (0, 1, 2, 4, 6, 7)            6
2      0  0.471730     (0, 1, 2, 4, 6)            5
3      0  0.478344        (0, 1, 4, 7)            4
4      0  0.479609        (0, 1, 4, 6)            4
Best Subset Regression MAE: 0.467
Best Subset Regression coefficients: {'Intercept': -0.599, 'lcavol': 0.497, 'lweight': 0.81, 'age': -0.012, 'svi': 0.413, 'pgg45': 0.005}

岭回归（Ridge Regression）

最佳子集回归（BSR）的一个缺点是它没有告诉我们关于从模型中排除的特征对响应变量的影响。岭回归提供了这种硬选择的替代方案，将这些特征分成包含在模型中的和不包含的。相反，它惩罚系数以将它们缩小到零。不完全为零，因为这意味着从模型中排除，但是在零方向上，这可以被视为以连续方式降低模型的复杂性，同时将所有变量保持在模型中。

在岭回归中，线性回归损失函数以这样的方式增强，不仅可以最小化差方和，还可以惩罚参数估计的大小：
$\mathcal{L}_{ridge}(\hat\beta )=\sum_{i=1}^{n}(y_i-x_i'\hat\beta)^2+\lambda\sum_{j=1}^{m}\hat{\beta_j}^2=||y-X\hat{\beta}||^2+\lambda||\hat\beta||^2$

解决这个最小化问题解析解：
$\hat{\beta}^{ridge} = (X^TX+\lambda I)^{-1}X^Ty$

其中 I 表示单位矩阵。惩罚项λ是要选择的超参数：其值越大，系数越向零收缩。从上面的公式可以看出，当 λ 变为零时，加性罚分消失，β-ridge 与线性回归中的 β-OLS 相同。另一方面，当 λ 增长到无穷大时，β-ridge 接近于零：在足够高的惩罚下，系数可以任意地收缩到接近零。

但这种收缩是否真的会导致减少模型的方差，但会以承诺的方式引入一些偏差？是的，确实如此，从岭回归估计的偏差和方差的公式中可以清楚地看出：随着λ的增加，偏差也随之增加，而方差则下降！
$Bias(\hat{\beta}_{ridge}) = -\lambda(X'X+\lambda I)^{-1}\beta$
$Var(\hat{\beta_{ridge}})=\sigma^2(X'X+\lambda I)^{-1}X'X(X'X+\lambda I)^{-1}$

现在，如何选择 λ 的最佳值？运行交叉验证尝试一组不同的值，并选择一个最小化测试数据上交叉验证错误的值。

# ridge regression
ridge_cv = RidgeCV(normalize=True, alphas=np.logspace(-10, 1, 400))
ridge_model = ridge_cv.fit(X_train, y_train)
ridge_prediction = ridge_model.predict(X_test)
ridge_mae = np.mean(np.abs(y_test - ridge_prediction))
ridge_coefs = dict(
    zip(['Intercept'] + data.columns.tolist()[1:-2],
        np.round(np.concatenate((ridge_model.intercept_, ridge_model.coef_),
                                axis=None), 3))
)

print('Ridge Regression MAE: {}'.format(np.round(ridge_mae, 3)))
print('Ridge Regression coefficients:', ridge_coefs)

Ridge Regression MAE: 0.517
Ridge Regression coefficients: {'Intercept': 0.155, 'lcavol': 0.51, 'lweight': 0.605, 'age': -0.016, 'lbph': 0.14, 'svi': 0.692, 'lcp': -0.134, 'gleason': 0.009, 'pgg45': 0.008}

LASSO

Lasso，或最小绝对收缩和选择算子，在精髓上与岭回归非常相似。它还为损失函数的非零系数增加了一个惩罚，但与惩罚平方系数之和（所谓的 L2 惩罚）的岭回归不同，LASSO惩罚它们的绝对值之和（ L1 惩罚）。因此，对于 λ 的高值，许多系数在 LASSO 下完全归零，这在岭回归中从未如此。

它们之间的另一个重要区别是它们如何解决这些特征之间的多重共线性问题。在岭回归中，相关变量的系数趋于相似，而在 LASSO 中，其中一个通常为零，另一个则分配整个影响。因此，如果存在大约相同值的许多大参数，即当大多数预测变量真正影响响应时，预期岭回归将更好地工作。另一方面，当存在少量重要参数且其他参数接近于零时，即当只有少数预测因子实际影响响应时，LASSO效果更好。

然而，在实践中，人们不知道参数的真实值。因此，岭回归和 LASSO 之间的选择可以基于样本外预测误差。另一种选择是将这两种方法合二为一，就是下一种回归方法。

LASSO的损失函数如下：
$\mathcal{L}_{lasso}(\hat\beta) = \sum_{i=1}^{n} (y_i-x'_i\hat\beta)^2+\lambda\sum_{j=1}^{m}|\hat\beta_j|$

与岭回归不同，这种最小化问题无法通过分析解决。幸运的是，有数值算法可以处理它。

# LASSO
lasso_cv = LassoCV(normalize=True, alphas=np.logspace(-10, 1, 400))
lasso_model = lasso_cv.fit(X_train, y_train)
lasso_prediction = lasso_model.predict(X_test)
lasso_mae = np.mean(np.abs(y_test - lasso_prediction))
lasso_coefs = dict(
    zip(['Intercept'] + data.columns.tolist()[1:-2],
        np.round(np.concatenate((lasso_model.intercept_, lasso_model.coef_), axis=None), 3))
)

print('LASSO MAE: {}'.format(np.round(lasso_mae, 3)))
print('LASSO coefficients:', lasso_coefs)

LASSO MAE: 0.5
LASSO coefficients: {'Intercept': 0.074, 'lcavol': 0.459, 'lweight': 0.456, 'age': -0.0, 'lbph': 0.05, 'svi': 0.352, 'lcp': 0.0, 'gleason': 0.0, 'pgg45': 0.002}

弹性网（Elastic Net）

弹性网首先是针对 LASSO 的劣势而产生的，LASSO的变量选择过于依赖数据，因而不稳定。它的解决方案是将 Ridge Regression 和 LASSO 的惩罚结合起来，以获得两全其美的效果。弹性网旨在最大限度地减少包括 L1 和 L2 惩罚的损失函数：
$\mathcal{L}_{enet}(\hat\beta)=\frac{\sum_{i=1}^{n}(y_i-x'_i\hat\beta)^2}{2n}+\lambda (\frac{1-\alpha}{2}\sum_{j=1}^{m}\hat\beta_j^2+\alpha\sum_{j=1}^{m}|\hat\beta_j|)$
其中 α 是岭回归（当它为零时）和 LASSO（当它为1时）之间的混合参数。可以使用基于 scikit-learn 的基于交叉验证的超左侧调整来选择最佳α。

# Elastic Net
elastic_net_cv = ElasticNetCV(normalize=True, alphas=np.logspace(-10, 1, 400),
                              l1_ratio=np.linspace(0, 1, 100))
elastic_net_model = elastic_net_cv.fit(X_train, y_train)
elastic_net_prediction = elastic_net_model.predict(X_test)
elastic_net_mae = np.mean(np.abs(y_test - elastic_net_prediction))
elastic_net_coefs = dict(
    zip(['Intercept'] + data.columns.tolist()[1:-2],
        np.round(np.concatenate((elastic_net_model.intercept_,
                                 elastic_net_model.coef_), axis=None), 3))
)

print('Elastic Net MAE: {}'.format(np.round(elastic_net_mae, 3)))
print('Elastic Net coefficients:', elastic_net_coefs)

Elastic Net MAE: 0.5
Elastic Net coefficients: {'Intercept': 0.074, 'lcavol': 0.459, 'lweight': 0.456, 'age': -0.0, 'lbph': 0.05, 'svi': 0.352, 'lcp': 0.0, 'gleason': 0.0, 'pgg45': 0.002}

最小角度回归（Least Angle Regression）

到目前为止，我们已经讨论了一种子集化方法，最佳子集回归和三种收缩方法：岭回归，LASSO及其组合，弹性网络。本节专门介绍位于子集和收缩之间的方法：最小角度回归（LAR）。该算法以零模型开始，所有系数等于零，然后迭代地工作，在每个步骤将一个变量的系数移向其最小二乘值。

更具体地说，LAR从识别与响应最相关的变量开始。然后，它将该变量的系数连续地移向其最小平方值，从而降低其与演化残差的相关性。一旦另一个变量在与残差的相关性方面“赶上”，该过程就会暂停。然后，第二个变量加入有效集，即具有非零系数的变量集，并且它们的系数以保持其相关性连接和减少的方式一起移动。继续该过程直到所有变量都在模型中，并以完全最小二乘拟合结束。

下面的代码块将LAR应用于前列腺数据。

LAR_cv = LarsCV(normalize=True)
LAR_model = LAR_cv.fit(X_train, y_train)
LAR_prediction = LAR_model.predict(X_test)
LAR_mae = np.mean(np.abs(y_test - LAR_prediction))
LAR_coefs = dict(
    zip(['Intercept'] + data.columns.tolist()[1:-2],
        np.round(np.concatenate((LAR_model.intercept_, LAR_model.coef_), axis=None), 3))
)

print('Least Angle Regression MAE: {}'.format(np.round(LAR_mae, 3)))
print('Least Angle Regression coefficients:', LAR_coefs)

Least Angle Regression MAE: 0.499
Least Angle Regression coefficients: {'Intercept': 0.05, 'lcavol': 0.46, 'lweight': 0.46, 'age': 0.0, 'lbph': 0.054, 'svi': 0.362, 'lcp': 0.0, 'gleason': 0.0, 'pgg45': 0.002}

主成分回归（Principal Components Regression）

我们已经讨论了选择变量（子集）和降低系数（收缩）的方法。本文中介绍的最后两种方法采用了稍微不同的方法：它们将原始要素的输入空间挤压到较低维度的空间中。主要是，他们使用X创建一小组新特征Z，它们是X的线性组合，然后在回归模型中使用它们。

这两种方法中的第一种是主成分回归。它应用主成分分析，这种方法允许获得一组新特征，彼此不相关且具有高方差（以便它们可以解释目标的方差），然后将它们用作简单线性回归中的特征。这使得它类似于岭回归，因为它们都在原始特征的主成分空间上运行（对于基于PCA的岭回归推导，参见[参考文献1]）。不同之处在于 PCR 丢弃具有最少信息功能的成分，而Ridge Regression只是将它们缩小得更强。

要重新获得的成分数量可以视为超参数，并通过交叉验证进行调整，如下面的代码块中的情况。

# Principal Components Regression
regression_model = LinearRegression(normalize=True)
pca_model = PCA()
pipe = Pipeline(
    steps=[
        ('pca', pca_model), ('least_squares', regression_model)])
param_grid = {'pca__n_components': range(1, 9)}
search = GridSearchCV(pipe, param_grid)
pcareg_model: GridSearchCV = search.fit(X_train, y_train)
pcareg_prediction = pcareg_model.predict(X_test)
pcareg_mae = np.mean(np.abs(y_test - pcareg_prediction))
n_comp = list(pcareg_model.best_params_.values())[0]
pcareg_coefs = dict(
    zip(['Intercept'] + ['PCA_comp_' + str(x) for x in range(1, n_comp + 1)],
        np.round(np.concatenate((pcareg_model.best_estimator_.steps[1][1].intercept_,
                                 pcareg_model.best_estimator_.steps[1][1].coef_), axis=None), 3))
)

print('Principal Components Regression MAE: {}'.format(np.round(pcareg_mae, 3)))
print('Principal Components Regression coefficients:', pcareg_coefs)

实验降到7个成分时测试结果最佳：

Principal Components Regression MAE: 0.504
Principal Components Regression coefficients: {'Intercept': 2.452, 'PCA_comp_1': 0.019, 'PCA_comp_2': -0.018, 'PCA_comp_3': -0.114, 'PCA_comp_4': 0.495, 'PCA_comp_5': 0.513, 'PCA_comp_6': -0.46, 'PCA_comp_7': -0.468}

偏最小二乘法（Partial Least Squares）

本文讨论的最终方法是偏最小二乘法（PLS）。与主成分回归类似，它也使用原始要素的一小组线性组合。不同之处在于如何构建这些组合。虽然主成分回归仅使用 X 自身来创建派生特征 Z，但偏最小二乘另外使用目标 y。因此，在构建 Z 时，PLS 寻找具有高方差的方向（因为这些可以解释目标中的方差）以及与目标的高相关性。这与主成分回归形成对比，主成分回归仅关注高方差。

在 PLS 下，第一个新特征 z1 被创建为所有特征 X 的线性组合，其中每个 Xs 由其内积与目标 y 加权。然后，y 在 z1上回归，给出 PLS β 系数。最后，所有 X 都相对于 z1 正交化。然后，该过程重新开始 z2 并继续，直到获得 Z 中所需的组件数量。像往常一样，这个数字可以通过交叉验证来选择。

可以证明，尽管 PLS 根据需要缩小了 Z 中的低方差分量，但它有时会使高方差分量膨胀，这可能导致在某些情况下更高的预测误差。这似乎是我们的前列腺数据的情况：PLS 在所有讨论的方法中表现最差。

# Partial Least Squares
pls_model_setup = PLSRegression(scale=True)
param_grid = {'n_components': range(1, 9)}
search = GridSearchCV(pls_model_setup, param_grid)
pls_model = search.fit(X_train, y_train)
pls_prediction = pls_model.predict(X_test)
pls_mae = np.mean(np.abs(y_test - pls_prediction))
pls_coefs = dict(
  zip(data.columns.tolist()[1:-2],
      np.round(np.concatenate((pls_model.best_estimator_.coef_), axis=None), 3))
)

print('Partial Least Squares Regression MAE: {}'.format(np.round(pls_mae, 3)))
print('Partial Least Squares Regression coefficients:', pls_coefs)

Partial Least Squares Regression MAE: 1.008
Partial Least Squares Regression coefficients: {'lcavol': 0.281, 'lweight': 0.186, 'age': 0.087, 'lbph': 0.101, 'svi': 0.213, 'lcp': 0.187, 'gleason': 0.131, 'pgg45': 0.171}

总结与回顾

由于模型参数的大变化，线性模型具有许多可能相关的特征，在预测精度和模型的可解释性方面失败。这可以通过减少方差来缓解，这种方差只能以引入一些偏差为代价。找到最佳的偏差 - 方差权衡点可以优化模型的性能。

允许实现此目的的两大类方法是子集和收缩。前者选择变量的子集，而后者将模型的系数缩小为零。这两种方法都会降低模型的复杂性，从而导致参数方差的减少。

本文讨论了几种子集和收缩方法：

最佳子集回归（BSR）迭代所有可能的特征组合以选择最佳特征组合;
岭回归（Ridge Regression）惩罚平方系数值（ L2 惩罚），限制权值大小;
LASSO 惩罚系数的绝对值（L1惩罚），这可以迫使它们中的一些精确为零;
弹性网（Elastic Net）结合了 L1 和 L2 的惩罚，集合了 Ridge 和 Lasso 的优势;
最小角度回归（LAR）适用于子集和收缩之间：它迭代地工作，在每个步骤中添加其中一个特征的“某个部分”;
主成分回归（PCR）执行PCA将原始特征压缩为一小部分新特征，然后将其用作预测变量;
偏最小二乘回归（PLS）也将原始特征概括为较小的新特征子集，但与 PCR 不同，它也利用目标构建它们。

正如您在上面运行代码块时从应用程序看到的前列腺数据，大多数这些方法在预测准确性方面表现相似。前5种方法的误差范围在0.467和0.517之间，略优于最小二乘误差为 0.523。最后两个，PCR 略好，PLS 表现一般，可能是由于数据中没有那么多特征，因此降维的收益是有限的。

参考:

Hastie，T.，Tibshirani，R。，和Friedman，JH（2009）。统计学习的要素：数据挖掘，推理和预测。第2版。纽约：施普林格。

https://www.datacamp.com/community/tutorials/tutorial-ridge-lasso-elastic-net

英文原文出自：https://towardsdatascience.com/a-comparison-of-shrinkage-and-selection-methods-for-linear-regression-ee4dd3a71f16

你可能感兴趣的:(机器学习,回归,机器学习公式推导理解)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
如何成为段子手欣雅阅读
我是一个尬聊大师，与朋友聊天经常把话题聊死，留我一个人在群里，望着自己打下的最后一句话无语凝噎。看到风趣幽默的朋友与人聊天，很是艳羡，觉得自己何时才能成为这样的段子手呢？一、段子是什么？“段子”一词在百度百科上的解释：本是相声中的一个艺术术语，指的是相声作品中一节或一段艺术内容。我的理解：段子就是一些搞笑的故事或者笑话。二、为什么要会说段子？不知道大家有没有这样的朋友，本来很无趣的聚会，只要有他参
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
心有蓝天白云，爱情便会晴空万里，然后有花香有鸟鸣有美好的未来曹十二吖
丁南的婚姻，来自于一场她对生命的对比。她曾经说过，当她最爱的母亲用生命去逼迫她结婚的时候，她曾一度不理解到愤怒，甚至于想过用轻生来对抗母亲的不理智。庆幸的是，丁南是一个自我调节能力非常强的人，她想如果我连死亡都不怕，还怕不能经营好一段婚姻吗？抱着这样的念头，24年没有谈过恋爱的她，用短短三个月的时间，完成了少女到女人的蜕变。她曾经说过：“我要把自己最珍贵的东西留给自己命中注定的那个人。”闺蜜几人中
Redis系列：Geo 类型赋能亿级地图位置计算 Ly768768 redis bootstrap 数据库
1前言我们在篇深刻理解高性能Redis的本质的时候就介绍过Redis的几种基本数据结构，它是基于不同业务场景而设计的：动态字符串(REDIS_STRING)：整数(REDIS_ENCODING_INT)、字符串(REDIS_ENCODING_RAW)双端列表(REDIS_ENCODING_LINKEDLIST)压缩列表(REDIS_ENCODING_ZIPLIST)跳跃表(REDIS_ENCODI
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
如何选择最适合你的项目研发管理软件？TAPD卓越版全面解析北京云巴巴信息技术有限公司产品经理需求分析
在当今快速发展的科技时代，项目研发管理软件已成为企业不可或缺的重要工具。面对市场上琳琅满目的产品，如何选择一款适合自己团队的项目研发管理软件呢？本文将围绕项目研发管理软件的选择标准，重点介绍TAPD卓越版的特点、优势以及使用体验，让你更好地理解和选择适合自己的项目研发管理软件。项目研发管理软件的选择标准在选择项目研发管理软件时，我们需要考虑以下几个方面的因素：功能全面性：软件是否覆盖了从需求管理、
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
STM32中的计时与延时 lupinjia STM32 stm32 单片机
前言在裸机开发中，延时作为一种规定循环周期的方式经常被使用，其中尤以HAL库官方提供的HAL_Delay为甚。刚入门的小白可能会觉得既然有官方提供的延时函数，而且精度也还挺好，为什么不用呢？实际上HAL_Delay中有不少坑，而这些也只是HAL库中无数坑的其中一些。想从坑里跳出来还是得加强外设原理的学习和理解，切不可只依赖HAL库。除了延时之外，我们在开发中有时也会想要确定某段程序的耗时，这就需要
关于Mysql 中 Row size too large (＞ 8126) 错误的解决和理解秋刀prince mysql mysql 数据库
提示：啰嗦一嘴，数据库的任何操作和验证前，一定要记得先备份！！！不会有错；文章目录问题发现一、问题导致的可能原因1、页大小2、行格式2.1compact格式2.2Redundant格式2.3Dynamic格式2.4Compressed格式3、BLOB和TEXT列二、解决办法1、修改页大小（不推荐）2、修改行格式3、修改数据类型为BLOB和TEXT列4、其他优化方式（可以参考使用）4.1合理设置数据
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
JVM、JRE和 JDK：理解Java开发的三大核心组件 Y雨何时停T Java java
Java是一门跨平台的编程语言，它的成功离不开背后强大的运行环境与开发工具的支持。在Java的生态中，JVM（Java虚拟机）、JRE（Java运行时环境）和JDK（Java开发工具包）是三个至关重要的核心组件。本文将探讨JVM、JDK和JRE的区别，帮助你更好地理解Java的运行机制。1.JVM：Java虚拟机（JavaVirtualMachine）什么是JVM？JVM，即Java虚拟机，是Ja
如何在心上用功？余超林AIA财富管家
思考：如何在心上用功？学习心得：心-道-德-事的理解心-道-德-事这四部曲，本质上就是一个人的思维智慧的四个层面：事是最底层，这是所有人在这个社会谋求生存的基础，一个人能够把事情彻底做好，保质保量的完成，才会有真正的结果，但是这个层面要获得真正成功很困难，因为会做事的人很多，最终会出现恶性竞争；德是第三层，如果说整个社会做事的竞争激烈程度为100%，那么上升到德上的竞争激烈程度降低为80%，德是一
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
逻辑思维的过程与力量解晓萱
之前我对逻辑思维的了解停留在，讲话时有逻辑，辩论时条理清晰。今天看了《开讲了》里面关于大学生质疑易中天老师的视频，听到易中天老师的回答，忽然对逻辑思维有了稍微深刻的理解。图片发自App逻辑学对我们太重要了，不仅仅是学习备考，更重要的是生活和事业及交流的选择及过程。偏激的起点和性格有关，更和逻辑思维水平有关。视频里，易中天老师评价北大学生逻辑时讲到：“他的逻辑环节是没问题的，但是逻辑起点错了，所以他
好习惯:锻炼孩子的思考力好习惯2011
家长在教育孩子时，应积极鼓励孩子提问，让孩子尽量相信自己能够解决问题，还要注意激发孩子的好奇心，使孩子对所探究的问题产生强烈的求知欲望。在适当的时候，家长们也要问孩子一些问题，锻炼孩子的思考能力。只要我们愿意，就可以用适合孩子年龄的理解的方式和语言，引导孩子进行思考，并学到知识。知识是一环扣一环的，我们为孩子解开一个谜，就为解开下一个谜作了准备，只要我们用心，孩子的知识链条就会越接越长。孩子们在学
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
Spring MVC 全面指南：从入门到精通的详细解析一杯梅子酱技术栈学习 spring mvc java
引言：SpringMVC，作为Spring框架的一个重要模块，为构建Web应用提供了强大的功能和灵活性。无论是初学者还是有一定经验的开发者，掌握SpringMVC都将显著提升你的Web开发技能。本文旨在为初学者提供一个全面且易于理解的学习路径，通过详细的知识点分析和实际案例，帮助你快速上手SpringMVC，让学习过程既深刻又高效。一、SpringMVC简介1.1什么是SpringMVC？Spri
人与人之间的相遇，是天意，人与人之间的分离，常在人为。雨墨笔谈
人际关系，是我们生活中不可或缺的一部分。然而，如何与他人和谐相处，维系友情和爱情，却是一门艺术，需要智慧、耐心去领悟。不强求才是人与人之间最舒服的相处方式。这一理念代表着我们与世界相处的智慧，也是我们与他人建立持久友情和幸福感情的关键。理解与尊重人际关系中，理解和尊重是金科玉律。当我们能够以开放的心态去理解他人，不仅可以减少冲突，还可以建立更深刻的关系。正如有这样一句话说到：“你无法选择你的亲人，
【旅行故事】强个体与好组织相互成就@稀土永磁Amy@20220205@上海稀土永磁Amy
我们每个人都在组织当中。当你来到组织中，都要理解个体跟组织的关系和组织中个体的关系。一个组织产生高绩效的时候，其实是需要组织个体的发展跟组织发展之间要有一个匹配程度。有时也会看到一个组织当中，一些个体会觉得发展的不够充分，原因就在于个体的发展速度超过了组织的发展速度。还有一些时候我们会发现，组织要淘汰很多个体，原因也在于组织发展的速度超越了个体发展的速度。按照这个逻辑，无论是组织的视角还是个体的视
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &