weixin_43178406

多元（一元）线性回归&多项式回归

1. 多元线性回归基本假定与表达式

1.1 基本假定

回归模型是正确设定的
解释变量 $x_1,x_2,..,x_m$ 是非随机的或固定的，且各 $x_j$ 之间不存在严格线性相关性（无完全多重共线性）
各解释变量在所抽取的样本中具有变异性，且随着样本容量的无限增加，各解释变量的样本方差趋于一个非零的有限常数。（大样本性质，伪回归问题）
随机误差项零均值、同方差、序列不相关
解释变量与随机变量不相关（只要4中的零均值假设成立，本条假设一定成立）
随机项满足正态分布

1.2 具体值的表达方式

$\begin{bmatrix} \hat{y_1}\\ \hat{y_2}\\ ...\\ \hat{y_n} \end{bmatrix}= \begin{bmatrix} x_{11}&x_{12}&...&x_{1m}\\ x_{21}&x_{22}&...&x_{2m}\\ ...&...&...&....\\ x_{n1}&x_{n2}&...&x_{nm}\\ \end{bmatrix}* \begin{bmatrix} \omega_1\\ \omega_2\\ ...\\ \omega_m \end{bmatrix}+ \begin{bmatrix} b_1\\ b_2\\ ...\\ b_m \end{bmatrix}+ \begin{bmatrix} \epsilon_1\\ \epsilon_2\\ ...\\ \epsilon_m \end{bmatrix}$
其中 $x_{ij}$ 表示第i个样本第j个变量；
$\omega_i$ 为参数；
$b_i$ 为截距项；
因此x的每一行代表一个样本，每一列代表一个特征；y是一个向量；x是一个矩阵； $\omega$ 是一个向量。有时候，为了省略b，会默认x有m+1个随机变量，但x的元素是常数1，形式如下：
$\begin{bmatrix} \hat{y_1}\\ \hat{y_2}\\ ...\\ \hat{y_n} \end{bmatrix}= \begin{bmatrix} 1&x_{11}&x_{12}&...&x_{1m}\\ 1&x_{21}&x_{22}&...&x_{2m}\\ ...&...&...&...&....\\ 1&x_{n1}&x_{n2}&...&x_{nm}\\ \end{bmatrix}* \begin{bmatrix} \omega_1\\ \omega_2\\ ...\\ \omega_m \end{bmatrix}+ \begin{bmatrix} \epsilon_1\\ \epsilon_2\\ ...\\ \epsilon_m \end{bmatrix}$
在进行推导的过程的一般采用第二种形式，下述表达形式中仍采用含有b的，方便理解。

1.3 向量表达形式

上述说过
$\vec{y}=\omega_1\vec{x_1}+\omega_2\vec{x_2}+...+\omega_m\vec{x_m}+\vec{b}+\vec{\epsilon}$

1.4 矩阵表达方式

$\vec{y}=X\vec{\omega}+\vec{\epsilon}$
其中， $X=(\vec{x_1},\vec{x_2},...,\vec{x_m})$ 或者 $X=(\vec{x^1},\vec{x^2},...,\vec{x^m})^T$
$\vec{x}$ 下标表示特征，上标表示样本。

2. 多元线性回归求解

2.1 矩阵解

多元回归的解方法有最小二乘估计、极大似然估计、矩估计等，最小二乘估计的参数结果是一种无偏估计（前提是变量y服从正态分布，以及后面的假设检验都是在正态分布的假设下才成立的），因此应用最为广泛。
最小二乘估计即残差和最小，表达式如下：
$\min\limits_{\omega}\sum\limits_{i=1}^{n}=(y_i-\hat{y_i})=(y_i-(x^{i})^T)·\omega$

$\min\limits_{\omega}||\vec{y}-X\vec{\omega}||^2=\min\limits_{\omega}(\vec{y}-X\vec{\omega})^T(\vec{y}-X\vec{\omega})$
第二种方式也是范数的表达形式。求解最小值的过程是先求导，再令导数为0。
具体推导过程如下：

注意事项：

逆矩阵存在的充分必要条件是特征矩阵不存在多重共线性，即线性代数中的非线性。多重共线性的解决方式见下方（lasso回归和领回归）。但是，当X真存在多重共线性，但又没注意到时，此时的逆就是伪逆（加号逆）。多元回归还涉及异方差性等，可见博客：回归模型概述。
实际中，数据非常大，求解 $X^TX)^{-1}$ 是非常难，因此 $X^TX$ 采用奇异值分解的方法（方阵逆和伪逆均适用）。

2.2 代数解

求偏导：

上述截图来自王黎明的应用回归分析

2.3 几何解

2.3.1 线性方程组的几何意义

从行的角度看：
线性方程组的解就是直线a和直线b的交点，如下图左

从上图右可以更全面理解线性方程组，其维度取决于有几个变量x，解得情况取决于每个方程构成的空间图是否存在交点，如果无交点即无解；只有一个交点，有唯一解；相交是一条线或面或超空间的面，有无穷多解。
从列的角度看

维度取决于样本个数。如果向量 $x_1=(1,0,0)和向量x_2=(0,1,0)$ 可以通过倍数张成组合成向量 $\vec{y}=(1,1,0)$ 则方程存在解，该例子中 $\omega_1=1,\omega_2=1$ 。即 $\omega_1*\vec{x_1}+\omega_2*\vec{x_2}=1*(1,0,0)+2*(0,1,0)=\vec{y}$
假如现在是三个样本、三个特征对应的线性方程组，是否有解的几何意义为向量 $\vec{y}$ 是否可以通过 $\vec{x_1},\vec{x_2},\vec{x_3}$ 的线性组合构成。
换句话说向量 $\vec{y}$ 是否在向量 $\vec{x_1},\vec{x_2},\vec{x_3}$ 所构成的平面或者空间中，该平面或空间记做 $\Omega$ 。如果不在，则无解，如果在，则可能有无穷多解也可能只有一个解。故无解时， $\vec{y}$ 不在 $\Omega$ 中；有解时， $\vec{y}$ 在 $\Omega$ 中，但存在唯一解和无穷解两种情况。

2.3.2 最小二乘法

最小二乘法就是解一个无解的线性方程组
以下图为例：

要找到解，就是找到 $\omega_1,\omega_2$ 与向量 $x_1,x_2$ 的一个线性组合，使得组合后的向量刚好等于 $\vec{y}$ 。换句话说，要想有解， $\vec{y}$ 必须落在 $x_1,x_2$ 所构成的空间 $\Omega$ 上。但是向量 $\vec{y}$ 并不在空间 $\Omega$ 上。
不能找到解，就寻找一个近似解
找不到完美解，只能找一个最接近的解，所以在空间 $\Omega$ 上找一个最接近向量 $\vec{y}$ 的替代向量 $\vec{\hat y}$ .
$\vec{\hat y}$ 就是向量 $\vec{y}$ 到空间 $\Omega$ 上的投影。利用投影垂直的性质，可以得到：
$(\vec{y}-\vec{\hat y})^Tx_1=0 ...and ...(\vec{y}-\vec{\hat y})^Tx_2=0$
令 $X=(x_1,x_2)$ ， $\vec{\hat y}=\omega_1x_1+\omega_2x_2=X\vec{\omega}$ ，扩展到高维转化成矩阵形式：
$(\vec{y}-\vec{\hat y})^TX=0\rightarrow (\vec{y}-X\vec{\omega})^TX=0$ 。
因此 $\vec{\omega}=(X^TX)^{-1}X^T\vec{y}$
所以，最小二乘法的几何意义是高维空间的一个向量（由y数据决定）在低维子空间（由X数据以及多项式的次数决定）的投影。

2.4 正交投影矩阵

结合上述，若存在矩阵P使得 $P\vec{y} =\vec{\hat y}$ ，则称P为正交投影矩阵。推理可得， $P=X(X^TX)^{-1}X^T$

3. sklearn中linear model模块简介

3.1 总体概述

3.2 linear_model.LinearRegression

LinearRegression使用的是矩阵求解的方式，并且没有正则化项

from sklearn import datasets
boston = datasets.load_boston()
X = boston.data
X.shape
y = boston.target
X = X[y < 50]
y = y[y < 50]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 666)

from sklearn.preprocessing import StandardScaler #最大最小值方法用MinMaxScaler
standardScaler = StandardScaler()#创建实例
standardScaler.fit(X_train) #拟合
standardScaler.mean_ #均值
standardScaler.scale_ #描述数据分布范围
X_train = standardScaler.transform(X_train)#此时x_train本身没有改变，故需要一个变量承接
X_test = standardScaler.transform(X_test)

from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X_train, y_train)
y_predict = lin_reg.predict(X_test)
lin_reg.intercept_#截距
lin_reg.score(X_test, y_test)
lin_reg.coef_

'''获得均方误差'''
from sklearn.metrics import mean_squared_error
mean_squared_error(y_test, y_predict)

4. 多重共线性

上述中讲到多重共线性，指矩阵X存在线性相关，求解过程中可以理解为 $X^TX)$ 的行列式为0（精确相关关系）或者非常接近于0（高度相关关系）。解决多重共线性的方法有三种：

这三种手段中，第一种相对耗时耗力，需要较多的人工操作，并且会需要混合各种统计学中的知识和检验来进行使用。在机器学习中，能够使用一种模型解决的问题，我们尽量不用多个模型来解决，如果能够追求结果，我们会尽量避免进行一系列检验。况且，统计学中的检验往往以“让特征独立”为目标，与机器学习中的”稍微有点相关性也无妨“不太一致。
第二种手段在现实中应用较多，不过由于理论复杂，效果也不是非常高效，因此向前逐步回归不是机器学习的首选。
机器学习的核心是使用第三种方法：改进线性回归来处理多重共线性。为此，一系列算法，岭回归， Lasso，弹性网就被研究出来了。

5. 岭回归

5.1 原理简介

在线性模型之中，除了线性回归之外，最知名的就是岭回归与Lasso了。这两个算法非常神秘，他们的原理和应用都不像其他算法那样高调，学习资料也很少。这可能是因为这两个算法不是为了提升模型表现，而是为了修复漏洞而设计的（实际上，我们使用岭回归或者Lasso，模型的效果往往会下降一些，因为我们删除了一小部分信息），因此在结果为上的机器学习领域颇有些被冷落的意味。
岭回归在多元线性回归的损失函数上加上了L2正则项，表达如下：

求解过程如下：

一个矩阵存在逆的充要条件为其行列式不等于0，换句话说，将矩阵通过行列变换成上三角矩阵后，对角线元素不含有0元素。假如X存在多重共线性，则 $X^TX$ 经过行列变换后的上三角矩阵对角线存在0元素，但是加上 $\alpha$ 后，就不为0了，因此消除了多重共线性。除非：

岭回归中，当 $\alpha>0$ 时， $X^TX$ 加上一个数，故矩阵变大，因此逆矩阵减小，所以岭回归有压缩系数的作用，因此，岭回归中 $\alpha$ 一般取大于0的数（虽然理论上也是可以小于0的）。

5.2 sklearn简介

其他参数，一般不会去设置，可以暂时不做了解。

from sklearn import datasets
boston = datasets.load_boston()
X = boston.data
X.shape
y = boston.target
X = X[y < 50]
y = y[y < 50]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 666)

from sklearn.preprocessing import StandardScaler #最大最小值方法用MinMaxScaler
standardScaler = StandardScaler()#创建实例
standardScaler.fit(X_train) #拟合
standardScaler.mean_ #均值
standardScaler.scale_ #描述数据分布范围
X_train = standardScaler.transform(X_train)#此时x_train本身没有改变，故需要一个变量承接
X_test = standardScaler.transform(X_test)

from sklearn.linear_model import Ridge
Ridge_reg = Ridge()
Ridge_reg.fit(X_train, y_train)
y_predict = Ridge_reg.predict(X_test)
Ridge_reg.intercept_#截距
Ridge_reg.score(X_test, y_test)
Ridge_reg.coef_

'''获得均方误差'''
from sklearn.metrics import mean_squared_error
mean_squared_error(y_test, y_predict)

5.3 选择最佳参数 $\alpha$

5.3.1 岭迹图

既然要选择 $\alpha$ 的范围，我们就不可避免地要进行最优参数的选择。在各种机器学习教材中，总是教导使用岭迹图来判断正则项参数的最佳取值。传统的岭迹图长这样，形似一个开口的喇叭图（根据横坐标的正负，喇叭有可能朝右或者朝左）：

这一个以正则化参数 $\alpha$ 为横坐标，线性模型求解的系数 $\omega$ 为纵坐标的图像，其中每一条彩色的线都是一个系数 $\omega$ 。其目标是建立正则化参数与系数 $\alpha$ 之间的直接关系，以此来观察正则化参数的变化如何影响了系数 $\alpha$ 的拟合。岭迹图认为，线条交叉越多，则说明特征之间的多重共线性越高。我们应该选择系数较为平稳的喇叭口所对应的 $\alpha$ 取值作为最佳的正则化参数的取值。绘制岭迹图的方法非常简单，代码如下：


import numpy as np
import matplotlib.pyplot as plt from sklearn import linear_model
#创造10*10的希尔伯特矩阵
X = 1. / (np.arange(1, 11) + np.arange(0, 10)[:, np.newaxis]) y = np.ones(10)
#计算横坐标 n_alphas = 200
alphas = np.logspace(-10, -2, n_alphas)

#建模，获取每一个正则化取值下的系数组合
coefs = []
for a in alphas:
ridge = linear_model.Ridge(alpha=a, fit_intercept=False) ridge.fit(X, y)
coefs.append(ridge.coef_)

#绘图展示结果
ax = plt.gca() ax.plot(alphas, coefs) ax.set_xscale('log')
ax.set_xlim(ax.get_xlim()[::-1])	#将横坐标逆转
plt.xlabel('正则化参数alpha') plt.ylabel('系数w') plt.title('岭回归下的岭迹图') plt.axis('tight')
plt.show()

然而，并不建议使用岭迹图来作为寻找最佳参数的标准。有这样的两个理由：

岭迹图的很多细节，很难以解释。比如为什么多重共线性存在会使得线与线之间有很多交点？当很大了之后看上去所有的系数都很接近于0，难道不是那时候线之间的交点最多吗？

岭迹图的评判标准，非常模糊。哪里才是最佳的喇叭口？哪里才是所谓的系数开始变得”平稳“的时候？一千个读 者一千个哈姆雷特的画像？未免也太不严谨了。

5.3.2 RidgeCV

在现实中，真正应用来选择正则化系数的技术是交叉验证，并且选择的标准非常明。sklern中使用RindgeCV

from sklearn import datasets
boston = datasets.load_boston()
X = boston.data
X.shape
y = boston.target
X = X[y < 50]
y = y[y < 50]
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state = 666)

from sklearn.preprocessing import StandardScaler #最大最小值方法用MinMaxScaler
standardScaler = StandardScaler()#创建实例
standardScaler.fit(X_train) #拟合
standardScaler.mean_ #均值
standardScaler.scale_ #描述数据分布范围
X_train = standardScaler.transform(X_train)#此时x_train本身没有改变，故需要一个变量承接
X_test = standardScaler.transform(X_test)

from sklearn.linear_model import RidgeCV
RidgeCV_reg = RidgeCV(alphas = (0.1, 0.01, 0.001),cv = 5)
RidgeCV.fit(X_train, y_train)
y_predict = RidgeCV_reg.predict(X_test)
RidgeCV.intercept_#截距
RidgeCV.score(X_test, y_test)
RidgeCV.coef_

6. Lasso回归

6.1 原理简介

Lasso全称最小绝对收缩和选择算子（least absolute shrinkage and selection operator），由于这个名字过于复杂所以简称为Lasso。和岭回归一样，Lasso是被创造来作用于多重共线性问题的算法，不过Lasso使用的是系数的L1范式（L1范式则是系数的绝对值）乘以正则化系数，所以 Lasso的损失函数表达式为：
$\min\limits_{\omega}||X\omega-y||_2^2+\alpha||\omega||_1$
有些教材说，Lasso与岭回归非常相似，都是利用正则项来对原本的损失函数形成一个惩罚，以此来防止多重共线性。这种说法不是非常严谨。当我们使用最小二乘法来求解Lasso中的参数，我们依然对损失函数进行求导：

现在问题又回到了 $X^TX$ 的逆是否存在。在岭回归中，通过正则化系数，能够向方阵 $X^TX$ 加上一个单位矩阵，以此来防止方阵 $X^TX$ 的行列式为0，而现在L1范式所带的正则项在求导之后并不带有这个项，因此它无法对 $X^TX$ 造成任何影响。也就是说，Lasso无法解决特征之间”精确相关“的问题。当使用最小二乘法求解线性回归时，如果线性回归无解或者报出零错误，换Lasso不能解决任何问题。
岭回归可以解决特征间的精确相关关系导致的最小二乘法无法使用的问题，而Lasso不行。幸运的是，在现实中我们其实会比较少遇到“精确相关”的多重共线性问题，大部分多重共线性问题应该是“高度相关“，假设方阵 $X^TX$ 的逆是一定存在，那么：

通过增大 $\alpha$ ，可以为 $\omega$ 的计算增加一个负项，从而限制参数估计中 $\omega$ 的大小，而防止多重共线性引起的参数 $\omega$ 估计过大导致模型失准的问题。Lasso不是从根本上解决多重共线性问题，而是限制多重共线性带来的影响。何况，这还是在假设所有的系数都为正的情况下，假设系数 $\omega$ 无法为正，则很有可能需要将正则项参数 $\alpha$ 设定为负，因此 $\alpha$ 可以取负数，并且负数越大，对共线性的限制也越大。
岭回归和Lasso回归都会压缩系数的大小，对标签贡献更少的特征的系数会更小，也会更容易被压缩。不过，L2正则化只会将系数压缩到尽量接近0，但L1正则化主导稀疏性，因此会将系数压缩到0。这个性质，让Lasso成为了线性模型中的特征选择工具首选。

6.2 特征选择

import numpy as np import pandas as pd
from sklearn.linear_model import Ridge, LinearRegression, Lasso from sklearn.model_selection import train_test_split as TTS
from sklearn.datasets import fetch_california_housing as fch import matplotlib.pyplot as plt

housevalue = fch()

X = pd.DataFrame(housevalue.data) y = housevalue.target
X.columns = ["住户收入中位数","房屋使用年代中位数","平均房间数目"
,"平均卧室数目","街区人口","平均入住率","街区的纬度","街区的经度"]

X.head()

Xtrain,Xtest,Ytrain,Ytest = TTS(X,y,test_size=0.3,random_state=420)

#恢复索引
for i in [Xtrain,Xtest]: i.index = range(i.shape[0])

#岭回归进行拟合
Ridge_ = Ridge(alpha=0.01).fit(Xtrain,Ytrain) (Ridge_.coef_*100).tolist()
#Lasso进行拟合
lasso_ = Lasso(alpha=0.01).fit(Xtrain,Ytrain) (lasso_.coef_*100).tolist()

6.3选择最佳的正则化参数

使用交叉验证的Lasso类参数与岭回归略有不同，这是由于Lasso对于alpha的取值更加敏感，因此往往让 $\alpha$ 在很小的空间中变动。这个小空间小到超乎人们的想象（不是0.01到0.02之间这样的空间，这个空间对lasso而言还是太大了），因此设定了一个重要概念**“正则化路径”(regularization path)**：假设特征矩阵中有n个特征，则就有特征向量 $x_1,x_2,...,x_n$ 。对于每一个 $\alpha$ 的取值，都可以得出一组对应这个特征向量的参数向量，其中包含了n+1个参数(包含截距项)。这些参数可以被看作是一个n+1维空间中的一个点。对于不同的 $\alpha$ 取值，我们就将得到许多个在n+1维空间中的点，所有的这些点形成的序列，就被称之为是正则化路径。
把形成这个正则化路径的 $\alpha$ 的最小值除以 $\alpha$ 的最大值得到的量 $\frac{\alpha_{min}}{\alpha_{max}}$ 称为正则化路径的长度（length of the path）。在sklearn中,可以通过规定正则化路径的长度（即限制 $\alpha$ 的最小值和最大值之间的比例)，以及路径中 $\alpha$ 的个数，来让sklearn自动生成 $\alpha$ 的取值，避免了自己手动生成 $\alpha$ 列表。
和岭回归的交叉验证类相似，除了进行交叉验证之外，LassoCV也会单独建立模型。它会先找出最佳的正则化参数，然后在这个参数下按照模型评估指标进行建模。需要注意的是，LassoCV的模型评估指标选用的是均方误差，而岭回归的模型评估指标是可以自己设定的，并且默认是 $R^2$ 。

from sklearn.linear_model import LassoCV

#自己建立Lasso进行alpha选择的范围
alpharange = np.logspace(-10, -2, 200,base=10)

#其实是形成10为底的指数函数
#10**(-10)到10**(-2)次方 alpharange.shape
Xtrain.head()

lasso_ = LassoCV(alphas=alpharange #自行输入的alpha的取值范围
,cv=5 #交叉验证的折数
).fit(Xtrain, Ytrain)

#查看被选择出来的最佳正则化系数 lasso_.alpha_

#调用所有交叉验证的结果 lasso_.mse_path_

lasso_.mse_path_.shape  #返回每个alpha下的五折交叉验证结果 lasso_.mse_path_.mean(axis=1)  #有注意到在岭回归中我们的轴向是axis=0吗？
#在岭回归当中，我们是留一验证，因此我们的交叉验证结果返回的是，每一个样本在每个alpha下的交叉验证结果
#因此我们要求每个alpha下的交叉验证均值，就是axis=0，跨行求均值
#而在这里，我们返回的是，每一个alpha取值下，每一折交叉验证的结果
#因此我们要求每个alpha下的交叉验证均值，就是axis=1，跨列求均值

#最佳正则化系数下获得的模型的系数结果 lasso_.coef_

lasso_.score(Xtest,Ytest)

#与线性回归相比如何？
reg = LinearRegression().fit(Xtrain,Ytrain) reg.score(Xtest,Ytest)
#使用lassoCV自带的正则化路径长度和路径中的alpha个数来自动建立alpha选择的范围 ls_ = LassoCV(eps=0.00001
,n_alphas=300
,cv=5
).fit(Xtrain, Ytrain)


ls_.alpha_
ls_.alphas_  #查看所有自动生成的alpha取值 ls_.alphas_.shape ls_.score(Xtest,Ytest)

ls_.coef_

7.普通线性回归、岭回归、lasso回归几何意义

7.1 岭回归与普通线性回归

上面讲到，岭回归是在普通线性回归上加了一个参数的L2范数，也被称为目标函数的惩罚函数。它可以确保岭回归系数值不会变的很大，起到收缩的作用，这个收缩力度就可以通过 $\alpha$ 来平衡。岭回归模型的参数求解依赖于一个目标函数，该目标函数还可以表示为（通过数学证明可以得到上述所写岭回归表达式与下面这两个是一致的）：
$\hat{\omega}=arg \min\limits_{\omega}||X\omega-y||_2^2$
$附加约束条件：\sum\limits_{i=1}^{p}\omega_i^2\le t$
为什么要添加这个岭回归系数平方和的约束呢？上面讲到岭回归模型可以解决多重共线性的问题，正是因为多重共线性的原因，才需要添加这个约束。比如一个家庭可支配收入(y)的因素有收入(x1)和支出(x2)，可以根据自变量和因变量的关系构造线性模型 $y=\omega_0+\omega_1x_1+\omega_2x_2$ 。假如收入(x1)和支出(x2)之间存在高度多重共线性，则两个变量的回归系数之间定会存在相互抵消的作用。即把 $\omega_1$ 调整为很大的正数，把 $\omega_2$ 调整为很小的负数时，预测出来的y将不会有较大的变化。所以为了压缩 $\omega_1$ 和 $\omega_2$ 的范围，就需要一个平方和的约束。
如果把上面的等价目标函数展示到几何图形中的话，将会是（这里以两个变量的回归系数为例，且不含截距项）：

圆柱体即附加约束条件，椭圆柱体就是目标函数（不含L2范数）。黄色的交点就是满足目标函数下的岭回归系数值。进一步，可以将这个三维的立体图映射到二维平面中：

7.2 Lasso与普通最小二乘

与岭回归一样，lasso表现在二维平面上为：

7.3 小结

LASSO回归于岭回归只是在惩罚函数部分有所不同，但这个不同却让LASSO明显占了很多优势，例如在变量选择上就比岭回归强悍的多。就以直观的图形为例，LASSO回归的惩罚函数映射到二维空间的话，就会形成“角”，一旦“角”与抛物面相交，就会导致 $\omega_1$ 为0（如上图所示），这样beta1对应的变量就是一个可抛弃的变量。但是在岭回归过程中，没有“角”的圆形与抛物面相交，出现岭回归系数为0的概率还是非常小的。

8.多项式回归

方程 $y=\omega_0+\omega_1x_1^2+\omega_2x_2^2+\omega_3x_1x_2$ 就是一个多项式回归模型，但本质上仍可看做线性回归，令 $z_1=x_1^2,z_2=x_2^2,z_3=x_1x_2$ 就是线性模型了，评估指标仍然不变。
这种方法可以非常容易地通过sklearn中的类PolynomialFeatures来实现

#多项式回归
import numpy as np
x1 = np.random.normal(loc = 10, scale = 3, size = (100,))
x2 = np.random.normal(loc = 8, scale = 4, size = (100,))
X = np.array([x1, x2]).T
X.shape
y = x1 **2 + 2 * x1 + x2 ** 2 + 3 * x2 + 5 * x1 * x2
y.shape

from sklearn.preprocessing import PolynomialFeatures
poly = PolynomialFeatures(degree = 2)#degree 表示最高为x的几次幂
poly.fit(X)
X_ = poly.transform(X)
X_.shape
poly.powers_ # 获得x1，x2次方的结果。[0,0]表示x1的0次幂，x2的零次幂；[1,0]表示x1的1次幂，x2的0次幂，以此类推
poly.n_input_features_
poly.n_output_features_
from sklearn.linear_model import LinearRegression
lin_reg = LinearRegression()
lin_reg.fit(X_, y)
lin_reg.intercept_#截距
lin_reg.score(X_, y)
lin_reg.coef_ 
lin_reg.get_params(deep = True)

此外也可以通过pipeline管道函数实现，代码实现：

#Pipeline 管道：初始化数据的转化、数据归一化、线性回归融合到一起
x = np.random.uniform(-3, 3, size = 100).reshape(-1, 1)
y = 0.5 * x **2 + x + 2 + np.random.normal(0, 1, 100)
from sklearn.pipeline import Pipeline
poly_reg = Pipeline([
                    ('ploy', PolynomialFeatures(degree = 2)),
                    ('std_scaler', StandardScaler()),
                    ('lin_reg', LinearRegression())
                    ])  #元组构成的列表，每个元组第二个数为相应步骤的初始化
poly_reg.fit(x, y)
poly_reg.predict(x)
poly_reg.score(x,y)

结合

【CV】25.1.7 arxiv更新速递 hinmer arxiv CV每日更新 python 人工智能计算机视觉 chatgpt 目标检测 ai AIGC
—第1篇----关键词:手势识别,计算机视觉,低光照条件,机器学习,RaspberryPi,OpenCV论文链接-摘要:手势识别是一种基于计算机视觉技术的感知用户界面，允许计算机将人类动作解释为命令，使用户无需使用手与计算机交流，从而使鼠标和键盘变得多余。手势识别的主要弱点是光线条件，因为手势控制依赖于摄像头。摄像头用于在2D和3D中解释手势，因此提取的信息可能因光源而异。系统的限制是无法在黑暗环
【包邮送书】你好！Python Mindtechnist 粉丝福利 python 网络开发语言机器学习
欢迎关注博主Mindtechnist或加入【智能科技社区】一起学习和分享Linux、C、C++、Python、Matlab，机器人运动控制、多机器人协作，智能优化算法，滤波估计、多传感器信息融合，机器学习，人工智能等相关领域的知识和技术。关注公粽号《机器和智能》回复关键词“python项目实战”即可获取美哆商城视频资源！博主介绍：CSDN博客专家，CSDN优质创作者，CSDN实力新星，CSDN内容
基于遗传算法的城市旅行问题（TSP）求解 NovakG_ 深度学习 python 算法深度学习神经网络
1.遗传算法背景介绍遗传算法是一种基于生物进化论中的自然选择和遗传机制的优化算法，模拟了生物进化过程以搜索最优解。通过仿真染色体的交叉、变异等操作，遗传算法将求解过程转换为类似生物进化的迭代运算。该算法在解决复杂的组合优化问题时，通常比常规优化算法更高效，且具有广泛应用，包括组合优化、机器学习、信号处理、自适应控制和人工生命等领域2.遗传算法基本解题思路遗传算法的设计思路主要受到大自然中生物体进化
【2025 ODA teigha .NET系列开发教程第五章】给CAD实体添加附属数据XDATA，包括源码三好学生～张旺 ODA Teigha .NET开发教程 .net
系列文章目录提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档2025ODAteigha.NET系列开发教程系列文章目录AutoCADXData扩展数据开发指南什么是XData？XData的两种存储方式1.全局字典存储(XRecord)2.实体附加存储步骤1：注册应
【数据挖掘实战】房价预测机器学习司猫白数据挖掘人工智能 python 机器学习
本次对kaggle中的入门级数据集，房价回归数据集进行数据挖掘，预测房屋价格。本人主页：机器学习司猫白机器学习专栏：机器学习实战PyTorch入门专栏：PyTorch入门深度学习实战：深度学习ok，话不多说，我们进入正题吧概述本次竞赛有79个解释变量（几乎）描述了爱荷华州艾姆斯住宅的各个方面，需要预测每套住宅的最终价格。数据集描述本次数据集已经上传，大家可以自行下载尝试文件说明train.csv-
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶网罗开发 AI 大模型人工智能机器学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Copilot 概述计算机萍萍学姐 copilot copilot 人工智能机器学习
Copilot是什么？它有什么用途？Copilot是由人工智能公司和GitHub合作开发的一个基于人工智能的代码提示工具，它可以利用机器学习技术和大量训练数据生成高质量的代码。Copilot的目标是在保持代码质量和可读性的前提下，提高开发者的编码效率，使得编码工作更为高效和便捷。Copilot的出现是解决编程过程中可能遇到的一些难点和瓶颈问题，特别是在快速迭代的敏捷开发场景中，提高编码效率和减少编
让旅游更智能：基于AR的旅游导览应用解析 Echo_Wish Python 笔记 Python算法旅游 ar restful
友友们好！我的新专栏《Python进阶》正式启动啦！这是一个专为那些渴望提升Python技能的朋友们量身打造的专栏，无论你是已经有一定基础的开发者，还是希望深入挖掘Python潜力的爱好者，这里都将是你不可错过的宝藏。在这个专栏中，你将会找到：●深入解析：每一篇文章都将深入剖析Python的高级概念和应用，包括但不限于数据分析、机器学习、Web开发等。●实战案例：通过丰富的实战案例，带你一步步实现
【AI日志分析】基于机器学习的异常检测：告别传统规则的智能进阶人工智能机器学习深度学习
摘要随着系统规模的扩大和复杂性增加，传统基于规则的日志分析方法难以识别隐藏的复杂异常模式。本文将介绍基于机器学习的日志异常检测技术，包括模型选择、特征工程及实现步骤。通过具体的代码示例与图表，展示如何高效检测异常日志，并提供应用场景与优化策略。引言日志是系统运行状态的关键数据来源，但面对海量日志数据，传统规则式分析显得力不从心。机器学习能够根据日志的历史数据和行为模式，通过训练模型检测异常情况，不
【Python】已完美解决：ERROR: Could not find a version that satisfies the requirement re 屿小夏 python 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
下载马斯克Grok-1模型的实战代码 herosunly 大模型 grok-1 下载模型实战代码
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了下载马斯克Grok-1模型的实战代码，希望能对学习大模型的同学们有所帮助
吴恩达深度学习笔记（七）——机器学习策略子非鱼icon 深度学习自学笔记深度学习机器学习人工智能神经网络吴恩达
一、正交化通俗的理解就是：要能够诊断出系统性能瓶颈在哪里，以有策略刚好解决这个问题。一个“按钮”只负责解决一件事情。二、单一数字评估指标准确率（precision）：在分类器中标记为猫的例子中，有多少是真的猫召回率（recall）：对于所有的真猫图片，你的分类器正确识别了多少。但如果有两个评估指标，就很难去选择一个更好的分类器，如下图所示。所以有一个结合这两个指标的标准方法，也即F1分数，定义如下
数据挖掘：定义、挑战与应用黑色叉腰丶大魔王数据挖掘人工智能
一、数据挖掘的定义（一）概念阐述数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它融合了数据库技术、统计学、机器学习、人工智能等多学科的理论和方法，旨在通过对数据的深入分析和处理，发现有价值的模式、关联、趋势等，从而为决策提供支持。（二）与相关概念的区别与联系数据库管理：数据库管理侧重于数据的存储、组织、检索和维护
使用Google Vertex AI Search进行企业级高级搜索 hgSdaegva 人工智能 python
技术背景介绍GoogleVertexAISearch（前称为EnterpriseSearchonGenerativeAIAppBuilder）是GoogleCloud提供的VertexAI机器学习平台的一部分。VertexAISearch允许组织快速建立由生成式AI驱动的搜索引擎，为客户和员工提供服务。它基于各种GoogleSearch技术，包括语义搜索，通过使用自然语言处理和机器学习技术来推断内
在EverlyAI上运行LLM模型——以LLAMA为例 HGWAcsdgvs llama python
在EverlyAI上运行LLM模型——以LLAMA为例技术背景介绍EverlyAI是一个强大的云平台，允许你在云中大规模运行机器学习模型。它还提供了对多种大型语言模型（LLM）的API访问。在这篇文章中，我们将展示如何使用EverlyAI的API来调用LLAMA模型。通过这种方式，你可以在云端轻松地运行和测试你的语言模型。核心原理解析LLAMA模型是一个强大的变压器模型，它具有数十亿个参数，能够处
自动化评估：利用机器学习算法评估 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1评估的意义评估在各个领域都扮演着至关重要的角色，例如教育、人力资源、医疗保健等。传统评估方式通常依赖人工，费时费力且容易受到主观因素的影响。随着机器学习技术的不断发展，自动化评估逐渐成为一种趋势，它能够提高评估效率、降低成本并减少人为偏差。1.2机器学习在评估中的优势机器学习算法能够从大量数据中学习规律，并根据这些规律对新的数据进行预测或分类。在评估领域，机器学习可以用于：自动评
Level2逐笔成交逐笔委托毫秒记录：今日分享优质股票数据20250122 2401_89140926 python 金融数据库大数据
逐笔委托逐笔成交下载链接:https://pan.baidu.com/s/1WP6eGLip3gAbt7yFKg4XqA?pwd=7qtx提取码:7qtxLevel2逐笔成交逐笔委托数据分享下载通过Level2逐笔成交和逐笔委托这种每一笔的毫秒级别的数据可以分析出很多有用的点，包括主力意图，虚假动作，让任何操作无所遁形。适合交易大师来分析主力规律，也适合人工智能领域的机器学习，数据量大且精准。以下
机器学习-分类算法评估标准赛丽曼机器学习机器学习分类人工智能
一.准确率accuracy将预测结果和测试集的目标值比较，计算预测正确的百分比准确率越高说明模型效果越好fromsklearnimportdatasetsfromsklearn.model_selectionimporttrain_test_splitfromsklearn.neighborsimportKNeighborsClassifier#加载鸢尾花数据X,y=datasets.load_i
Jetbrains Ai Assistant插件越来越好用了 Ai 编码 Ai编码工具人工智能 android
在IntelliJIDEA中，JetBrainsAI是JetBrains集成的人工智能功能，旨在提高开发效率，辅助开发者更智能地编写、优化和理解代码。JetBrainsAI作为IntelliJIDEA的一部分，通过自然语言处理和机器学习技术，提供了许多智能代码建议和自动化功能。点击这里：获取JetbrainsAiAssistant插件以下是JetBrainsAI在IntelliJIDEA中的一
机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测墨枣机器学习算法神经网络分类人工智能
机器学习算法（八）：基于BP神经网络的乳腺癌的分类预测本项目链接：https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc1.算法简介和应用1.1算法简介BP（BackPropagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经
AI驱动电商搜索导购：技术创新与应用 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
文章标题《AI驱动电商搜索导购：技术创新与应用》关键词：人工智能，电商搜索导购，机器学习，深度学习，推荐系统，自然语言处理，个性化搜索，图像识别，应用案例，未来展望。摘要：本文旨在探讨人工智能（AI）在电商搜索导购领域的应用，分析其技术创新和实际应用案例，探讨AI驱动电商搜索导购的未来发展趋势。文章首先介绍了AI在电商搜索导购中的角色和优势，然后深入探讨了AI基础理论和搜索导购技术原理。接着，文章
【机器学习实战入门】使用OpenCV进行性别和年龄检测精通代码大仙数据挖掘深度学习 python 机器学习 python opencv 数据挖掘人工智能
GenderandAgeDetectionPython项目首先，向您介绍用于此高级Python项目的性别和年龄检测中的术语：什么是计算机视觉？计算机视觉是一门让计算机能够像人类一样观察和识别数字图像和视频的学科。它面临的挑战大多源于对生物视觉有限的了解。计算机视觉涉及获取、处理、分析和理解数字图像，旨在从现实世界中提取高维数据，从而生成可用来做决策的符号或数值信息。该过程通常包括物体识别、视频跟踪
机器学习笔记 - 机器学习/深度学习实战案例合集坐望云起深度学习从入门到精通机器学习深度学习人工智能案例应用神经网络
一、简述如何学习机器学习/深度学习，理论和实践都很重要，理论上的内容需要看课程、读教材。但是实践需要自己动手，实践之后自然会对理论有更深入的理解。怎么实践？借用欧阳修《卖油翁》的话”无他，但手熟尔“。就是多看多写多跑。下面创建这个github的目的是为了存放一些图像处理/计算机视觉/机器学习/深度学习的示例代码集合，不定期会添加新的示例，可供参考。GitHub-bashendixie/ml_too
Java 大视界 -- Java 与大数据分布式机器学习平台搭建（58）青云交大数据新视界 Java 大视界大数据分布式机器学习 Apache Spark Hadoop Apache Flink 平台搭建架构设计
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。一、欢迎加入【福利社群
AI 对程序员的冲击剖析程序员WANG 工具人工智能机器学习语言模型
摘要随着人工智能（AI）技术的飞速发展，其影响力已逐渐渗透到各个行业，程序员群体也面临着前所未有的冲击。本文深入探讨AI对程序员在编程工作模式、技能需求以及职业发展路径等方面带来的冲击，并分析程序员应对这些冲击的策略与方向，旨在为程序员在AI时代的职业发展提供参考。一、引言AI技术近年来取得了突破性进展，其在自然语言处理、机器学习、深度学习等领域的应用日益广泛。在软件开发领域，AI不再仅仅是辅助工
svm python 模型绘图_1SVM处理数据并绘图张炜大师傅 svm python 模型绘图
爬虫Python基础、数据分析扩展包Numpy、pandas、matplotlib，Python读取MySQL数据，Python爬虫及Scrapy框架，无监督机器学习算法聚类分析等，以及案例：互联网金融行业客户价值分析等。机器学习机器学习是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有
机器学习、基础算法、python常见面试题必知必答系列大全：（面试问题持续更新） promptllm人工智能
基础算法常见面试篇1.1过拟合和欠拟合常见面试篇一、过拟合和欠拟合是什么？二、过拟合/高方差（overfiting/highvariance）篇2.1过拟合是什么及检验方法？2.2导致过拟合的原因是什么？2.3过拟合的解决方法是什么？三、欠拟合/高偏差（underfiting/highbias）篇3.1欠拟合是什么及检验方法？3.2导致欠拟合的原因是什么？3.3过拟合的解决方法是什么？1.2Bat
从System Prompt来看GPT-3.5到GPT-4的进化 herosunly 大模型 system prompt gpt-3 chatgpt gpt4 gpt4o
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了从SystemPrompt来看GPT-3.5到GPT-4的进化之路，希
R语言机器学习算法实战系列（十九）特征选择之Monte Carlo算法（Monte Carlo Feature Selection）生信学习者1 R语言机器学习实战 r语言机器学习算法数据分析数据挖掘数据可视化人工智能
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍原理步骤下载数据加载R包导入数据数据预处理数据分割MCFS运行MCFS-ID过程混淆矩阵重要特征的RI最小阈值距离与共同部分收敛特征重要性排序选择重要特征构建特征依赖图提取重要特征基于重要特征构建随机森林模型混淆矩阵评估模型AUC曲线刻画模型在训练和测试数据集的表现总结系统信息介绍特征选择（FeatureSel
F#语言的图形用户界面沈霁晨包罗万象 golang 开发语言后端
F#语言的图形用户界面开发引言随着软件开发的日益复杂化，图形用户界面（GUI）在现代应用程序中的重要性不可忽视。它提供了一种直观的方式，使用户能够与应用程序进行交互。F#语言作为一种函数式编程语言，近年来在开发领域越来越受到关注，尤其是在数据分析和机器学习领域。但F#同样能够用于图形用户界面的开发，尤其是结合.NET平台及其丰富的库。本文将深入探讨F#语言在图形用户界面开发中的应用，包括常用的框架
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring