lavendelion

Coursera-吴恩达机器学习课程个人笔记-Week2

Week2 线性回归和梯度下降法

参数说明
1.多特征的线性回归方程
2.梯度下降法(Gradient Descent)
- 2.1如何选择参数向量θ呢？
- 2.2优化梯度下降法的方法
- - 1).特征缩放(特征标准化)
  - 2).学习率α的选择
- 2.3批量梯度下降算法和随机梯度下降算法
3.线性回归的“非线性拟合”
4.目标函数J(θ)的最小值的线性代数求法(了解)
- 4.1目标函数J(θ)的最小值求解过程：
- 4.2梯度下降法和线代直接求解法求解最优解的对比

week1由于比较基础，暂时先略过，如果有时间会补上。
另外，这份笔记里不只是有吴恩达课堂的内容，还增加了一些曾经在其他课堂学习记录下的笔记，所以算是一种笔记整合。不过整体流程是按吴恩达课程大纲走的。目前算是借助吴恩达的课程进行一次复习。
如有发现何处公式推导或者文字说明有误，请留言指正，谢谢。

参数说明

假设数据集中有m个样本，针对研究的问题每个样本具有n个特征。那么：
$\textbf{x}^{(i)}=(x_1^{(i)},x_2^{(i)},...,x_n^{(i)})'$ 表示第i个样本的特征向量，其中 $x_k^{(i)}$ 表示第i个样本的第k个特征；
$y^{(i)}$ 表示第i个样本的标签或对应特征 $\textbf{x}^{(i)}$ 的实际结果；
$(\textbf{x}^{(i)},y^{(i)})$ 表示第i个样本。
如果具有m个样本，那么可以合并写成
$\textbf{X}_{m×n}=\begin{bmatrix} x_0^{(1)}&x_1^{(1)}&\cdots&x_n^{(1)} \\ \cdots&\cdots&\cdots&\cdots \\ x_0^{(m)}&x_1^{(m)}&\cdots&x_n^{(m)} \\ \end{bmatrix} ，其中x_0^{(i)}=1。$
$\textbf{Y}=\begin{bmatrix} y^{(1)} \\ y^{(2)} \\ \cdots \\ y^{(m)} \\ \end{bmatrix}$

1.多特征的线性回归方程

假设当前机器学习系统可以对特征为 $x_1,x_2,...,x_n)'$ 的数据进行预测，预测结果为 $\hat{y}$ 。则多特征的线性回归的数学表达式即为：
$\hat{y}=θ_0+θ_1x_1+⋯+θ_n x_n=\textbf{θ}^T\textbf{x}^{(i)}$
其中 $θ=(θ_0,θ_1,…,θ_n)'$ 是参数向量；
$\textbf{x}^{(i)}$ 是某个样本的特征向量；
由于考虑到参数 $θ_0$ ，所以通常会增加一个全1特征 $x_0$ =1，简化多特征的线性回归方程。即此时的特征转化为
$x^{(i)}=(x_0^{(i)},x_1^{(i)},x_2^{(i)},…,x_n^{(i)}), 其中x_0^{(i)}=1。$

2.梯度下降法(Gradient Descent)

2.1如何选择参数向量θ呢？

首先需要有一个评价当前机器学习系统预测效果的标准，此处称为损失函数J(θ)，其作用是衡量系统预测值和真实值的差距大小。最直观的做法是将所有样本数据的预测值和真实值的差值平方后求均值：
$J(\textbf{θ})=\frac{1}{2m}\sum_{i=1}^m (\hat{y}-y^{(i)})^2 =\frac{1}{2m}\sum_{i=1}^m(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)})^2$
(注：公式中的1/2 是为了后续求导方便，详情见后续推导部分)
损失函数J(θ)数值越大，说明预测效果越差。所以很明显我们需要寻找使J(θ)达到最小值的参数向量θ。即：
$\arg\min \limits_{\theta}J(\textbf{θ})$
沿着 $J(\textbf{θ})$ 梯度下降的方向不断迭代，即可达到局部最小值：
$梯度下降法迭代公式：\textbf{θ}:=\textbf{θ}-α\frac{∂J(\textbf{θ})}{∂\textbf{θ}}$
其中α是学习率(learning rate)，也叫步长，可以控制收敛速度，但是过大的话容易发散。
在程序中该如何计算导数 $\frac{∂J(\textbf{θ})}{∂\textbf{θ}}$ 呢？
$\frac{∂J(\textbf{θ})}{∂θ_j}=\frac{∂}{∂θ_j}[\frac{1}{2m}\sum_{i=1}^m(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)})^2]=\frac{1}{2m}\sum_{i=1}^m 2(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)})·\frac{∂}{∂θ_j}(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)})$
$∴\frac{∂J(\textbf{θ})}{∂θ_j}=\frac{1}{m}\sum_{i=1}^m(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)})·\frac{∂}{∂θ_j}(\sum_{i=1}^mθ_i x_i-y^{(i)})=\frac{1}{m}\sum_{i=1}^m(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)}) x_j^{(i)}$
转化为矩阵表达式为：
$\frac{∂J(\textbf{θ})}{∂θ_j}=\frac{1}{m}(\textbf{Xθ}-\textbf{Y})^T \textbf{X}_{(: ,j)}$
其中，
$\textbf{X}_{m×n}=\begin{bmatrix} x_0^{(1)}&x_1^{(1)}&\cdots&x_n^{(1)} \\ \cdots&\cdots&\cdots&\cdots \\ x_0^{(m)}&x_1^{(m)}&\cdots&x_n^{(m)} \\ \end{bmatrix}$
$\textbf{θ}=(θ_0, θ_1,…,θ_n)'$
$\textbf{X}_{(: ,j)}=(x_j^{(1)},x_j^{(2)},...,x_j^{(m)})'$
$\textbf{Y}=\begin{bmatrix} y^{(1)} \\ y^{(2)} \\ \cdots \\ y^{(m)} \\ \end{bmatrix}$
$∴\frac{∂J(\textbf{θ})}{∂\textbf{θ}}=[\frac{∂J(\textbf{θ})}{∂θ_0},\frac{∂J(\textbf{θ})}{∂θ_1},...,\frac{∂J(\textbf{θ})}{∂θ_n}]^T$
通常设置初值θ=(0,0,…,0)’，代入迭代公式后即可不断更新参数向量θ直到θ收敛致某一值，此时的参数向量θ可以使J(θ)达到局部最小值。
通常来说，梯度下降法求到的不是全局最优解，而是局部最优。然而此处的线性回归问题只有一个最优解，并无局部最优解(因为J(θ)是一个凸函数)。所以梯度下降法(步长适当时)一定会收敛，且一定能得到全局最优解。

2.2优化梯度下降法的方法

1).特征缩放(特征标准化)

为什么需要特征缩放？
因为当样本具有多个特征时，如 $\textbf{x}^{(i)}=(x_1^{(i)},x_2^{(i)},...,x_n^{(i)})'$ ，在所有样本中，由于每个特征的量纲不同，特征取值的范围也不同，可能 $x_1^{(i)}∈[0,1]$ ，而 $x_2^{(i)}∈[10000,100000]$ 。这样，在进行梯度下降的时候，由于数值较大的特征(如 $x_2^{(i)}$ )会导致在数值较小的特征的梯度方向上移动缓慢，从而大大增加梯度迭代次数，降低算法效率(如右图)。因此，对所有数据进行适当的特征缩放后，将所有特征的取值范围映射到同一数量级的范围内，可以解决上述问题。

如何进行特征缩放？
常用的特征缩放方法有：
i. (0,1)缩放
$x_k^{(i)}:=\frac{x_k^{(i)}-\min\limits_{j∈[1,m]}x_k^{(j)} }{\max\limits_{j∈[1,m]}x_k^{(j)}-\min\limits_{j∈[1,m]}x_k^{(j)}}$
其中，等号左边的 $x_k^{(i)}$ 是第i个样本第k个特征缩放后的新值；
$\min\limits_{j∈[1,m]}x_k^{(j)}$ 是所有样本第k个特征的最小值；
$\max\limits_{j∈[1,m]}x_k^{(j)}$ 是所有样本第k个特征的最大值。
ii. 标准缩放
$x_k^{(i)}:=\frac{x_k^{(i)}-\bar{x}_k}{std(x_k)}$
$\bar{x}_k=mean_{j∈[1,m]}⁡(x_k^{(j)})=\frac{1}{m}\sum_{j=1}^m x_k^{(j)}$ ，是所有样本第k个特征的均值；
$std(x_k)$ 是所有样本第k个特征的标准差。

2).学习率α的选择

如果学习率过小，则达到收敛所需的迭代次数很大，收敛速度很慢；
如果学习率过大，则每次迭代后的损失函数数值(loss值)可能不降反增，会跳过局部最小值，甚至不收敛；
通常可以按顺序尝试α=0.01,0.03,0.1,0.3,1,3,10等数值。
最好是记录每次迭代的loss值，然后画出J(θ)与迭代次数的函数图，根据图像来选择合适的学习率。如下图。

2.3批量梯度下降算法和随机梯度下降算法

批量梯度下降算法(BGD, batch gradient descent)：
$θ_j=θ_j-α \frac{1}{m}\sum_{i=1}^m(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)}) x_j^{(i)} ，反复迭代，直到收敛$
随机梯度下降算法(SGD, stochastic gradient descent)：
$θ_j=θ_j-α \frac{1}{m}(\textbf{θ}^T \textbf{x}^{(i)}-y^{(i)}) x_j^{(i)}，一个样本迭代一次或多个样本迭代一次$
由于批量梯度下降每前进一个步长时，都需要遍历整个训练集，所以当训练集样本个数m很大时，会耗费很长时间，效率不高。而随机梯度下降法是每遍历一个样本(或设定好一定数量的样本)就前进一个步长，所以随机梯度算法一般会比批量梯度算法更快的找到”最优解”(随机梯度算法找到的最优解一般不是最优的，而是在最优解附近摆动的，但是其得到的最终解通常都是在精度要求以内的)。所以通常情况下，在训练集样本数较大时，都倾向于使用随机梯度下降算法。
随机梯度下降(SGD)是可行的，并且效率很高，实际中是最常用的。同时，这种拿一个样本就下降，可以保证在线学习，及时更新。当然，也可以折中，取一定样本后再下降。(在大部分教材中提到的随机梯度下降，其实是折中的随机梯度下降。也就是每次取若干个样本的平均梯度作为更新方向)。

3.线性回归的“非线性拟合”

线性回归不只是可以拟合“线性方程”，提前计算好已有特征的非线性数值，再作为新特征值代入线性回归中，就可以拟合“非线性方程”。
例如想要拟合的方程为： $y=θ_0+θ_1\sin⁡x+θ_2 \ln⁡x$ ，但是样本中只给出了x的数值。那么只需要计算出所有样本的 $\sin⁡x$ 和 $\ln⁡x$ 的数值，然后令 $x_1=\sin⁡x,x_2=\ln⁡x$ 。代入后即可得：
$y=θ_0+θ_1 x_1+θ_2 x_2$
因为这里的线性回归的线性，其实不是指对特征 $x^{(i)}$ 的线性，由于我们在目标方程中真正要求解的是参数向量 $θ=(θ_0,θ_1,…,θ_n)'$ ，因此只需要对参数 $θ=(θ_0,θ_1,…,θ_n)'$ 保持线性即可。而对特征 $x^{(i)}$ 是否线性并不影响，只需要在进行线性回归前进行适当的数据转化即可。

4.目标函数J(θ)的最小值的线性代数求法(了解)

4.1目标函数J(θ)的最小值求解过程：

我们如此思考，将M个N维样本组成矩阵 $X_{M×N}$ ：
1.X的每一行对应一个样本，共M个样本；
2.X的每一列对应样本的一个维度，共N维(也就是模型的影响因素个数，或是同一因素不同阶数的影响)；
3.还有一维常数项，全为1(所以实际上是N+1维)。
所以，目标函数转换为：
$J(\textbf{θ})=\frac{1}{2}\sum_{i=1}^m(\textbf{θ}^T\textbf{x}^{(i)}-y^{(i)} )^2 =\frac{1}{2}(\textbf{Xθ}-\textbf{Y})^T (\textbf{Xθ}-\textbf{Y}) (平方和求和等于矩阵与其转置相乘)$
所以，目标函数求导，也就是目标函数的梯度为：
$\frac{∂J(\textbf{θ})}{∂\textbf{θ}}=\frac{∂}{∂\textbf{θ}} [\frac{1}{2} (\textbf{Xθ}-\textbf{Y})^T (\textbf{Xθ}-\textbf{Y})]=∂/∂\textbf{θ} [\frac{1}{2} (\textbf{θ}^T X^T-Y^T )(\textbf{Xθ}-\textbf{Y}]$
$\frac{∂J(\textbf{θ})}{∂\textbf{θ}}=\frac{∂}{∂\textbf{θ}} [\frac{1}{2} (\textbf{θ}^T \textbf{X}^T \textbf{Xθ}-\textbf{θ}^T \textbf{X}^T \textbf{Y}+\textbf{Y}^T \textbf{Xθ}-\textbf{Y}^T \textbf{Y})]=\textbf{X}^T \textbf{Xθ}-\frac{1}{2} \textbf{X}^T\textbf{Y}-\frac{1}{2}\textbf{X}^T\textbf{Y}=0$
其中，上式中使用了几个线性代数结论：
1.当矩阵A为对称阵时， $\frac{∂(\textbf{θ}^T \textbf{Aθ})}{∂\textbf{θ}}=2\textbf{Aθ}，故 \frac{∂(\textbf{θ}^T \textbf{X}^T \textbf{Xθ})}{∂\textbf{θ}}=2\textbf{X}^T \textbf{Xθ}$
2. $\frac{∂\textbf{Aθ}}{∂\textbf{θ}}=\textbf{A}^T，∴\frac{(∂\textbf{θ}^T \textbf{A})}{∂θ}=\textbf{A}$ 。 $\frac{(∂\textbf{θ}^T \textbf{X}^T \textbf{Y})}{∂\textbf{θ}}=\textbf{X}^T \textbf{Y}$
综上所述，
令 $\frac{∂J(\textbf{θ})}{∂\textbf{θ}}=\textbf{X}^T \textbf{Xθ}-\textbf{X}^T \textbf{Y}=0$
可以得到目标函数 $J(\textbf{θ})$ 的驻点：
$超级重要结论：\textbf{θ}=(\textbf{X}^T \textbf{X})^{-1} \textbf{X}^T \textbf{Y}$
$简单记忆方法（不正规)：\textbf{Xθ}=\textbf{Y}⇒\textbf{X}^T \textbf{Xθ}=\textbf{X}^T \textbf{Y}⇒\textbf{θ}=(\textbf{X}^T \textbf{X})^{-1} \textbf{X}^T \textbf{Y}$
代入样本数据点X,Y之后，就可以求解得到θ的值
但是，如果 $\textbf{X}^T\textbf{X}$ 不可逆怎么办？
为了解决该问题，我们在上式中增加扰动，得到：
$θ=(\textbf{X}^T \textbf{X}+λ\textbf{I})^{-1} \textbf{X}^T \textbf{Y}$
其中λ>0。且λ的选择需要根据实际情况进行修改，也就是λ是可调节的参数(超参数)。(其实 $λ\textbf{I}$ 中的 $\textbf{I}$ 不是标准单位矩阵，而是第一行为0的 $\textbf{I}$ )。

(X^T X)矩阵不可逆的常见原因，及简单的解决办法
1).具有多余的特征，即两个特征之间关系非常紧密(例如两个特征线性相关)
2).特征数量太多(比如特征数量大于样本数据集数量)
解决办法：找出关系密切的特征，删去多余特征。

为什么增加了扰动可以避免不可逆？
∵对于任意非零向量u，有
$\textbf{u}^T \textbf{X}^T \textbf{Xu}=(\textbf{Xu})^T \textbf{Xu}$ ,令 $\textbf{v}=\textbf{Xu}$ , $∴\textbf{v}^T \textbf{v}≥0$ 恒成立, $∴\textbf{X}^T \textbf{X}$ 是半正定矩阵
∴对于任意 $λ>0，\textbf{X}^T \textbf{X}+λ\textbf{I}$ 一定是正定矩阵，因此一定可逆。(即加入扰动后，避免了 $\textbf{X}^T \textbf{X}$ 是全零矩阵的情况。)

为什么增加了扰动还能防止过拟合?
在线性回归的目标函数中加入复杂度惩罚因子(目标函数增加平方和的损失)，可以一定程度的抑制噪声数据的干扰。这种做法的本质是假定参数θ服从高斯分布。加入扰动后的目标函数如下：
$Ridge回归：J(\textbf{θ})=\frac{1}{2m} \sum_{i=1}^m[(\textbf{θ}^T\textbf{x}^{(i)}-y^{(i)} )^2 ]+λ\sum_{j=1}^nθ_j^2$
$Lasso回归：J(\textbf{θ})=\frac{1}{2m} \sum_{i=1}^m[(\textbf{θ}^T\textbf{x}^{(i)}-y^{(i)} )^2 ]+λ\sum_{j=1}^n|θ_j |$
其中 $λ\sum_{j=1}^nθ_j^2$ 这一项，叫做正则项，这种做法叫做Ridge回归，也叫 $l_2$ 正则(L2-norm)。同理，如果改为 $λ\sum_{j=1}^n|θ_j |$ ，则叫做Lasso回归，也叫 $l_1$ 正则(L1-norm)。
利用上述新的目标函数，再进行求导求驻点的操作，最终得到的结果就是上述加了扰动λ后的结果。这就解释了为什么加了扰动后的结果可以防止过拟合。

-----------------------------注释-----------------------------
1).Ridge回归可以很简单对 $λ\sum_{j=1}^nθ_j^2$ 项求导，但是Lasso回归要如何对 $λ\sum_{j=1}^n|θ_j |$ 项求导？
构造函数
$f(x,α)=x+\frac{1}{α}\log⁡(1+e^{-αx} ),x≥0$
所以有如下近似：
$|x|≈f(x,α)+f(-x,α)=\frac{1}{α}\log⁡(1+e^{-αx}+1+e^{αx} )$
所以 $∣ x ∣$ 的梯度为：
$∇|x|≈\frac{1}{(1+e^{-αx}}-\frac{1}{(1+e^{αx})};∇^2 |x|≈(2αe^{αx})/(1+e^{αx} )^2$
实践中，通常取 $α=10^6$

2).广义逆矩阵(伪逆矩阵)
由 $\textbf{Xθ}=\textbf{Y}⇒\textbf{θ}=(\textbf{X}^T \textbf{X})^{-1} \textbf{X}^T \textbf{Y}$ 可知，定义：
$\textbf{A}^+=(\textbf{A}^T \textbf{A})^{-1} \textbf{A}^T$
当 $\textbf{A}$ 为可逆方阵时，可以推导得到 $\textbf{A}^+=\textbf{A}^{-1}$
当 $\textbf{A}$ 为矩阵(非方阵)时，称 $A^+$ 为广义逆矩阵(伪逆矩阵)
-----------------------------注释-----------------------------

4.2梯度下降法和线代直接求解法求解最优解的对比

在线性回归中，当n比较低维的时候，可以直接用解析的方法计算。但是当n比较高维的时候，这样做就会耗费大量的计算能力。这时候最好就要用梯度下降法(Gradient Descent)。不一定能找到全局最优，但一定能找到局部最优，通常情况下，局部最优解已经可以满足任务要求了。

差不多当n>10000时，直接求解法的效率就明显低于梯度下降法了。
另外，梯度下降法求解的是局部最优解，而直接求解法求的是全局最优解

一文学会react+redux（模块化/同步/异步操作）青山绿水的蓝 web前端 react.js 前端 javascript
本文基于npxcreate-react-app创建太久没看react，闲来无事重新捡起做一点笔记，希望对部分vue的同行想学习redux起到一些帮助1.准备工作安装1.安装项目插件2.修改`package.json`中的scripts，将`react-scripts`替换为`craco`：3.craco.config.js根目录下创建或修改`craco.config.js`来配置Less以及@别名
深度学习基因组学+机器学习单细胞分析，当下最火热研究方向！ qwmb919 人工智能深度学习机器学习 python
深度学习已经被广泛应用于基因组学研究中，利用已知的训练集对数据的类型和应答结果进行预测，深度学习，可以进行预测和降维分析。深度学习模型的能力更强且更灵活，在适当的训练数据下，深度学习可以在较少人工参与的情况下自动学习特征和规律。调控基因组学，变异检测，致病性评分成功应用。深度学习可以提高基因组数据的可解释性，并将基因组数据转化为可操作的临床信息。深度学习通过强大的深度神经网络模型从高维大数据中自动
《深入浅出HTTPS》读书笔记（7）：安全的密码学Hash算法 earthzhang2021 https http 网络协议网络 1024程序员节
密码学Hash算法除了常规Hash算法的特性，还应该具备下面三个特性。1）强抗碰撞性（CollisionResistance）如果两个不相同的值能够得到同样的摘要值，表示产生了Hash碰撞。密码学中，Hash算法必须具备强抗碰撞性，否则不应该使用。2）弱抗碰撞性（Secondpre-imageResistance）给定一个消息和这个消息对应的摘要值，很难找到一条不同的消息也具有相同的摘要值。如果某
《深入浅出HTTPS》读书笔记（5）：随机数 earthzhang2021 https 网络协议 http
密码学中随机数的用途非常大，其他密码学算法内部都会用到随机数。1）效率在软件或者密码学应用中需要大量的随机数，必须在很短的时间内生成随机数。2）随机性生成的随机数只要不存在统计学偏差，那么这个随机数就具备随机性（randomness）。3）不可预测性密码学中的随机数必须具备不可预测性，否则就会存在安全问题，当然非密码学应用使用具备随机性的随机数就足够了。4）不可重现性所谓不可重现性（unrepea
＜深入浅出图神经网络＞读书笔记数学工具构造器 GNN
文章目录笔记GNN代码chapter5|GCN分析TODO改代码得到的结论chapter6|GraphSage分析TODO去今年刚出就买了.一查豆瓣评分比我想的还低(我这种小白都能看出一些错误),有1说1对于入门还是可以的,至少能知道GNN大概的发展路线,如图卷积→\rightarrow→GCN→\rightarrow→GNN等.如果小白直接上手GNN啥的,连图滤波,空域频域等概念都不知道,也只能
《深入浅出HTTPS》读书笔记（31）：HTTPS和TLS/SSL earthzhang2021 python 开发语言 1024程序员节 https 网络
《深入浅出HTTPS》读书笔记（31）：HTTPS和TLS/SSLTLS/SSL协议和应用层协议无关，它只是加密应用层协议（比如HTTP）并传递给下层的TCP。HTTP和TLS/SSL协议组合在一起就是HTTPS,HTTPS等同于HTTP+TLS/SSL。就是说HTTPS拥有HTTP所有的特征，并且HTTP消息由TLS/SSL协议进行安全保护。对于客户端（比如浏览器）来说，发送HTTPS请求就是连
深度学习之线性代数 ousinka DJL d2lcoder Java开发者动手学习深度学习深度学习 java 机器学习
深度学习之线性代数标量如果你从来没有学过线性代数或机器学习，那么你过去的数学经历可能是一次只想一个数字。如果你曾经用钱买个茶叶蛋，或者在付过打车费，那么你已经知道如何做一些基本的事情，比如在数字间相加或相乘。例如，上海的温度现在为13摄氏度。严格来说，我们称仅包含一个数值的叫标量（scalar）。在数学表示法，其中标量变量由普通小写字母表示（例如，x、y和z）。我们用R表示所有（连续）实数标量的空
【GAE】《High-Dimensional Continuous Control Using Generalized Advantage Estimation》译读笔记 songyuc 笔记
High-DimensionalContinuousControlUsingGeneralizedAdvantageEstimation摘要Policygradientmethods在reinforcementlearning中是一种具有吸引力的方法，因为它们直接优化累积奖励，并且可以很直接地与非线性functionapproximators如neuralnetworks一起使用。其两个主要挑战是
深度学习的应用场景及常用技术 eso1983 深度学习
深度学习作为机器学习的一个重要分支，在众多领域都有广泛的应用，以下是一些主要的应用场景及常用技术。1.应用场景1.计算机视觉图像分类描述：对图像中的内容进行分类，识别出图像中物体所属的类别。例如，在安防领域，通过对监控摄像头拍摄的图像进行分类，判断是否有可疑人员或物品出现；在电商领域，对商品图片进行分类，方便用户搜索和筛选商品。示例：识别图片中的动物是猫还是狗，或者判断一张图片是风景照还是人物照。
spring cloud netflix笔记精神病院丶吴院长个人笔记 spring cloud spring
Ribbon可以通过配置文件制定负载均衡的规则默认使用轮训算法来实现负载均衡根据响应时间做权重两个自动装配类RibbonAutoConfiguration和LoadBalancerAutoConfiguration装配类会让加了LoadBalanced注解的RestTemplate加上一个拦截器LoadBalancerInterceptor关键类LoadBalancerInterceptorRib
深入解析：Python中的决策树与随机森林小鹿( ﹡ˆoˆ﹡ ) Python python 决策树随机森林 Python
在这个数据驱动的时代，机器学习技术已经成为许多企业和研究机构不可或缺的一部分。其中，决策树和随机森林作为两种强大的算法，在分类和回归任务中表现尤为出色。本文将带领大家深入了解这两种算法在Python中的实现，从基础到实战，逐步揭开它们的神秘面纱。引言决策树是一种非常直观的预测模型，它通过一系列规则对数据进行分割，最终形成树状结构。而随机森林则是基于决策树的一种集成学习方法，通过构建多个决策树并取其
《DirectX 12 3D游戏开发实战》读书笔记1：数学基础 tikris 3d 游戏 c++矩阵线性代数
文章目录学习内容内容关于浮点类型误差解决方案参数与D3D数据结构向量类型XMVECTOR与XMFLOATn：XMVECTOR与XMFLOATn的相互转化：取得某个分量或者将某个分量转换为XMVECTOR类型：参数向量特点：表示方法：运算求模：单位化(规范化、标准化等同义)：正交化：加(减)法：乘法：其他函数杂项点常向量矩阵矩阵的传参矩阵的初始化XMMATRIX和XMFLOAT4X4的转换运算矩阵的
directx12 3d+vs2022游戏开发第六章笔记八绘制几何体云缘若仙 directx12 3d 3d 笔记算法 directx12 3d
1.顶点与输入布局在DirectX123D中，顶点是构建几何体的基本单元，它不仅包含了空间位置信息，还可以存储颜色、法线、纹理坐标等其他属性数据。通过定义不同的顶点结构体，可以创建出满足各种需求的顶点格式。例如，以下结构体定义了一个包含位置和颜色信息的顶点：structVertex{ XMFLOAT3Pos; XMFLOAT4Color;};在这个结构体中，XMFLOAT3类型的Pos
[C++]DirectX 12 3D游戏开发实战—第12章学习笔记01 2019.5.7 卡酷酷 DirectX12 C++
个人学习用，请勿转载第十二章几何着色器词汇曲面细分：tenssellation几何着色器：geometryshader三角形列表：trainglelist内容如果不启用曲面细分这一环节，几何着色器这个可选阶段会位于顶点着色器与像素着色器之间。顶点着色器以顶点作为输入数据，而几何着色器的输入数据则是完整的图元。如果要绘制三角形列表，那么几何着色器程序实际将对列表中的每个三角形T执行下列操作：for(
[C++]DirectX 12 3D游戏开发实战—第12章学习笔记02 2019.5.8 卡酷酷 C++DirectX12
个人学习使用，请勿转载12.3纹理数组12.3.1概述纹理数组即为存放纹理的数组。C++代码中纹理数组也由ID3D12Resource接口表示，创建ID3D12Resource对象时，可以通过设置DepthArraySize属性指定纹理数组所存储的元素个数。在d3dApp文件中创建深度/纹理模板时总是将该值设为1。CreateD3DResource12函数。Texture2DArraygTreeM
[C++]DirectX 12 3D游戏开发实战—第9章学习笔记03 2019.5.4 卡酷酷 DirectX12 C++
@个人学习用，请勿转赞。DirectX123D游戏开发实战—第9章学习笔记03词汇内容9.11附有纹理的山川演示程序给陆地网格重复铺设草地纹理根据时间函数令流水纹理延波浪滚动起来9.11.1生成栅格纹理坐标上图是一个m*n的栅格，右侧是在归一化纹理坐标[0,1]2中与之相对应的栅格。纹理坐标中的第i行第j列顶点坐标为uij=j⋅δuu_{ij}=j·\deltauuij=
大语言模型丨ChatGPT-4o深度科研应用、论文与项目撰写、数据分析、机器学习、深度学习及AI绘图（BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等）赵钰老师 ChatGPT python 人工智能语言模型深度学习数据分析 chatgpt 机器学习随机森林
目录第一章、2024大语言模型最新进展与ChatGPT各模型第二章、ChatGPT-4o提示词使用方法与高级技巧（最新加入思维链及逆向工程及GPTs）第三章、ChatGPT4-4o助力日常生活、学习与工作第四章、基于ChatGPT-4o课题申报、论文选题及实验方案设计第五章、基于ChatGPT-4o信息检索、总结分析、论文写作与投稿、专利idea构思与交底书的撰写第六章、ChatGPT-4o编程入
吴晓波历代经济变革得失@简明“中国经济史” - 读书笔记喝醉酒的小白破万卷成长
目录《历代经济变革得失》读书笔记一、核心观点二、主要内容（一）导论（二）春秋战国时期（三）汉代（四）北宋（五）明清时期（六）近现代（七）结语三、金句书摘四、阅读感悟《历代经济变革得失》读书笔记一、核心观点本书以中国历史上重要的经济变革为脉络，深入探讨了从春秋战国到改革开放时期经济发展的得失，揭示了统一文化、分权均富、国有经济等因素在中国经济变革中的关键作用，以及对当下经济发展的启示。二、主要内容（
【python】在【机器学习】与【数据挖掘】中的应用：从基础到【AI大模型】小李很执着杂乱无章机器学习数据挖掘 python 人工智能语言模型
目录一、Python在数据挖掘中的应用1.1数据预处理数据清洗数据变换数据归一化高级预处理技术1.2特征工程特征选择特征提取特征构造二、Python在机器学习中的应用2.1监督学习分类回归2.2非监督学习聚类降维三、Python在深度学习中的应用3.1深度学习框架TensorFlowPyTorch四、Python在AI大模型中的应用4.1大模型简介4.2GPT-4o实例五、实例验证5.1数据集介绍
MySQLDBA修炼之道-开发篇（一）滔_GY MySQL DBA修炼之道-读书笔记数据库 oracle mysql
三、开发基础1.数据模型1.1关系数据模型介绍关于NULL如果某个字段的值是未知的或未定义的，数据库会提供一个特殊的值NULL来表示。NULL值很特殊，在关系数据库中应该小心处理。例如查询语句“select*fromemployeewhere绩效得分绩效得分>85；”就不能查询出绩效得分是未知的（NULL）的数据。关于key和索引key常指表中能唯一标识一笔记录的字段（属性）或多个字段的组合。现实
Python软体中使用Scikit-learn库训练简单线性回归模型清水白石008 Python题库 python python scikit-learn 线性回归
Python软体中使用Scikit-learn库训练简单线性回归模型1.引言作为数据科学家和机器学习从业者,我们经常需要处理各种类型的数据,并从中提取有价值的信息。其中,线性回归是最基础也是最常用的机器学习算法之一。它可以帮助我们预测连续型目标变量,在很多实际应用场景中都有广泛应用,比如房价预测、销量预测等。在本文中,我将使用Python的Scikit-learn库,介绍如何训练一个简单的线性回归
超实用的Python机器学习教程 - 基于scikit - learn库 AI_DL_CODE 人工智能 python 机器学习人工智能
一、机器学习简介机器学习的定义与概念机器学习是一门多领域交叉学科，它涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。简单来说，机器学习是让计算机从数据中学习规律并进行预测或决策的技术。它旨在构建能够自动从数据中学习模式并进行改进的算法，而无需被明确编程来执行特定任务。例如，我们可以让机器学习算法通过分析大量的历史天气数据来预测未来的天气情况，或者通过分析用户的购物历史来推荐可能感兴趣
【python】利用 GridSearchCV 和 SVM 进行学生成绩预测码银支持向量机机器学习人工智能
在机器学习领域，寻找最优模型参数是一个重要的步骤，它直接影响模型的泛化能力和预测准确性。本文将通过一个具体案例介绍如何使用支持向量机（SVM）和网格搜索（GridSearchCV）来预测学生的成绩，并通过调整参数来优化模型性能。数据集：公众号“码银学编程”后台回复：学生成绩-SVM前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家：前言–人工智能教程引言学生的成绩预测
机器学习笔记——特征工程好评笔记补档机器学习人工智能论文阅读 AIGC transformer 深度学习面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍强化学习。文章目录特征工程（FzeatureEngineering）1.特征提取（FeatureExtraction）手工特征提取（ManualFeatureExtraction）：自动特征提取（AutomatedFeatureExtraction）：2.特征选择
不同物体运动方向的检测-python 人工智能专属驿站 python 开发语言
方法优点适用场景缺点光流法实时性强、支持稠密方向分析视频流中物体整体运动对背景复杂场景鲁棒性差特征点跟踪精确捕捉局部运动特征点明显的物体特征点丢失影响结果帧间差分简单快速，适合实时检测背景稳定、低复杂度场景对噪声和阴影敏感深度摄像头三维方向检测，抗背景干扰能力强需要深度信息的场景需要特殊硬件，成本较高惯性传感器不依赖视觉，适用环境广泛设备本体的运动分析精度受传感器噪声影响机器学习能适应复杂非线性场
严恭敏老师PSINS工具箱学习笔记-1 嘀嗒zxy 惯导学习笔记 matlab
PSINS工具箱学习与使用刚开始入门惯性导航算法，看了一些书但实践出了一些问题，经推荐了解到西工大严恭敏老师的PSINS工具箱很适合自学，就在网上找了一些相关资料，很全。网址：http://www.psins.org.cn/syb站介绍：https://www.bilibili.com/video/BV1R54y1E7ut/?vd_source=6ce8821b81ac808150f82236f5
Learning Vue 读书笔记 Chapter 2 追光少年3322 vue.js javascript 前端 vue3
2.Vue基本工作原理2.1VirtualDOM概念：DOM:DOM以内存中树状数据结构的形式，代表了网页上的HTML（或XML）文档内容。它充当了一个编程接口，将网页与实际的编程代码（如JavaScript）连接起来。VirtualDOM是浏览器中实际DOM的内存虚拟副本，但它更轻量且具有额外的功能。VirtualDOM工作原理：通过用户界面交互，用户向Vue传达了他们希望元素达到的状态；随后，
python 爬取小红书追光少年3322 python 网络爬虫
爬虫实现基本流程一.明确需求明确采集的网站及数据内容目标：根据小红书作者主页链接，采集作者主页所有笔记，并保存为excel表格。采集的字段包括作者、笔记类型、标题、点赞数、笔记链接。网址：https://www.xiaohongshu.com/user/profile/64c38af4000000000e026b43二.分析思路分析爬虫思路，概括如下：打开小红书主页与登录打开小红书作者主页,获取作
Python笔记之 collections.deque双端队列一起种梧桐吧 Python笔记列表队列 python
deque简介deque是一个双端列表,如果要经常从两端操作数据,选择deque就比较好,如果要实现随机访问,还是建议使用列表list.collections.deque官方说明文档操作简介append()append(x)Addxtotherightsideofthedeque.importcollectionsmydeque=collections.deque(range(3),maxlen=
iCloud备忘录同步指南：跨设备同步你的想法与任务 liuxin33445566 icloud
引言iCloud备忘录是苹果公司提供的一项功能，它允许用户在所有苹果设备上同步备忘录。无论是快速记录想法、创建购物清单，还是规划旅行，iCloud备忘录都能帮助用户保持组织和同步。本文将详细介绍如何在iCloud中同步备忘录，确保你的笔记在所有设备上保持最新状态。iCloud备忘录概述iCloud备忘录是iOS、iPadOS、macOS、watchOS以及Windows平台上备忘录应用的一部分。它
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l