Andy-ZHA

适合小白的深度神经网络DNN思想及详细推导

导读：网上关于深度神经网络的博文和技术博客数不胜数，但是能够让初学者直接看懂的却是不多，倒不是说别人写的不好而是因为这些大佬大多是站在一定的高度来介绍的，不懂我们这些小白的痛苦啊，以下的内容是我在看了吴恩达老师的教程加以总结之后的文章，想要学习深度学习需要有一点数学功底，当然这不是最重要的，如果你在学习的过程中发现有些知识不懂可以现场查询一下，无需针对DNN特意去报班学习数学，我觉得这是没必要的，真正的学习应该是以目标为导向的扩展式学习，能够帮你快速建立必要的知识储备，我会用尽量简明的言语来介绍，希望能够帮助初学者快速理解和掌握深度神经网络。

博客内容主要参考如下，有兴趣的同学可以看一下：

1.深度神经网络BP算法

2.DNN深度神经网络入门

3.DNN反向传播过程推导

4.矩阵、向量的求导公式

一、DNN是什么？

一句话来简单介绍DNN就是：拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层，在输出层得到分类结果的计算模型。如果你想了解更多关于DNN的信息，可以去网上查一下关于DNN的博客，这些内容可以帮你快速建立对深度神经网络的知识，而不需要花费大量时间去看论文。当然这不是我们文章的主要目的，我要介绍的主要是DNN的网络结构，前向算法和反向传播（Back Propagation 即BP）算法思想和详细的推导过程。

二、标准的DNN网络结构

这里我将以逻辑回归算法（LR）的思想为例将其用在DNN中，将上图中的某一个隐藏层的神经元放大，看看这里的一个隐层到底做了什么？

输入层的输入样本的每一个特征与隐藏层的特征方程线性拟合得到一个值，通过一个激活函数 $\sigma （z）$ 将值映射到（0，1）之间的激活值，这就是逻辑回归的基本迭代公式。接下来我将用矩阵的方式推到所有公式，因为通常用矩阵来计算的话，并发性能会大大提升。

三、DNN的前向算法思想

在此之前，我需要介绍一下接下来推到需要用到的符号，上角标表示神经网络的层数。

$X^{0}$ ： $\left ( X_{1},X_{1},...,X_{N} \right )$ 一个列向量，表示每一个输入的样本特征，通常我们也用 $A^{0}$ 来表示，也叫初始值

$W^{l}$ ：weights是一个特征的权重矩阵，也是我们训练的模型重点

$b^{l}$ ：bias是每个样本训练得到的偏差，在此不再介绍偏差和权重的知识

$Z^{l}=W^{lT}X^{l-1}+b^{l} \left (or Z^{l}=W^{lT}A^{l-1}+b^{l} \right )$ ：这里的 $Z^{l}$ 表示一个回归方程得到的回归值

$A^{l}=\sigma \left ( Z^{l} \right )$ ：这里的 $A^{l}$ 表示激活值，通过一个Sigmoid激活函数映射得到的值，其中 $A^{l}$ 也是最终的预测结果

前向迭代的算法思想是，通过前面一层得到的激活值，来计算下一层的Z值，再通过Z值来计算激活值A。在这里可能有人会想计算这些值的作用是什么，如果有同学不明白的可以不用着急，我们先暂且搁置，稍后我会在推到的过程中解释。

正式推导过程：

将样本集 = $\begin{Bmatrix} y_{1} =w_{11}^{l}x_{1}+w_{12}^{l}x_{1}+w_{13}^{l}x_{1} \\ y_{2}=w_{21}^{l}x_{1}+w_{22}^{l}x_{1}+w_{23}^{l}x_{1} \\ ..........................................\\ y_{m}=w_{m1}^{l}x_{1}+w_{m2}^{l}x_{1}+w_{m3}^{l}x_{1} \\ \end{Bmatrix}$ 中样本的每一个特征权重和特征值按列堆叠可以得到 $W^{l}=\begin{bmatrix} w_{11}^{l} & w_{21}^{l} & ... & w_{m1}^{l}\\ w_{12}^{l} & w_{22}^{l} & ... & w_{m2}^{l}\\ w_{13}^{l} & w_{23}^{l} & ... & w_{m3}^{l} \end{bmatrix} , X=\begin{bmatrix} x_{1}\\ x_{2}\\ x_{3} \end{bmatrix}$ ，这样是不是就很熟悉了，慢慢看到样本与权重拟合的雏形了，现在需要做一些转换，对线性代数熟悉的同学应该知道矩阵乘法的计算方式AB矩阵相乘需要满足A矩阵的列数要等与B矩阵的行数。

所以有， $Z^{l}=W^{lT}X^{l-1}+b^{l}$ ，用 $W^{l}$ 的转置矩阵 $W^{lT}$ 来计算。

$Z^{l}=\begin{bmatrix} w_{11}^{l} & w_{12}^{l} & w_{13}^{l}\\ w_{21}^{l} & w_{22}^{l} & w_{23}^{l} \\ ... & ... & ... \\ w_{m1}^{l} & w_{m2}^{l} & w_{m3}^{l} \end{bmatrix}*\begin{bmatrix} x_{1}\\ x_{2}\\ x_{3}\\ \end{bmatrix}+b^{l}$ 至此，我们还需要通过给 $Z^{l}$ 套上一个 $\sigma$ 函数，来计算最终的激活值。

（1）、初始化

$A^{0}$ = ，随机初始化一个服从正太分布 $W^{1}$ （=np.random.randn(0,1)）但是不能为0，否则计算的结果都是0没有意义，可以是0，有了初始化的值，就可以通过下面的公式一步一步迭代得到最后一层的输出结果，也就是我们需要的预测值 $A^{l}$

（2）计算第一个隐层

$\left\{\begin{matrix} Z^{1}=W^{1T}X+b^{1}\\ A^{1}=\sigma\left (Z^{1} \right ) \end{matrix}\right.$ ，之后你会发现除了第一层的是，之后的每一层我都是用 $A^{l}$ 来代替的，这是因为前一层的 $A^{l}$ 就是下一层计算的，因为A的值是通过Sigmoid激活函数计算出来的，所以 $A^{l}$ 也叫激活值。用来激活下一层的计算的。

（3）计算第二个隐层（输出层）

$\left\{\begin{matrix} Z^{2}=W^{2T}A^{1}+b^{2}\\ A^{2}=\sigma\left (Z^{2} \right ) \end{matrix}\right.$

将计算推广到层

在层，有：

$\left\{\begin{matrix} Z^{l-1}=W^{l-1T}A^{l-2}+b^{l-1}\\ A^{l-1}=\sigma\left (Z^{l-1} \right ) \end{matrix}\right.$

在层，有：

$\left\{\begin{matrix} Z^{l}=W^{lT}A^{l-1}+b^{l}\\ A^{l}=\sigma\left (Z^{l} \right ) =\hat{Y}\end{matrix}\right.$

(4)、计算损失函数

通常对于二分类问题损失函数主要有交叉熵损失和损失，为了方便计算我们在这里用交叉熵损失函数：

$L\left ( \hat{y} ,y\right )=-\left ( yln\hat{y}+(1-y)ln(1-\hat{y}) \right )$ ，由此我们可以得到代价函数，有如下表达：

$J(W,b,X,Y)=-\frac{1}{M}\sum \left ( Yln\hat{Y}+(1-Y)ln(1-\hat{Y}) \right )$ 到此，例子中的所有单隐层的所有前向步骤全部结束了，是不是感觉很简单呢。但到这里的计算只是前向的结束，那么如何去迭代更新每一层的参数 $W^{l},b^{l}$ 呢？这里纪要再费点时间介绍一下反向传播算法的思想了。

（在这里额外补充一句，标准的最小二乘函数表达式是： $l\left ( \hat{y},y \right )=\left ( \hat{y}-y \right )^{2}$ ，但有的时候你会发现深度学习中使用的最小二乘的损失函数是这样写的： $l\left ( \hat{y},y \right )=\frac{1}{2}\left ( \hat{y}-y \right )^{2}$ ，他是在标准的最小二乘前面加了一个 $\frac{1}{2}$ 其实也没什么别的意思，就是为了求导的时候消除前面的系数 2，就这个作用，如果你看到这样的写法也不要太惊讶）

四、DNN的反向传播思想

好了，算法走到这里之后，我们需要思考一个问题，反向传播究竟是传播什么？又能得到什么？又能做什么？如果能把这几个问题想清楚，你就理解了BP得到思想精髓了也是整个DNN的思想精髓。

OK，来看一下我们计算的预测值（ $\hat{Y}$ ）与真实值（）之间肯定是存在误差的，那么要消除误差需要做什么？我们发现贯穿始终的与预测值有关的就是每一层的参数，所以我们必须计算每一层的，通过不断调整，来减小误差，那么有了目标之后我们需要知道怎么做，也就是传播什么的问题了，传播什么回去可以调整，以达到减小误差的目的。

现在再来思考一下，前向传播与反向传播的差别在哪儿？我们是否可以借鉴前向传播的思想，来计算反向传播的公式？

我们把反向的计算过程类比前向的思想，你会发现反向计算的时候，下面这个公式

$\left\{\begin{matrix} Z^{l}=W^{lT}A^{l-1}+b^{l}\\ A^{l}=\sigma\left (Z^{l} \right ) =\hat{Y}\end{matrix}\right.$ ，计算出来的结果 $Z^{l} ,A^{l}$ 是不是类似前向传播中的初始值 $A^{0},Z^{0}$ 初始值？当然这里的 $Z^{0}$ 通常不用，因为没有意义，我们需要的是 $A^{0}$ ，?这些都是后话，我们来看一下反向传播的推导，看看你能否从中看出一些规律，并将其运用到日后的学习中。

由于时间原因，上图我只画了正向和反向的部分全连接传播示意图，读者在查看的时候需要有一个基本的判断，不要被误导。

BP的正式推导过程：

（1）、伪初始化计算第层

伪初始化可能你在其他文章中看不到这个词，这是我随便写的一个词，主要是对比前向的思想来帮助你了解反向传播，我们通过正向得到的最后一组数据是 $Z^{l},A^{l},W^{l},b^{l}$ ，以该数据为初始数据来反推前层所需要的数据。

代价函数： $J(W,b,X,Y)=-\left ( Yln\hat{Y}+(1-Y)ln(1-\hat{Y}) \right )$

${W^{l}}'=\frac{\partial J}{\partial W^{l}}=\frac{\partial J}{\partial A^{l}}\cdot \frac{\partial A^{l}}{\partial Z^{l}}\cdot\frac{\partial Z^{l}}{\partial W^{l}}$ ，或写成 ${W^{l}}'=\frac{\partial J}{\partial W^{l}}=\frac{\partial J}{\partial A^{l}}\cdot {\sigma}'\left ( Z^{l} \right )\cdot\frac{\partial Z^{l}}{\partial W^{l}}$

${b^{l}}'=\frac{\partial J}{\partial b^{l}}=\frac{\partial J}{\partial A^{l}}\cdot \frac{\partial A^{l}}{\partial Z^{l}}\cdot\frac{\partial Z^{l}}{\partial b^{l}}$ ，或写成 ${b^{l}}'=\frac{\partial J}{\partial b^{l}}=\frac{\partial J}{\partial A^{l}}\cdot {\sigma}'\left ( Z^{l} \right )\cdot\frac{\partial Z^{l}}{\partial b^{l}}$ 为了看的更加清晰我将对上面的两个式子做仔细推导，以方便大家对比学习。

$\begin{align*} {W^{l}}'&=\frac{\partial J}{\partial W^{l}}=\frac{\partial J}{\partial A^{l}}\cdot {\sigma}'\left ( Z^{l} \right )\cdot\frac{\partial Z^{l}}{\partial W^{l}} \\ &=\left ( \frac{1-Y}{1-A^{l}}-\frac{Y}{A^{l}} \right )\cdot\frac{e^{-Z^{l}}}{1+e^{-Z^{l}}}\cdot A^{l-1T} \\ &=\left ( \frac{A^{l}-Y}{\left ( 1-A^{l} \right )A^{l}} \right )\cdot\left ( \frac{1+e^{-Z^{l}}}{1+e^{-Z^{l}}}-\frac{1}{1+e^{-Z^{l}}} \right )\cdot A^{l-1T} \\ &=\left ( \frac{A^{l}-Y}{\left ( 1-A^{l} \right )A^{l}} \right )\cdot\left ( \frac{1}{1+e^{-Z^{l}}}-\frac{1}{(1+e^{-Z^{l}})^{2}} \right )\cdot A^{l-1T} \\ &= \left ( \frac{A^{l}-Y}{\left ( 1-A^{l} \right )A^{l}} \right )\cdot\left ( A^{l}(1-A^{l}) \right )\cdot A^{l-1T}\\ &= (A^{l}-Y)\cdot A^{l-1T} \end{align*}$ and $\begin{align*} {b^{l}}'&=\frac{\partial J}{\partial b^{l}}=\frac{\partial J}{\partial A^{l}}\cdot {\sigma}'\left ( Z^{l} \right )\cdot\frac{\partial Z^{l}}{\partial b^{l}} \\ &=\left ( \frac{1-Y}{1-A^{l}}-\frac{Y}{A^{l}} \right )\cdot\frac{e^{-Z^{l}}}{1+e^{-Z^{l}}} \\ &=\left ( \frac{A^{l}-Y}{\left ( 1-A^{l} \right )A^{l}} \right )\cdot\left ( \frac{1+e^{-Z^{l}}}{1+e^{-Z^{l}}}-\frac{1}{1+e^{-Z^{l}}} \right ) \\ &=\left ( \frac{A^{l}-Y}{\left ( 1-A^{l} \right )A^{l}} \right )\cdot\left ( \frac{1}{1+e^{-Z^{l}}}-\frac{1}{(1+e^{-Z^{l}})^{2}} \right ) \\ &= \left ( \frac{A^{l}-Y}{\left ( 1-A^{l} \right )A^{l}} \right )\cdot\left ( A^{l}(1-A^{l}) \right )\cdot A^{l-1T}\\ &= (A^{l}-Y) \end{align*}$

求解的过程中我们发现，两个计算的式子中有一个共有的部分 $\frac{\partial J}{\partial A^{l}}\cdot {\sigma}'\left ( Z^{l} \right )$ 可以先将这部分计算出来cache（）住，方便后面计算，加快计算速度。

因此，上述的公式可以继续化简，得到：

${W^{l}}'=\frac{\partial J}{\partial W^{l}}=\frac{\partial J}{\partial A^{l}}\cdot {\sigma}'\left ( Z^{l} \right )\cdot\frac{\partial Z^{l}}{\partial W^{l}}=\frac{\partial J}{\partial Z^{l}}\cdot\frac{\partial Z^{l}}{\partial W^{l}}=(A^{l}-Y)A^{l-1T}$

${b^{l}}'=\frac{\partial J}{\partial b^{l}}=\frac{\partial J}{\partial A^{l}}\cdot {\sigma}'\left ( Z^{l} \right )\cdot\frac{\partial Z^{l}}{\partial b^{l}}=\frac{\partial J}{\partial Z^{l}}\cdot\frac{\partial Z^{l}}{\partial b^{l}}=\frac{\partial J}{\partial Z^{l}}=A^{l}-Y$

（2）、反向求第层

根据上面层给出的公式，，来推导层的式子，发现有一个公共的式子可以单独求出

我们需要计算出 $\frac{\partial J}{\partial Z^{l}}$ ，这样后面的计算就方便了，现在来看一下 $\frac{\partial J}{\partial Z^{l}}$ 能否给出更加简单的推导？根据层的公式，你会发现层有如下规律：

$\frac{\partial J}{\partial Z^{l-1}}=\frac{\partial J}{\partial Z^{l}}\cdot\frac{\partial Z^{l}}{\partial Z^{l-1}}\cdot\frac{\partial Z^{l-1}}{\partial Z^{l-2}}\cdot\cdot\cdot\cdot\frac{\partial Z^{3}}{\partial Z^{2}}\cdot\frac{\partial Z^{2}}{\partial Z^{1}}$

因为在层我们已经计算出了 $\frac{\partial J}{\partial Z^{l}}$ ，所以后面的式子我们只需要关注 $\frac{\partial Z^{l}}{\partial Z^{l-1}}$ 就行，继续推导 $\frac{\partial Z^{l}}{\partial Z^{l-1}}$ 的公式：

$A^{l-1}=\sigma \left ( Z^{l-1} \right )$

$Z^{l}=W^{l}A^{l-1}+b^{l}$

综合两式得： $Z^{l}=W^{l}\sigma \left ( Z^{l-1} \right )+b^{l}$

故而， $\frac{\partial Z^{l}}{\partial Z^{l-1}}=\frac{\partial (W^{l}A^{l-1}+b^{l})}{\partial Z^{l-1}}=\frac{\partial (W^{l}\sigma (Z^{l-1}) +b^{l})}{\partial Z^{l-1}}=W^{l}\sigma' (Z^{l-1})$

所以， $\frac{\partial J}{\partial Z^{l-1}}=\frac{\partial J}{\partial Z^{l}}\frac{\partial Z^{l}}{\partial Z^{l-1}}=\frac{\partial J}{\partial Z^{l}}W^{l}\sigma' (Z^{l-1})$

由此，我们可以将层的公式进行化简，得到：

$\frac{\partial J}{\partial W^{l-1}}=\frac{\partial J}{\partial Z^{l-1}}\cdot\frac{\partial Z^{l-1}}{\partial W^{l-1}}=\frac{\partial J}{\partial Z^{l-1}}\cdot A^{l-2T}$

$\frac{\partial J}{\partial b^{l-1}}=\frac{\partial J}{\partial Z^{l-1}}\cdot\frac{\partial Z^{l-1}}{\partial b^{l-1}}=\frac{\partial J}{\partial Z^{l-1}}$

然后再去更新即可

$W^{l-1}=W^{l-1}+\alpha \frac{\partial J}{\partial Z^{l-1}}A^{l-2T}$

$b^{l-1}=b^{l-1}+\alpha \frac{\partial J}{\partial Z^{l-1}}$ ，因为前面已经计算过第层的 $W^{l},b^{l}$ 所以，之后不再计算这层的权重和偏差，只需要根据第层的 $W^{l},b^{l}$ 来不断递推后面的数据即可。

至此，所有的计算就全部结束了，我们可以通过将上下层的关系联系起来去迭代的数据，现在我们回过头来想一下反向传播的思想与前向传播的思想有什么不同，细心的朋友们可能已经发现，二者在计算思路上基本一致，都是通过上层的计算结果来计算下一层的结果，唯一需要注意的是思路的转变。

五、DNN能做什么？（选）

DNN的标准网络可以说是标准的神经网络计算方式，它的出现被认为是里程碑的式的发展，此后的CNN、RNN都是在DNN的基础上演变而来的，DNN能做的事情很多，往往经典学习领域的问题都能通过DNN集成学习实现，比如分类问题，语音识别，计算机视觉等，但是后两者有了更好的计算方式那就是RNN和CNN，他们在不同的领域发挥着不同的功能，CNN更适合图像识别领域，而RNN则更适合处理时间序列问题，这让处理一个问题的选择变得更加广泛和灵活，能够帮助开发者节约大量时间，从而将精力更多的放在研究精确和准确度上。

前面我用了大量的篇幅介绍二分类问题，相信你已经能够充分的理解DNN的算法思想了，下面介绍一个DNN图像识别的例子，我们需要知道DNN为什么能够识别图像？

你应该知道图像其实就是一个三维的矩阵（1000，1000，3），表示红黄蓝三色的图形数据长宽比分别是1000*1000的图片，也就是1000维数*1000维数的三色图，以灰度图（只有一种颜色1000*1000*1）为例，灰度图识别通常不看第三维，所以当成二维数据来看待，我们以64*64的图片来看，将每一行的色度特征竖向排列成一个列向量，这个列向量就是一张图片的灰度图样本 $X=\begin{bmatrix} x0&...&x63&x64&...&x127&...&x4095\end{bmatrix}^{T}$ ，样本维度为64*64=4096

机器通过学习样本图的边缘信息（比如横竖排列的小方块），再通过不同的隐层来学习局部信息（比如眼睛，鼻子，嘴巴等），直到学习到全图信息为止（整个脸部特征），最后输出我们想要的结果，这就是隐层的作用。

以上就是我对DNN的理解和总结，希望能够帮助到你，如果文章中有什么不对的地方，请在评论中指出，我会及时修改。

Python与Dlib库实现人脸技术实战西域情歌
本文还有配套的精品资源，点击获取简介：本项目详细说明了如何使用Python结合Dlib库实现人脸检测、识别、数量检测和距离检测。利用Dlib提供的机器学习算法和计算机视觉功能，包括HOG特征检测、级联分类器、面部特征向量模型和关键点预测等，项目能够快速准确地在图像中检测和识别人脸。此外，还介绍了如何统计图像中的人脸数量以及如何计算人脸之间的距离。通过实际代码资源，开发者能够掌握实时人脸技术的应用，
机器学习算法_支持向量机
一、支持向量机支持向量机只能做二分类任务SVM全称支持向量机，即寻找到一个超平面使样本分成两类，且间隔最大硬间隔：如果样本线性可分，在所有样本分类都正确的情况下，寻找最大间隔；如果出现异常值或样本线性不可分，此时硬间隔无法实现软间隔：允许部分样本，在最大间隔之内，甚至在错误的一边，寻找最大间隔；目标是尽可能保持间隔宽阔和限制间隔违例之间寻找良好的平衡惩罚系数：通过惩罚系数来控制这个平衡，C值越小，
机器学习在智能金融风险评估中的应用：信用评分与欺诈检测 Blossom.118 机器学习与人工智能机器人机器学习人工智能 python 深度学习 sklearn 计算机视觉
在金融行业，风险评估是确保金融机构稳健运营的关键环节。随着大数据和机器学习技术的快速发展，金融机构开始探索如何利用机器学习算法来提高风险评估的准确性和效率。本文将探讨机器学习在智能金融风险评估中的应用，特别是信用评分和欺诈检测方面的最新进展，并分析其带来的机遇和挑战。一、智能金融风险评估中的信用评分（一）传统信用评分方法的局限性传统的信用评分主要依赖于人工规则和简单的统计模型，如逻辑回归。这些方法
面了字节跳动的数据挖掘岗，感觉真的很难。。。大模型爱好者社区机器学习深度学习面试宝典数据挖掘人工智能数据分析算法面试
节前，我们社群组织了一场技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对新手如何入门机器学习算法、该如何备战、面试常考点分享等热门话题进行了深入的讨论。基于社群的讨论，今天我整理了一个同学的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以文末加入我们交流群。一面40min【编程题】有两种数据，分别是被转发的用户和转发的
【学习】《算法图解》第十二章学习笔记：K近邻算法程序员
前言《算法图解》第十二章介绍了一种简单而强大的机器学习算法——K近邻算法（K-NearestNeighbors，简称KNN）。这是一种基于实例的学习方法，也是机器学习领域中最基础、最直观的算法之一。本章不仅讲解了KNN的基本原理和实现方式，还探讨了特征提取、归一化等重要概念，为读者打开了机器学习的大门。本笔记将梳理KNN算法的核心思想、实现步骤以及应用场景。一、K近邻算法概述（一）基本思想K近邻算
AppML 案例简介沐知全栈开发开发语言
AppML案例简介引言AppML，全称为“应用程序机器学习”，是一种将机器学习技术与移动应用开发相结合的技术框架。它旨在简化移动应用的机器学习功能集成，使得开发者无需深入了解复杂的机器学习算法，即可将强大的AI功能引入他们的应用中。本文将简要介绍AppML的一些成功案例，展示其在不同领域的应用和价值。AppML案例一：健康监测应用案例概述：一款名为“HealthMate”的健康监测应用利用AppM
FP16、BF16、INT8、INT4精度模型加载所需显存以及硬件适配的分析 herosunly 大模型精度 BF16 硬件适配
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了FP16、INT8、INT4精度模型加载占用显存大小的分析，希望对学习大
常见机器学习算法与应用场景计算机软件程序设计知识科普机器学习算法人工智能
当然可以。下面是对常见机器学习算法的全面详细阐述，包括每种算法的基本原理、特点以及典型应用场景。1.监督学习（SupervisedLearning）1.1线性回归（LinearRegression）原理：通过拟合一条直线来表示输入和输出之间的关系，适用于预测连续值输出。特点：简单易懂，计算速度快，但只能捕捉线性关系。应用场景：房价预测股票价格预测销售额预测1.2逻辑回归（LogisticRegre
**基于Python的数据分析与机器学习实战教程****一、引言**随着大数据时代的到来，数据处理和分析能力已经成为现代软件开发人员的必备技能之一。Python作为一种高效、简洁且功能丰富的编程语言， 2401_89451588 python 数据分析机器学习
基于Python的数据分析与机器学习实战教程一、引言随着大数据时代的到来，数据处理和分析能力已经成为现代软件开发人员的必备技能之一。Python作为一种高效、简洁且功能丰富的编程语言，在数据分析领域得到了广泛的应用。本文将介绍如何使用Python进行数据分析，并结合机器学习算法实现数据驱动的应用。二、Python基础首先，我们需要掌握Python的基本语法和常用的库。Python的语法简洁易懂，上
机器学习，支持向量机svm和决策树xgboost介绍 suixinm 支持向量机机器学习决策树
支持向量机(SVM)和XGBoost都是非常强大且应用广泛的机器学习算法，但它们基于不同的原理，各有其优势和劣势，适用于不同的场景。以下是两者的主要区别和优劣势对比：1.核心思想与模型类型:SVM:核心思想:找到一个最优的超平面（在特征空间中），将不同类别的样本分隔开，并且使得该超平面到两类样本中最近的样本点（支持向量）的距离（间隔）最大化。核心是几何间隔最大化。模型类型:单个模型（虽然是核方法，
【机器学习第四期（Python）】LightGBM 方法原理详解 WW、forever 机器学习原理及代码实现机器学习 python 人工智能
LightGBM概述一、LightGBM简介二、LightGBM原理详解⚙️核心原理LightGBM的主要特点三、LightGBM实现步骤（Python）可调参数推荐完整案例代码（回归任务+可视化）参考LightGBM是由微软开源的基于梯度提升框架（GBDT）的机器学习算法，专为高性能、高效率设计，适用于大规模数据处理任务。它在准确率、训练速度和资源使用上都优于传统GBDT实现（如XGBoost）
机器学习算法——神经网络1（神经元模型）
神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。神经网络中最基本的成分是神经元（neuron）模型。即上述定义中的“简单单元”。在生物神经网络中，每个神经元与其他申请元相连，当它“兴奋”时，就会向相连的神经元发送化学物质，从而改变这些神经元内的电位；如果某神经元的电位超过一个“阈值”，那么它就会被激活，即“兴奋”起来，向其他神经
【机器学习算法】XGBoost原理
一、基本内容基本内容：GBDT的基础上，在损失函数上加入树模型复杂度的正则项与GBDT一样，也是使用新的弱学习器拟合残差（当前模型负梯度，残差方向）GBDT损失函数Loss=∑i=1NL(yi,yit)Loss=\sum_{i=1}^{N}L(y_i,y_i^{t})Loss=i=1∑NL(yi,yit)XGboost损失函数Loss=∑i=1SL(yi,yit)+∑j=1NΩ(fj))Loss=
大语言模型(LLM)量化基础知识(一) -派神- RAG NLP ChatGPT 语言模型人工智能自然语言处理
承接各类AI相关应用开发项目(包括但不限于大模型微调、RAG、AI智能体、NLP、机器学习算法、运筹优化算法、数据分析EDA等)!!!有意愿请私信!!!随着大型语言模型(LLM)的参数数量的增长,与其支持硬件（加速器内存）增长速度之间的差距越来越大，如下图所示：上图显示，从2017年到2022年，语言模型的大小显著增加：2017年：Transformer模型（0.05B参数）2018年：GPT（0
ICBDDM2025：大数据与数字化管理前沿峰会鸭鸭鸭进京赶烤学术会议大数据图像处理计算机视觉 AI编程人工智能机器人考研
在选择大学专业时，可以先从自身兴趣、能力和职业规划出发，初步确定几个感兴趣的领域。然后结合外部环境因素，如专业前景、教育资源和就业情况等，对这些专业进行深入的分析和比较。大数据专业：是一个热门且前沿的学科领域，它涉及到数据的收集、存储、处理、分析和应用等多个方面。课程设置基础课程数学基础：高等数学、线性代数、概率论与数理统计等。这些课程为大数据分析提供了必要的数学工具，例如线性代数在机器学习算法中
【PyCharm 使用技巧】PyCharm 基本功能详解 || 【Jupyter Notebook】如何进入其它盘，如D盘？H盘？|| 【机器学习】聚类算法详解及其应用 || 道路交通流量模拟预测追光者♂ Python从入门到人工智能工具技巧解决办法百题千解计划(项目实战案例）PyCharm使用技巧 Jupyter如何进入其它盘聚类算法练习 PyCharm详解时空交通流预测模拟
作者主页：追光者♂个人简介：在读计算机专业硕士研究生、CSDN-人工智能领域新星创作者、2022年CSDN博客之星人工智能领域TOP4、阿里云社区专家博主【无限进步，一起追光！】欢迎点赞收藏⭐留言本篇的目录一，是请看目录四——PyCharm基础设置回顾的续篇，继续记录讲解PyCharm的基本功能。目录二回顾了在使用Jupyter时的问题。目录三练习了机器学习算法中的聚类算法。目录一、再次了解PyC
XGBoost算法原理及Python实现法号清水算法 python 开发语言
一、概述 XGBoost是一种基于梯度提升框架的机器学习算法，它通过迭代地训练一系列决策树来构建模型。核心思想是通过不断地在已有模型的基础上，拟合负梯度方向的残差（真实值与预测值的差）来构建新的弱学习器，达到逐步优化模型的目的。 XGBoost在构建决策树时，利用了二阶导数信息。在损失函数的优化过程中，不仅考虑了一阶导数（梯度），还引入了二阶导数（海森矩阵），这使得算法能够更精确地找到损失函数
GBDT：梯度提升决策树——集成学习中的预测利器大千AI助手人工智能 Python #OTHER 决策树集成学习算法 GBDT 梯度提升人工智能机器学习
核心定位：一种通过串行集成弱学习器（决策树）、以梯度下降方式逐步逼近目标函数的机器学习算法，在结构化数据预测任务中表现出色。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！一、GBDT是什么？全称：GradientBoostingDecisionTree（梯度提升决策树）本质：Boosting集成学
机器学习算法-逻辑回归模型在交通领域的应用是一个Bug 机器学习算法逻辑回归
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档逻辑回归模型在交通领域的应用：车流数量和平均速度之间的关系前言结果分析代码分析逻辑回归可视化：交通拥堵预测的动态建模过程一、交通数据生成与预处理二、逻辑回归核心算法实现三、动态可视化：决策边界的演变过程四、特征标准化与模型评估五、实验结果与模型解读六、拓展思考：逻辑回归的局限性结语：从代码到交通智能前言紧接上文的逻辑回归原理分析讲一讲
LeRobot: 让机械臂接入大模型小众AI AI开源人工智能 AI编程
HuggingFace推出的开源项目LeRobot引发了业界广泛关注。这一项目通过整合最先进的机器学习算法和便捷的开发工具链，为开发者提供了一个高效、易用的机器人AI开发平台，堪称机器人领域的“Transformer时刻”。LeRobot旨在为PyTorch中的真实机器人技术提供模型、数据集和工具。目标是降低机器人技术的准入门槛，以便每个人都可以从共享数据集和预训练模型中受益。LeRobot包含最
AI智能时代SEO优化，AISEO-人工智能搜索引擎优化 weixin_ggwwsscc 人工智能搜索引擎 deepseek AI seo
AI驱动的关键词精准匹配与语义理解传统的关键词排名规则主要依赖于关键词的字面匹配，即网站内容中出现的关键词与用户搜索词完全一致或高度相似时，才有可能获得较好的排名。然而，随着AI技术在搜索引擎中的广泛应用，这一局面正在发生深刻改变。如今的搜索引擎借助自然语言处理（NLP）和机器学习算法，能够深入理解用户搜索词背后的语义和意图，实现更精准的内容匹配。AI智能时代SEO优化，AISEO-人工智能搜索引
机器学习15-XGBoost 吹风看太阳机器学习机器人人工智能
XGBOOST学习笔记一、引言在机器学习的集成学习算法中，XGBoost（eXtremeGradientBoosting）凭借其高效性、可扩展性和卓越的性能，成为数据科学竞赛和工业界应用的热门选择。XGBoost本质上是一种基于梯度提升框架（GradientBoostingFramework）的机器学习算法，它通过不断拟合残差来构建多个弱学习器（通常是决策树），并将这些弱学习器进行累加，从而形成一
机器学习算法实战系列：异常检测全攻略——从统计方法到深度学习的异常发现技术全息架构师 AI 行业应用实战先锋机器学习算法深度学习
机器学习算法实战系列：异常检测全攻略——从统计方法到深度学习的异常发现技术引言“数据中的异常往往蕴含着最有价值的信息！从金融欺诈检测到工业设备故障预警，从网络安全到医疗诊断，异常检测技术正在守护着各个领域的安全底线。”异常检测是机器学习中极具挑战性又极具价值的领域，它旨在识别数据中与大多数实例显著不同的异常模式。本文将系统讲解异常检测的核心算法，从传统的统计方法到前沿的深度学习技术，通过金融反欺诈
【C语言练习】100. 使用C语言实现简单的自然语言理解算法视睿从零开始学习机器人 c语言算法开发语言排序算法
100.使用C语言实现简单的自然语言理解算法100.使用C语言实现简单的自然语言理解算法关键词匹配算法简介示例代码：简单的关键词匹配算法代码说明示例运行扩展功能其他方法基于规则的方法统计机器学习方法C语言中统计机器学习方法概述常见统计机器学习算法的C实现贝叶斯定理基础算法核心思想常见变体实现示例（Python）优缺点优化库与工具性能与注意事项有限状态自动机（FSA）深度学习接口调用混合方法100.
AI如何改变IT行业保持学习ing 人工智能
AI对IT行业的变革AI技术正在深刻影响IT行业的各个方面，从自动化运维到软件开发，再到数据分析和安全防护。以下是AI改变IT行业的主要方式：自动化运维（AIOps）AI驱动的运维工具可以实时监控系统性能，预测潜在故障并自动修复。机器学习算法分析日志数据，识别异常模式，减少人工干预。例如，AI可以预测服务器负载峰值，提前分配资源避免宕机。智能软件开发AI辅助编程工具如GitHubCopilot基于
机器学习算法_聚类KMeans算法 TY-2025 机器学习机器学习算法聚类
一、聚类算法分析1.概念概念：根据样本之间的相似性，将样本划分到不同的类别中；不同的相似度的计算方法，会得到不同的聚类结果，常见的相似度计算方法有欧氏距离法（无监督算法）聚类算法的目的是在没有先验知识的情况下，自动发现数据集中的内在结构和模式2.聚类算法分类（1）根据聚类颗粒度分类个数比较多的，细聚类；个数比较多的，粗聚类（2）根据实现方法分类K-means：按照质心分类层次聚类：对数据进行逐层划
图像处理与机器学习项目：特征提取、PCA与分类器评估 pk_xz123456 深度学习仿真模型算法图像处理机器学习人工智能
图像处理与机器学习项目：特征提取、PCA与分类器评估项目概述本项目将完成一个完整的图像处理与机器学习流程，包括数据探索、特征提取、主成分分析(PCA)、分类器实现和评估五个关键步骤。我们将使用Python的OpenCV、scikit-learn和scikit-image库来处理图像数据并实现机器学习算法。importnumpyasnpimportmatplotlib.pyplotaspltimpo
核方法、核技巧、核函数、核矩阵第六五签数学模型矩阵线性代数
核方法（KernelMethods）和核技巧（KernelTrick）是机器学习中处理非线性问题的强大理论框架和实践工具。核心目标：征服非线性许多机器学习算法（如感知机、支持向量机SVM、主成分分析PCA）本质上是寻找线性模式或线性决策边界（直线/平面/超平面）。然而，现实世界的数据往往是线性不可分的，这意味着在原始特征空间中，无法用一条直线（或超平面）完美地将不同类别的数据点分开，或者无法用线性
机器学习之集成学习算法文柏AI共享机器学习集成学习算法
集成学习算法一概述二Bagging方法2.1思想2.2代表算法2.3API三Boosting方法3.1AdaBoost3.1.1思想3.1.2API3.2GBDT3.2.1思想3.2.2API3.3XGBoost3.3.1思想3.3.2API机器学习算法很多,今天和大家聊一个很强悍的算法-集成学习算法,基本上是处理复杂问题的首选.话不多说,直奔主题.一概述集成学习（EnsembleLearning
机器学习算法——朴素贝叶斯和特征降维 TY-2025 机器学习机器学习算法人工智能
一、常见概率计算朴素贝叶斯算法是利用概率值进行分类的一种机器学习算法概率：一种事情发生的可能性，取值在[0,1]之间条件概率：表示事件A在另外一个事件B已经发生的条件下的发生概率P(A∣B)P(A|B)P(A∣B)联合概率：表示多个条件同时成立的概率P(AB)=P(A)∗P(B∣A)=P(B)∗P(A∣B)P(AB)=P(A)*P(B|A)=P(B)*P(A|B)P(AB)=P(A)∗P(B∣A)
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户