chen_nnn

吴恩达机器学习系列课程笔记

视频资源获取：https://www.bilibili.com/video/BV164411b7dx?p=1

有监督学习：给算法包含正确答案的数据集，算法的任务就是根据数据集给出更多的正确答案。

回归问题（Regression）：预测一个连续的输出值，预测出连续值属性的类型。在回归问题中，我们试图在连续输出中预测结果，这意味着我们试图将输入变量映射到某个连续函数。
分类问题（Classification）：预测离散值输出0或1。在分类问题中，我们试图在离散输出中预测结果。换句话说，我们试图将输入变量映射到离散的类别中。

在有监督学习中，面对需要处理无限多特性的问题时，可以使用支持向量机算法

无监督学习：数据中没有任何标签或者所有的数据都具有相同的标签。无监督学习允许我们在几乎不知道或根本不知道结果应该是什么的情况下处理问题。我们可以从不一定知道变量影响的数据中得出结构。我们可以根据数据中变量之间的关系对数据进行聚类，从而得出这种结构。在无监督学习中，没有基于预测结果的反馈。

聚类算法（clustering algorithm）：将所有的数据经过算法分析过后，得到许多不同的簇，例如谷歌新闻。收集十万个不同的基因，并找到一种方法来自动将这些基因分组，这些基因在某种程度上是相似的，或者由不同的变量相关的，比如寿命、位置、角色等等。
鸡尾酒宴会算法（cocktail party algorithm）：处理鸡尾酒宴会问题。“鸡尾酒会算法”允许你在混乱的环境中找到结构。（即，在鸡尾酒会上从一系列声音中识别出个人的声音和音乐）。

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

模型建立过程：为了更正式地描述监督学习问题，我们的目标是，给定一个训练集，学习函数h:X→Y，因此h（x）对于Y的相应值是一个“好的”预测值。由于历史原因，这个函数h被称为一个假设。因此，从图像上看，过程如下：

当我们试图预测的目标变量是连续的时，比如在我们的住房示例中，我们称学习问题为回归问题。当y只能取一小部分离散值时（比如，如果给定居住面积，我们想预测一个住宅是房子还是公寓），我们称之为分类问题。

代价函数：该函数也称为平方误差函数、或是均方函数。为了便于计算梯度下降，将平均值减半，因为平方函数的导数项将抵消该项。

$J(θ_0 ,θ_1)= \frac{1}{2m}\sum_{i=1}^{m}(\hat{y}_i-y_i)^2 =\frac{1}{2m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)^2$

在对一个数据集做一个一元回归线性分析时，所设计到的可能会有两个可控制变量，图为这两个变量发生变化时，代价函数的图形。左图是一个3-D曲面图，中图是数据集，右图是一个等高线图。

梯度下降：取成本函数的导数（函数的切线）。切线的斜率是这一点的导数，它会给我们一个前进的方向。我们沿着最陡下降的方向逐步降低成本函数。每个步骤的大小由参数α决定，该参数称为学习速率（learning rate）。

$\theta_j:=\theta_j-\alpha\frac{\partial }{\partial \theta_j}J(\theta_0,\theta_1)\ \ \ \ \ \ \ \ \ \ \ \ (for\ j=0\ and\ j=1)\\final \ step:\theta_j:=\theta_j-\alpha*0$

在使用梯度下降算法时需要注意的一点是对于梯度的计算必须是同时更新，不能渐次更新，同时更新的情况是普遍接受的梯度下降法，而渐次更新则是另一种方法，需要记住。

$\mathbf{Correct:Simultaneous\ update:}\\temp0:=\theta_0-\alpha\frac{\partial }{\partial \theta_0}J(\theta_0,\theta_1)\\temp1:=\theta_1-\alpha\frac{\partial }{\partial \theta_1}J(\theta_0,\theta_1)\\\theta_0:=temp0\\\theta_1:=temp1$

$\mathbf{Incorrect:}\\temp0:=\theta_0-\alpha\frac{\partial }{\partial \theta_0}J(\theta_0,\theta_1)\\\theta_0:=temp\ 0\\temp1:=\theta_1-\alpha\frac{\partial }{\partial \theta_1}J(\theta_0,\theta_1)\\\theta_1:=temp1$

当特别应用于线性回归的情况时，可以导出一种新形式的梯度下降方程。我们可以替换实际成本函数和实际假设函数，并将方程修改为：

$repeat\ until\ convergence:\{\\ \theta_0:=\theta_0-\alpha\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)\\ \theta_1:=\theta_1-\alpha\frac{1}{m}\sum_{i=1}^{m}((h_\theta(x_i)-y_i)x_i) \\\}$

其中m是训练集的大小，θ0和θ1是同时变化的常数，xi和yi是给定训练集的值。所有这些的要点是，如果我们从猜测我们的假设开始，然后反复应用这些梯度下降方程，我们的假设将变得越来越准确。这就是原始代价函数J上的梯度下降法。这种方法在每一步上看整个训练集中的每一个例子，叫做批量梯度下降法（batch gradient descent）。请注意，虽然梯度下降通常容易受到局部极小值的影响，但我们在这里提出的线性回归优化问题只有一个全局最优值，没有其他局部最优值；因此，梯度下降总是收敛到全局最小值（假设学习速率α不太大）。实际上，J是一个凸二次函数。这里是一个梯度下降的例子，因为它是为了最小化一个二次函数而运行的。

多元线性回归、多特征量：适应这些多重特征的假设函数的多变量形式如下： $h_\theta(x)=\theta_0+\theta_1x_1+\theta_2x_2+\theta_3x_3+\cdots+\theta_nx_n$ ，使用矩阵乘法的定义，我们的多变量假设函数可以简洁地表示为：

$h_\theta(x)=\begin{bmatrix} \theta_0&\theta_1&\cdots&\theta_n \end{bmatrix} \begin{bmatrix} x_0\\x_1\\\vdots\\x_n \end{bmatrix}=\theta^Tx$

这是一个训练示例中假设函数的矢量化，公式中的 $x_0$ 恒为1。

多元梯度下降：

$\ until\ convergence\{\\\theta_j:=\theta_j-\alpha\frac{1}{m}\sum^m_{i=1}(h_\theta(x^{(i)})-y^{(i)})\cdot x^{(i)}_j\qquad for\ j:=0\cdots n\\\}$

或者是写成：

$\ until\ convergence\{\\\theta_0:=\theta_0-\alpha\frac{1}{m}\sum^m_{i=1}(h_\theta(x^{(i)})-y^{(i)})\cdot x^{(i)}_0\\ \theta_1:=\theta_1-\alpha\frac{1}{m}\sum^m_{i=1}(h_\theta(x^{(i)})-y^{(i)})\cdot x^{(i)}_1\\ \theta_2:=\theta_2-\alpha\frac{1}{m}\sum^m_{i=1}(h_\theta(x^{(i)})-y^{(i)})\cdot x^{(i)}_2\\ \cdots \}$

特征缩放：我们可以通过让每个输入值在大致相同的范围内来加速梯度下降。这是因为θ在小范围内迅速下降，在大范围内缓慢下降，因此当变量非常不均匀时，θ将低效地振荡到最佳值。防止这种情况的方法是修改输入变量的范围，使它们大致相同。让每个特征的范围大致都保持在-1到1之间。有两种技术可以帮助实现这一点：特征缩放（feature scaling）和均值归一化（mean normalization）。特征缩放涉及将输入值除以输入变量的范围（即最大值减去最小值），从而得到一个新的范围，即1。平均标准化涉及从输入变量的值中减去输入变量的平均值，从而使输入变量的新平均值仅为零。

$x_i:=\frac{x_i-\mu_i}{s_i}$

其中 $\mu_i$ 是特征i所有值的平均值， $s_i$ 是所有值的范围或者是值的标准差。

学习率：已经经过证明，如果学习率 $\alpha$ 足够小，那么 $J(\theta)$ 将在每次迭代中减小。如果 $\alpha$ 太小，则收敛缓慢；如果 $\alpha$ 太大，可能不会在每次迭代中减少，因此可能不会收敛。

调试梯度下降：绘制一个包含迭代次数的图。该图中的 $x$ 轴是迭代次数， $y$ 轴是 $J(\theta)$ 的值，绘制这样的图可以明显的看出 $J(\theta)$ 的趋势。如果 $J(\theta)$ 增加，那么你可能需要减少 $\alpha$ 。
自动收敛测试：如果 $J(\theta)$ 在一次迭代中减少小于E，则声明收敛，其中E是一些小值，例如 $10^{−3}$ 。然而，在实践中，很难选择这个阈值。

多项式回归（Polynomial regression）：我们可以通过使其成为二次、三次或平方根函数（或任何其他形式）来改变假设函数的行为或曲线。

正规方程（normal equation）：我们将通过显式地取 $J(\theta)$ 相对于 $\theta$ 的导数，并将其设置为零，来最小化 $J(\theta)$ 。这使我们无需迭代就能找到最佳 $θ$ 。正规方程公式如下所示。并且对于正轨方程而言比不需要进行特征缩放。

$\theta=(X^TX)^{-1}X^Ty$

对于梯度下降和正规方程的比较：（在m个训练样本，n个特征的情况下）

梯度下降	正规方程
需要选取学习率	不需要选取学习率
需要进行多次迭代	不需要进行迭代
即使在n很大时，同样可以正常运行，复杂度是 $o(kn^2)$	需要计算 $X^TX)^{-1}$ ，复杂度是 $o(n^3)$ ，当n很大时，计算量太大

pinv函数将为您提供 $\theta$ 的值，即使 $X^TX$ 不是可逆的。如果 $X^TX$ 是不可逆的，常见的原因可能是：

冗余特征，其中两个特征密切相关（即线性相关）
特征数太多（例如m≤ n）。在这种情况下，删除一些特征或使用“正则化”方法。

分类：为了尝试分类，一种方法是使用线性回归，将所有大于0.5的预测映射为1，将所有小于0.5的预测映射为0。然而，这种方法并不能很好地工作，因为分类实际上不是一个线性函数。分类问题和回归问题一样，只是我们现在想要预测的值只有少量离散值。现在，我们将关注二元分类问题，其中y只能有两个值0和1（我们在这里所说的大部分内容也将推广到多类情况）。我们可以忽略y是离散值这一事实来处理分类问题，并使用我们的旧线性回归算法来尝试预测给定x的y。然而，很容易构造出这种方法性能非常差的示例。比如说，当面对将y限制在0到1之间时，旧线性回归算法计算出某一个 $h_\theta(x)$ 的值大于1或小于0时，此时就失去了原本的意义。为了解决这个问题，引入Sigmoid函数或者叫Logistic函数

$h_\theta(x)=g(\theta^Tx)\\z=\theta^Tx\\g(z)=\frac{1}{1+e^{-z}}$

根据上述公式计算出来的 $h_\theta(x)$ 将给出我们输出为1的概率，例如， $h_\theta(x)=0.7$ ，表示最终输出为1的概率为70%，我们预测为0的概率只是预测为1的概率的补充，例如，如果预测为1的概率为70%，那么预测为0的概率为30%。

决策界限：决策界限是分隔y=0和y=1区域的线，是根据假设函数 $(\theta)$ 来创建的。同样Sigmoid函数的输入并不一定要求是线性的，可以是一个描述圆的函数或者任何符合我们数据的形状。为了得到离散的0或1分类，我们可以将假设函数的输出转换为：

$KaTeX parse error: Expected 'EOF', got '&' at position 47: …=1\\h_\theta(x)&̲lt;0.5\rightarr…$

根据Sigmoid函数的性质，当输入大于0时输出大于0.5。

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& g(z) \geq…$

所以我们对 $g (z)$ 的输入时 $\theta^TX$ ，那就意味着：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& h_\theta(…$

代价函数：我们不能使用与线性回归相同的成本函数，因为逻辑函数会导致输出波动，导致许多局部最优。换句话说，它不是凸函数。相反，我们的逻辑回归成本函数如下所示：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& J(\theta)…$

如果我们的正确答案“y”为0，那么如果我们的假设函数也输出0，那么成本函数将为0。如果我们的假设接近1，那么成本函数将接近无穷大。如果我们的正确答案“y”是1，那么如果我们的假设函数输出1，那么成本函数将是0。如果我们的假设接近0，那么成本函数将接近无穷大。注意，以这种方式编写代价函数可以保证J（θ）对于逻辑回归是凸的。

简化代价函数： $Cost(h_\theta(x),y)=-y*log(h_\theta(x))-(1-y)*log(1-h_\theta(x))$

Logistic回归代价函数：

$J(\theta) = \dfrac{1}{m} \sum_{i=1}^m \mathrm{Cost}(h_\theta(x^{(i)}),y^{(i)})\\=-\frac{1}{m}\sum_{i=1}^m[y^{(i)}log(h_\theta(x^{(i)}))+(1-y^{(i)})log(1-h_\theta(x^{(i)}))]$

Logistic梯度下降：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& \mathbf{G…$

矢量化的实现方式为： $\theta :=\theta-\frac{\alpha}{m}X^T(g(X\theta)-\vec{y})$

高级优化方法：共轭梯度法、BFGS、L-BFGS

多元分类–一对多(1vs all)(1vs rest)：现在，当我们有两个以上的类别时，我们将对数据进行分类。我们将扩展定义，而不是y={0,1}，这样y={0,1…n}。由于y={0,1…n}，我们将问题分为n+1（+1是因为索引从0开始）个二元分类问题；在每一个例子中，我们预测“y”是我们的一个类别的概率。我们基本上是选择一个类，然后将所有其他类合并到一个单独的第二类。我们反复这样做，对每个案例应用二元逻辑回归，然后使用返回最高值的假设作为我们的预测。总结一下：对多分类问题中每一个类别都训练一个回归器，然后在输入数据之后选取回归器返回值最大的那一类作为预测结果。

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& y \in \lb…$

过拟合：欠拟合或高偏差是指假设函数h的形式与数据的趋势不匹配。这通常是由于函数过于简单或使用的功能太少造成的。在另一个极端，过度拟合或高方差是由一个假设函数引起的，该假设函数拟合可用数据，但不能很好地概括预测新数据。这通常是由一个复杂的函数造成的，该函数创建了许多与数据无关的不必要的曲线和角度。这个术语既适用于线性回归，也适用于逻辑回归。解决过度装配问题有两个主要选择：

减少特征值的数量：手动选择要保留的特征或者是选择模型选择算法
正则化：保留所有特征，但减少参数的大小。当我们有很多稍微有用的特性时，正则化效果很好。

代价函数：如果我们的假设函数有过度拟合，我们可以通过增加它们的成本来减少函数中某些项的权重。假设我们想让下面的函数更二次： $\theta_0+\theta_1x+\theta_2x^2+\theta_3x^3+\theta_4x^4$ ，想要消除 $\theta_3$ 和 $\theta_4$ 的影响，在不实际消除这些特征或改变假设形式的情况下，我们可以修改成本函数：

$min_\theta \frac{1}{2m} \sum_{i=1}^m(h_\theta (x^{(i)})-y^{(i)}) ^2+1000\cdot \theta_3^2+1000 \cdot \theta_4^2$

我们在末尾增加了两个额外条款，以增加 $\theta_3$ 和 $\theta_4$ 的成本，现在为了使代价函数接近于0，我们必须减小 $\theta_3$ 和 $\theta_4$ 的值使其接近于0。这种方法反过来大大减小假设函数中 $\theta_3$ 和 $\theta_4$ 的值。因此在新的假设函数曲线中看起来更像一个二次函数，但是由于增加了额外的小项 $\theta_3x^3$ 和 $\theta_4x^4$ 也使其更能符合数据的特点。我们还可以在一次求和中正则化所有θ参数，如下所示：

$min_\theta \frac{1}{2m} \left[ \sum_{i=1}^m(h_\theta (x^{(i)})-y^{(i)}) ^2+\lambda\sum_{i=1}^n\theta_j^2 \right]$

线性回归的正则化：

梯度下降法：我们将修改梯度下降函数，以分离出 $\theta_0$ 因为我们不想惩罚 $\theta_0$ 。

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ & \text{Re…$

术语 $\frac{\lambda}{m}\theta_j$ 执行我们的正则化。通过一些操作，我们的更新规则也可以表示为：

$\theta_j:=\theta_j(1-\alpha\frac{\lambda}{m})-\alpha\frac{1}{m}\sum_{i=1}^m(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}$

上述方程中的第一项， $1-\alpha\frac{\lambda}{m}$ 将始终小于1。直观地说，你可以把它看作是减少了 $\theta_j$ 的值,每次更新时都会有一定数量的信息。请注意，第二个项现在与之前完全相同。
正规方程：现在让我们使用非迭代法方程的替代方法来处理正则化。要添加正则化，方程与原始方程相同，只是我们在括号内添加了另一项：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& \theta = …$

L是一个矩阵，0在左上角，1在对角线下，0在其他地方。其尺寸应为（n+1）×（n+1）。直观地说，这是单位矩阵（尽管我们不包括 $x_0$ ），乘以一个实数 $\lambda$ 。回想一下，如果m $X^TX$

Logistic回归的正则化：在前文中出现过Logistic的代价函数为：

$J(\theta) = \dfrac{1}{m} \sum_{i=1}^m \mathrm{Cost}(h_\theta(x^{(i)}),y^{(i)})\\=-\frac{1}{m}\sum_{i=1}^m[y^{(i)}log(h_\theta(x^{(i)}))+(1-y^{(i)})log(1-h_\theta(x^{(i)}))]$

我们可以在末尾添加一个项来正则化这个方程：

$J(\theta) =-\frac{1}{m}\sum_{i=1}^m[y^{(i)}log(h_\theta(x^{(i)}))+(1-y^{(i)})log(1-h_\theta(x^{(i)}))]+\frac{\lambda}{2m}\sum_{j=1}^n\theta_j^2$

关注代价函数中第二个和式的起始是从 $j = 1$ 开始的，对于一个 $\theta$ 向量而言其下标是从0到n共有n+1个向量在其中，但是在正则化的过程中，将 $\theta_0$ 这个参数排除在外，不参与正则化的过程，因此在计算方程时，应不断更新以下两个方程：（和前面的线性回归相同）

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ & \text{Re…$

模型展示：让我们来看看如何使用神经网络来表示假设函数。在一个非常简单的层面上，神经元基本上是计算单元，将输入（树突）作为电输入（称为“尖峰”）传递到输出（轴突）。在我们的模型中，我们的树突类似于输入特征 $x_1\cdots x_n$ ，输出是我们假设函数的结果。在这个模型中，我们的 $x_0$ 输入节点有时被称为“偏差单元”它总是等于1。在神经网络中，我们使用与分类中相同的逻辑函数 $\frac{1}{1 + e^{-\theta^Tx}}$ ，也有时称为Sigmoid激活函数。在这种情况下，我们的“θ”参数有时被称为“权重”。从视觉上看，一个简单化的表示看起来像：

$\begin{bmatrix}x_0 \newline x_1 \newline x_2 \newline \end{bmatrix}\rightarrow\begin{bmatrix}\ \ \ \newline \end{bmatrix}\rightarrow h_\theta(x)$

我们的输入节点（第1层），也称为“输入层”，进入另一个节点（第2层），最后输出假设函数，称为“输出层”。我们可以在输入层和输出层之间有中间的节点层，称为“隐藏层”在本例中，我们将这些中间或“隐藏”层节点标记为 $a^2_0\cdots a ^2_n$ 并称之为“激活单元”。此时如果将隐藏层加入，则为：

$\begin{bmatrix}x_0 \newline x_1 \newline x_2 \newline x_3\end{bmatrix}\rightarrow\begin{bmatrix}a_1^{(2)} \newline a_2^{(2)} \newline a_3^{(2)} \newline \end{bmatrix}\rightarrow h_\theta(x)$

而公式总每一个激活节点的值的获取方式，则为：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲ a_1^{(2)} = g(…$

这意味着我们通过使用3×4的参数矩阵来计算激活节点。我们将每一行参数应用于我们的输入，以获得一个激活节点的值。我们的假设输出是应用于我们的激活节点的值之和的逻辑函数，其已乘以另一个参数矩阵 $\Theta^{(2)}$ ，这其中包含第二层节点的权重。每一层都有自己的权重矩阵 $\Theta^{(j)}$ ，这些权重矩阵的尺寸确定如下：如果该神经网络在第j层有s_j个节点，在第j+1层有s_{j+1}个节点，那么这个权重矩阵 $\Theta^{(j)}$ 的维度就是 $s_{j+1}\times(s_j+1)$ 。+1来自 $\Theta^{(j)}$ 中添加的“偏差节点”， $x_0$ 和 $\Theta_0^{(j)}$ 。换句话说，输出节点将不包括偏置节点，而输入节点将包括偏置节点。

接下来，我们将对上述函数进行矢量化实现。我们将定义一个新变量 $z_k^{(j)}$ 它包含了g函数中的参数。在我们前面的示例中，如果我们用变量z替换所有参数，我们将得到：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲a_1^{(2)} = g(z…$

对于位于第二层的k个节点而言，变量z将被写成这样的形式 $z_k^{(2)}=\Theta_{k,0}^{(1)}x_0 + \Theta_{k,1}^{(1)}x_1 + \Theta_{k,2}^{(1)}x_2 + \Theta_{k,n}^{(1)}x_n$

x和 $z^j$ 的向量表示为：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲x = \begin{bmat…$

这时我们令 $x=a^{(1)}$ ，我们就可以得到这样一个普适的公式： $z^{(j)}=\Theta^{(j-1)}a^{(j-1)}$ ，这样我们就可以得到第j层的激活结点的向量表示为 $a^{(j)}=g(z^{(j)})$ 。在计算得到 $a^{(j+1)}$ 之后，将偏置单元添加到激活结点当中，即为 $a_0^{(j)}=1$ 。为了计算我们的最终假设函数值，我们首先计算另一个z向量： $z^{(j+1)}=\Theta^{(j)}a^{(j)}$ 。我们将 $\Theta^{(j-1)}$ 之后的下一个 $\Theta$ 矩阵和我们刚刚得到的所有激活节点的值相乘，得到最终的z向量。最后的这个 $\Theta$ 矩阵 $\Theta^{(j)}$ 只有一行因此乘以只有一列的 $a ^{(j)}$ ，所以我们的结果是一个单一的数字。然后，我们通过以下方式获得最终结果： $h_\Theta(x)=a^{(j+1)}=g(z^{(j+1)})$ 。请注意，在最后一步中，在第j层和第j+1层之间，我们所做的事情与逻辑回归中所做的完全相同。在神经网络中添加所有这些中间层可以让我们更优雅地产生有趣和更复杂的非线性假设。

例子与直觉理解：应用神经网络的一个简单例子是预测 $x_1$ 和 $x_2$ ，这是逻辑“and”运算符，仅当 $x_1$ 和 $x_2$ 都是1时输出结果为1。我们的函数图如下所示：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲\begin{bmatrix}…$

需要注意的是 $x_0$ 是偏置单元其值始终为1，现在设定 $\Theta$ 矩阵为 $\Theta^{(1)} =\begin{bmatrix}-30 & 20 & 20\end{bmatrix}$ ，这样设置 $\Theta$ 矩阵会让最后的输出假设为真当且仅当 $x_1$ 和 $x_2$ 都是1。结算过程如下：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& h_\Theta(…$

因此，我们通过使用一个小的神经网络，而不是使用实际的与门，来构造计算机中的一个基本运算。神经网络也可以用来模拟所有其他逻辑门。下面是逻辑运算符“OR”的示例，表示 $x_1$ 是真的或者 $x_2$ 是真的，又或者两者都是真的。

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& \Theta^{(…$

在这些的基础上我们可以试着构建更高级的逻辑门，比如说是异或门。我们现在已知与门、或非门、或门的 $\Theta$ 矩阵值为：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲AND:\Theta^{(1)…$

根据这三种逻辑门构建的神经网络图的结构应该如下所示：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲\begin{bmatrix}…$

从输入层到第一个隐藏层实现与门和或非门的功能，因此构建 $\Theta^{(1)}$ 矩阵： $\Theta^{(1)} =\begin{bmatrix}-30 & 20 & 20 \newline 10 & -20 & -20\end{bmatrix}$ ；第一个隐藏层到第二个隐藏层之间实现或门的功能，因此构建 $\Theta^{(2)}$ 矩阵： $\Theta^{(2)} =\begin{bmatrix}-10 & 20 & 20\end{bmatrix}$ ，然后根据上文的实现方式来得到各个节点的值：

$KaTeX parse error: No such environment: align* at position 8: \begin{̲a̲l̲i̲g̲n̲*̲}̲& a^{(2)} =…$

这样就实现了异或门的功能，与前面的与门、或非门、或门不同的是该异或门中包含了两个隐藏层。

多元分类：为了将数据分类为多个类别，我们让假设函数返回一个值向量。假设我们想将数据分为四类。我们将使用下面的示例来了解如何进行这种分类。该算法将图像作为输入，并对其进行相应分类：我们可以将结果类的集合定义为y：每个 $y ^{(i)}$ 表示与汽车、行人、卡车或摩托车相对应的不同图像。内层里的每一层都为我们提供了一些新的信息，这些信息会影响我们最终的假设函数的结果。我们对一组输入结果的假设可能如下所示：

$h_\Theta(x) =\begin{bmatrix}0 \newline 0 \newline 1 \newline 0 \newline\end{bmatrix}$

在这种情况下，我们得到的类是第三个类的值为1，意思是算法最终判定该输入图像属于卡车分类。
神经网络的代价函数：让我们首先定义几个我们需要使用的变量：

L = 网络中的总层数
$s_l$ = 层l中的单元数
K = 输出单元/类别的数量
由于在神经网络中我们可能有多个输出节点，所以使用 $h_\Theta(x)_k$ 来表示假设函数输出向量中第k维的值。

所以对于神经网络而言，它的代价函数可以写为：

$KaTeX parse error: No such environment: gather* at position 8: \begin{̲g̲a̲t̲h̲e̲r̲*̲}̲ J(\Theta) = - …$

我们添加了一些嵌套的求和来解释我们的多个输出节点。在方程的第一部分，在方括号之前，我们有一个额外的嵌套求和，它循环遍历输出节点的数量。在正则化部分，在方括号之后，我们必须考虑多个 $\Theta$ 矩阵。当前 $\Theta$ 矩阵中的列数等于当前层中的节点数（包括偏移单位）。当前 $\Theta$ 矩阵中的行数等于下一层中的节点数（不包括偏移单位）。和之前的逻辑回归一样，我们对每一项进行平方运算。

反向传播：是用于最小化成本函数的神经网络术语，就像我们在logistic和线性回归中使用梯度下降法一样。我们的目标是计算： $min_\Theta J(\Theta)$ 。也就是说，我们希望使用 $\Theta$ 中的一组最佳参数来最小化代价函数J。根据我们用来计算 $J(\Theta)$ 偏导数的方程：

$\frac{\partial}{\partial\Theta_{i,j}^{(l)}}J(\Theta)$

然后进行反向传播算法的计算：

根据给定的训练集 $\{(x^{(1)},y^{(1)})\cdots(x^{(m)},y^{(m)})\}$ ，定义一个与神经网络结构有关的零矩阵 $\Delta$ ，三个参数为 $(l, i, j)$ ， $l$ 是神经网络层数， $i$ 和 $j$ 是行坐标和列坐标。对于每个训练集当中的元素我们都做如下运算：

令 $a^{(1)}:=x^{(t)},t=1\cdots m$
在该神经网络中运用前向传播算法去计算除第一层外，每一层的激活值 $a^{(l)}$
根据该训练集中做好的标注 $y^{(t)}$ ，去计算 $\delta^{(L)}=a^{(L)}-y^{(t)}$ ，这里L是神经网络的总层数，$ a^{(L)}$是是最后一层激活单元的输出向量。因此，最后一层的“误差值”只是最后一层的实际结果与y的正确输出之间的差异。为了得到最后一层之前各层的增量值，我们可以使用一个从右到左的公式
根据 $\delta^{(l)}=((\Theta^{(l)})^T\delta^{(l+1)}).*g^{\prime}(z^{(l)})=((\Theta^{(l)})^T\delta^{(l+1)}).*a^{(l)}.*(1-a^{(l)})$ 计算 $\delta^{(L-1)},\delta^{(L-2)},\ldots,\delta^{(2)}$ ，后面点乘的那一项是g(z)函数的导数
$ \Delta^{(l)}{i,j} := \Delta^{(l)}{i,j} + a_j^{(l)} \delta_i^{{(l+1)}$或者是向量化的计算方式$\Delta}{(l)} := \Delta^{(l)} + \delta^{(l+1)}(a{(l)})^T$

据此我们就可以更新 $\Delta$ 矩阵：

在j不等于0时， $D^{(l)}_{i,j} := \dfrac{1}{m}\left(\Delta^{(l)}_{i,j} + \lambda\Theta^{(l)}_{i,j}\right)$
在j等于0时， $D^{(l)}_{i,j} := \dfrac{1}{m}\Delta^{(l)}_{i,j}$

增量矩阵D被用作一个“累加器”，在我们前进的过程中累加我们的值，并最终计算我们的偏导数。然后我们就可以得到 $\frac \partial {\partial \Theta_{ij}^{(l)}} J(\Theta)=D_{ij}^{(l)}$

实际上 $\delta$ 计算的是cost函数对于 $z_j^{(l)}$ 的偏导数 $\delta_j^{(l)}=\frac{\partial}{\partial z_j^{(l)}}cost(t)$

梯度检测：梯度检查将确保我们的反向传播按预期工作。我们可以用以下公式近似成本函数的导数：

$\dfrac{\partial}{\partial\Theta}J(\Theta) \approx \dfrac{J(\Theta + \epsilon) - J(\Theta - \epsilon)}{2\epsilon}$
在有多个 $\Theta$ 的情况下，我们可以将公式改写为：

$\dfrac{\partial}{\partial\Theta_j}J(\Theta) \approx \dfrac{J(\Theta_1, \dots, \Theta_j + \epsilon, \dots, \Theta_n) - J(\Theta_1, \dots, \Theta_j - \epsilon, \dots, \Theta_n)}{2\epsilon}$

$\epsilon$ 的取值约为10^-4，如果再小的话会使我们的程序陷入数值问题。

epsilon = 1e-4;
for i = 1:n,
  thetaPlus = theta;
  thetaPlus(i) += epsilon;
  thetaMinus = theta;
  thetaMinus(i) -= epsilon;
  gradApprox(i) = (J(thetaPlus) - J(thetaMinus))/(2*epsilon)
end;

我们之前看到了如何计算deltaVector。一旦我们计算了梯度近似向量，我们就可以检查gradApprox是否约等于 deltaVector。一旦验证了反向传播算法的正确性，就不需要再次计算梯度近似值。因为计算GradApprox的代码可能非常慢。

随机初始化：在一开始的初始化工作中，将所有 $\Theta$ 权重初始化为零不适用于神经网络。当我们反向传播时，所有节点都会重复更新到相同的值。相反，我们可以使用以下方法随机初始化 $\Theta$ 矩阵的权重：

因此，我们初始化每个 $\Theta^{(l)}_{ij}$ 到 $[-\epsilon,\epsilon]$ 之间的随机值。使用上述公式可以保证我们得到所需的界限。同样的过程也适用于所有的 $\Theta$ 。下面是一些可以用于实验的工作代码。

If the dimensions of Theta1 is 10x11, Theta2 is 10x11 and Theta3 is 1x11.

Theta1 = rand(10,11) * (2 * INIT_EPSILON) - INIT_EPSILON;
Theta2 = rand(10,11) * (2 * INIT_EPSILON) - INIT_EPSILON;
Theta3 = rand(1,11) * (2 * INIT_EPSILON) - INIT_EPSILON;

整合一下：首先，选择一个网络架构；选择神经网络的布局，包括每层中有多少隐藏单元，以及你想要的总层数。

输入单位数量=特征尺寸 $x^{(i)}$
输出单元数量=类别数量
每层隐藏单位的数量=通常越多越好（必须与计算成本相平衡，因为它随着隐藏单位的增加而增加），默认值：1个隐藏层。如果有多个隐藏层，建议在每个隐藏层中有相同数量的单元。

然后开始训练我们的神经网络，当我们执行正向和反向传播时，我们会循环每个训练示例：：

随机初始化权重
实现前向传播对每个 $x^{(i)}$ 都获得 $h_\Theta(x^{(i)})$
计算代价函数
实现反向传播来计算偏导数
使用梯度检查来确认你的反向传播工作。然后禁用梯度检查。
使用梯度下降法或内置的优化函数，使权重在 $\Theta$ 内的成本函数最小化。

理想情况下我们想要让 $h_\Theta(x^{(i)})\approx y^{(i)}$ ，这将会使得我们的成本函数最小化，但是有一点需要注意的是 $J(\Theta)$ 不是凸的，因此我们可能会得到局部最小值。

评估假设：一旦我们通过以下方式解决了预测中的错误：

获取更多培训示例
尝试更小的功能集
尝试其他功能
尝试多项式特征
增加或减少λ

我们可以继续评估我们的新假设。假设对训练示例的误差可能很小，但仍然不准确（因为过度拟合）。因此，为了评估一个假设，给定一个训练示例数据集，我们可以将数据分为两组：训练集和测试集。通常，训练集由70%的数据组成，测试集是剩下的30%。

使用这两套设备的新程序如下：

学习 $\Theta$ 并最小化 $J_{train}(\Theta)$ 使用训练集
计算测试集误差 $J_{test}(\Theta)$

对于测试集计算后的误差情况我们分为两种情况进行讨论：

对于线性回归而言： $J_{test}(\Theta) = \dfrac{1}{2m_{test}} \sum_{i=1}^{m_{test}}(h_\Theta(x^{(i)}_{test}) - y^{(i)}_{test})^2$
对于分类错误（也称为0/1错误分类错误）：

$err(h_\Theta(x),y) = \begin{matrix} 1 & if h_\Theta(x) \geq 0.5\ and\ y = 0\ or\ h_\Theta(x) < 0.5\ and\ y = 1\newline 0 & otherwise \end{matrix}$

这会给我们一个基于错误分类的二进制0或1错误结果。测试集的平均测试误差为： $\text{Test Error} = \dfrac{1}{m_{test}} \sum^{m_{test}}_{i=1} err(h_\Theta(x^{(i)}_{test}), y^{(i)}_{test})$
这为我们提供了错误分类的测试数据的比例。

你可能感兴趣的:(笔记,机器学习,聚类,算法)

C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
被动降噪的概念及编程实现 CodeByte 人工智能算法 javascript 编程
被动降噪是指通过编程技术和算法，对输入的数据进行处理，以减少或消除其中的噪声。噪声可以是各种形式的干扰，例如来自传感器、通信信号或其他外部源的干扰。在本文中，我们将探讨被动降噪的意义以及如何使用编程来实现这一目标。被动降噪的意义：噪声对数据的准确性和可靠性产生负面影响。在许多应用领域，例如图像处理、音频处理和信号处理中，噪声的存在可能导致数据质量下降，使得后续的分析和处理变得困难。因此，被动降噪技
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
【GESP】C++三级真题 luogu-B4359 [GESP202506 三级] 分糖果 CoderCodingNo GESP c++java 开发语言
GESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较简单。题目题解详见：【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoder【GESP】C++三级真题luogu-B4359[GESP202506三级]分糖果|OneCoderGESPC++三级，2025年6月真题，模拟算法，难度★★☆☆☆。本次三级题目个人感觉比较
【华为机试】HJ61 放苹果不爱熬夜的Coder 算法华为机试 golang 华为 golang 算法面试
文章目录HJ61放苹果描述输入描述输出描述示例1示例2解题思路算法分析问题本质分析状态定义与转移递推关系详解动态规划表构建算法流程图示例推导过程代码实现思路时间复杂度分析关键优化点边界情况处理递归解法对比实际应用场景测试用例分析算法特点数学原理完整题解代码HJ61放苹果描述我们需要将m个相同的苹果放入n个相同的盘子中，允许有的盘子空着不放。求解有多少种不同的分法。输入描述输入两个整数m,n(0B[
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
.NET中的安全性之数字签名、数字证书、强签名程序集、反编译 hezudao25 NET .net assembly 加密算法 reference header
本文将探讨数字签名、数字证书、强签名程序集、反编译等以及它们在.NET中的运用（一些概念并不局限于.NET在其它技术、平台中也存在）。1.数字签名数字签名又称为公钥数字签名，或者电子签章等，它借助公钥加密技术实现。数字签名技术主要涉及公钥、私钥、非对称加密算法。1.1公钥与私钥公钥是公开的钥匙，私钥则是与公钥匹配的严格保护的私有密钥；私钥加密的信息只有公钥可以解开，反之亦然。在VisualStud
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
数据结构：导论梁辰兴数据结构学习笔记数据结构导论算法时间复杂度空间复杂度
目录一，数据结构的研究内容二，基本概念与术语（一）数据、数据元素、数据项与数据对象（二）数据结构（三）数据类型与抽象数据类型️三，抽象数据类型的表示与实现⚙️四，算法与算法分析⚖️（一）算法的定义及特性（二）评价算法优劣的基本标准⏱️（三）算法的时间复杂度（四）算法的空间复杂度章结一，数据结构的研究内容数据结构是计算机科学的核心基础，其研究内容可概括为三大维度：数据组织形式：探索如何将现实世界中的
C++ 标准库＜numeric＞
以下对C++标准库中头文件所提供的数值算法与工具做一次系统、深入的梳理，包括算法功能、示例代码、复杂度分析及实践建议。一、概述中定义了一组对数值序列进行累加、内积、差分、扫描等操作的算法，以及部分辅助工具（如std::iota、std::gcd/std::lcm等）。所有算法均作用于迭代器区间，符合STL风格，可与任意容器或原始数组配合使用。从C++17、20起，又陆续加入了并行友好的std::r
具身语义导航算法总揽 Shilong Wang 具身导航算法算法
端到端方法小脑大脑GNMNavDPNaVILAViNTNomadNavidStreamVLNMapNavNavGPTUni-NavidOctoNavNavGPT2模仿学习行为克隆BCDAgger模块化方法GOATVLFMSayPlanLM-NavETPNavVoroNavEmbodiedRAGVL-NavStairwaytoSuccess业内大佬北大王鹤NavidUni-NavidOctoNav吴
枚举的构造函数中抛出异常会怎样 bylijinnan java enum 单例
首先从使用enum实现单例说起。为什么要用enum来实现单例？这篇文章（ http://javarevisited.blogspot.sg/2012/07/why-enum-singleton-are-better-in-java.html）阐述了三个理由： 1.enum单例简单、容易，只需几行代码： public enum Singleton { INSTANCE;
CMake 教程 aigo C++
转自：http://xiang.lf.blog.163.com/blog/static/127733322201481114456136/ CMake是一个跨平台的程序构建工具，比如起自己编写Makefile方便很多。介绍：http://baike.baidu.com/view/1126160.htm 本文件不介绍CMake的基本语法，下面是篇不错的入门教程： http:
cvc-complex-type.2.3: Element 'beans' cannot have character Cb123456 spring Webgis
cvc-complex-type.2.3: Element 'beans' cannot have character Line 33 in XML document from ServletContext resource [/WEB-INF/backend-servlet.xml] is i
jquery实例:随页面滚动条滚动而自动加载内容 120153216 jquery
<script language="javascript"> $(function (){ var i = 4;$(window).bind("scroll", function (event){ //滚动条到网页头部的高度，兼容ie,ff,chrome var top = document.documentElement.s
将数据库中的数据转换成dbs文件何必如此 sql dbs
旗正规则引擎通过数据库配置器（DataBuilder）来管理数据库，无论是Oracle，还是其他主流的数据都支持，操作方式是一样的。旗正规则引擎的数据库配置器是用于编辑数据库结构信息以及管理数据库表数据，并且可以执行SQL 语句，主要功能如下。 1)数据库生成表结构信息：主要生成数据库配置文件(.conf文
在IBATIS中配置SQL语句的IN方式 357029540 ibatis
在使用IBATIS进行SQL语句配置查询时，我们一定会遇到通过IN查询的地方，在使用IN查询时我们可以有两种方式进行配置参数：String和List。具体使用方式如下： 1.String:定义一个String的参数userIds，把这个参数传入IBATIS的sql配置文件，sql语句就可以这样写： <select id="getForms" param
Spring3 MVC 笔记（一） 7454103 spring mvc bean REST JSF
自从 MVC 这个概念提出来之后 struts1.X struts2.X jsf 。。。。。这个view 层的技术一个接一个！都用过！不敢说哪个绝对的强悍！要看业务，和整体的设计！最近公司要求开发个新系统！
Timer与Spring Quartz 定时执行程序 darkranger spring bean 工作 quartz
有时候需要定时触发某一项任务。其实在jdk1.3，java sdk就通过java.util.Timer提供相应的功能。一个简单的例子说明如何使用，很简单： 1、第一步，我们需要建立一项任务，我们的任务需要继承java.util.TimerTask package com.test; import java.text.SimpleDateFormat; import java.util.Date;
大端小端转换，le32_to_cpu 和cpu_to_le32 aijuans C语言相关
大端小端转换，le32_to_cpu 和cpu_to_le32 字节序 http://oss.org.cn/kernel-book/ldd3/ch11s04.html 小心不要假设字节序. PC 存储多字节值是低字节为先(小端为先, 因此是小端), 一些高级的平台以另一种方式(大端)
Nginx负载均衡配置实例详解 avords
[导读] 负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡，单从字面上的意思来理解就可以解负载均衡是我们大流量网站要做的一个东西，下面我来给大家介绍在Nginx服务器上进行负载均衡配置方法，希望对有需要的同学有所帮助哦。负载均衡先来简单了解一下什么是负载均衡
乱说的 houxinyou 框架敏捷开发软件测试
从很久以前，大家就研究框架，开发方法，软件工程，好多！反正我是搞不明白！这两天看好多人研究敏捷模型，瀑布模型！也没太搞明白. 不过感觉和程序开发语言差不多，瀑布就是顺序，敏捷就是循环. 瀑布就是需求、分析、设计、编码、测试一步一步走下来。而敏捷就是按摸块或者说迭代做个循环，第个循环中也一样是需求、分析、设计、编码、测试一步一步走下来。也可以把软件开发理
欣赏的价值——一个小故事 bijian1013 有效辅导欣赏欣赏的价值
　　第一次参加家长会，幼儿园的老师说："您的儿子有多动症，在板凳上连三分钟都坐不了，你最好带他去医院看一看。"　　回家的路上，儿子问她老师都说了些什么，她鼻子一酸，差点流下泪来。因为全班30位小朋友，惟有他表现最差；惟有对他，老师表现出不屑，然而她还在告诉她的儿子："老师表扬你了，说宝宝原来在板凳上坐不了一分钟，现在能坐三分钟。其他妈妈都非常羡慕妈妈，因为全班只有宝宝
包冲突问题的解决方法 bingyingao eclipse maven exclusions 包冲突
包冲突是开发过程中很常见的问题：其表现有： 1.明明在eclipse中能够索引到某个类，运行时却报出找不到类。 2.明明在eclipse中能够索引到某个类的方法，运行时却报出找不到方法。 3.类及方法都有，以正确编译成了.class文件，在本机跑的好好的，发到测试或者正式环境就抛如下异常： java.lang.NoClassDefFoundError: Could not in
【Spark七十五】Spark Streaming整合Flume-NG三之接入log4j bit1129 Stream
先来一段废话：实际工作中，业务系统的日志基本上是使用Log4j写入到日志文件中的，问题的关键之处在于业务日志的格式混乱，这给对日志文件中的日志进行统计分析带来了极大的困难，或者说，基本上无法进行分析，每个人写日志的习惯不同，导致日志行的格式五花八门，最后只能通过grep来查找特定的关键词缩小范围，但是在集群环境下，每个机器去grep一遍，分析一遍，这个效率如何可想之二，大好光阴都浪费在这上面了
sudoku solver in Haskell bookjovi sudoku haskell
这几天没太多的事做，想着用函数式语言来写点实用的程序，像fib和prime之类的就不想提了（就一行代码的事），写什么程序呢？在网上闲逛时发现sudoku游戏，sudoku十几年前就知道了，学生生涯时也想过用C/Java来实现个智能求解，但到最后往往没写成，主要是用C/Java写的话会很麻烦。现在写程序，本人总是有一种思维惯性，总是想把程序写的更紧凑，更精致，代码行数最少，所以现
java apache ftpClient bro_feng java
最近使用apache的ftpclient插件实现ftp下载，遇见几个问题，做如下总结。 1. 上传阻塞，一连串的上传，其中一个就阻塞了，或是用storeFile上传时返回false。查了点资料，说是FTP有主动模式和被动模式。将传出模式修改为被动模式ftp.enterLocalPassiveMode();然后就好了。看了网上相关介绍，对主动模式和被动模式区别还是比较的模糊，不太了解被动模
读《研磨设计模式》-代码笔记-工厂方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 工厂方法模式：使一个类的实例化延迟到子类 * 某次，我在工作不知不觉中就用到了工厂方法模式（称为模板方法模式更恰当。2012-10-29）： * 有很多不同的产品，它
面试记录语 chenyu19891124 招聘
或许真的在一个平台上成长成什么样，都必须靠自己去努力。有了好的平台让自己展示，就该好好努力。今天是自己单独一次去面试别人，感觉有点小紧张，说话有点打结。在面试完后写面试情况表，下笔真的好难，尤其是要对面试人的情况说明真的好难。今天面试的是自己同事的同事，现在的这个同事要离职了，介绍了我现在这位同事以前的同事来面试。今天这位求职者面试的是配置管理，期初看了简历觉得应该很适合做配置管理，但是今天面
Fire Workflow 1.0正式版终于发布了 comsci 工作 workflow Google
Fire Workflow 是国内另外一款开源工作流，作者是著名的非也同志，哈哈.... 官方网站是 http://www.fireflow.org 经过大家努力,Fire Workflow 1.0正式版终于发布了正式版主要变化: 1、增加IWorkItem.jumpToEx(...)方法，取消了当前环节和目标环节必须在同一条执行线的限制，使得自由流更加自由 2、增加IT
Python向脚本传参 daizj python 脚本传参
如果想对python脚本传参数，python中对应的argc, argv(c语言的命令行参数)是什么呢？需要模块：sys 参数个数：len(sys.argv) 脚本名： sys.argv[0] 参数1： sys.argv[1] 参数2： sys.argv[
管理用户分组的命令gpasswd dongwei_6688 passwd
NAME： gpasswd - administer the /etc/group file SYNOPSIS： gpasswd group gpasswd -a user group gpasswd -d user group gpasswd -R group gpasswd -r group gpasswd [-A user,...] [-M user,...] g
郝斌老师数据结构课程笔记 dcj3sjt126com 数据结构与算法
<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<
yii2 cgridview加上选择框进行操作 dcj3sjt126com GridView
页面代码 <?=Html::beginForm(['controller/bulk'],'post');?> <?=Html::dropDownList('action','',[''=>'Mark selected as: ','c'=>'Confirmed','nc'=>'No Confirmed'],['class'=>'dropdown',])
linux mysql fypop linux
enquiry mysql version in centos linux yum list installed | grep mysql yum -y remove mysql-libs.x86_64 enquiry mysql version in yum repositoryyum list | grep mysql oryum -y list mysql* install mysq
Scramble String hcx2013 String
Given a string s1, we may represent it as a binary tree by partitioning it to two non-empty substrings recursively. Below is one possible representation of s1 = "great":
跟我学Shiro目录贴 jinnianshilongnian 跟我学shiro
历经三个月左右时间，《跟我学Shiro》系列教程已经完结，暂时没有需要补充的内容，因此生成PDF版供大家下载。最近项目比较紧，没有时间解答一些疑问，暂时无法回复一些问题，很抱歉，不过可以加群（334194438/348194195）一起讨论问题。 ----广告-----------------------------------------------------
nginx日志切割并使用flume-ng收集日志 liyonghui160com
nginx的日志文件没有rotate功能。如果你不处理，日志文件将变得越来越大，还好我们可以写一个nginx日志切割脚本来自动切割日志文件。第一步就是重命名日志文件，不用担心重命名后nginx找不到日志文件而丢失日志。在你未重新打开原名字的日志文件前，nginx还是会向你重命名的文件写日志，linux是靠文件描述符而不是文件名定位文件。第二步向nginx主
Oracle死锁解决方法 pda158 oracle
　select p.spid,c.object_name,b.session_id,b.oracle_username,b.os_user_name from v$process p,v$session a, v$locked_object b,all_objects c where p.addr=a.paddr and a.process=b.process and c.object_id=b.
java之List排序 shiguanghui list排序
在Java Collection Framework中定义的List实现有Vector，ArrayList和LinkedList。这些集合提供了对对象组的索引访问。他们提供了元素的添加与删除支持。然而，它们并没有内置的元素排序支持。　　你能够使用java.util.Collections类中的sort()方法对List元素进行排序。你既可以给方法传递
servlet单例多线程 utopialxw 单例多线程 servlet
转自http://www.cnblogs.com/yjhrem/articles/3160864.html 和 http://blog.chinaunix.net/uid-7374279-id-3687149.html Servlet 单例多线程 Servlet如何处理多个请求访问？Servlet容器默认是采用单实例多线程的方式处理多个请求的：1.当web服务器启动的