Jermiane

【吴恩达机器学习笔记】第六章逻辑回归

搜索微信公众号:‘AI-ming3526’或者’计算机视觉这件小事’ 获取更多人工智能、机器学习干货

csdn：https://blog.csdn.net/qq_36645271

github：https://github.com/aimi-cn/AILearners

第六章逻辑回归

6.1 分类问题

6.1.1 分类的例子

在分类问题中，我们要预测的变量 $y$ 是离散的值，并尝试预测的是结果是否属于某一个类（例如正确或错误）例如：

电子邮件：垃圾邮件/不是垃圾邮件。
网上转账：诈骗/不是诈骗。
肿瘤：恶性/良性。

6.1.2 二元分类

我们将因变量(dependent variable)可能属于的两个类分别称为负类（negative class）和正类（positive class）。因变量 $y\in \{0,1\}$ ，其中 0 表示负类，如良性肿瘤；1 表示正类，如恶性肿瘤。注意，这里 $y$ 只能取0和1这两个值。

在两个类别中，到底哪个是正类，哪个是负类，即哪个是0，哪个是1是任意的。但是人们往往约定负类表示没有哪样东西，正类表示具有我们要寻找的东西。例如上面，良性肿瘤表示我们“没有”肿瘤，所以是负类，即1；恶性肿瘤表示我们“有”肿瘤，所以是正类，即0。

在肿瘤预测问题中，我们可以用线性函数来做分类，如下图所示。

对于线性回归，我们可以设置分类器阈值为0.5。如果假设函数输出的值大于0.5，可以预测为 $y = 1$ ；如果小于0.5，可以预测 $y = 0$ 。对于初始的八个数据点来说，分类效果还可以，但是如果加入上图中右上角的第九个数据点，线性回归对分类问题的就不是那么好了。

并且假设函数的输出值可能远大于1或者远小于0，所以把线性回归应用于分类问题中通常不是一个好主意。因此在这里我们提出逻辑回归(logistic regression)，其特点在于算法的输出或者说是预测值一直介于0到1之间，并不会大于1或小于0。虽然算法名称中有“回归”二字，但它是一种分类算法。

6.2 假设表示

6.2.1 逻辑回归模型

目标： $0\leq h_\theta(x) \leq1$
假设函数： $h_\theta(x)=\theta^Tx$
sigmoid/logistic 函数： $g(z)=\frac{1}{1+e^{-z}}$
两式联立： $h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}$

在和是哪个数公式中，sigmoid函数和logistic函数其实是一种函数的不同名称，其函数图像如下：

因为 $g (z)$ 的值在0和1之间，那么 $h (x)$ 的值一定在0和1之间。有了假设函数之后，我们就要用参数 $\theta$ 拟合我们的数据。

6.2.2 模型的解释

我们的假设 $x$ 的输出 $h_\theta(x)$ 输出了某个数字，我们会把这个数字当做对一个输入 $x$ ， $y = 1$ 的概率估计，下面是一个例子：

假设现在有一个病人，我们把他的肿瘤大小数据“喂”给我们的假设函数。假设我们的假设函数的输出是0.7，那么对于一个特征为 $x$ 的患者， $y = 1$ 的概率是0.7。换句话说，我们将要告诉病人，这个肿瘤有70%的可能是恶性肿瘤。正式表达为 $h_\theta(x)=P(y=1|x;\theta)$ ，即在给定 $x$ 的条件下 $y = 1$ 的概率。

由于这是一个分类任务， $y$ 的取值必须是0或1，因此根据 $h_\theta(x)$ 我们也能计算 $y = 0$ 的概率，因为：

$P(y=0|x;\theta)+P(y=1|x;\theta)=1$
$P(y=0|x;\theta)=1-P(y=1|x;\theta)$

6.3 判定边界

6.3.1 进一步理解逻辑回归

在上述公式中，假设函数 $h_\theta(x)$ 输出的是给定 $x$ 和参数 $\theta$ 时， $y = 1$ 的估值概率假设：

当 $h_\theta(x)\geq0.5$ 时( $\theta^Tx\geq0$ )，预测 $y = 1$ 。
当 $h_\theta(x)<0.5$ 时( $\theta^Tx<0$ )，预测 $y = 0$ 。

结合上面公式与函数图像我们可以看出：

当 $z\geq0$ 时， $g(z)\geq0.5$ 。
那么，当 $\theta^Tx\geq0$ 时， $h_\theta(x)=g(\theta^Tx)\geq0.5$ 。
同理，当 $z < 0$ 时， $g (z) < 0.5$ 。
那么，当 $\theta^Tx<0$ 时， $h_\theta(x)=g(\theta^Tx)<0.5$ 。

如果我们要决定预测 $y = 1$ 或 $y = 0$ ，取决于估值概率是大于0.5还是小于0.5,。相当于若需要预测 $y = 1$ ，只需要 $\theta^Tx\geq0$ ；若需要预测 $y = 0$ ，只需要 $\theta^Tx<0$ 。

6.3.2 决策边界

现在假设我们有一个数据集书上图所示，以及假设函数。假设现在参数已经拟合好， $\theta_0,\theta_1,\theta_2$ 分别为-3,1,1。根据第一小节中的知识我们可以知道，只要满足 $\theta^Tx\geq0$ ，即 $-3+x_1+x_2\geq0$ ，我们的假设函数就会预测 $y = 1$ 的可能性更大，即 $x_1+x_2\geq3$ 时， $y = 1$ 。将 $x_1+x_2=3$ 这条直线表示在数据集中，我们可以发现它将数据集分成了两部分。

其中 $x_1+x_2\geq3$ 的区域，即右上角的区域为 $y = 1$ 的区域， $x_1+x_2<3$ 的区域，即左下角的区域为 $y = 0$ 的区域.我们给这条直线一个名字——决策边界(decision boundary)。

决策边界是假设函数的属性，有参数 $\theta$ 决定，它不是数据集的属性。 $\theta$ 一经决定，决策边界也就被决定。

6.3.3 非线性决策边界

让我们来看一个更加复杂的例子，我们依旧用“叉”表示正样本，用“圈”表示负样本。在这里，逻辑回归可以像多变量线性回归中一样，添加额外的高阶多项式项，如下图所示。现在我们依旧假设参数以拟合好，分别为-1,0,0,1,1。

决策边界的选定与线性例子中的相同，只不过这里的决策边界更加复杂，而不是用直线分开正负样本。

6.4 代价函数

6.4.1 如何拟合逻辑回归中的参数

在这一节中，我们要学习如何拟合逻辑回归模型的参数 $\theta$ 。具体来说，我们要定义用来拟合参数的优化目标或者代价函数。

在上述问题中， $x$ 是一个 $n + 1$ 维的向量， $y$ 只能取0和1。

6.4.2 代价函数

我们首先对线性回归中的代价函数做一些改变。这里我们不写原先的 $\frac{1}{2m}$ ，而是把 $\frac{1}{2}$ 放到求和符号里面，然后用 $cost(h_\theta(x^{(i)}),y^{(i)}$ 来表示求和符号里的式子。现在代价函数就能更强出的被表达为 $\frac{1}{m}$ 乘以这个 $c o s t$ 项在训练集范围上的求和。然后去掉 $c o s t$ 这个式子中的上标对代价函数进行简化，就可以将这个代价函数理解为它是在输出的预测值是 $h (x)$ ，而实际标签是 $y$ 的情况下我们希望学习算法所付出的代价。

这个代价函数在线性回归里很好用，但在逻辑回归中，如果我们能最小化 $J(\theta)$ ，那么它也能工作，但实际上它会变成参数 $\theta$ 的非凸函数(non-convex)。

因为逻辑回归中的 $h_\theta(x)$ 是一个复杂的非线性函数，用它计算出来的 $J(\theta)$ 就会是一个非凸函数，其具有许多局部最优解，如上图左边的函数图像所示，使用梯度下降就不能保证收敛到局部最小值，所以这里不能使用这个代价函数。

6.4.3 逻辑回归的代价函数

在逻辑回归中，我们定义：

这个代价函数看起来非常复杂，让我们通过图像来直观的对其进行理解。由于 $h_\theta（x）$ 只能取0到1之间的数，所以我们只取[0,1]上的图像。在画代价函数的图像前，让我们先回顾一下对数函数(log(x))的图像。

当 $y = 1$ 时，如果 $h_\theta(x)=1$ ，也就是说假设函数的预测值是1，那么我们的代价值应该等于0。但是当 $h_\theta(x)$ 趋于0，那么 $c o s t$ 的值趋于无穷。这相当于你预测一个病人的肿瘤是良性肿瘤( $h_\theta(x)=0$ ),但实际他的肿瘤是恶性肿瘤( $y = 1$ )，那么我们的代价值就会很大，算法将会被“惩罚”。

这是 $y = 1$ 的情况，同理，让我们看一下 $y = 0$ 的情况。让我们先画出-log(1-x)的图像如下：

之后我们画出 $y = 0$ 时的图像。其图像的特点为在 $h_\theta(x)$ 趋于1时图像激增，也就是说如果最后发现 $y = 0$ ，而我们却几乎非常肯定的预测 $y = 1$ 的概率是1，那么我们就要付出非常大的代价值。

6.5 简化的代价函数和梯度下降

6.5.1 逻辑回归代价函数

在这里，对于分类问题，在我们的训练集中，甚至不在训练集中的样本， $y$ 的值总是等于0或1的，这是由 $y$ 的数学定义决定的。因此，我们可以将 $c o s t$ 的两个式子合并成一个等式，这将使我们更方便的写出代价函数，并推导出梯度下降。具体的，代价函数将写为：
$Cost(h_\theta(x),y)=-ylog(h_\theta(x))-(1-y)log(1-h_\theta(x))$
在这里，我们都知道 $y$ 只能取0和1。

当 $y = 1$ 的时候 $Cost(h_\theta(x),y)=-ylog(h_\theta(x))$ 。与上面 $y = 1$ 是等式相同。
当 $y = 0$ 的时候 $Cost(h_\theta(x),y)=-log(1-h_\theta(x))$ 。与上面 $y =$ 是0等式相同。

通过这种方式定义的代价函数只是把两个式子写成一种更紧凑的形式而不需要区分 $y = 1$ 或 $y = 0$ 来写。这样逻辑回归的代价函数如下：

这个式子是从统计学中的极大似然法(maximum likelihood)得来的，它是统计学中为不同模型快速寻找参数的方法，同时它还有一种较好的性质——它是凸函数。

为了拟合参数 $\theta$ ：最小化代价函数 $J(\theta)$ 。
为了根据新的 $x$ 做预测：用拟合得到的 $\theta$ 输出 $h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}$ 。

另外，我们假设的输出，实际上就是输入为 $x$ ，以 $\theta$ 为参数时 $y = 1$ 的概率，即 $P(y=1|x;\theta)$ 。所以接下来要做的就是弄清楚如何最小化代价函数 $J(\theta)$ ，这样我们才能拟合出参数 $\theta$ 。

6.5.2 梯度下降

如果要最小化这个关于 $\theta$ 的函数，我们要反复更新每个参数，即用它自己减去学习率 $\alpha$ 乘以后面的导数项。我们计算后面的偏导数项如下：
$\frac{\partial}{\partial\theta_j}J(\theta)=\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x^{(i)})-y^{(i)})x_j^{(i)}$
之后把这个偏导数项放回原来的式子里，我们就可以将梯度下降算法写成如下形式：

在这里我们会发现逻辑回归的梯度下降的更新规则与线性回归在形式上是相同的，但是他们却不是一个算法。逻辑回归中假设 $h_\theta(x)$ 的定义已经改变，因此，即使参数更新的规则看起来相同，但是由于假设函数的定义发生了变化，所以二者不同。

在这里，监控梯度下降过程的方法与之前相似——画出代价函数随迭代步数变化的函数。

6.6 高级优化

6.6.1 梯度下降

在我们学习高级优化前，让我们换个角度再来看什么是梯度下降。

在梯度下降中，我们有代价函数 $J(\theta)$ ，并且我们要使它最小化。那么我们要做的是编写代码，当输入参数 $\theta$ 时，它会计算出两样东西—— $J(\theta)$ 以及 $j$ 从0到n时的偏导数项。假设我们已经完成了这两步，那么梯度下降要做的就是反复执行这些更新，从而更新参数 $\theta$ 。其实我们只需要编写代码来计算导数项，但是如果你希望还能监控代价函数的收敛性，那我们还需要编写代码来计算代价函数和偏导数项。

6.6.2 高级优化算法

除了梯度下降以外，还有其他一些优化算法更高级、更复杂，如共轭梯度法(conjugate gradient)，BFGS和L-BFGS。这三种算法有许多有点：

不需要手动选择学习率 $\alpha$ ，在给出计算导数项和代价函数的方法之后，这些算法有一个“只能内循环”，称为线搜索算法(line search algorithm)，它可以自动尝试不同的学习速率 $\alpha$ 并自动选择一个好的学习率 $\alpha$ 。它甚至可以为每次迭代选择不同的学习速率。
收敛速度比梯度下降快。

缺点就是他们比梯度下降复杂。

6.6.3 使用优化算法的例子

现在我们有一个包含两个参数的问题，通过最小化代价函数，我们可以得到 $\theta_1=5$ ， $\theta_2=5$ ，同时代价函数分别对两个参数求偏导后的结果也如上图所示。用Octave实现代价函数如图右上所示。这个函数的作用是返回两个自变量，第一个自变量jVal是我们计算的代价函数 $J(\theta)$ ，第二个自变量gradient是一个向量，对应着偏导数项。运行完这个costFunction函数之后就可以调用高级的优化函数fminunc，它在Octave中表示无约束最小化函数(minimization unconstrained)。其调用方式如下：

你要设置几个options，这个 options 变量作为一个数据结构可以存储你想要的options，所以‘GradObj’和‘On’，意思是设置梯度目标参数为打开(on)，这意味着你现在确实要给这个算法提供一个梯度，然后设置最大迭代次数，‘MaxIter’和‘100’表示最大迭代次数为100。
我们给出一个参数 $\theta$ d的猜测初始值，它是一个2×1的向量。
调用fminunc，这里的‘@’符号表示指向我们刚刚定义的costFunction函数的指针。如果你调用它，它就会使用众多高级优化算法中的一个，当然你也可以把它当成梯度下降，只不过它能自动选择学习速率，你不需要自己来做。然后它会尝试使用这些高级的优化算法，就像加强版的梯度下降法，为你找到最佳的值。

在Octave中运行效果如下：

这里的exitFlag=1证明代价函数已经是收敛了的。

6.6.4 高级优化在逻辑回归中的应用

在上图中，我们混合使用了Octave代码与数学公式。这里有 $n + 1$ 个参数，但在Octave中，标号是从1开始的，所以这里的 $\theta_0$ 一般在Octave中写成 $t h e t a (1)$ 。在这里，首先我们需要写一个costFunction函数，它为逻辑回归求得代价函数。

总结来说，无论是线性回归还是逻辑回归，我们都要

先编写代码来实现他们的代价函数，返回函数值以及梯度。
再滴哦用高级优化函数对其进行最小化直至收敛，得到我们需要的参数。

6.7 多类别分类：一对多

6.7.1 多类别分类问题

我们用三个例子来了解什么是**多类别分类(multiclass classification)**问题：

假如说你现在需要一个学习算法能自动地将邮件归类到不同的文件夹里，或者说可以自动地加上标签，那么，你也许需要一些不同的文件夹，或者不同的标签来完成这件事，来区分开来自工作的邮件、来自朋友的邮件、来自家人的邮件或者是有关兴趣爱好的邮件，那么，我们就有了这样一个分类问题：其类别有四个，分别用 $y = 1, y = 2, y = 3, y = 4$ 来代表。
第二个例子是有关药物诊断的，如果一个病人因为鼻塞来到你的诊所，他可能并没有生病，用 $y = 1$ 这个类别来代表；或者患了感冒，用 $y = 2$ 来代表；或者得了流感用 $y = 3$ 来代表。
第三个例子：如果你正在做有关天气的机器学习分类问题，那么你可能想要区分哪些天是晴天、多云、雨天、或者下雪天。

对上述所有的例子， $y$ 可以取一个很小的数值，比如1 到3、1到4或者其它数值，以上说的都是多类分类问题，值得注意的是，对于下标是0 1 2 3，还是 1 2 3 4 都不重要，其实怎样标注都不会影响最后的结果。

下图是**二元分类(binary classification)与多元分类(Multi-class classification)**可视化数据集的对比。在多元分类中，我们用三种符号代表三种不同的类别。

6.7.2 一对多

**一对多(one-vs-all)方法有时也被称为一对余(one-vs-rest)**方法，其核心思想是将这个数据集转换为三个独立的二元分类为题。

是偶先我们将类别1(class 1)设定为正类，将类别2(class 2)和类别3(class 3)设定为负类，则会形成一个新数据集如上图所示。这时，我们要拟合一个分类器 $h_\theta^{(1)}(x)$ 。这里的三角形代表正样本，其值为1，圆圈代表负样本，其值为0，这样我们就能得到一个决策边界。之后我们对类别2和类别3也进行这样的处理。

总而言之，我们拟合出三个分类器，对于 $i = 1, 2, 3$ ，我们拟合分类器 $h_\theta^{(i)}(x)$ 来尝试估计出给定 $x$ 和 $\theta$ 时， $y = i$ 的概率。我们这三个分类器都针对其中一种情况进行训练。最后为了做出预测，我们给出一个新的输入值 $x$ ，期望获得预测，我们要做的就是分别在这三个分类器中输入 $x$ ，然后选择 $h$ 最大的类别，即选出可信度最高，效果最好的那个分类器。无论 $i$ 是多少，输出的值就是我们要预测的那个值。

AIMI-CN AI学习交流群【1015286623】获取更多AI资料，扫码加群：

分享技术，乐享生活：欢迎关注我们的公众号，每周推送AI系列资讯类文章，欢迎您的关注！

机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
【K8s】专题十一：Kubernetes 集群证书过期处理方法行者Sun1989 Kubernetes kubernetes 云原生容器
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口Linux专栏|Docker专栏|Kubernetes专栏往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【Docker】MySQL源码构建Docker镜
个人笔记--python代码--储存数据 pdc31czy 个人笔记 Python python 笔记
1.存储Error（txt文件）importnumpyasnp#Errorerror_u=np.linalg.norm(exact_u_current-predict_np_u,2)/np.linalg.norm(exact_u_current,2)error_v=np.linalg.norm(exact_v_current-predict_np_v,2)/np.linalg.norm(exact
基于Llama 3搭建中文版（Llama3-Chinese-Chat）大模型对话聊天机器人老牛同学 AI 专业技术 llama 机器人人工智能 ai Ollama
前面两篇博文，我们分别在个人笔记本电脑部署了Llama38B参数大模型，并使用Ollama搭建了基于Web可视化对话聊天机器人，可以在自己电脑上愉快的与Llama大模型Web机器人对话聊天了。但在使用过程中，笔者发现Llama大模型经常出现中文问题英文回答的问题，需要使用中文回答等提示词告诉大模型用中文回答，体验还不是最好的。今天，本博文就来解决这个问题，让我们有个中文版的Llama3Web对话机
【K8s】专题十三：Kubernetes 容器运行时之 Docker 与 Containerd 详解行者Sun1989 Kubernetes kubernetes 云原生容器 containerd docker
本文内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！专栏订阅入口Linux专栏|Docker专栏|Kubernetes专栏往期精彩文章【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法【Docker】（全网首发）KylinV10下MySQL容器内存占用异常的解决方法（续）【Docker】MySQL源码构建Docker镜
【成为架构师4-2】解耦：MQ，互联网架构的解耦利器 Nevercome_ 成为架构师消息队列架构后端
系列文章是博主对沈剑的《架构师训练营》分享内容的个人笔记总结，原内容公众号“成为架构师”。目录MQ是什么不应该使用MQ的场景典型场景一：数据驱动的依赖任务典型场景二：上游不关心执行结果典型场景三：上游关注执行结果，但是执行时间较长典型场景四：削峰填谷，流量控制，保护下游MQ是什么MQ，消息队列，或者叫消息总线，常用于上下游之间消息通信的解耦。上游是一个消息发送进程，中间是MQ服务，下游是消息接收进
Tomcat的作用（自用） w_3123454 大师我悟了 tomcat java 容器
本文为个人笔记，记录自己对Tomcat的一些疑问，及搜索到的一些答案。不一定准确，仅供自用。。几个重要概念：容器，web容器，http服务，项目部署到Tomcatservlet是一种规范，Tomcat是运行servlet的一种容器文章目录1.[Tomcat是一个应用服务器](https://www.cnblogs.com/toSeeMyDream/p/6379330.html)2.Tomcat提供
【Docker】MySQL 源码构建 Docker 镜像（基于 ARM 64 架构）行者Sun1989 Docker docker mysql 容器
以下内容均来自个人笔记并重新梳理，如有错误欢迎指正！如果对您有帮助，烦请点赞、关注、转发、订阅专栏！欢迎扫码关注个人公众号，不定期推送热点文章！公众号原文链接：MySQL源码构建Docker镜像（基于ARM64架构）背景介绍近期，笔者正推进公司MySQL适配ARM64架构工作，由于一直使用DockerHub上的官方镜像，所以第一时间在Hub上检索，却发现官方只为MySQL8.0以上版本提供ARM6
Vue的个人笔记 Purple Coder 笔记
Vue学习小tipsctrl+s---->运行alt+b链接插值表达式指令
算法练习-赎金信（思路+流程图+代码） Yamai Yuzuru 算法编程笔记流程图
难度参考难度：中等分类：哈希表难度与分类由我所参与的培训课程提供，但需要注意的是，难度与分类仅供参考。且所在课程未提供测试平台，故实现代码主要为自行测试的那种，以下内容均为个人笔记，旨在督促自己认真学习。题目给你两个字符串：ransomNote和magazine，判断ransomNote能不能由magazine里面的字符构成。如果可以，返回true；否则返回false示例1:输入：ransomNo
算法练习-分割等和子集（思路+流程图+代码） Yamai Yuzuru 算法编程笔记算法数据结构
难度参考难度：困难分类：动态规划难度与分类由我所参与的培训课程提供，但需要注意的是，难度与分类仅供参考。且所在课程未提供测试平台，故实现代码主要为自行测试的那种，以下内容均为个人笔记，旨在督促自己认真学习。题目给定一个只包含正整数的非空数组。是否可以将这个数组分割成两个子集，使得两个子集的元素和相等。注意：每个数组中的元素不会超过100数组的大小不会超过200示例1:输入：[1，5，11，5]输出
算法练习-01背包问题【含递推公式推导】（思路+流程图+代码） Yamai Yuzuru 算法编程笔记流程图
难度参考难度：困难分类：动态规划难度与分类由我所参与的培训课程提供，但需要注意的是，难度与分类仅供参考。且所在课程未提供测试平台，故实现代码主要为自行测试的那种，以下内容均为个人笔记，旨在督促自己认真学习。题目动态规划经典问题01背包？具体内容：背包最大重量为4物品如下：重量价值物品0115物品1320物品2430问背包能背的最大重量是多少？思路0-1背包问题的动态规划解法基于以下思路：子问题定义
JavaScript 基础学习（个人笔记）松果猿 javascript 笔记
目录本笔记内容主要来源于网络上的资料，经过我个人整理、归纳和总结。仅供个人学习参考，如有侵权，请联系删除JavaScript用法中的JavaScript中的JavaScript函数引入本地独立JS文件引入网络来源文件JavaScript输出JavaScript显示数据使用window.alert()写到控制台JavaScript语法JavaScript字面量JavaScript变量JavaScri
深度学习基础叁：反向传播算法白拾Official #深度学习神经网络算法网络深度学习人工智能
注：封面画师：新雨林-触站说明本页面无手机端适配，强制缩放阅读。使用纯html格式，保存教学用ppt，添加了部分个人笔记。目录工作正常，可以跳转。反向传播这里对反向传播的讲解比较奇怪，可能比较适合初学者理解。想要通过严谨的数学推导理解反向传播的同学，可以搜索一下。反向传播算法反向传播算法什么是正向传播网络什么是反向传播反向传播算法为什么需要反向传播图解反向传播反向传播计算链式求导法则案例1：通过反
HCIA~HCIE个人笔记索引 Hades_Ling HCIA相关知识 HCIP相关知识华为网络
HCIA~HCIE个人笔记索引HCIA部分(2022.11.27~2022.12.19)1.0.0华为设备telnet与ssh的配置1.1.0华为设备FTP服务器2.0.0以太网CSMA-CD与CSMA-CA的区别与工作方式2.1.0以太网以太网帧格式与报文分片2.10.0以太网传统STP生成树（简介、工作方式）2.10.1以太网传统STP生成树（STPBPDU、STP端口状态、STP工作过程）2
R语言从拍摄照片生成色卡用于统计图 youmigo
ok.pngex_2021-04-29_02-10-25.pngex_2021-04-29_02-13-55.png图片1.jpg微信图片_20210429013555.jpg#ThuApr2901:37:232021-#字符编码：UTF-8#R版本：Rx644.0.5forwindow10#[email protected]#个人笔记不负责任，拎了个梨.rs.restartR()requir
通讯的基本概念理解懈 & CJ stm32
#纯属个人笔记作为学习记录用途#较多个人比较好理解的说法可能不太准确若发现错误欢迎评论区指正通讯的基本概念一、串行通讯与并行通讯按数据传送的方式，通讯可分为串行通讯与并行通讯，串行通讯是指设备之间通过少量数据信号线(一般是8根以下)，地线以及控制信号线，按数据位形式一位一位地传输数据的通讯方式。而并行通讯一般是指使用8、16、32及64根或更多的数据线进行传输的通讯方式。理解一：串行通信和并行通讯
设置系统时钟深度理解懈 & CJ stm32
#纯属个人笔记作为学习记录用途#较多个人比较好理解的说法可能不太准确若发现错误欢迎评论区指正使用HSE时，设置系统时钟的步骤1、开启HSE，并等待HSE稳定2、设置AHB、APB2、APB1的预分频因子3、设置PLL的时钟来源，和PLL的倍频因子，设置各种频率主要就是在这里设置4、开启PLL，并等待PLL稳定5、把PLLCK切换为系统时钟SYSCLK6、读取时钟切换状态位，确保PLLCLK被选为系
个人笔记～请不要点进来好多番茄
1.虽然三十岁不到，但我已深知人的时间和精力确实非常有限，所以近三年里我一直在做减法，舍弃追逐趋势，因为发展太快，变坏太快，热点趋势轮番变动，往往一个还没怎么了解就被另一个夺取了注意力，根本停不下来，没有一个热点趋势是熟悉的。目前只关注财商思维和基金定投，其他的一概不关注。2.建议做投资最好选择成熟的市场，监管严格且制度化，这样金融的发展就会更加的规范化和标准化，投资者获得的信息就会更加的充分，真
产品职业相关-个人笔记（草稿修改中） cb3349770665
一、竞品分析1.理解：监测同行业功能或面向对象相似的产品的功能以及各项数据，取其所长，视情况用于己身。信息来源：艾瑞网等行业报告、各大应用市场2.二、原型1.规范：UML三、文档四、职业与发展发展方向：1）战略层面／方向五、我学到了什么：1.不要人云亦云原样照搬。思考、分析竞品做这个功能是在什么环境下、面向
【个人笔记】计算机网络五层结构理解图灵重生我名苏泽个人学习笔记笔记计算机网络
#纯属个人笔记作为学习记录用途#较多个人比较好理解的说法可能不太准确若发现错误欢迎评论区指正不希望误导小白详细的概念请以书本的定义为准目录正片传统的五层结构如下：物理层（PhysicalLayer）：负责传输比特流，通过物理媒介（如电缆、光纤等）传输数据。定义了电压、电流、物理连接等细节规范，确保数据的可靠传输。数据链路层（DataLinkLayer）：提供节点之间可靠的数据传输。将比特组装成帧，
MySQL数据表设计，三大范式 Broken故城
个人笔记，仅供参考数据库的三大设计范式三大范式即三个创建数据表的准则，根据自己的实际需求决定是否遵守即可1、第一范式，（1NF）数据表中的所有字段都是不可分割的原子值例如一个地址信息，如果全部存在一个字段中就不符合第一范式，需要把国家，省份这些信息尽可能拆分到不同字段才满足。这样可以方便以后检索。举例：createtablestudent1(idintprimarykey,namevarchar(
fast.ai 深度学习笔记（三）绝不原创的飞龙人工智能人工智能深度学习笔记
深度学习2：第1部分第6课原文：medium.com/@hiromi_suenaga/deep-learning-2-part-1-lesson-6-de70d626976c译者：飞龙协议：CCBY-NC-SA4.0来自fast.ai课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。第6课[##2017年深度学习优
fast.ai 机器学习笔记（一）绝不原创的飞龙人工智能人工智能 python
机器学习1：第1课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-1-84a1dc2b5236译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。简要课程大纲根据时间和班级兴趣，我们将涵盖类似以下内容
R语言,rayshader包，save_3dprint函数，保存3D打印 youmigo
好像不支持中文。实操失败。#FriOct1601:08:342020-#字符编码：UTF-8#R版本：Rx644.0.2forwindow10#[email protected]#个人笔记不负责任#——拎了个梨.rs.restartR()#save_3dprint函数，保存3D打印rm(list=ls());gc()require(rayshader)#编写可用于3D打印的立体光刻（STL）文
fast.ai 机器学习笔记（四）绝不原创的飞龙人工智能人工智能 python
机器学习1：第11课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-11-7564c3c18bbb译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。使用SGD优化多层函数的回顾[0:00]这个想法是
fast.ai 深度学习笔记（六）绝不原创的飞龙人工智能人工智能 python 深度学习
深度学习2：第2部分第12课原文：medium.com/@hiromi_suenaga/deep-learning-2-part-2-lesson-12-215dfbf04a94译者：飞龙协议：CCBY-NC-SA4.0来自fast.ai课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。生成对抗网络（GANs）视频
fast.ai 机器学习笔记（三）绝不原创的飞龙人工智能人工智能 python
机器学习1：第8课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-8-fa1a87064a53译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。广义定义的神经网络视频/笔记本正如我们在上一课结束时讨
fast.ai 机器学习笔记（二）绝不原创的飞龙人工智能人工智能 python
机器学习1：第5课原文：medium.com/@hiromi_suenaga/machine-learning-1-lesson-5-df45f0c99618译者：飞龙协议：CCBY-NC-SA4.0来自机器学习课程的个人笔记。随着我继续复习课程以“真正”理解它，这些笔记将继续更新和改进。非常感谢Jeremy和Rachel给了我这个学习的机会。视频复习测试集，训练集，验证集和OOB我们有一个数据集
个人笔记-动态规划 amazing_hh 算法集算法
文章目录思想过程实现的套路1.自底向上2.自顶向下题目1.经典的数字三角形问题2.最大连续子序列和3.最长公共子序列背包问题1.01背包2.多重背包3.完全背包思想首先，动态规划最重要的是掌握他的思想，动态规划的核心思想是把原问题分解成子问题进行求解，也就是分治的思想。那么什么问题适合用动态规划呢？我们通过一个现实中的例子，来理解这个问题。大家可能在公司里面都有一定的组织架构，可能有高级经理、经理
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

【吴恩达机器学习笔记】第六章 逻辑回归

第六章 逻辑回归