Chen丶YiDA

吴恩达机器学习笔记（一）之梯度下降和线性回归

文章目录

Machine Learning

一、介绍

1.1 机器学习的概念
1.2 分类

1.2.1 监督学习
1.2.2 无监督学习（Unsupervised Learning）

2 Model and Cost Function

2.1 模型表示
2.2 代价函数（Cost Function）

2.2.1 代价函数的直观理解1
2.2.2 代价函数的直观理解2

2.3 梯度下降（Gradient descent）

2.3.1 概念
2.3.2 梯度下降的直观理解
2.3.3 梯度下降的线性回归

参考文献：

Machine Learning

一、介绍

1.1 机器学习的概念

汤姆·米切尔（Tom Mitchell）提供了一个定义：“如果某计算机程序在T任务上的性能（由P来衡量）随着经验E的提高而提高，则可以说它是从经验E中学习有关某类任务T和性能指标P的。 ”

1.2 分类

1.2.1 监督学习

回归（Regression）问题：目标是推测一个连续的值的输出（具体的数值：比如说房价）
分类（Classification）问题：目标是推测离散值输出（比如说肿瘤的类型，0代表良性1代表恶性）

Question：假设你经营着一家公司，你想开发学习算法来处理这两个问题：

你有一大批同样的货物，想象一下，你有上千件一模一样的货物等待出售，这时你想预测接下来的三个月能卖多少件？
你有许多客户，这时你想写一个软件来检验每一个用户的账户。对于每一个账户，你要判断它们是否曾经被盗过？

那这两个问题，它们属于分类问题、还是回归问题?

问题一是一个回归问题，因为你知道，如果我有数千件货物，我会把它看成一个实数，一个连续的值。因此卖出的物品数，也是一个连续的值。

问题二是一个分类问题，因为我会把预测的值，用 0 来表示账户未被盗，用 1 表示账户曾经被盗过。所以我们根据账号是否被盗过，把它们定为0 或 1，然后用算法推测一个账号是 0 还是 1，所以它归为分类问题。

总结：监督学习问题分为“回归”和“分类”。在回归问题中，我们试图预测连续输出中的结果；在分类问题中，我们尝试预测离散输出中的结果。

1.2.2 无监督学习（Unsupervised Learning）

有一堆数据。我不知道数据里面有什么。我不知道谁是什么类型。我甚至不知道人们有哪些不同的类型，这些类型又是什么。但你能自动地找到数据中的结构吗？就是说你要自动地聚类那些个体到各个类，我没法提前知道哪些是哪些。因为我们没有给算法正确答案来回应数据集中的数据，所以这就是无监督学习。

无监督学习使我们几乎或根本不了解结果应该是什么样子。我们可以从数据中获得结构，而不必知道变量的影响。我们可以通过基于数据中变量之间的关系对数据进行聚类来推导此结构。在无监督学习的情况下，没有基于预测结果的反馈。

例：
聚类：收集1,000,000个不同的基因，然后找到一种方法，将这些基因自动分组为通过不同变量（例如寿命，位置，角色等）在某种程度上相似或相关的组。
非聚类：“Cocktail Party Algorithm”，使您可以在混乱的环境中找到结构。（即在Cocktail party上从一连串的声音中识别出个人声音和音乐）。

2 Model and Cost Function

2.1 模型表示

以之前的预测房价问题为例，假使我们回归问题的训练集（Training Set）如下表所示：

我们将要用来描述这个回归问题的标记如下:

m 代表训练集中实例的数量

x 代表特征/输入变量

y 代表目标变量/输出变量

(x,y) 代表一个训练样本

${{x}^{(i)}},{{y}^{(i)}})$ 代表第 $i$ 个训练样本

$h$ 代表学习算法的解决方案或函数也称为假设（hypothesis）

这就是一个监督学习算法的工作方式，我们可以看到这里有我们的训练集里房屋价格

解决房价预测问题，我们实际上是要将训练集“喂”给我们的学习算法，进而学习得到一个假设 $h$ ，然后将我们要预测的房屋的尺寸作为输入变量输入给 $h$ ，预测出该房屋的交易价格作为输出变量输出为结果。那么，对于我们的房价预测问题，我们该如何表达 $h$ ？

$h$ 代表hypothesis(假设)，输入是房屋尺寸大小， $y$ 值对应房子的价格因此， $h$ 是一个从 $x$ 到 $y$ 的函数映射。

一种可能的表达方式为： $h_\theta \left( x \right)=\theta_{0} + \theta_{1}x$ ，因为只含有一个特征/输入变量，因此这样的问题叫作单变量线性回归问题。

2.2 代价函数（Cost Function）

我在线性回归中我们有一个像这样的训练集， $m$ 代表了训练样本的数量，比如 $m = 47$ 。而我们的假设函数，也就是用来进行预测的函数，是这样的线性函数形式： $h_\theta \left( x \right)=\theta_{0}+\theta_{1}x$ 。

接下来我们会引入一些术语为我们的模型选择合适的参数（parameters） $\theta_{0}$ 和 $\theta_{1}$ ，在房价问题这个例子中便是直线的斜率和在 $y$ 轴上的截距。

我们选择的参数决定了我们得到的直线相对于我们的训练集的准确程度，模型所预测的值与训练集中实际值之间的差距（下图中蓝线所指）就是建模误差（modeling error）

我们的目标便是选择出可以使得建模误差的平方和能够最小的模型参数。即使得代价函数 $\left( \theta_0, \theta_1 \right) = \frac{1}{2m}\sum\limits_{i=1}^m \left( h_{\theta}(x^{(i)})-y^{(i)} \right)^{2}$ 最小。

2.2.1 代价函数的直观理解1

先看个简单地例子，假设其中一个参数 $\theta_{0} = 0$

如果我们尝试从视觉上考虑它，我们的训练数据集将分散在x-y平面上。我们正在尝试画一条直线（定义为 $h_\theta \left( x \right)$ )穿过这些分散的数据点。

我们的目标是获得最佳的生产线。最佳可能的线应是这样，以使散射点与该线的平均垂直垂直距离最小。理想情况下，直线应穿过训练数据集的所有点。在这种情况下， $J(\theta_{0}, \theta_{1})$ 将为0。以下示例显示了成本函数为0的理想况。

此时 $\theta_{1}= 1$ ， $h_\theta \left( x \right)$ 贯穿模型中的每个数据点。相反，当 $\theta_{1}= 0.5$ 。如下图所示，我们看到从拟合到数据点的垂直距离增加了。

这将我们的成本函数提高到0.58。绘制其他几个点可得出下图：

因此，作为目标，我们应尽量减少代价函数。在这种情况下， $\theta_{1} =1$ 时，代价函数最低。

2.2.2 代价函数的直观理解2

这是代价函数 $J(\theta_{0}, \theta_{1})$ 的3D曲面图

可以用等高线图来表示3D曲面图，取任何颜色并沿“圆”走，代价函数都有相同的值。例如，在下面的绿线上找到的三个绿点具有相同 $J(\theta_{0}, \theta_{1})$ 的值。带圆圈的x在出现以下情况时在，左侧显示图形的代价函数的值 $\theta_{0}=800$ 和 $\theta_{1}=-0.15$ ,假设函数 $h_\theta \left( x \right)$ 的图像如下图所示。

当 $\theta_{0}=360$ 和 $\theta_{1}=0$ 时，代价函数 $J(\theta_{0}, \theta_{1})$ 的值在等高线图中更靠近中心，从而减少了误差。

现在给我们的假设函数一个稍微为正的斜率，就可以更好地拟合数据。当$ \theta_{0}=250 $和$ \theta_{1}=$0.12时，代价函数更小了。

2.3 梯度下降（Gradient descent）

2.3.1 概念

梯度下降是一个用来求函数最小值的算法，我们将使用梯度下降算法来求出代价函数 $J(\theta_{0}, \theta_{1})$ 的最小值。

梯度下降背后的思想是：开始时我们随机选择一个参数的组合 $\left( {\theta_{0}},{\theta_{1}},......,{\theta_{n}} \right)$ ，计算代价函数，然后我们寻找下一个能让代价函数值下降最多的参数组合。我们持续这么做直到找到一个局部最小值（local minimum），因为我们并没有尝试完所有的参数组合，所以不能确定我们得到的局部最小值是否便是全局最小值（global minimum），选择不同的初始参数组合，可能会找到不同的局部最小值

梯度下降的算法为：

其中 $a$ 是学习率（learning rate），它决定了我们沿着能让代价函数下降程度最大的方向向下迈出的步子有多大，在批量梯度下降中，我们每一次都同时让所有的参数减去学习速率乘以代价函数的导数。

在每次迭代 $j$ 时.同时更新 ${\theta_{0}}$ 和 ${\theta_{1}}$ ，下图左边为正确的更新方式。

2.3.2 梯度下降的直观理解

首先使用一个参数 $\theta_{1}$ 的情况,并绘制其代价函数以实现梯度下降。我们的单个参数公式为：

${\theta_{1}}:={\theta_{1}}-\alpha \frac{\ d}{\ d {\theta_{1}}}J\left( \theta_{1} \right)$

$\left( \theta_1 \right) = \frac{1}{2m}\sum\limits_{i=1}^m \left( h_{\theta}(x^{(i)})-y^{(i)} \right)^{2}$

下图所示，（这点的导数就是这点的斜率），当斜率为负时， ${\theta_{1}}$ 更新后等于 ${\theta_{1}}$ 减去一个正数数乘以 $a$ ， ${\theta_{1}}$ 是减小的，当斜率为正时； ${\theta_{1}}$ 增大。

那么 $a$ 学习率要时刻调整吗？

在梯度下降法中，当我们接近局部最低点时，梯度下降法会自动采取更小的幅度，这是因为当我们接近局部最低点时，很显然在局部最低时导数等于零，所以当我们接近局部最低时，导数值会动变得越来越小，所以梯度下降将自动采取较小的幅度，这就是梯度下降的做法。所以实际上没有必要再另外减小 $a$ 。

2.3.3 梯度下降的线性回归

梯度下降是很常用的算法，它不仅被用在线性回归上和线性回归模型、平方误差代价函数。接下来将梯度下降和代价函数结合。我们将用到此算法，并将其应用于具体的拟合直线的线性回归算法里。

梯度下降算法和线性回归算法比较如图：

对我们之前的线性回归问题运用梯度下降法，关键在于求出代价函数的导数，即：

$\frac{\partial }{\partial {{\theta }_{j}}}J({{\theta }_{0}},{{\theta }_{1}})=\frac{\partial }{\partial {{\theta }_{j}}}\frac{1}{2m}{{\sum\limits_{i=1}^{m}{\left( {{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}} \right)}}^{2}}$

$j = 0$ 时： $\frac{\partial }{\partial {{\theta }_{0}}}J({{\theta }_{0}},{{\theta }_{1}})=\frac{1}{m}{{\sum\limits_{i=1}^{m}{\left( {{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}} \right)}}}$

$j = 1$ 时： $\frac{\partial }{\partial {{\theta }_{1}}}J({{\theta }_{0}},{{\theta }_{1}})=\frac{1}{m}\sum\limits_{i=1}^{m}{\left( \left( {{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}} \right)\cdot {{x}^{(i)}} \right)}$

则算法改写成：

Repeat {

${\theta_{0}}:={\theta_{0}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{ \left({{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}} \right)}$

${\theta_{1}}:={\theta_{1}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{\left( \left({{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}} \right)\cdot {{x}^{(i)}} \right)}$

}

但是我们在此处为线性回归提出的优化问题只有一个全局最优，而没有其他局部最优。因此，梯度下降总是会收敛（假设学习率α不太大）到全局最小值。实际上， $J(\theta_{0}, \theta_{1})$ 是一个凸二次函数。

下图显示了梯度下降所采取的轨迹，该轨迹在（48,30）处初始化。图中的x（由直线连接）标记了梯度下降收敛到最小值时经历的θ的连续值。也成为“Batch” Gradient Descent（批量梯度下降），因为每一次更新参数都遍历了整个数据集。

参考文献：

https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes
https://www.coursera.org/course/ml

你可能感兴趣的:(吴恩达机器学习笔记)

吴恩达机器学习笔记（1）—引言大饼酥人工智能机器学习人工智能吴恩达
目录一、欢迎二、机器学习是什么三、监督学习四、无监督学习一、欢迎机器学习是当前信息技术领域中最令人兴奋的方向之一。在这门课程中，你不仅会学习机器学习的前沿知识，还将亲手实现相关算法，从而深入理解其内部机理。事实上，机器学习已广泛渗透进我们的日常生活。例如，每次你使用Google、Bing进行搜索，或用Facebook、Apple的图像识别功能识别朋友，甚至邮箱中的垃圾邮件过滤器，背后都离不开机器学
吴恩达机器学习笔记：特征与多项式回归ちゆきー机器学习笔记回归
1.特征和多项式回归如房价预测问题，ℎθ(x)=θ0+θ1×frontage+θ2×deptℎx1=frontage（临街宽度），x2=deptℎ（纵向深度），x=frontage∗deptℎ=area（面积），则：hθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1xhθ(x)=θ0+θ1x线性回归并不适用于所有数据，有时我们需要曲线来适应我们的数据，比如一个二次方
吴恩达机器学习笔记：多维梯度下降实践ちゆきー机器学习笔记计算机视觉
1.特征放缩在我们面对多维特征问题的时候，我们要保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快地收敛。以房价问题为例，假设我们使用两个特征，房屋的尺寸和房间的数量，尺寸的值为0-2000平方英尺，而房间数量的值则是0-5，以两个参数分别为横纵坐标，绘制代价函数的等高线图能看出图像会显得很扁，梯度下降算法需要非常多次的迭代才能收敛。解决的方法是尝试将所有特征的尺度都尽量缩放到-1到1之间。如
吴恩达机器学习笔记：监督学习ちゆきー机器学习笔记学习
1.回归我们用一个例子介绍什么是监督学习把正式的定义放在后面介绍。假如说你想预测房价。前阵子，一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来，看起来是这个样子：横轴表示房子的面积，单位是平方英尺，纵轴表示房价，单位是千美元。那基于这组数据，假如你有一个朋友，他有一套750平方英尺房子，现在他希望把房子卖掉，他想知道这房子能卖多少钱。我们应用学习算法，可以在这组数据中画一条
吴恩达机器学习笔记复盘（二）监督学习和无监督学习 wgc2k 机器学习机器学习笔记学习
监督学习经济价值以及定义监督学习是机器学习中创造了99%经济价值的类型，它是学习输入到输出映射的算法，关键在于给学习算法提供包含正确答案（即给定输入X的正确标签Y）的学习例子。生活中的例子邮件分类，输入是电子邮件，输出是判断邮件是否为垃圾邮件。语音识别，输入音频剪辑，输出文本记录。机器翻译，输入一种语言文本，输出其他语言的相应翻译。在线广告，输入广告和用户信息，预测用户是否点击广告，为公司带来大量
吴恩达机器学习全课程笔记第二篇亿维数组 Machine Learning 机器学习笔记人工智能学习
目录前言P31-P33logistics（逻辑）回归决策边界P34-P36逻辑回归的代价函数梯度下降的实现P37-P41过拟合问题正则化代价函数正则化线性回归正则化logistics回归前言这是吴恩达机器学习笔记的第二篇，第一篇笔记请见：吴恩达机器学习全课程笔记第一篇完整的课程链接如下：吴恩达机器学习教程（bilibili）推荐网站：scikit-learn中文社区吴恩达机器学习学习资料（gith
吴恩达机器学习笔记（2） python小白22
一.逻辑回归1.什么是逻辑回归？逻辑回归是一种预测变量为离散值0或1情况下的分类问题，在逻辑回归中，假设函数。2.模型描述在假设函数中，，为实数，为Sigmoid函数，也叫Logistic函数。模型解释：，即就是对一个输入，的概率估计。损失函数的理解：所谓最大似然估计，就是我们想知道哪套参数组合对应的曲线最可能拟合我们观测到的数据，也就是该套参数拟合出观测数据的概率最大，而损失函数的要求是预测结果
吴恩达机器学习笔记十二 Sigmoid激活函数的替代方案激活函数的选择为什么要使用激活函数爱学习的小仙女！机器学习机器学习人工智能
在需求预测案例中，awareness这个输入可能不是二元(binary)的，或许是一点(alittlebit)、有些(somewhat)或完全(extremely)，此时相比将awareness规定为0、1，不如考虑概率，认为它是一个0-1之间的数。激活函数可以采用ReLU函数(rectifiedlinearunit)三个常用的激活函数使用线性激活函数也可以看作是没有激活函数。激活函数的选择输出层
吴恩达机器学习笔记十神经网络 TensorFlow 人工智能爱学习的小仙女！机器学习神经网络人工智能深度学习
神经网络：说几层的时候是指隐藏层及输出层，不包含输入层。例如下图是一个四层神经网络。前向传播(forwardpropagation)越靠近输出层，该层的神经元数量越少TensorFlow（张量流）实现神经网络的搭建sequential（）把两层顺序连接起来；如果有新的x，用predict()人工智能
吴恩达机器学习笔记-Logistic回归模型 Carey_Wu
回归函数在逻辑回归模型中我们不能再像之前的线性回归一样使用相同的代价函数，否则会使得输出的结果图像呈现波浪状，也就是说不再是个凸函数。代价函数的表达式之前有表示过,这里我们把1/2放到求和里面来。这里的求和部分我们可以表示为：很显然，如果我们把在之前说过的分类问题的假设函数带进去，即，得到的结果可能就是上述所说的不断起伏的状况。如果这里使用梯度下降法，不能保证能得到全局收敛的值，这个函数就是所谓的
吴恩达机器学习笔记（1） python小白22
一.初识机器学习1.监督学习在监督学习中，训练数据既有特征又有标签，通过训练，让机器可以自己找到特征和标签之间的联系，在面对只有特征没有标签的数据时，可以判断出标签。监督学习可以分为回归问题和分类问题。回归问题是利用训练出的模型，预测连续的数值输出；分类问题是预测离散值的输出。2.无监督学习无监督学习是给算法大量的数据，要求它找出数据的类型结构。无监督学习的数据没有标签，或是所有数据都是同一种标签
ML：2-2neural network layer skylar0 机器学习
文章目录1.神经网络层2.更复杂的神经网络3.神经网络的前向传播【吴恩达机器学习笔记p47-49】1.神经网络层【了解神经网络如何完成预测的】input：4个数字的向量。3个神经元分别做logisticregression。下角标：标识第i个神经元的值。上角标：表示第j层layer的值。这3个神经元所做的logisticregression的结果组成了一个向量a将传给ouputlayer。第1层的
吴恩达机器学习笔记（1）——单变量线性回归机智的神棍酱
上一个笔记，我们大概了解了什么是机器学习以及机器学习的两个重要的分类，本篇笔记将带领大家了解机器学习的第一个模型——线性回归例题为了让大家更加直观的理解这个模型，我们引入一个例题，我们有一组波特兰市的城市住房的价格数据，我们要通过这些数据来找出一个函数，来预测任意面积下的房价，这就是一个简单的线性回归问题。这里给出的数据是一组房子面积对应的房价数据集其中m代表训练集，x是输入，y是输出。我们用（x
吴恩达机器学习笔记 AADGSEGA 机器学习
吴恩达机器学习笔记第一周基本概念监督学习分为回归算法和分类算法无监督学习事先没有正确答案。例如将客户群分成不同类，混合的声音区分开先在Octave或者matlab实现，可行，再尝试用Java或者python或者C++重新写出来只考虑两个变量的线性回归：例如找出一条函数拟合房价的那个例子里面的数据点。数据集：输入x[i]，输出y[i]，中间函数是h。使用成本函数（即方差误差，这里假设是只有房屋大小这
吴恩达机器学习笔记六本木砍王刀哥机器学习笔记人工智能
一、机器学习1.1机器学习定义1.2监督学习supervisedlearning1.2.1监督学习定义给算法一个数据集，其中包含了正确答案，算法的目的是给出更多的正确答案如预测房价（回归问题）、肿瘤良性恶性分类（分类问题）假如说你想预测房价。前阵子，一个学生从波特兰俄勒冈州的研究所收集了一些房价的数据。你把这些数据画出来，看起来是这个样子:横轴表示房子的面积，单位是平方英尺，纵轴表示房价，单位是千
吴恩达机器学习笔记26-样本和直观理解1（Examples and Intuitions I） weixin_34221773 人工智能数据结构与算法
从本质上讲，神经网络能够通过学习得出其自身的一系列特征。在普通的逻辑回归中，我们被限制为使用数据中的原始特征?1,?2,...,??，我们虽然可以使用一些二项式项来组合这些特征，但是我们仍然受到这些原始特征的限制。在神经网络中，原始特征只是输入层，在我们上面三层的神经网络例子中，第三层也就是输出层做出的预测利用的是第二层的特征，而非输入层中的原始特征，我们可以认为第二层中的特征是神经网络通过学习后
吴恩达机器学习笔记--第三周-4.解决过拟合问题 Loki97 吴恩达machine learning学习笔记机器学习 machine learning 吴恩达过拟合正则化
week3-4.SolvingtheProblemofOverfitting一、TheProblemofOverfittingunderfitting=highbias；overfitting=highvariance。避免过拟合的方法：二、CostFunction在代价函数J中对每个参数theta加入正则化项（罚函数），从而使所有的参数变小。但是不对theta0增加正则化项。若正则化项中的系数l
吴恩达机器学习笔记孙虾米
WhatisMachineLearning?TwodefinitionsofMachineLearningareoffered.ArthurSamueldescribeditas:"thefieldofstudythatgivescomputerstheabilitytolearnwithoutbeingexplicitlyprogrammed."Thisisanolder,informaldef
吴恩达机器学习笔记（五）正则化Regularization 哇哈哈哈哈呀哇哈哈哈机器学习机器学习人工智能逻辑回归
正则化（regularization）过拟合问题（overfitting)Underfitting（欠拟合）–>highbias(高偏差)Overfitting（过拟合）–>highvariance(高方差)Overfitting:Ifwehavetoomanyfeatures,thelearnedhypothesismayfitthetrainingsetverywell,butfailtoge
吴恩达机器学习笔记---正则化 ML0209 机器学习机器学习
前言使用正则化技术缓解过拟合现象，使模型更具泛化性1.过拟合问题(Overfit)2.代价函数(CostFunction)3.线性回归的正则化(RegularizedLinearRegression)4.逻辑回归的正则化(RegularizedLogisticRegression)正则化(Regularization)(一)过拟合问题(Overfit) 先看两张图：两张图分别代表回归问题和分
吴恩达机器学习笔记（三） yh_y
前言我跳过了Octave部分的学习，转而利用这部分时间去研究python如何实现这系列课程的小作业，当作是熟悉一边python的一些常用库及一些好用的工具。关于这系列的python代码参考下面这个大佬的代码：吴恩达机器学习与深度学习作业目录-Cowry-CSDN博客接下来开始第三周的学习，线性回归算法结束，进入下一个算法。视频课简记6、逻辑回归6.1分类问题分类问题在第一周一开始举得例子也曾接触过
吴恩达机器学习笔记（二）五大人
模型描述：根据房间的大小（平方数）预测其能售卖出的价格1、监督学习（每个例子都有一个正确的输出值）1.1、回归问题，可以预测一个准确的数值输出1.2、分类问题，可以预测离散值输出（只有0和1的离散值输出）2、训练集（trainingset）：在监督学习中提供“参考”的数据集合三个要素：训练集的数量，输入变量，输出变量训练样本（trainingexample）：（x^(i),y^(i)）第i个训练样
吴恩达机器学习笔记（自用） cosθ 机器学习人工智能 python
吴恩达机器学习机器学习的定义什么是机器学习？机器学习算法1.监督学习（SupervisedLearning）2.无监督学习（UnsupervisedLearning）单变量线性回归模型描述（ModelRepresentation）代价函数梯度下降线性回归中的梯度下降凸函数（convexfunction）多变量线性回归多元梯度下降法特征缩放（FeatureScaling）学习率（Learningra
吴恩达机器学习笔记（3）魏清宇
多变量线性回归：问题：根据多个属性，如房子面积，房子楼层，房子年龄等估计房子的价格多变量线性回归中的变量多变量线性回归的假设此时有多个特征,i对应不同的特征值，如房子面积，楼层，年龄等，参数为一个n+1维向量多变量线性回归中的梯度下降，对每一个参数求偏导数从而得到不同参数的梯度参数特征缩放——加速梯度下降过程收敛到最优值多变量梯度下降时，参数的取值要尽量小在多多变量梯度下降中，要让不同参数的取值范
吴恩达机器学习笔记（5）—— 神经网络机智的神棍酱
又摸鱼摸了好久，终于开学了，不能再摸鱼了，这学期课都是嵌入式开发方面的，我给自己的电脑买了个新硬盘装了Linux，不再像以前在虚拟机里小打小闹了，折腾了好几天的新系统，现在有时间写新的笔记了。这次给大家带来的是神经网络，比较难，我可能写的也不是太明白，就看看吧。非线性假设其实神经网络是一个很古老的算法，不过在很长的一段时间内受计算机的机能所限，这个算法没有太大的进展。直到了现在，计算机的飞速发展，
吴恩达机器学习笔记（一） yh_y
概念机器学习是研究计算机模仿人类学习的过程，利用新的数据改善自身的性能，是人工智能的核心。机器学习、人工智能、深度学习之间的关系：AI、ML、DL的包含关系人工智能=机器人；机器学习是实现人工智能的一种方法；深度学习是实现机器学习的一种技术。概念包含关系上：人工智能>机器学习>深度学习。视频课简记:1、引言1.1欢迎1、机器学习很常见，如谷歌搜索（搜出的网站排序算法）、邮箱的垃圾站（无监督）。2、
正则化(吴恩达机器学习笔记) 是忘生啊机器学习机器学习逻辑回归人工智能
文章目录1.过拟合问题2.代价函数3.正则化线性回归1.梯度下降法2.正规方程4.正则化逻辑回归1.过拟合问题如图所示：第一个模型是线性的，属于欠拟合，不能很好的适应数据集，而第3个则是一个高次方的模型，过于拟合原始数据，从而不能很好的预测数据，属于欠拟合。也不难看出，当x的次数越高，训练出来的模型就会对数据集拟合的越好，但是其预测效果就会变差。解决方案：①减少特征的数量，丢弃掉一些非必要的特征。
机器学习正则化ppt_吴恩达机器学习笔记（三） —— Regularization正则化希望阳光下机器学习正则化ppt
主要内容：一.欠拟合和过拟合(over-fitting)二.解决过拟合的两种方法三.正则化线性回归四.正则化logistic回归五.正则化的原理一.欠拟合和过拟合(over-fitting)1.所谓欠拟合，就是曲线没能很好地拟合数据集，一般是由于所选的模型不适合或者说特征不够多所引起的。2.所谓过拟合，就是曲线非常好地拟合了数据集(甚至达到完全拟合地态度)，这貌似是一件很好的事情，但是，曲线千方百
【吴恩达机器学习笔记详解】第六章逻辑回归爱冒险的梦啊机器学习教程机器学习逻辑回归人工智能
第五章主要讲的是编程语言的介绍，因为我们现在用python的比较多，所以就没有再看那一章。但是5.6值得看一下5.6矢量现在的变成语言包含了各种各样的矩阵库，所以通常进行矩阵计算的时候我们直接用命令即可，如果使用了合适的向量化方法，代码会简单很多。下面进行一些例子的讲解。这是线性回归的假设函数，他是从0到j的一个求和，我们也可以把他看作是矩阵的相乘，θ的转置×x，可以写成计算两个向量的内积。前面的
吴恩达机器学习笔记：逻辑回归分类、神经网络流动的时间里找你的旋律神经网络机器学习深度学习
机器学习笔记：逻辑回归分类、神经网络逻辑回归LogisticRegression(不是很懂)正则化Regularization神经网络NeuralNetworks(也不太懂)建议评估假设算法模型选择和交叉验证集诊断偏差和方差正则化和偏差/方差学习曲线决定下一步做什么机器学习系统的设计(MachineLearningSystemDesign)类偏斜的误差度量（不太懂）机器学习的数据(不太懂)机器学习
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他