鹏鹏哥哥的小红帽

线性回归和梯度下降的基本的认识

我们的第一个学习算法将是线性回归，

英文术语是linear regression。

我们将看到模型是什么样子，而更重要的是我们将看到监督学习整体逻辑是什么样子。

现在我们来定义一些机器学习中常用的符号。

我们使用小写字母m来表示训练样本的样本总数。

我们使用小写字母x来表示输入变量，不过通常我们称之为特征。

最后，我们使用小写字母y来表示输出变量或者叫做目标变量。

使用这三个符号标记，我们可以使用(x,y)来表示一个训练样本。

在我们右侧这个表格中，每一行代表的就是一个训练样本，而如果我们具体指某一个样本时，我们可以使用(x(i), y(i))来表示。这里的上标i，表示的是第i个样本。请注意，在数学中，上标常常用于表示幂运算，即x的i次方，所以这里我们特意使用了括号，特指我们这个是第i个样本，而不是要进行什么幂运算。

我们来看看整个监督学习的基本结构。

首先我们得有一个训练集，比如我们的夫子庙房价的训练集。然后我们将训练集提供给我们的学习算法。

而我们的学习算法的职责就是输出一个确定的函数，这里称之为"假设"，但它实际上是一个函数，可以使用英文小写字母h表示，它是英文假设hypothesis的首字母。而这个最终的假设，实际上就是一个函数，它的作用在于，接受输入变量，比如输入房子的面积，然后输出房价的预测值。

所以，所谓假设h，实际上就是将输入变量x映射到输出变量y的一个函数。

假设这个词的含义可能有些让人觉得不是那么自然。这种不自然并非错觉，这个名字确实不是在这个场合中最贴切的名字，这实际上是历史原因，因为输入变量到输出变量的映射，是线性的？还是二次的？甚至是其他多项式的？这个是不确定的，也就是说这个映射本身的形式实际上是不知道的，那么我们使用线性函数实际上就是在做一种假设，亦即我们假设输入变量到输出变量的映射是线性的。

这是一种解释，而且在现在的机器学习中，假设一词已经算是标准的称呼了。我希望这能够缓解大家对于假设一词的不自然感受。不过至于究竟为什么大家这么称呼，其实并不重要。

重要的是，我们如何表示假设呢？或者说如何表示这个映射呢？比如，我们的这个房价预测的例子，我们认为它应该是一条直线，更标准的说法是线性。

那么我们为什么选择这么个线性模型呢？实际上在现实工作中，我们可能会选择更加复杂的函数，比如非线性函数。但是我们的这个例子是个非常简单的例子，而且仅有一个输入变量，因此我们以简单的例子作为入门还是非常合适的。当然，我们后面的课程会使用更加复杂的模型，也会介绍更加复杂的学习算法。

对于我们目前这个简单的模型，我们称之为线性回归，而进一步，对于我们这种仅仅有一个输入变量的情况，我们称之为一元线性回归，或者单变量线性回归。

Cost Function损失函数

代价函数(英文术语是cost function)的东西。它将帮助我们找到最能拟合我们数据的直线。

在线性回归中，我们有一个训练集，比如一直在说的夫子庙房价的数据集。我们简单回顾下，小写字母m表示训练集中的样本量，我们这里是20.

而我们选择的假设，也就是函数形式是线性的，就是我们这里的这个式子。

我们式子中的θ0和θ1被称为模型的参数，因为它们一定被确定了，那么整个模型也就确定了，那么也就可以用来对新的样本进行预测了。

那么，我们现在要讨论的是，如何选择合适的参数值，也就是θ0和θ1的值。

使用不同的θ0和θ1，我们会得到不同的假设或者函数。

在线性回归中，我们有一个训练集，比如我们在左侧中绘制的这个散点图。

我们想要做的是，找到适当的的θ0和θ1，使得我们的直线能够很好地拟合我们的数据。

那么问题在于，我们如何才能找到这条线呢？更具体地说，我们如何才能找到这条线对应的θ0和θ1呢？

解决这个问题的思路非常直观，我们选择的θ0和θ1，从而定义的直线，对于样本集中的x而言，其得出的y值应当尽量地接近训练集中该x对应的真实y值。不过考虑到，我们的训练集中并非只有一个样本，因此在我们需要考虑所有的样本，比如我们希望通过θ0和θ1确定的直线对于训练集中的所有x产生的y值，和它们真实的y值总体相差最小。

我相信这个想法是直观的，也是符合直觉的。不过如果我们希望计算机能够理解，我们必须将这个想法正式化一些。

我们来看它的正式化表达式。这一堆看上去很多，很复杂，但实际上它仅仅是表达了我们解决线性回归问题的想法而已。

所以整个式子想要表达的含义就是：

找到θ0和θ1的值，使得预测值和真实值之间的平均差异最小。

这个式子确实有点庞大，我们可以稍微简练一些地这么写，即我们定义J(theta0, theta1)，表示整体的损失，它更加学术范的名称叫做均方误差。然后我们的目标是找到使得J最小化的theta0和theta1.

再顺便说一下，我们这里使用了均方误差来作为我们衡量预测值和真实值之间差异的指标，但它并非唯一的，这一点请大家不要有任何想当然。事实上，我们可以定义任何一种能够衡量预测值和真实值之间差异的指标作为损失函数，而均方误差是最简单的一种，而且对于大多数回归场景而言都能表现出不错的性能。不过后面我们还会介绍其他类型的损失函数。

好，现在我们已经正式化了回归问题的代价函数了。但可能大家对它还没有特别直观的认识，我们接下来讨论下它到底是在计算什么东西，以及为什么我们想要使用它，

前面我们给出了代价函数的数学定义。

接下来我们将细致且直观地研究下代价函数到底是在干什么，而且我们为什么要使用它。

我们想要使用一条直线来拟合我们的数据，所以我们有这样的假设，也就是函数形式，它有两个参数，分别是θ0和θ1。不同的θ0和θ1取值会使得我们得到不同的直线。

那么不同的直线对数据的拟合效果我们使用这个代价函数来表示，而它也是我们的优化目标，就是想让它最小化。

为了能够更好地可视化表达代价函数J，我们把我们的假设进一步简化，就像下面这个式子。在这个式子中，我们忽略掉θ0，实际上就是将θ0设置成0。然后我们的假设函数就是简单的θ1乘以x。

所以，现在我们仅有一个参数θ1，而我们的代价函数和之前差别不大，仅仅是hx现在等于θ1乘以x罢了。也正因此，我们的优化目标就是找到可以最小化j的theta1.

在图形上，我们简化了的假设即theta0等于0，其实就是穿过原点的一条直线。通过这个简化了的假设以及它所对应的代价函数，让我们来看看这些式子实际上都在干什么。

我们这里其实想要理解的是两个关键的函数：

第一个就是假设函数，而第二个则是代价函数。

所以大家请注意，在左侧，是我们的假设hx。对于一个固定的θ1，它是关于x的函数。所以假设是关于房子大小x的一个函数。

相对的，代价函数J，它是关于参数theta1的函数，而这个theta1其实是假设函数hx的斜率。

我们下面来看看不同的theta1对二者都会有怎样的影响。

我们先来看假设函数。在左侧，假如我们的训练集只有三个点，分别是(1,1), (2,2)和(3,3)。我们如果选择theta1等于1，那么我们的直线就像这里画的一样，完美地经过每一个点。我们这里强调一下，我们画的这条线的含义是房子大小和房价之间的关系。那么在有了这条直线后，我们想要做的其实是，这条直线对应的代价J是多少？

所以，我们来计算一下当theta1等于1的时候，J的取值是什么。我们的代价函数的定义是：

所以当theta1等于1的时候，J(theta1) = J(1) = 0。对应回假设函数，这也符合我们的认识，因为直线完美地穿过了所有三个样本点(1,1) (2,2) (3,3)，所以拟合值和真实值完全相等，这样的拟合不存在损失，所以J(1) = 0。

这里再次强调一下，右侧的这个图是代价函数J，它是关于参数theta1的函数，因此它的横轴是theta1，纵轴是J。左右两侧表达的东西在概念上是完全不同的两个东西，千万不能搞混。

我们theta1取1，是随机选择的，运气不错使得我们的代价函数是0。不过theta1的值域当然不仅仅是1。

那么假如我们运气不是那么好，theta1取值是0.5呢？

如果我们的theta1取值是0.5，那么假设函数的直线的斜率就是0.5，那么它在图形上会经过(2,1)点。那这时，这条直线对应的拟合代价函数值又是多少呢？

我们可以不断地变更theta1的取值，我们就可以得到不同theta1对应的拟合直线，并且也可以得到其对应的拟合代价函数J的值。比如，如果我们取theta1等于-0.5，那么相应的J的值大约是5.25。我们持续不断地这么做，我们就能够大概画出J的图形。

现在，请大家回想一下J是什么。J是代价函数，它表征的是假设函数对训练集样本数据拟合的均方误差，也就是说它的值越小越好。所以J是我们最小化的目标。而能影响J的仅有参数theta而已，在这里theta只有一个，那就是theta1。

对于我们这个简单的例子而言，我们在theta1=1的时候，J最小，等于0，也就是theta1=1产生的假设函数能够最好地拟合我们的数据。所以，通过这个例子，我们看到通过调整theta最小化J，是能够找到最优的拟合函数的。

这就是假设函数和代价函数之间的关系了。

我们前面理解了下简化的代价函数的意义是什么。在接下来，我们来理解下原来的那个代价函数。

我们简单地来回顾下我们的假设，

这次我们不再将theta0设置成0了，我们现在将同时可视化theta0和theta1. 和理解简化版时一样，我们希望理解假设函数H和代价函数J。

左侧仍然是我们房价的训练集。我们这里的直线对应的方程是如图所示，也就是theta0等于50，theta1等于0.06。

现在，我们想计算这种设置条件下的代价函数，像之前一样，我们在右侧来画画看。在平面上，我们的横轴是theta1，纵轴是代价函数J，我们没办法表示theta0了！因为我们有三个变量：theta0，theta1和J，然而二维平面只有两个轴，没办法同时表示三个变量。所以这种时候就不得不在三维空间中绘制它们了。

现在，我们有两个参数了，这使得我们的代价函数在三维图形上类似一个碗型。根据不同的训练集，我们会得到不同的碗型，可能是个完美的碗型，也有可能是个狭长的碗。

比如我们现在看到的这个三维图形，

所以，底部平面的任何一个点表示了一个theta0和theta1，而我们的这个三维图形在该点上的垂直高度即代表了相应的代价函数值J。

不过虽然这样的三维图形看上去很好，但，我们可以借助康托图，也就是等高线图来描述。

我们现在来看看具体的例子。左边是我们的训练集以及随便画的一条拟合直线，右侧则是代价函数J的等高线图。

我们注意到，这幅图的两个轴分别是我们的两个参数：theta0和theta1. 然后这里有一些椭圆形的线条。这里的每一个椭圆形的线条表示的是，它们的J值都是相等的[随便找一个椭圆线，画三个点，解释不通的theta对应的J都相等]。

这些曲线实际上是前一张ppt中的碗型三维图形的投影，在看到这张等高线图的时候我们可以想象一个三维的碗型图形，它稍微有些窄，越往里J值越小。而最小点就是这个点。

这就是等高线图，这种图相较于三维立体图更加易于可视化我们的代价函数J。

我希望大家已经对代价函数J有了比较好的理解，他们是如何与不同的假设函数联系在一起的，拟合越好的假设函数对应在等高线上的J值点离最小值点也就越近。

当然，这些只是让我们直观上理解了代价函数与假设函数之间的关系，或者说是代价函数与模型参数之间的关系。而我们的学习算法所需要做的，实际上就是找到能够使我们代价函数J取值最小的那些参数。

虽然，直接绘图似乎能够直接找到最优的参数，但对于复杂问题，特别是参数更多的情况，我们实际上是无法绘图的，而且即使是仅含有两个参数的情况，我们在绘图之后仍然需要人工读取对应的参数值。而这显然不是我们想要做的。我们想要做的是：通过迭代能够不断地修正参数的值，使得J的取值不断向最小值渐进。最后在最小值点或者离最小值点不远的点停下来，并直接告知我们参数的取值。

梯度下降

Parameter learning

Gradient Descent

我们在前面已经定义了代价函数J。现在我们开始介绍一个被称为梯度下降，用于最小化代价函数的算法。

实际上，梯度下降是一种通用的算法，而且并不仅仅用于线性回归。它在整个机器学习中都被广泛地使用。

在后面的课程中，我们还会使用梯度下降来最小化其他类型的函数，而不是仅仅是线性回归的代价函数J。

我们首先介绍对于任意函数，梯度下降的含义是什么，然后我们针对一直讨论的线性回归问题应用梯度下降。

首先，这里是我们问题。

我们这里假设有某个函数J(theta0, theta1)，它可能是某个线性回归问题的代价函数，也有可能是其他什么我们想要最小化的函数。

那么我们的目标是希望有一个算法能够求得最小化J(theta0,theta1)的参数theta0和theta1.

这里我们说一下，梯度下降可以被用于更加广泛地函数。所以我们可以想象，我们可以有一个以theta0，theta1，theta2一直到theta n为参数的函数，然后我们希望最小化这个函数。而梯度下降算法也可以被用于求解它。所以，梯度下降实际上可以被认为是用于求解函数最小值的一种通用算法。

为了便于理解，我们这里假设我们的函数仅仅有两个参数。

那么所谓的梯度下降的逻辑是什么呢？简单来说它只有两条：

1. 初始时，猜一下theta0和theta1的取值，其实就是随机生成一个theta0和theta1.

2. 接着，要做的是，不断地小幅改变theta0和theta1的值，试着降低J(theta0, theta1)，直到收敛到最小值点，或者是一个局部最小值点。

梯度下降的基本思路，我们可以以图的形式更加直观地看看梯度下降到底在干什么。

比如我们想要最小化的是这么一个函数。注意下坐标轴，这是theta0，这是theta1，它们在水平平面上，垂直的坐标轴是我们想要最小化的函数J。这里的彩色曲面就是函数J在不同的theta0和theta1时的值，即曲面里水平面的距离就是J的取值。

现在，我们暂时抛开函数。可以试着想象一下，这是一片户外休闲的山林。这里大约有两座小山，这里似乎是一小片、一小片的平原，然后还有几处洼地。

那么我们想要做的是下山。实际上，在梯度下降算法中，我们做的就是环顾四周，试着找到能够最快下山的方向，然后小步地移动一下，然后再次环顾找到最快下山的方向。这里我们需要注意，在下山的时候我们实际上并不知道整个环境的情况，我们只能看到周围非常有限的一块很小的区域，你可以认为整片区域实际上被雾气所笼罩。

所以，我们并不知道有两座山，有几处洼地，否则的话我们直接朝着洼地方向走就好了。

所以，因为浓雾，我们对整个地形都没有什么认识，我们只能看到周围比如一米的环境。在这种时候，我们如何才能最快地下山呢？

用俗话说就是：走一步看一步。只是我们怎么看呢？我们肯定是看当前所处一米附近，哪个方向下山最快，对不对？即，在一米范围内哪个方向下山最快，我们就沿着哪个方向走一步。我们走完这一步以后就能看见新的一米范围的情况了，然后再看看四周哪个方向下山最快，然后再走一步。

这个策略实际上就是所谓的贪心，在当前状态下尽可能地朝着目标前进。这个过程也就是梯度下降算法的最核心思想。

梯度下降有一个很有趣的性质。

这是我们第一次运行梯度下降的起始点。现在呢，我们假如在另一个地方，以这一点作为起始点，那么我们重复之前的贪心策略，走一步看一步地尽力最快速地下山。这次我们不再到达上一次的洼地，而是到了一个新的洼地，或者说是另一个局部最小点。

所以，如果我们从第一次的点出发，我们最终会到达这个局部最小点，但是如果我们稍微从一个不同位置出发，我们又会到达一个完全不同的局部最小点。这其实就是梯度下降的一个性质，我们后面会再提到。

这就是梯度下降的直观解释了，我希望这种图形的方式能够帮你很好地理解什么是梯度下降，以及它的核心思想。

让我们来看看梯度下降对应的数学知识，毕竟直观理解并不能让计算机理解，想让计算机理解，我们需要更加形式化地描述这个过程。

其实梯度下降算法非常简单，我们仅仅需要不断地重复一种操作，直到收敛即可。这个简单的操作就是不断以这个式子更新theta j即可。这个式子实际上有不少细节，我们一点点来看。

首先，这个符号":="，指的是赋值操作。所以简单地说，a := b，它的含义就是使用b的值来覆盖a原有的值。这个操作完成以后，a的值就是b的值，就是所谓的赋值了。如果我们省略了:号，那么它在计算机领域内的含义就是判断二者是否相同了。所以，这就是赋值。

接下来的这个alpha，它其实是一个数字，被称为学习率。alpha干的事情基本上就是控制下我们下山时的每一步的步长。因此，如果alpha非常大，那么它会使得我们梯度下降过程变得非常激进，因为每一步都会走的比较大。而如果alpha比较小，那么会导致较为保守的步长，使得我们梯度下降的速度较慢。我们后面还会回来讨论下alpha，以及如何设置alpha。

最后，我们再来看看这一项，这是一个微分项。暂时我们不讨论它，后面我会导出这个微分项，并且告诉大家它到底是什么。

对于梯度下降我们再额外需要说的就是我们要更新的是什么。当然是theta0和theta1了，对不对。所以这个式子里面的j的取值就是0和1了。所以，我们要更新两个值，theta0和theta1。在更新的时候，正确的方式是同步地更新二者。同步的含义在于，我们使用theta0减去某些东西来更新theta0，一并使用theta1减去某些东西来更新theta1.看看左下角的实现可以更加明确地表达什么是同步更新。

这里注意到，我们更新了theta0以后，在更新theta1的时候，J(theta0，theta1)并没有改变，所以当我们更新theta1的时候并不受theta0更新的影响。当我们明确了theta0和theta1会变更成什么数值以后，我们再实际地更新theta0和theta1.

注意，当我们先更新theta0以后，对于theta1的更新而言，J已经变了，它的theta0已经发生了变更，这就不再是同步更新了。实际上这种非同步更新，并不是对于下山的时候找到最佳方向的正确实现。所以，一般我们说梯度下降，我们潜在地都在说同步更新。

如果非要使用非同步更新，可能算法也能走运地工作起来，但它是缺乏坚实的理论支持的。甚至，这种非同步更新的算法都不是梯度下降。所以，仅仅是这一点点小的区别也会使得我们的代码做的事情完全不同。

好，这就是整个梯度下降算法的轮廓了。除了微分项以外，我希望大家对整个梯度下降有了至少概括性地了解。而微分项，实际上可以被理解为下山的方向。

梯度下降应用

Gradient Descent Intuition

前面我们讨论了梯度下降的数学定义。现在让我们深入地来看看这个算法到底在干什么，以及梯度下降的策略为什么是合理的。

微分项

我们前面对这个微分项没有做足够的解释，所以大家现在可能对它还有点陌生。不过我们现在要做的就是解释他。

为了更加方便直观地解释他们，我们使用一个稍微简单一点点的例子，那就是我们最小化一个只有一个参数的函数。

所以，比方说，我们有一个代价函数J，它仅有一个参数，theta1，就像我们之前讨论代价函数时简化的一样。这样，我们就可以非常容易地在二维平面上绘图来直观地理解梯度。

比如这是我们的函数，J(theta1)。横轴是我们的theta1.纵轴是我们的代价函数J。

但是微分在这一点上的含义其实是，其切线的斜率，其实就是取他的tan值。在高中数学知识中，我们称它为求导。

所以，微分其实就是该点的切线的斜率。斜率的计算非常简单，就是这个高度除以这个水平长度。现在我们看，这条直线的斜率是一个正数，所以在该点上的微分是一个正数。因此，我们这里更新theta1，也就是theta1原来的值减去alpha乘以一个正数。我们的学习率alpha一直都是正数，所以总体而言，我们的更新就是theta1减去某个正数，即theta1会变小，在图上也就是它会向左移动。这么做是正确的，因为我们就是希望theta1向这个方向移动，这样会使得我们的J变小，向最小值点靠近。

因此，这么看，我们的梯度下降算法干的不错，确实能帮我们通过修改theta1来降低代价函数J，不断地向着J的最小值推进。

那么我们再来看看另一种情况。

这一次，我们假如theta1取值在J的最小值点的左侧。微分项的定义没有变，仍然是这一点的切线的斜率。不过跟前一次不同的是，这次它的斜率是一个负值了。也就是说，在该点，微分项是一个负值。因此，梯度下降算法在更新theta1的时候，是theta1减去alpha乘以一个负值。这意味着我们会增大theta1. 因为负负得正，更新的时候实际上是给原来的theta1增加了一些。所以，theta1会向着右侧推进。也就是越来越接近我们的最小值点。这当然就是我们希望的。

所以不管参数theta1是在最小值点的哪一侧，梯度下降算法都能够向着最小值点靠近。

以上就是我们对梯度下降算法中的微分项的直观解释。

学习率alpha。

如果alpha很小，我们的算法更新会使得我们的更新项很小，也就是更新步长很小。这会导致我们每次只更新一点点。原本只需要一步的更新，现在因为alpha很小，可能需要好几步才能走完。所以，整个梯度下降就会需要非常多次更新才能到达最小值点，所以从程序运行来看，它需要非常多的时间来迭代，会非常耗时。

那么，如果alpha太大呢？alpha太大导致的情况比alpha太小更加严重，它可能会错过最小值点，无法收敛，甚至使得J的值发散，变得越来越大。

假如，它其实离最小值点已经很近了，它的梯度让我们的更新方向向右，但是如果我们的学习率alpha太大，这导致我们的步长非常大，可能就直接越过了我们的最小值点，然后在新的这一点，我们的梯度比之前大一些，这样，alpha乘以这里的梯度，得到的步长就更大，这样就再一次跨越了最小值点，而且比原先那个点离最小值点更远了，这个过程会不断地重复，使得我们离最小值点越来越远，代价函数J的值越来越大。

我们现在来看一个有点意思的问题。假设我们运气很好，初始化的时候theta1直接就是一个局部最小点了，那么这时候梯度下降会怎么做呢？

比如我们初始化在了这个点，而这个点恰好就是一个局部最小点。

其实，在局部最小点，我们的微分项就是0，因为它的切线实际上是跟水平轴平行的，它的斜率是0。所以更新步长就是0，那么theta1就不会更新。这意味着，如果theta1已经在局部最小点了，那么它就不会被更新。所以，如果我们的参数已经使得代价函数J的值最小了，那么梯度下降就不会更新这些参数，会将我们的参数一直留在局部最小点。

这也解释了为什么梯度下降可以收敛到局部最小值点。

比如我们右侧有一个代价函数，我们希望最小化他。

比如我们初始化了在这一点，如果我们使用梯度下降往前走一步，也会我们会到这一点。然后我们再迭代一下，会往下再走一点。不过每一步都会比前一步的幅度要小一些。

这是因为随着迭代，我们不断地接近最小值点，切线的斜率是越来越小的，也就是我们的梯度下降中的微分项的值是在不断减小的，因此如果学习率alpha是固定的，那么这里的更新步长其实是越来越小的。

所以，越接近最小值点，我们的步长就越小，慢慢地向最小值点挺近。最终到达最小值点。而当我们达到最小值点以后，梯度就是0了，即切线斜率就是0，所以参数theta1就不再更新了，就停在了最小值点。

到这里，我们对通用梯度下降就介绍完了。

接下来，我们来看看对于显现回归问题的代价函数的最小化，梯度下降算法是怎么工作的。

梯度下降用于线性回归

Gradient Descent For Linear Regression

前面我们讨论了梯度下降算法，我们也讨论了线性回归模型以及均方误差代价函数。

现在我们已经有了足够的知识，可以将它们放在一起，这样我们就有了一个用于线性回归的算法了。

这里是我们之前一直讨论的东西。左侧是梯度下降算法，右侧是线性回归的假设函数h以及它的代价函数J。

我们将采用梯度下降算法来最小化我们的均方误差代价函数。

梯度下降：

线性回归：

为了能够把我们梯度下降算法的这个式子转成代码，我们重点是需要把这里的微分项给算一下。所以我们需要搞明白对于我们这个均方误差代价函数而言，它的微分项是什么，然后将它放到梯度下降算法中。

我们来看看梯度下降在这里是怎么工作的。

我们之前在讨论梯度下降的时候说过这个算法的一个问题在于，初始点的不同会造成最终可能会收敛到不同的局部最小值点。

不过对于线性回归问题的代价函数而言，它的代价函数总是一个碗型的，专业术语叫做凸函数。

这里我不打算深入讨论凸函数这个概念。不过凸函数的一种非正式理解就是它是一个类似这样的碗型，它不会有任何局部最小点，而只会有全局最小点。所以，梯度下降在这种代价函数上，我们最终总会收敛到全局最小点。那么，现在让我们看看它的具体表现把。

像我们之前做的一样，左侧是我们的假设函数hx，它是关于特征x的函数。右侧是代价函数J的等高线图。

在这里，我们看到初始化的时候，这条线的斜率大约是-0.2，y轴的截距是150，它们对应的代价函数J的取值以小红叉的标志显示在这里。它距离全局最小点差距不小，所以这个代价还是很大的，当然我们在左侧的图中也能看出来，这条直线的拟合效果非常差。

这时候，我们的梯度下降算法会要求我们的theta0和theta1沿着梯度最大的方向移动，可能就移动到了这个小红叉所在的点。这时候theta0的取值大约是100，theta1的取值是-0.15，它们对应的拟合直线如左图。

这里我需要提醒一下大家，在梯度下降的时候，我们的算法其实对左图没有任何认知，它一直在右图上工作，一直试图在对theta0和theta1进行修正使得J越来越小，直至到达最小值点。

所以，这里如果非要将两个图联系起来的话，我倾向于说梯度下降在右图上工作，并导致了左图中直线的变化，这个变化是积极的，因为它使得直线对数据的拟合更加好了。虽然当前的这条直线对数据的拟合仍然不够好，但至少比前一条直线要好。

代价函数的值更小了，相对应的直线相较前两条直线也更加能够拟合数据了。但仍然不够。梯度下降算法还会继续迭代。

直到迭代到接近最好到拟合直线。

最后，我们说一下，我们这里使用的梯度下降，它更加确切地名字叫做批量梯度下降(batch gradient descent)。它的函已是，每一次我们梯度下降的更新都需要计算所有样本的梯度。这对于拥有很大训练集的问题而言可能存在性能问题，因为我们的算法是迭代型的，每次迭代需要计算所有的样本。

不过，实际应用中，梯度下降的每一步并非必须要依赖全体训练样本，每走一步只看一小部分样本也是可以的，这种常常被称为小批量梯度下降(mini-batch gradient descent)。

当然，每次也可以只计算一个样本，这样迭代得更快，但也会使得迭代显得更加不稳定。这种被称为随机梯度下降。

我们会在程序练习中看到批量梯度下降和随机梯度下降的区别。

好，以上就是线性回归梯度下降的全部内容了。

如果你以前学习过更高级一点的线性代数的话，那么你可能知道有一些可以直接求解代价函数J最小值的方法，而不需要通过一个类似于梯度下降的迭代算法来解。

在后面的课程中我们也会讨论到这样的方法，这种方法被称为正规方程。但是梯度下降相较于这种方法在更大的数据集上拥有更好的伸缩性。

而且，梯度下降是一种通用的求函数最小值的方案，它在不同的领域中都可以被使用，而且也在不同的机器学习算法中被大量使用。

不管怎样，都恭喜大家掌握了第一个机器学习算法，而且可以确定的是你已经理解了本质。

你可能感兴趣的:(机器学习,梯度下降,线性回归)

LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
使用tensorflow的线性回归的例子（七） lishaoan77 tensorflow tensorflow 线性回归人工智能
L1与L2损失这个脚本展示如何用TensorFlow求解线性回归。在算法的收敛性中，理解损失函数的影响是很重要的。这里我们展示L1和L2损失函数是如何影响线性回归的收敛性的。我们使用iris数据集,但是我们将改变损失函数和学习速率来看收敛性的改变。importmatplotlib.pyplotaspltimportnumpyasnpimporttensorflowastffromsklearnim
使用tensorflow的线性回归的例子（十二） lishaoan77 tensorflow tensorflow 线性回归人工智能戴明回归
DemingRegression这里展示如何用TensorFlow求解线性戴明回归。=+y=Ax+b我们用iris数据集,特别是:y=SepalLength且x=PetalWidth。戴明回归Demingregression也称为totalleastsquares,其中我们最小化从预测线到实际点(x,y)的最短的距离。最小二乘线性回归最小化与预测线的垂直距离，戴明回归最小化与预测线的总的距离，这种
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
智能产品经理的核心能力 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
智能产品经理的核心能力1.背景介绍在当今快节奏的数字时代,产品经理扮演着至关重要的角色,他们负责确保产品满足用户需求,实现商业目标,并保持竞争优势。随着人工智能(AI)和机器学习(ML)技术的不断发展,智能产品经理的概念应运而生。智能产品经理需要将传统的产品管理技能与新兴技术相结合,以创建具有创新性和智能化的产品体验。智能产品不仅需要满足功能需求,还需要提供个性化、智能化和无缝的用户体验。这对产品
使用Python进行机器学习入门指南软考和人工智能学堂 Python开发经验 python 机器学习开发语言
使用Python进行机器学习入门指南机器学习（MachineLearning）是人工智能（ArtificialIntelligence,AI）的一个重要分支，旨在通过算法和统计模型，使计算机系统能够自动从数据中学习和改进。Python作为机器学习领域的主流编程语言，提供了丰富的库和工具来实现各种机器学习任务。本文将介绍如何使用Python进行机器学习，包括基本概念、常用库以及一个实战项目示例。目录
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
堡垒机操作行为异常检测的机器学习算法应用
一、传统检测模式的困境与机器学习的破局价值在数字化转型浪潮中，堡垒机作为运维安全的核心防线，面临着操作行为复杂度激增与检测能力滞后的双重挑战。传统检测手段主要依赖静态规则库与统计模型，存在三大致命缺陷：规则固化与误报泛滥：某金融机构曾因规则库未及时更新，导致运维人员正常批量操作被误判为“暴力破解”，单日误报量超2000次，消耗安全团队60%的精力。动态行为适应性弱：微服务架构下，运维人员访问路径呈
最全自动驾驶数据集（11/4号已更新）数据猎手小k 自动驾驶人工智能机器学习
自动驾驶是一个快速发展的行业，它融合了人工智能、机器学习、传感器技术、高精度地图和先进的计算平台等多种技术。技术方面，自动驾驶汽车依赖于先进的传感器、如激光雷达、摄像头、毫米波雷达等，以及强大的计算平台来处理大量数据，自动驾驶数据集是训练和验证自动驾驶系统的关键资源，它提供了丰富的场景和条件，使算法能够学习和适应复杂的真实世界驾驶环境。一、研究背景自动驾驶技术的发展需要大量的数据来训练和优化算法，
机器学习深度学习驱动在光子学设计中的应用与未来【专题培训会议邀您共探科技前沿】软研科技信息与通信信号处理量子计算人工智能
一、背景介绍在智能科技飞速发展的今天，光子学设计与智能算法的结合正成为科研创新的热点。深度学习、机器学习等算法在光子器件的逆向设计、超构表面材料设计、光学神经网络构建等方面展现出巨大潜力。二、会议亮点由北京软研国际信息技术研究院主办的“智能算法驱动的光子学设计与应用”专题培训会议，将深入探讨以下核心内容：光子器件的逆向设计：利用深度学习优化多参数光子器件设计。超构表面与超材料设计：智能算法在新型光
机器学习与光子学的融合正重塑光学器件设计范式 m0_75133639 光电智能电视二维材料电子半导体人工智能顶刊 nature
Nature/Science最新研究表明，该交叉领域聚焦六大前沿方向：光子器件逆向设计、超构材料智能优化、光子神经网络加速器、非线性光学芯片开发、多任务协同优化及光谱智能预测。系统掌握该领域需构建四维知识体系：1、基础融合——从空间/集成光学系统切入，解析机器学习赋能光学的理论必然性，涵盖光学神经网络构建原理2、逆向设计革命——通过AnsysOptics实战，掌握FDTD算法与粒子群/拓扑优化技术
AI模型训练新范式：基于同态加密的隐私保护方案 AIGC应用创新大全人工智能同态加密区块链 ai
AI模型训练新范式：基于同态加密的隐私保护方案技术解析关键词同态加密（HomomorphicEncryption）、隐私保护机器学习（PPML）、全同态加密（FHE）、安全多方计算（MPC）、加密数据训练摘要本报告系统解析基于同态加密的AI模型训练新范式，覆盖从理论基础到工程实践的全生命周期。首先通过第一性原理推导同态加密的数学本质，对比传统隐私保护技术的局限性；其次构建“加密-训练-解密”全流程
量子机器学习入门：从理论到实践
量子机器学习入门：从理论基石到实践路径元数据框架标题量子机器学习入门：从理论基石到实践路径——连接量子计算与人工智能的未来桥梁关键词量子计算；机器学习；量子算法；量子神经网络；Qiskit；PennyLane；量子变分算法摘要量子机器学习（QuantumMachineLearning,QML）是量子计算与机器学习的交叉领域，通过量子计算的叠加态、纠缠和并行性解决传统机器学习的计算瓶颈（如高维数据处
全球人工智能与机器学习大会PPT a flying bird 论文解读和大咖技术号记录人工智能
大会演讲PPT合集https://ppt.infoq.cn/list/93PPT分享|ppt|人工智能|aicon|infoq|机器学习PPT分享,前段时间的AICon北京站2021全球人工智能与机器学习大会（https://aicon.infoq.cn/2021/beijing），汇集了很多业界大佬，工业界多个方向的从业人员分享了他们在实际业……https://xw.qq.com/cmsid/2
人工智能基础知识PPT课件智慧化智能化数字化方案方案解读馆人工智能入门人工智能学习人工智能课件人工智能PPT
人工智能基础知识定义与概念：人工智能是研究、开发用于模拟、延伸和扩展人类智能行为的综合性科学，其目的是让计算机系统具备执行人类智能任务的能力。涉及计算机科学、数学等多学科，研究对象是让系统具备智能，智能包括认知、适应和自主能力等维度。学派与方法学派：有符号主义、联结主义、行为主义等学派，分别从不同角度研究人工智能。方法：包括基于知识、学习和仿生的方法，如专家系统、机器学习、深度学习等。分类与发展分
数据挖掘：从理论到实践的深度探索代码老y 数据挖掘人工智能
在当今数字化时代，数据已经成为企业决策的重要依据。数据挖掘作为一门从大量数据中提取有价值信息的技术，已经广泛应用于各个领域，如金融、医疗、零售、互联网等。本文将深入探讨数据挖掘的基本概念、主要技术和实际应用案例，帮助读者更好地理解数据挖掘的价值和应用。一、数据挖掘的基本概念（一）数据挖掘的定义数据挖掘（DataMining）是从大量数据中提取有用信息的过程。它结合了统计学、机器学习、数据库技术和人
开发智能化的企业并购风险评估模型
开发智能化的企业并购风险评估模型关键词：企业并购、风险评估、人工智能、机器学习、深度学习、数学建模摘要：本文详细探讨了开发智能化企业并购风险评估模型的背景、核心概念、算法原理、系统架构设计以及项目实战。通过结合机器学习和深度学习技术，提出了一种基于数据驱动的智能化风险评估方法，旨在帮助企业更准确地识别和预测并购过程中的潜在风险，提升决策的科学性和有效性。第1章:企业并购风险评估模型的背景与问题描述
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
机器学习算法：核心原理与前沿发展综述 fmvrj34202 机器学习算法人工智能
机器学习算法作为人工智能的核心驱动力，正在重塑我们解决问题的范式。本文将系统性地探讨机器学习算法的分类体系、数学基础、优化方法以及最新发展趋势，为从业者提供技术参考。一、算法分类体系根据学习范式，机器学习算法可分为三大类：监督学习：基于标注数据的建模方法线性回归：最小化平方误差的闭式解θ=(XᵀX)⁻¹Xᵀy支持向量机：通过核技巧实现非线性分类，优化目标为max(0,1-yᵢ(w·xᵢ+b))决策
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S