qq_1041357701

机器学习基础-2

第2周

文章目录

第2周

@[toc] 四、多变量线性回归(Linear Regression with Multiple Variables)

4.1 多维特征

4.2 多变量梯度下降

4.3 梯度下降法实践1-特征缩放

4.4 梯度下降法实践2-学习率

4.5 特征和多项式回归

4.6 正规方程

4.7 正规方程及不可逆性（可选）

五、Octave教程(Octave Tutorial)

5.1 基本操作

5.2 移动数据

5.3 计算数据

5.4 绘图数据

5.5 控制语句：for，while，if语句

5.6 向量化

5.7 工作和提交的编程练习

四、多变量线性回归(Linear Regression with Multiple Variables)

4.1 多维特征

参考视频: 4 - 1 - Multiple Features (8 min).mkv

目前为止，我们探讨了单变量/特征的回归模型，现在我们对房价模型增加更多的特征，例如房间数楼层等，构成一个含有多个变量的模型，模型中的特征为 $\left( {x_{1}},{x_{2}},...,{x_{n}} \right)$ 。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ahtIt3ub-1665933231700)(…/images/591785837c95bca369021efa14a8bb1c.png)]

增添更多特征后，我们引入一系列新的注释：

$n$ 代表特征的数量

${x^{\left( i \right)}}$ 代表第 $i$ 个训练实例，是特征矩阵中的第 $i$ 行，是一个向量（vector）。

比方说，上图的

${x}^{(2)}\text{=}\begin{bmatrix} 1416\\\ 3\\\ 2\\\ 40 \end{bmatrix}$ ，

${x}_{j}^{\left( i \right)}$ 代表特征矩阵中第 $i$ 行的第 $j$ 个特征，也就是第 $i$ 个训练实例的第 $j$ 个特征。

如上图的 $x_{2}^{\left( 2 \right)}=3,x_{3}^{\left( 2 \right)}=2$ ，

支持多变量的假设 $h$ 表示为： $h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$ ，

这个公式中有 $n + 1$ 个参数和 $n$ 个变量，为了使得公式能够简化一些，引入 $x_{0}=1$ ，则公式转化为： $h_{\theta} \left( x \right)={\theta_{0}}{x_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$

此时模型中的参数是一个 $n + 1$ 维的向量，任何一个训练实例也都是 $n + 1$ 维的向量，特征矩阵 $X$ 的维度是 $m * (n + 1)$ 。因此公式可以简化为： $h_{\theta} \left( x \right)={\theta^{T}}X$ ，其中上标 $T$ 代表矩阵转置。

4.2 多变量梯度下降

参考视频: 4 - 2 - Gradient Descent for Multiple Variables (5 min).mkv

与单变量线性回归类似，在多变量线性回归中，我们也构建一个代价函数，则这个代价函数是所有建模误差的平方和，即： $J\left( {\theta_{0}},{\theta_{1}}...{\theta_{n}} \right)=\frac{1}{2m}\sum\limits_{i=1}^{m}{{{\left( h_{\theta} \left({x}^{\left( i \right)} \right)-{y}^{\left( i \right)} \right)}^{2}}}$ ，

其中： $h_{\theta}\left( x \right)=\theta^{T}X={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$ ，

我们的目标和单变量线性回归问题中一样，是要找出使得代价函数最小的一系列参数。
多变量线性回归的批量梯度下降算法为：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zjMF3XyI-1665933231702)(…/images/41797ceb7293b838a3125ba945624cf6.png)]

即：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SvEB55qH-1665933231707)(…/images/6bdaff07783e37fcbb1f8765ca06b01b.png)]

求导数后得到：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-32diuPjN-1665933231708)(…/images/dd33179ceccbd8b0b59a5ae698847049.png)]

当 $n >= 1$ 时，
${{\theta }_{0}}:={{\theta }_{0}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{({{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}})}x_{0}^{(i)}$

${{\theta }_{1}}:={{\theta }_{1}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{({{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}})}x_{1}^{(i)}$

${{\theta }_{2}}:={{\theta }_{2}}-a\frac{1}{m}\sum\limits_{i=1}^{m}{({{h}_{\theta }}({{x}^{(i)}})-{{y}^{(i)}})}x_{2}^{(i)}$

我们开始随机选择一系列的参数值，计算所有的预测结果后，再给所有的参数一个新的值，如此循环直到收敛。

代码示例：

计算代价函数
$J\left( \theta \right)=\frac{1}{2m}\sum\limits_{i=1}^{m}{{{\left( {h_{\theta}}\left( {x^{(i)}} \right)-{y^{(i)}} \right)}^{2}}}$
其中： ${h_{\theta}}\left( x \right)={\theta^{T}}X={\theta_{0}}{x_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$

Python 代码：

def computeCost(X, y, theta):
    inner = np.power(((X * theta.T) - y), 2)
    return np.sum(inner) / (2 * len(X))

4.3 梯度下降法实践1-特征缩放

参考视频: 4 - 3 - Gradient Descent in Practice I - Feature Scaling (9 min).mkv

在我们面对多维特征问题的时候，我们要保证这些特征都具有相近的尺度，这将帮助梯度下降算法更快地收敛。

以房价问题为例，假设我们使用两个特征，房屋的尺寸和房间的数量，尺寸的值为 0-2000平方英尺，而房间数量的值则是0-5，以两个参数分别为横纵坐标，绘制代价函数的等高线图能，看出图像会显得很扁，梯度下降算法需要非常多次的迭代才能收敛。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BgE4VpsV-1665933231710)(…/images/966e5a9b00687678374b8221fdd33475.jpg)]

解决的方法是尝试将所有特征的尺度都尽量缩放到-1到1之间。如图：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OosL3zra-1665933231712)(…/images/b8167ff0926046e112acf789dba98057.png)]

最简单的方法是令： ${{x}_{n}}=\frac{{{x}_{n}}-{{\mu}_{n}}}{{{s}_{n}}}$ ，其中 ${\mu_{n}}$ 是平均值， ${s_{n}}$ 是标准差。

4.4 梯度下降法实践2-学习率

参考视频: 4 - 4 - Gradient Descent in Practice II - Learning Rate (9 min).mkv

梯度下降算法收敛所需要的迭代次数根据模型的不同而不同，我们不能提前预知，我们可以绘制迭代次数和代价函数的图表来观测算法在何时趋于收敛。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-J5CLOV1n-1665933231713)(…/images/cd4e3df45c34f6a8e2bb7cd3a2849e6c.jpg)]

也有一些自动测试是否收敛的方法，例如将代价函数的变化值与某个阀值（例如0.001）进行比较，但通常看上面这样的图表更好。

梯度下降算法的每次迭代受到学习率的影响，如果学习率 $a$ 过小，则达到收敛所需的迭代次数会非常高；如果学习率 $a$ 过大，每次迭代可能不会减小代价函数，可能会越过局部最小值导致无法收敛。

通常可以考虑尝试些学习率：

$\alpha=0.01，0.03，0.1，0.3，1，3，10$

4.5 特征和多项式回归

参考视频: 4 - 5 - Features and Polynomial Regression (8 min).mkv

如房价预测问题，

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eQo8oJt5-1665933231716)(…/images/8ffaa10ae1138f1873bc65e1e3657bd4.png)]

$h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}\times{frontage}+{\theta_{2}}\times{depth}$

${x_{1}}=frontage$ （临街宽度）， ${x_{2}}=depth$ （纵向深度）， $x = f ro n t a g e * d e pt h = a re a$ （面积），则： ${h_{\theta}}\left( x \right)={\theta_{0}}+{\theta_{1}}x$ 。
线性回归并不适用于所有数据，有时我们需要曲线来适应我们的数据，比如一个二次方模型： $h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}^2}$
或者三次方模型： $h_{\theta}\left( x \right)={\theta_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}^2}+{\theta_{3}}{x_{3}^3}$

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cmTS3WkI-1665933231718)(…/images/3a47e15258012b06b34d4e05fb3af2cf.jpg)]

通常我们需要先观察数据然后再决定准备尝试怎样的模型。另外，我们可以令：

${{x}_{2}}=x_{2}^{2},{{x}_{3}}=x_{3}^{3}$ ，从而将模型转化为线性回归模型。

根据函数图形特性，我们还可以使：

${{{h}}_{\theta}}(x)={{\theta }_{0}}\text{+}{{\theta }_{1}}(size)+{{\theta}_{2}}{{(size)}^{2}}$

或者:

${{{h}}_{\theta}}(x)={{\theta }_{0}}\text{+}{{\theta }_{1}}(size)+{{\theta }_{2}}\sqrt{size}$

注：如果我们采用多项式回归模型，在运行梯度下降算法前，特征缩放非常有必要。

4.6 正规方程

参考视频: 4 - 6 - Normal Equation (16 min).mkv

到目前为止，我们都在使用梯度下降算法，但是对于某些线性回归问题，正规方程方法是更好的解决方案。如：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qLkXAgJ1-1665933231719)(…/images/a47ec797d8a9c331e02ed90bca48a24b.png)]

正规方程是通过求解下面的方程来找出使得代价函数最小的参数的： $\frac{\partial}{\partial{\theta_{j}}}J\left( {\theta_{j}} \right)=0$ 。
假设我们的训练集特征矩阵为 $X$ （包含了 ${{x}_{0}}=1$ ）并且我们的训练集结果为向量 $y$ ，则利用正规方程解出向量 $\theta ={{\left( {X^T}X \right)}^{-1}}{X^{T}}y$ 。
上标T代表矩阵转置，上标-1 代表矩阵的逆。设矩阵 $A={X^{T}}X$ ，则： ${{\left( {X^T}X \right)}^{-1}}={A^{-1}}$
以下表示数据为例：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kzN25pTL-1665933231721)(…/images/261a11d6bce6690121f26ee369b9e9d1.png)]

即：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KBqus5Gx-1665933231723)(…/images/c8eedc42ed9feb21fac64e4de8d39a06.png)]

运用正规方程方法求解参数：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ei7shRdf-1665933231724)(…/images/b62d24a1f709496a6d7c65f87464e911.jpg)]

在 Octave 中，正规方程写作：

pinv(X'*X)*X'*y

注：对于那些不可逆的矩阵（通常是因为特征之间不独立，如同时包含英尺为单位的尺寸和米为单位的尺寸两个特征，也有可能是特征数量大于训练集的数量），正规方程方法是不能用的。

梯度下降与正规方程的比较：

梯度下降	正规方程
需要选择学习率 $\alpha$	不需要
需要多次迭代	一次运算得出
当特征数量 $n$ 大时也能较好适用	需要计算 ${{\left( {{X}^{T}}X \right)}^{-1}}$ 如果特征数量n较大则运算代价大，因为矩阵逆的计算时间复杂度为 $O\left( {{n}^{3}} \right)$ ，通常来说当 $n$ 小于10000 时还是可以接受的
适用于各种类型的模型	只适用于线性模型，不适合逻辑回归模型等其他模型

总结一下，只要特征变量的数目并不大，标准方程是一个很好的计算参数$\theta $的替代方法。具体地说，只要特征变量数量小于一万，我通常使用标准方程法，而不使用梯度下降法。

随着我们要讲的学习算法越来越复杂，例如，当我们讲到分类算法，像逻辑回归算法，我们会看到，实际上对于那些算法，并不能使用标准方程法。对于那些更复杂的学习算法，我们将不得不仍然使用梯度下降法。因此，梯度下降法是一个非常有用的算法，可以用在有大量特征变量的线性回归问题。或者我们以后在课程中，会讲到的一些其他的算法，因为标准方程法不适合或者不能用在它们上。但对于这个特定的线性回归模型，标准方程法是一个比梯度下降法更快的替代算法。所以，根据具体的问题，以及你的特征变量的数量，这两种算法都是值得学习的。

正规方程的python实现：

import numpy as np
    
 def normalEqn(X, y):
    
   theta = np.linalg.inv(X.T@X)@X.T@y #X.T@X等价于X.T.dot(X)
    
   return theta

4.7 正规方程及不可逆性（可选）

参考视频: 4 - 7 - Normal Equation Noninvertibility (Optional) (6 min).mkv

在这段视频中谈谈正规方程 ( normal equation )，以及它们的不可逆性。
由于这是一种较为深入的概念，并且总有人问我有关这方面的问题，因此，我想在这里来讨论它，由于概念较为深入，所以对这段可选材料大家放轻松吧，也许你可能会深入地探索下去，并且会觉得理解以后会非常有用。但即使你没有理解正规方程和线性回归的关系，也没有关系。

我们要讲的问题如下： $\theta ={{\left( {X^{T}}X \right)}^{-1}}{X^{T}}y$

备注：本节最后我把推导过程写下。

有些同学曾经问过我，当计算 $\theta$ =inv(X'X ) X'y ，那对于矩阵 $X^{'} X$ 的结果是不可逆的情况咋办呢?
如果你懂一点线性代数的知识，你或许会知道，有些矩阵可逆，而有些矩阵不可逆。我们称那些不可逆矩阵为奇异或退化矩阵。
问题的重点在于 $X^{'} X$ 的不可逆的问题很少发生，在Octave里，如果你用它来实现 $\theta$ 的计算，你将会得到一个正常的解。在Octave里，有两个函数可以求解矩阵的逆，一个被称为pinv()，另一个是inv()，这两者之间的差异是些许计算过程上的，一个是所谓的伪逆，另一个被称为逆。使用pinv() 函数可以展现数学上的过程，这将计算出 $\theta$ 的值，即便矩阵 $X^{'} X$ 是不可逆的。

在pinv() 和 inv() 之间，又有哪些具体区别呢 ?

其中inv() 引入了先进的数值计算的概念。例如，在预测住房价格时，如果 ${x_{1}}$ 是以英尺为尺寸规格计算的房子， ${x_{2}}$ 是以平方米为尺寸规格计算的房子，同时，你也知道1米等于3.28英尺 ( 四舍五入到两位小数 )，这样，你的这两个特征值将始终满足约束： ${x_{1}}={x_{2}}*{{\left( 3.28 \right)}^{2}}$ 。
实际上，你可以用这样的一个线性方程，来展示那两个相关联的特征值，矩阵 $X^{'} X$ 将是不可逆的。

第二个原因是，在你想用大量的特征值，尝试实践你的学习算法的时候，可能会导致矩阵 $X^{'} X$ 的结果是不可逆的。
具体地说，在 $m$ 小于或等于n的时候，例如，有 $m$ 等于10个的训练样本也有 $n$ 等于100的特征数量。要找到适合的 $(n + 1)$ 维参数矢量 $\theta$ ，这将会变成一个101维的矢量，尝试从10个训练样本中找到满足101个参数的值，这工作可能会让你花上一阵子时间，但这并不总是一个好主意。因为，正如我们所看到你只有10个样本，以适应这100或101个参数，数据还是有些少。

稍后我们将看到，如何使用小数据样本以得到这100或101个参数，通常，我们会使用一种叫做正则化的线性代数方法，通过删除某些特征或者是使用某些技术，来解决当 $m$ 比 $n$ 小的时候的问题。即使你有一个相对较小的训练集，也可使用很多的特征来找到很多合适的参数。
总之当你发现的矩阵 $X^{'} X$ 的结果是奇异矩阵，或者找到的其它矩阵是不可逆的，我会建议你这么做。

首先，看特征值里是否有一些多余的特征，像这些 ${x_{1}}$ 和 ${x_{2}}$ 是线性相关的，互为线性函数。同时，当有一些多余的特征时，可以删除这两个重复特征里的其中一个，无须两个特征同时保留，将解决不可逆性的问题。因此，首先应该通过观察所有特征检查是否有多余的特征，如果有多余的就删除掉，直到他们不再是多余的为止，如果特征数量实在太多，我会删除些用较少的特征来反映尽可能多内容，否则我会考虑使用正规化方法。
如果矩阵 $X^{'} X$ 是不可逆的，（通常来说，不会出现这种情况），如果在Octave里，可以用伪逆函数pinv() 来实现。这种使用不同的线性代数库的方法被称为伪逆。即使 $X^{'} X$ 的结果是不可逆的，但算法执行的流程是正确的。总之，出现不可逆矩阵的情况极少发生，所以在大多数实现线性回归中，出现不可逆的问题不应该过多的关注 ${X^{T}}X$ 是不可逆的。

增加内容：

$\theta ={{\left( {X^{T}}X \right)}^{-1}}{X^{T}}y$ 的推导过程：

$J\left( \theta \right)=\frac{1}{2m}\sum\limits_{i=1}^{m}{{{\left( {h_{\theta}}\left( {x^{(i)}} \right)-{y^{(i)}} \right)}^{2}}}$
其中： ${h_{\theta}}\left( x \right)={\theta^{T}}X={\theta_{0}}{x_{0}}+{\theta_{1}}{x_{1}}+{\theta_{2}}{x_{2}}+...+{\theta_{n}}{x_{n}}$

将向量表达形式转为矩阵表达形式，则有 $J(\theta )=\frac{1}{2}{{\left( X\theta -y\right)}^{2}}$ ，其中 $X$ 为 $m$ 行 $n$ 列的矩阵（ $m$ 为样本个数， $n$ 为特征个数）， $\theta$ 为 $n$ 行1列的矩阵， $y$ 为 $m$ 行1列的矩阵，对 $J(\theta )$ 进行如下变换

$J(\theta )=\frac{1}{2}{{\left( X\theta -y\right)}^{T}}\left( X\theta -y \right)$

$=\frac{1}{2}\left( {{\theta }^{T}}{{X}^{T}}-{{y}^{T}} \right)\left(X\theta -y \right)$

$=\frac{1}{2}\left( {{\theta }^{T}}{{X}^{T}}X\theta -{{\theta}^{T}}{{X}^{T}}y-{{y}^{T}}X\theta -{{y}^{T}}y \right)$

接下来对 $J(\theta )$ 偏导，需要用到以下几个矩阵的求导法则:

$\frac{dAB}{dB}={{A}^{T}}$

$\frac{d{{X}^{T}}AX}{dX}=2AX$

所以有:

$\frac{\partial J\left( \theta \right)}{\partial \theta }=\frac{1}{2}\left(2{{X}^{T}}X\theta -{{X}^{T}}y -{}({{y}^{T}}X )^{T}-0 \right)$

$=\frac{1}{2}\left(2{{X}^{T}}X\theta -{{X}^{T}}y -{{X}^{T}}y -0 \right)$

$={{X}^{T}}X\theta -{{X}^{T}}y$

令 $\frac{\partial J\left( \theta \right)}{\partial \theta }=0$ ,

则有 $\theta ={{\left( {X^{T}}X \right)}^{-1}}{X^{T}}y$

五、Octave教程(Octave Tutorial)

5.1 基本操作

参考视频: 5 - 1 - Basic Operations (14 min).mkv

在这段视频中，我将教你一种编程语言：Octave语言。你能够用它来非常迅速地实现这门课中我们已经学过的，或者将要学的机器学习算法。

过去我一直尝试用不同的编程语言来教授机器学习，包括C++、Java、Python、Numpy和Octave。我发现当使用像Octave这样的高级语言时，学生能够更快更好地学习并掌握这些算法。事实上，在硅谷，我经常看到进行大规模的机器学习项目的人，通常使用的程序语言就是Octave。(编者注：这是当时的情况，现在主要是用Python)

Octave是一种很好的原始语言(prototyping language)，使用Octave你能快速地实现你的算法，剩下的事情，你只需要进行大规模的资源配置，你只用再花时间用C++或Java这些语言把算法重新实现就行了。开发项目的时间是很宝贵的，机器学习的时间也是很宝贵的。所以，如果你能让你的学习算法在Octave上快速的实现，基本的想法实现以后，再用C++或者Java去改写，这样你就能节省出大量的时间。

据我所见，人们使用最多的用于机器学习的原始语言是Octave、MATLAB、Python、NumPy 和R。

Octave很好，因为它是开源的。当然MATLAB也很好，但它不是每个人都买得起的。(貌似国内学生喜欢用收费的matlab，matlab功能要比Octave强大的多，网上有各种D版可以下载)。这次机器学习课的作业也是用matlab的。如果你能够使用matlab，你也可以在这门课里面使用。

如果你会Python、NumPy或者R语言，我也见过有人用 R的，据我所知，这些人不得不中途放弃了，因为这些语言在开发上比较慢，而且，因为这些语言如：Python、NumPy的语法相较于Octave来说，还是更麻烦一点。正因为这样，所以我强烈建议不要用NumPy或者R来完整这门课的作业，我建议在这门课中用Octave来写程序。

本视频将快速地介绍一系列的命令，目标是迅速地展示，通过这一系列Octave的命令，让你知道Octave能用来做什么。

启动Octave：

现在打开Octave，这是Octave命令行。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YhWow1EJ-1665933231727)(…/images/e2c2dcc31f19ac255566fa616799d496.png)]

现在让我示范最基本的Octave代码：

输入5 + 6，然后得到11。

输入3 – 2、5×8、1/2、2^6等等，得到相应答案。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YNIDnu6U-1665933231729)(…/images/6dcdf4a7c0d56787648d4a1902034150.png)]

这些都是基本的数学运算。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MkIfOJuG-1665933231731)(…/images/f8507899953ed2de68e6b2b83554f9ea.png)]

你也可以做逻辑运算，例如 12，计算结果为 false (假)，这里的百分号命令表示注释，12 计算结果为假，这里用0表示。

请注意，不等于符号的写法是这个波浪线加上等于符号 ( ~= )，而不是等于感叹号加等号( != )，这是和其他一些编程语言中不太一样的地方。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k5IRxbVA-1665933231734)(…/images/126b2a5c4b5bfb24e5c21cd080159530.png)]

让我们看看逻辑运算 1 && 0，使用双&符号表示逻辑与，1 && 0判断为假，1和0的或运算 1 || 0，其计算结果为真。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jp5ohF1i-1665933231736)(…/images/fec0936e2a78c0fe8c9e3ed107614a31.png)]

还有异或运算如XOR ( 1, 0 )，其返回值为1

从左向右写着 Octave 324.x版本，是默认的Octave提示，它显示了当前Octave的版本，以及相关的其它信息。

如果你不想看到那个提示，这里有一个隐藏的命令：

输入命令

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NvWN7roE-1665933231737)(…/images/8d63fe546c12a7e9eb658118d76288f7.png)]

现在命令提示已经变得简化了。

接下来，我们将谈到Octave的变量。

现在写一个变量，对变量 $A$ 赋值为3，并按下回车键，显示变量 $A$ 等于3。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WRenP4Uj-1665933231740)(…/images/a537df35ccc9ff83a3c7518362e2f729.png)]

如果你想分配一个变量，但不希望在屏幕上显示结果，你可以在命令后加一个分号，可以抑制打印输出，敲入回车后，不打印任何东西。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-iAcZ8DHI-1665933231742)(…/images/c11786828c587189891a9ef02f041ab7.png)]

其中这句命令不打印任何东西。

现在举一个字符串的例子：变量 $b$ 等于"hi"。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-XV4WqwVQ-1665933231743)(…/images/4b67374499c0d38ed8670ba74ff892d0.png)]

$c$ 等于3大于等于1，所以，现在 $c$ 变量的值是真。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4wugPsFR-1665933231745)(…/images/acedf91b6b39d551e62a89f2e0955628.png)]

如果你想打印出变量，或显示一个变量，你可以像下面这么做：

设置 $a$ 等于圆周率 $π$ ，如果我要打印该值，那么只需键入a像这样就打印出来了。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j7vI5lO1-1665933231747)(…/images/2cdc09b8bf67e546df7284ba74601c66.png)]

对于更复杂的屏幕输出，也可以用DISP命令显示：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-vUOZ2Ep3-1665933231748)(…/images/dfcd1d37526824726d85a655f8951249.png)]

这是一种，旧风格的C语言语法，对于之前就学过C语言的同学来说，你可以使用这种基本的语法来将结果打印到屏幕。

例如 ^{T}命令的六个小数：0.6%f ,a，这应该打印 $π$ 的6位小数形式。

也有一些控制输出长短格式的快捷命令：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pDbjU3c0-1665933231750)(…/images/ba8f0c3d2d8f017e0f7a611aa5be75d6.png)]

下面，让我们来看看向量和矩阵：

比方说建立一个矩阵 $A$ ：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RvEZbuNw-1665933231753)(…/images/693ebb444501838dd9b69520fff54be0.png)]

对 $A$ 矩阵进行赋值，考虑到这是一个三行两列的矩阵，你同样可以用向量。

建立向量 $V$ 并赋值1 2 3， $V$ 是一个行向量，或者说是一个3 ( 列 )×1 ( 行 )的向量，或者说，一行三列的矩阵。

如果我想，分配一个列向量，我可以写“1;2;3”，现在便有了一个3 行 1 列的向量，同时这是一个列向量。

下面是一些更为有用的符号，如：

V=1：0.1：2

这个该如何理解呢：这个集合 $v$ 是一组值，从数值1开始，增量或说是步长为0.1，直到增加到2，按照这样的方法对向量 $V$ 操作，可以得到一个行向量，这是一个1行11列的矩阵，其矩阵的元素是1
1.1 1.2 1.3，依此类推，直到数值2。

我也可以建立一个集合 $v$ 并用命令“1:6”进行赋值，这样 $V$ 就被赋值了1至6的六个整数。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-uecQrkfx-1665933231754)(…/images/1cdbd87db83a4184098cd6d5ee3c6a87.png)]

这里还有一些其他的方法来生成矩阵

例如“ones(2, 3)”，也可以用来生成矩阵：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-im0GXzDI-1665933231755)(…/images/5d2b25d4078a276091b9c00812674fa9.png)]

元素都为2，两行三列的矩阵，就可以使用这个命令：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-czwk5vKO-1665933231757)(…/images/21985f8690965598d4a17e3a6e7fee94.png)]

你可以把这个方法当成一个生成矩阵的快速方法。

$w$ 为一个一行三列的零矩阵，一行三列的 $A$ 矩阵里的元素全部是零：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4UMzlWTs-1665933231758)(…/images/846b48ec79c9fcee05b20767dcc89558.png)]

还有很多的方式来生成矩阵。

如果我对 $W$ 进行赋值，用Rand命令建立一个一行三列的矩阵，因为使用了Rand命令，则其一行三列的元素均为随机值，如“rand(3,3)”命令，这就生成了一个3×3的矩阵，并且其所有元素均为随机。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3hD3tKwM-1665933231759)(…/images/0de6e7054e869a82060cefa9968cd56b.png)]

数值介于0和1之间，所以，正是因为这一点，我们可以得到数值均匀介于0和1之间的元素。

如果，你知道什么是高斯随机变量，或者，你知道什么是正态分布的随机变量，你可以设置集合 $W$ ，使其等于一个一行三列的 $N$ 矩阵，并且，来自三个值，一个平均值为0的高斯分布，方差或者等于1的标准偏差。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cXaFQ2ud-1665933231761)(…/images/048f3cac1c32e3dc56160849c4dd60b0.png)]

还可以设置地更复杂：

并用hist命令绘制直方图。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-e4FCpjgu-1665933231764)(…/images/10c06cc39058da2c5eef696d75e65a2c.png)]

绘制单位矩阵：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0s4qpFk5-1665933231765)(…/images/08d11f870c5b30536f1965507fa7e7dc.png)]

如果对命令不清楚，建议用help命令：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-JomzZ14o-1665933231767)(…/images/79b55d71cf434126f3d8457a3a615d18.png)]

以上讲解的内容都是Octave的基本操作。希望你能通过上面的讲解，自己练习一些矩阵、乘、加等操作，将这些操作在Octave中熟练运用。

在接下来的视频中，将会涉及更多复杂的命令，并使用它们在Octave中对数据进行更多的操作。

5.2 移动数据

参考视频: 5 - 2 - Moving Data Around (16 min).mkv

在这段关于 Octave的辅导课视频中，我将开始介绍如何在 Octave 中移动数据。

如果你有一个机器学习问题，你怎样把数据加载到 Octave 中？

怎样把数据存入一个矩阵？

如何对矩阵进行相乘？

如何保存计算结果？

如何移动这些数据并用数据进行操作？

进入我的 Octave 窗口，

我键入 $A$ ，得到我们之前构建的矩阵 $A$ ，也就是用这个命令生成的：

A = [1 2; 3 4; 5 6]

这是一个3行2列的矩阵，Octave 中的 size() 命令返回矩阵的尺寸。

所以 size(A) 命令返回3 2

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-hrlexuRJ-1665933231768)(…/images/0f1fe8638058e229f1fc6c5b9cd4520c.png)]

实际上，size() 命令返回的是一个 1×2 的矩阵，我们可以用 $sz$ 来存放。

设置 sz = size(A)

因此 $sz$ 就是一个1×2的矩阵，第一个元素是3，第二个元素是2。

所以如果键入 size(sz) 看看 $sz$ 的尺寸，返回的是1 2，表示是一个1×2的矩阵，1 和 2分别表示矩阵 $sz$ 的维度。

你也可以键入 size(A, 1)，将返回3，这个命令会返回 $A$ 矩阵的第一个元素， $A$ 矩阵的第一个维度的尺寸，也就是 $A$ 矩阵的行数。

同样，命令 size(A, 2)，将返回2，也就是 $A$ 矩阵的列数。

如果你有一个向量 $v$ ，假如 v = [1 2 3 4]，然后键入length(v)，这个命令将返回最大维度的大小，返回4。

你也可以键入length(A)，由于矩阵 $A$ 是一个3×2的矩阵，因此最大的维度应该是3，因此该命令会返回3。

但通常我们还是对向量使用 $l e n g t h$ 命令，而不是对矩阵使用 length 命令，比如
length([1;2;3;4;5])，返回5。

如何在系统中加载数据和寻找数据：

当我们打开 Octave 时，我们通常已经在一个默认路径中，这个路径是 Octave的安装位置，pwd 命令可以显示出Octave 当前所处路径。

cd命令，意思是改变路径，我可以把路径改为C:\Users\ang\Desktop，这样当前目录就变为了桌面。

如果键入 ls，ls 来自于一个 Unix 或者 Linux 命令，ls命令将列出我桌面上的所有路径。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LLDF6YFw-1665933231770)(…/images/0de527966203108b7efa1b6730bd966c.png)]

事实上，我的桌面上有两个文件：featuresX.dat 和priceY.dat，是两个我想解决的机器学习问题。

featuresX文件如这个窗口所示，是一个含有两列数据的文件，其实就是我的房屋价格数据，数据集中有47行，第一个房子样本，面积是2104平方英尺，有3个卧室，第二套房子面积为1600，有3个卧室等等。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-lZwKQnIA-1665933231771)(…/images/e4080d69119a0e408581c81a66e133c8.png)]

priceY这个文件就是训练集中的价格数据，所以 featuresX 和priceY就是两个存放数据的文档，那么应该怎样把数据读入 Octave 呢？我们只需要键入featuresX.dat，这样我将加载了 featuresX 文件。同样地我可以加载priceY.dat。其实有好多种办法可以完成，如果你把命令写成字符串的形式load('featureX.dat')，也是可以的，这跟刚才的命令效果是相同的，只不过是把文件名写成了一个字符串的形式，现在文件名被存在一个字符串中。Octave中使用引号来表示字符串。

另外 who 命令，能显示出在我的 Octave工作空间中的所有变量

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MzgVERyQ-1665933231776)(…/images/7e85f313f721f53f3ae74664210a7a25.png)]

所以我可以键入featuresX 回车，来显示 featuresX

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-20evaT2e-1665933231781)(…/images/e49f56ceddd34dce986ae1dbdc399762.png)]

这些就是存在里面的数据。

还可以键入 size(featuresX)，得出的结果是 47 2，代表这是一个47×2的矩阵。

类似地，输入 size(priceY)，结果是 47
1，表示这是一个47维的向量，是一个列矩阵，存放的是训练集中的所有价格 $Y$ 的值。

who 函数能让你看到当前工作空间中的所有变量，同样还有另一个 whos命令，能更详细地进行查看。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4KTUv4o9-1665933231784)(…/images/e8207c74976c4443d1ea25ec2a3b8477.png)]

同样也列出我所有的变量，不仅如此，还列出了变量的维度。

double 意思是双精度浮点型，这也就是说，这些数都是实数，是浮点数。

如果你想删除某个变量，你可以使用 clear 命令，我们键入 clear featuresX，然后再输入 whos 命令，你会发现 featuresX 消失了。

另外，我们怎么储存数据呢？

我们设变量 V= priceY(1:10)

这表示的是将向量 $Y $的前10个元素存入 $V$ 中。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-AN5baqtg-1665933231786)(…/images/a8c3b363f13820b4fc6463c7520ab58c.png)]

假如我们想把它存入硬盘，那么用 save hello.mat v 命令，这个命令会将变量 $V$ 存成一个叫 hello.mat 的文件，让我们回车，现在我的桌面上就出现了一个新文件，名为hello.mat。

由于我的电脑里同时安装了 MATLAB，所以这个图标上面有 MATLAB的标识，因为操作系统把文件识别为 MATLAB文件。如果在你的电脑上图标显示的不一样的话，也没有关系。

现在我们清除所有变量，直接键入clear，这样将删除工作空间中的所有变量，所以现在工作空间中啥都没了。

但如果我载入 hello.mat 文件，我又重新读取了变量 $v$ ，因为我之前把变量 $v$ 存入了hello.mat 文件中，所以我们刚才用 save命令做了什么。这个命令把数据按照二进制形式储存，或者说是更压缩的二进制形式，因此，如果 $v$ 是很大的数据，那么压缩幅度也更大，占用空间也更小。如果你想把数据存成一个人能看懂的形式，那么可以键入：

save hello.txt v -ascii

这样就会把数据存成一个文本文档，或者将数据的 ascii 码存成文本文档。

我键入了这个命令以后，我的桌面上就有了 hello.txt文件。如果打开它，我们可以发现这个文本文档存放着我们的数据。

这就是读取和储存数据的方法。

接下来我们再来讲讲操作数据的方法：

假如 $A$ 还是那个矩阵

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VQsKzWNF-1665933231789)(…/images/b39bf4e9212442464fe2f568dbe4fa0c.png)]

跟刚才一样还是那个 3×2 的矩阵，现在我们加上索引值，比如键入 A(3,2)

这将索引到 $A$ 矩阵的 (3,2) 元素。这就是我们通常书写矩阵的形式，写成 $A$ 32，3和2分别表示矩阵的第三行和第二列对应的元素，因此也就对应 6。

我也可以键入A(2,:) 来返回第二行的所有元素，冒号表示该行或该列的所有元素。

类似地，如果我键入 A(:,2)，这将返回 $A$ 矩阵第二列的所有元素，这将得到 2 4 6。

这表示返回 $A$ 矩阵的第二列的所有元素。

你也可以在运算中使用这些较为复杂的索引。

我再给你展示几个例子，可能你也不会经常使用，但我还是输入给你看 A([1 3],:)，这个命令意思是取 $A$ 矩阵第一个索引值为1或3的元素，也就是说我取的是A矩阵的第一行和第三行的每一列，冒号表示的是取这两行的每一列元素，即：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tEDTCTEE-1665933231791)(…/images/d1d551d0c540449d457e312a34434355.png)]

可能这些比较复杂一点的索引操作你会经常用到。

我们还能做什么呢？依然是 $A$ 矩阵，A(:,2) 命令返回第二列。

你也可以为它赋值，我可以取 $A$ 矩阵的第二列，然后将它赋值为10 11 12，我实际上是取出了 $A$ 的第二列，然后把一个列向量[10;11;12]赋给了它，因此现在 $A$ 矩阵的第一列还是 1 3 5，第二列就被替换为 10 11 12。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QVB0ld2p-1665933231793)(…/images/f47bda45fd9beef6c600ebd48d163617.png)]

接下来一个操作，让我们把 $A $设为A = [A, [100, 101,102]]，这样做的结果是在原矩阵的右边附加了一个新的列矩阵，就是把 $A$ 矩阵设置为原来的 $A$ 矩阵再在右边附上一个新添加的列矩阵。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Q5WfwrJ4-1665933231794)(…/images/2e1c68a99a23d993674f08151e77dd44.png)]

最后，还有一个小技巧，如果你就输入 A(:)，这是一个很特别的语法结构，意思是把 $A$ 中的所有元素放入一个单独的列向量，这样我们就得到了一个 9×1 的向量，这些元素都是 $A$ 中的元素排列起来的。

再来几个例子：

我还是把 A 重新设为 [1 2; 3 4; 5 6]，我再设一个 $B$ 为[11 12; 13 14; 15 16]，我可以新建一个矩阵 $C$ ，C = [A B]，这个意思就是把这两个矩阵直接连在一起，矩阵 $A$ 在左边，矩阵 $B$ 在右边，这样组成了 $C$ 矩阵，就是直接把 $A$ 和 $B$ 合起来。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3nGK5PPX-1665933231797)(…/images/e07db429512d4b3b5d641c52e606159d.png)]

我还可以设C = [A; B]，这里的分号表示把分号后面的东西放到下面。所以，[A;B]的作用依然还是把两个矩阵放在一起，只不过现在是上下排列，所以现在 $A$ 在上面 $B$ 在下面， $C$ 就是一个 6×2 矩阵。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kZs1YCZ3-1665933231799)(…/images/7f11aa788b1b75c5a534d030b3ebc624.png)]

简单地说，分号的意思就是换到下一行，所以 C 就包括上面的A，然后换行到下面，然后在下面放上一个 $B$ 。

另外顺便说一下，这个[A B]命令跟 [A, B] 是一样的，这两种写法的结果是相同的。

通过以上这些操作，希望你现在掌握了怎样构建矩阵，也希望我展示的这些命令能让你很快地学会怎样把矩阵放到一起，怎样取出矩阵，并且把它们放到一起，组成更大的矩阵。

通过几句简单的代码，Octave能够很方便地很快速地帮助我们组合复杂的矩阵以及对数据进行移动。这就是移动数据这一节课。

我认为对你来讲，最好的学习方法是，下课后复习一下我键入的这些代码好好地看一看，从课程的网上把代码的副本下载下来，重新好好看看这些副本，然后自己在Octave 中把这些命令重新输一遍，慢慢开始学会使用这些命令。

当然，没有必要把这些命令都记住，你也不可能记得住。你要做的就是，了解一下你可以用哪些命令，做哪些事。这样在你今后需要编写学习算法时，如果你要找到某个Octave中的命令，你可能回想起你之前在这里学到过，然后你就可以查找课程中提供的程序副本，这样就能很轻松地找到你想使用的命令了。

5.3 计算数据

参考视频: 5 - 3 - Computing on Data (13 min).mkv

现在，你已经学会了在Octave中如何加载或存储数据，如何把数据存入矩阵等等。在这段视频中，我将介绍如何对数据进行运算，稍后我们将使用这些运算操作来实现我们的学习算法。

这是我的 Octave窗口，我现在快速地初始化一些变量。比如设置 $A$ 为一个3×2的矩阵，设置 $B$ 为一个3 ×2矩阵，设置 $C$ 为2 × 2矩阵。

我想算两个矩阵的乘积，比如说 $A \times C$ ，我只需键入A×C，这是一个 3×2 矩阵乘以 2×2矩阵，得到这样一个3×2矩阵。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xoKGzNA5-1665933231802)(…/images/8ee5c7c05865e90f75feda99b9131319.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1GO4hTnm-1665933231803)(…/images/38c956acb3bedf4362f40e6c5e8a692f.png)]

你也可以对每一个元素，做运算方法是做点乘运算A.*B，这么做Octave将矩阵 $A$ 中的每一个元素与矩阵 $B$ 中的对应元素相乘:A.*B

这里第一个元素1乘以11得到11，第二个元素2乘以12得到24，这就是两个矩阵的元素位运算。通常来说，在Octave中点号一般用来表示元素位运算。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dRxV4sNM-1665933231805)(…/images/646de38bffd4f7f6601167d0c0686970.png)]

这里是一个矩阵 $A$ ，这里我输入A.^2，这将对矩阵 $A$ 中每一个元素平方。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PXKCQd6r-1665933231807)(…/images/d456e7501d7aaa9fa2ef8a89e89fa7e1.png)]

我们设 $V$ 为 [1; 2; 3] 是列向量，你也可以输入1./V，得到每一个元素的倒数，所以这样一来，就会分别算出 1/1 1/2 1/3。

矩阵也可以这样操作，1./A 得到 $A$ 中每一个元素的倒数。

同样地，这里的点号还是表示对每一个元素进行操作。

我们还可以进行求对数运算，也就是对每个元素进行求对数运算。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IjvU8M7t-1665933231809)(…/images/0c7c1d7726c09ffb45152cf153614003.png)]

还有自然数 $e$ 的幂次运算，就是以 $e$ 为底，以这些元素为幂的运算。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wdM1qQhf-1665933231810)(…/images/a36506049248948c82e598c8c254dc31.png)]

我还可以用 abs来对 $v$ 的每一个元素求绝对值，当然这里 $v$ 都是正数。我们换成另一个这样对每个元素求绝对值，得到的结果就是这些非负的元素。还有 $- v$ ，给出 $v$ 中每个元素的相反数，这等价于 -1 乘以 $v$ ，一般就直接用 $- v$
就好了，其实就等于 $- 1 * v$ 。

还有一个技巧，比如说我们想对 $v$ 中的每个元素都加1，那么我们可以这么做，首先构造一个3行1列的1向量，然后把这个1向量跟原来的向量相加，因此 $v$ 向量从[1 2 3] 增至 [2 3 4]。我用了一个，length(v)命令，因此这样一来，ones(length(v) ,1) 就相当于ones(3,1)，然后我做的是v +ones(3,1)，也就是将 $v$ 的各元素都加上这些1，这样就将 $v$ 的每个元素增加了1。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TFBwscea-1665933231811)(…/images/9432bbcbfde53c7e0dcb1c7317b01c0c.png)]

另一种更简单的方法是直接用 v+1，v + 1 也就等于把 $v$ 中的每一个元素都加上1。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PZzjSL4e-1665933231814)(…/images/e02eec3ca4688ff1cb9126c8eb13bfed.png)]

现在，让我们来谈谈更多的操作。

矩阵 $A$ 如果你想要求它的转置，那么方法是用A’,将得出 A 的转置矩阵。当然，如果我写(A')'，也就是 $A$ 转置两次，那么我又重新得到矩阵 $A$ 。

还有一些有用的函数，比如： a=[1 15 2 0.5]，这是一个1行4列矩阵，val=max(a)，这将返回 $A$ 矩阵中的最大值15。

我还可以写 [val, ind] =max(a)，这将返回 $A$ 矩阵中的最大值存入 $v a l$ ，以及该值对应的索引，元素15对应的索引值为2,存入 $in d$ ，所以 $in d = 2$ 。

特别注意一下，如果你用命令 max(A)， $A$ 是一个矩阵的话，这样做就是对每一列求最大值。

我们还是用这个例子，这个 $a$ 矩阵a=[1 15 2 0.5]，如果输入a<3，这将进行逐元素的运算，所以元素小于3的返回1，否则返回0。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RQKhPNJG-1665933231815)(…/images/fc04d42876c9d7d7bed51bade2077649.png)]

因此，返回[1 1 0 1]。也就是说，对 $a$ 矩阵的每一个元素与3进行比较，然后根据每一个元素与3的大小关系，返回1和0表示真与假。

如果我写 find(a<3)，这将告诉我 $a$ 中的哪些元素是小于3的。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KToAAFsk-1665933231817)(…/images/ac9ad10f115d2d1cd15a0514c8ceeafa.png)]

设A = magic(3)，magic 函数将返回一个矩阵，称为魔方阵或幻方 (magic squares)，它们具有以下这样的数学性质：它们所有的行和列和对角线加起来都等于相同的值。

当然据我所知，这在机器学习里基本用不上，但我可以用这个方法很方便地生成一个3行3列的矩阵，而这个魔方矩阵这神奇的方形屏幕。每一行、每一列、每一个对角线三个数字加起来都是等于同一个数。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3F2u4e6i-1665933231819)(…/images/f8c7f4f36183ef4b36bce427be2fce6f.png)]

在其他有用的机器学习应用中，这个矩阵其实没多大作用。

如果我输入 [r,c] = find(A>=7)，这将找出所有 $A$ 矩阵中大于等于7的元素，因此， $r$ 和 $c$ 分别表示行和列，这就表示，第一行第一列的元素大于等于7，第三行第二列的元素大于等于7，第二行第三列的元素大于等于7。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fBDSxURb-1665933231820)(…/images/409a04487d1d7f039acfd61b3787f6aa.png)]

顺便说一句，其实我从来都不去刻意记住这个 find 函数，到底是怎么用的，我只需要会用help函数就可以了，每当我在使用这个函数，忘记怎么用的时候，我就可以用 help函数，键入 help find 来找到帮助文档。

最后再讲两个内容，一个是求和函数，这是 $a$ 矩阵：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OXwdVmDX-1665933231821)(…/images/d7221c981ecc7730465710a0d8b49b34.png)]

键入 sum(a)，就把 a 中所有元素加起来了。

如果我想把它们都乘起来，键入 prod(a)，prod 意思是product(乘积)，它将返回这四个元素的乘积。

floor(a) 是向下四舍五入，因此对于 $a$ 中的元素0.5将被下舍入变成0。

还有 ceil(a)，表示向上四舍五入，所以0.5将上舍入变为最接近的整数，也就是1。

键入 type(3)，这通常得到一个3×3的矩阵，如果键入 max(rand(3),rand(3))，这样做的结果是返回两个3×3的随机矩阵，并且逐元素比较取最大值。

假如我输入max(A,[],1)，这样做会得到每一列的最大值。

所以第一列的最大值就是8，第二列是9，第三列的最大值是7，这里的1表示取A矩阵第一个维度的最大值。

相对地，如果我键入max(A,[],2)，这将得到每一行的最大值，所以，第一行的最大值是等于8，第二行最大值是7，第三行是9。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8DgczhrL-1665933231822)(…/images/31bc524d1a19b4e9d8ea0974517a512e.png)]

所以你可以用这个方法来求得每一行或每一列的最值，另外，你要知道，默认情况下max(A)返回的是每一列的最大值，如果你想要找出整个矩阵A的最大值，你可以输入max(max(A))，或者你可以将 $A$ 矩阵转成一个向量，然后键入 max(A(:))，这样做就是把 $A$ 当做一个向量，并返回 $A$ 向量中的最大值。

最后，让我们把 $A$ 设为一个9行9列的魔方阵，魔方阵具有的特性是每行每列和对角线的求和都是相等的。

这是一个9×9的魔方阵，我们来求一个 sum(A,1)，这样就得到每一列的总和，这也验证了一个9×9的魔方阵确实每一列加起来都相等，都为369。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-OuqaB2ZV-1665933231824)(…/images/0b9753a3e10bbdce0f26c3d44d61ae26.png)]

现在我们来求每一行的和，键入sum(A,2)，这样就得到了 $A$ 中每一行的和加起来还是369。

现在我们来算$A $的对角线元素的和。我们现在构造一个9×9 的单位矩阵，键入 eye(9),

然后我们要用 $A$ 逐点乘以这个单位矩阵，除了对角线元素外，其他元素都会得到0。

键入sum(sum(A.*eye(9))

这实际上是求得了，这个矩阵对角线元素的和确实是369。

你也可以求另一条对角线的和也是是369。

flipup/flipud 表示向上/向下翻转。

同样地，如果你想求这个矩阵的逆矩阵，键入pinv(A)，通常称为伪逆矩阵，你就把它看成是矩阵 $A$ 求逆，因此这就是 $A$ 矩阵的逆矩阵。

设 temp = pinv(A)，然后再用 $t e m p$ 乘以 $A$ ，这实际上得到的就是单位矩阵，对角线为1，其他元素为0。

如何对矩阵中的数字进行各种操作，在运行完某个学习算法之后，通常一件最有用的事情是看看你的结果，或者说让你的结果可视化，在接下来的视频中，我会非常迅速地告诉你，如何很快地画图，如何只用一两行代码，你就可以快速地可视化你的数据，这样你就能更好地理解你使用的学习算法。

5.4 绘图数据

参考视频: 5 - 4 - Plotting Data (10 min).mkv

当开发学习算法时，往往几个简单的图，可以让你更好地理解算法的内容，并且可以完整地检查下算法是否正常运行，是否达到了算法的目的。

例如在之前的视频中，我谈到了绘制成本函数 $J(\theta)$ ，可以帮助确认梯度下降算法是否收敛。通常情况下，绘制数据或学习算法所有输出，也会启发你如何改进你的学习算法。幸运的是，Octave有非常简单的工具用来生成大量不同的图。当我用学习算法时，我发现绘制数据、绘制学习算法等，往往是我获得想法来改进算法的重要部分。在这段视频中，我想告诉你一些Octave的工具来绘制和可视化你的数据。

我们先来快速生成一些数据用来绘图。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c4c74Idk-1665933231826)(…/images/4514b422525aaac1e99add67e44882ee.png)]

如果我想绘制正弦函数，这是很容易的，我只需要输入plot(t,y1)，并回车，就出现了这个图：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ENiMNfLV-1665933231827)(…/images/ff08dcc5b9718aa9c744e13fcc4fd607.png)]

横轴是 $t$ 变量，纵轴是 $y 1$ ，也就是我们刚刚所输出的正弦函数。

让我们设置 $y 2$

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FigIyIPi-1665933231828)(…/images/2d32a23ab895a8e765caf90a7679817e.png)]

Octave将会消除之前的正弦图，并且用这个余弦图来代替它，这里纵轴 $cos (x)$ 从1开始，

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZGaDRi52-1665933231830)(…/images/38969cc85853190ff3eac4f06398bc1b.png)]

如果我要同时表示正弦和余弦曲线。

我要做的就是，输入：plot(t, y1)，得到正弦函数，我使用函数hold on，hold on函数的功能是将新的图像绘制在旧的之上。

我现在绘制 $y 2$ ，输入：plot(t, y2)。

我要以不同的颜色绘制余弦函数，所以我在这里输入带引号的r绘制余弦函数， $r$ 表示所使用的颜色：plot(t,y2,’r’)，再加上命令xlabel('time')，
来标记X轴即水平轴，输入ylabel('value')，来标记垂直轴的值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Gzb5k7nK-1665933231834)(…/images/9eb4e496f34a801fd7ba5e85c4eec66b.png)]

同时我也可以来标记我的两条函数曲线，用这个命令 legend('sin','cos')将这个图例放在右上方，表示这两条曲线表示的内容。最后输入title('myplot')，在图像的顶部显示这幅图的标题。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nKh0PPUU-1665933231836)(…/images/23594175efe66d5b9b1e687375a2dbda.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UiwdBs0u-1665933231859)(…/images/c765aeee9c53e0e77d01d1e73cabd9b4.png)]

如果你想保存这幅图像，你输入print –dpng 'myplot.png'，png是一个图像文件格式，如果你这样做了，它可以让你保存为一个文件。

Octave也可以保存为很多其他的格式，你可以键入help plot。

最后如果你想，删掉这个图像，用命令close会让这个图像关掉。

Octave也可以让你为图像标号

你键入figure(1); plot(t, y1);将显示第一张图，绘制了变量 $t$ $y 1$ 。

键入figure(2); plot(t, y2); 将显示第一张图，绘制了变量 $t$ $y 2$ 。

subplot命令，我们要使用subplot(1,2,1)，它将图像分为一个1*2的格子，也就是前两个参数，然后它使用第一个格子，也就是最后一个参数1的意思。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dnEi3hTj-1665933231860)(…/images/a786b8ed82ddd182f4595de2173cc84b.png)]

我现在使用第一个格子，如果键入plot(t,y1)，现在这个图显示在第一个格子。如果我键入subplot(1,2,2)，那么我就要使用第二个格子，键入plot(t,y2)；现在y2显示在右边，也就是第二个格子。

最后一个命令，你可以改变轴的刻度，比如改成[0.5 1 -1 1]，输入命令：axis([0.5 1 -1 1])也就是设置了右边图的 $x$ 轴和 $y$ 轴的范围。具体而言，它将右图中的横轴的范围调整至0.5到1，竖轴的范围为-1到1。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-D96GOVNL-1665933231862)(…/images/f13993f4784d01e7da769b4ec2545cd7.png)]

你不需要记住所有这些命令，如果你需要改变坐标轴，或者需要知道axis命令，你可以用Octave中用help命令了解细节。

最后，还有几个命令。

Clf（清除一幅图像）。

让我们设置A等于一个5×5的magic方阵：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gFCkxA0K-1665933231864)(…/images/82a990a5832ae2618d768551b90470dc.png)]

我有时用一个巧妙的方法来可视化矩阵，也就是imagesc(A)命令，它将会绘制一个5*5的矩阵，一个5*5的彩色格图，不同的颜色对应A矩阵中的不同值。

我还可以使用函数colorbar，让我用一个更复杂的命令 imagesc(A)，colorbar，colormap gray。这实际上是在同一时间运行三个命令：运行imagesc，然后运行，colorbar，然后运行colormap gray。

它生成了一个颜色图像，一个灰度分布图，并在右边也加入一个颜色条。所以这个颜色条显示不同深浅的颜色所对应的值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wiGrXhBc-1665933231865)(…/images/881986ec5af9d86b6b14b260fb3b3618.png)]

你可以看到在不同的方格，它对应于一个不同的灰度。

输入imagesc(magic(15))，colorbar，colormap gray

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-I48vv945-1665933231873)(…/images/22a9a9536d4db17b6d64603fb54dce9e.png)]

这将会是一幅15*15的magic方阵值的图。

最后，总结一下这段视频。你看到我所做的是使用逗号连接函数调用。如果我键入 $a = 1$ , $b = 2$ , $c = 3$ 然后按Enter键，其实这是将这三个命令同时执行，或者是将三个命令一个接一个执行，它将输出所有这三个结果。

这很像 $a = 1$ ; $b = 2$ ; $c = 3$ ;如果我用分号来代替逗号，则没有输出出任何东西。

这里我们称之为逗号连接的命令或函数调用。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c6DJqHLZ-1665933231876)(…/images/c0e8b7a19ced9a1dd006ed87d6323c9b.png)]

用逗号连接是另一种Octave中更便捷的方式，将多条命令例如imagesc colorbar colormap，将这多条命令写在同一行中。

现在你知道如何绘制Octave中不同的图像，在下面的视频中，我将告诉你怎样在Octave中，写控制语句，比如if while for语句，并且定义和使用函数。

5.5 控制语句：for，while，if语句

参考视频: 5 - 5 - Control Statements_ for, while, if statements (13 min).mkv

在这段视频中，我想告诉你怎样为你的 Octave 程序写控制语句。诸如：“for” “while” “if” 这些语句，并且如何定义和使用方程。

我先告诉你如何使用 “for” 循环。

首先，我要将 $v$ 值设为一个10行1列的零向量。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ttZDdXjy-1665933231880)(…/images/26a912d550af9fd43a7ae62e3b610e97.png)]

接着我要写一个 “for" 循环，让 $i$ 等于 1 到 10，写出来就是 i = 1:10。我要设$ v(i)$的值等于 2 的 $i$ 次方，循环最后写上“end”。

向量 $v$ 的值就是这样一个集合 2的一次方、2的二次方，依此类推。这就是我的 $i$ 等于 1 到 10的语句结构，让 $i$ 遍历 1 到 10的值。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oOpnIfP4-1665933231881)(…/images/890f6ea8f857f22002f98c20d52b3bb8.png)]

另外，你还可以通过设置你的 indices (索引) 等于 1一直到10，来做到这一点。这时indices 就是一个从1到10的序列。

你也可以写 i = indices，这实际上和我直接把 i 写到 1 到 10 是一样。你可以写 disp(i)，也能得到一样的结果。所以这就是一个 “for” 循环。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TjHnjach-1665933231883)(…/images/fc956ae1291dc7d3b819e471d1962398.png)]

如果你对 “break” 和 “continue” 语句比较熟悉，Octave里也有 “break” 和 “continue”语句，你也可以在 Octave环境里使用那些循环语句。

但是首先让我告诉你一个 while 循环是如何工作的：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aVhNfEnB-1665933231885)(…/images/1b37f81896a59145576ae996c9dd4d16.png)]

这是什么意思呢：我让 $i$ 取值从 1 开始，然后我要让 $v (i)$ 等于 100，再让 $i$ 递增 1，直到 $i$ 大于 5停止。

现在来看一下结果，我现在已经取出了向量的前五个元素，把他们用100覆盖掉，这就是一个while循环的句法结构。

现在我们来分析另外一个例子：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SqgD5yzN-1665933231889)(…/images/279cfbda6b4d9a2ced1332f086db4d9e.png)]

这里我将向你展示如何使用break语句。比方说 v(i) = 999，然后让 i = i+1，当 $i$ 等于6的时候 break (停止循环)，结束 (end)。

当然这也是我们第一次使用一个 if 语句，所以我希望你们可以理解这个逻辑，让 $i$ 等于1 然后开始下面的增量循环，while语句重复设置 $v (i)$ 等于999，不断让 $i$ 增加，然后当 $i$ 达到6，做一个中止循环的命令，尽管有while循环，语句也就此中止。所以最后的结果是取出向量 $v$ 的前5个元素，并且把它们设置为999。

所以，这就是if 语句和 while 语句的句法结构。并且要注意要有end，上面的例子里第一个 end 结束的是 if
语句，第二个 end 结束的是 while 语句。

现在让我告诉你使用 if-else 语句：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ReSlkfkO-1665933231895)(…/images/3fce4367c960bb6fbc492a3b8f9ddc5d.png)]

最后，提醒一件事：如果你需要退出 Octave，你可以键入exit命令然后回车就会退出 Octave，或者命令quit也可以。

最后，让我们来说说函数 (functions)，如何定义和调用函数。

我在桌面上存了一个预先定义的文件名为 “squarethisnumber.m”，这就是在 Octave 环境下定义的函数。

让我们打开这个文件。请注意，我使用的是微软的写字板程序来打开这个文件，我只是想建议你，如果你也使用微软的Windows系统，那么可以使用写字板程序，而不是记事本来打开这些文件。如果你有别的什么文本编辑器也可以，记事本有时会把代码的间距弄得很乱。如果你只有记事本程序，那也能用。我建议你用写字板或者其他可以编辑函数的文本编辑器。

现在我们来说如何在 Octave 里定义函数：

这个文件只有三行：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sS072L2S-1665933231897)(…/images/247f96f4e7ab7a259ac9ef1eebe0b503.png)]

第一行写着 function y = squareThisNumber(x)，这就告诉 Octave，我想返回一个 y值，我想返回一个值，并且返回的这个值将被存放于变量 $y$ 里。另外，它告诉了Octave这个函数有一个参数，就是参数 $x$ ，还有定义的函数体，也就是 $y$ 等于 $x$ 的平方。

还有一种更高级的功能，这只是对那些知道“search path (搜索路径)”这个术语的人使用的。所以如果你想要修改
Octave的搜索路径，你可以把下面这部分作为一个进阶知识，或者选学材料，仅适用于那些熟悉编程语言中搜索路径概念的同学。

你可以使用addpath 命令添加路径，添加路径“C:\Users\ang\desktop”将该目录添加到Octave的搜索路径，这样即使你跑到其他路径底下，Octave依然知道会在 Users\ang\desktop目录下寻找函数。这样，即使我现在在不同的目录下，它仍然知道在哪里可以找到“SquareThisNumber” 这个函数。

但是，如果你不熟悉搜索路径的概念，不用担心，只要确保在执行函数之前，先用 cd命令设置到你函数所在的目录下，实际上也是一样的效果。

Octave还有一个其他许多编程语言都没有的概念，那就是它可以允许你定义一个函数，使得返回值是多个值或多个参数。这里就是一个例子，定义一个函数叫：

“SquareAndCubeThisNumber(x)” ( $x$ 的平方以及 $x$ 的立方)

这说的就是函数返回值是两个： $y 1$ 和 $y 2$ ，接下来就是 $y 1$ 是被平方后的结果， $y 2$ 是被立方后的结果，这就是说，函数会真的返回2个值。

有些同学可能会根据你使用的编程语言，比如你们可能熟悉的C或C++，通常情况下，认为作为函数返回值只能是一个值，但Octave 的语法结构就不一样，可以返回多个值。

如果我键入 [a,b] = SquareAndCubeThisNumber(5)，然后， $a$ 就等于25， $b$ 就等于5的立方125。

所以说如果你需要定义一个函数并且返回多个值，这一点常常会带来很多方便。

最后，我来给大家演示一下一个更复杂一点的函数的例子。

比方说，我有一个数据集，像这样，数据点为[1,1], [2,2],[3,3]，我想做的事是定义一个 Octave 函数来计算代价函数 $J(\theta)$ ，就是计算不同 $\theta$ 值所对应的代价函数值 $J$ 。

首先让我们把数据放到 Octave 里，我把我的矩阵设置为X = [1 1; 1 2; 1 3];

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VtGvuHGT-1665933231898)(…/images/3c857152ef3f0d6b374e4863289d1c60.png)]

请仔细看一下这个函数的定义，确保你明白了定义中的每一步。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-dFpg0LBn-1665933231901)(…/images/e01d6da07890e32d46d0616741a3fe64.png)]

现在当我在 Octave 里运行时，我键入 J = costFunctionJ (X, y, theta)，它就计算出 $J$ 等于0，这是因为如果我的数据集 $x$ 为 [1;2;3]， $y$ 也为 [1;2;3] 然后设置 $\theta_0$ 等于0， $\theta_1$ 等于1，这给了我恰好45度的斜线，这条线是可以完美拟合我的数据集的。

而相反地，如果我设置 $\theta$ 等于[0;0]，那么这个假设就是0是所有的预测值，和刚才一样，设置 $\theta_0$ = 0， $\theta_1$ 也等于0，然后我计算的代价函数，结果是2.333。实际上，他就等于1的平方，也就是第一个样本的平方误差，加上2的平方，加上3的平方，然后除以 $2 m$ ，也就是训练样本数的两倍，这就是2.33。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0AC1WDld-1665933231944)(…/images/885b5d19c33f545292ccc1b69976c789.png)]

因此这也反过来验证了我们这里的函数，计算出了正确的代价函数。这些就是我们用简单的训练样本尝试的几次试验，这也可以作为我们对定义的代价函数 $J$ 进行了完整性检查。确实是可以计算出正确的代价函数的。至少基于这里的 $x$ 和 $y$ 是成立的。也就是我们这几个简单的训练集，至少是成立的。

现在你知道如何在 Octave 环境下写出正确的控制语句，比如 for 循环、while 循环和 if语句，以及如何定义和使用函数。

在接下来的Octave 教程视频里，我会讲解一下向量化，这是一种可以使你的 Octave程序运行非常快的思想。

5.6 向量化

参考视频: 5 - 6 - Vectorization (14 min).mkv

在这段视频中，我将介绍有关向量化的内容，无论你是用Octave，还是别的语言，比如MATLAB或者你正在用Python、NumPy 或 Java C C++，所有这些语言都具有各种线性代数库，这些库文件都是内置的，容易阅读和获取，他们通常写得很好，已经经过高度优化，通常是数值计算方面的博士或者专业人士开发的。

而当你实现机器学习算法时，如果你能好好利用这些线性代数库，或者数值线性代数库，并联合调用它们，而不是自己去做那些函数库可以做的事情。如果是这样的话，那么通常你会发现：首先，这样更有效，也就是说运行速度更快，并且更好地利用你的计算机里可能有的一些并行硬件系统等等；其次，这也意味着你可以用更少的代码来实现你需要的功能。因此，实现的方式更简单，代码出现问题的有可能性也就越小。

举个具体的例子：与其自己写代码做矩阵乘法。如果你只在Octave中输入 $a$ 乘以 $b$ 就是一个非常有效的两个矩阵相乘的程序。有很多例子可以说明，如果你用合适的向量化方法来实现，你就会有一个简单得多，也有效得多的代码。

让我们来看一些例子：这是一个常见的线性回归假设函数： ${{h}_{\theta }}(x)=\sum\limits_{j=0}^{n}{{{\theta }_{j}}{{x}_{j}}}$

如果你想要计算 $h_\theta(x)$ ，注意到右边是求和，那么你可以自己计算 $j = 0$ 到$ j = n$ 的和。但换另一种方式来想想，把 $h_\theta(x)$ 看作 $\theta^Tx$ ，那么你就可以写成两个向量的内积，其中 $\theta$ 就是 $\theta_0$ 、 $\theta_1$ 、 $\theta_2$ ，如果你有两个特征量，如果 $n = 2$ ，并且如果你把 $x$ 看作 $x_0$ 、 $x_1$ 、 $x_2$ ，这两种思考角度，会给你两种不同的实现方式。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xY5JdX1T-1665933231945)(…/images/7fefb92d8680e4a15f947cd2ca24a9ac.png)]

比如说，这是未向量化的代码实现方式：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wz4HmBOd-1665933231947)(…/images/125c07019cb39675085fe3b80b85fca5.png)]

计算 $h_\theta(x)$ 是未向量化的，我们可能首先要初始化变量 $p re d i c t i o n$ 的值为0.0，而这个变量 $p re d i c t i o n$ 的最终结果就是 $h_\theta(x)$ ，然后我要用一个 for 循环， $j$ 取值 0 到 $n + 1$ ，变量 $p re d i c t i o n$ 每次就通过自身加上$ theta(j) $乘以 $x (j)$ 更新值，这个就是算法的代码实现。

顺便我要提醒一下，这里的向量我用的下标是0，所以我有 $\theta_0$ 、 $\theta_1$ 、 $\theta_2$ ，但因为MATLAB的下标从1开始，在 MATLAB 中 $\theta_0$ ，我们可能会用 $t h e t a (1)$ 来表示，这第二个元素最后就会变成， $t h e t a (2$ ) 而第三个元素，最终可能就用 $t h e t a (3)$ 表示，因为MATLAB中的下标从1开始，这就是为什么这里我的 for 循环， $j$ 取值从 1 直到 $n + 1$ ，而不是从 0 到 $n$ 。这是一个未向量化的代码实现方式，我们用一个 for 循环对 $n$ 个元素进行加和。

作为比较，接下来是向量化的代码实现：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TAWZGS9s-1665933231948)(…/images/829e153c119919f80c058d1bc703a08b.png)]

你把x和 $\theta$ 看做向量，而你只需要令变量 $p re d i c t i o n$ 等于 $t h e t a$ 转置乘以 $x$ ，你就可以这样计算。与其写所有这些for循环的代码，你只需要一行代码，这行代码就是利用 Octave 的高度优化的数值，线性代数算法来计算两个向量 $\theta$ 以及 $x$ 的内积，这样向量化的实现更简单，它运行起来也将更加高效。这就是 Octave 所做的而向量化的方法，在其他编程语言中同样可以实现。

让我们来看一个C++ 的例子：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QQbdDdMT-1665933231950)(…/images/987fc9372da3b167fd16d7a19722405b.png)]

与此相反，使用较好的**C++数值线性代数库，你可以写出像右边这样的代码，因此取决于你的数值线性代数库的内容。你只需要在C++**中将两个向量相乘，根据你所使用的数值和线性代数库的使用细节的不同，你最终使用的代码表达方式可能会有些许不同，但是通过一个库来做内积，你可以得到一段更简单、更有效的代码。

现在，让我们来看一个更为复杂的例子，这是线性回归算法梯度下降的更新规则：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WwwKMNhG-1665933231952)(…/images/6ad266a30f955db5b905905670aabfc5.png)]

我们用这条规则对$ j$ 等于 0、1、2等等的所有值，更新对象 $\theta_j$ ，我只是用 $\theta_0$ 、 $\theta_1$ 、 $\theta_2$ 来写方程，假设我们有两个特征量，所以 $n$ 等于2，这些都是我们需要对 $\theta_0$ 、 $\theta_1$ 、 $\theta_2$ 进行更新，这些都应该是同步更新，我们用一个向量化的代码实现，这里是和之前相同的三个方程，只不过写得小一点而已。

你可以想象实现这三个方程的方式之一，就是用一个 for 循环，就是让 $j$ 等于0、等于1、等于2，来更新 $\theta_j$ 。但让我们用向量化的方式来实现，看看我们是否能够有一个更简单的方法。基本上用三行代码或者一个for 循环，一次实现这三个方程。让我们来看看怎样能用这三步，并将它们压缩成一行向量化的代码来实现。做法如下：

我打算把 $\theta$ 看做一个向量，然后我用 $\theta$ - $\alpha$ 乘以某个别的向量 $\delta$ 来更新 $\theta$ 。

这里的 $\delta$ 等于

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-HGvnVEjx-1665933231953)(…/images/fa662ec6d5703d85c314f5e4792a7468.png)]

让我解释一下是怎么回事：我要把 $\theta$ 看作一个向量，有一个 $n + 1$ 维向量， $\alpha$ 是一个实数， $\delta$ 在这里是一个向量。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-14P5gwUJ-1665933231955)(…/images/20bc912bae44e66125f8bfcec6e720c7.png)]

所以这个减法运算是一个向量减法，因为 $\alpha$ 乘以 δ是一个向量，所以 $\theta$ 就是 $\theta$ - $\alpha \delta$ 得到的向量。

那么什么是向量 $\delta$ 呢 ?

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-NXB7h2Ck-1665933231957)(…/images/541b9f097a8e1357c2a75e4f64e53b54.png)]

$X^{(i)}$ 是一个向量

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Lqctx4xd-1665933231959)(…/images/0a03d239f2f1d1af057d492bcce276f4.png)]

你就会得到这些不同的式子，然后作加和。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LSQ9fPkt-1665933231965)(…/images/8d10103bf172a889090690a00037ffa1.png)]

实际上，在以前的一个小测验，如果你要解这个方程，我们说过为了向量化这段代码，我们会令u = 2v +5w因此，我们说向量 $u$ 等于2乘以向量 $v$ 加上5乘以向量 $w$ 。用这个例子说明，如何对不同的向量进行相加，这里的求和是同样的道理。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Dg9sG8WG-1665933231968)(…/images/c84012101afc6836a3396893695d9669.png)]

这就是为什么我们能够向量化地实现线性回归。

所以，我希望步骤是有逻辑的。请务必看视频，并且保证你确实能理解它。如果你实在不能理解它们数学上等价的原因，你就直接实现这个算法，也是能得到正确答案的。所以即使你没有完全理解为何是等价的，如果只是实现这种算法，你仍然能实现线性回归算法。如果你能弄清楚为什么这两个步骤是等价的，那我希望你可以对向量化有一个更好的理解，如果你在实现线性回归的时候，使用一个或两个以上的特征量。

有时我们使用几十或几百个特征量来计算线性归回，当你使用向量化地实现线性回归，通常运行速度就会比你以前用你的for循环快的多，也就是自己写代码更新 $\theta_0$ 、 $\theta_1$ 、 $\theta_2$ 。

因此使用向量化实现方式，你应该是能够得到一个高效得多的线性回归算法。而当你向量化我们将在之后的课程里面学到的算法，这会是一个很好的技巧，无论是对于Octave 或者一些其他的语言如C++、Java 来让你的代码运行得更高效。

5.7 工作和提交的编程练习

参考视频: 5 - 7 - Working on and Submitting Programming Exercises (4 min).mkv

在这段视频中，我想很快地介绍一下这门课程做作业的流程，以及如何使用作业提交系统。这个提交系统可以即时检验你的机器学习程序答案是否正确。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pAO17qJA-1665933231970)(…/images/feddafffd2937841222e6e8e2cfb9401.png)]

在’ml-class-ex1’目录中，我们提供了大量的文件，其中有一些需要由你自己来编辑，因此第一个文件应该符合编程练习中pdf文件的要求，其中一个我们要求你编写的文件是warmUpExercise.m这个文件，这个文件只是为了确保你熟悉提交系统。

你需要做的就是提交一个5×5的矩阵，就是A = eye(5)这将修改该函数以产生5×5的单位矩阵，现在warmUpExercise()这个方程就实现了返回5x5的单位矩阵，将它保存一下，所以我已经完成了作业的第一部分。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-kINkCs7g-1665933231971)(…/images/d29dc95c23570991ae49d262ce351d7e.png)]

现在回到我的 Octave 窗口，现在来到我的目录C:\Users\ang\Desktop\ml-class-ex1如果我想确保我已经实现了程序像这样输入warmUpExercise()好了它返回了我们用刚才写的代码创建的一个5x5的单位矩阵。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Qm9epaKb-1665933231973)(…/images/c1db5363de0286d223444d6a9225a393.png)]

我现在可以按如下步骤提交代码，我要在这里目录下键入submit()。我要提交第一部分所以我选择输入’1’。这时它问我的电子邮件地址，我们打开课程网站，输入用户名密码。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-py5DzntP-1665933231975)(…/images/3663f8b6d0612a40204450dcf0df2257.png)]

按下回车键，它连接到服务器，并将其提交，然后它就会立刻告诉你：恭喜您！已成功完成作业1第1部分。这就确认了你已经做对了第一部分练习，如果你提交的答案不正确，那么它会给你一条消息，说明你没有完全答对，您还可以继续使用此提交密码，也可以生成新密码。你的密码是否会显示出来取决于你使用的操作系统。
这就是提交作业的方法，你完成家庭作业的时候，我希望你都能答对。

你可能感兴趣的:(网络,深度学习,机器学习,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
中原焦点团队网络初中级30期阴丽丽坚持分享第三百八十八次2022.10.18分享约练次数（74）咨询师（6）来访者（53）观察者（15）阴丽丽
今天是忙碌的一天，一早起来，总想着找点把事情弄完，可总也弄不完。就这样弄着吧！孩子的事，自己的事都在那里搁置着，不想做，有点欧！今天总体还不错，只是在下午起床时走神了俩小时，也算是给自己的放松吧！今日难得1.儿子乖巧、听话，努力配合，一天下来也是忙忙碌碌，这真的很难得！2.儿子今天录的视频被班主任认可，这真的很难得3.我今天早上做核酸时，自己把教案整了一下，这真的很难得
网络编程基础记得开心一点啊网络
目录♫什么是网络编程♫Socket套接字♪什么是Socket套接字♪数据报套接字♪流套接字♫数据报套接字通信模型♪数据报套接字通讯模型♪DatagramSocket♪DatagramPacket♪实现UDP的服务端代码♪实现UDP的客户端代码♫流套接字通信模型♪流套接字通讯模型♪ServerSocket♪Socket♪实现TCP的服务端代码♪实现TCP的客户端代码♫什么是网络编程网络编程，指网络上
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
多子女家庭问题 3e5c5362403c
杨宁宁焦点解决网络初17中19坚持分享589天（2021.3.20）本周约练我1次，总计166次，读书打卡第256天案例督导收获：【家有老大篇】被爱与高期待下的独舞家里的第一个孩子往往集万千宠爱于一身。爸爸妈妈、爷爷奶奶、姥姥姥爷的目光都聚焦在他的身上。在这种光环下长大的孩子，就如小皇帝一般，衣来伸手、饭来张口。拥有爱的同时，也意味着拥有了更高的被期待，父母会花血本给你报各种各样的早教班，给你买各
父母教育孩子的方式，将影响孩子一生树英教育
为什么有些孩子总是充满自信与快乐？独立、有主见又坚强？而有些孩子却自卑、胆怯，软弱又过度依赖父母？为什么有些孩子总是健康、阳光又富于创造力？而有些孩子却悲观、孤僻又思想空乏？一个孩子的行为取决于孩子的思想，思想取决于环境和自己的认知，认知取决于教育。父母是孩子人生中的第一位教育者，父母养育孩子的方式，将决定他们人生的高度，影响他们的一生。网络图，侵权即删优秀的父母就像园丁，既要浇水施肥，又要修剪杂
2024.9.6 Python，华为笔试题总结，字符串格式化，字符串操作，广度优先搜索解决公司组织绩效互评问题，无向图 RaidenQ python 华为 leetcode 算法力扣广度优先无向图
1.字符串格式化name="Alice"age=30formatted_string="Name:{},Age:{}".format(name,age)print(formatted_string)或者name="Alice"age=30formatted_string=f"Name:{name},Age:{age}"print(formatted_string)2.网络健康检查第一行有两个整数m
戴容容中原焦点团队.网络初级第33期,坚持分享第19天 2022年3月9日 TessDai
《每个人眼中的世界都是不同的》“一千个人眼里有一千个哈姆雷特”世界是多元的,每个人都有自己的道理,人人按照自己的理解去看待这个世界的人和物.我们如此,其他人也是如此.因此,任何事情,我们要放下自己以为的真理,去理解他人认为的真理,只有同频方能共振.孩子在慢慢长大的过程中慢慢学会独立,甚至对抗.尤其当孩子处于青春期的时候,他们开始有很多自己独立的想法,和一些特立独行的做法,家长常常会觉得不可思议,觉
第1步win10宿主机与虚拟机通过NAT共享上网互通学习3人组大数据大数据
VM的CentOS采用NAT共用宿主机网卡宿主机器无法连接到虚拟CentOS要实现宿主机与虚拟机通信，原理就是给宿主机的网卡配置一个与虚拟机网关相同网段的IP地址，实现可以互通。1、查看虚拟机的IP地址2、编辑虚拟机的虚拟网络的NAT和DHCP的配置，设置虚拟机的网卡选择NAT共享模式3、宿主机的IP配置，确保vnet8的IPV4属性与虚拟机在同一网段4、ping测试连通性[root@localh
网络通信流程记得开心一点啊服务器网络运维
目录♫IP地址♫子网掩码♫MAC地址♫相关设备♫ARP寻址♫网络通信流程♫IP地址我们已经知道IP地址由网络号+主机号组成，根据IP地址的不同可以有5钟划分网络号和主机号的方案：其中，各类地址的表示范围是：分类范围适用网络网络数量主机最大连接数A类0.0.0.0~127.255.255.255大型网络12616777214【(2^24)-2】B类128.0.0.0~191.255.255.255中
Java爬虫框架（一）--架构设计狼图腾-狼之传说 java 框架 java 任务 html解析器存储电子商务
一、架构图那里搜网络爬虫框架主要针对电子商务网站进行数据爬取，分析，存储，索引。爬虫：爬虫负责爬取，解析，处理电子商务网站的网页的内容数据库：存储商品信息索引：商品的全文搜索索引Task队列：需要爬取的网页列表Visited表：已经爬取过的网页列表爬虫监控平台：web平台可以启动，停止爬虫，管理爬虫，task队列，visited表。二、爬虫1.流程1)Scheduler启动爬虫器，TaskMast
计算机木马详细编写思路小熊同学哦 php 开发语言木马木马思路
导语：计算机木马（ComputerTrojan）是一种恶意软件，通过欺骗用户从而获取系统控制权限，给黑客打开系统后门的一种手段。虽然木马的存在给用户和系统带来严重的安全风险，但是了解它的工作原理与编写思路，对于我们提高防范意识、构建更健壮的网络安全体系具有重要意义。本篇博客将深入剖析计算机木马的详细编写思路，以及如何复杂化挑战，以期提高读者对计算机木马的认识和对抗能力。计算机木马的基本原理计算机木
Mongodb Error: queryTxt ETIMEOUT xxxx.wwwdz.mongodb.net 佛一脚 error react mongodb 数据库
背景每天都能遇到奇怪的问题，做个记录，以便有缘人能得到帮助！换了一台电脑开发nextjs程序。需要连接mongodb数据，对数据进行增删改查。上一台电脑好好的程序，新电脑死活连不上mongodb数据库。同一套代码，没任何修改，搞得我怀疑人生了，打开浏览器进入mongodb官网毫无问题，也能进入线上系统查看数据，网络应该是没问题。于是我尝试了一下手机热点，这次代码能正常跑起来，连接数据库了！！！是不
高考后该不该给孩子买电脑，什么情况能买？什么情况不能买？寻求改变
我知道家长们很担心，怕买了电脑小孩沉迷游戏，耽误了学业，也不利于身体健康。对于准大学生来说，基本上在18岁左右，也不算小了，但在很多父母眼里，依旧是个小孩子。数据显示，这种情况是有发生的，大学生约70%的电脑主要被用于玩网络游戏，如果没有养成一个用良好的习惯，对孩子影响是非常大的。我总结为三买，三不买。最近有看到群里很多家长再问，小孩上大学该不该给他买电脑，要买和不买两种观点的家长都有，那么哪种情
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ESP32-C3入门教程网络篇⑩——基于esp_https_ota和MQTT实现开机主动升级和被动触发升级的OTA功能小康师兄 ESP32-C3入门教程 https 服务器 esp32 OTA MQTT
文章目录一、前言二、软件流程三、部分源码四、运行演示一、前言本文基于VSCodeIDE进行编程、编译、下载、运行等操作基础入门章节请查阅：ESP32-C3入门教程基础篇①——基于VSCode构建HelloWorld教程目录大纲请查阅：ESP32-C3入门教程——导读ESP32-C3入门教程网络篇⑨——基于esp_https_ota实现史上最简单的ESP32OTA远程固件升级功能二、软件流程
中国广电永久9元流量套餐！性价比最高流量卡套餐介绍！优惠攻略官
中国广电是中国最大的传媒集团之一，其推出的流量套餐备受消费者青睐。中国广电最实惠的流量套餐不仅价格亲民，而且提供了优质的网络体验。首先，中国广电的流量套餐价格实惠，适合不同消费者的需求。无论是短期的日租卡还是长期有效的月租卡，用户都可以根据自己的实际情况选择适合自己的套餐。而且，流量的价格相对于其他运营商的套餐来说更加合理，给用户提供了更大的选择空间。☞大流量卡套餐「→点这免费申请办理」或者截图扫
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分