YYYMarshal

机器学习（Machine Learning）

简介

bili 吴恩达机器学习

这是一门让计算机在没有明确编程的情况下学习的科学。
亚瑟·塞缪尔(1959)：赋予计算机学习能力而不被明确编程的研究领域。

机器学习作为人工智能的一个子领域。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心，是使计算机具有智能的根本途径。

机器学习有下面几种定义：
（1）机器学习是一门人工智能的科学，该领域的主要研究对象是人工智能，特别是如何在经验学习中改善具体算法的性能。
（2）机器学习是对能通过经验自动改进的计算机算法的研究。
（3）机器学习是用数据或以往的经验，以此优化计算机程序的性能标准。

机器学习算法

机器学习算法：

监督学习
无监督学习

强化学习

监督学习 Supervised Learning

从输入到输出的标签
从被给予“正确答案”中学习

监督学习算法种类：

回归
- 回归试图预测无限多个可能的数字中的任何一个。
分类
- 分类是指只预测少量可能的输出或类别。

回归 Regression

试着从无限多个可能的数字中预测一个数字，例如例子中的房价。

分类 Classification

以乳腺癌检测为例，只有两种可能的输出或两种可能的类别，这就是为什么它被称为分类。

预测类别不一定是数字。

无监督学习 Unsupervised Learning

数据只包含输入x，而不包含输出标签y。
算法必须在数据中找到结构，模式或有趣的东西。

我们不想监督算法并为每一个输入给出引用的正确答案；相反，我们想让算法自己找到一些结构或模式或者只是在数据中找到一些有趣的东西。
无监督学习算法可以决定数据可以分配到两个不同的组或两个不同的集群。

无监督学习分类

聚类
- 将相似的数据点分组在一起。
异常检测
- 发现异常数据点（金融系统中的欺诈检测）
降维
- 使用更少的数字压缩数据，尽可能少的丢失信息

聚类 Clustering

聚类算法是一种无监督学习算法。获取没有标签的数据，并尝试将其自动分组到集群中。

线性回归模型 Linear Regression Model

线性回归模型意味着对你的数据拟合一条直线，这可能是当今世界上使用最广泛的学习算法。它是一种特殊类型的监督学习模型，它被称为回归模型，因为它预测数字作为输出。

在回归模型中，模型可以输出无限多的可能数字，但分类模型只有少量可能的产出，所以有一个可能输出的离散有限集。

例如：根据房子的大小来预测房子的价格。

术语

用来训练模型的数据集叫作训练集
输入变量也叫作特征或者输入特征
输出变量（目标变量、输出目标）

训练集、输入特征、输出目标 →→→ 学习算法 →→→ 功能函数

函数 f 称为模型。y是目标，是训练集中的实际真实值。y-hat 是对 y 的估计或预测，它可能是也可能不是实际的真实值。

线性函数只是直线的一个花哨术语，而不是曲线或抛物线等非线性函数。

线性回归，带有一个变量的线性回归，具有一个输入变量的线性模型又称单变量线性回归。

成本（代价）函数 Cost Function

模型：f_w,b (x) = wx +b
在机器学习中，w 和 b 被称为模型的参数，模型的参数是可以在训练中调整的变量，以改进模型，在此例中，以便直线更好地拟合训练数据。有时 w 和 b 也被称为系数或权重。

机器学习使用的成本函数实际上是 m 的两倍，额外的除以 2 是为了让我们以后的一些计算更整洁一点。

此例中的成本函数也称为平方误差成本函数，平方误差成本函数是线性回归中最常用的函数
为了衡量参数 w 和 b 的选择与训练数据的匹配程度（测量训练数据的对齐程度），所以使用代价函数J(w,b)

代价函数的直观理解

代价函数的作用是衡量模型的预测值与y的真实值之间的差异
线性回归的目标是找到参数 w （或参数 w 和 b），找到代价函数 J 的最小可能值

模型简化后的图像与代价函数图像的对比：
w = 1 ===> J(w) = 0

w = 0.5 ===> J(w) = 0.58

w = 0 ===> J(w) = 2.3

w = -0.5 ===> J(w) = 5.25

可视化代价函数

对下面这个尺寸预测房价的模型，忽略参数 b 的值，只考虑参数 w 得到的代价函数图像：

考虑参数 w 和 b 后得到的代价函数：

使用等高线图（右上角的图）来观察代价函数：

梯度下降 Gradient Descent

找到一个有效的算法，可以写在代码中自动查找参数 w 和 b 的值，它给你最适合的线，使成本函数最小化，梯度下降算法可以做到。
梯度下降在机器学习中无处不在，不仅用于线性回归，在人工智能中一些更大更复杂的模型也使用，比如训练一些最先进的神经网络模型，也被称为深度学习模型。
梯度下降是一种算法，可以用它来最小化任何函数，不仅仅是线性回归的成本函数。

一般先设置参数为0
然后逐步改变参数的值，来减少成本函数的值
直到我们达到或接近最小值（而且这个最低限度可能不止一个）

局部最小值

实现梯度下降

α：学习率（Learning Rate），学习率通常是0到1之间的一个数，比如0.1 0.2；这个变量控制下坡时的步幅，在这个例子中即是更行模型参数 w 和 b 时迈出的步子的大小。
∂J(w, b) / ∂w：成本函数的（偏）导数项，下坡时的方向

更新参数 w 和 b的值，然后不断重复这两个步骤，直到算法收敛，然后达到一个局部最小值。在这个最小值下，参数 w 和 b 不再随着采取的每一个额外步骤而变化很大。
通过同步更新以正确的方式实现它更自然，左下角的步骤是正确的，求 tmp_b 时带入的w的值是旧值，而不是 tmp_w 的值。

梯度下降的直观理解

从点 w 左侧，斜率为负数，所以从左向右移动，新的w的值会增加；相反的，点w 右侧的斜率为整数，所以从右向左移动，新的w的值会减少。

学习率 Learning Rate, α

如果学习率很小，那么梯度下降的速度会很慢，这会消耗很多的时间，因为在它接近最小值之前，它需要很多步骤，而且每一步的步幅都很小。
如果学习率过大，那么梯度下降可能会超过预期目标，可能永远都达不到最小（梯度下降可能无法收敛，甚至可能发散）。

梯度下降可以达到局部最小值

当接近局部最小值时，梯度下降将自动采取较小的步幅，因为当接近局部最小值时，导数会自动变小，这意味着更新步幅也会自动变小，即使学习率α保持在某个固定值。

线性回归中的梯度下降

用平方误差成本函数来表示带有梯度下降的线性回归模型，将会训练线性回归模型，使其与我们的训练集数据符合成一条直线。

两个偏导数对应的公式的推导过程：
$\frac{∂}{∂w} J(w, b) = \frac{∂}{∂w} \frac{1}{2m} \sum_{i=1}^m (f_{w, b}(x^{(i)}) - y^{(i)}) ^2 = \\ \frac{∂}{∂w} \frac{1}{2m} \sum_{i=1}^m (wx^{(i)} + b - y^{(i)}) ^2 = \\ \frac{1}{2m} \sum_{i=1}^m (wx^{(i)} + b - y^{(i)}) 2x^{(i)} = \\ \frac{1}{m} \sum_{i=1}^m (f_{w, b}(x^{(i)}) - y^{(i)}) x^{(i)}$

最终的梯度下降算法：

这个模型的成本函数有多个局部最小值，而且可以在不同的局部最小值结束运算。

但当使用线性回归模型的平方误差成本函数时，成本函数不会有多个局部最小值，只有一个单一的全局最小值。且此时的成本函数为凸函数。

运行梯度下降

间歇梯度下降
在梯度下降的每一个步骤上，我们所看到的是所有的训练示例，而仅仅是训练数据的子集。

多种特征 Multiple Features

多元线性回归

多类特征是指有多个特征值。以预测房价为例，在前面的线性回归模型，其中只有一个特征w, 它是房子的面积。但是我们在实际预测价格的时候，使用一个特征可能预测的并不会很准。所以现在不光是通过房屋面积来预测房价，并加入卧室数量、楼层数、房屋年龄这些特征（变量）来计算房价，这些都可以作为特征值。

$x_j : 第 j 列，即第 j 个特征 \\ n：特征的数量 \\ \vec{x}^{(i)} : 第 i 个训练样本，即第 i 行数据 \\ x^{(i)}_j : 第 i 个训练样本的第 j 个特征的值 \\$

带有多个特征的模型的定义：

$M o d e l :$
$Previously: f_{w, b}(x) = wx + b$
$f_{w, b}(x) = w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + b$

$example: f_{w,b}(x) = 0.1x_1 + 4x_2 + 10x_3 + (-2)x_4 + 80$
$x_1: size, x_2: bedrooms, x_3: floors, x_4: years, 80: base price$

$f_{w, b}(x) = w_1x_1 + w_2x_2 + ··· + w_nx_n + b$

具有多种改进特征的模型是多元（特征）线性回归：

向量化矢量化点积

向量化 Vectorization

Numpy：Python中的数值线性代数库

使用向量化计算的优点：

代码简洁
运行速度较快

np.dot(w, x) 函数是在计算机硬件上通过寻址实现的

★☆

多元线性回归的梯度下降法

特征放缩 Feature Scaling

当一个特征的可能范围很大时，一个好的模型更有可能学会选择一个相对较小的基准值；同样地，当一个特征的可能值很小时，那么它的参数的合理值就会比较大。

特征放缩的作用：
面对特征数量较多的时候，保证这些特征具有相近的尺度（无量纲化），可以使梯度下降法更快的收敛。

1. 最大值标准化

这个方法是直接除以最大值：
x1的放缩范围：300/2000 ~ 2000/2000，即 0.15 ~ 1
x2的放缩范围：0/5 ~ 5/5，即 0 ~ 1

2. 均值归一化 Mean Normalization

这个方法最后的得到的图像是以零为圆心。
步骤：

找到训练集上的平均值 μ（此例中，μ1 = 600 作为 x1 的平均值）
$x_1 = \frac{x_1 - \mu_1}{max - min}$ ，即 $x_1 min = \frac{300 - 600}{2000 - 300} = -0.18$ ， $x_1 max = \frac{2000 - 600}{2000 - 300} = 0.82$ ，得到 $\leq x_1 \leq 0.82$ ，此时，x1 已均值归一化。
找到训练集上的平均值 μ（此例中，μ2 = 2.3 作为 x2 的平均值）
$x_2 = \frac{x_2 - \mu_2}{max - min}$ ，即 $x_2min = \frac{0 - 2.3}{5 - 0} = -0.46$ ， $x_2max = \frac{5 - 2.3}{5 - 0} = 0.54$ ，得到 $\leq x_2 \leq 0.54$ ，此时，x2 已均值归一化。

3. Z分数归一化 Z-score normalization

使用这个方法，需要计算每个特征的标准差 σ，首先计算平均值和标准差。
步骤：

若 x1 的标准差为 σ1 = 450，平均值 μ1 = 600
$x_1 = \frac{x_1 - \mu_1}{\sigma_1}$ , $x_1min = \frac{300 - 600}{450} = 0.67, x_2max = \frac{2000 - 600}{450} = 3.1$ ，即 $\leq x_1 \leq 3.1$
若 x2 的标准差为 σ2 = 1.4，平均值 μ2 = 2.3
$x_2 = \frac{x_2 - \mu_2}{\sigma_2}$ , $x_2min = \frac{0 - 2.3}{1.4} = -1.6, x_2max = \frac{5 - 2.3}{1.4} = 1.9$ ，即 $\leq x_2 \leq 1.9$

下图中的中间上方图像是高斯分布（正态分布）的标准差。

检查梯度下降是否收敛

确保梯度下降正常工作

1. 创建一个学习曲线 Learning Curve，试图推测出何时可以停止自己的特定的训练模型

下面这张图可以帮助你看到你的成本函数在每次梯度下降迭代后的变化。
在每次迭代后，成本函数的值应该下降，若在某一次的迭代后成本函数的值增大了，这意味着学习率 α 选择得很差（通常是过大）或存在漏洞。

2. 自动收敛测试 Automatic convergence test

用 $\epsilon$ 来代表一个很小的数字，比如 0.001
如果在一次迭代中，成本函数的值下降的幅度小于 $\epsilon$ ，那么现在的曲线图像就很可能处于上图中的平坦部分，此时即可宣布收敛，收敛表明此时找到的参数向量w 和常数b 很接近成本函数的最小值
但通常情况下，选择正确的阈值 $\epsilon$ 是相当困难的，所以实际上倾向于使用上面的方法，而不是使用自动收敛检测

学习率的选择

在一个足够小的学习率的情况下，成本函数应该在每次迭代后都减小

如果学习率过小，则梯度下降需要花费很多次的迭代才能收敛
如果学习率过大，则迭代的时候可能超过最小值，导致成本上升

特征工程 Feature Engineering

通过改造或组合原有特征，利用直觉设计新特征。
Using intuition to design new features, by transforming or combining original features.

取决于对问题有什么见解，而不是仅仅取决于刚开始使用的特征，有时通过定义新特征，可能会得到一个更好的模型。
$f_{\vec{w}, b}(\vec{x}) = w_1 * x_1 + w_2 * x_2 + b \\ if: area = frontage * depth \\ set: x_3 = x_1 * x_2, (new feature: x_3)\\ f_{\vec{w},b}(\vec{x}) = w_1 * x_1 + w_2 * x_2 + w_3 * x_3 + b$

多项式回归 Polynomial Regression

利用多元线性回归和特征工程的思想，提出一种新的多项式回归算法，用来拟合曲线。

链接

研究一个因变量与一个或多个自变量间多项式的回归分析方法，称为多项式回归（Polynomial Regression）。
如果自变量只有一个时，称为一元多项式回归；如果自变量有多个时，称为多元多项式回归。
在一元回归分析中，如果变量y与自变量x的关系为非线性的，但是又找不到适当的函数曲线来拟合，则可以采用一元多项式回归。

分类 Classification

动机 Motivation

使用分类的原因
如果使用线性回归来预测肿瘤是否为恶性这种问题上，则会导致很明显的错误。

线性回归预测了一个数字；分类则只能接受少数几个可能的值中的一个，而不是无限范围内的数字。

这种只有两个可能输出的分类问题，称为二元分类（Binary Classification）。这里的二元指的是在这些问题中只有两个可能的类或两个可能的类别。

Question	Answer “y”
Is this email spam?	no yes
Is the transaction fraudulent?	no yes
Is the tumor malignant?	no yes

Answer “y” can only be one of two values, no or yes, false or true, 0 or 1

class = category

决策边界（Decision Boundary）
逻辑回归（Logistic Regression）：这个算法可以避免产生下图的效果，逻辑回归虽然是带有回归二字，但却是用来分类的。

逻辑回归 Logistic Regression

Sigmoid Function（Logistic Function）（乙状结肠函数，后勤函数，S型函数）
逻辑回归可以用来拟合相当复杂的数据。
输出的范围是：0 ~ 1
$\frac{1}{1 + e^{-z}}, 0 < g(z) < 1$

逻辑回归：
$f_{\vec{w},b}(\vec{x}) = g(\vec{w} · \vec{x} + b) = \frac{1}{1 + e^{-(\vec{w} · \vec{x} + b)}}$

决策边界 Decision Boundary

可以设置一个阈值，当预测的数值高于这个阈值时，可以判定为1，低于这个阈值时，可以判定为0。

例一：

例二：

例三：

逻辑回归的成本函数函数 Cost Function For Logistic Regression

成本函数用来衡量一组特定的参数与训练数据的匹配程度，从而提供了一种更好的方法来尝试选择更好的参数。
误差平方的成本函数不是逻辑回归的理想成本函数，平方误差成本函数是线性回归中最常用的函数。

单一训练子集的损失（L），并作为学习算法预测的函数：

逻辑回归的损失函数

当 $y^{(i)}$ 等于1时，损失函数会帮助算法做出更准确的预测，因为当它预测的值接近1时，损失是最低的。

当 $y^{(i)}$ 等于0时， $f_{\vec{w},b}(\vec{x^{(i)}})$ 越远离 $y^{(i)}$ ，损失越大。

总结，逻辑回归的损失函数的定义如下图所示，并且通过选择损失函数，总代价函数是凸的，因此可以可靠地使用极大的下降来获得全局最小值。

逻辑回归的简化版成本函数

就是将两个表达式合成一个，不管 $y^{(i)}$ 为1还是0，都会得到原来的表达式：

成本函数J 是整个训练集m个例子中的平均损失值。
这个特殊的成本函数是从统计学中推导出来的，它使用了最大似然估计的统计原理。

梯度下降实现 Gradient Descent Implementation

因为线性回归模型和逻辑回归模型的具体模型算法不一样，所以尽管在下图中写的代码看起来是一样的，但实际上是两种截然不同的算法。

过拟合的问题 The Proble Of Overfitting

过拟合时，尽管在训练中做得很好，但却不能很好的概括新的例子。

Regression example：
右侧的过拟合（高方差），左侧的欠拟合（高偏差），中间的刚刚好（泛化）。

Classification example：

解决过拟合 Addressing Overfitting

方案：

收集更多的训练数据（Collect more training examples, Collect more data）
选择要包含/排除的特性（Select features to include/exclude, Select features）
正规化（Regularization, Reduce size of parameters）
- 减少参数的大小，正规化是一种更温和地减少一些特征影响的方法。
- 正规化鼓励学习算法缩小参数的值，而不一定要求参数被设置为零。
- 正规化所做的是保持所有的特征，但只是防止某个特征产生过大的影响。

正则化代价函数 Cost Function With Regularization

正则化参数：λ（Regularization Parameter），λ > 0

正则化线性回归的成本函数：

两个极端情况下的正则化参数 λ：

若 λ = 0，即没有使用正则化项，则最终会过拟合。
若 λ = $10^{10}$ ，则使其最小化的唯一方法是让w的值非常接近于0，则 f(x) = b 会成立，会导致欠拟合。

正则化线性回归 Regularized Linear Regression

实现正则化线性回归的梯度下降

正则化逻辑回归 Regularized Logistic Regression

生命3.0时代，面对人工智能时代的到来，我们可以做些什么笃定的沙丁鱼
生命的定义生命的定义有很多，最为人所熟知的是在生物学上的定义，即生命是蛋白质存在的一种形式。但是，这种定义可能不太适用于未来的智能机器和外星文明，我们不能将我们对未来生命的思考局限在过去遇到过的物种，所以需要将生命定义得更广阔一些：生命是一个能保持自身复杂性并能进行复制的过程。复制的对象并不是由原子组成的物质，而是能阐明原子是如何排列的信息，这种信息由比特组成。换句话说：我们可以将生命看作一种自我
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
不正规不靠谱：假摩根士丹利内部群推荐绿色低碳减排平台骗局揭露!送一万体验资金做慈善全是假的! 易星辰分享普法
关于曝光网上摩根士丹利何晓斌宝丰能源节能减排在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”
车辆云端威胁情报共享系统的多维解析与发展路径百态老人大数据人工智能
第一部分：内容本质提取原始内容描述了一个闭环网络安全体系：“车辆实时上传异常行为日志至安全运营中心（VSOC），云端通过机器学习分析攻击模式并下发全局防御策略”。其核心架构包含：数据采集层：车辆端持续收集异常行为日志数据，包含CAN总线通信模式、网络流量特征及驾驶行为数据传输层：通过V2X通信协议和OTA更新通道实现车云双向通信分析层：安全运营中心(VSOC)采用CNN-BiSRU等深度学习模型进
假冒朱民！通达OA社科院朱民ST-balance项目就是假的，被骗亏损真相揭秘，亲身亏损经历正义青天
通达OA社科院朱民ST-balance项目不正规——杀猪盘不能提现投票骗局曝光！随着互联网的普及，数字经济蓬勃发展，各种线上平台如雨后春笋般涌现。然而，在这些看似繁荣的平台中，不乏一些黑平台，它们以欺诈手段骗取用户的财产，给人们的财产安全带来严重威胁！因此，我们有必要提高警惕，防范黑平台诈骗。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈
基于深度学习的语音识别：从音频信号到文本转录 Blossom.118 机器学习与人工智能深度学习语音识别音视频人工智能机器学习线性代数计算机视觉
前言语音识别（AutomaticSpeechRecognition,ASR）是人工智能领域中一个极具挑战性和应用前景的研究方向。它通过将语音信号转换为文本，为人们提供了更加自然和便捷的人机交互方式。近年来，深度学习技术在语音识别领域取得了显著进展，极大地提高了语音识别的准确率和鲁棒性。本文将详细介绍如何使用深度学习技术构建一个语音识别系统，从音频信号的预处理到模型的训练与部署。一、语音识别的基本概
过拟合、欠拟合及其解决方案；梯度消失、梯度爆炸；循环神经网络进阶 Ryan_sz1
1、过拟合、欠拟合及其解决方案过拟合、欠拟合机器学习或者训练深度神经网络的时候经常会出现欠拟合和过拟合这两个问题，但是，一开始我们的模型往往是欠拟合的，也正是因为如此才有了优化的空间，我们需要不断的调整算法来使得模型的表达能拿更强。但是优化到了一定程度就需要解决过拟合的问题了。也就是说欠拟合是模型表达能力不够，达不到很好的表达效果。而过拟合是在训练集的范围内表达能力过强，导致完全拟合了训练集。解决
数字人系统：AI界的超级巨星，你准备好了吗？优秘智能UMI 数字人人工智能深度学习计算机视觉机器学习自然语言处理语言模型图像处理
在这个日新月异的科技时代，每一个创新的火花都可能点燃一场变革的燎原之火。今天，我们要聊的，正是那颗在AI领域熠熠生辉的璀璨新星——优秘数字人系统。它不仅仅是技术的飞跃，更是对未来生活方式的深刻重塑，一场关于人机交互、智能共生的美好预演。技术原理：深度解析与智能构建的奥秘1.深度学习：智能的基石数字人系统的核心技术之一在于深度学习。深度学习是一种模仿人脑神经网络结构和功能的机器学习技术，通过构建多层
普通人想利用AI变现，这5个赛道不能错过！浮沉导师
随着人工智能技术的迅猛发展，越来越多的普通人开始关注如何利用AI实现变现。AI不仅改变了我们的工作方式，也创造了众多赚钱的机会。本文将介绍五个值得关注的AI赛道，帮助你抓住这些机会，实现收入增长。【高省】APP网购优惠券免费领，分享还能赚钱。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台。佣金更高，模式更好，终端用户不流失。0投资，稳定可靠，百度有几百万篇报道，期待你的加入。应用市场下载【高省
AI人工智能 Agent：金融投资中智能体的应用 AI天才研究院 AI大模型企业级应用开发实战 AI大模型应用入门实战与进阶 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能Agent：金融投资中智能体的应用1.背景介绍在金融投资领域，人工智能（AI）技术的应用已经成为一种趋势。随着数据量的爆炸性增长和计算能力的提升，AI技术在金融市场中的应用变得越来越广泛和深入。智能体（Agent）作为AI技术的重要组成部分，能够在金融投资中发挥重要作用。智能体可以通过学习和适应市场环境，自动执行交易策略，优化投资组合，甚至预测市场趋势。2.核心概念与联系2.1智能体（
对话谷歌前 CEO Eric Schmidt：数字超智能将在十年内到来，AI 将创造更多更高薪的工作 AI科技大本营人工智能
责编|王启隆出品|CSDN（ID：CSDNnews）投稿或寻求报道|[email protected]科技巨擘、谷歌前CEOEricSchmidt最近做客PeterDiamandis的Moonshots播客，与主持人PeterDiamandis及DaveLondon展开了一场关于人工智能未来的深度对话。全世界都在为AI的飞速发展感到兴奋又焦虑时，这位曾经执掌谷歌帝国长达十年、亲眼见证并推动了这场技术
聚焦基础研究突破，北电数智联合复旦大学等团队提出“AI安全”DDPA方法入选ICML CSDN资讯人工智能安全数据要素大数据
近日，由北电数智首席科学家窦德景教授牵头，联合复旦大学和美国奥本大学等科研团队共同研发，提出一种DDPA（DynamicDelayedPoisoningAttack）新型对抗性攻击方法，为机器学习领域的安全研究提供新视角与工具，相关论文已被国际机器学习大会（ICML2025）收录。ICML由国际机器学习学会（IMLS）主办，聚焦深度学习、强化学习、自然语言处理等机器学习前沿方向，是机器学习与人工智
格灵深瞳视觉算法面试30问全景精解机＿长算法面试职场和发展
格灵深瞳视觉算法面试30问全景精解——AI感知×智能安防×场景创新：格灵深瞳视觉算法面试核心考点全览前言格灵深瞳（GREATVISION）作为国内领先的人工智能与计算机视觉企业，专注于智慧安防、智能交通、智慧零售等领域，推动视觉算法在大规模城市级场景的落地。格灵深瞳视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在复杂场景下的创新能力与工程实践。本文精选30个高质量面试问题，涵盖基
商汤科技视觉算法面试30问全景精解
商汤科技视觉算法面试30问全景精解——AI赋能×智能视觉×产业创新：商汤科技视觉算法面试核心考点全览前言商汤科技（SenseTime）作为全球领先的人工智能平台公司，专注于计算机视觉、深度学习和智慧城市、智能汽车、智能医疗等领域，推动人脸识别、目标检测、视频分析、自动驾驶等前沿技术的产业化落地。商汤视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、自动驾驶、智慧医疗等复
旷视科技视觉算法面试30问全景精解机＿长科技算法面试深度学习 YOLO
旷视科技视觉算法面试30问全景精解——AI赋能×智能安防×视觉创新：旷视科技视觉算法面试核心考点全览前言旷视科技（Megvii）作为全球领先的人工智能公司，专注于计算机视觉、深度学习和智能安防等领域，推动人脸识别、目标检测、视频分析、工业视觉等前沿技术的产业化落地。旷视视觉算法岗位面试不仅考察候选人对视觉基础理论的扎实掌握，更关注其在大规模安防、工业检测、智慧城市等复杂场景下的创新与工程能力。本文
阿里云态势感知和安骑士有什么区别？阿腾云
阿里云态势感知和安骑士均是阿里云云盾安全产品，态势感知属于安全管理类的产品，安骑士数据服务器安全类产品，阿里云百科网来详细说下阿里云态势感知和安骑士之间的区别：态势感知和安骑士的区别简单来说，安骑士是检测云服务器漏洞的，态势感知提供安全类的大数据分析服务。态势感知：安全大数据分析平台，通过机器学习和结合全网威胁情报，发现传统防御软件无法覆盖的网络威胁，溯源攻击手段、并且提供可行动的解决方案。安骑士
今日播报！庆衍书院郭庆旺被骗黑幕曝光，KSD2.0光伏市场不能出金不要再次踏入！法律咨询维权
社交平台有这样一种群，群里都是“理财专家”“炒股大神”“操盘高手”，不仅每天免费授课、推荐牛股，还有助理“一对一”指导具体操作。针对网上素未谋面的牛散大咖，经济学家等推荐网上投资理财、数字经济，数字体育市场，人工智能项目，数字低碳，慈善投票网站买数字的等等都是骗局，广大市民对此要提高警惕，遇到此类情况一概不要相信。咨询顾问：182--71402640（电微同号）数字经济数字体育数字农业慈善投票大赛
大模型软件的多租户架构设计 AI天才研究院 AI人工智能与大数据 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型软件的多租户架构设计关键词：大模型软件、多租户架构、设计、性能优化、安全性摘要：随着大数据和人工智能技术的迅猛发展，大模型软件在各个领域得到了广泛应用。然而，如何在大模型软件中实现高效的多租户架构设计，成为当前技术领域的一个关键挑战。本文将深入探讨大模型软件的多租户架构设计，包括其背景、核心概念、算法原理、系统架构、项目实战以及最佳实践等，旨在为开发者提供一套系统化、全面化的设计指南。设计过
AI人才实在太抢手！顶级科学家年薪超7000万：中高级也能过千万程序员超超人工智能 transformer 深度学习 java spring boot ai 大模型
快科技7月2日消息，据媒体报道，激烈的人工智能人才争夺战，导致一些顶尖资深研究科学家的年薪超过1000万美元（约7167万元人民币）。而典型的薪资方案则处于300万至700万美元区间，相较于2022年，这一数字实现了约50%的增长。薪酬追踪网站Levels的统计数据显示，Meta给予AI工程师的薪酬范围为18.6万至320万美元，OpenAI则在21.2万至250万美元之间；若以薪酬中位数来衡量，
「日拱一码」035 机器学习——调参过程可视化胖达不服输「日拱一码」机器学习人工智能调参过程可视化神经网络 python 模型可解释性
目录超参数搜索的3D曲面可视化交互式3D可视化神经网络学习率的3D可视化SVM超参数的3D决策边界可视化超参数优化的3D动画超参数搜索的3D曲面可视化##超参数搜索的3D曲面可视化importnumpyasnpimportmatplotlib.pyplotaspltfrommpl_toolkits.mplot3dimportAxes3Dfromsklearn.datasetsimportmake_
边缘计算与量子模型优化驱动医疗诊断新突破
内容概要在医疗人工智能领域，边缘计算与量子模型优化的协同演进正重构诊断系统的技术范式。通过将计算节点前置至医疗设备端，边缘架构有效解决了传统云端模型面临的实时性瓶颈，配合量子优化算法对复杂特征空间的快速寻优能力，使得CT、MRI等高维影像数据的解析效率提升显著。值得关注的是，框架选型直接影响着模型部署的可行性——TensorFlow在移动端推理优化方面的工具链完备性，与PyTorch动态图机制对迭
量子生成对抗网络：量子计算与生成模型的融合革命牧之112 量子计算生成对抗网络人工智能
引言：当生成对抗网络遇上量子计算在人工智能与量子计算双重浪潮的交汇处，量子生成对抗网络（QuantumGenerativeAdversarialNetworks,QGAN）正成为突破经典算力瓶颈的关键技术。传统生成对抗网络（GAN）在图像生成、数据增强等领域已取得辉煌成就，但其参数规模与计算复杂度随着数据维度呈指数级增长。量子计算的叠加性、纠缠性和并行性，为解决这一矛盾提供了全新思路。2025年，
OpenAI模型可解释性工具：理解AI的黑箱 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络人工智能百度 ai
OpenAI模型可解释性工具：理解AI的黑箱关键词：OpenAI模型、可解释性工具、AI黑箱、模型理解、人工智能摘要：本文旨在深入探讨OpenAI模型可解释性工具，帮助大家理解AI这个“黑箱”。首先介绍了研究的背景、目的和预期读者，接着解释了核心概念，包括OpenAI模型、可解释性工具等，阐述了它们之间的关系。通过核心算法原理、数学模型和公式的讲解，让大家明白其内在机制。还给出了项目实战案例，包括
骗局套路：卧虎藏隆应天书府隆国强被骗无法提现！讲述背后事实！正义青天
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！近期作者接触到了很多投资者被所谓的“隆国强”（骗子假冒）在卧虎藏隆应天书府带单的案例。这些新平台打着
数据质量是机器学习项目的核心痛点，AI技术能提供智能化解决方案。 zzywxc787 python pandas numpy 人工智能自动化运维 AI编程
一、数据质量诊断系统（Python实现）importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.clusterimportKMeansfromsklearn.ensembleimportIsolationForestfromtensorflow.keras.modelsimportSequentialfromte
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解以山河作礼。 #机器学习算法机器学习算法回归
7.机器学习-十大算法之一拉索回归（Lasso）算法原理讲解一·摘要二·个人简介三·前言四·原理讲解五·算法流程六·代码实现6.1坐标下降法6.2最小角回归法七·第三方库实现7.1scikit-learn实现（坐标下降法）：7.2scikit-learn实现（最小角回归法）：一·摘要拉索回归（LassoRegression）是一种线性回归的正则化形式，它通过引入L1范数惩罚项来实现模型的稀疏性，从
机器学习算法之回归算法福葫芦机器学习回归算法
一、回归算法思维导图二、算法概念、原理、应用场景和实例代码1、线性回归1.1、概念‌‌线性回归算法是一种统计分析方法，用于确定两种或两种以上变量之间的定量关系。‌线性回归算法通过建立线性方程来预测因变量（y）和一个或多个自变量（x）之间的关系。其基本形式为y=wx+e，其中w是权重，x是自变量，e是误差项。1.2、算法原理线性回归算法的核心在于找到最佳的拟合直线，使得预测值与实际值之间的误差最小。
7篇1章7节：机器学习算法解读，与数值预测回归模型构建 MD分析用R探索医药数据科学机器学习算法回归 r语言数据挖掘
机器学习是当今数据分析和人工智能的核心工具之一，其算法广泛应用于分类、回归、排序和推荐等领域。本篇将详细讲解机器学习的四大经典算法类型，并以回归问题为例深入探讨数值预测的关键步骤，包括数据准备、线性回归模型构建、模型预测及误差评估，帮助读者更系统地理解和掌握机器学习的基础知识及实际应用。一、机器学习的算法在数据科学和人工智能的浪潮中，机器学习算法成为了解决各种数据问题的关键工具。机器学习主要处理四
假冒振我中华第六届内部操盘群毛振华不正规!未来低碳项目不能提现难友真实经历告诉你! 法律咨询维权
随着互联网的普及和金融科技的发展，越来越多的人开始使用线上平台进行投资、交易等活动。然而，一些不法分子也利用这些平台实施诈骗行为，给投资者带来了巨大的损失。本文将介绍一种常见的骗局——黑平台无法出金，以帮助大家提高警惕性，避免上当受骗。推荐网上投资理财、数字经济、数字体育、人工智能，数字农业慈善投票网站买数字的等等都是，广大市民对此要提高警惕，遇到此类情况一概不要相信。（注明：该文章出现名字为网上
ai绘画生成软件哪个好？几款好用的AI绘画软件分享! 呼酱小宝箱
随着人工智能技术的不断发展，越来越多的AI绘画生成软件被开发出来。这些软件利用深度学习技术，可以将普通照片或图像转化成具备艺术效果的画作。那么，ai绘画生成软件哪个好？首先，让我们来看一下几个常见的AI绘画生成软件，它们分别是：1、DeepDreamDeepDream是由Google开发的一款AI绘画生成软件。它通过卷积神经网络对输入的图片进行处理，从而生成出具有艺术风格的画作。DeepDream
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修

机器学习（Machine Learning）

简介

机器学习算法

监督学习 Supervised Learning

回归 Regression

分类 Classification

无监督学习 Unsupervised Learning

聚类 Clustering

线性回归模型 Linear Regression Model

术语

成本（代价）函数 Cost Function

代价函数的直观理解

可视化代价函数

梯度下降 Gradient Descent

实现梯度下降

梯度下降的直观理解

学习率 Learning Rate, α

线性回归中的梯度下降

运行梯度下降

多种特征 Multiple Features

多元线性回归

向量化 Vectorization

多元线性回归的梯度下降法

特征放缩 Feature Scaling

1. 最大值标准化

2. 均值归一化 Mean Normalization

3. Z分数归一化 Z-score normalization

检查梯度下降是否收敛

1. 创建一个 学习曲线 Learning Curve，试图推测出何时可以停止自己的特定的训练模型

2. 自动收敛测试 Automatic convergence test

学习率的选择

特征工程 Feature Engineering

多项式回归 Polynomial Regression

分类 Classification

动机 Motivation

逻辑回归 Logistic Regression

决策边界 Decision Boundary

逻辑回归的成本函数函数 Cost Function For Logistic Regression

逻辑回归的损失函数

逻辑回归的简化版成本函数

梯度下降实现 Gradient Descent Implementation

过拟合的问题 The Proble Of Overfitting

解决过拟合 Addressing Overfitting

正则化代价函数 Cost Function With Regularization

正则化线性回归 Regularized Linear Regression

正则化逻辑回归 Regularized Logistic Regression

你可能感兴趣的:(人工智能,人工智能,机器学习)

1. 创建一个学习曲线 Learning Curve，试图推测出何时可以停止自己的特定的训练模型