csshuke

机器学习物语(3)：回归问题

上一次讲到 Empirical Risk Minimization (ERM) 算法在有限个函数的空间里学习是可行的，然而这样的结果似乎用处不大，因为许多机器学习中用到的函数空间都是无限的。我们还提到，为了解决这个问题，需要一个“将无限化为有限”的工具。如果是对统计学习理论有一定了解的同学，可能会觉得我应该马上要讲 VC Dimension 了：如果 F 的 VC 维是有限的，那么即使它本身的元素个数是无限的，我们仍然可以得到合理的 bound 。任何谈到学习理论的文章不提 VC 维都会显得很过分，不过今天我们还暂时不讲这个。回到“无限到有限”的话题，我在这里也曾写过关于拓扑空间的紧性的文章，实际上，Compactness 才是我们这次要用到的工具。回忆一下，紧集的任一开覆盖存在一有限子覆盖，正是把“无限”变成了“有限”。

在进入正题之前，我们先来简单看一下机器学习中的两大问题：分类和回归。分类问题对应于离散的（有限的） Y ，例如，二分类问题中， Y={0,1} （也有用 Y={−1,+1} 的，不过这只是形式上的不同而已）；再比如在手写数字识别（分类）问题中， Y={0,1,…,9} 。而回归问题则对应连续的 Y ，最常见的情况是 Y=R 。分类问题关心的是类别是否匹配，代表每个类别的数字只是一个符号而已，可以换成任意其他符号，并且这些符号之间一般没有什么关系，例如，原本是数字 8 ，把它分类成 7 或者 2 都同样是错误的，并不会因为 7 （从数值上）更接近 8 就是一个更好的结果——在这种情况下，0-1 loss 是最自然的损失函数。而回归问题则不一样，比如，今天的气温是 28 度，预测为 25 度很自然地比预测为 2 度要好。说白了就是分类问题中 Y 是离散的，用了离散度量来衡量相似度，而回归问题中则用了 R 上的欧氏度量。

当然虽然归纳成这个样子，但是两者的差别还是很大的，包括分析方法、优化方法之类的，因为离散问题通常都特别难处理，涉及到组合优化的问题，动不动就变成 NP-hard 了，而连续情况的分析则可以借用数学分析以及相关的一堆工具，在某些情况下要显得容易得多。而且即使在分类的情况下，目前的理论研究大部分也都集中在二分类这个最简单的特例上，一方面因为这是最基本和最简单的情况，便于分析；另一方面，多类问题通常都可以转化为二类问题。例如，最简单的转化方法是所谓的 one-vs-all classification ，假设 binary classifier 除了能够给出属于两类中的哪一类，还能给出属于那一类的概率或者置信度（不一定要是一个合法的概率值，只要是一个可以比较大小的分数即可）的话，那么对于 K 类问题，分别训练 K 个 binary classifier ，其中第 k 个 classifier 被训练为区分“是第 k 类”和“不是第 k 类”（也就是“是第 k 类以外的任一类”）两种情况。实际分类的时候同时运行 K 个分类器，最后结果按属于哪一类的置信度最大来决定。

不过就我目前的了解来看，对于这样方法的合理性似乎研究得比较少，而直接从多类分类角度入手来设计模型的似乎就更少了，不过似乎也正在收到越来越多的关注。Logistic 回归分类器是可以自然地处理多类问题的，最近好像也有看到针对 Multiclass Boosting 的相关工作。从实验方面来说，Fei-fei Li 在 ECCV 2010 的一篇 What does classifying more than 10,000 image categories tell us? 就观察到了一些比较有趣的现象。在 Vision 问题中的分类问题似乎类别数目可以达到非常非常多，那些在较少的类别数的情况下表现很好的算法，到了这种时候就不一定还能胜出了。这里面是否有什么深刻的道理呢？在多类或者非常多类的情况下，我们是否需要从头重新考虑分类模型呢？

似乎越扯越远了，其实本文要探讨的问题是回归问题，因为想要利用紧性来处理无限的情况，希望借助分析上的一些工具，于是我们暂时转为处理连续的情况。顺便也把回归问题的模型以及相关的概念正式 formulate 一下。

考虑 Y=R 的情况，并使用平方误差 loss function

ℓ f (x, y) = (f (x) - y) 2

在处理回归问题的时候，我们习惯把风险 (Risk) 叫做误差 (Error) ，因此，一个 regressor f 的误差定义为

E (f) = E [(f (X) - Y) 2] = \int X \times Y (f (x) - y) 2 d P (x, y)

类似地，可以定义回归函数

η (x) = E [Y | X = x] = \int Y y d P (y | x)

可以理解为随机变量 X 取 x 的时候，随机变量 Y 的平均值。在二分类问题中，我们用回归函数定义了贝叶斯分类器并证明了该分类器是最优的。类似地，我们在这里可以证明回归函数 η(x) 本身就是最优的 regressor 。

首先，根据 Fubini 定理，我们可以将重积分拆开成累次积分（当然，假定可积性首先是满足的，否则分析 Error 就没有意义了）：

E (f) = \int X \times Y (f (x) - y) 2 d P (x, y) = \int X (\int Y (f (x) - y) 2 d P (y | x)) d P (x)

于是

E (f) = \int X (\int Y (f (x) - η (x) + η (x) - y) 2 d P (y | x)) d P (x) = \int X (\int Y (f (x) - η (x)) 2 + 2 (f (x) - η (x)) (η (x) - y) + (η (x) - y) 2 d P (y | x)) d P (x) = \int X (f (x) - η (x)) 2 d P (x) + \int X (\int Y (η (x) - y) 2 d P (y | x)) d P (x) ≜ \int X (f (x) - η (x)) 2 d P (x) + σ 2 P

其中红色的项与 f 无关，而只和数据本身的分布 P 有关，记为 σ2P ，由于两项都是非负的，所以很容易就得到我们的结论：当 f(x) 和 η(x) 几乎处处相等的时候，第一项积分等于零，此时误差取到最小值，类似地，也称为贝叶斯误差。可以看到，贝叶斯误差其实就是 σ2P ，它衡量了问题本身的难易程度，即使最好的情况也无法达到比它还小的误差。而当 f(x) 和 η(x) 在某个非零测集上不相等时，第一项积分就大于零了，此时 E(f) 将大于贝叶斯误差。这就证明了 η(x) 的最优性。

同样的，我们考虑在一个特定的函数空间中的 ERM 问题。由于我们在一开始提到了，要利用 compactness ，很自然地我们考虑由 X 到 Y=R 的连续函数构成的 Banach 空间 C(X) 的一个紧子集 H 。特别地，我们使用无穷范数（上确界范数）

∥ f ∥ \infty = sup x \in X | f (x) |

注意这里选择无穷范数是必要的，在后面的证明中的一步需要这个条件，以下我们直接用简单的符号 ∥⋅∥ 表示。而 H 的紧性自然是本文的重点——它保证了我们的 ERM 算法能够成功。另外，它还有一些额外的好处，比如保证 H 中存在（至少）一个最优的 regressor fH ，亦即

f H = argmin f \in H E (f)

注意之前在讨论分类问题的时候我们为了简单起见就直接假设了函数空间 F 上的最优分类器 fF 的存在性。类似的，对于任意 f∈H ，其误差可以分解为两个部分

E (f) = E (f) - E (f H) + E (f H)

红色的项叫做 estimation error ，蓝色的项叫做 approximation error 。我们的目的是去估计 ERM 学习出来的函数 fn 的 estimation error ：

E (f n) - E (f H) = E (f n) - E n (f n) + E n (f n) - E (f H) \leq E (f n) - E n (f n) + E n (f H) - E (f H) \leq 2 sup f \in H | E (f) - E n (f) |

问题再一次转化为了 H 上的一致收敛问题，到此为止基本上都是前面的复习，用回归的语言重新复述了一下。接下来终于要开始新的东西了。首先我们要证明 E(f) 和 En(f) 在 H 上是 Lipschitz 连续的。

命题 1：若 |fi(x)−y|≤M 对于 i 等于 1 和 2 都成立，则

| E (f 1) - E (f 2) | | E n (f 1) - E n (f 2) | \leq 2 M ∥ f 1 - f 2 ∥ \leq 2 M ∥ f 1 - f 2 ∥

证明：由前面的推导得

| E (f 1) - E (f 2) | = ∣ ∣ ∣ \int X (f 1 (x) - η (x)) 2 - (f 2 (x) - η (x)) 2 d P (x) ∣ ∣ ∣ = ∣ ∣ ∣ \int X (f 1 (x) - f 2 (x)) (f 1 (x) + f 2 (x) - 2 η (x)) d P (x) ∣ ∣ ∣ \leq \int X | (f 1 (x) - f 2 (x)) | | (f 1 (x) + f 2 (x) - 2 η (x)) | d P (x) \leq ∥ f 1 - f 2 ∥ \int X (| f 1 (x) - η (x) | + | f 2 (x) - η (x) |) d P (x) \leq 2 M ∥ f 1 - f 2 ∥

类似的，对于 En ，我们有

| E n (f 1) - E n (f 2) | = ∣ ∣ ∣ 1 n \sum i = 1 n (f 1 (x i) - y i) 2 - (f 2 (x i) - y i) 2 ∣ ∣ ∣ = ∣ ∣ ∣ 1 n \sum i = 1 n (f 1 (x i) - f 2 (x i)) (f 1 (x i) + f 2 (x i) - 2 y i) ∣ ∣ ∣ \leq 1 n \sum i = 1 n | (f 1 (x i) - f 2 (x i)) | | (f 1 (x i) + f 2 (x i) - 2 y i) | \leq ∥ f 1 - f 2 ∥ 1 n \sum i = 1 n (| f 1 (x i) - y i | + | f 2 (x i) - y i |) \leq 2 M ∥ f 1 - f 2 ∥

注意到对于 En 的证明中，我们需要上确界范数。

有以上这个命题，立即可以得到，在该命题的条件下

| (E (f 1) - E n (f 1)) - (E (f 2) - E n (f 2)) | \leq | E (f 1) - E (f 2) | + | E n (f 1) - E n (f 2) | \leq 4 M ∥ f 1 - f 2 ∥

可以看到这里的连续性严重依赖于 |f(x)−y| 的有界性，也就是我们选择的平方损失函数的有界性。不过通不像分类问题中的 0-1 loss 那样天然地有界，这里我们还需要一些条件才能保证。比如，我们可以假定回归函数 η(x) 是有界的，然后再假定 X 是紧集。这基本都是还算合理的假设了，例如，通常的 vector space model 里， X 是个线性空间的话，只要假定所有可能的输入数据是限制在一个有界的范围内就可以了。以下如果没有特别指出，总假定 |f(x)−y|≤M ，特别是在出现常数 M 的情况下，总是指该上界。

为了方便起见，我们记 E(f)≜E(f)−En(f) ，我们的目的是要限定 supf∈H|E(f)| 。根据上一次讲过的 Hoeffding 不等式，我们知道，对于固定的 f0 ，有

P (∣ ∣ E (f 0) ∣ ∣ > ϵ) \leq 2 exp (- n ϵ 2 2 M 2)

再由刚刚证明过的 E(f) 的连续性，知道在 f0 的一个小领域内，我们也可以保证 E(f) 的值不会偏差太大。特别地，取 H 中以 f0 为圆心， r 为半径的一个开球 B(f0;r) ，则显然 ∀f∈B(f0;r) 都有 ∥f−f0∥≤r ，因此

| E (f) - E (f 0) | \leq 4 M ∥ f - f 0 ∥ = 4 M r

由绝对值的性质，知

| E (f) | \leq 4 M r + | E (f 0) |

由于右边和 f 无关，取上确界，我们又得到

sup f \in B (f 0; r) | E (f) | \leq 4 M r + | E (f 0) |

可以看到，如果半径 r 足够小，我们就可以把 sup|E(f)| 限定在和 E(f0) 相差不大的范围内，为了得到事件 {sup|E(f)|>ϵ} 的概率，我们注意到

{sup f \in B (f 0; r) | E (f) | > ϵ} \subset {4 M r + | E (f 0) | > ϵ} = {| E (f 0) | > ϵ - 4 M r}

而后者的概率是我们可以控制的，特别地，如果我们取 r=ϵ/8M ，则根据刚才的 Hoeffding 不等式：

P (sup f \in B (f 0; ϵ / 8 M) | E (f) | > ϵ) \leq P (| E (f 0) | > ϵ 2) \leq 2 exp (- n ϵ 2 8 M 2)

这样一来，我们就把以 f0 为圆心， ϵ/8M 为半径的范围全部控制住了，接下来推广到整个紧集 H 上就成了顺理成章的事。首先注意到开球族

{B (f; ϵ 8 M) : f \in H}

显然可以覆盖 H ，由 H 的紧性知，存在有限个开球仍然覆盖 H ，不妨记为

B (f 1; ϵ / 8 M), \dots, B (f N; ϵ / 8 M)

则我们有

P (sup f \in H | E (f) | > ϵ) \leq \sum i = 1 N P (sup f \in B (f i; ϵ / 8 M) | E (f) | > ϵ) \leq 2 N exp (- n ϵ 2 8 M 2)

于是我们完成了在紧集 H 上一致收敛的界定。这里我们可以定义一个度量空间 S 的 Covering Number N(S,r) 为最小的 l ，使得存在 l 个半径为 r 的开球将其覆盖住。显然，紧集的 Covering Number 是有限的，从上面的结论知道，Covering Number 有限的时候，ERM 算法是可行的。

紧性看起来似乎是很严格的要求，其实许多有用的函数空间都满足的，比如 Rm 上的线性函数（把系数向量的模限制在 1 以内）。更多的例子，以及如何估计具体的函数空间的 Covering Number 的例子，可以参见 Felipe Cucker 和 Steve Smale 的论文 On the Mathematical Foundations of Learning 。本文的主要内容也是摘要整理自这篇论文。话说这俩人都是数学系的，Smale 更是拿了菲尔兹奖和沃尔夫奖。

封面人物：漫画《七龙珠》中的人造人 17 号、16 号和 18 号。这些人造人是红领巾军为了打败孙悟空，在历年的天下第一武术大会以及其他重要的战斗中通过间谍机器人搜集孙悟空等人的战斗数据，最终制造出来的战斗型机器人。不知道他们在制造人造人的时候是不是用了机器学习的方法来训练其战斗技能 :P ，不过这些人造人的性能实际上是非常优良的，不仅对搜集过数据的战斗中的招数拟合得很好，而且对于未出现过的对手（例如超级赛亚人），也能从容应付。

考虑 Y=R 的情况，并使用平方误差 loss function

ℓ f (x, y) = (f (x) - y) 2

在处理回归问题的时候，我们习惯把风险 (Risk) 叫做误差 (Error) ，因此，一个 regressor f 的误差定义为

E (f) = E [(f (X) - Y) 2] = \int X \times Y (f (x) - y) 2 d P (x, y)

类似地，可以定义回归函数

η (x) = E [Y | X = x] = \int Y y d P (y | x)

首先，根据 Fubini 定理，我们可以将重积分拆开成累次积分（当然，假定可积性首先是满足的，否则分析 Error 就没有意义了）：

E (f) = \int X \times Y (f (x) - y) 2 d P (x, y) = \int X (\int Y (f (x) - y) 2 d P (y | x)) d P (x)

于是

E (f) = \int X (\int Y (f (x) - η (x) + η (x) - y) 2 d P (y | x)) d P (x) = \int X (\int Y (f (x) - η (x)) 2 + 2 (f (x) - η (x)) (η (x) - y) + (η (x) - y) 2 d P (y | x)) d P (x) = \int X (f (x) - η (x)) 2 d P (x) + \int X (\int Y (η (x) - y) 2 d P (y | x)) d P (x) ≜ \int X (f (x) - η (x)) 2 d P (x) + σ 2 P

∥ f ∥ \infty = sup x \in X | f (x) |

f H = argmin f \in H E (f)

E (f) = E (f) - E (f H) + E (f H

【人工智能 | 大数据】基于人工智能的大数据分析方法用心去追梦人工智能大数据数据分析
基于人工智能（AI）的大数据分析方法是指利用机器学习、深度学习和其他AI技术来分析和处理大规模数据集。这些方法能够自动识别模式、提取有用信息，并做出预测或决策，从而帮助企业和组织更好地理解市场趋势、客户行为以及其他关键因素。以下是几种主要的基于AI的大数据分析方法：机器学习模型：通过训练算法让计算机从历史数据中学习并做出预测或分类。常见的机器学习技术包括监督学习（如回归分析、支持向量机）、非监督学
基于MATLAB机器学习、深度学习实践技术应用梦想的初衷~ 机器学习人工智能 matlab 机器学习深度学习
近年来，MATLAB在机器学习和深度学习领域的发展取得了显著成就。其强大的计算能力和灵活的编程环境使其成为科研人员和工程师的首选工具。在无人驾驶汽车、医学影像智能诊疗、ImageNet竞赛等热门领域，MATLAB提供了丰富的算法库和工具箱，极大地推动了人工智能技术的应用和创新。原文链接https://mp.weixin.qq.com/s?__biz=Mzg2NDYxNjMyNA==&mid=224
降维算法：主成分分析一个人在码代码的章鱼数学建模机器学习概率论
主成分分析一种常用的数据分析技术，主要用于数据降维，在众多领域如统计学、机器学习、信号处理等都有广泛应用。主成分分析是一种通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量（即主成分）的方法。这些主成分按照方差从大到小排列，方差越大，包含的原始数据信息越多。通常会选取前几个方差较大的主成分，以达到在尽量保留原始数据信息的前提下降低数据维度的目的。它通过将多个指标转换为少数几个主成分,
Python从0到100（八十三）：神经网络-使用残差网络RESNET识别手写数字是Dream呀 python 神经网络网络
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
【人工智能】Python实战：构建高效的多任务学习模型蒙娜丽宁 Python杂谈 AI 人工智能 python 学习
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界多任务学习（Multi-taskLearning,MTL）作为机器学习领域中的一种重要方法，通过在单一模型中同时学习多个相关任务，不仅能够提高模型的泛化能力，还能有效利用任务间的共享信息。本文深入探讨了多任务学习的基本概念、优势及其在实际应用中的重要性。
基于 Python 的机器学习模型部署到 Flask Web 应用：从训练到部署的完整指南 m0_74825223 python 机器学习 flask
目录引言技术栈步骤一：数据预处理步骤二：训练机器学习模型步骤三：创建FlaskWeb应用步骤四：测试Web应用步骤五：模型的保存与加载保存模型加载模型并在Flask中使用步骤六：Web应用的安全性考量示例：简单的输入验证示例：自定义错误处理示例：使用Flask-JWT-Extended进行认证结论参考资料引言在当今数据驱动的时代，机器学习模型已经广泛应用于各行各业，从金融、医疗到教育等领域。然而，
机器学习：scikit-learn 和 Jupyter Notebook（推荐初学者使用google colab） wyc9999ww 机器学习 scikit-learn jupyter 人工智能 python
对于初学者来说，scikit-learn是一个理想的机器学习入门工具。不仅提供了丰富的算法和功能，还通过一致的API设计，确保能够快速上手并进行各种机器学习任务。通过使用scikit-learn，可以专注于理解和实践机器学习的核心概念，而不必过多担心底层实现细节。所以scikit-learn能轻松实现从数据预处理到模型训练和评估的完整流程。此外在推荐一个适合初学者的深度学习平台工具googleco
有趣的python代码实例_Python之路：200个Python有趣的小例子一网打尽 weixin_39845406 有趣的python代码实例
概述博主最近在学习python，看完了一整套学习视频，然后呃呃呃，还是用不太流畅。碰巧在全球最大的同性交友论坛GayHub(呸！是开源代码托管平台Github)上面发现了一个项目，该项目列举了200多个Python小例子，Python基础、Python坑点、Python字符串和正则、Python绘图、Python日期和文件、Web开发、数据科学、机器学习、深度学习、TensorFlow、Pytor
机器学习数学基础-定积分应用-经济问题华东算法王（原聪明的小孩子小孩哥解析宋浩微积分算法
定积分在经济学中的应用广泛，特别是用来解决与累积量、平均值、总收入、成本、利润等相关的问题。以下是定积分在经济学中的几个常见应用场景：1.总收入和总成本的计算在经济学中，定积分常用于计算总收入、总成本等累积量。如果给定价格函数和需求函数或供应函数，定积分可以帮助我们计算从某一数量到另一数量之间的总收入或总成本。总收入：假设某商品的价格随数量的变化而变化，价格函数为(p(x))，其中(x)表示销售的
迁移学习与RBF神经网络 fanxbl957 人工智能理论与实践迁移学习神经网络人工智能
迁移学习与RBF神经网络一、引言在机器学习和深度学习领域，迁移学习和神经网络都是备受关注的重要技术。迁移学习旨在将从一个或多个源任务中学习到的知识应用到目标任务中，以加快目标任务的学习过程，提高学习效果，尤其在数据稀缺或训练资源有限的情况下展现出显著优势。而RBF（径向基函数）神经网络作为一种经典的神经网络结构，以其独特的函数逼近能力和良好的局部逼近特性，在众多领域取得了出色的性能表现。将迁移学习
用大数据“喂养”出来的AI模型ChatGPT 爆火是大数据、大算力、强算法的支撑，中国缺乏的什么？ Ai17316391579 深度学习服务器人工智能
先来了解一下ChatGPT的基本情况ChatGPT本质属于生成式人工智能，属于无监督或半监督的机器学习。与之相关的还有Discriminativemodeling区分式模型，区分式模型大多属于监督式学习。生成性人工智能目前有两种主要的框架：GAN（GenerativeAdversarialNetwork）和GPT（GenerativePre-trainedTransformer）。GAN目前广泛应
AIGC视频生成国产之光：ByteDance的PixelDance模型好评笔记 AIGC-视频补档 AIGC 计算机视觉人工智能深度学习机器学习论文阅读面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
Python气象数据分析：风速预报订正、台风预报数据智能订正、机器学习预测风电场的风功率、浅水模型、预测ENSO等小艳加油大气科学 python 人工智能气象机器学习
目录专题一Python和科学计算基础专题二机器学习和深度学习基础理论和实操专题三气象领域中的机器学习应用实例专题四气象领域中的深度学习应用实例更多应用Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Py
YOLOv8/YOLOv11使用web界面推理自己的模型，Gradio框架快速搭建挂科边缘 YOLOv8改进 YOLO 前端计算机视觉目标检测人工智能 python
前言Gradio是一个开源Python库，用于快速构建和共享机器学习模型的Web界面。开发者可以通过简单的Python代码将机器学习模型封装成交互式应用，无需复杂的设置即可在浏览器中使用自己训练好模型。接下来教你使用Gradio框架构建一个简单Web界面推理YOLOv8/YOLOv11模型。话不多说上检测结果：一、YOLOv8/YOLOv11源码下载YOLOv8源码下载：官网打不开的话，从我的网盘
深度学习笔记——模型部署好评笔记深度学习笔记深度学习笔记人工智能 transformer 模型部署大模型部署大模型
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要概括模型部署的知识点，包括步骤和部署方式。文章目录模型部署模型部署的关键步骤常见的模型部署方式优势与挑战总结边缘端部署方案总结历史文章机器学习深度学习模型部署模型部署是指将训练好的机器学习或深度学习模型集成到生产环境中，使其能够在实际应用中处理实时数据和提供预测服务。模型部署的流程涉及模型的封装、部署环境的选择、部
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点岑童嵘
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点【下载地址】泰坦尼克号生存分类数据集本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件：训练集和测试集。数据集主要用于训练和评估机器学习模型，以预测泰坦尼克号乘客的生存情况项目地址:https://gitcode.com/open-source-toolkit/35561项目介绍泰坦尼克号生存分类数
基于Python机器学习、深度学习技术提升气象、海洋、水文领域实践应用 KY_chenzhao python 机器学习深度学习气象
1.背景与目标ENSO（ElNiño-SouthernOscillation）是全球气候系统中最显著的年际变率现象之一，对全球气候、农业、渔业等有着深远的影响。准确预测ENSO事件的发生和发展对于减灾防灾具有重要意义。近年来，深度学习技术在气象领域得到了广泛应用，其中长短期记忆网络（LSTM）因其在处理时间序列数据方面的优势，被广泛用于ENSO预测。2.数据准备数据来源包括NOAA（美国国家海洋和
R语言的软件工程 BinaryBardC 包罗万象 golang 开发语言后端
R语言的软件工程1.引言随着数据科学的快速发展，R语言作为一种统计计算和图形绘制的编程语言，其在数据分析、可视化以及机器学习等领域的应用日益广泛。尽管R语言在数据处理上有其独特的优势，但要将其运用于大型项目和商业应用中，就需要遵循软件工程的原则。本篇文章将探讨R语言在软件工程中的应用，主要涵盖软件开发生命周期、代码规范、版本控制、测试和文档等方面。2.软件开发生命周期软件开发生命周期（SDLC）是
Python中的Pipeline快速教学、 Coding Is Fun python 开发语言
在Python中，Pipeline通常指的是机器学习工作流中的流水线，尤其是在使用scikit-learn库时。Pipeline允许你将多个数据处理步骤和模型训练步骤串联起来，形成一个有序的工作流程。这不仅使代码更简洁，还能确保在训练和预测时一致的数据处理。以下是一个快速教学，帮助你掌握Python中Pipeline的核心概念和使用方法。目录安装和导入必要的库Pipeline的基本概念创建一个简单
大模型介绍詹姆斯爱研究Java spring
大模型（LargeModel）指的是拥有庞大参数量的机器学习模型。由于具有更多的参数，大模型能够更好地拟合复杂的数据和模式，从而提供更准确的预测和更好的性能。大模型的参数量通常远远超过常规模型，可以达到数百万甚至数十亿个参数。这些参数通常通过深度神经网络（DeepNeuralNetwork）来表示，包括多个隐藏层和大量的神经元。大模型的训练需要大量的计算资源和数据。通常，它们需要在多个GPU或TP
Python从0到100（七十三）：Python OpenCV-OpenCV实现手势虚拟拖拽是Dream呀 python opencv 开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
K-means聚类：解锁数据隐藏结构的钥匙陈辰学长 kmeans 聚类机器学习
K-means聚类：解锁数据隐藏结构的钥匙在机器学习的广阔领域中，无监督学习以其独特的魅力吸引了众多研究者和实践者。其中，K-means聚类作为一种经典且实用的无监督学习算法，以其简单高效的特点，广泛应用于市场细分、图像分割和基因聚类等领域。本文将深入探讨K-means聚类的工作原理、应用实例及其在这些领域中的具体应用，旨在揭示其如何智能划分数据，解锁隐藏结构，为相关领域提供精准导航。一、K-me
与机器学习的邂逅--自适应神经网络结构的深度解析想成为高手499 机器学习与人工智能机器学习神经网络人工智能
引言随着人工智能的发展，神经网络已成为许多应用领域的重要工具。自适应神经网络（AdaptiveNeuralNetworks，ANN）因其出色的学习能力和灵活性，逐渐成为研究的热点。本文将详细探讨自适应神经网络的基本概念、工作原理、关键技术、C++实现示例及其应用案例，最后展望未来的发展趋势。自适应神经网络的基本概念什么是自适应神经网络？自适应神经网络是一种能够根据输入数据的变化和环境的动态特性自动
PostgreSQL - pgvector 插件构建向量数据库并进行相似度查询花千树-010 RAG 数据库 postgresql AI编程
在现代的机器学习和人工智能应用中，向量相似度检索是一个非常重要的技术，尤其是在文本、图像或其他类型的嵌入向量的操作中。本文将介绍如何在PostgreSQL中安装pgvector插件，用于存储和检索向量数据，并展示如何通过Python脚本向数据库插入向量并执行相似度查询。一、安装PostgreSQL并配置pgvector插件1.安装PostgreSQL首先，确保你已经安装了PostgreSQL。可以
未来教育：AI知识库如何重塑学习体验知识管理知识库知识库软件
在科技日新月异的今天，教育领域正经历着前所未有的变革。人工智能（AI）技术的快速发展，特别是AI知识库的广泛应用，正在重塑我们的学习体验，使之变得更加高效、个性化和智能化。本文将深入探讨AI知识库如何影响未来教育，以及它如何为学习者提供前所未有的学习体验。一、AI知识库：教育领域的智能助手AI知识库，作为结合了人工智能技术的知识管理系统，不仅能够存储和处理海量信息，还能通过自然语言处理、机器学习等
【TVM 教程】内联及数学函数
ApacheTVM是一个端到端的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者：TianqiChen尽管TVM支持基本的算术运算，但很多时候，也需要复杂的内置函数，例如exp取指函数。这些函数是依赖target系统的，并且在不同target平台中可能具有不同的名称。本教程会学习到如何调用这些target-spe
mindspore编译报错小乐快乐深度学习神经网络
1、重新创建个工程后无法正常运行，2、使用代码为：华为提供的机器学习监督学习中的代码[quote][size=2][url=forum.php?mod=redirect&goto=findpost&pid=1364937&ptid=165780][color=#999999]回复：HS12发表于2021-10-3018:16[/color][/url][/size]报错信息
ai照片放大python源码_AI新时代-大牛教你使用python+Opencv完成人脸解锁（附源码）... weixin_39639505 ai照片放大python源码
好吧，伙计们，我回来了。说我拖更不写文章的可以过来用你的小拳拳狠命地捶我胸口....那么今天我们来讲关于使用python+opencv+face++来实现人脸验证及人脸解锁。代码量同样不多，你可以将这些代码运用在其它一些智能领域，如智能家居，进门的时候判断你是谁，也可以加入机器学习判断来的人是客人还是熟人。在讲之前我们会先适当的拓扑一下关于人脸识别的知识点。OK废话少说下面开始正是话题。解锁原理：
线性回归：从基础到进阶的全面解析 tester Jeffky 大模型线性回归机器学习算法
线性回归：从基础到进阶的全面解析线性回归是机器学习中最基本的算法之一，广泛应用于预测和分析。本文将详细介绍线性回归的基本概念、数学原理、实现方法以及在实际应用中的注意事项。我们将通过丰富的代码示例来展示如何从头开始构建一个简单的线性回归模型，并逐步深入到更复杂的场景。1.线性回归的基本概念1.1什么是线性回归？线性回归是一种用于建模两个或多个变量之间关系的统计方法。它假设因变量（目标变量）与一个或
什么是多模态机器学习：跨感知融合的智能前沿非凡暖阳人工智能神经网络
在人工智能的广阔天地里，多模态机器学习（MultimodalMachineLearning）作为一项前沿技术，正逐步解锁人机交互和信息理解的新境界。它超越了单一感官输入的限制，通过整合视觉、听觉、文本等多种数据类型，构建了一个更加丰富、立体的认知模型，为机器赋予了接近人类的综合感知与理解能力。本文将深入探讨多模态机器学习的定义、核心原理、关键技术、面临的挑战以及未来的应用前景，旨在为读者勾勒出这一
java责任链模式 3213213333332132 java 责任链模式村民告县长
责任链模式，通常就是一个请求从最低级开始往上层层的请求，当在某一层满足条件时，请求将被处理，当请求到最高层仍未满足时，则请求不会被处理。就是一个请求在这个链条的责任范围内，会被相应的处理，如果超出链条的责任范围外，请求不会被相应的处理。下面代码模拟这样的效果：创建一个政府抽象类,方便所有的具体政府部门继承它。 package 责任链模式; /** *
linux、mysql、nginx、tomcat 性能参数优化 ronin47
一、linux 系统内核参数 /etc/sysctl.conf文件常用参数 net.core.netdev_max_backlog = 32768 #允许送到队列的数据包的最大数目 net.core.rmem_max = 8388608 #SOCKET读缓存区大小 net.core.wmem_max = 8388608 #SOCKET写缓存区大
php命令行界面 dcj3sjt126com PHP cli
常用选项 php -v php -i PHP安装的有关信息 php -h 访问帮助文件 php -m 列出编译到当前PHP安装的所有模块执行一段代码 php -r 'echo "hello, world!";' php -r 'echo "Hello, World!\n";' php -r '$ts = filemtime("
Filter&Session 171815164 session
Filter HttpServletRequest requ = (HttpServletRequest) req; HttpSession session = requ.getSession(); if (session.getAttribute("admin") == null) { PrintWriter out = res.ge
连接池与Spring,Hibernate结合 g21121 Hibernate
前几篇关于Java连接池的介绍都是基于Java应用的，而我们常用的场景是与Spring和ORM框架结合，下面就利用实例学习一下这方面的配置。 1.下载相关内容： &nb
[简单]mybatis判断数字类型 53873039oycg mybatis
昨天同事反馈mybatis保存不了int类型的属性,一直报错，错误信息如下: Caused by: java.lang.NumberFormatException: For input string: "null" at sun.mis
项目启动时或者启动后ava.lang.OutOfMemoryError: PermGen space 程序员是怎么炼成的 eclipse jvm tomcat catalina.sh eclipse.ini
在启动比较大的项目时，因为存在大量的jsp页面，所以在编译的时候会生成很多的.class文件，.class文件是都会被加载到jvm的方法区中，如果要加载的class文件很多，就会出现方法区溢出异常 java.lang.OutOfMemoryError: PermGen space. 解决办法是点击eclipse里的tomcat，在
我的crm小结 aijuans crm
各种原因吧，crm今天才完了。主要是接触了几个新技术： Struts2、poi、ibatis这几个都是以前的项目中用过的。 Jsf、tapestry是这次新接触的，都是界面层的框架，用起来也不难。思路和struts不太一样，传说比较简单方便。不过个人感觉还是struts用着顺手啊，当然springmvc也很顺手，不知道是因为习惯还是什么。jsf和tapestry应用的时候需要知道他们的标签、主
spring里配置使用hibernate的二级缓存几步 antonyup_2006 java spring Hibernate xml cache
．在spring的配置文件中 applicationContent.xml，hibernate部分加入 xml 代码 <prop key="hibernate.cache.provider_class">org.hibernate.cache.EhCacheProvider</prop> <prop key="hi
JAVA基础面试题百合不是茶抽象实现接口 String类接口继承抽象类继承实体类自定义异常
/* * 栈（stack）：主要保存基本类型（或者叫内置类型）（char、byte、short、 *int、long、 float、double、boolean）和对象的引用，数据可以共享，速度仅次于 * 寄存器（register），快于堆。堆（heap）：用于存储对象。 */ &
让sqlmap文件 "继承" 起来 bijian1013 java ibatis sqlmap
多个项目中使用ibatis , 和数据库表对应的 sqlmap文件（增删改查等基本语句)，dao, pojo 都是由工具自动生成的, 现在将这些自动生成的文件放在一个单独的工程中，其它项目工程中通过jar包来引用，并通过"继承"为基础的sqlmap文件，dao,pojo 添加新的方法来满足项
精通Oracle10编程SQL(13)开发触发器 bijian1013 oracle 数据库 plsql
/* *开发触发器 */ --得到日期是周几 select to_char(sysdate+4,'DY','nls_date_language=AMERICAN') from dual; select to_char(sysdate,'DY','nls_date_language=AMERICAN') from dual; --建立BEFORE语句触发器 CREATE O
【EhCache三】EhCache查询 bit1129 ehcache
本文介绍EhCache查询缓存中数据，EhCache提供了类似Hibernate的查询API，可以按照给定的条件进行查询。要对EhCache进行查询，需要在ehcache.xml中设定要查询的属性数据准备 @Before public void setUp() { //加载EhCache配置文件 Inpu
CXF框架入门实例白糖_ spring Web 框架 webservice servlet
CXF是apache旗下的开源框架，由Celtix + XFire这两门经典的框架合成，是一套非常流行的web service框架。它提供了JAX-WS的全面支持，并且可以根据实际项目的需要，采用代码优先（Code First）或者 WSDL 优先（WSDL First）来轻松地实现 Web Services 的发布和使用，同时它能与spring进行完美结合。在apache cxf官网提供
angular.equals boyitech AngularJS AngularJS API AnguarJS 中文API angular.equals
angular.equals 描述: 比较两个值或者两个对象是不是相等。还支持值的类型，正则表达式和数组的比较。两个值或对象被认为是相等的前提条件是以下的情况至少能满足一项：两个值或者对象能通过=== （恒等）的比较两个值或者对象是同样类型，并且他们的属性都能通过angular
java-腾讯暑期实习生-输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A[0]*A[1]*...*A[i-1]*A[i+1] bylijinnan java
这道题的具体思路请参看何海涛的微博：http://weibo.com/zhedahht import java.math.BigInteger; import java.util.Arrays; public class CreateBFromATencent { /** * 题目：输入一个数组A[1,2,...n]，求输入B，使得数组B中的第i个数字B[i]=A
FastDFS 的安装和配置修订版 Chen.H linux fastDFS 分布式文件系统
FastDFS Home:http://code.google.com/p/fastdfs/ 1. 安装 http://code.google.com/p/fastdfs/wiki/Setup http://hi.baidu.com/leolance/blog/item/3c273327978ae55f93580703.html 安装libevent (对libevent的版本要求为1.4.
[强人工智能]拓扑扫描与自适应构造器 comsci 人工智能
当我们面对一个有限拓扑网络的时候,在对已知的拓扑结构进行分析之后,发现在连通点之后,还存在若干个子网络,且这些网络的结构是未知的,数据库中并未存在这些网络的拓扑结构数据....这个时候,我们该怎么办呢? 那么,现在我们必须设计新的模块和代码包来处理上面的问题
oracle merge into的用法 daizj oracle sql merget into
Oracle中merge into的使用 http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5980965 该命令使用一条语句从一个或者多个数据源中完成对表的更新和插入数据. ORACLE 9i 中，使用此命令必须同时指定UPDATE 和INSE
不适合使用Hadoop的场景 datamachine hadoop
转自：http://dev.yesky.com/296/35381296.shtml。　　Hadoop通常被认定是能够帮助你解决所有问题的唯一方案。当人们提到“大数据”或是“数据分析”等相关问题的时候，会听到脱口而出的回答：Hadoop! 实际上Hadoop被设计和建造出来，是用来解决一系列特定问题的。对某些问题来说，Hadoop至多算是一个不好的选择，对另一些问题来说，选择Ha
YII findAll的用法 dcj3sjt126com yii
看文档比较糊涂，其实挺简单的： $predictions=Prediction::model()->findAll("uid=:uid",array(":uid"=>10)); 第一个参数是选择条件：”uid=10″。其中:uid是一个占位符，在后面的array(“:uid”=>10)对齐进行了赋值；更完善的查询需要
vim 常用 NERDTree 快捷键 dcj3sjt126com vim
下面给大家整理了一些vim NERDTree的常用快捷键了，这里几乎包括了所有的快捷键了，希望文章对各位会带来帮助。切换工作台和目录 ctrl + w + h 光标 focus 左侧树形目录ctrl + w + l 光标 focus 右侧文件显示窗口ctrl + w + w 光标自动在左右侧窗口切换ctrl + w + r 移动当前窗口的布局位置 o 在已有窗口中打开文件、目录或书签，并跳
Java把目录下的文件打印出来蕃薯耀列出目录下的文件文件夹下面的文件目录下的文件
Java把目录下的文件打印出来 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 11:02:
linux远程桌面----VNCServer与rdesktop hanqunfeng Desktop
windows远程桌面到linux，需要在linux上安装vncserver，并开启vnc服务，同时需要在windows下使用vnc-viewer访问Linux。vncserver同时支持linux远程桌面到linux。 linux远程桌面到windows，需要在linux上安装rdesktop，同时开启windows的远程桌面访问。下面分别介绍，以windo
guava中的join和split功能 jackyrong java
guava库中，包含了很好的join和split的功能，例子如下： 1）将LIST转换为使用字符串连接的字符串 List<String> names = Lists.newArrayList("John", "Jane", "Adam", "Tom");
Web开发技术十年发展历程 lampcy android Web 浏览器 html5
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
架构师之mima-----------------mina的非NIO控制IOBuffer(说得比较好) nannan408 buffer
1.前言。如题。 2.代码。 IoService IoService是一个接口，有两种实现：IoAcceptor和IoConnector；其中IoAcceptor是针对Server端的实现，IoConnector是针对Client端的实现；IoService的职责包括： 1、监听器管理 2、IoHandler 3、IoSession
ORA-00054:resource busy and acquire with NOWAIT specified Everyday都不同 oracle session Lock
[Oracle] 今天对一个数据量很大的表进行操作时，出现如题所示的异常。此时表明数据库的事务处于“忙”的状态，而且被lock了，所以必须先关闭占用的session。 step1，查看被lock的session： select t2.username, t2.sid, t2.serial#, t2.logon_time from v$locked_obj
javascript学习笔记 tntxia JavaScript
javascript里面有6种基本类型的值:number、string、boolean、object、function和undefined。number：就是数字值，包括整数、小数、NaN、正负无穷。string:字符串类型、单双引号引起来的内容。boolean:true、false object:表示所有的javascript对象，不用多说function:我们熟悉的方法，也就是
Java enum的用法详解 xieke90 enum 枚举
Java中枚举实现的分析：示例： public static enum SEVERITY{ INFO,WARN,ERROR } enum很像特殊的class，实际上enum声明定义的类型就是一个类。而这些类都是类库中Enum类的子类 (java.l

机器学习物语(3)：回归问题

你可能感兴趣的:(机器学习)