Datawhale

深度学习和经典统计学是一回事？

Datawhale干货

作者：Boaz Barak，编辑：机器之心

深度学习和简单的统计学是一回事吗？很多人可能都有这个疑问，毕竟二者连术语都有很多相似的地方。在这篇文章中，理论计算机科学家、哈佛大学知名教授 Boaz Barak 详细比较了深度学习与经典统计学的差异，认为“如果纯粹从统计学角度认识深度学习，就会忽略其成功的关键因素”。

图源：https://twitter.com/YiMaTweets/status/1553913464183091200

深度学习（或一般的机器学习）经常被认为是简单的统计学，即它与统计学家研究的基本是相同的概念，但是使用与统计学不同的术语来描述。Rob Tibshirani 曾总结了下面这个有趣的“词汇表”：

表中的某些内容是不是很能引起共鸣？事实上所有从事机器学习的人都清楚，Tibshiriani 发布的这张表中，右侧的许多术语在机器学习中已被广泛使用。

如果纯粹从统计学角度认识深度学习，就会忽略其成功的关键因素。对深度学习更恰当的评价是：它使用统计学术语来描述完全不同的概念。

对深度学习的恰当评价不是它用不同的词来描述旧的统计术语，而是它用这些术语来描述完全不同的过程。

本文会解释为什么深度学习的基础其实不同于统计学，甚至不同于经典的机器学习。本文首先讨论模型拟合数据时的「解释（explanation）」任务和「预测（prediction）」任务之间的差异。接着讨论学习过程的两个场景：1. 使用经验风险最小化拟合统计模型; 2. 向学生传授数学技能。然后，文章又讨论了哪一个场景更接近深度学习的本质。

虽然深度学习的数学和代码与拟合统计模型几乎相同。但在更深层次上，深度学习更像是向学生传授数学技能这种场景。而且应该很少有人敢宣称：我掌握了完整的深度学习理论！其实是否存在这样的理论也是存疑的。相反深度学习的不同方面最好从不同的角度来理解，而仅仅从统计角度无法提供完整的蓝图。

本文对比了深度学习和统计学，这里的统计学特指的是“经典统计学”，因为它被研究得最久，并且在教科书中经久不衰。许多统计学家正在研究深度学习和非经典理论方法，就像 20 世纪物理学家需要扩展经典物理学的框架一样。事实上，模糊计算机科学家和统计学家之间的界限对双方都是有利的。

1、预测与模型拟合

一直以来，科学家们都是将模型计算结果与实际观测结果进行比较，以验证模型的准确性。埃及天文学家托勒密提出了关于行星运动的巧妙模型。托勒密的模型遵循地心说，但有一系列的本轮（见下图），使其具有极好的预测准确性。相比之下，哥白尼最初的日心说模型比托勒密模型简单，但在预测观察结果方面不太准确。（哥白尼后来添加了自己的本轮，以便能够与托勒密的模型媲美。）

托勒密和哥白尼的模型都是无与伦比的。如果我们想通过 “黑盒” 进行预测，那么托勒密的地心模型更胜一筹。但如果你想要一个简单的模型，以便可以“观察模型内部”（这是解释恒星运动理论的起点），那么哥白尼的模型是不二选择。后来，开普勒将哥白尼的模型改进为椭圆轨道，并提出了开普勒行星运动三定律，这使得牛顿能够用适用于地球的引力定律来解释行星规律。

因此，重要的是，日心说模型不只是一个提供预测的“黑盒”，而是由几个简单的数学方程给出的，但是方程中的 “运动部分” 极少。多年来，天文学一直是发展统计技术的灵感来源。高斯和勒让德分别独立地在 1800 年左右发明了最小二乘回归，以预测小行星和其他天体的轨道。1847 年，柯西发明了梯度下降法，这也是由天文预测推动的。

在物理学中，有时学者们可以掌握全部细节，从而找到 “正确” 的理论，把预测准确性做到最优，并且对数据做出最好的解释。这些都在奥卡姆剃刀之类的观点范畴内，可以认为是假设简单性、预测能力和解释性都相互和谐一致的。

然而，在许多其它领域，解释和预测这两个目标之间的关系却没有那么和谐。如果只想预测观察结果，通过 “黑盒” 可能是最好的。另一方面，如果想获得解释性的信息，如因果模型、通用原则或重要特征，那么可以理解和解释的模型可能越简单越好。

模型的正确选择与否取决于其用途。例如，考虑一个包含许多个体的遗传表达和表型（例如某些疾病）的数据集，如果目标是预测一个人生病的几率，那么无论它有多复杂或依赖于多少个基因，都要使用适配该任务的最佳预测模型。相反，如果目的是识别一些基因，以便进行进一步研究，那么一个复杂的非常精确的 “黑盒” 的用处是有限的。

统计学家 Leo Breiman 在 2001 年关于统计建模的两种文化的著名文章中阐述了这一点。第一种是“数据建模文化”，侧重于能解释数据的简单生成模型。第二种是“算法建模文化”，对数据的生成方式不可知，侧重于寻找能够预测数据的模型，无论其多么复杂。

文章链接：https://projecteuclid.org/journals/statistical-science/volume-16/issue-3/Statistical-Modeling--The-Two-Cultures-with-comments-and-a/10.1214/ss/1009213726.full

Breiman 认为，统计学过于受第一种文化的支配，这种关注造成两种问题：

导致了不相关的理论和可疑的科学结论。
阻止了统计学家研究令人兴奋的新问题。

Breiman 的论文一出，就引起了一些争议。同为统计学家的 Brad Efron 回应说，虽然他同意一些观点，但他也强调，Breiman 的论点似乎是反对节俭和科学见解，支持花大力气制造复杂的“黑盒”。但在最近的一篇文章中，Efron 摒弃了之前的观点，承认 Breima 更有先见之明，因为“21 世纪统计学的焦点都聚焦在预测算法上，在很大程度上沿着 Breiman 提出的路线演进”。

2、经典和现代预测模型

机器学习，无论是不是深度学习，都沿着 Breiman 的第二种观点演进，即以预测为重点。这种文化有着悠久的历史。例如，Duda 和 Hart 在 1973 年出版的教科书和 Highleyman 1962 年的论文就写到了下图中的内容，这对于今天的深度学习研究者来说是非常容易理解的：

Duda 和 Hart 的教科书《Pattern classification and scene analysis》和 Highleyman 1962 年的论文《The Design and Analysis of Pattern Recognition Experiments》中的片段。

类似地，下图中的 Highleyman 的手写字符数据集和用于拟合它的架构 Chow（1962）（准确率约为 58%）也会引起很多人的共鸣。

3、为什么深度学习与众不同？

1992 年，Geman、Bienenstock 和 Doursat 写了一篇关于神经网络的悲观文章，认为 “当前的前馈神经网络在很大程度上不足以解决机器感知和机器学习中的难题”。具体来说，他们认为通用神经网络在处理困难任务方面不会成功，而它们成功的唯一途径是通过人工设计的特征。用他们的话说：“重要属性必须是内置的或“硬连接的”…… 而不是以任何统计意义上的方式学习。” 现在看来 Geman 等人完全错了，但更有意思的是了解他们为什么错了。

深度学习确实不同于其它学习方法。虽然深度学习似乎只是预测，就像最近邻或随机森林一样，但它可能有更多的复杂参数。这看起来似乎只是量的差异，而不是质的差异。但在物理学中，一旦尺度变化了几个数量级，通常就需要完全不同的理论，深度学习也是如此。深度学习与经典模型（参数化或非参数化）的基础过程完全不同，虽然它们的数学方程（和 Python 代码）在更高层次上来看是相同的。

为了说明这一点，下面考虑两个不同的场景：拟合统计模型和向学生教授数学。

场景 A：拟合一个统计模型

通过数据去拟合一个统计模型的典型步骤如下：

1.这里有一些数据(是的矩阵；是维向量，即类别标签。把数据认为是来自某个有结构且包含噪声的模型，就是要去拟合的模型)

2.使用上面的数据拟合一个模型，并用优化算法来最小化经验风险。就是说通过优化算法找到这样的，使得最小，代表损失（表明预测值有多接近真实值），是可选的正则化项。

3. 模型的总体损失越小越好，即泛化误差的值相对最小。

Effron 从包含噪声的观测中恢复牛顿第一定律的展示图

这个非常通用的范例其实包含许多内容，如最小二乘线性回归、最近邻、神经网络训练等等。在经典统计场景中，我们通常会碰到下面的情况：

权衡：假设是经过优化的模型集合(如果函数是非凸的或包含正则化项，精心选择算法和正则化，可得到模型集。的偏差是元素所能达到的最接近真值的近似值。集合越大，偏差越小，并且可能为 0(如果)。

然而，越大，需要缩小其成员范围的样本越多，因此算法输出模型的方差越大。总体泛化误差是偏差和方差的总和。因此，统计学习通常是 Bias-Variance 权衡，正确的模型复杂度是将总体误差降至最低。事实上，Geman 等人证明了其对神经网络的悲观态度，他们认为：Bias-Variance 困境造成的基本限制适用于所有非参数推理模型，包括神经网络。

“多多益善”并不总是成立：在统计学习中，更多的特征或数据并不一定会提高性能。例如，从包含许多不相关特征的数据中学习是很难的。类似地，从混合模型中学习，其中数据来自两个分布中的一个（如和），比独立学习每个分布更难。

收益递减：在很多情况中，将预测噪声降低到水平所需的数据点数量与参数和是有关的，即数据点数量约等于。在这种情况下，需要大约 k 个样本才能启动，但一旦这样做，就面临着回报递减的情况，即如果需要个点才能达到 90% 的准确率，则需要大约额外的个点来将准确率提高到 95%。一般来说，随着资源增加（无论是数据、模型复杂度还是计算），人们希望获得越来越精细的区分，而不是解锁特定的新功能。

对损失、数据的严重依赖性：当将模型拟合到高维数据时，任何小细节都可能会产生很大的差异。L1 或 L2 正则化器等选择很重要，更不用说使用完全不同的数据集。不同数量的高维优化器相互之间也非常不同。

数据是相对 “单纯” 的：通常会假设数据是独立于某些分布进行采样的。虽然靠近决策边界的点很难分类，但考虑到高维度上测量集中现象，可以认为大多数点的距离都是相近的。因此在经典的数据分布中，数据点间的距离差异是不大的。然而，混合模型可以显示这种差异，因此，与上述其他问题不同，这种差异在统计中很常见。

场景 B：学习数学

在这个场景中，我们假设你想通过一些说明和练习来教学生数学（如计算导数）。这个场景虽然没有正式定义，但有一些定性特征：

学习一项技能，而不是去近似一个统计分布：在这种情况下，学生学习的是一种技能，而不是某个量的估计 / 预测。具体来说，即使将练习映射到解的函数不能被用作解决某些未知任务的“黑盒”，但学生在解决这些问题时形成的思维模式仍然对未知任务是有用的。

多多益善：一般来说，做题越多、题型涉猎越广的学生表现越好。同时做一些微积分题和代数题，不会导致学生的微积分成绩下降，相反可能帮助其微积分成绩提升。

从提升能力到自动化表示：虽然在某些情况下，解决问题的回报也会递减，但学生的学习会经历几个阶段。有一个阶段，解决一些问题有助于理解概念并解锁新的能力。此外，当学生重复某一特定类型的问题时，他们见到同类问题就会形成自动化的解题流程，从之前的能力提升转变为自动化解题。

表现独立于数据和损失：教授数学概念的方法不止一种。使用不同书、教育方法或评分系统学习的学生最终可以学习到相同的内容以及相似的数学能力。

有些问题更困难：在数学练习中，我们经常看到不同学生解决同一问题的方式之间存在着很强的相关性。对于一个问题来说，似乎确实存在一个固有的难度水平，以及一个对学习最有利的自然难度递进。

4、深度学习更像是统计估计还是学生学习技能？

上面两个场景的比喻中，哪一个用来描述现代深度学习更恰当？具体来说，它成功的原因是什么？统计模型拟合可以很好地使用数学和代码来表达。实际上，规范的 Pytorch 训练循环通过经验风险最小化训练深度网络：

在更深的层次上，这两种场景之间的关系并不清楚。为了更具体，这里以一个特定的学习任务为例。考虑使用 “自监督学习 + 线性探测” 方法训练的分类算法。具体算法训练如下：

1. 假设数据是一个序列，其中是某个数据点（比如一张图片），是标签。

2. 首先得到表示函数的深度神经网络。通过最小化某种类型的自监督损失函数，仅使用数据点而不使用标签来训练该函数。这种损失函数的例子是重建（用其它输入恢复输入）或对比学习（核心思想是正样本和负样本在特征空间对比，学习样本的特征表示）。

3. 使用完整的标记数据拟合线性分类器（是类数），以最小化交叉熵损失。我们的最终分类器是:

步骤 3 仅适用于线性分类器，因此 “魔术” 发生在步骤 2 中（深度网络的自监督学习）。在自监督学习中有些重要属性：

学习一项技能而不是去近似一个函数：自监督学习不是逼近函数，而是学习可用于各种下游任务的表示(这是自然语言处理的主导范式)。通过线性探测、微调或激励获得下游任务是次要的。

多多益善：在自监督学习中，表示质量随着数据量的增加而提高，不会因为混合了几个来源的数据而变糟。事实上，数据越多样化越好。

Google PaLM 模型的数据集。

解锁新能力：随着资源（数据、计算、模型大小）投入的增加，深度学习模型也在不连续地改进。在一些组合环境中也证明了这一点。

随着模型规模的增加，PaLM 在基准测试中显示出不连续的改进，并且解锁令人惊讶的功能，比如解释笑话为什么好笑。

性能几乎与损失或数据无关：存在多个自监督损失，图像研究中其实使用了多种对比和重建损失，语言模型使用单边重建（预测下一个 token）或使用 mask 模型，预测来自左右 token 的 mask 输入。也可以使用稍微不同的数据集。这些可能会影响效率，但只要做出 “合理” 的选择，通常原始资源比使用的特定损失或数据集更能提升预测性能。

有些情况比其他情况更困难：这一点并不特定于自监督学习。数据点似乎有一些固有的 “难度级别”。事实上，不同的学习算法具有不同的“技能水平”，不同的数据 dian 具有不同的” 难度水平“（分类器正确分类点的概率随的技能而单调提升，随难度单调降低）。

“技能与难度（skill vs. difficulty）”范式是对 Recht 等人和 Miller 等人发现的 “accuracy on the line” 现象的最清晰解释。Kaplen、Ghosh、Garg 和 Nakkiran 的论文还展示了数据集中的不同输入如何具有固有的“难度剖面”，对于不同的模型族，该剖面通常是稳健的。

CIFAR-10 上训练并在 CINIC-10 上测试的分类器的 accuracy on the line 现象。图源：https://millerjohnp-linearfits-app-app-ryiwcq.streamlitapp.com/

顶部的图描述了最可能类别的不同 softmax 概率，作为某个类别分类器的全局精度的函数，该类别由训练时间索引。底部的饼图显示了不同数据集分解为不同类型的点(注意，这种分解对于不同的神经结构是相似的)。

训练就是教学：现代大模型的训练似乎更像是教学生，而不是让模型拟合数据，当学生不懂或感到疲倦时，就 “休息” 或尝试不同的方法（训练差异）。Meta 的大模型训练日志很有启发性——除了硬件问题外，我们还可以看到干预措施，例如在训练过程中切换不同的优化算法，甚至考虑 “hot swapping” 激活函数（GELU to RELU）。如果将模型训练视为拟合数据，而不是学习表示，则后者没有多大意义。

Meta 训练日志摘录

4.1）但是监督学习怎样呢？

前面讨论了自监督学习，但深度学习的典型例子，仍然是监督学习。毕竟，深度学习的 “ImageNet 时刻” 来自 ImageNet。那么上面所讨论的是否仍然适用于这个设定？

首先，有监督的大规模深度学习的出现在某种程度上是个偶然，这得益于大型高质量标记数据集（即 ImageNet）的可用性。如果你想象力丰富，可以想象另一种历史，即深度学习首先开始通过无监督学习在自然语言处理方面取得突破性进展，然后才转移到视觉和监督学习中。

其次，有证据表明，尽管使用完全不同的损失函数，但监督学习和自监督学习在”内部“的行为其实是相似的。两者通常都能达到相同的性能。具体地，对于每一个，人们可以将通过自监督训练的深度为 d 的模型的前 k 层与监督模型的最后 d-k 层合在一起，而性能损失很小。

SimCLR v2 论文的表格。请注意监督学习、微调（100%）自监督和自监督 + 线性探测之间在性能上的一般相似性（图源：https://arxiv.org/abs/2006.10029）

拼接自监督模型和 Bansal 等人的监督模型（https://arxiv.org/abs/2106.07682）。左：如果自监督模型的准确率（比如）比监督模型低 3%，则当层的 p 部分来自自监督模型时，完全兼容的表示将导致拼接惩罚为 p 3%。如果模型完全不兼容，那么我们预计随着合并更多模型，准确率会急剧下降。右：合并不同自监督模型的实际结果。

自监督 + 简单模型的优势在于，它们可以将特征学习或 “深度学习魔法”（由深度表示函数完成）与统计模型拟合（由线性或其他“简单” 分类器在此表示之上完成）分离。

最后，虽然这更像是一种推测，但事实上 “元学习” 似乎往往等同于学习表征（参见：https://arxiv.org/abs/1909.09157，https://arxiv.org/abs/2206.03271），这可以被视为另一个证据，证明这在很大程度上是在进行的，而不管模型优化的目标是什么。

4.2）过度参数化怎么办？

本文跳过了被认为是统计学习模型和深度学习在实践中存在差异的典型例子：缺乏 “Bias-Variance 权衡” 以及过度参数化模型的良好泛化能力。

为什么要跳过？有两个原因：

首先，如果监督学习确实等于自监督 + 简单学习，那么这可能解释了它的泛化能力。
其次，过度参数化并不是深度学习成功的关键。深度网络之所以特别，并不是因为它们与样本数量相比大，而是因为它们在绝对值上大。事实上，通常在无监督 / 自监督学习中，模型不会过度参数化。即使对于非常大的语言模型，它们的数据集也更大。

Nakkiran-Neyshabur-Sadghi“deep bootstrap”论文表明，现代架构在 “过度参数化” 或“欠采样”状态下表现类似（模型在有限数据上训练多个 epoch，直到过度拟合：上图中的 “Real World”），在“欠参数化” 或者 “在线” 状态下也是如此（模型训练单个 epoch，每个样本只看一次：上图中的 “Ideal World”）。图源：https://arxiv.org/abs/2010.08127

总结

统计学习当然在深度学习中发挥着作用。然而，尽管使用了相似的术语和代码，但将深度学习视为简单地拟合一个比经典模型具有更多参数的模型，会忽略很多对其成功至关重要的东西。教学生数学的比喻也不是完美的。

与生物进化一样，尽管深度学习包含许多复用的规则（如经验损失的梯度下降），但它会产生高度复杂的结果。似乎在不同的时间，网络的不同组件会学习不同的东西，包括表示学习、预测拟合、隐式正则化和纯噪声等。研究人员仍在寻找合适的视角提出有关深度学习的问题，更不用说回答这些问题。

原文链接：https://windowsontheory.org/2022/06/20/the-uneasy-relationship-between-deep-learning-and-classical-statistics/

“干货学习，点赞三连↓

在 Conda 中删除环境及所有安装的库 Studying 开龙wu conda
注意事项1.删除环境前确保你没有在该环境中运行任何程序。2.删除操作是不可逆的，所有该环境中的包和配置都会被永久删除。3.如果你想保留环境的配置信息，可以在删除前使用condaenvexport>environment.yml导出环境配置。关于requirements.txt和environment.yaml文件使用介绍详情可参考以往文章，争对机器学习和深度学习里Python项目开发管理项目依赖的
计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW) Python毕设源码程序高学长 python 课程设计 uni-app
计算机毕业设计Python+uniapp校园兼职系统小程序(小程序+源码+LW)该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+uni+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+UNI等等组成，B/S模式+pychram管理
Python-Django毕业设计养老院老人日常生活管理系统（程序+Lw) Python计算机毕设程序源码_ python django 课程设计
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程项目运行环境配置：Pychram社区版+python3.7.7+Mysql5.7+HBuilderX+listpip+Navicat11+Django+nodejs。项目技术：django+python+Vue等等组成，B/S模式+pychram管理等等。环境需要1.运行环境：最好是python3.7.7，我们在这个版本上开发的。其他版
Supervisor 入门指南一篇就够 —— 安装、项目配置与常见报错速查逻极 python 开发工具笔记 python 运维工具开发 supervisor
Supervisor入门指南一篇就够——安装、项目配置与常见报错速查一、Supervisor是什么在服务器进程管理中，Supervisor是一款用Python编写的进程守护与管理工具。它的核心功能是将普通的命令行进程转变为后台daemon进程，并且在进程因意外情况退出时，能够自动将其重启，保证进程的持续运行。在实际应用中，它常出现在多层架构里。比如在Nginx→Gunicorn/Django→Su
什么是Java？想学习却不知道从哪开始？不熬夜不是好程序员
谈起Java，相信有很多小伙伴们也跟我刚开始一样，对他的了解只有难，学成之后工资高，从入门学到入土，但当你真正开始系统的学习之后才发现其实哪些程序猿们也不过尔尔（刚学习完刚入职那种。。。）什么是Java?Java是一门编程语言，Java是一门掌握了技术就可以拿到高薪的工作岗位。Java这个语言在我国发展的很完善，相当于你掌握了Java技术出来，具备一定的开发经验，既可以在一线城市找到合适的岗位工作
Unreal Engine开发：Unreal Engine基础入门_C++编程基础v1 chenlz2007 游戏开发虚幻 c++java unity 游戏引擎交互 lucene
C++编程基础在开始学习UnrealEngine之前，掌握C++编程基础是非常重要的。C++是一种强大的面向对象编程语言，广泛应用于游戏开发、系统软件开发等领域。本节将介绍C++的基本概念、语法和一些常用的功能，为后续的UnrealEngine开发打下坚实的基础。1.C++简介C++是一种静态类型的、编译式的、通用的、中级到高级的编程语言，它支持多种编程范式，包括面向对象编程、泛型编程和过程化编程
Python基础（字符串的切片与断言）日暮凡尘 python 开发语言 pycharm
'''1.输入一个字符串，判断是否只包含英文字母（大写或小写）。输出True或False。2.输入一个字符串，统计里面数字字符（0-9）的数量。3.输入两个字符串，第一个是主串，第二个是要查找的字符，判断字符是否在主串中。4.输入一个字符串，将所有数字字符转换成整数后求和。5.统计字符串中空格的数量6.输入字符串和数字n，判断字符串是否只包含数字且长度等于n。7.验证用户输入的手机号格式（中国手机
python 变量进阶（理解）程序员同行者
变量进阶（理解）目标变量的引用可变和不可变类型局部变量和全局变量01.变量的引用变量和数据都是保存在内存中的在Python中函数的参数传递以及返回值都是靠引用传递的1.1引用的概念在Python中变量和数据是分开存储的数据保存在内存中的一个位置变量中保存着数据在内存中的地址变量中记录数据的地址，就叫做引用使用id()函数可以查看变量中保存数据所在的内存地址注意：如果变量已经被定义，当给一个变量赋值
python——for_in循环何处望天明CS python
#Nico#时间：2021/4/2021:09#for-in循环'''in表达式从（字符串、序列等）中依次取值，又称为遍历for-in遍历的对象必须是可迭代对象''''''for-in的语法结构for自定义变量in可迭代对象:循环体'''#字符串中取值foritemin'python':print(item)#range产生一个整数序列，也是一个可迭代对象foriinrange(10):print
一步一步学Python3(小学生也适用) 第十七篇:循环语句for in循环
一、Pythonforin循环Pythonforin循环，是用来遍历任何数据序列，如一个列表，一个字符串，一个字典，一个元组等。forin循环的一般语法如下：foritemin序列:语句块else:语句块forin字符串：把每个字符循环出来'''字符串：把每个字符循环出来'''str1='老树Python''''把字符串str1元素进行循环，每循环出一个元素，就把该元素赋值给item'''fori
智慧水库信息化系统建设产品需求文档V2.0 小赖同学啊 test Technology Precious 物联网
智慧水库信息化系统建设产品需求文档1.引言1.1文档目的本文档旨在明确智慧水库信息化系统的建设需求，为系统设计、开发和实施提供全面依据，确保系统功能满足水库管理业务需求，提升水库管理的智能化水平和决策效率。1.2背景介绍传统水库管理面临数据采集不及时、分析手段有限、决策依赖经验等问题，难以应对复杂多变的水文情势和日益增长的管理需求。随着物联网、大数据、人工智能等技术的发展，智慧水库建设成为必然趋势
OpenCV中常用特征提取算法（SURF、ORB、SIFT和AKAZE）用法示例（C++和Python）点云SLAM 图形图像处理 opencv 算法 ORB算法 SIFT算法 SURF算法 AKAZE算法计算机视觉
OpenCV中提供了多种常用的特征提取算法，广泛应用于图像匹配、拼接、SLAM、物体识别等任务。以下是OpenCV中几个主流特征提取算法的用法总结与代码示例，涵盖C++和Python两个版本。常用特征提取算法列表算法特点是否需额外模块SIFT（尺度不变特征）稳定性强、可旋转缩放xfeatures2d模块SURF（加速稳健特征）快速但专利保护xfeatures2d模块ORB（OrientedFAST
python 循环结构(for-in) 编程小僧 python基础
循环结构(for-in)说明：也是循环结构的一种，经常用于遍历字符串、列表，元组，字典等格式：forxiny:循环体执行流程：x依次表示y中的一个元素，遍历完所有元素循环结束示例1：遍历字符串s='Iloveyoumorethanicansay'foriins:print(i)示例2：遍历列表l=['鹅鹅鹅','曲项向天歌','锄禾日当午','春种一粒粟']foriinl:print(i)#可以
9.20其二道左无人
做一家服务公司，为下面的公司提供一些事务性的管理、财务管理、风险管理的服务，粘住一个大圈子的HR，通过下面的公司做掉项目，为HR提供一个稳定的资源变现的渠道；做一家科技公司，提供线上的平台运营，大数据采集，以及基于这个基础上的卖货、信贷等服务做一家连锁企业，每一家门店都是独立的企业，提供招聘、引流以及终端服务所以外部通过众筹绑定大批量的HR，就会有稳定的订单，通过服务公司提供服务，通过终端门店保证
Python学习笔记 cherishSpring python python 学习笔记
目录一、名词解释二、数据类型（变量名无类型，变量值有类型）三、数据类型转换(万物皆可转字符串)四、标识符五、运算符六、字符串扩展七、数据输入八、if语句九、while语句十、for循环语句十一、函数十二、数据容器1、List列表2、tuple元组3、字符串4、序列的常用操作-切片5、set集合6、dict字典7、数据容器相互转换8、通用操作十三、文件编码一、名词解释1、字面量被写在代码中的固定的值
Python for循环 dengdieli5313 python
Pythonfor循环可以遍历任何序列的项目，如一个列表或者一个字符串。for循环的语法结构如下：foriterating_varinsequence:statements(s)最简单的形式如下，循环10次。1foriinrange(10):2print("loop:",i)输出为1loop:02loop:13loop:24loop:35loop:46loop:57loop:68loop:79lo
python的for-in循环小白L. 入门 python numpy 开发语言
‘’‘for-in循环in表达从（字符串序列）中依次取值，又称为遍历for-in遍历的对象必须是可迭代对象for-in的语法结构for自定义的变量in可迭代对象:循环体循环体内不需要访问自定义变量，可以将自定义变量替代为下划线’‘’#第一次取出来的是P，将P赋值item，将item的值输出foritemin'python':print(item)#range（）产生一个整数序列，–》也是一个可迭代
只靠可视化大屏，做不了数字化，数据总监总结3点，你做到了几个大数据的那些事
企业数字化是很多企业热衷的话题。本文的数字化指各行业头的头部企业的端到端数字化解决方案，常见部署于华为专有云、阿里私有云、亚马逊云，项目金额一般百万起步，上不封顶。很多企业投人、投钱数字化，都希望有个酷炫的数据大脑，政府、合作伙伴来参观时，用酷炫的数据大脑让来宾们啧啧称赞。热闹散去后，企业内部的各部门，天天围着数据挖宝，大数据快告诉我，下个月能卖多少，哪几个渠道卖得不好，哪条生产线有问题，哪些货压
Python-for-in循环難釋懷 python windows 服务器
一、前言在Python编程中，循环结构（LoopStructure）是程序控制流的重要组成部分。其中，for...in循环是Python中最常用、最简洁的迭代工具之一。与传统的C风格语言中的for不同，Python的for...in循环专门用于遍历可迭代对象（Iterable），如列表、元组、字符串、字典、集合，甚至是生成器等。本文将带你深入了解：for...in循环的基本语法；如何高效地遍历各种
OpenCV学习（二）-二维、三维识别香蕉可乐荷包蛋 #OpenCV opencv 学习人工智能
OpenCV是一个功能强大的计算机视觉库，可以用于识别和处理二维图像和三维图像。以下是关于二维图像和三维图像识别的基础知识和示例代码。1.二维图像识别二维图像识别通常包括图像分类、对象检测、特征提取等任务。以下是一些常见的操作：1.1图像分类使用预训练模型对图像进行分类，例如使用深度学习模型（如ResNet、MobileNet等）。importcv2#加载预训练的深度学习模型net=cv2.dnn
【AI 赋能：Python 人工智能应用实战】5. 梯度下降家族：SGD/Adam优化器对比实验与选择策略 AI_DL_CODE 人工智能 python 梯度下降优化器 SGD Adam PyTorch
摘要：本文系统解析梯度下降优化器的核心原理与演进脉络，构建从理论到实战的完整知识体系。理论部分梳理优化器发展里程碑，从1951年的SGD到2018年的AdamW，揭示技术迭代逻辑；通过数学公式对比SGD、Momentum、Adam等核心算法的更新机制，解析动量加速、自适应学习率的创新点。结合损失曲面分析，阐释Momentum如何逃离鞍点、Adam如何处理悬崖梯度。实战模块基于PyTorch在MNI
脱岗离岗逃岗监测识别软件系统平台标检测算法#YOLO
值班脱岗智能监测识别系统是一种利用AI视频智能分析技术的智能化系统，能够对办公工作岗位区域、岗亭、值班室、生产线岗位等进行7*24小时不间断实时监测。该系统的出现，有助于提高工作效率，确保工作秩序的正常运行，同时也能有效避免值班人员脱岗、懈怠等现象的发生。该系统的工作原理是通过高清摄像头捕捉实时画面，然后利用AI视频智能分析技术对画面进行实时分析，识别出是否有人脱岗、懈怠或者有其他异常情况发生。当
颠覆未来：创新代码引领人工智能与量子计算深度融合金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能量子计算
摘要在信息时代飞速演进的背景下，人工智能与量子计算正以前所未有的速度互相融合，推动着科技边界的不断拓展。本文回顾了经典算法的智慧，展示了前沿深度学习模型的构建，并通过量子电路设计探讨了创新代码的可能性，为探索未来科技变革提供了全新视角。1.引言当前，科技创新正处于高速迭代的关键阶段，传统计算方法与新型技术的交汇处正成为研究热点。人工智能的发展已渗透到各行各业，而量子计算的崛起则为解决复杂计算问题提
Python设计模式：适配模式 niuguangshuo python基础 python 设计模式开发语言
1.适配模式（AdapterPattern）详解适配模式（AdapterPattern）是一种结构型设计模式，它允许将一个类的接口转换成客户端所期望的另一种接口。适配模式使得原本由于接口不兼容而无法一起工作的类可以协同工作。换句话说，适配模式充当了一个桥梁，允许不同接口的类之间进行交互。在软件开发中，常常会遇到需要使用现有类的情况，但这些类的接口与我们需要的接口不匹配。适配模式提供了一种解决方案，
【大模型】结构化提示词：让AI高效完成复杂任务的“编程语言” JosieBook AI/大数据/云计算人工智能
文章目录前言：提示词一、不同提示词写作方法对比进阶技巧对比表实战组合策略二、三板斧：精准撰写提示词的黄金法则角色设定：为AI精准定位任务描述：明确行动指南输出要求：规范成果呈现三、魔法棒：零基础也能用的“AI需求翻译机”四、结构化：把提示词写成“可插拔的乐高”五、分治法：把“庞然大物”拆成可并行的小任务前言：提示词在人工智能时代，提示词（Prompt）已成为连接人类意图与AI能力的核心媒介。优质的
智界R7智驾功能和性能评价 TheWanderers 智能驾驶智界
一、智驾行车能力标题硬件配置与系统架构感知硬件：Max/Ultra版搭载1个192线激光雷达、3个毫米波雷达（含1个4D成像雷达）、12个超声波雷达、11个高清摄像头（含前向800万像素双目+鱼眼镜头）。Pro版未配备激光雷达，但保留3个毫米波雷达和10个摄像头。核心算法：HUAWEIADS3.0系统，基于端到端架构，整合感知、决策与控制模块，支持全场景目标识别（如非标准障碍物、夜间行人）。算力支
使用UV管理PyTorch项目
PyTorch是深度学习研究和开发的流行选择。可以使用uv管理PyTorch项目，包括不同Python版本依赖、管理环境、甚至加速器选择等。安装Pytorch从打包角度来看，PyTorch有几个不常见的特点：许多PyTorchwheel托管在专门的索引上，而非Python包索引（PyPI）。因此，安装PyTorch通常需要配置项目使用PyTorch专属索引。PyTorch为每种加速器生成不同的构建
数字图像处理（三：图像如果当作矩阵，那加减乘除处理了矩阵，那图像咋变）：从LED冬奥会、奥运会及春晚等等大屏，到手机小屏，快来挖一挖里面都有什么
数字图像处理（三）一、（准备工作：咋玩，用什么玩具）图像以矩阵形式存储，那矩阵一变、图像立刻跟着变？1.Python+JupyterNotebook/Lab+库(NumPy,OpenCV,Matplotlib,scikit-image)2.MATLAB+ImageProcessingToolbox3.JavaScript+HTML5Canvas+浏览器4.专业的图像处理软件(带脚本/插件功能)二、
使用Python进行文件属性修改 python自动化工具 python办公自动化 python 服务器 java
哈喽，大家好，我是木头左！在计算机中，文件属性是指与文件相关的元数据，如创建时间、修改时间、访问时间等。这些属性对于管理和组织文件非常重要。Python提供了一些内置的函数和方法，可以方便地修改文件的属性。本文将介绍如何使用Python进行文件属性的修改。1.获取文件属性需要使用os模块中的stat()函数来获取文件的属性。该函数返回一个包含文件属性的命名元组。以下是一个简单的示例：importo
人工智能视频分析系统人员离岗报警设计方案 liuhu21 人工智能云计算运维
一、方案概述近几年安防监控技术不断的进步，特别是在人工智能推出之后。安防监控系统结合人工智能算法做到了许多以前无法做到的事情。就比如我们今天要说的离岗检测报警监控系统。以前我们只能通过人工值守监控室的方式，通过人的判断去观看现场人员在岗情况。如今有了离岗检测监控系统，系统可以自动监测现场人员是否在岗、离岗时间以及离岗人数等等。这样，大大减少了监控室值班人员的工作量，同时相较人工监管提升了工作效率。
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

深度学习和经典统计学是一回事？

你可能感兴趣的:(算法,大数据,编程语言,python,计算机视觉)