Wendy_WHY_123

机器学习与物理科学（三）（Machine learning and the physical sciences）

Machine learning and the physical sciences

摘要
Ⅲ.粒子物理与宇宙学（ PARTICLE PHYSICS AND COSMOLOGY）

A.模拟的作用（The role of the simulation）
B.粒子物理学中的分类和回归（Classiﬁcation and regression in particle physics）

1.喷气物理学( Jet Physics)
2.中微子物理学(Neutrino physics)
3.系统不确定性的稳健性 ( Robustness to systematic uncertainties)
4.触发方式 (Triggering)
5.理论粒子物理学 (Theoretical particle physics)

C.宇宙学的分类与回归（ Classiﬁcation and regression in cosmology）

1.测光红移 (Photometric Redshift)
2.引力透镜的发现和参数估计 (Gravitational lens ﬁnding and parameter estimation)
3.其他示例(Other examples)

D.逆问题和可能的无罩推论（Inverse Problems and Likely-hood- free Inference）

1.无似然推理( Likelihood-free Inference)
2.粒子物理学中的例子 (Examples in particle physics)
3.宇宙学的例子 (Examples in Cosmology)

E.生成模型（Generative Models）
F.展望和挑战（ Outlook and Challenges）

作者：Giuseppe Carleo ，Ignacio Cirac ，Kyle Cranmer ，Laurent Daudet ，Maria Schuld ，Naftali Tishby ，Leslie Vogt-Maranto ，Lenka Zdeborová
翻译：Wendy

摘要

机器学习包含用于大量数据处理任务的广泛算法和建模工具，这些已进入近年来最科学的学科。我们以选择性的方式回顾了有关机器学习与物理科学之间的交叉领域的最新研究。这包括以物理见解为动力的机器学习（ML）的概念性发展，机器学习技术在物理学中多个领域的应用以及这两个领域之间的交叉应用。在给出了机器学习方法和原理的基本概念之后，我们描述了如何 使用统计物理学来理解机器学习中的方法的示例。然后，我们将描述 ML方法在粒子物理学和宇宙学，量子多体物理学，量子计算以及化学和材料物理学中的应用。我们还将重点介绍旨在 加速ML的新型计算体系结构的研究和开发。在每个部分中，我们都描述了最近的成功以及特定领域的方法和挑战。

Ⅲ.粒子物理与宇宙学（ PARTICLE PHYSICS AND COSMOLOGY）

从正在进行中的有计划的实验中，有各种各样的组合可以很好地探索宇宙，从难以想象的小基本粒子世界到令人敬畏的宇宙规模。诸如大型强子对撞机（Large Hadron Collider，LHC）和大型天气观测望远镜（Large Synoptic Survey Telescope ，LSST）之类的实验可提供大量数据，可与特定理论模型的预测进行比较。这两个领域都有完善的物理模型作为基础假设：粒子物理和ΛCDM宇宙学的标准模型，其中包括冷暗物质和宇宙常数Λ。有趣的是，所考虑的大多数其他假设都是在相同的理论框架中提出的，即量子场论和广义相对论。尽管有如此敏锐的理论工具，但挑战仍然是艰巨的，因为与零值的预期偏差预计将是难以置信的微小，而揭示这种细微差别需要对复杂的实验设备进行稳健的处理。使统计推断复杂化的是，对数据的最高保真度预测不是来自简单的封闭式方程式，而是来自复杂的计算机模拟。机器学习在粒子物理学和宇宙学中掀起了一股浪潮，因为它提供了一系列技术来应对这些挑战，并提出了激发大胆新策略的新观点。令人兴奋的是，这些领域涵盖了理论和实验方面，既包括具有直接影响的应用，又包括从长远来看将发生更多变革的前景。

A.模拟的作用（The role of the simulation）

在粒子物理学和宇宙学中使用机器学习的一个重要方面是使用计算机模拟来生成标记训练数据{Xµ，yµ} n (µ = 1)的样本。例如，当目标y指的是粒子类型，特定的散射过程或基础理论中出现的参数时，通常可以直接在模拟代码中指定目标y，以便模拟直接采样X〜p（·| y）。在其他情况下，模拟不是直接以y为条件，而是提供样本（X，Z）〜p（·），其中Z是描述模拟内部发生的事情的潜在变量，但在实际实验中无法观察到。如果可以通过函数y（Z）从这些潜在变量中计算出目标标签，则还可以从仿真中创建标签化的训练数据{Xµ，y（Zµ）} n( µ = 1)。使用高保真模拟生成标记的训练数据不仅是在这些领域进行监督学习的早期成功的关键，而且还是解决这种方法缺点的研究重点。

粒子物理学家已经开发出一套高保真模拟系统，这些模拟是分层构成的，用于描述各种长度尺度上的相互作用。这些模拟的组成部分包括量子域理论的费曼图解扰动展开，复杂辐射模式的现象学模型以及检测器中粒子与物质相互作用的详细模型。虽然生成的仿真具有很高的保真度，但仿真本身具有可以调整的自由参数，并且在下游分析任务中必须考虑到仿真中的残留不确定性数量。

同样，宇宙学家可以使用广义相对论以及相关的物质和辐射非引力效应（在结构形成过程中变得越来越重要）来模拟不同长度尺度下的宇宙演化。与数十亿重力相互作用的大型物体的计算昂贵的N体仿真相比，在特定的设置中可以进行大量的近似处理，从而提供了极大的加速，而一旦包含非重力反馈效应，这种模拟的花费将变得过高。

宇宙学模拟通常涉及由于原始量子波动而导致的随机初始条件的确定性演化。N体模拟非常昂贵，因此模拟相对较少，但它们涵盖了较大的时空量，该量在统计上是各向同性的，并且在大范围内是均匀的。相反，从最初的高能散射到探测器中的低能相互作用，粒子物理模拟都是随机的。高能对撞机实验的仿真可以并行方式在硬件上运行，但是物理目标需要大量的模拟碰撞。

由于仿真在这些领域中起着至关重要的作用，因此机器学习中的许多最新研究都以一种或另一种方式与仿真相关。这些近期工作的目标是：

通过将领域知识直接整合到机器学习模型中来 开发更具数据效率的技术 ；
将模拟中的 不确定因素 纳入训练过程；
开发可用于实际数据且不依赖模拟的弱监督程序；
开发异常检测算法以发现数据中的异常特征，而无需模拟特定的信号假设；
改善仿真的调整，重新加权或调整仿真数据以 更好地匹配真实数据，或使用机器学习为仿真和真实数据之间的残差建模；
学习用于仿真的快速神经网络代理，该代理可用于快速生成合成数据；
开发有效利用模拟的近似推理技术；
学习可直接用于统计推断的快速神经网络代理。

B.粒子物理学中的分类和回归（Classiﬁcation and regression in particle physics）

机器学习技术已经在实验粒子物理学中使用了数十年，以帮助进行粒子识别和事件选择，这可以看作是分类任务。机器学习也已用于重建，可以看作是回归任务。监督学习用于基于大量标记的训练样本{Xµ，yµ} n(µ = 1)来训练预测模型，其中X表示输入数据，y表示目标标签。在进行颗粒识别的情况下，输入特征X表征检测器中的局部能量沉积，标记y表示少数颗粒种类（例如，电子，光子，介子等）之一。在重建任务中，使用了相同类型的传感器数据X，但是目标标记y是指负责这些能量沉积的粒子的能量或动量。这些算法适用于LHC数据的批量数据处理。

事件选择是指选择与目标分析任务最相关的一小部分碰撞的任务。例如，在寻找希格斯玻色子时，超对称性和暗物质数据分析人员必须选择与这些假设的“信号”过程特征一致的LHC数据的一小部分。通常，这些事件选择要求也可以通过所谓的“背景”过程来满足，这些过程由于实验限制或基本的量子力学效应而模仿信号的特征。以其最简单的形式进行的搜索减少了将满足这些要求的数据中的事件数量与仅背景虚假假设和信号加背景虚假假设的预测进行比较。因此，事件选择要求在拒绝后台过程和接受信号过程中越有效，则结果统计分析将越有效。在高能物理学中，机器学习分类技术传统上被称为 多变量分析，以强调与基于简单阈值（或“切割”）的传统技术的对比，传统阈值适用于精心选择或设计的特征。

在1990年代和2000年代初期，简单的前馈神经网络通常用于这些任务。十多年来，神经网络很大程度上被 增强决策树（BDT） 取代，成为分类和回归任务的必经之路（Breiman等，1984； Freund和Schapire，1997； Roe等，2005）。从2014年左右开始，基于深度学习的技术应运而生，并被证明在多种应用中具有更强大的功能（有关历史的近期回顾，请参见参考文献（Guest等，2018； Radovic等，2018））。

深度学习首先用于事件选择任务，其目标是根据标准模型之外的理论来假设虚拟粒子。它不仅性能优于增强型决策树，而且不需要经过工程设计的功能即可实现这一令人印象深刻的性能（Baldi等人，2014）。在此概念验证工作中，网络是一个深层的多层感知器，使用简化的检测器设置对它进行了非常大的训练。此后不久，引入了参数化分类器的概念，其中将二元分类器的概念扩展到了y = 1信号假设被提升为连续参数化的复合假设的情况，例如根据质量假设粒子的数量（Baldi等人，2016b）。

1.喷气物理学( Jet Physics)

强子对撞机（例如大型强子对撞机）上最丰富的相互作用会在最终状态下产生高能夸克和胶子。这些夸克和胶子放射出更多的夸克和胶子，由于约束现象 最终结合成色中性复合粒子。撞击探测器的介子和重子的准直喷雾统称为射流。几十年来，开发一种在理论上很健壮并且可用于测试 ***量子色动力学（QCD）***预测的射流结构的有用表征一直是粒子物理研究的活跃领域。此外，超出标准模型的物理学许多场景都预测会衰减为两个或更多个射流的粒子产生。如果产生的不稳定颗粒具有较大的动量，则将生成的射流增强，使射流重叠成具有非琐碎子结构的单个脂肪射流。从夸克和胶子的标准模型过程中，通过大量生产的喷气机对这些增压喷气机或胖喷气机进行分类，可以显着改善大型强子对撞机的物理范围。更一般而言，识别喷气机的祖先是一项分类任务，通常称为喷气机标记。

在首次将深度学习应用于事件选择之后不久，深度卷积网络就被用于检测喷气标签，其中低级检测器数据使其自身具有像图像的表示（Baldi等人，2016a； de Oliveira等人等人，2016年）。虽然机器学习技术已在粒子物理学中使用了数十年，但实践始终仅限于具有固定维数的输入特征X。射流物理学中的一个挑战是数据的自然表示形式是粒子，并且与射流相关的粒子数量会发生变化。递归神经网络在粒子物理学中的首次应用是在风味标记（ﬂavor tagging）的背景下（Guestet等，2016）。最近，关于使用不同网络架构（包括在序列，树和图形上运行的递归网络）的研究激增（有关喷气物理学的最新评论，请参见参考文献（Larkoski等人，2017））。这包括在架构设计中利用领域知识的混合方法。例如，受自然语言处理技术的启发，设计了递归网络，该递归网络在由一类喷射聚类算法创建的树结构上运行（Louppe等人，2017a）。类似地，网络的发展是受不变性的影响，即对呈现给网络的粒子进行排列不变，并对粒子的辐射方向图细节保持稳定（Komiske等，2018b，2019）。最近，已经组织了针对特定基准问题的不同方法的比较（Kasieczka等，2019）。

除了分类和回归之外，机器学习技术还用于密度估计和平滑光谱建模，在这种形式中，分析形式的动机不足，并且模拟存在重大不确定性（Frate等人，2017）。这项工作还允许人们用先验扩散而不是特定的具体物理模型来模拟替代信号假设。更抽象地讲，这项工作中的 高斯过程正用于对非均匀泊松点过程的强度进行建模，这是在粒子物理学，天体物理学和宇宙学中发现的一种情况。该工作线的一个有趣方面是，高斯过程核可以使用与物理学家直观地用来描述观测结果的因果模型清晰对应的组成规则来构造，这有助于解释性（Duvenaud等，2013）。

2.中微子物理学(Neutrino physics)

中微子与物质的相互作用非常弱，因此实验需要大体积的检测器才能达到可观的相互作用速率。不同类型的相互作用，无论它们来自中微子的不同种类还是背景宇宙射线过程，都在探测器体积中留下了局部能量沉积的不同模式。检测器体积均匀，这激发了卷积神经网络的使用。

深层卷积网络在粒子物理实验数据分析中的第一个应用是在使用 闪烁矿物油的NOVA实验 中。NOVA中的相互作用导致产生光，这是从两个不同的有利位置成像的。 NOVA开发了同时处理这两个图像的卷积网络（Aurisano等，2016）。他们的网络将相同纯度的电子中微子的选择效率（真实阳性率）提高了40％。该网络已用于搜索电子中微子的外观和假设的 无菌中微子。

同样，MicroBooNE实验可检测到在Fermilab中产生的中微子。它使用170吨液氩时间投射室。带电粒子使液氩电离，电离电子通过该体积漂移到三个线平面。处理后的结果数据由一个33兆像素的图像表示，该图像主要是噪声，而稀疏的是合法的能量沉积。MicroBooNE合作使用FasterRCNN（Ren等人，2015）来识别和定位与边界框的中微子相互作用（Acciarri等人，2017）。这一成功对于未来基于液氩时间投射室的中微子实验（例如Deep Underground Neutrino Experiment ，DUNE）非常重要。

除了加速器设施产生的能量相对较低的中微子外，还使用机器学习技术通过位于南极的IceCube天文台来研究高能中微子。特别是，3D卷积和图神经网络已应用于信号分类问题。在动态方法中，检测器阵列被建模为图形，其中顶点是传感器，而边缘是传感器的空间坐标的学习函数。发现图神经网络的性能优于传统的基于物理学的方法以及经典的3D卷积神经网络（Choma等人，2018）。

3.系统不确定性的稳健性 ( Robustness to systematic uncertainties)

实验粒子物理学家敏锐地意识到，模拟虽然非常精确，却并不完美。结果，社区制定了许多策略，这些策略大致分为两大类。首先涉及在使用模拟进行训练时合并错误建模的影响。这涉及通过模拟和分析链传播潜在的不确定性源（例如，校准，检测器响应，质子的夸克和胶子组成，以及来自扰动理论的高阶校正的影响等）。对于这些不确定性来源中的每一个，都包括一个讨厌的参数ν，并且通过这些讨厌的参数对所得的统计模型p（X | y，ν）进行参数化。此外，在惩罚最大似然分析的情况下，数据的似然函数用表示这些不确定性来源中的不确定性的项p（ν）进行了扩充。在机器学习的背景下，通常使用从标称模拟ν=ν0生成的数据来训练分类器和回归器，从而得出预测模型f（X |ν0）。将该预测模型视为固定的，可以使用模型p（X | y，ν）p（ν）通过f（X |ν0）传播ν中的不确定性。但是，基于这种方法的下游统计分析不是最佳的，因为未对预测模型进行训练，而未考虑ν的不确定性。

在机器学习文献中，这种情况通常称为由训练分布ν0和目标分布ν表示的两个域之间的协变量偏移。存在多种用于域适应的技术来训练对这种变化具有鲁棒性的分类器，但是它们倾向于局限于二进制域ν∈{train，target}。为了解决这个问题，开发了一种对抗训练技术，将域自适应扩展到ν∈Rq参数化的域（Louppe等人，2016）。对抗方法鼓励网络学习关键量，其中p（f（X）| y，ν）独立于ν，或者等效地p（f（X），v | y）= p（f（X）| y）p（ν）。这种对抗性方法也已用于算法公平性的环境中，在这种算法中，人们希望训练独立于（或与之相关的）特定连续属性或可观察量的分类器或回归器。例如，在射流物理学中，人们通常希望射流标签器与射流不变质量无关（Shimmin等人，2017）。以前，开发了一种称为uboost的不同算法来实现增强决策树的类似目标（Rogozhnikov等人，2015； Stevens和Williams，2013）。

在粒子物理学中用于处理模拟中系统错误建模的第二种通用策略是避免使用模拟对分布p（X | y）进行建模。在下文中，令R表示满足相应选择要求的数据的各个子集上的索引。已经开发出各种数据驱动策略，以将控制区域中的数据分布p（X | y，R = 0）与感兴趣区域中的分布p（X | y，R = 1）相关联。这些关系也涉及仿真，但是这种方法的技术是将这些关系建立在仿真的可靠方面。最简单的示例是通过标识由y和p（y | R = 0）≈1主导的数据R = 0的子集来估计特定过程y的分布p（X | y，R = 1）。这是一种极端情况，适用性受到限制。

近来，已经开发了仅在识别仅类别比例的区域或假设相对概率p（y | R）不是线性相关的弱监督技术（Komiske等人，2018a; Metodiev等人，2017））。该技术还假定分布p（X | y，R）独立于R，这在某些情况下是合理的，而在其他情况下是可疑的。该方法已被用来训练区分夸克和胶子的喷气式标签机，在夸克和胶子之间，模拟的精确度已不再足够，并且该方法的假设是合理的。这种弱监督数据驱动的方法是粒子物理机器学习的一项重大发展，尽管它仅限于部分问题。例如，如果目标类别y之一对应于数据中可能不存在或不存在的假设粒子，则此方法不适用。

4.触发方式 (Triggering)

必须通过对撞机实验（例如大型强子对撞机）收集大量数据，因为针对这种现象极为罕见。大部分冲突都包含先前已研究和表征的现象，与完整数据流相关的数据量实在太大。结果，对撞机实验使用了称为 触发器的实时数据缩减系统。 触发器决定要保留哪些事件以供将来分析以及丢弃哪些事件。ATLAS和CMS实验每100,000个事件中仅保留约1个。这些系统在不同程度上使用了机器学习技术。本质上，相同的粒子识别（分类）任务在这种情况下会出现，尽管在实时环境中，根据误报和否定的计算要求和性能是不同的。

LHCb实验一直是触发中使用机器学习技术的领导者。LHC触发器选择的数据大约有70％是通过机器学习算法选择的。最初，实验为此目的使用了增强的决策树（Gligorov和Williams，2013），后来被Yandex开发的MatrixNet算法取代（Likhomanenko等人，2015）。

触发系统通常使用专用的硬件和固件，例如现场可编程门阵列（FPGA）。最近，已经开发出工具来简化针对FPGA的机器学习模型的编译，以针对这些实时触发系统的需求（Duarte等人，2018; Tsaris等人，2018）。

5.理论粒子物理学 (Theoretical particle physics)

虽然粒子物理学和宇宙学中的大部分机器学习都集中在对观测数据的分析上，但也有一些示例将机器学习用作理论物理学中的工具。例如，机器学习已被用于表征弦论的概貌（Carifio等人，2017），识别量子色动力学（QCD）的相变（Pang等人，2018）并研究AdS / CFT对应关系（Hashimoto等，2018a，b） 。其中一些工作与将机器学习作为凝聚态物质或多体量子物理学中的工具的使用紧密相关。具体而言，深度学习已在格点QCD（LQCD）的背景下使用。在这个方向上的探索性工作中，深度神经网络被用来根据晶格配置预测QCD拉格朗日参数（Shanahan等人，2018）。许多多尺度动作匹配方法都需要这样做，目的是提高计算密集型LQCD计算的效率。这个问题被设置为回归任务，挑战之一是训练实例相对较少。此外，机器学习技术已被用于减少马尔可夫链中的自相关时间（Albergo等人，2019； Tanaka和Tomiya，2017b）。为了以较少的训练示例解决此任务，重要的是 利用已知的空间- 时间和局部规范在晶格数据中的对称性。考虑到对称性丰富，数据扩充不是可扩展的解决方案。取而代之的是，作者进行了 特征工程，这些工程施加了规范对称性和时空平移不变性。尽管这种方法被证明是有效的，但还是需要考虑一类较丰富的网络，它们与数据的对称性是等变的（或协变的）（此类方法在第III.F节中进行了讨论）。这项工作的延续是由Argon Leadership Computing Facility支持的。全新的Intel-Cray系统Aurora将具有超过1万种的能力，并且专门针对将传统高性能计算与现代机器学习技术结合在一起的问题。

C.宇宙学的分类与回归（ Classiﬁcation and regression in cosmology）

1.测光红移 (Photometric Redshift)

由于宇宙的膨胀，遥远的发光物体发生了红移，而距离-红移关系是观察宇宙学的基本组成部分。可以通过光谱学获得非常精确的红移估计值。然而，这种光谱调查是昂贵且费时的。基于宽带测光或在几个色带中成像的光度测量可以粗略估算光谱能量分布。光度红移是指从光度数据估计红移的回归任务。在这种情况下，地面实况训练数据来自精确的光谱调查。

传统的光度红移方法基于模板拟合方法（Benítez，2000； Brammer等，2008； Feldmann等，2006）。十多年来，宇宙学家还使用了基于神经网络的机器学习方法，并增强了决策树来进行光度红移（Carrasco Kind和Brunner，2013； Collister和Lahav，2004； Firth等人，2003）。这项工作的一个有趣的方面是，已超出了红移的点估计值的选择。存在各种方法来确定红移估计的不确定性并获得后验分布。

尽管不是从模拟生成训练数据，但是仍然存在这样的担忧，即训练数据的分布可能无法代表将应用模型的数据的分布。这种类型的协变量偏移是由光谱调查中的各种选择效果和光度调查中的细微差别引起的。暗能量调查（Dark Energy Survey）考虑了许多此类方法，并建立了验证过程以对其进行严格评估（Bonnett等人，2016）。最近，有人在使用层次模型来建立模型中的其他因果结构，以应对这些差异。用机器学习的语言来说，这些新模型有助于转移学习和领域适应。分层模型还旨在将传统模板拟合方法的可解释性与机器学习模型的灵活性相结合（Leistedt等人，2018）。

2.引力透镜的发现和参数估计 (Gravitational lens ﬁnding and parameter estimation)

广义相对论最引人注目的效果之一是引力透镜，其中巨大的前景物体扭曲了背景物体的图像。例如，当巨大的前景星系与背景源在天空上几乎重合时，就会发生强烈的引力透镜效应。这些事件是对大型星系暗物质分布的有力探测，可以提供有价值的宇宙学约束。但是，这些系统很少见，因此可扩展且可靠的镜头查找系统对于应对大型测量（如LSST，Euclid和WFIRST）至关重要。简单的前馈，卷积和残差神经网络（ResNets）已应用于该监督分类问题（Estrada等，2007； Lanusse等，2018； Marshall等，2009）。在这种情况下，训练数据来自使用PICS（宇宙强图像的管道）透镜进行模拟（Li等人，2016）进行强透镜射线追踪，以及使用LensPop（Collett，2015）进行模拟LSST观察。一旦确定，通过最大似然估计来表征透镜物体是一项计算量大的非线性优化任务。最近，卷积网络已被用于快速估计奇异等温椭球体密度分布的参数，通常用于对强透镜系统建模（Hezaveh等人，2017）。

3.其他示例(Other examples)

除了上面的例子（其中对象的基本事实与劳动密集型方法相对不明确）之外，宇宙学家还利用机器学习来推断涉及不可观察到的潜在过程或基本宇宙学模型参数的数量。例如，已经对3D卷积网络进行了训练，以根据暗物质的空间分布预测基本的宇宙学参数（Ravanbakhsh等人，2017年）（见图1）。在这项概念验证工作中，使用计算密集型N体模拟对网络进行了训练，以模拟宇宙中暗物质的演化，并假设标准ΛCDM宇宙学模型中的10个参数具有特定值。在该技术对可见物质的实际应用中，将需要对可见示踪剂相对于潜在暗物质分布的偏差和方差建模。为了缩小这一差距，已经对卷积网络进行了训练，以 学习暗物质和可见星系之间的快速映射（Zhang等人，2019），从而可以在模拟精度和计算成本之间进行权衡。这项工作面临的挑战（对于固态物理学，晶格场论和许多体量子系统而言，是常见的），因为仿真的计算量很大，因此大型仿真Xµ的统计独立实现相对较少。随着深度学习趋向于需要大量的标注训练数据集，因此已经探索了各种类型的子采样和数据增强方法来改善这种情况。二次采样的另一种方法是所谓的背景，通过在反向传播管道中引入随机潜在因子，即使在单个样本上也可以提供损失函数的随机梯度（Golkar和Cranmer，2018）。

对基本宇宙学模型的推断也出现在分类环境中。尤其是，带有大量中微子的修正重力模型可以模拟标准ΛCDM模型所预测的弱透镜可观察物的预测。将Xµ限制为二阶统计量时，存在的简并性可以通过合并高阶统计量或弱透镜信号的其他丰富表示形式来打破。特别是（Peel 等，2018）的作者构造了 弱透镜信号的小波分解作为卷积网络输入 的新颖表示。由此产生的方法能够以83％–100％的精度区分先前退化的模型。

深度学习也已用于估计星系团的质量，这些星系团是宇宙中最大的受重力约束的结构，也是强大的宇宙学探测工具。这些星系团的质量大部分以暗物质的形式出现，这是无法直接观察到的。可以通过重力透镜，对团簇内介质进行X射线观察或对星团的星系进行动力学分析来估计星系团的质量。机器学习用于动态集群质量估计的第一次使用是在仅暗物质的模拟（Ntampaka等，2015，2016）上使用支持分配机（Póczos等，2012）进行的。***使用MACSIS仿真（Henson等，2016）将许多非神经网络算法（包括高斯过程回归（内核岭回归），支持向量机，梯度提升树回归等）应用于此问题（Henson等，2016）***。该模拟超越了仅暗物质模拟，并且融合了各种天体物理过程的影响，并允许开发可应用于观测数据的真实处理管道。大型调查（例如eBOSS，DESI，eROSITA，SPT-3G，ActPol和Euclid）推动了对准确，自动化的质量估算流程的需求。作者发现，与传统的σ-M关系相比，使用机器学习技术预测的真实质量比降低了4倍（Armitage 等，2019）。最近，卷积神经网络已被用于缓解病毒标度关系中的系统变量，从而进一步改善了动态质量估计（Ho等人，2019）。卷积神经网络也已用于通过合成（模拟）X射线观测来估计星团质量。卷积神经网络也已用于通过星系团的合成（模拟）X射线观测来估计团块质量，与传统的基于X射线发光度的方法相比，作者发现预测质量的散布减小了。

D.逆问题和可能的无罩推论（Inverse Problems and Likely-hood- free Inference）

正如反复强调的那样，粒子物理学和宇宙学都具有积极进取的高保真正演模拟的特征。这些前向模拟要么是内在随机的（例如在粒子模拟中发现的概率衰减和相互作用的情况下），要么是皮下性的（例如在重力透镜法或N体重力模拟下）。但是，即使是确定性的物理模拟，通常也会在基于Poission计数或仪器噪声模型的基础上对观测值进行概率描述。在这两种情况下，可以考虑将模拟隐式定义为分布p（X，Z | y），其中X表示观察到的数据，Z是未观察到的潜在变量，它们在模拟中具有随机值，y是正向模型的参数，例如系数在Lagrangian或ΛCDM宇宙学中的10个参数。许多科学任务可被描述为反问题，其中人们希望从X = x推断Z或y。我们考虑过的最简单的情况是y代表分类值的分类，而y∈Rd回归。点估计ˆ y（X = x）和ˆ Z（X = x）是有用的，但在科学应用中，我们经常需要估计的不确定性。

在许多情况下，反问题的解决方案是错误的，因为X的小变化会导致估计值的大变化。这意味着估算器将具有高方差。在某些情况下，前向模型等效于线性算子，并且最大似然估计y ^ MLE(X) 或 z^MLE(X) 可以表示为矩阵求逆。在这种情况下，逆条件的不稳定性会与条件较差的正向模型有关。尽管最大似然估计可能会保持不变，但方差往往较高。惩罚最大似然，岭回归（Tikhonov正则化）和高斯过程回归是偏差权衡的密切相关方法。

在粒子物理学中，这种类型的问题通常称为展开。在那种情况下，人们通常会对检测器作用之前的碰撞的某些运动学特性的分布感兴趣，并且X代表在检测器作用折叠后该量的拖尾形式。同样，估计描述质子内部夸克和胶子的部分密度函数也可以看作是这种反问题（Ball等人，2015； Forteet等人，2002）。最近，神经网络和具有更复杂，受物理启发的内核的高斯过程都已应用于这些问题（Bozson等人，2018; Frate等人，2017）。在宇宙学的背景下，一个反问题的例子是将激光干涉仪重力波观测器（LIGO）时间序列降为重力波的基础波形（Shen等人，2019） 。生成对抗网络（GANs）甚至已经被用于逆问题的背景中，在逆问题中，它们被用来对天真反卷积限制之外的星系图像进行去噪和恢复（Schawinski等人，2017）。另一个示例涉及在被前景物体重力镜头之前估计背景物体的图像。在这种情况下，很难描述背景对象的物理动机。最近，引入了递归推理机（Putzky and Welling，2017）作为隐式学习此类反问题的先验方法，并将其成功应用于强引力透镜（Morningstar等人，2018,2019）。

解决逆问题的更雄心勃勃的方法包括提供给定X的y的详细概率表征。在常例范式中，人们希望表征似然函数L（y）= p（X = x | y），而在贝叶斯形式主义中，人们希望表征后验概率分布p（y | X = x）∝ p（X = x | y）p（y）。对于给定X的潜在变量Z的推论发生了类似情况。基于可能性的详细建模，马尔可夫链蒙特卡洛（MCMC），粒子物理学和宇宙论都拥有完善的统计推论方法（Foreman-Mackey等，2013 ），汉密尔顿蒙特卡罗（Hamiltonian Monte Carlo）和变分推理（Jain等人，2018; Lang等人，2016; Regier等人，2018）。但是，所有这些方法都要求似然函数是易处理的。

1.无似然推理( Likelihood-free Inference)

令人惊讶的是，由模拟器隐式定义的概率密度或可能性p（X = x | y）通常很棘手。象征性地，概率密度可以写成p（X | y）=∫p（X，Z | y）dZ，其中Z是模拟的潜在变量。最新模拟的潜在空间是巨大且高度结构化的，因此无法通过分析来执行此积分。在大型强子对撞机的一次碰撞模拟中，Z可能具有数亿个组件。在实践中，模拟通常基于蒙特卡洛技术，并生成样本（Xµ，Zµ）〜p（X，Z | y），据此可以估算密度。挑战在于，如果X是高维的，则很难准确地估计这些密度。例如，基于朴素直方图的方法无法缩放到高维度，并且核密度估计技术仅在大约5维范围内值得信赖。挑战在于，分布具有较大的动态范围，有趣的物理学常位于分布的尾部。

由模拟隐式定义的似然性的难解性不仅是粒子物理学和宇宙学的基础问题，也是许多其他科学领域的基础问题，包括流行病学和系统发育学。这激励了所谓的无似然推理算法的发展，该算法仅要求能够以正向模式从仿真生成样本。

一种著名的技术是近似贝叶斯计算（ABC）。在ABC中，人们使用MCMC或拒绝采样方法执行贝叶斯推理，在这种方法中，似然度近似于概率p（ρ（X，x）<ε），其中x是要作为条件的观测数据，ρ（x0，x ）是x与模拟器x0的输出之间的某种距离度量，而ε是公差参数。当ε→0时，将恢复精确的贝叶斯推论。但是，该过程的效率消失了。 ABC的挑战之一，尤其是高维x的挑战之一，是距离度量ρ（x0，x）的规范，该度量要保持合理的接受效率而又不降低推理质量（Beaumontet等，2002； Marinet等， 2012； Marjoram等，2003； Sisson和Fan，2011； Sisson等，2007）。这种估计可能性的方法与使用直方图或核密度估计来近似ˆ p（x | y）≈p（x | y）的粒子物理学中的传统实践非常相似。在这两种情况下，都需要领域知识来识别有用的摘要，以减少数据的维数。ABC技术的一个有趣扩展是利用通用概率编程。特别是，一种称为推理编译的技术是一种重要的采样的复杂形式，其中神经网络控制概率程序中的随机数生成，以使模拟偏差以产生更接近观察到的x的输出x0（Le等，2017 ）。

术语ABC通常与更通用的术语无可能性推断同义；然而，还有许多其他方法涉及学习近似似然或似然比，该近似似然或似然比用作难处理似然（比率）的替代。例如，已使用具有自回归模型和归一化流量的神经密度估计（Larochelle和Murray，2011年; Papamakarios等人，2017年; Rezende和Mohamed，2015年）用于此目的并扩展到更高维度的数据（Cranmer和Louppe，2016年） ; Papamakarios等人，2018）。或者，训练分类器来区分x〜p（x | y）和x〜p（x | y0）可以用来估计似然比ˆ r（x | y，y0）≈p（x | y）/ p（x | y0），可用于推论常识范式或贝叶斯范式（Brehmer等，2018c; Cranmer等，2015; Hermans等，2019）。

2.粒子物理学中的例子 (Examples in particle physics)

包括希格斯玻色子的发现在内的成千上万的物理学成果涉及 基于替代似然率ˆ p（x | y）的统计推断，该似然率由密度估计技术构建，该密度估计技术应用于从模拟生成的合成数据集中。这些通常仅限于一维或二维汇总统计信息，或者除了观察到的事件数量外根本没有任何功能。尽管术语“无可能性推断”相对较新，但它是实验粒子物理学方法学的核心。

最近，已经开发了一套基于神经网络的无可能性推理技术，并将其应用于物理模型，超越了以有效场理论（EFT）表示的标准模型（Brehmer等人，2018a，b）。EFT提供了围绕标准模型的理论的系统扩展，该标准模型由量子力学算子的系数进行参数化，量子算子在这种情况下扮演y的角色。这项工作中一个有趣的发现是，即使似然比和似然比是难解的，但联合似然比r（x，z | y，y0）和联合得分t（x，z | y）=∇ylogp（x ，z | y）易于处理，可用于扩充训练数据（见图2）并显着提高这些技术的样本效率（Brehmer等人，2018c）。

另外，推论编译技术已经被应用于推论τ-轻子衰变。这种概念验证需要开发概率编程协议，该协议可以集成到现有的领域特定的仿真代码中，例如SHERPA和GEANT4（Baydin等，2018； Casado等，2017）。这种方法提供了对潜在变量p（Z | X = x）的贝叶斯推断和更深的可解释性，因为后验对应于模拟的完整堆栈轨迹上的分布，从而可以概率性地检查模拟的任何方面。

由粒子物理学的挑战激发的另一种无可能性推理技术被称为 对抗性变分优化（AVO（ Louppe等人，2017b）。AVO平行于生成对抗网络，其中生成模型不再是神经网络，而是领域特定的仿真。目标不是优化网络的参数，而是优化仿真的参数，以使生成的数据与目标数据分布相匹配。主要挑战在于，与神经网络不同，大多数科学模拟器都是不可区分的。为了解决这个问题，使用了变分优化技术，该技术提供了 不同的代理损失函数。目前正在研究这项技术以调整仿真参数，这是一项计算量大的任务，最近还使用了贝叶斯优化（Ilten等人，2017）。

3.宇宙学的例子 (Examples in Cosmology)

在宇宙学中，ABC的早期用途包括限制银河系的厚盘形成情况（Robin等人，2014年）以及推断高红移时星系形态转化率的推论（Cameron和Pettitt，2012年），目的是追踪银河系。从Ia型超新星测量得出的哈勃参数演变。这些经验促使开发诸如CosmoABC之类的工具，以简化该方法在宇宙学应用中的应用（Ishida等人，2015）。

最近，基于宇宙学的经验，还开发了基于机器学习的无可能性推理方法。为了应对ABC对于高维观测X的挑战，开发了一种数据压缩策略，该策略可学习摘要统计信息，从而最大程度地利用Fisher参数上的信息（Alsing等人，2018; Charnock等人，2018）。学到的摘要统计量近似一些名义或基准参数值的小邻域中隐式似然的充分统计量。这种方法与（Brehmer等人，2018c）的方法紧密相关。最近，这些方法已扩展到 学习对系统不确定性具有鲁棒性的汇总统计信息（Alsing和Wandelt，2019） 。

E.生成模型（Generative Models）

机器学习研究中的一个活跃领域涉及使用无监督学习来训练生成模型，以产生与某些经验分布匹配的分布。这包括生成对抗网络（GAN）（Goodfellow等，2014），变分自编码器（VAE）（Kingma和Welling，2013; Rezende等，2014），自回归模型和基于归一化流的模型（Larochelle和Murray），2011； Papamakarios等，2017； Rezende和Mohamed，2015）。

有趣的是，激发无可能性推断的同一问题，由模拟器隐式定义的密度的难处理性也出现在生成对抗网络（GAN）中。如果GAN的密度易处理，则可以通过标准的最大似然来训练GAN，但是由于它们的密度难以控制，因此需要技巧。诀窍是引入一个对手-即区分网络，用于对生成模型中的样本和目标分布中的样本进行分类。判别器 有效地估计了两个分布之间的似然比，这提供了与基于分类器的无似然推理方法的直接联系（Cranmer and Louppe，2016）。

在操作上，这些模型起着与传统科学模拟器相似的作用，尽管传统模拟代码还为基于物理原理的基础数据生成过程提供了因果模型。但是，由于感兴趣的分布是从低水平的微观物理描述中出现的，因此传统的科学模拟器通常非常慢。例如，在大型强子对撞机上模拟碰撞涉及原子级的电离和闪烁物理学。同样，宇宙学模拟涉及大量质量物体之间的引力相互作用，并且还可能包含涉及辐射，恒星形成等的复杂反馈过程。因此，学习这些模拟的快速逼近法非常有价值。

在粒子物理学中，此方向上的早期工作包括用于量热计中粒子能量沉积的GAN（Paganini等人，2018a，b），ATLAS合作正在对其进行研究（ATLAS Collaboration，2018）。在宇宙学中，已使用生成模型来学习宇宙结构形成的模拟（Rodríguez等人，2018）。在一种有趣的混合方法中，深度神经网络被用来根据基于线性摄动理论的快速物理模拟中的残差来预测宇宙的非线性结构形成（He等，2018）。

在其他情况下，动机不高的模拟并不总是存在或不切实际。然而，对于此类数据而言，具有生成模型的数据对于校准很有价值。在这个方向上的一个说明性例子来自（Ravanbakhshet等人，2016），见图3。作者指出，下一代对弱引力透镜的宇宙学调查依赖于对遥远星系表观形状的精确测量。但是，形状测量方法需要精确的校准才能满足科学分析的精度要求。此校准过程具有挑战性，因为它需要大量昂贵的高质量星系图像。因此，GAN启用了参数引导程序的隐式泛化。

F.展望和挑战（ Outlook and Challenges）

尽管粒子物理学和宇宙学在利用机器学习方法方面有着悠久的历史，但机器学习所应用的主题范围却显着增长。如今，机器学习被视为应对升级的高光度LHC挑战的关键策略（Albertsson等人，2018; Apollinari等人，2015），并且正在影响未来在宇宙学和粒子物理学领域的实验策略（ Ntampaka等，2019）。在大型强子对撞机中特别引起关注的一个领域是 识别高发光环境中带电粒子留下的轨迹的挑战（Farrell 等，2018），这是最近kaggle比赛挑战的重点。

在将机器学习应用于物理问题的几乎所有领域中，都希望以已知存在于数据或数据生成过程中的层次结构，组成结构，几何结构或对称形式的形式并入领域知识。最近，机器学习社区在这方面进行了大量工作（Bronsteinet等，2017; Cohen和Welling，2016; Cohenet等，2018; Cohenet等，2019; Kondor，2018; Kondor等。，2018; Kondor and Trivedi，2018）。这些进展受到物理学家的密切关注，并已被纳入该领域的当代研究中。

你可能感兴趣的:(物理学,机器学习)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
第九章肿瘤放射治疗晨翕
放射物理学：主要研究各种放射源的性能特点、治疗剂量学、质量控制、质量保证及辐射防护等放射生物学：主要研究机体正常组织和肿瘤组织对射线对反应及如何人为地改变这些反应对质和量。放射技术学：主要研究具体运用各种放射源及设备治疗肿瘤患者，包括射野设置、体位固定、定位、摆位操作等技术实施。临床放射肿瘤学：在临床肿瘤学的基础上，研究肿瘤放射治疗的适应证，根据病理、分期、预后确定治疗策略，综合运用放射物理、放射
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
大数据毕业设计hadoop+spark+hive知识图谱租房数据分析可视化大屏租房推荐系统 58同城租房爬虫房源推荐系统房价预测系统计算机毕业设计机器学习深度学习人工智能 2401_84572577 程序员大数据 hadoop 人工智能
做了那么多年开发，自学了很多门编程语言，我很明白学习资源对于学一门新语言的重要性，这些年也收藏了不少的Python干货，对我来说这些东西确实已经用不到了，但对于准备自学Python的人来说，或许它就是一个宝藏，可以给你省去很多的时间和精力。别在网上瞎学了，我最近也做了一些资源的更新，只要你是我的粉丝，这期福利你都可拿走。我先来介绍一下这些东西怎么用，文末抱走。（1）Python所有方向的学习路线（
【机器学习与R语言】1-机器学习简介苹果酱0567 面试题汇总与解析 java 中间件开发语言 spring boot 后端
1.基本概念机器学习：发明算法将数据转化为智能行为数据挖掘VS机器学习：前者侧重寻找有价值的信息，后者侧重执行已知的任务。后者是前者的先期准备过程：数据——>抽象化——>一般化。或者：收集数据——推理数据——归纳数据——发现规律抽象化：训练：用一个特定模型来拟合数据集的过程用方程来拟合观测的数据：观测现象——数据呈现——模型建立。通过不同的格式来把信息概念化一般化：一般化：将抽象化的知识转换成可用
Python前沿技术：机器学习与人工智能 4.0啊 Python 人工智能 python 机器学习
Python前沿技术：机器学习与人工智能一、引言随着科技的飞速发展，机器学习和人工智能（AI）已经成为了计算机科学领域的热门话题。Python作为一门易学易用且功能强大的编程语言，已经成为了这两个领域的首选语言之一。本文将深入探讨Python在机器学习和人工智能领域的应用，以及一些前沿技术和工具。二、Python机器学习基础2.1机器学习概述机器学习是人工智能（AI）的一个关键子集，它的核心在于让
chatgpt赋能python：如何在Python中计算平均值 tulingtest ChatGpt python chatgpt numpy 计算机
如何在Python中计算平均值计算平均值是数据分析、统计和机器学习等许多领域中的常见任务。Python作为一门功能强大且易于学习的编程语言，为计算平均值提供了多种方法。在本文中，我们将介绍如何在Python中计算平均值。什么是平均值简单来说，平均值是一组数字的总和除以数字的数量。例如，对于数字序列1，3，5，7，9，平均值是(1+3+5+7+9)/5=5。平均值在数据分析中非常有用，因为它可以提供
Python 初学者入门必知： Anaconda是什么？有什么作用？怎么使用？懒大王爱吃狼 Python基础 python 开发语言 python基础 python学习 anaconda anaconda安装 python教程
初学者在学习Python时，经常看到的一个名字是Anaconda。究竟什么是Anaconda，为什么它如此受欢迎？在这篇文章中，我们将探讨Anaconda，了解Anaconda的从安装到使用的。Anaconda是一个免费开源的Python和R编程发行版，包含上千个适用于数据科学和机器学习的包。同时，配备了Spyder和Jupyternotebook等工具，初学者可以使用它们来学习Python，使用
每天五分钟玩转深度学习PyTorch：模型参数优化器torch.optim 幻风_huanfeng 深度学习框架pytorch 深度学习 pytorch 人工智能神经网络机器学习优化算法
本文重点在机器学习或者深度学习中，我们需要通过修改参数使得损失函数最小化(或最大化)，优化算法就是一种调整模型参数更新的策略。在pytorch中定义了优化器optim，我们可以使用它调用封装好的优化算法，然后传递给它神经网络模型参数，就可以对模型进行优化。本文是学习第6步(优化器)，参考链接pytorch的学习路线随机梯度下降算法在深度学习和机器学习中，梯度下降算法是最常用的参数更新方法，它的公式
一切皆是映射：AI的去中心化：区块链技术的融合 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
一切皆是映射：AI的去中心化：区块链技术的融合作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：AI，区块链，去中心化，智能合约，共识机制，数据安全，隐私保护，分布式账本技术，机器学习，数据隐私1.背景介绍1.1问题的由来随着人工智能（AI）技术的快速发展，其在各个领域的应用越来越广泛，从自动驾驶、智能医疗到金融服务，AI正在改变着我们的生活。
第五届核磁机器学习班（训练营：2023.6.5~6.17）茗创科技
茗创科技专注于脑科学数据处理，涵盖（EEG/ERP,fMRI,结构像,DTI,ASL,FNIRS）等，欢迎留言讨论及转发推荐，也欢迎了解茗创科技的脑电课程，数据处理服务及脑科学工作站销售业务，可添加我们的工程师（微信号MCKJ-zhouyi或17373158786）咨询。★课程简介★基于血氧水平依赖的功能磁共振成像(fMRI)技术,利用其数据构建的功能性脑网络后,发现脑并不是一个单纯对外界刺激进行
ViewController添加button按钮解析。（翻译）张亚雄 c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m // Reservation software // // Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查开窍的石头 mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作在mongo中对于不存在的表当你用db.表名他会自动统计下边用到的user是表明，db代表的是数据库添加(insert):
log4j配置 0624chenhong log4j
1) 新建java项目 2) 导入jar包，项目右击，properties—java build path—libraries—Add External jar，加入log4j.jar包。 3) 新建一个类com.hand.Log4jTest package com.hand; import org.apache.log4j.Logger; public class
多点触摸(图片缩放为例) 不懂事的小屁孩多点触摸
多点触摸的事件跟单点是大同小异的，上个图片缩放的代码，供大家参考一下 import android.app.Activity; import android.os.Bundle; import android.view.MotionEvent; import android.view.View; import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析换个号韩国红果果 JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。 clientWidth 只包括内容区 padding 不包括border。 clientLeft = offsetWidth -clientWidth 即这个元素border的值 offsetLeft 若无已定位的包裹元素
数据库产品巡礼：IBM DB2概览蓝儿唯美 db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统，其包含了对XML，图像存储和Java脚本对象表示（JSON）的支持。DB2可被各种类型的企业使用，它提供了一个数据平台，同时支持事务和分析操作，通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统 DB2可应用于以下三个主要的平台: 工作站，DB2可在Linus、Unix、Windo
java笔记5 a-john java
控制执行流程： 1，true和false 利用条件表达式的真或假来决定执行路径。例：（a==b）。它利用条件操作符“==”来判断a值是否等于b值，返回true或false。java不允许我们将一个数字作为布尔值使用，虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值，那么首先必须用一个条件表达式将其转化成布尔值，例如if(a!=0)。 2，if-els
Web开发常用手册汇总 aijuans PHP
一门技术，如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术，非常好，却得不到普遍运用的原因。正如我们学习一门技术，过程大概是这个样子： ①我们日常工作中，遇到了问题，困难。寻找解决方案，即寻找新的技术； ②为什么要学习这门技术？这门技术是不是很好的解决了我们遇到的难题，困惑。这个问题，非常重要，我们不是为了学习技术而学习技术，而是为了更好的处理我们遇到的问题，才需要学习新的
今天帮助人解决的一个sql问题 asialee sql
今天有个人问了一个问题，如下： type AD value A
意图对象传递数据百合不是茶 android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的 1,将下面的代码添加到main.xml中 <?xml version="1.0" encoding="utf-8"?> <LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句 bijian1013 oracle object session kill
一.查询锁定的表如下语句，都可以查询锁定的表语句一： select a.sid, a.serial#, p.spid, c.object_name, b.session_id, b.oracle_username, b.os_user_name from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件［tar.gz］征客丶 mysql osx
场景：在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。环境：mac osx 10.10、mysql 5.6 的二进制文件步骤：[所有目录请从根“/”目录开始取，以免层级弄错导致找不到目录] 1、下载 mysql 5.6 的二进制文件，下载目录下面称之为 mysql5.6SourceDir；下载地址：http://dev.mysql.com/downl
分布式系统与框架 bit1129 分布式
RPC框架 Dubbo 什么是Dubbo Dubbo是一个分布式服务框架，致力于提供高性能和透明化的RPC远程服务调用方案，以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装，包括多种线程模型，序列化，以及“请求-响应”模式的信息交换方式。集群容错: 提供基于接
那些令人蛋痛的专业术语白糖_ spring Web SSO IOC
spring 【控制反转(IOC)/依赖注入(DI)】：由容器控制程序之间的关系，而非传统实现中，由程序代码直接操控。这也就是所谓“控制反转”的概念所在：控制权由应用代码中转到了外部容器，控制权的转移，是所谓反转。简单的说：对象的创建又容器(比如spring容器)来执行，程序里不直接new对象。 Web 【单点登录(SSO)】：SSO的定义是在多个应用系统中，用户
《给大忙人看的java8》摘抄 braveCS java8
函数式接口：只包含一个抽象方法的接口 lambda表达式：是一段可以传递的代码你最好将一个lambda表达式想象成一个函数，而不是一个对象，并记住它可以被转换为一个函数式接口。事实上，函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。方法引用：又是要传递给其他代码的操作已经有实现的方法了，这时可以使
编程之美-计算字符串的相似度 bylijinnan java 算法编程之美
public class StringDistance { /** * 编程之美计算字符串的相似度 * 我们定义一套操作方法来把两个不相同的字符串变得相同，具体的操作方法为： * 1.修改一个字符（如把“a”替换为“b”）; * 2.增加一个字符（如把“abdd”变为“aebdd”）; * 3.删除一个字符（如把“travelling”变为“trav
上传、下载压缩图片 chengxuyuancsdn 下载
/** * * @param uploadImage --本地路径(tomacat路径) * @param serverDir --服务器路径 * @param imageType --文件或图片类型 * 此方法可以上传文件或图片.txt,.jpg,.gif等 */ public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法 comsci 算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指：给定一个加权有向图G和源点s，对于图G中的任意一点v，求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法，因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。与迪科
oracle ASM中ASM_POWER_LIMIT参数 daizj ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT 该初始化参数用于指定ASM例程平衡磁盘所用的最大权值，其数值范围为0~11，默认值为1。该初始化参数是动态参数，可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下： SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序 dieslrae 快速排序
public void quickSort(int[] array){ this.quickSort(array, 0, array.length - 1); } public void quickSort(int[] array,int left,int right){ if(right - left <= 0
C语言学习六指针_何谓变量的地址一个指针变量到底占几个字节 dcj3sjt126com C语言
# include <stdio.h> int main(void) { /* 1、一个变量的地址只用第一个字节表示 2、虽然他只使用了第一个字节表示，但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了 3、他都只存了第一个字节地址，为什么只需要存一个字节的地址，却占了4个字节，虽然只有一个字节，但是这些字节比较多，所以编号就比较大，
phpize使用方法 dcj3sjt126com PHP
phpize是用来扩展php扩展模块的，通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下安装（fastcgi模式）的时候，常常有这样一句命令：代码如下: /usr/local/webserver/php/bin/phpize 一、phpize是干嘛的？ phpize是什么？ phpize是用来扩展php扩展模块的，通过phpi
Java虚拟机学习 - 对象引用强度 shuizhaosi888 JAVA虚拟机
本文原文链接：http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处！无论是通过计数算法判断对象的引用数量，还是通过根搜索算法判断对象引用链是否可达，判定对象是否存活都与“引用”相关。引用主要分为：强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1（完整软件包）下载地址 happyqing .net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1（完整软件包） http://www.microsoft.com/zh-cn/download/details.aspx?id=25150 Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新，包含很多基于 .NET Framewo
JAVA定时器的使用 jingjing0907 java timer 线程定时器
1、在应用开发中，经常需要一些周期性的操作，比如每5分钟执行某一操作等。对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。 privatejava.util.Timer timer; timer = newTimer(true); timer.schedule( newjava.util.TimerTask() { public void run()
Webbench 流浪鱼 webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html Webbench是知名的网站压力测试工具，它是由Lionbridge公司（http://www.lionbridge.com）开发。 Webbench能测试处在相同硬件上，不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容：每秒钟相
第11章动画效果（中） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
windows下制作bat启动脚本. sanyecao2314 java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子 tomcat_oracle java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文；解密是将密文转换回纯文本。　　数据的加解密属于密码学的范畴。通常，加密和解密都需要使用一些秘密信息，这些秘密信息叫做密钥，将纯文本转为密文或者转回的时候都要用到这些密钥。　　对称加密指的是发送者和接收者共用同一个密钥的加解密方法。　　非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥，两个不同的密钥的
Android_ViewStub 阿尔萨斯 ViewStub
public final class ViewStub extends View java.lang.Object android.view.View android.view.ViewStub 类摘要： ViewStub 是一个隐藏的，不占用内存空间的视图对象，它可以在运行时延迟加载布局资源文件。当 ViewSt