Wendy_WHY_123

人工智能AI与物理学（二）（A Topical Review There is no royal road to unsupervised learning）

Physicist’s Journeys Through the AI World - A Topical Review There is no royal road to unsupervised learning

摘要（Abstract）
Ⅳ SCINET：物理机器（SCINET: A PHYSICS MACHINE）

A.实验一：阻尼摆实验（Experiment One: Damped Pendulum）
B.实验二：量子位预测（B. Experiment Two: Qubits）
C.实验三：日心说模型（ Experiment Three: Heliocentric Model）

Ⅴ AI物理学家（THE AI PHYSICIST）

A.框架（ Architecture）
B.学习算法（B. The Learning Algorithm）

1.提出理论（ Proposing theories）
2.分而治之算法（ Divide-and-conquer algorithm）
3.添加理论（Adding theories）
4.奥卡姆剃刀原理（Occam’s razor）
5.统一算法（Uniﬁcation algorithm）

C.总结获得的知识（Summing up Acquired Knowledge）

1.消除过度领域（1. Eliminating transition domains）

Ⅵ 结论（ CONCLUSION）

A.结束语（Concluding Remarks）
B.展望（ Outlook）

附录

A.激活函数（Activation Functions）
B.K-均值聚类（ K-means Clustering）

原文作者：Imad Alhousseini,Wissam Chemissany,Fatima Kleit,Aly Nasrallah
翻译者：Wendy

摘要（Abstract）

以最简单的形式定义人工智能（AI），是使机器变得智能的一种技术工具。由于智能的核心是学习，因此机器学习是人工智能的核心子领域。深度学习是机器学习的一个子领域，以解决之前机器学习的限制性问题。由于在各个领域都获得了可观的成效，人工智能在过去的几年中普遍获得了突出的地位。这导致物理学家将注意力集中在了AI这个工具上。他们的目标是更好的理解和丰富他们的直觉。这篇评论文章旨在补充先前提出的方法，以弥合人工智能与物理学之间的鸿沟，并向前迈出了重要的一步，以过滤出由此类漏洞带来的“Babelian” 冲突。这首先需要具备有关通用AI的基础知识。为此，审查的主要重点应放在成为人工神经网络的深度学习模型上。她们是可以通过不同的学习过程进行自我训练的深度学习模型。此外还讨论了马尔可夫决策过程的概念。最后，作为通向主要目标的捷径，本片综述彻底检查了这些神经网络如何能够构建描述某些观察结果的物理理论，而无需应用任何先前的物理知识。

Ⅳ SCINET：物理机器（SCINET: A PHYSICS MACHINE）

现在我们介绍一个机器学习技术在物理学应用的实例，该实例应用神经网络来增强物理学的能力。该方法通常使用实验数据并将其呈现给神经网络，以便提出解释数据的理论。但是，大多数技术都对初始状态空间或数学表达式空间施加了约束。更具体的说，这些技术将我们的物理直觉结合到神经网络中，因此，它们主要是在测试网络的效率和学习性，而不是从头开始输出理论。文献[6]的工作中，通过构造一个名为SciNet的神经网络解决了这个问题，在该网络上没有任何约束或任何先验信息。 SciNet还必须输出完整而充分的描述物理概念公式的参数。这项工作的主要思想如下：

向SciNet提供实验数据；
SciNet发现数据的简单表示；
然后SciNet将回答被提出的问题。

SciNet必须能够仅使用其给出的表示来回答问题，而无需返回输入数据。使用两个模型来执行这个步骤：

编码器：编码器结构由一个或多个神经网络组成。它采用观测值O（实验数据）并将其编码为表示R，表示为机器学习上下文中的潜在表示，因此该映射为：E： O→R。
解码器：解码器也是一个神经网络结构。它以编码器产生的潜在表示R和要回答的问题Q作为输入。输出问题的答案，因此映射为： D : R×Q→A。

图6解释了编码器和解码器网络。SciNet的编码器和解码器通过选择的观察数据和问题训练集进行训练，然后使用选择的测试集进行测试以预测准确性。必须注意的是，由于我们以前不知道或不施加潜在神经元的数量（潜在表示的具体数量）。由于潜在神经元的不足，预测的准确性可能降低。从这个意义上讲，在训练阶段，潜伏神经元的数量可以重新设置以适应这些表现。

举一个简单的例子，假设您向SciNet输入了电势U随电流I控制的欧姆定律的函数变化的观察结果。但是SciNet不知道欧姆定律是什么。它只知道输入的观察结果。编码器将找到这些观察结果的表现形式，即代表电阻的参数R并将其储存在潜在的神经元中。通过提供潜在表示和问题（对于给定电流的电势将是多少），解码器可以预测正确的答案（即电流与电势之间的关系）。

接下来介绍文献[6]中提供的一些实例，这些实例演示了SciNet在无任何约束条件和先验知识的情况下，从头预测表示和答案的效率和准确性。

A.实验一：阻尼摆实验（Experiment One: Damped Pendulum）

作为SciNet工作原理的简单经典实例，双摆由以下微分方程描述：

其中κ是控制振荡频率ω的弹簧常数，b是阻尼系数，该阻尼摆系统的解为：
SciNet被实现为具有三个潜在神经元的神经网络，并且对钟摆的位置进行了时序观察。对于所有的训练集，固定振幅A0，质量m=1，相位δ0 = 0，仅弹簧常数k和阻尼系数b分别在[5,10]kg/s2 和 [0.5,1]kg/s之间变化。

编码器输出参数k和b，并将其存储在两个潜在神经元中，而无需使用第三个神经元。在提出时间 tpred 作为一个问题时，SciNet 会通过解码器网络以极高的准确性预测当时摆的位置。因此，SciNet能够提取物理参数并进行存储并准确预测未来的位置。这意味着提取的参数足以描述整个系统并做出未来的预测。

B.实验二：量子位预测（B. Experiment Two: Qubits）

在介绍了一个经典示例之后，SciNet进行了量子示例测试，尤其是量子位测试。在解释当前问题之前，我们定义了一些使用的术语：

量子位：量子位是经典位的量子模拟，是一个二维系统，可以以两个状态的叠加形式存在。它构成了量子计算的基本单位。
量子层析成像：这是一种通过一系列测量重建量子态的方法。一种典型的方法是准备量子态的副本，并对副本进行几次测量。这些测量中的每一个都使我们能够将部分信息存储在状态中。如果该组测量在信息上是完整的，从而允许完全重建量子态，则称它们在层析上是完整的。否则，它们在断层扫描方面是不完整的。
二进制投影测量：产生量子位状态的测量：例如，单个量子位的| 0>或| 1>。

在没有任何先验的量子知识的情况下，给定一组测量值，需要SciNet来表示量子系统的状态并进行准确的预测。在该示例中，我们假设要表示的两个考虑状态是1量子位状态和2量子位状态。单个量子位的实参数量为2，而双量子位的实参数量为6。以下是我们得到这些数字的方法：

对于n个量子位，复数向量空间的维数为2^n，因此对于单个量子位，我们有两种状态：| 0>和| 1>; 对于双量子位，我们有四个状态：| 00>，| 01>，| 10>和| 11>。
计算实际参数的个数，我们将得到2×2^n。
存在两个约束。第一个是归一化条件<ψ|ψ>= 1，第二个是全局相位因子不包含任何信息，这意味着拥有ψ’=eiφψ不会影响内积。这些约束将使参数数量减少两个。

因此，我们应该期望编码器对1量子位使用两个潜在参数，对2量子位使用六个潜在参数。从所有二进制射影测量值M的集合中，选择一个随机子集M1 = {α1，α2，…，αn1}（n1 = 10表示单量子位，30表示2量子位），并将其投影到ψ上，其中ψ 是要表示的量子态。产生的概率p（αi，ψ）是测量量子位为零的概率。重复测量几次后，将产生的概率作为观测值输入网络。根据这些观察结果，SciNet确定足以描述量子态的最小参数数量。

选择另一组随机的二进制投影测量值M2 = {β1，β2，…，βn2}（n2 = 10（单量子位）和30（2量子位）），我们将这些测量值投影到另一个测量值ω上，以生成概率集 p（βi，ω）。这些概率被作为问题反馈给SciNet。注意，M2被认为是层析上完整的，即ω被完整描述，而M1可能是完整的或不完整的。需要SciNet来预测应用ω测量零的概率p（ω，ψ）= |<ω，ψ>| ²。

对于1量子位系统，并在有足够数量的潜伏神经元（两个神经元）的情况下，鉴于M1在层析成像上是完整的，SciNet可以非常准确地预测概率。当M1在断层扫描上不完整时，错误百分比会很高。由于准确性不高，因此可以识别断层摄影不完全的集合，并且准确率百分比可以了解集合提供的信息量。

对于2量子位系统，由于有足够数量的神经元（最少6个）和层析成像完整的集合，因此错误的百分比非常低。对于层析不完全集，无论添加了多少潜伏神经元，错误百分比都很高。因此潜在神经元的个数不影响预测的准确性。

C.实验三：日心说模型（ Experiment Three: Heliocentric Model）

先前的示例是与时间无关的模型。如此处所述，处理与时间有关的问题需要对SciNet的结构进行一些修改。根据观察结果，编码器输出初始时间r（t0）的表示。这些表示随时间演变为r（t1），依此类推。在每个时间步长，解码器网络输出一个答案。

该实验背后的想法是，假定从地球上看火星和太阳的角度，SciNet将在每个时间步长预测这些角度。当我们说从地球上看到的角度时，就好像我们在考虑地心模型（地球位于太阳系的中心）。但是，给定从地球看去的火星θM和太阳θS的角度，SciNet生成潜在表示并存储从太阳看去的地球φE和火星φM的角度。 SciNet构造了日心模型。因此，两个神经元被激活以保存φE和φM。解码器网络在每个时间步长θi接收这些表示，并根据需要以非常低的错误率（小于0.4％）输出θM（ti）和θS（ti）。

在没有系统的背景知识的情况下，作为神经网络的SciNet成功地以最小数量的物理参数表示物理系统。这是如何从AI和神经网络中获益以达到预期结果的具体示例。

Ⅴ AI物理学家（THE AI PHYSICIST）

首先，值得一提的是关于[6]的工作中实现的机器学习技术的特殊性。内置的神经网络提供了描述特定物理设置的数据集。如第Ⅳ节中详细介绍的，它们的作用是提出描述输入数据的物理理论。麻省理工学院的研究人员也采用了相同的主题，以使用机器学习技术改善我们的物理直觉。但是，他们提出了一个不同问题：是否有可能产出一个可以同时推断描述世界不同方面的理论的AI系统？（即通用AI系统）。为了解决这个问题，Tegmark等人在文献[20]中介绍了一种模仿人类科学家思维方式的ML算法，他们称其为“AI物理学家”。“AI物理学家”代理成功的学习了理论，并将其用于推断未来的领域的特定预测。“AI物理学家”使用四个连续的策略来解决各种复杂的物理问题，其中三个策略是：分而治之、奥卡姆剃刀原则和统一原则。智能代理的另一个关注点是更快学习的能力，即 通过高速学习达到所需的准确性。但是，代理面临的一个主要问题是在接受新任务训练时会忘记已经学习的任务。（即无记忆能力）。忘记先前任务的现象被称为灾难性忘记。“AI物理学家”试图通过第四项也就是最后一项被称为 终生学习 的策略来克服它。这种方法可以通过模拟硬盘存储器中转站理论（Theory Hub）成功实现。

A.框架（ Architecture）

“AI物理学家”按如下方式处理给定数据：

理论中心从先前保存的理论空间中提出理论。这些理论描述了部分数据点，并随机初始化了新理论以考虑其余部分。
分而治之算法可以训练新的数据并提出新发现的理论，可以最佳地拟合所有数据。首先对它们进行一起训练，以最大程度地降低全局平均损失，然后分别对每个区域进行特定的微调，使其完全适应其描述的区域。
然后将定义明确的理论添加到理论中心。
奥卡姆（Occam）剃刀算法将经过整理的理论组织起来，将其转化为更简单的符号表达。
统一（Uniﬁcation ）算法将符号理论与主理论结合在一起。
然后将主理论和符号理论添加到理论中心，并在遇到新环境时提出建议。

所有的这些步骤可以用图7表示：

在详细解释之前，有必要强调说明一些有助于理解策略的注解。首先，将提供给“AI物理学家”的数据D表征为一个时间序列向量，使得D = {(xt,yt)} = {(xt−T,…,yt−1,yt)} ，理论T定义为一个2元组(f,c)。f时将某个时间步的数据点映射到另一个时间步的数据点的预测函数，而c是将每个数据点分类到其相关域的子分类器。f和c都被具有可学习参数的神经网络实现，因此f的神经网络由两个具有线性激活的隐藏层组成，而子分类器的神经网络具有两个非线性的ReLU激活函数和一个具有线性激活的输出层。

B.学习算法（B. The Learning Algorithm）

1.提出理论（ Proposing theories）

当给“AI物理学家”提供描述以前没有遇到过的新环境数据时，它首先从理论中心提出了描述部分数据的理论。这是证明过去的理论没有被忘记，并在后面重新使用的重要证明。这是终生学习策略的一部分。从描述集合的M个理论总数中，必须从理论中心提出 Mo ≤ M个理论。 Mo 和M之前已经指定。最初，当将数据集D = {(xt,yt)} 提供给主体时，理论中心首先会检查所有已有的理论（步骤一）。对于每个数据点 (xt,yt),代理程序通过最小化相应的损失函数来保存最能描述该数据点的理论的索引i(步骤二)。将所有基于相同理论的数据点添加到前一个数据点，并将所有对应点放到一个记为 D^(i)的数据子集中。在这种情况下，构成了几个子集 D ^(i)，并为每个数据点计算了数据点ni的数量。在所有理论中，然后提出具有最大ni的M0集，因此提出了它们的相应理论。

2.分而治之算法（ Divide-and-conquer algorithm）

引入代理的环境由几种理论描述。如前所述，该理论由其领域子集分类c和函数f组成。该算法的主要思想是：使用子分类器将数据划分为多个域，然后在要征服的域中训练每个函数。函数f的映射xt → yt，并由参数向量θ进行参数化。回想一下，f和c由神经网络实现，并且神经网络的参数是权重和偏差。使用梯度下降来学习和调整参数，以最小化以下损失函数：

其中l是预测函数f(xt) 产生的输出与实际输出yt之间的差距。

但是，由于所遇到的环境是混合的，其中发现了几种理论，因此每种理论都与其他理论进行竞争，专门研究子集的领域，而全局均值损失为：

这里的损失由参数 γ决定。对于γ的负值，最能降低损失函数l的函数将主导Lγ。换句话说，预测准确性最高的 fi将占主导地位。随着γ越来越小，Lγ趋于等于由拟合函数fi产生的最小损失，即：

由于每个拟合最适合其域，因此全局均值损失得以最小化。有关更多技术细节，请参阅[20]中的附录F。

根据经验发现，γ = −1 适合该过程。它在函数的专用化过程中及在梯度下降过程中给出梯度以改善其理论的过程中效果很好。

寻找最合适其域内数据的函数是将错误最小化的两个过程。首先是使包含所有函数的谐波平均损失L−1最小化。第二个方法是最小化特定函数在其域中的损耗l[fi(xt,yt)] ,作为微调每个函数的一种方式。我们选择l作为描述长度（DL）损失函数：

其中ut = |f(xt) − yt|。描述长度是存储所需的位数，我们的目标是尽可能降低此位数。通过降低损耗l，降低DL。关于子分类c，我们旨在最小化的损失是分类交叉熵损失。这种损失将softmax激活与交叉熵损失结合在一起。softmax激活函数通常用于分类，以使其在所有预测的类之间输出概率最大的类。然后交叉熵检查分类的有效性。这意味着，如果所需类别的概率较低，则将导致较高的交叉熵损失，表明分类不准。

为分而治之的算法开发的算法称为无监督分而治之算法（DDAC）。对于数据集D = {(xt,yt)},M是要训练的初始理论的数量，其中理论中心提出了M0个理论（[20]中的作者使用M = 4和 M0 = 2）。初始精度误差ε0被设置为相当大（使用10），因此损耗变为二次均方误差（MSE）。在每次迭代之后，将误差设置为中值预测误差。处理方程式（60）中的损失函数非常棘手，这就是为什么将其近似为MSE更好的原因。

该算法通过随机初始化理论中心未提出的M−M0 个理论开始，因此具有M个理论T = {T1,…,TM}，并且函数f通过向量θ: fθ进行参数化。子类c由向量φ: cφ进行参数化，其中θ和φ是可学习的参数。第一阶段是使用谐波损耗 L−1训练理论（步骤2-3）。谐波损耗作为属性传递给子程序迭代训练，后者构成该算法的核心部分。

在子例程的迭代训练步骤中（步骤s1-s10），计算谐波损耗相对于参数θ的梯度，并用于随机梯度下降或Adam 优化算法中，以学习率βf更新该步长（更新的步长，常使用5×10−3 ），对于数组 (xt,yt)，将损失最小化的函数 fi的索引 i保存在参数bt中。

通过这种方式，我们通过最佳函数对每个数据集进行分类。在训练了理论的函数以最大程度减少损失之后，对子分类器进行了训练。在迭代训练的步骤6中，我们需要最小化的损失是交叉熵，为此，我们需要将子分类 cφ 的输出转化为概率输出。这由softmax激活函数完成。将softmax函数应用于cφ(xt)的输出后，它们与 bt一起在交叉熵函数中实现。计算该损失的梯度，并将其用于SGD或 Adam中，以学习率βc (使用10−3 ）更新子分类器的参数φ。使用谐波损失函数 L−1 和交叉熵训练函数和子类别的这些步骤被重复的迭代（作者使用K=10000次的迭代）。

迭代训练中的步骤（s8）检查描述合理数据集的理论（作者使用的阈值时30%），并且如果发现其中一部分（阈值5%）的MSE大于一定数量（使用2×10−6 ），然后初始化另一个理论TM+1并通过迭代训练的步骤 s1- s6 ，计算TM+1的损失。如果此时的损失大于添加新理论之前的损失，则拒绝新理论。否则它将被接受并训练。迭代训练中的步骤（s9)再次检查了理论。如果理论描述了数据集的一小部分（使用0.5%），则将其删除。

对每个函数进行微调的第二阶段遵循与第一阶段相同的步骤，但使用的是损失l。每个阶段也都是迭代完成的，并在每次迭代之后，都会计算精度误差（取误差较低的值）。

3.添加理论（Adding theories）

为了在分治法之后将训练合格的理论添加到理论中心，首先要计算每个理论在其领域中的描述长度dl。只要在此描述长度不超过某个阈值η，就将理论直接添加到理论中心。不仅如此，还添加该理论拟合的数据集，以便了解该理论先前的训练方式。但应用奥卡姆剃刀原理时，也是有益的，这将在下一部分中解释。

4.奥卡姆剃刀原理（Occam’s razor）

a.概述 Overview
基于有限的数据集进行推理面临着一个重要问题，即模型选择的问题。每当需要在其他竞争性假设中选择一个最能解释给定数据的假设时，就会出现此问题。奥卡姆剃刀原理在解决这一冲突方面起着重要作用。奥卡姆剃刀原理：在相互竞争的假设中，假设数量最少的那个是最适合数据的那个。这意味着所研究的数据通常使用最简单的解释进行模型。

奥卡姆剃刀原理被广泛应用于各个领域，以排除任何不必要的信息和元素。为了使讨论仅限于科学领域，物理学家经常使用Occam的剃刀。以下是两个说明奥卡姆剃刀原理的示例：

太阳系的地心说与日心说：在天文学上，关于太阳系的中心模型存在着古老的争论。为此，有两种相互竞争的理论，第一种被称为地心模型，它指出太阳和行星是围绕着地球转动；另一种被称为日心模型，指出太阳是所有行星的轨道中心。
应用奥卡姆剃刀原理时，没有进行讨论。哥白尼在发现地心模型多年后又发现了日心模型。由于日心模型要简单的多，因此获得了大家的认同。而地心说除了存在一些无法解释的奥秘之外，还包括更复杂的假设。
爱因斯坦vs洛伦兹： 在20世纪，出现了尝试解释 时空连续体 的测试。当时的两位物理学家爱因斯坦（Albert Einstein）和亨德里克·洛伦兹（Hendrik Lorentz）解决了这个问题，并用不同的计算方法弥补了所有的数学解释。
洛伦兹的计算是基于这样的解释，即太空中存在一种静止的介质，称为以太，而爱因斯坦的解释没有以太。由于没有实验证据表明存在这种介质，运用奥卡姆剃刀原理，爱因斯坦的理论更为人们所接受。

b.最小描述长度模式
在学习了所有的理论之后，它们将接受奥卡姆剃刀原理。这种策略（原理）的一种形式包括数学模式，即最小描述长度 (Minimum Description Length Formalism，MDL) 模式。

MDL模式是Rissanen 在1988年提出。给定一个数据集，Rissanen 定义将数据描述为描述长度（DL）的位数。这种模式的两个主要围绕两个想法进行，首先是检测数据中的规律，然后利用它来压缩这些数据。这些规律决定了数据的属性。这样就可以揭示有意义的信息。第二个中心思想指出，只要发现规律性，就会从数据中学习。这意味着，我们压缩数据的次数越多，从中学习的内容就越多。 Rissanen将描述规律性的模型解释为将数据生成为输出的程序。当然，该模型还可以通过其相应的代码来识别。因此，现在将描述长度定义为该程序的比特数，包括压缩数据比特。

c.奥卡姆剃刀算法
在“AI物理学家”的背景下，奥卡姆剃刀算法的主要目标是最小化使用MDL模式，通过DDAC算法获得的预测函数fi的描述长度。域子分类器对每个域都是唯一的，因此考虑最小化其DL 是不切实际的。另一方面，预测功能的重要性在于它可以在其他域中重用或者解决新的传入数据。首先，该算法计算现有理论的描述长度，然后尝试将其最小化。

对于数据集D = {(xt,yt)}，训练的理论为T = {(fi,ci)}。这些理论的DL是每个理论的DL加上其错误的DL：

其中ut = |ˆ yt − yt|。（61）式中的第二项已经用 DDAC 算法进行了最小化。奥卡姆剃刀算法只要关注于最小化第一项DL(T)，该项又可以被分解为DL(T) = DL(fθ) + DL(cφ)，其中fθ = (f1,…fM)，cφ = (c1,…cM)。其中DL(fθ)可以被定义为描述f的参数θ的长度：

为了最小化DL中的fθ的参数，应用了一些转换，例如collapseLayers, localSnap, integerSnap 等等。这些转换将保持滚动，只要他们使总描述长度 DL(T,D)最小即可。接下来将对这些转换进行详细的解释。

该算法首先将数据集D分解为D(i)（步骤2），每个子集都在其对应的域中。然后，它应用第一个变换collapseLayers（第3步），发现具有线性激活的神经网络的所有连续层并将其合并。如前所述，预测函数可从前一个位置预测当前时间步的位置。localSnap 转换（第4步）会干扰仅考虑更接近要预测的当前时间步长的输入。intergerSnap 转换（第5步）将 fi 中的参数转换为整数，这使总DL最小。例如，给定参数 p = 1.99992,转换后p = 2 ，然后计算新的描述长度。如果此捕捉将DL最小化，则将其占用，否则将其保留。另一个p = 1.6666633示例，算法将尝试转化后为p = 2 并计算DL。如果发现DL增加了，它将离开并尝试另一种转换，即rationalSnap转换，可以近似 p = 1.5 = 3 /2。要计算整数m的描述长度，我们使用：

rationalSnap转换（第6步）用有理数替换fi中的实数或无理参数。这明显减小了 DL(fθ)。例如，如果我们有π = 3.14159265359…，则算法第6步将其转化为p = 355 /113，然后计算DL。可以发现，这种捕捉使总DL最小。要计算以整数m为分子和以自然数n为分母的有理数的描述长度，我们使用：

接下来是toSymbolic （第7步），它将预测函数转化为符号表示。

定义这些转换之后，它们将作为D(i)和ε之外的变量被输入子程序最小化DL函数。子例程将fi，D(i)和转换作为输入，并将转换重复应用于fi。子例程MinimizeDL函数开始计算预测函数的 dl(s2)，然后复制预测函数fclone（s3）并储存它在转换失败的情况下重用。在步骤（s4-s5) 中，算法通过执行变换开始，并考虑了使损失最小化。如果理论i的描述长度dl减少了（采用零步耐心实现），则接受改变换。其中

这意味着如果新的描述增加，则直接退出循环，并在转换或fclone（第7步）之前采用预测函数。如果转换保持描述长度不变，重复以上4步重新执行转换；如果dl保持不变，则推出循环。

5.统一算法（Uniﬁcation algorithm）

为了达到科学的最终目标，即对自然的模拟，该想法不仅是描述观察到的现象，而且还寻求它们之间的联系。这有助于统一这一现象背后的理论。以下算法将显示”AI物理学家“中的积分过程如何发生。

这个算法将采用符号预测函数 {(fi,.)}，并输出主要理论T = {(fp,.)}。通过修改fp中的p，我们可以生成已知预测函数fi的连续体。接下来即将呈现的是关于如何输出或发现一个大师理论。

该算法以符号预测函数作为输入，然后采用这些函数中的每一个并计算其描述长度dl(i)（第1-3步）。在（第4步）中，算法使用（例如）K均值聚类算法（见附录B）基于符号函数的描述长度对符号函数fi进行聚类。因此，预测函数通过簇号k: fik附加标记。统一过程开始于（第5-11步）。首先将预测函数fik转化为二元组(gik,hik)（第6步），其中gik是fik的树枝，而 hik是树干结构。通过应用“子例程规范化”函数执行此转换（步骤s1-s2）。第7、8两步将找到具有相同结构h的树并将它们分组为 Gk。在同一组 Gk中的树的扩散系数由pjk参数化（第9步）。这种参数化将树统一参数化为P的主树。一旦找到主树，该算法会将其重新转化为符号形式（第10步），即主预测函数。最后，该算法将更新 T = {(fpk,.)}中的主函数并返回T。

C.总结获得的知识（Summing up Acquired Knowledge）

为了更好地了解这些算法如何协同工作，必须指定提供给“AI物理学家”的数据。如上所述，数据是向量的时间序列，每个向量都描述了在四个不同领域中徘徊的球的二维运动。每个域的特征都是物理作用，即重力，弹簧，电磁场或弹跳边界。目的是尽可能准确地预测这些粒子的二维运动。“AI物理学家”首先从理论中心提出理论，然后测试它们是否适合部分数据。有了提出的理论和随机初始化的理论之后，代理继续进行分而治之算法。根据文献[20]的结果，“AI物理学家”能够构建用于预测球的未来位置的预测函数，并将它们同时分类为上述四个领域。预先构建的预测函数将传递到奥卡姆剃刀算法中，以最大程度地减小描述长度。在应用这些子例程后，如下执行属于四个领域之一的差分方程之一，即预测函数：

预测函数的描述长度 DL(f) = 212.7。值得一提的是，该方程式是在应用了第一个collapse-Layer转换之后得出的。当应用然后捕捉转换时，它会进一步简化：

具有较小的描述长度DL(f) = 55.6。仍然在奥卡姆剃刀策略中，toSymbolic转换将等式66转化为符号表示：

现在剩下的就是找到一种掌握理论的理论，该理论将有关一个主题的预测函数归为一组。为此，“AI物理学家”使用统一算法根据符号预测函数的描述长度对符号预测函数进行聚类，其中聚类的DL在某些阈值之间。最后将等式67归纳为一个主理论fp：

基于这些方程，可以推断出该区域的球受到重力的影响。为了更明确，将等式68重写为：
其中 gi ≡ pi(∆t)²。关于其他三个区域，一个受弹簧影响，一个处于电磁场，一个具有反弹边界。它们的推到方式于该受重力影响的域的推导方式相同。

“AI物理学家”获得的结果非常有前景，因为它优于具有近似相同复杂性的替代神经网络。值得一提的是，终身学习策略在学习算法中的重要性。为了检验这一点，构建了一个新的学习代理，并将其命名为“AI物理学家新生儿”。这个新代理的主要特定是它没有理论中心。这意味着它 没有保存任何先前学习的理论。这是“AI物理学家新生儿”与“AI物理学家”之间的主要区别。两者都达到了完美的精度水平，但是“AI物理学家”的学习速度比其他人快。这意味着 使用以前学习的理论有助于提高学习速度。

1.消除过度领域（1. Eliminating transition domains）

在成功的描述了控制每个领域的理论之后，“AI物理学家”面临着另一个问题，即边界和过度区域。当轨迹从一个不同的物理域移到另一个域时，哪个理论控制运动？AI代理通常从最后一个T = 3个xt = (yt−3,yt−2,yt−1)找到下一个位置。当轨迹接近边界时，先前位置的集合可以包含来自第一个域的3个位置，而不包含来自第二个域的任何位置，包含来自第一个域的2个位置和来自第二个域的1个位置，反之亦然。这四种情况中的每一种都需要一个不同的函数来计算下一个位置。随着添加更多的域，这些情况的数量也会增加。

此外，将域设置为完全弹性的。也就是说，如果轨迹遇到一个域的边界，它将被反弹回来。这些情况还需要不同的函数来管理它们。对于过度和反弹，数据不充分，因此，代理将无法找到解决方案。但是，解决此问题的直接方法是使用以下步骤简单的消除这些区域：

对于找到预测未来位置的函数f的每个域 (xt → yt) ，我们找到了预测过去位置的函数(xt → yt−T−1)。
当轨迹接近过度区域并使用第一域的未来预测函数时，将执行时间上的外推。外推是轨迹的前向扩展，好像它仍在第一个域中一样。为此正向外推拟合函数yf(t) 。
对于相同的轨迹，并使用第二个域的过去预测函数，将执行时间倒推。这种推断是轨迹的向后扩展，就好像它在第二个域中一样。为此，反向外推拟合函数为 yb(t)。
我们找到了时间t∗，使得这些函数之间的差异最小。
理想情况下，它将恰好是这两个函数的交点。

如果此刻我们有 yf(t∗) ≈ yb(t∗), 则它是一个边界点。另外，如果y0 f(t∗) ≈ y0 b(t∗)，那么我们要处理的是一个区域与另一个区域之间的过度边界，因为该边界附近的速度在过度时不会不同。否则，边界将是外部边界（反弹）。找到这些点后，将再次训练领域分类器，消除这些点，并尽可能扩展领域。

Ⅵ 结论（ CONCLUSION）

A.结束语（Concluding Remarks）

希望这篇综述有助于在两个科学领域的交叉点上提供对主题的明显见解：人工智能和物理学。在这方面，两个领域在取得重大进展方面共同发挥了重要作用。这篇综述首先介绍了 神经网络，以了解它们在算法中的使用方式以及如何使用不同类型的学习范式对他们进行有效的训练。特别是这些学习范式之一的 强化学习，它是关于在随机环境中对代理的绩效进行建模的关注。整合强化学习技术的问题引起了广泛关注，因为它们体现了以随机行为为特征的现实世界情况。这些问题由所谓的马尔可夫决策过程所描述。神经网络引起的关注是它们在算法中的使用，以帮助提高对观测数据背后的物理理论的理解。其中之一是 SciNet，这是Renato 等人在文献[6]中构建的神经网络模型。它的主要作用是推断观测数据的最小表示形式，以总结其物理环境的所有重要方面。Tegmark 等人在文献[20]中创建的另一种技术“AI物理学家”体现了物理学家的思考和遇到问题的解决方式。该技术分为四种策略，概述了物理学家解决问题的方式。这些提到的技术显示出令人鼓舞的结果。朝着这个研究方向努力的物理学家可以依靠这些结果，并在扩展当前工作方面取得一些进展。未来的研究工作仍然存在许多问题，下一部分将提到其中的一些问题。

B.展望（ Outlook）

人工智能技术对解决物理问题和进一步揭示其背后的直觉做出了巨大贡献。但是，也可以嵌入物理理论来增强AI。重整化组可以在神经网络中作为从数据中提取特征的方案进行说明。超越经典领域，量子相干和量子纠缠在量子计算机中被使用，使其比经典计算机更高效。这些技术可以在机器学习中实现，从而加快了数据处理的速度，但是 量子机器学习仍然遭受着高成本和复杂性的困扰。但是，诸如“对称”和“量规固定”之类的工具可能会最大程度的发挥“AI物理学家”程序的功能。并使我们降低复杂性和降低预期噪声影响的方式，约束其余问题。这些相关问题目前正在研究中。

在这篇综述文章中研究的常规“AI物理学家”显然已经利用了经典计算机。最近，已经提出了一些将机器学习扩展到量子领域中的尝试。出乎意料的是，基于 K核方法的机器学习（例如矢量机器（SVM）），与量子计算共享一些相似的理论基础，因为它有效的将计算应用于任何大的希尔伯特空间中。这种联系为专家设计量子机器学习方法铺平了道路。为此，在[33]中介绍了一种建立量子神经网络的通用方法。因此，实际工作的自然扩展是将“AI物理学家”升级为量子设置，将我们带入量子AI物理学家的时代。最近获得了巨大发展的一个相关研究是 利用量子启发的张量网络的机器学习。张量网络可以在自适应和无监督学习中使用，类似于归一化重组（RG）。关于此结果的诱人之处是开发的框架，该框架的优点是可以将设计的算法和理论发展统一起来，从而对经典计算和量子计算均具有优势。在这样的统一方案中，应该由“AI物理学家”训练模型，然后将其传递给量子AI物理学家进行进一步优化。进一步研究这种联系并将其应用于凝聚态和高能物理中的问题（例如，AdS/CFT对偶性）将是有益的。

此外，在“AI物理学家”的奥卡姆剃刀中使用SciNet编程以提取最小表示量，可能是进一步减少计算训练时间的一步。这将需要对“AI物理学家”架构进行修改，从而可能会提高性能。

附录

A.激活函数（Activation Functions）

下表列出了常用的激活功能。它包括每个属性的定义。

B.K-均值聚类（ K-means Clustering）

K-均值聚类的目标很简单：将相似的数据点组合在一起并发现潜在的模式。该算法在数据集中寻找固定数目的簇数K。聚类是使用具有一定阈值的距离度量将数据点分组在一起的集合，并且聚簇的数量根据人的选择进行初始化。这个想法如下：假设有一个庞大的数据集，将这些集合一起训练是非常繁琐且昂贵的。 K-均值聚类算法用于将集合划分为子集，在子集中可以更轻松地自行解决每个聚类。经过四步总结的迭代之后，该算法收敛到一个解决方案：

通过随机选择K个数据点来初始化中心（质心）。
通过计算数据点和质心之间的距离，将数据点分配给群集。
使用新值更新群集质心，新值是群集中所有数据点的平均值。
重复步骤2和3，直到满足以下条件之一：

（a）分配给每个群集的数据点保持不变。
（b）通过重复迭代后，质心固定不变。
（c）数据点和质心之间的最小距离不变。
（d）迭代次数应足以保证收敛。

你可能感兴趣的:(人工智能,神经网络,物理学)

探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
第九章肿瘤放射治疗晨翕
放射物理学：主要研究各种放射源的性能特点、治疗剂量学、质量控制、质量保证及辐射防护等放射生物学：主要研究机体正常组织和肿瘤组织对射线对反应及如何人为地改变这些反应对质和量。放射技术学：主要研究具体运用各种放射源及设备治疗肿瘤患者，包括射野设置、体位固定、定位、摆位操作等技术实施。临床放射肿瘤学：在临床肿瘤学的基础上，研究肿瘤放射治疗的适应证，根据病理、分期、预后确定治疗策略，综合运用放射物理、放射
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况 m0_57781768 python langchain 语言模型
深入探讨：如何在Python中通过LangChain技术精准追踪大型语言模型（LLM）的Token使用情况在现代的人工智能开发中，大型语言模型（LLM）已经成为了不可或缺的工具，无论是用于自然语言处理、对话生成，还是其他复杂的文本生成任务。然而，随着这些模型的广泛应用，开发者面临的一个重要挑战是如何有效地追踪和管理Token的使用情况，特别是在生产环境中，Token的使用直接影响着API调用的成本
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比