半度微凉1993

GAP: Generalizable Approximate Graph Partitioning Framework(广义近似图划分框架)

Abstract

图划分是将一个图的节点划分为平衡的分区，同时最小化跨分区的边割的问题。由于它的组合性质，许多近似解被开发出来，包括多层次方法和谱聚类的变体。我们提出了GAP，一个可推广的近似划分框架, 这需要深入学习图划分的方法。我们定义了一个表示划分目标的可微损失函数，并利用反向传播优化网络参数。与按图重做优化的基线不同，GAP具有泛化能力，允许我们训练在推理时产生性能分区的模型，即使是在看不见的图上。此外，由于我们在学习图的表示的同时联合优化分区损失函数，GAP可以很容易地针对各种图结构进行调整。我们评估GAP在不同大小和结构的图上的性能，包括广泛使用的机器学习模型（例如ResNet、VGG和Inception-V3）、无标度图和随机图。我们证明GAP在达到竞争分割的同时比基线快100倍，并将其推广到看不见的图上。

1 Introduction

图划分是一个重要的优化问题，在计算机视觉、超大规模集成电路设计、生物学、社会网络、交通网络等领域有着广泛的应用。其目标是求图的平衡划分，同时最小化边割的数目。这个问题是NP完全问题，它被描述为一个离散优化问题，并且通常使用启发式和近似算法来获得解。一些值得注意的方法包括多级方法和谱划分方法[Karypis and Kumar，1998，Karypis et al.，1999，Karypis and Kumar，2000，Miettinen等人，2006，Andersen等人，2006，Chung，2007]。

在这项工作中，我们介绍了一种基于学习的方法，GAP，用于持续放松问题。我们定义了一个可微的损失函数，它的目标是将一个图划分成不相交的平衡分区，同时最小化这些分区的边割数。我们训练一个深度模型来优化这个损失函数。优化是在无监督的方式下完成的，不需要标记的数据集。

我们的方法GAP不假设图的结构（例如稀疏与稠密，或无标度）。相反，GAP在优化分割损失函数的同时，利用图嵌入技术学习并适应图结构。这种表示学习使得我们的方法是自适应的，而不需要为不同类型的图设计不同的策略。

我们基于学习的方法也具有泛化能力，这意味着我们可以在一组图上训练一个模型，然后在推理时使用它来处理大小不等的不可见图。特别地，我们证明了当GAP在较小的图（例如1k个节点）上训练时，它将所学知识转移到更大的图上（例如20k个节点）。这种泛化允许经过训练的间隙模型快速推断出大型不可见图上的分区，而基线方法必须为每个新的图重新进行整个优化。

综上所述，本文做出以下贡献：

(1) 我们提出了GAP，一个可推广的近似划分框架，它是一个无监督的学习方法来解决平衡图划分的经典问题。我们定义了一个可微的损失函数，它使用归一化割的连续松弛。然后我们训练一个深度模型，并应用反向传播来优化损耗。

(2)GAP模型可以在推理时对不可见图进行有效的划分。与现有的方法相比，泛化是一个优势，现有的方法必须对每个新的图重新进行整体优化。

(3)GAP利用了图嵌入技术[Kipf and Welling，2017，Hamilton et al.，2017]并学会了根据图的底层结构对图进行划分，从而能够在各种各样的图上生成高效的分区。

(4)为了鼓励可重复的研究，我们在补充材料中提供源代码，并且正在将框架开源。(Tips:代码已开源)

(5)我们发现GAP在实现竞争性分区的同时，在各种合成和真实世界的图上，GAP比性能最好的基线快100倍，最多有27000个节点。

2 Related Work

图划分：图划分是一个重要的组合优化问题，已经得到了详尽的研究。最广泛使用的图划分算法通过对输入图执行操作来生成分区，直到收敛为止[Andersen等人，2006，Chung，2007]。另一方面，多级划分方法首先通过折叠节点和边来减小图的大小，然后在较小的图上进行划分，最后扩展图以恢复对原始图的划分[Karypis and Kumar，2000，Karypis et al.，1999，Karypis and Kumar，1998，Miettinen et al.，2006]。这些算法可以提供高质量的分区【Miettinen等人，2006年】。

另一种方法是使用模拟退火。[vanden Bout and Miller，1990]提出了平均场退火，它将模拟退火与Hopfield神经网络相结合。[Kawamoto et al.，2018]研究了一种不同的图划分公式，其中图是由统计模型生成的，任务是推断生成模型的预先指定的组标签。他们为这一版本的问题开发了一个最小图神经网络结构的平均场理论。

这一系列的研究将图划分描述为一个离散优化问题，而我们的GAP框架是第一个用于连续松弛问题的深度学习方法之一。此外，GAP将一般化为看不见的图，动态地生成分区，而不必对每个图重新进行优化。

聚类：给定一组点，聚类的目标是识别相似点的组。对具有不同目标的聚类问题，如自平衡k均值和平衡最小割集进行了详尽的研究[Liu等人，2017，Chen等人，2017，Chang等人，2014]。最有效的聚类技术之一是谱聚类，它首先在图的特征空间中生成节点嵌入，然后将k均值聚类应用于这些向量[Shi and Malik，2000，Ng et al.，2002，Von Luxburg，2007]。

然而，将聚类推广到看不见的节点和图是非常重要的。为了解决泛化问题，SpectralNet[Shaham et al.，2018]是光谱聚类的一种深度学习方法，它为看不见的数据点生成光谱嵌入。其他用于聚类的深度学习方法尝试以适合于通过k均值或高斯混合模型进行聚类的方式对输入进行编码【Yang等人，2017年，Xie等人，2016年，Zheng等人，2016年，Dilokthanakul等人，2016年】。

图聚类和图划分虽然相关，但它们是不同的问题，因为图聚类试图最大化簇的局部性，而图划分则在保持分区之间平衡的同时保持局部性。我们的方法还将划分问题视为具有可微损失的端到端学习问题，而上述方法生成嵌入，然后使用不可微技术（如k-means）进行聚类。

设备布置：图划分的实际意义通过张量流计算图的设备布置任务来证明，其中的目标是通过为设备分配操作来最小化执行时间。[Mirhoseini et al.，2017]提出了一种强化学习方法来优化张量流图的设备布局。他们使用seq2seq策略将操作分配给设备。然后将生成的配售的执行时间作为奖励信号来优化策略。[Mirhoseini et al.，2018]中提出了一个设备布局的层次模型，其中图形划分和布局是联合学习的。虽然这项工作也使用神经网络来学习分区，但是他们的目标是优化结果分区的运行时，迫使他们使用策略梯度来优化其不可微的损失函数。

3 Problem Definition and Background

设G=（V，E）是一个图，其中V={vi}和E={E（vi，vj）| vi∈V，vj∈V}是图中的节点集和边集。设n为节点数。图G可分为g个不相交集S1，S2,...,S g，其中集合中的节点的并集为V（k=1t S k=V），每个节点只属于一个集合（k=1s k=∅），只需去掉连接这些集合的边。

最小割集：为了形成不相交集而从G中删除的边的总数称为割。给定集S k，S̄k，则割（S k，S̄k）正式定义为：

该公式可推广到多个不相交集s1，s2。sg，其中S̄k是除sk外所有集的并集。

规范化割：最小化割的图的最优划分（方程式2）是一个研究得很好的问题，并且有有效的多项式算法来解决它[Papadimitriou和Steiglitz，1982]。然而，最小割准则倾向于度较小的切割节点，导致集/分区不平衡。为了避免这种偏差，[Shi and Malik，2000，Zhang and Rohe，2018]研究了基于图电导的归一化切割（Ncut），其中切割成本计算为所有节点的总边缘连接的一部分。

其中vol（sk，V）=vi∈sk，vj∈vee（vi，vj），即图G中节点属于sk的总度。

最小化归一化割的一种方法是基于图的拉普拉斯特征向量[Shi and Malik，2000，Zhang and Rohe，2018]。先前的研究表明，在广泛的社会和信息网络中，图电导最小的集群通常很小[Leskovec，2009，Zhang和Rohe，2018]。正则化谱聚类是[Zhang and Rohe，2018]提出的解决这一问题的方法。

然而，在本文中，我们提出GAP作为一种无监督学习方法，它具有一个可微的损失函数，可以训练它来寻找具有最小规范化割的平衡分区。我们证明了GAP使泛化成为不可见图。

4 Generalizable Approximate Partitioning

现在我们介绍可归纳的近似划分框架（GAP）。如图1所示，GAP有两个主要组成部分：用于生成每个节点的划分概率的图表示学习（模型）和标准化切割目标的可微公式（损失函数）。GAP使我们能够训练一个神经网络来优化一个先前无法区分的目标，通过生成具有最小边缘切割的平衡分割。在讨论模型之前，我们首先给出了损失函数。

4.1 GAP Loss Function

我们假设我们的模型返回，Yik表示节点v i∈v属于分区sk的概率。我们提出了一个基于Y的损失函数X来计算方程3中的归一化割，并评估分区的平衡性。在后面的4.2小节中，我们将讨论生成Y的模型。

规范化割：正如我们在第3节中讨论的，是边数，其中。设Yik是节点vi属于分区Sk的概率。节点Vj不属于分区sk的概率为1−Yjk。因此，E[cut（S k，S̄k）]可由式4表示，其中N（v i）是与v i相邻的节点集（图1中的直观说明）。

由于给定节点的相邻节点集可以从图a的邻接矩阵中检索出来，因此我们可以将方程4重写如下：

与邻接矩阵的逐元素乘积确保只考虑相邻节点。此外，的结果是n×n矩阵，是其所有元素的和。

由式3可知，是属于Sk的所有节点的阶数之和。设D是大小为n的列向量，其中Di是节点v i∈V的次数。给定Y，我们可以计算如下：

式中，Γ是中的向量，g是划分的数目。利用式5和式6中的，我们可以计算方程式3中的预期归一化切割，如下所示：

是元素除法，的结果是一个n×n矩阵，其中是它所有元素的和。

平衡割：到目前为止，我们已经展示了如何计算给定矩阵Y（属于分区的节点概率）的图的期望规范化割。在这里，我们展示了给定的Y，我们也可以评估这些分区的平衡程度。

给定图| V |=n中的节点数和分区数g，要获得平衡分区，每个分区的节点数应为。Y中列的和给出了每个分区中的期望节点数，因为Yik表示节点v i∈v属于分区Sk的概率。因此，对于平衡分区，我们将以下错误最小化：

结合期望的归一化切割（方程式7）和平衡分割误差（方程式8），我们得到以下损失函数：

接下来，我们讨论了在等式9中寻找图划分Y以最小化损失的间隙神经模型。

4.2 The GAP Model

GAP模型接受一个图定义，生成利用局部图结构的节点嵌入，并将每个嵌入投影到logit中，该逻辑图定义了一个概率分布，以最小化期望的标准化切割（等式9）。

图嵌入模块：图嵌入模块的目的是利用图的结构和节点特征来学习节点嵌入。最近，使用图卷积网络[Kipf and Welling，2017]（GCN）、GraphSAGE[Hamilton et al.，2017]、neural graph Machines[Bui et al.，2017]、graph Attention networks[Veličković等人]等方法将图神经网络应用于节点嵌入和分类任务方面取得了一些进展。，2018年]和其他变体。在这项工作中，我们利用GCN和GraphSAGE学习各种图的图形表示，这有助于泛化。

GCN:[Kipf and Welling，2017]表明未经训练的具有随机权重的GCN可以作为一个强大的图节点特征抽取器。在我们的实现中，我们使用了加权矩阵的3层GCN，使用了[Glorot和Bengio，2010]中描述的Xavier初始化。

其中，是具有附加自连接的无向图G的邻接矩阵。I n是单位矩阵，。输入特征矩阵X依赖于图。在张量流计算图中，每种操作类型（如MatMul、Conv2d、Sum等）都是一个特征。

GraphSAGE:[Hamilton et al.，2017]开发了一种基于节点输入特征生成高维图节点表示的节点嵌入技术。该技术的核心是采样和聚合，在给定一个节点v i的情况下，我们从N（v i）中抽取一组v i的邻居，并聚合它们的表示（使用最大池），以生成v i的采样邻居的嵌入。这种邻域表示与v i本身的表示相结合，以生成v i的新表示。多次迭代这个过程会导致消息在节点之间传递，以增加跳数。

我们对GraphSAGE的实现基于[Hamilton et al.，2017]中的算法1。对于通过步骤k的每个消息，我们对每个节点v i∈v执行以下操作：

其中agg和proj分别表示聚合矩阵和投影矩阵。

图划分模块：我们的GAP框架中的第二个模块负责对图进行划分，接受节点嵌入，并生成每个节点属于分区s1、s2、…、sg的概率（图1中的Y）。该模块是一个完全连接的层，然后是softmax，经过训练，使方程9最小化。

我们还注意到，对于特别大的图，可以从较大的图中对随机抽样的小批量节点进行优化。此外，可以阻止从分割模块到嵌入模块的梯度流，从而导致无监督的节点嵌入。

5 Experiments

我们实验的主要目标是（a）评估GAP框架对hMETIS的性能[Karypis and Kumar，2000]，一个广泛使用的使用多级划分的划分器，以及（b）评估GAP在不可见图上的泛化性，并提供关于列车图和测试图之间的结构相似性如何影响的见解泛化性能。源代码是为可复制性而提供的，并且正在被开源。

5.1 Setup

我们对真实图和合成图进行了实验。具体来说，我们使用了五个广泛使用的张量流图。我们还生成随机图和无标度图作为合成数据集，以显示GAP对不同结构图的有效性。

Real Datasets

* ResNet[He et al.，2016]是一个具有残余连接的深卷积网络，可避免梯度消失。带有50层的ResNet_v1_50的TensorFlow实现包含20586个操作。

* Inception-v3【Szegedy等人，2017年】由多个区块组成，每个区块由若干个卷积层和汇集层组成。这个模型的张量流图包含27114个操作。

* lexNet【Krizhevsky等人，2012年】由5个卷积层组成，其中一些是max pooling层，3个完全连接的层和一个最终的softmax。该模型的张量流图有798次运算。

*MNIST conv有3个卷积层用于MNIST分类任务。该模型的张量流图包含414个运算。

*VGG[Simonyan和Zisserman，2014]包含16个卷积层。VGG的张量流图包含1325个操作。

Synthetic Datasets(合成数据集)

* 随机：使用Erdös–Rényi模型随机生成大小为10 3和10 4节点的网络[Erdos and Rényi，1960]，其中任意两个节点之间具有边的概率为0.1。

*无标度：使用NetworkX随机生成大小为103和104的无标度网络【Hagberg等人，2008】（无标度网络是一种度分布遵循幂律的网络【Bollobás等人，2003年】）。

Baseline基线：由于图划分是NP完全的，所以通常使用启发式和近似算法来导出解。虽然已经有大量关于特定图结构/应用的图划分的工作[Gonzalez et al.，2012，Hada et al.，2018]，hMETIS[Karypis and Kumar，2000，Karypis et al。，1999]是一个通用框架，适用于各种各样的图形，并被证明在不同的领域提供高质量的分区（例如VLSI、道路网络[Miettinen等人，2006年，Xu和Tan，2012年]。与hMETIS类似，GAP是一个通用的框架，它对图结构没有任何假设。在我们的实验中，我们将GAP与嗯，我们设置hMETIS参数以返回边缘切割最小的平衡分区。

Performance Measures性能度量：正如我们在第3节中讨论的，图划分的目标是具有最小边割的平衡分区。我们通过检查1）Edge cut：切割与总边数的比率，以及2）平衡性：是1减去每个分区中节点数的MSE，然后平衡分区（n/g）来评估结果分区的性能。

5.2 Performance

在这组实验中，我们发现GAP的性能优于hMETIS。因为hMETIS不会泛化为看不见的图，并且一次只优化一个图，所以我们还约束GAP一次优化一个图，以便进行公平比较。我们在5.3节讨论了GAP的泛化能力。

表1显示了GAP对hMETIS在实张量流图上的3分区问题的性能。这两种技术生成非常平衡的分区，GAP在VGG图的边缘切割上的性能优于hMETIS。

图3显示了当分区数从2到10时GAP对hmeti的性能。这些图代表了5个随机图的平均值。GAP和hMETIS都能产生99%的平衡分区。然而，GAP也能够找到比hMETIS更低的边缘切割分区。通过检查我们的数据集的度直方图（图2a到2d），我们发现虽然hMETIS启发式算法在稀疏张量流图上工作得相当好，但是GAP在稠密图上的性能优于hMETIS。

5.3 Generalization

在本节中，我们将展示GAP在真实数据集和合成数据集上的有效推广。据我们所知，我们是第一个提出一种图划分的学习方法，它可以推广到不可见的图。

5.3.1 Generalization on real graphs

在这组实验中，我们用单个张量流图VGG训练GAP，并在MNIST-conv上进行验证。在推理时，我们在看不见的张量流图AlexNet、ResNet、andrence time上测试训练的模型Inception-v3。

表2给出了我们的实验结果，并说明了节点特征和图嵌入在泛化中的重要性。在GAP-id中，我们使用节点的索引作为其特征，而在GAP-op中，操作类型（如TensorFlow中的Add、Conv2d和L2loss）作为节点特征。我们将所有功能编码为一个热点。在第4.2节之后，我们利用图卷积网络[Kipf and Welling，2017]（GCN）和Graph SAGE[Hamilton等人，2017]来捕捉图形之间的相似性。在GCN离线和fline的GraphSAGE中，我们不训练图嵌入模块（图1）中没有来自分割模块的梯度流，而在GraphSAGE训练中，两个模块是联合训练的。表2显示，经过GraphSAGE训练（最后一行）的GAP-op获得了最佳的性能，并且比其他模型更好地进行了泛化。注意，这个模型是在一个图上训练的，VGG只有1325个节点，在AlexNet、ResNet和Inception-v3上分别用798、20586和27114个节点进行测试。

图4显示了Inception-v3的间隙划分，使用了一个在同一个图（4a）上训练的模型和一个在VGG（4b）上训练的模型。注意，分区用颜色表示，我们只显示操作类型为卷积的节点。在场景（4a）中，我们在Inception-v3上训练和测试GAP，我们实现了99%的平衡分区和4%的边缘切割（表1）。GAP在VGG上训练并在看不见的图（Inception-v3）上进行测试，它实现了99%的平衡分区和6%的边缘切割（表2的最后一行）。图4a和4b中的分区分配非常相似（75%），这证明了GAP的泛化。

我们还观察到VGG和其他用于推理和验证的计算图中节点特征（操作类型）的相似性与间隙划分的边缘切割分数相关（图5）。例如，让A和B分别是VGG和ResNet中的操作类型集，Jaccard相似性为）。图5显示，随着图形与VGG的Jaccard相似性的增加，边缘切割减少。换句话说，在训练图和测试图中出现相似的节点类型有助于我们的模型的泛化。

模型体系结构与Hyper-p参数：这里，我们描述了性能最好的模型的细节（对应于表2的最后一行）。特征（TensorFlow操作类型）的数量为1518。GraphSAGE有5层512个单元的共享池，图形分区模块是一个由64个单元组成的3层密集网络，最后有一个softmax层。我们使用ReLU作为激活函数，所有权重都是使用Xavier初始化初始化的[Glorot和Bengio，2010]。我们使用Adam优化器，学习率为7.5e-5。

5.3.2 Generalization on synthetic graphs

我们进一步研究了随机图和无标度图上GAP的推广。注意，我们在同一类型的图上训练和测试GAP，但是节点的数量可能会有所不同。例如，我们在1k节点的随机图上训练GAP，并在1k和10k节点的随机图上进行测试。同样，我们在1k节点的scalefree图上训练GAP，并在1k和10k节点的无标度图上进行测试。

图6a、6b和6c显示了无标度图上GAP相对于hMETIS的边缘切割、平衡性和执行时间（每个点是5个实验的平均值）。在GAP-Scalefree-1中，我们只使用一个无标度图来训练GAP，而GAP-Scalefree10是在10个无标度图上训练的。然后，我们在5张1k和10k节点的无标度图上测试了GAP-Scalefree-1和GAP-Scalefree-10模型，并给出了平均结果。图6a显示了GAP-Scalefree-1和GAP-Scalefree-10用比hMETIS更低的边缘切割来划分1k和10k节点的不可见图。尽管GAP-Scalefree-1的平衡性低于hMETIS，但是通过增加训练集中的图的数量（GAP-Scalefree-10），平衡性得到了改善，如图6b所示，而其边缘切割仍然更小（6a）。此外，GAP-Scalefree-10比hMETIS（6c）运行得稍快，其分区与hMETIS（6b）的分区一样平衡，但具有较低的边缘切割（6a）。

图7a、7b和7c显示了随机图上GAP相对于hmeti的边缘切割、平衡性和执行时间。每个点是5个实验的平均值。在GAP-Random-1中，我们只在一个随机图上训练GAP，而在GAP-Random-10中，我们训练10个随机图。然后，我们在5个1k和10k节点的不可见随机图上测试了GAP-random-1和GAP-random-10模型，并给出了平均结果。GAP在1k和10k节点的不可见随机图上泛化时的性能与hMETIS的性能几乎相同，而图7c显示在推断过程中，GAP比hMETIS的运行时快10到100倍。

模型结构和超参数：与计算图中节点特征是操作类型不同，合成图中的节点没有特征。此外，我们还必须训练一个模型，它可以推广到不同大小的图。例如，我们在具有1k个节点的随机图上训练一个模型，并在具有10k个节点的随机图上测试它。为此，我们将PCA应用于无特征图的邻接矩阵，并检索1000大小的嵌入作为节点特征。我们使用ReLU作为我们的激活函数，所有的权重都是通过Xavier初始化初始化的。我们还使用Adam优化器。下面是每个模型的其余超参数。

GAP-Scalefree-1：用一个无标度图训练模型。GraphSAGE有5层512个单元，图划分模块采用softmax的三层128单元密集网络。学习率为2.5e-6。

GAP-Scalefree-10：用10个无标度图训练。GraphSAGE有4层128个单元，图划分模块是一层64个单元的密集网络，采用softmax。学习率为7.5e-6。

GAP-Random-1：只使用随机图训练。GraphSAGE有5层128个单元的共享池，图划分模块是一个由64个单元组成的2层密集网络，带有softmax。学习率为7.5e-4。

GAP-Random-10：用10个随机图训练。GraphSAGE有2层256个单元的共享池，图划分模块是一个由128个单元组成的3层密集网络，带有softmax。学习率为7.5e-6。

6 Conclusion

针对图划分问题，我们提出了一个深度学习框架GAP，其目标是将图中的节点分配到平衡的分区中，同时最小化跨分区的边割。我们的GAP框架支持泛化：我们可以训练在推理时产生性能分区的模型，即使是在看不见的图上。与现有的基线相比，这种泛化是一个优势，现有的基线会为每个新的图形重新进行优化。我们对广泛使用的机器学习模型（ResNet、VGG和Inception-v3）、无标度图和随机图的结果表明，GAP在达到竞争划分的同时，比基线快100倍，并将其推广到看不见的图。

你可能感兴趣的:(RL)

「DeepSeek接班OpenAI」，最新开源的R1推理模型，让AI圈爆了人工智能学家人工智能
来源：前沿科技分享圈近日，AI领域迎来了一次重大突破，DeepSeek正式推出了其最新研发的开源推理模型——DeepSeek-R1。这一模型在数学、代码和自然语言推理等关键任务上的表现，已经能够与OpenAI的o1正式版相媲美，引发了AI研究者和从业者的广泛关注。多阶段训练：创新的模型架构DeepSeek-R1的训练方式采用了多阶段循环的策略，具体包括基础训练、强化学习（RL）、微调等多个阶段。这
强化学习在自动驾驶中的实现与挑战 Echo_Wish 人工智能前沿技术自动驾驶人工智能机器学习
强化学习在自动驾驶中的实现与挑战自动驾驶技术作为当今人工智能领域的前沿之一，正通过各种方式改变我们的出行方式。而强化学习（ReinforcementLearning,RL），作为机器学习的一大分支，在自动驾驶的实现中扮演了至关重要的角色。它通过模仿人类驾驶员的决策过程，为车辆提供动态、灵活的导航与控制能力。然而，强化学习在实际应用中并非一帆风顺，还面临着诸多技术和现实挑战。本文将从原理、实现与挑战
AI：263-强化学习在自动驾驶领域的应用与前沿挑战一键难忘精通AI实战千例专栏合集自动驾驶汽车强化学习人工智能
强化学习在自动驾驶中的应用与挑战自动驾驶汽车是当前人工智能和机器学习的热门研究方向，而强化学习（ReinforcementLearning，RL）因其在复杂动态环境中的决策能力，成为推动自动驾驶技术的重要工具。本文将探讨强化学习在自动驾驶中的应用、面临的挑战，并提供一个简单的代码实例以展示如何在自动驾驶中应用强化学习。1.强化学习的基础概念强化学习是一种通过试错的方式来学习最佳策略的机器学习方法。
Rust中奖励函数的实现与应用 AI天才研究院计算 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Rust中奖励函数的实现与应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：Rust,奖励函数,强化学习,机器学习,状态空间1.背景介绍1.1问题的由来在机器学习领域，特别是在强化学习（ReinforcementLearning,RL）中，奖励函数（RewardFunction）扮演着至关重要的角色。它定义了智能体（Agent）在执行任务时
强化学习中，为什么用AC架构资源存储库算法强化学习算法
目录强化学习中，为什么用AC架构为什么用AC架构？AC架构的工作原理AC架构的优缺点优点：缺点：相关算法：基于AC架构的算法总结强化学习中，为什么用AC架构在强化学习（ReinforcementLearning,RL）中，AC架构（即Actor-Critic架构）是一种非常常用的架构，用于训练智能体（Agent）在环境中执行任务。AC架构结合了策略梯度方法和价值迭代方法，通过分离策略和价值函数的估
Linux Commands&Tips hilgc000 Linux find linux
Tips文件操作根据名字查找文件https://www.cnblogs.com/Baron-Lu/p/6991269.htmlfind/home/lijiajia/-name‘*elm’批量替换文件中的字符串：sed-i“s/len/size/g”`greplen-rl./`批量修改文件名fornameinls*.html;doecho$name${name%.html}.jpg;donelsjp
DeepSeek R1：中国AI黑马的崛起与挑战码事漫谈 AI 人工智能
文章目录技术突破：从零开始的推理能力进化DeepSeekR1-Zero：纯RL训练的“自我觉醒”DeepSeekR1：冷启动与多阶段训练的平衡之道实验验证：推理能力的全方位跃升基准测试：超越顶尖闭源模型蒸馏技术：小模型的逆袭行业启示：AGI之路的新范式纯RL训练的价值与挑战蒸馏技术的普惠意义开源生态的推动力未来展望：从推理到通用智能结语在人工智能领域，大型语言模型（LLMs）正以迅猛之势重塑我们的
[补题]G2. Ruler (hard version) Flower# 题解/补题 c++算法 c语言
G2.Ruler(hardversion)思路:hard和easy版的区别就是从10次查询变成7次。如果是10次，那么可以每次查询一个正方形用二分的方法容易的做出来。如果是7次，可以用类似于三分的方法，查询l×rl\timesrl×r的矩形的结果q：若q=lm∗rq=lm*rq=lm∗r则x>rmx>rmx>rm若q=lm∗(rm+1)q=lm*(rm+1)q=lm∗(rm+1)则lm=lmx>=
NVIDIA Isaac Lab 入门教程（一） kuan_li_lyg 机器人最优控制工具人工智能机器人开发语言 python 强化学习模仿学习 Isaac
系列文章目录前言IsaacLab是一个用于机器人学习的统一模块化框架，旨在简化机器人研究中的常见工作流程（如RL、从演示中学习和运动规划）。它建立在英伟达IsaacSim的基础上，利用最新的仿真功能实现逼真的场景和快速高效的仿真。该框架的核心目标是模块化：轻松定制和添加新环境、机器人和传感器。灵活性：适应社区不断变化的需求。开放性：保持开源，允许社区贡献和扩展框架。包含电池：包含大量可随时使用的环
【llm对话系统】RL强化学习的技术演进与RLHF kakaZhui 人工智能 chatgpt llama
一、强化学习基础知识强化学习(ReinforcementLearning,RL)是一种机器学习方法，它通过智能体(Agent)与环境(Environment)的交互来学习如何行动以最大化累积奖励(Reward)。1.核心概念:智能体(Agent):做出决策并采取行动的学习者。环境(Environment):智能体所处的外部世界，对智能体的行动做出反应。状态(State,S):对环境当前情况的描述。
智能推理的革命：DeepSeek-R1 深度解析其算法与实现步子哥算法人工智能
在人工智能（AI）领域，语言模型（LargeLanguageModels,LLMs）正以惊人的速度发展，变得越来越智能，能够理解和生成复杂的语言内容。然而，尽管现有的模型在许多任务上表现出色，它们在深度推理和逻辑思维方面仍有显著的提升空间。DeepSeek-R1的出现，正是为了解决这一问题，通过强化学习（ReinforcementLearning,RL）赋予语言模型更强大的推理能力，开创了LLMs
【AI论文】迈向大型推理模型：大型语言模型增强推理综述东临碣石82 人工智能语言模型自然语言处理
摘要：语言长久以来被视为人类推理不可或缺的工具。大型语言模型（LLM）的突破激发了利用这些模型解决复杂推理任务的浓厚研究兴趣。研究人员已经超越了简单的自回归词元生成，引入了“思维”的概念——即代表推理过程中间步骤的词元序列。这一创新范式使LLM能够模仿复杂的人类推理过程，如树搜索和反思性思维。近期，一种新兴的学习推理趋势采用强化学习（RL）来训练LLM掌握推理过程。这种方法通过试错搜索算法自动生成
【强化学习】PyTorch-RL框架大雨淅淅人工智能 pytorch 人工智能 python 深度学习机器学习
目录一、框架简介二、核心功能三、学习环境配置四、学习资源五、实践与应用六、常见问题与解决方案七、深入理解强化学习概念八、构建自己的强化学习环境九、调试与优化十、参与社区与持续学习一、框架简介PyTorch-RL是一个基于PyTorch框架的深度强化学习项目。它充分利用了PyTorch的强大功能，提供了易于使用且高效的深度强化学习算法实现。该项目的主要编程语言是Python，旨在帮助开发者快速实现和
蓝桥杯真题 - 子树的大小 - 题解 ExRoc 蓝桥杯算法 c++
题目链接：https://www.lanqiao.cn/problems/3526/learning/个人评价：难度2星（满星：5）前置知识：无整体思路整体将节点编号−1-1−1，通过找规律可以发现，节点iii下一层最左边的节点编号是im+1im+1im+1，最右边的节点编号是im+mim+mim+m；用l,rl,rl,r分别标记当前层子树的最小节点编号与最大节点编号，每次让最左边的节点往下一层的
【机器学习：三十二、强化学习：理论与应用】 KeyPan 机器学习机器学习机器人人工智能深度学习数据挖掘
1.强化学习概述**强化学习（ReinforcementLearning,RL）**是一种机器学习方法，旨在通过试验与反馈的交互，使智能体（Agent）在动态环境中学习决策策略，以最大化累积奖励（CumulativeReward）。相比监督学习和无监督学习，强化学习更关注长期目标，而非简单地从标签中学习。核心概念智能体（Agent）：进行学习和决策的主体。环境（Environment）：智能体所在
《AI语言模型的关键技术探析：系统提示、评估方法与提示工程》 XianxinMao 人工智能语言模型自然语言处理
文章主要内容摘要1.系统提示(SystemPrompt)定义:用于设置模型行为、角色和工作方式的特殊指令重要性:定义模型行为边界影响输出质量和一致性可将通用模型定制为特定领域助手挑战:技术集成复杂兼容性问题效果难以精确预测2.模型评估方法创新方向:自一致性(Self-Consistency)评估PlanSearch方法强化学习(RL)应用核心特点:多次采样和交叉验证策略空间探索动态权重调整实践价值
【深度强化学习】DQN：深度Q网络算法——从理论讲解到源码解析视觉萌新、深度强化学习深度Q网络 DQN
【深度强化学习】DQN：深度Q网络算法——从理论讲解到源码解析介绍常用技巧算法步骤DQN源码实现网络结构训练策略DQN算法进阶双深度Q网络（DoubleDQN）竞争深度Q网络（DuelingDQN）优先级经验回放（PER）噪声网络（noisy）本文图片与源码均来自《EasyRL》：https://github.com/datawhalechina/easy-rl介绍核心思想：训练动作价值函数Q
css 在div左上角添加类似书签的标记嗬呜阿花 STYLE LIST css 前端 html
效果图html半导体CSS.mark{float:left;margin:06rpx;position:relative;padding:0;width:24px;color:#fff;writing-mode:sideways-rl;text-align:center;}.mark::after{position:absolute;content:"";left:0;top:100%;borde
OpenAI o1 的价值意义及“强化学习的Scaling Law” & Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考光剑书架上的书 ChatGPT 大数据AI人工智能计算人工智能算法机器学习
OpenAIo1的价值意义及“强化学习的ScalingLaw”蹭下热度谈谈OpenAIo1的价值意义及RL的Scalinglaw。一、OpenAIo1是大模型的巨大进步我觉得OpenAIo1是自GPT4发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT4o和o1是发展大模型不同的方向，但是o1这个方向更根本，重要性也比GPT4o这种方向要重要得多，原因下面会分析。为什
缩小模拟与现实之间的差距：使用 NVIDIA Isaac Lab 训练 Spot 四足动物运动 AI人工智能集结号人工智能
目录在IsaacLab中训练四足动物的运动能力目标观察和行动空间域随机化网络架构和RL算法细节先决条件用法训练策略执行训练好的策略结果使用JetsonOrin在Spot上部署经过训练的RL策略先决条件JetsonOrin上的硬件和网络设置Jetson上的软件设置运行策略开始开发您的自定义应用程序由于涉及复杂的动力学，为四足动物开发有效的运动策略对机器人技术提出了重大挑战。训练四足动物在现实世界中上
Codeforces Round 969 (Div. 2 ABCDE题) 视频讲解阿史大杯茶 Codeforces 算法 c++数据结构
A.Dora’sSetProblemStatementDorahasasetssscontainingintegers.Inthebeginning,shewillputallintegersin[l,r][l,r][l,r]intothesetsss.Thatis,anintegerxxxisinitiallycontainedinthesetifandonlyifl≤x≤rl\leqx\leq
论文速读|全身人型机器人控制学习与序列接触 28BoundlessHope 人形机器人文献阅读人工智能机器人
项目地址：WoCoCo:LearningWhole-BodyHumanoidControlwithSequentialContactsWoCoCo（Whole-BodyControlwithSequentialContacts）框架通过将任务分解为多个接触阶段，简化了策略学习流程，使得RL策略能够通过任务无关的奖励和模拟到现实的设计来学习复杂的人型机器人控制任务。该框架仅需要对每个任务指定少量任务
【3.7】贪心算法-解分割平衡字符串攻城狮7号贪心算法算法 c++
一、题目在一个平衡字符串中，'L'和'R'字符的数量是相同的。给你一个平衡字符串s，请你将它分割成尽可能多的平衡字符串。注意：分割得到的每个字符串都必须是平衡字符串。返回可以通过分割得到的平衡字符串的最大数量。示例1：输入：s="RLRRLLRLRL"输出：4解释：s可以分割为"RL"、"RRLL"、"RL"、"RL"，每个子字符串中都包含相同数量的'L'和'R'。示例2：输入：s="RLLLLR
基于强化学习的制造调度智能优化决策松间沙路hba 智能调度强化学习制造智能排程车间调度 APS 强化学习
获取更多资讯，赶快关注上面的公众号吧！文章目录调度状态和动作设计调度状态的设计调度动作的设计基于RL的调度算法基于值函数的RL调度算法SARSAQ-learningDQN基于策略的RL调度算法基于RL的调度应用基于RL的单机调度基于RL的并行机调度基于RL的流水车间调度基于RL的作业车间调度基于RL的其他调度RL与元启发式算法在调度中的集成应用讨论问题领域算法领域应用领域参考文献生产调度作为制造系
深度学习学习经验——强化学习（rl） Linductor 深度学习学习经验深度学习学习人工智能
强化学习强化学习（ReinforcementLearning,RL）是一种机器学习方法，主要用于让智能体（agent）通过与环境的互动，逐步学习如何在不同情况下采取最佳行动，以最大化其获得的累积回报。与监督学习和无监督学习不同，强化学习并不依赖于已标注的数据集，而是通过智能体在环境中的探索和试错来学习最优策略。强化学习的主要特点：基于试错学习：强化学习中的智能体通过与环境的互动，不断尝试不同的行动
粒子群优化算法和强化算法的优缺点对比，以表格方式进行展示。详细解释资源存储库笔记笔记
粒子群优化算法（PSO）和强化学习算法（RL）是两种常用的优化和学习方法。以下是它们的优缺点对比，以表格的形式展示：特性粒子群优化算法（PSO）强化学习算法（RL）算法类型优化算法学习算法主要用途全局优化问题，寻找最优解学习和决策问题，优化策略以最大化长期奖励计算复杂度较低，通常不需要梯度信息；计算复杂度与粒子数量和迭代次数有关较高，涉及到策略网络的训练和环境交互；复杂度取决于状态空间、动作空间以
请介绍一下大数据主要是干什么的？决策支持预测分析用户行为分析个性化服务操作优化风险管理创新与产品开发加拿大卡尔加里大学历史背景学术结构研究和创新校园设施盛溪的猫猫感悟大数据英语加拿大
目录请介绍一下大数据主要是干什么的？决策支持预测分析用户行为分析个性化服务操作优化风险管理创新与产品开发加拿大卡尔加里大学历史背景学术结构研究和创新校园设施国际化学生生活大语言模型目前的问题卡尔加里经济地理和气候文化和活动教育交通绿色城市AVL树的旋转单右旋（LL旋转）单左旋（RR旋转）左右旋（LR旋转）右左旋（RL旋转）请介绍一下大数据主要是干什么的？大数据是一个涉及从极其庞大和复杂的数据集中提
TinyUSB 基本使用 czy8787475 DDM 单片机
由于早期时候我们产品基于STM32开发,自然而然的用了STM32的USB库,这个本身没什么问题,库也很完善,而且有官方在完善,这本来是个不错的东西,但是随着ST的缺货,问题就越来越多,比如别人的芯片可不会兼容ST的库,如果是标准设备那还好,如果像我们还做HOTPKey这样的,移植起来就相当的麻烦.一开始他们推荐我使用RL-USB,但是RL-USB始终是挂载RTX上的,至于哪一天RTX也出毛病,这就
【强化学习】day1 强化学习基础、马尔可夫决策过程、表格型方法宏辉强化学习 python 算法强化学习
写在最前：参加DataWhale十一月组队学习记录【教程地址】https://github.com/datawhalechina/joyrl-bookhttps://datawhalechina.github.io/easy-rl/https://linklearner.com/learn/detail/91强化学习强化学习是一种重要的机器学习方法，它使得智能体能够在环境中做出决策以达成特定目标。
今日arXiv最热NLP大模型论文：无需数据集，大模型可通过强化学习与实体环境高效对齐 | ICLR2024 夕小瑶自然语言处理人工智能深度学习
引言：将大型语言模型与环境对齐的挑战虽然大语言模型（LLMs）在自然语言生成、理解等多项任务中取得了显著成就，但是在面对看起来简单的决策任务时，却常常表现不佳。这个问题的主要原因是大语言模型内嵌的知识与实际环境之间存在不对齐的问题。相比之下，强化学习（RL）能够通过试错的方法从零开始学习策略，从而确保内部嵌入知识与环境的对齐。但是，怎样将先验知识高效地融入这样的学习过程是一大挑战，为了解决这一差距
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round