前世忘语

【综述】分子预训练模型综述

A Systematic Survey of Molecular Pre-trained Models

总结

一、Introduction

二、Molecular Descriptors

三、Pre-training Strategies

1. AutoEncoders (AE)

2. Autoregressive Modeling (AM)

3. Masked Components Modeling (MCM)

4. Context Prediction (CP)

5. Contrastive Learning (CL)

6. Replaced Component Detection (RCD)

7. Denoising Modeling (DM)

8. Knowledge-Enriched Pre-training

9. Multimodal Pre-training

四、Applications

1. Molecular Property Prediction (MPP)

2. Molecular Generation (MG)

3. Drug-Drug Interaction (DDI)

4. Drug-Target Interaction (DTI)

五、Conclusions and Future Outlooks

1. Understanding Theoretical Groundings

2. Towards Better Knowledge Transfer

3. Seeking Better Encoder Architectures and Pre-Training Tasks

4. Seeking More Reliable and Realistic Benchmarks for Fair Evaluations

5. Pursuing Broader Impact in Diverse End Tasks

总结

今天给大家介绍来自浙江大学于2022年10月29日发表在arXiv上的预印本《分子预训练模型综述》。从头开始训练深度神经网络通常需要足够的标记分子，而在现实场景中获取这些分子的成本很高。为了缓解这一问题，受NLP中“预训练-微调”范式成功的启发，人们投入了大量精力研究分子预训练模型（MPMs），在这种模型中，神经网络使用大规模的无标记分子进行预训练，然后针对不同的下游任务进行微调。作者提供了一个系统的预训练模型的分子表征综述。首先，作者强调了训练深度神经网络进行分子表征的局限性。接下来，作者从分子描述符、编码器结构、预训练策略和应用等几个关键角度系统地回顾了该主题的最新进展。最后，作者指出了几个挑战，并讨论了未来有前途的研究方向。

一、Introduction

基于序列（LSTM，Transformer）和基于图（GNN）的方法都特别关注在监督下的分子表示。这种学习范式往往需要足够的标记分子数据，这阻碍了其在实践中的广泛应用，主要有以下两个原因：

Scarcity of labeled data：特定任务的分子标签可能非常稀缺，因为数据标签通常需要耗时和资源昂贵的湿实验。

Poor out-of-distribution generalization：在许多现实场景中，学习具有不同大小或官能团的分子需要分布外泛化。例如，当一个人想要预测一个新合成的分子的化学性质时，它与训练集中的所有分子都不同。然而，据观察，目前的神经网络不能很好地外推到分布外的分子。

受NLP中近期成功的预训练语言模型（PLMs）的启发，MPMs被引入来从大量未标记的分子中学习通用分子表征，并使用任务特定的标记数据对下游任务进行微调。图1显示了常规流程。一开始，研究人员采用基于序列的预训练策略对基于序列的分子数据，如SMILES。一种典型的策略是预训练编码器来预测像BERT这样的随机掩码标记。该系列包括ChemBERTa、SMILES-BERT、Molformer等。最近，分子图（2D和3D）的预训练也逐渐步入人们的视野。其中2D图的预训练主要利用图拓扑的结构信息，3D图的预训练主要利用三维构象信息。例如，Hu等人提出了两种预训练策略(1)掩码原子或边属性并预测被掩码属性(2)预测通过取中心原子周围的K-hop邻居获得的上下文子图。You等人建议使用对比学习最大化成对分子图之间的一致性。Zaidi等人证明，对构象空间进行去噪有助于学习分子力场。这项工作的贡献可以概括为以下四个方面:

Structured taxonomy：如图2所示，作者贡献了一个结构化的分类法来提供该领域的广泛概述，它从四个角度对现有的工作进行了分类：分子描述符、网络结构、预训练策略和应用。

Current progress：根据分类法，系统地描述了分子预训练模型的研究现状。

Abundant resources：收集了丰富的资源，包括开源的MPM、可用的数据集和一个重要的论文列表，网址。

Future directions：讨论了现有研究的局限性，并提出了几个有前途的研究方向。

图 1

图 2

二、Molecular Descriptors

指纹：分子指纹用二元串来描述分子中特定亚结构的存在或缺失。例如，PubChemFP编码了881个结构键类型，对应于PubChem数据库中所有化合物片段的子结构。Morgan指纹为每个原子分配数字标识符，并使用哈希函数在相邻原子之间迭代更新这些原子描述符。

序列：由于其通用性和可解释性，最常用的分子顺序描述符是SMILES。每个原子都表示为各自的ASCII符号。化学键、分支和立体化学在SMILES串中用特定的符号表示。然而，SMILES字符串的大部分并不对应有效分子。为了解决这个问题，最近开发了一个基于字符串的分子描述符SELFIES，这样每个SELFIES字符串都表示一个有效的分子。

2d图：分子可以自然地表示为二维图，原子作为节点，键作为边。此外，每个节点和边缘还可以携带信息特征向量，例如表示原子/键类型。尽管2D图被证明是分子的自然描述符，但这种描述符有一些限制。例如，对于两个手性不同的分子图，当原子和键类型作为唯一特征时，大多数主流的图神经网络无法区分它们。为了用更有意义的特征丰富图形表示，通常包含两个特征集:基本特征和丰富特征。前者是节点和键特征的最小集合，可以清楚地描述分子的二维结构，后者包括附加的原子特征，如芳香性和杂化，以及键特征，如环信息。作者将这两个特征集分别总结为表1和表2。

3d图：3D分子几何图形表示三维空间中每个原子的空间排列。具体来说，它包括具有原子类型和原子坐标的原子列表。与关注拓扑信息的2D分子图不同，3D几何图形编码构象信息，这对许多分子性质，特别是量子性质至关重要。此外，也可以直接推断三维空间中给定的分子几何构型的手性。

三、Pre-training Strategies

作者在表3中总结了几种代表性的预训练策略。

1. AutoEncoders (AE)

用自编码器重构分子（图3a）作为学习分子表征的自监督目标。分子重构中的预测目标是给定分子的部分结构，如原子子集或化学键的属性。例如，Honda等人建立了一个基于Transformer的编码器-解码器来重构SMILES所代表的分子。受自编码器在其他领域成功的启发，图自编码器也被广泛采用，通过重建原始分子图的邻接矩阵来预训练分子图。尽管自编码器可以学习有意义的分子表示，但它们无法捕捉分子间的关系，这限制了它们的性能。

2. Autoregressive Modeling (AM)

自回归模型将输入的分子分解为子序列，然后根据之前的子序列去预测下一个子序列。遵循GPT在预训练语言模型方面取得巨大成功的思想，MolGPT预训练一个Transformer，以自回归预测SMILES字符串中的下一个token。对于分子图，GPT-GNN按照一系列步骤重构分子图（图3b），而图自编码器则一次性重构整个图。特别是，给定一个节点和边随机掩码的图，GPT-GNN每次生成一个被掩码的节点及其边，并使每次迭代生成的节点和边的可能性最大化。然后，迭代生成节点和边，直到生成所有被掩码的节点。类似地，MGSSL生成分子图motif，而不是单个原子或键。然而，自回归预训练过程的计算成本较高。

3. Masked Components Modeling (MCM)

MCM（图3c）类似于掩码语言模型（MLM），它从输入语句中随机掩码标记，然后训练模型用其余标记预测掩码标记，MCM（图3c）首先掩码分子的某些部分（如原子、键、子图等），然后训练模型预测它们。对于基于序列的预训练，按照ChemBERTa、SMILES- bert和Molformer中的掩码语言模型对SMILES或SELFIES中的一些字符进行掩码，然后根据输入掩码后的SMILES或SELFIES的Transformer恢复掩码字符。对于分子图预训练，Hu等提出了属性掩蔽，其中输入的原子/化学键属性被随机掩码，并对GNN进行预训练以预测这些属性。此外，GROVER尝试预测掩码图，以捕获分子图中的上下文信息。这些掩码方法尤其适用于注释丰富的分子图。例如，掩码节点属性（原子类型）使GNN能够学习简单的化学规则，如价，以及更复杂的化学现象比如官能团的电子或空间效应。此外，与自回归相比。MCM根据周围环境预测被掩码的成分(原子/键)，而自回归模型仅根据出现在它们之前的序列预测它们。因此，MCM允许MPM全面捕获化学规律。然而，使用MCM的预训练模型的输入往往包含下游任务中从未出现过的人工符号，这造成了预训练和微调阶段之间的差距。这一关键问题在分子预训练中仍未得到解决。

4. Context Prediction (CP)

上下文预测（图3d）被提出以上下文感知的方式捕获分子/原子的语义。例如，Hu等人使用分子中的子图，用GNN预测其周围的上下文结构。GROVER试图在一些局部子图中预测目标原子/键的上下文感知属性。这里的属性是目标原子/键周围的一些原子键计数项。尽管CP很有效，但它需要一个辅助模型来将上下文编码为一个固定的向量，这为大规模的预训练引入了更多的计算开销。

5. Contrastive Learning (CL)

对比预训练已成为分子表征最流行的策略之一。根据对比粒度(如分子级或子图级)，可将CL分为Deep InfoMax (DIM)和Instance Discrimination (IND)两类。

DIM最初是为图像提出的，通过最大化图像表示和图像局部区域之间的相互信息来学习表示。对于分子图，InfoGraph首先提出通过最大化不同粒度的分子与子图级表示之间的互信息来获得有表达性的分子表示。

IND（图3e）是最受欢迎的预训练策略之一，其目的是通过将增强的分子推到靠近锚点分子(正对)的地方，而远离其他分子(负对)来学习分子表示。对于分子表示，GraphCL及其变体为用图表示的分子水平预训练提出了各种先进的增强策略。最近，一些研究尝试通过分别丢弃负对、参数化互信息估计、甚至分子图数据增强来简化上述对比预训练框架。此外，最近的一些研究也使相同分子的不同描述符之间的一致性最大化，并排斥不同的描述符。具体来说，SMICLR联合预训练一个图编码器和一个SMILES编码器来执行对比学习目标。MM-Deacon利用两个独立的Transformer来学校分子的SMILES与IUPAC表征，之后使用对比目标来最大化相互信息，判断SMILES和IUPAC是否来自同一分子，并区分来自不同分子的SMILES和IUPAC。GeomGCL采用双视图几何消息传递神经网络（GeomMPNN）对分子的2D和3D图形进行编码，并设计几何图形对比目标。

虽然分子对比预训练已经取得了很好的效果，但仍有一些关键问题。

在分子增强过程中难以保持语义。现有的解决方案通过人工试错，繁琐的优化，或通过昂贵的领域知识的指导来选择合适的扩展，这是次优的。

在分子对比学习中，拉近相似分子的距离可能并不总是正确的。例如，在分子活性悬崖的情况下，相似的分子具有完全不同的性质，仍然将它们的嵌入拉近的对比目标可能不合适。对于分子预训练，是否有更合适的增广框架或无增广框架还有待探索。

对比框架将其他所有分子图拒之门外，不管它们的真实语义如何，由于最近一项工作中主张的假阴性问题，这将不利于排斥性质相似的分子，并削弱性能。

6. Replaced Component Detection (RCD)

替换成分检测（图3f）被提出作为输入分子随机排列的有效预训练任务。具体来说，PHD将分子分解成两个部分，并通过不同分子中单个部分的随机组合排列分子结构。然后训练编码器来判断这两种成分是否来自同一分子。尽管RCD可以帮助MPM捕获分子结构下的内在模式，但它本质上是一个二元分类任务，比MCM更具挑战性。因此，在这种简单的预训练任务下，预训练过程会迅速收敛到一个高值，从而使预训练模型捕获的可转移知识更少，从而影响了对新任务的泛化或适应能力。

7. Denoising Modeling (DM)

受Noisy Nodes的启发，Noisy Nodes将去噪（图3g）作为提高性能的辅助任务，最近的一项工作将噪声添加到3D几何的原子坐标中，并对编码器进行预训练以预测噪声。他们进一步证明了分子预训练中的去噪目标近似等价于学习一个分子力场，揭示了去噪如何帮助分子预训练。同时，考虑到掩蔽原子类型可以通过3D原子位置推断出来，普通的掩码原子类型预测任务可以非常简单。作为补救措施，Uni-Mol设计了一个3D位置去噪预训练任务，在原子坐标中添加噪声，使掩模原子预测的预训练任务更具挑战性，从而鼓励模型学习更多可转移的知识。

8. Knowledge-Enriched Pre-training

MPMs通常从大型分子数据库中学习一般的分子表示。然而，他们通常缺乏领域特定的知识。为了提高MPM的性能，最近的一些研究尝试将外部知识注入MPM中。例如，GraphCL首先指出键扰动（键的添加或删除）在概念上与领域知识不相容，而且在经验上对化合物的对比预训练没有帮助。因此，他们避免采用键扰动来进行分子图增强。

为了更明确地将领域知识融入到预训练中，MoCL提出了一种新的分子增强算法，称为子结构替换，将分子的有效子结构替换为生物电子等排体，该生物电子等排体产生一个与原分子具有相似物理或化学性质的新分子。最近，为了捕捉具有共同属性但没有化学键直接连接的原子之间的相关性，KCL构建了一个化学元素知识图来总结化学元素之间的微观联系，并为分子表示学习贡献了一个新的知识增强对比学习框架。此外，MGSSL首先利用BRICS算法推导出语义意义的motif，然后预训练编码器以自回归方式预测motif。ChemRL-GEM提出利用分子几何信息增强分子图预训练。设计了一种基于几何的图神经网络和几种几何级的自监督学习策略(键长预测、键角预测和原子距离矩阵预测)来捕获预训练时的分子几何知识。Zhu等人提出使用对比目标最大化四种分子描述符的视图嵌入与其聚合嵌入之间的一致性。

9. Multimodal Pre-training

分子还可以使用其他形式描述，包括图像和生化文本。受CV和NLP领域多模态预训练进展的启发，最近的一些工作对分子进行了多模态预训练。

例如，KV-PLM首先将SMILES和生化文本变成token。然后，他们随机掩码部分标记，并预训练编码器恢复掩码token。MolT5首先掩盖了一些丰富的SMILES和分子的生化文本描述的部分，然后预训练Transformer模型来预测被掩盖的部分。这样，这些预训练的模型既可以生成SMILES字符串，也可以生成生化文本，这对于文本引导的分子生成和分子标题（生成分子描述性文本）尤其有效。此外，MICER采用了一种基于编码器-解码器的预训练框架用于分子图像标题（生成分子图像的描述性文本）。具体来说，它们将分子图像作为预训练的编码器（即CNN）的输入，然后解码相应的SMILES字符串。上述多模态预训练策略可以提高不同模态间的翻译效果。此外，各种模态可以相互补充，为下游任务组成更完整的知识库。

四、Applications

在表5中，作者总结了在不同应用程序中用于评估MPM的几个广泛使用的数据集。

1. Molecular Property Prediction (MPP)

MPMs可以作为分子编码器来获得新合成药物的表示，这有助于下游分子性质预测任务。MoleculeNet是分子性质预测最常用的benchmark，包括来自PubChem]、PubChem BioAssasy和ChEMBL的70万个分子。分子的性质大致可分为四类：生理、生物物理、物理化学和量子力学。MoleculeNet共有17个数据集，其中FreeSolv、ESOL、MUV、HIV、BACE、BBBP、Tox21、ToxCast、SIDER、Clintox、QM7、QM8、QM9是最常用的MPMs评估数据集。利用MoleculeNet进行分子性质预测可以看作是机器学习中的多标签二元分类或回归任务。最近，引入了一个名为Alchemy的新的量子分子数据集，用于分子性质的多任务学习。

2. Molecular Generation (MG)

分子生成是计算机辅助药物设计的一个长期而有前途的研究课题。然而，列举无限的类药物化学空间在计算上是禁止的。基于机器学习的方法，特别是生成模型，通过缩小搜索空间和提高计算效率，彻底改变了分子生成的前景。目前，MPMs在分子生成方面已经显示出了良好的应用前景。例如，MolGPT采用自回归模拟分子生成过程的预训练策略，在生成有效的、唯一的和新颖的分子方面显示出有前景的结果。此外，多模态分子预训练技术的出现使从描述性文本生成分子成为可能(文本到分子生成)。此外，以生成分子三维构象为目标的分子构象生成具有广泛的应用，如蛋白质-配体结合位姿预测。传统的基于分子动力学或马尔可夫链蒙特卡罗的方法往往计算成本高，特别是对于大分子。三维几何增强MPMs在下游的构象生成任务中表现出显著的优势，因为它们可以捕获二维分子图和三维构象之间的必然关系。评价分子生成的代表性数据集包括ZINC ， ChEMBL和QM9。

3. Drug-Drug Interaction (DDI)

药物-药物相互作用预测是药物研发过程中必不可少的一个阶段，它可能导致药物不良反应，损害健康甚至导致死亡。此外，准确的DDI预测有助于药物推荐。因此，DDI预测是市场批准前监管调查不可或缺的一部分。从机器学习的角度来看，DDI预测可以看作是将联合药物的影响分为协同作用、相加作用和拮抗作用三类的任务。现有的分子预训练工作，如MPG，将DDI预测作为评估MPM有效性的下游任务。常用的DDI预测数据集包括TWOSIDES2和DeepDDI3，提取自DrugBank。

4. Drug-Target Interaction (DTI)

药物-靶标相互作用预测是药物发现早期阶段的一项关键任务，其目的是确定具有与特定蛋白质靶标结合效力的候选药物。此外，当一种新疾病出现时，最佳的治疗选择是回收已批准的药物，因为它们的可用性和已知的安全性，即药物再利用。因此，DTI预测可以减少进一步的药物发现需求，降低药物安全风险。当利用MPMs实现DTI时，我们需要同时考虑分子编码器和目标编码器，并预测DTI的结合亲和力。在这种情况下，MPMs可以直接作为药物编码器，预先训练的模型为分子编码器提供了良好的初始化。然后，对分子编码器和目标编码器进行协同训练，实现DTI预测任务。现有的工作，如MPG遵循上述设置来推进DTI预测。DTI广泛使用的数据集包括Human和Caenorhabditis elegans。

五、Conclusions and Future Outlooks

1. Understanding Theoretical Groundings

尽管MPM已经在各种下游任务中证明了它们的能力，但对MPM的严格理论分析一直滞后。对于研究和产业界来说，理解MPM学到的关键机制以及它如何提高不同下游任务的性能至关重要。然后，我们可以更好地利用MPM的力量，在现实应用中放大优点，避免缺点。例如，最近的一项研究观察到，一些自监督图预训练策略并不总是比非预训练策略带来统计上显著的优势。需要进一步的工作来充分理解各种分子预训练目标成功或失败的理论基础。

2. Towards Better Knowledge Transfer

在预训练策略方面，MPM付出了巨大的努力。然而，如何利用这些预训练的模型来提高下游任务的性能还有待进一步研究。微调是一种使知识适应各种下游任务的主要技术，但它面临着灾难性遗忘[的问题，这意味着在微调过程中MPM经常忘记他们所学的知识。为了缓解这一问题，Han等人在微调阶段对各种预训练任务与目标任务进行自适应选择和组合，以实现更好的自适应。该策略保留了自监督预训练任务获取的足够知识，提高了分子预训练转移学习的有效性。然而，该策略假设MPM的预训练任务对下游用户可用，这在许多现实场景中是不实际的。为了更好地从预训练的模型中转移知识，还需要做大量的工作。

3. Seeking Better Encoder Architectures and Pre-Training Tasks

正如之前的研究所揭示的，在分子图预训练中应用强大的图注意网络（GAT）将极大地削弱预训练性能。目前还不清楚为什么会出现这种现象，以及什么样的GNN架构将是最适合分子图预训练的选择。另一方面，对于大规模分子图预训练，如何将消息传递方案作为统一的编码器集成到Transformer中，值得关注。此外，正如在之前中指出的，一些具有代表性的预训练策略仍然充满了各种各样的问题。例如，MCM在预训练和微调阶段之间造成了一个不受欢迎的间隙，因为它经常包含在下游任务中从未出现过的人工符号。预计会有更多的努力来缓解这些问题。

4. Seeking More Reliable and Realistic Benchmarks for Fair Evaluations

现有的MPM评价方案规模有限，使得对这些基准的评价对于了解MPM的实际进展不太可靠。以流行的量子特性预测数据集QM9为例，现有的MPM已经取得了很高的性能。进一步的竞争和在这些基准上投入的资源可能会对研究问题造成有限的影响。另一个例子是MoleculeNet，它包含了一些用于ADMET分子特性预测的昂贵数据集。然而，由于这些数据集非常小，同一模型的性能甚至在不同的随机种子下有很大的差异。此外，另一个迫切需要是在现实环境下进行基准测试，例如，考虑scaffold的分布外泛化，我们根据scaffold（分子子结构）拆分分子。正如在现实世界中，研究人员总是寻求将已知分子的MPMs应用到可能具有不同性质的未知分子上。最近，构建了治疗学数据共享(TDC)，用于系统地访问和评估跨越大量治疗任务的机器学习模型，这可能成为更公平评估MPM的统一平台

5. Pursuing Broader Impact in Diverse End Tasks

MPM通常规模很大，需要消耗大量的计算能力来训练。最终目标是获得一个通用的分子表示，可以用于任何涉及分子的下游任务。然而，方法的进步和实际应用之间存在着关键的差距。一方面，MPMs还没有被广泛用于取代传统的分子描述符。另一方面，MPMs如何使更多的下游任务受益，包括化学反应预测、虚拟筛选中的分子相似性搜索、逆合成、分子设计、化学空间探索等，仍有待进一步研究。

参考（具体细节见原文）

原文链接：[2210.16484] A Systematic Survey of Molecular Pre-trained Models (arxiv.org)https://arxiv.org/abs/2210.16484

分子预训练论文链接：

GitHub - junxia97/awesome-pretrain-on-molecules: A curated list of resources for pre-training on (molecular) graphs.https://github.com/junxia97/awesome-pretrain-on-molecules

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
Reflection 70B——HyperWrite推出的大型语言模型新加坡内哥谈技术语言模型人工智能自然语言处理
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一
5条实操干货有效打造你的个人品牌长安行动派
这是ZerK的第46篇原创相信大家对个人品牌这个词已经不在陌生。尤其是在知识付费的年代，你的个人品牌，就是你的标签！在《深度工作》中说到，在未来有三种人会越来越贵第一种人:能与机器对话，操纵机器的人。人工智能时代的到来，机器毕竟部分取代人类。第二种人:IP，知识产权或者文学潜在财产就像有些网上课程一周卖出的钱和一个机构卖一年一样多。价值99元的课程，10万人购买，是很常见的。爱产出大概就是10万✖
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文

【综述】分子预训练模型综述

A Systematic Survey of Molecular Pre-trained Models

总结

一、Introduction

二、Molecular Descriptors

三、Pre-training Strategies

1. AutoEncoders (AE)

2. Autoregressive Modeling (AM)

3. Masked Components Modeling (MCM)

4. Context Prediction (CP)

5. Contrastive Learning (CL)

6. Replaced Component Detection (RCD)

7. Denoising Modeling (DM)

8. Knowledge-Enriched Pre-training

9. Multimodal Pre-training

四、Applications

1. Molecular Property Prediction (MPP)

2. Molecular Generation (MG)

3. Drug-Drug Interaction (DDI)

4. Drug-Target Interaction (DTI)

五、Conclusions and Future Outlooks

1. Understanding Theoretical Groundings

2. Towards Better Knowledge Transfer

3. Seeking Better Encoder Architectures and Pre-Training Tasks

4. Seeking More Reliable and Realistic Benchmarks for Fair Evaluations

5. Pursuing Broader Impact in Diverse End Tasks

你可能感兴趣的:(人工智能,深度学习)