wangpan007

论文解读：学习蛋白质的空间结构可以提高蛋白质相互作用的预测

文章目录

论文概况
1. 研究背景
2. 研究数据
- 2.1 种内数据集
- 2.2 种间数据集
- 2.3 多类别数据集
3. 研究方法
- 3.1数据预处理
3.2局部特征提取
- 3.3 结构特征提取
- - 3.3.1 构建预测接触图
  - 3.3.2 图表示学习
- 3.4 预测模块
4. 结果
- 4.1 种内数据集上的性能比较
- - 4.1.1四个种内数据集性能比较
  - 4.1.2与其他算法比较
- 4.2 多物种数据集的性能比较
- - 4.2.1 不同阈值的序列同一性比较
  - 4.2.2 TAGPPI与PIPR方法比较
- 4.3 多类别数据集性能比较
- 4.4 消融实验
- - 4.4.1TextCNN和图注意层的影响
  - 4.4.2 残基嵌入的影响
- 4.5 超参数的分析
- - 4.5.1批处理大小的影响
4.5.2 分类维度的选择
5. 结论
6. 创新点
7. 启发

论文概况

作者单位：湖南大学曾湘详课题组
发表期刊：《Briefings in Bioinformatics》，2020年期刊影响因子：11.622
发表时间：2022年1月11日
数据和代码：https://github.com/xzenglab/TAGPPI

1. 研究背景

生物细胞的生命是由代谢和信号通路中的蛋白质相互作用控制的，通过对PPIs的深入了解，我们可以更深入地了解正常状态和疾病状态下的细胞生理学，促进相关任务，如靶向药物开发和治疗设计。蛋白质的空间结构与蛋白质的功能密切相关。整合蛋白质结构提高了蛋白质相互作用(PPI)预测的性能。然而，已知蛋白质结构的数量有限，限制了基于结构的预测方法的应用，利用预测的蛋白质结构信息是一种很有前途的方法来提高基于序列的预测方法的性能。我们提出了一种新的端到端框架TAGPPI仅使用蛋白质序列来预测PPIs。

2. 研究数据

2.1 种内数据集

种内PPI数据集由酵母（Yeast）、大肠杆菌（E. coli）、秀丽隐杆线虫（C. elegans）和黑腹线虫（D.melanogaster）这四个数据集组成。酵母的种内PPI数据集是目前最先进的方法中广泛使用的基准数据集，所以本文大量的实现在酵母数据集上展开，如下表所示。

数据集	蛋白质数量	正样本数量	负样本数量
酵母（Yeast）	2497	5594	5594
大肠杆菌（E. coli）	1834	6954	6954
秀丽隐杆线虫（C. elegans）	2637	4013	4013
黑腹线虫（D.melanogaster）	7058	21975	21975

2.2 种间数据集

多物种数据集结合了种内的基准数据集。多物种数据集是用来评估模型预测不同物种间蛋白质相互作用的能力，这些蛋白质具有非常低的序列一致性，在这个数据集上训练和测试我们的模型，以估计TAGPPI在多种物种上的能力，蛋白质少于50个氨基酸或高序列鉴定(40%， 25%， 10%或1%)被移除，如下表所示。

2.3 多类别数据集

该数据集是由AlphaFold预测的Homo sapiens蛋白质结构的数据集，它们的标签是通过与STRING数据库进行匹配获得，蛋白质数量和样本数量分别为：16278和75875。数据集中有七种类型的相互作用:激活（activation,）、绑定（,binding）、催化（catalysis）、表达（expression）、抑制（inhibihtion）、翻译后修饰（post-translational modification）和反应（reaction）。

3. 研究方法

本文提出了一个端到端的深度学习框架TAGPPI来识别PPI， PPI预测任务是一个基于多维蛋白质数据的二元分类问题。TAGPPI旨在学习一个映射函数f(.)，该函数输入两个蛋白质的序列特征及其预测的接触图。然后来预测是否存在相互作用。该方法主要包括以下四步：

数据处理：用一种预先训练好的嵌入模型来初始化氨基酸
序列局部特征提取：用序列特征学习模块在一维空间上捕获局部特征。
基于图的空间特征聚合：利用堆叠图神经网络和池化层选择空间结构特征。在接触图上实现了图形表示学习方法，获得了蛋白质的三维结构特征。
多层感知器的预测模块：将序列局部特征和图的空间特征进行结合，通过堆叠的三层全连接层完成最终的预测。

模型如下图所示

3.1数据预处理

利用氨基酸嵌入将蛋白质嵌入到不同的维度空间中，提取蛋白质的多维信息。利用SeqVec来实现氨基酸嵌入，SeqVec是通过训练ELMo语言模型得到的取自蛋白质序列Uniref50数据集，SeqVec采用字符序列嵌入和图节点嵌入两种方法实现了序列嵌入，嵌入的输出为 $X∈R^{L*M}$ 。

3.2局部特征提取

通过3.1部分的SeqVec得到矩阵的维度为 $X∈R^{L*M}$ ， M表示选择的特征维度作者设置为1024，L表示蛋白质序列氨基酸的数量。为了确保TextCNN模块的输出矢量大小是固定的，取蛋白质序列的最大氨基酸数L=1200，长度小于1200则用0进行填充，得到的嵌入矩阵的大小为 $R^{1200*1024}$ ，使用一维卷积的TextCNN来捕捉蛋白质序列的局部特征，该TextCNN包括三个卷积层和三个 max-pooling，具体结构如下图所示：

模型的参数如下：

三个卷积层参数：filter=128，kernel_size = 3，stide=1
前两个max-pooling：pool_size = 3，stide=3
最后一个max-pooling：pool_size =130，stide=1

3.3 结构特征提取

3.3.1 构建预测接触图

长度为L的蛋白质的接触图是一个方阵，当两个残基的 $C_ β$ 原子的欧式距离小于8Å时判定两个残基是接触的，方阵定义如下公式：

AlphaFold能够以原子精度预测蛋白质结构，是DeepMind和EMBL的欧洲生物信息学研究所提供蛋白质结构预测，它建立在多年以前使用大量基因组数据（约 170,000 个蛋白质结构）来预测蛋白质结构的研究基础之上。 AlphaFold产生的蛋白质3D模型比以往任何一种都精确得多，在生物学的核心挑战之一上取得了重大进展。作者使用上述定义的规则在AlphaFold数据库中构建了接触图，并建立了几个用于PPI预测的接触图数据库。

3.3.2 图表示学习

蛋白质空间图定义为G = (V, A)，其中V表示节点集， $A∈R^{L*L}$ 表示邻接矩阵，通过 AlphaFold预测的接触图学习得到，为了学习蛋白质的结构特征，我们按照全maxpooling操作设计了三个堆叠的图注意网络(GATs)模块，如下图所示，GATs对邻居节点进行聚合时采用注意机制。对目标节点影响较大的邻居节点在聚合中会获得较大的权重系数，邻近氨基酸在空间上的依赖性，即使它们的顺序很远。图注意层的初始输入是一组节点特征 $h^{(0)}=({h_1^{0},h_2^{0},h_3^{0},h_L^{0}，h_m^{0}∈R^{d^0})}$ ， ${d^0}=1024$ ，利用氨基酸嵌入方法，在氨基酸嵌入中描述的一套新的节点特征，第l个GAT的节点特征表示为 $h^{(l)}=({h_1^{l},h_2^{l},h_3^{l},h_L^{l}，h_m^{l}∈R^{d^l})}$ ，K头注意力机制可以表示为：

公式参数：
W：表示一个加权矩阵，用来实现一个可学习的线性变换从 $h^{l-1}$ 到 $h^{l}$
$N_m$ ：节点M邻居节点个数
||：表示连接运算
$α_{mn}^k$ ：表示第k个注意机制计算的归一化注意系数
$e_{ij}^{(l)}$ ：节点i和邻居节点j的相似系数

$α_{mn}$ 的定义如下：

GAT采用多头注意机制，提高了自我注意带来的效益。GATs模型的参数如下所示。

前两个图注意力层：K=3
最后一个图注意力层：K=1
全连接层神经元数量：128

一对蛋白质空间图 $G_i$ 和 $G_j$ 最终得到的结构特征向量为 $F_g^i∈R^{1*128}$ 和 $F_g^j∈R^{1*128}$ 。

3.4 预测模块

们将序列编码器的输出(即 $F_s^i$ 和 $F_s^j$ )和结构特征嵌入 $F_g^i$ 和 $F_g^j$ 进行组合，组合规则如下，其中 λ是一个可学习的参数。

连接 $F_o^i$ 和 $F_o^j$ ，即[ $F_o^i$ ; $F_o^j$ ]并获得输出为：

公式参数：
MLP：为三层堆叠的全连接层
激活函数：作者通过在酵母数据集的实验发现LeakyReLU差于RELU激活函数，故采用RELU作为激活函数。

采用交叉熵损失LCE作为模型的损失函数：
公式参数：
#D：训练数据集中蛋白质-蛋白质样本的总数
σ：表示sigmoid机会函数

4. 结果

4.1 种内数据集上的性能比较

4.1.1四个种内数据集性能比较

在种内数据集上得到的5倍交叉验证结果如下表所示。

结论：

准确度：在e.c oli数据集C和线虫数据集和D. melanogaster数据集均大于99%。
MCC：均高于95%

4.1.2与其他算法比较

基于酵母数据集的方法，并将我们的模型与9个最先进的模型进行了比较，对表3中的所有模型进行训练，直到在5倍交叉验证设置下收敛。
结论：作者的方法均好于其他九种算法。

下表中提供了统计显著性检验结果。结果表明TAGPPI明显优于其他方法和TextCNN模块。

结论：
TAGPPI明显优于其他方法和TextCNN模块

4.2 多物种数据集的性能比较

4.2.1 不同阈值的序列同一性比较

对多物种数据集进行评估的目的是展示TAGPPI在不同序列一致性标准下预测不同物种蛋白质相互作用的能力，下表的结果表明TAGPPI在不同序列一致性阈值下均表现良好。

结论：
模型在测试时的精度和特异性都在99%以上

4.2.2 TAGPPI与PIPR方法比较

结论：作者的方法TAGPPI的ACC和F1均高于PIPR方法

4.3 多类别数据集性能比较

进一步评估了TAGPPI在PPI类型预测任务中的能力。并与SCNN和PIPR在多类数据集上的性能进行了比较。10倍交差验证的结果如下表所示。

结论：除F1外作者的模型的效果好于SCNN和PIPR。

4.4 消融实验

4.4.1TextCNN和图注意层的影响

为了调查我们模型中每个组件的有效性，我们对酵母数据集进行了消融研究。如表7所示，检验TextCNN和图注意层的对实验结果的影响，如下表所示。

结论：TextCNN和图注意层的多重组合比单独使用效果更好
评估了TAGPPI提高的准确性的统计意义。统计学意义的比较(p值<0.01)以粗体表示，如表8所示。

结论：TAGPPI的性能明显优于除叠加两个的TextCNN外的大多数其他模型组件

局部特征和结构特征比例的影响：

结论：λ的值为0.3和0.5能取得更好的结果。

4.4.2 残基嵌入的影响

利用one-hot编码、物理化学特征和PIPR嵌入方法对三种嵌入特征的嵌入性能进行了评价。将SeqVec与上述三种嵌入特征在酵母数据集上的PPIs预测任务中进行了比较。还将one-hot编码和物理化学特征向量串联融合特征进行比较，如下图所示。

one-hot编码：利用20种氨基酸进行编码
物理化学特征：12种复合氨基酸的理化性质，在12种性质中，疏水性和极性分别按两种不同的尺度计算每种氨基酸的14维物理化学特征向量。
PIPR的氨基酸嵌入：训练前和物理化学性质的串联。

结论： SeqVec嵌入的性能最好。

4.5 超参数的分析

4.5.1批处理大小的影响

如下图所示，随着训练历元的增加，accuracy和precision的值逐渐提高。我们观察到，与批次16、32、64相比，批次8的精度值和精度值的提升趋势不是很明显，在epoch 10前后非常优秀，即使在训练epoch 50之后，批处理大小8也无法实现。

结论：综合考虑时间和精度，batchs_size设置为32

4.5.2 分类维度的选择

设计了三层堆叠全连通的二值分类器，并分别实现了Relu激活功能。尺寸表示第一个完全连接层中的神经元数量。第二层完全连接的神经元数量是第一层的一半。分类器的最后一个全连接层只有一个神经元。

结论：第一个全连接层的输出维度设置为512。

5. 结论

提出了一种新的端到端深度学习方法TAGPPI来预测ppi。我们使用卷积结构和GATs同时从氨基酸序列和接触图中提取特征，以描述蛋白质的空间结构。实验评估表明，与其他基于序列的方法相比，我们的模型在PPI预测方面是非常成功的。第一个应用图形的模型学习蛋白质接触映射到PPI任务。

6. 创新点

提出了一种深度学习框架TAGPPI，将蛋白质的序列特征和预测结构信息整合到蛋白质相互作用(protein-protein interaction, PPI)预测任务中，利用AlphaFold预测数据库构建的联系图，在基于序列和基于结构的方法之间架起了一座桥梁。
实验结果表明该方法优于现有的基于序列的方法
蛋白质表示学习方法的新策略可以应用于其他任务

7. 启发

可学习就别手动调参，局部特征和结构特征的比例系数λ的设置。
AlphaFold预测蛋白质的结构信息。
采用多尺度的TextCNN。
消融实验验证算法模块作用的同时提升工作量。

SeisMoLLM: Advancing Seismic Monitoring via Cross-modal Transfer with Pre-trained Large Language UnknownBody LLM Daily Multimodal 语言模型人工智能自然语言处理
摘要深度学习的最新进展给地震监测带来了革命性变化，但开发一个能在多个复杂任务中表现出色的基础模型仍然充满挑战，尤其是在处理信号退化或数据稀缺的情况时。本文提出SeisMoLLM，这是首个利用跨模态迁移进行地震监测的基础模型，它无需在地震数据集上进行直接预训练，就能充分发挥大规模预训练大语言模型的强大能力。通过精心设计的波形标记化处理和对预训练GPT-2模型的微调，SeisMoLLM在DiTing和
如何通过深度学习优化操作系统中的故障诊断与恢复机制金枝玉叶9 程序员知识储备1 程序员知识储备2 程序员知识储备3 深度学习人工智能
如何通过深度学习优化操作系统中的故障诊断与恢复机制（副标题：智能监控、自适应诊断与自动恢复——操作系统故障自愈的新方向）摘要随着现代操作系统在多核、高并发和分布式环境中的广泛应用，系统故障及其恢复问题日益成为影响系统稳定性和业务连续性的关键挑战。传统的故障诊断方法依赖于预设规则和人工干预，难以应对复杂多变的故障场景。本文提出了一种基于深度学习的故障诊断与恢复机制，通过对大量历史日志、监控数据和故障
知识蒸馏论文精选——《Graph-Free Knowledge Distillation for Graph Neural Networks 》宇直不会放弃 GKD-Output layer 人工智能数据挖掘机器学习深度学习神经网络 cnn pytorch
（GFKD）无图知识蒸馏《Graph-FreeKnowledgeDistillationforGraphNeuralNetworks》2021作者是XiangDeng和ZhongfeiZhang，来自纽约州立大学宾汉姆顿分校论文地址见文末摘要知识蒸馏（KnowledgeDistillation,KD）通过强制学生网络模仿在训练数据上预训练老师网络的输出，从而将知识从老师网络转移到学生网络。然而，在
LWC-KD：图结构感知的推荐系统增量学习对比知识蒸馏宇直不会放弃 GKD-Middle layer 人工智能 python chatgpt gpu算力深度学习机器学习神经网络
LWC-KD：图结构感知的推荐系统增量学习对比知识蒸馏《GraphStructureAwareContrastiveKnowledgeDistillationforIncrementalLearninginRecommenderSystems》2021作者是YueningWang、YingxueZhang和MarkCoates论文地址：https://dl.acm.org/doi/10.1145/
HarmonyNext实战案例：基于ArkTS的高性能分布式机器学习应用开发 harmonyos-next
HarmonyNext实战案例：基于ArkTS的高性能分布式机器学习应用开发引言在HarmonyNext生态系统中，分布式机器学习是其核心特性之一。通过分布式机器学习，开发者可以充分利用多设备的计算资源，实现复杂模型的训练与推理。本文将深入探讨如何使用ArkTS12+语法开发一个高性能的分布式机器学习应用，涵盖从基础概念到高级技巧的全面讲解。通过本案例，您将学习到如何利用HarmonyNext的分
成功案例丨开发时间从1小时缩短到3分钟：如何利用历史数据训练AI模型，预测设计性能？ Altair澳汰尔 PhysicsAI 仿真 AI 机器学习 HyperWorks 数据分析
案例简介PhysicsAI™助力HEROMOTOCORP实现设计效率提升99%印度领先的跨国摩托车和踏板车制造商HeroMotoCorpLtd.（以下简称Hero）致力于通过将人工智能（AI）和机器学习技术融入有限元分析（FEA）流程，以加速产品开发周期。在其首个AI驱动项目——摩托车把手设计优化中，Hero采用了PhysicsAI™几何深度学习解决方案，利用历史数据训练AI模型并预测设计性能。A
关于两次项目的学习感悟罗婕斯特大数据
经过这两次项目，我学到了以下几点：1.模块化与结构化思维：代码展示了如何将深度学习任务分解为多个模块（如数据加载、模型定义、训练循环、评估等）。这种模块化的思维方式不仅适用于编程，也可以应用于解决复杂问题时的结构化思考。2.细节决定成败：代码中涉及了许多细节，如数据预处理、学习率调整、损失函数的选择等。这些细节对模型的最终性能有着重要影响。这提醒我们，在解决实际问题时，细节往往决定成败，需要耐心和
Python学习指南：系统化路径 + 避坑建议程之编 Python全栈通关秘籍青少年编程 python 开发语言人工智能机器学习
新手小白学习编程就像搭积木——需要从基础开始，逐步构建知识体系。以下是为你量身定制的Python学习路径，帮你告别杂乱，高效入门！一、学习前的关键认知明确目标：想用Python做什么？数据分析（如Excel自动化、可视化）Web开发（如搭建网站）人工智能（如机器学习）自动化办公（如处理文件、邮件）目标不同，后续学习侧重点不同（但基础通用）。避免误区：❌只看教程不写代码✅边学边动手，哪怕抄代码也要运
机器学习之KMeans算法 Mr终游机器学习机器学习算法 kmeans
目录一、KMeans的核心思想二、KMeans算法流程三、KMeans的关键点1.优点：2.缺点：四、如何确定最佳k值1.肘部法则2.轮廓系数五、Kmeans的典型应用场景六、代码示例KMeans是一种广泛使用的无监督学习算法，主要用于聚类分析（Clustering）。它的目标是将数据集划分为K个互不重叠的子集（簇，Cluster），使得同一簇内的数据点尽可能相似，不同簇之间的数据点尽可能差异显著
大语言模型原理基础与前沿双层路由多模态融合、多任务学习和模块化架构 AI智能涌现深度研究 AI大语言模型和知识图谱融合 Python入门实战 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型原理基础与前沿：双层路由多模态融合、多任务学习和模块化架构关键词：大语言模型、双层路由、多模态融合、多任务学习、模块化架构、神经网络、自然语言处理1.背景介绍大语言模型（LargeLanguageModels，LLMs）已经成为人工智能和自然语言处理领域的重要研究方向。随着GPT-3、BERT等模型的出现，大语言模型在各种任务中展现出了惊人的性能。然而，随着模型规模的不断扩大和应用场景的
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务 AGI大模型与大数据研究院程序员提升自我硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：构建序列到序列(Seq2Seq)模型处理翻译任务1.背景介绍1.1问题的由来翻译是跨语言沟通的重要桥梁，随着全球化进程的加速，翻译需求日益增长。传统的机器翻译方法主要依赖于规则和统计方法，如基于短语的翻译、基于统计的机器翻译等。然而，这些方法难以处理复杂的语言现象，翻译质量参差不齐。近年来，随着深度学习技术的快速发展，基于神经网络序列到序列（Sequence-to-Seq
Python第十六课：深度学习入门 | 神经网络解密程之编 Python全栈通关秘籍 python 神经网络青少年编程
本节目标理解生物神经元与人工神经网络的映射关系掌握激活函数与损失函数的核心作用使用Keras构建手写数字识别模型可视化神经网络的训练过程掌握防止过拟合的基础策略一、神经网络基础（大脑的数字化仿生）1.神经元对比生物神经元人工神经元树突接收信号输入层接收特征数据细胞体整合信号加权求和（∑(权重×输入)+偏置）轴突传递电信号激活函数处理输出2.核心组件解析激活函数：神经元的"开关"（如ReLU：max
【氮化镓】用于低压射频电源的具有80.4% PAE的Si基E-Mode AlN/GaN HEMT 北行黄金橘氮化镓器件可靠性 GaN 科技氮化镓ＧａＮ　HEMT PAE
引言本文是一篇关于增强型（E-mode）AlN/GaN高电子迁移率晶体管（HEMTs）的研究论文，晶体管是在硅衬底上制造的，并在3.6GHz频率下展示了80.4%的峰值功率附加效率（PAE）。文章首先介绍了GaN器件在微波和毫米波功率放大器中的应用，特别是在雷达、卫星通信和民用移动通信系统中。这些应用对器件的性能要求极高，包括高功率密度、高效率和低供电电压。文章指出，与耗尽模式（D-mode）相比
【大模型开发】深入解析 DeepSpeed：原理、核心技术与示例代码云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习大模型开发大模型微调 deepseek deepspeed python 人工智能 pytorch
深入解析DeepSpeed：原理、核心技术与示例代码DeepSpeed是由微软开源的高性能深度学习训练优化引擎，专注于帮助研究人员和工程团队在分布式环境中高效地训练超大规模模型。其核心目标是提供高吞吐、低内存占用、低成本的分布式训练方案，让数千亿甚至万亿级参数模型的训练成为可能。本文将从DeepSpeed的核心原理、关键组件、代码示例及实现过程详解等方面做详细阐述，帮助读者更好地理解并使用Deep
【漫话机器学习系列】130.主成分（Principal Components） IT古董漫话机器学习系列专辑机器学习人工智能 python
主成分（PrincipalComponents）详解1.什么是主成分？主成分（PrincipalComponents，PCs）是数据集中方差最大的线性组合，它是主成分分析（PrincipalComponentAnalysis，PCA）中的核心概念。主成分可以看作是对原始特征的新表述方式，它通过数学变换找到一组新的正交坐标轴，使得数据的主要变化方向与这些轴对齐。简单来说：主成分是数据集中信息量（方差
一学就会的深度学习基础指令及操作步骤（6）迁移学习小圆圆666 深度学习迁移学习人工智能卷积神经网络
文章目录迁移学习模型准备数据增强模型训练模型微调和预测检查预测结果迁移学习迁移学习是将一个任务中学到的知识应用到另一个相关任务上，以提高新任务的学习效率和性能。优势：节省训练时间，提高模型性能，尤其在小数据场景下效果显著。核心是利用源域的知识来帮助目标域任务，比如在ImageNet上预训练的模型用于医疗影像分类。源域（SourceDomain）：已有知识的领域（如ImageNet图像库）。目标域（
C++开源库大全大王算法 C/C++开发实战365 C++入门及项目实战宝典 c++开源
程序员要站在巨人的肩膀上，C++拥有丰富的开源库，这里包括：标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++StandardLibrary：是一系列类和函数的集合，使用核心语言编写，也是C++ISO自身标准的一部分。
基于PyTorch的深度学习6——数据处理工具箱2 Wis4e 深度学习 pytorch 人工智能
torchvision有4个功能模块：model、datasets、transforms和utils。主要介绍如何使用datasets的ImageFolder处理自定义数据集，以及如何使用transforms对源数据进行预处理、增强等。下面将重点介绍transforms及ImageFolder。transforms提供了对PILImage对象和Tensor对象的常用操作。1)对PILImage的常
基于PyTorch的深度学习——机器学习3 Wis4e 深度学习机器学习 pytorch
激活函数在神经网络中作用有很多，主要作用是给神经网络提供非线性建模能力。如果没有激活函数，那么再多层的神经网络也只能处理线性可分问题。在搭建神经网络时，如何选择激活函数？如果搭建的神经网络层数不多，选择sigmoid、tanh、relu、softmax都可以；而如果搭建的网络层次较多，那就需要小心，选择不当就可导致梯度消失问题。此时一般不宜选择sigmoid、tanh激活函数，因它们的导数都小于1
深度学习与普通神经网络有何区别？是理不是里深度学习神经网络人工智能
深度学习与普通神经网络的主要区别体现在以下几个方面：一、结构复杂度普通神经网络：通常指浅层结构，层数较少，一般为2-3层，包括输入层、一个或多个隐藏层、输出层。深度学习：强调通过5层以上的深度架构逐级抽象数据特征，包含多层神经网络，层数可能达到几十层甚至上百层。例如，ResNet（2015）包含152个卷积层。二、特征学习方式普通神经网络：特征提取通常依赖人工设计，需要领域专家的经验。这意味着在处
神经网络中梯度计算求和公式求导问题 serve the people 日常琐问神经网络机器学习算法
以下是公式一推导出公式二的过程。表达式一∂E∂wjk=−2(tk−ok)⋅sigmoid(∑jwjk⋅oj)⋅(1−sigmoid(∑jwjk⋅oj))⋅∂∂wjk(∑jwjk⋅oj)\frac{\partialE}{\partialw_{jk}}=-2(t_k-o_k)\cdot\text{sigmoid}\left(\sum_jw_{jk}\cdoto_j\right)\cdot(1-\tex
AI 技术引入 RTK（实时动态定位）系统，可以实现智能化管理和自动化运行小赖同学啊人工智能低空经济人工智能自动化运维
将AI技术引入RTK（实时动态定位）系统，可以实现智能化管理和自动化运行，从而提高系统的精度、效率和可靠性。以下是AI技术在RTK系统中的应用实例：一、AI技术在RTK系统中的应用场景1.整周模糊度快速解算问题：RTK的核心是解算载波相位的整周模糊度，传统方法耗时较长。AI解决方案：使用深度学习模型（如卷积神经网络CNN）预测整周模糊度。通过历史数据训练模型，实现快速解算。实例：某无人机公司使用A
AI 驱动的软件测试革命：从自动化到智能化的进阶之路綦枫Maple AI+软件测试人工智能自动化运维
引言：软件测试的智能化转型浪潮在数字化转型加速的今天，软件产品的迭代速度与复杂度呈指数级增长。传统软件测试依赖人工编写用例、执行测试的模式，已难以应对快速交付与高质量要求的双重挑战。人工智能技术的突破为测试领域注入了新动能，通过机器学习、深度学习、自然语言处理等技术，测试流程正从“被动验证”向“主动预防”演进。本文将深入探讨AI与软件测试的融合路径，结合技术原理、工具实践与行业趋势，为读者呈现一幅
XGBClassifiler函数介绍浊酒南街 #算法机器学习 XGB
目录前言函数介绍示例前言XGBClassifier是XGBoost库中用于分类任务的类。XGBoost是一种高效且灵活的梯度提升决策树（GBDT）实现，它在多种机器学习竞赛中表现出色，尤其擅长处理表格数据。函数介绍XGBClassifiler(max_depth=3,learning_rate=0.1,n_estimators=100,objective='binary:logistic',boo
基于大数据架构的就业岗位推荐系统的设计与实现【java或python】—计算机毕业设计源码+LW文档 qq_375279829 大数据架构 python 课程设计算法
摘要随着互联网技术的迅猛发展和大数据时代的到来，就业市场日益复杂多变，求职者与招聘方之间的信息不对称问题愈发突出。为解决这一难题，本文设计并实现了一个基于大数据架构的就业岗位推荐系统。该系统通过收集、整合并分析大量求职者简历信息、企业招聘信息以及市场动态数据，运用先进的机器学习算法，为求职者提供个性化的岗位推荐服务，同时帮助企业快速定位到合适的候选人。本文将从系统设计的背景与意义、技术基础、需求分
向量数据库简介 openwin_top python编程示例系列 python编程示例系列二数据库
向量数据库（VectorDatabase）是一种专门用于存储和查询向量数据的数据库系统。向量数据库通常使用高效的向量索引技术，支持基于向量相似度的查询和检索，可以应用于图像搜索、自然语言处理、推荐系统、机器学习等领域。与传统的关系型数据库不同，向量数据库通常使用基于向量的数据模型，将向量作为数据的核心表示形式。向量数据库可以存储和处理大量的向量数据，支持高效的向量相似度计算和查询。常见的向量索引技
Ubuntu22.04安装CP2K最新版2025.1 jhonwyyc 机器学习深度学习 ubuntu
CP2K教程CP2K系列之一安装文章目录CP2K教程前言一、安装依赖库1.引入库二、下载并解压缩1.下载链接2.解压缩三、安装1.安装cp2k_toolchain2.安装cp2k3.指定根目录4.修改环境变量四、测试总结前言CP2K是一款开源的第一性原理计算软件，采用Fortran98编写。近年来结合机器学习与lammps，已成为热度逐年增加的软件。但是目前使用它仍存在不少难点。本文讲解在Ubun
在LangChain中运行Replicate模型的实用指南 fgayif langchain 人工智能 python
##技术背景介绍Replicate是一个平台，可以轻松调用各种预训练的AI模型。与传统的模型托管和调用相比，Replicate提供了简单的API接口，使开发者能够快速集成和使用强大的AI模型。本文将重点介绍如何在LangChain项目中集成和调用Replicate模型。##核心原理解析在集成Replicate模型之前，需要进行一些基础设置和安装工作。LangChain是一个用于自然语言处理的库，它
使用Activeloop Deep Lake构建深度学习数据仓库与向量存储 dgay_hua 深度学习人工智能 python
技术背景介绍随着深度学习技术的发展，数据的存储与管理成为了一个重要的问题。尤其是对于需要处理大量数据的应用，例如自然语言处理和图像识别，传统的数据存储方式已经无法满足需求。ActiveloopDeepLake是专为深度学习设计的数据仓库，可以作为向量存储使用，支持多模态数据的存储和处理，并且可以直接用于细调大型语言模型（LLMs）。此外，它还提供自动版本控制，无需依赖其他服务，兼容主要云服务提供商
使用CharacterTextSplitter进行文本分割的实战指南 bBADAS python
在处理长文本时，将其切割成较小的片段是常见的需求，尤其是在自然语言处理任务中。CharacterTextSplitter是一个强大的工具，用于通过字符分隔符对文本进行分割，本文将深入介绍如何使用它进行文本处理。技术背景介绍当面对一份冗长的文本时，比如总统演讲稿、法律文档等，我们常常需要将其拆分成便于处理的小段。CharacterTextSplitter正是为此而生的一个轻量级工具，专门用于基于特定
Java 并发包之线程池和原子计数 lijingyao8206 Java计数 ThreadPool 并发包 java线程池
对于大数据量关联的业务处理逻辑，比较直接的想法就是用JDK提供的并发包去解决多线程情况下的业务数据处理。线程池可以提供很好的管理线程的方式，并且可以提高线程利用率，并发包中的原子计数在多线程的情况下可以让我们避免去写一些同步代码。这里就先把jdk并发包中的线程池处理器ThreadPoolExecutor 以原子计数类AomicInteger 和倒数计时锁C
java编程思想抽象类和接口百合不是茶 java 抽象类接口
接口c++对接口和内部类只有简介的支持,但在java中有队这些类的直接支持 1 ,抽象类 : 如果一个类包含一个或多个抽象方法,该类必须限定为抽象类(否者编译器报错) 抽象方法 : 在方法中仅有声明而没有方法体 package com.wj.Interface;
[房地产与大数据]房地产数据挖掘系统 comsci 数据挖掘
随着一个关键核心技术的突破,我们已经是独立自主的开发某些先进模块,但是要完全实现,还需要一定的时间... 所以,除了代码工作以外,我们还需要关心一下非技术领域的事件..比如说房地产 &nb
数组队列总结沐刃青蛟数组队列
数组队列是一种大小可以改变，类型没有定死的类似数组的工具。不过与数组相比，它更具有灵活性。因为它不但不用担心越界问题，而且因为泛型（类似c++中模板的东西）的存在而支持各种类型。以下是数组队列的功能实现代码： import List.Student; public class
Oracle存储过程无法编译的解决方法 IT独行者 oracle 存储过程　
今天同事修改Oracle存储过程又导致2个过程无法被编译，流程规范上的东西，Dave 这里不多说，看看怎么解决问题。 1. 查看无效对象 XEZF@xezf(qs-xezf-db1)> select object_name,object_type,status from all_objects where status='IN
重装系统之后oracle恢复文强chu oracle
前几天正在使用电脑，没有暂停oracle的各种服务。突然win8.1系统奔溃，无法修复，开机时系统提示正在搜集错误信息，然后再开机，再提示的无限循环中。无耐我拿出系统u盘准备重装系统，没想到竟然无法从u盘引导成功。晚上到外面早了一家修电脑店，让人家给装了个系统，并且那哥们在我没反应过来的时候，直接把我的c盘给格式化了并且清理了注册表，再装系统。然后的结果就是我的oracl
python学习二（一些基础语法）小桔子 pthon 基础语法
紧接着把！昨天没看继续看django 官方教程，学了下python的基本语法与c类语言还是有些小差别： 1.ptyhon的源文件以UTF-8编码格式 2. / 除结果浮点型 // 除结果整形 % 除取余数 * 乘 ** 乘方 eg 5**2 结果是5的2次方25 _&
svn 常用命令 aichenglong SVN 版本回退
1 svn回退版本 1)在window中选择log,根据想要回退的内容,选择revert this version或revert chanages from this version 两者的区别: revert this version:表示回退到当前版本(该版本后的版本全部作废) revert chanages from this versio
某小公司面试归来 alafqq 面试
先填单子，还要写笔试题，我以时间为急，拒绝了它。。时间宝贵。老拿这些对付毕业生的东东来吓唬我。。面试官很刁难，问了几个问题，记录下； 1，包的范围。。。public,private,protect. --悲剧了 2，hashcode方法和equals方法的区别。谁覆盖谁.结果，他说我说反了。 3，最恶心的一道题，抽象类继承抽象类吗？（察，一般它都是被继承的啊） 4，stru
动态数组的存储速度比较集合框架百合不是茶集合框架
集合框架：自定义数据结构(增删改查等) package 数组; /** * 创建动态数组 * @author 百合 * */ public class ArrayDemo{ //定义一个数组来存放数据 String[] src = new String[0]; /** * 增加元素加入容器 * @param s要加入容器
用JS实现一个JS对象，对象里有两个属性一个方法 bijian1013 js对象
<html> <head> </head> <body> 用js代码实现一个js对象，对象里有两个属性，一个方法 </body> <script> var obj={a:'1234567',b:'bbbbbbbbbb',c:function(x){
探索JUnit4扩展：使用Rule bijian1013 java 单元测试 JUnit Rule
在上一篇文章中，讨论了使用Runner扩展JUnit4的方式，即直接修改Test Runner的实现(BlockJUnit4ClassRunner)。但这种方法显然不便于灵活地添加或删除扩展功能。下面将使用JUnit4.7才开始引入的扩展方式——Rule来实现相同的扩展功能。 1. Rule &n
[Gson一]非泛型POJO对象的反序列化 bit1129 POJO
当要将JSON数据串反序列化自身为非泛型的POJO时，使用Gson.fromJson(String, Class)方法。自身为非泛型的POJO的包括两种： 1. POJO对象不包含任何泛型的字段 2. POJO对象包含泛型字段，例如泛型集合或者泛型类 Data类 a.不是泛型类， b.Data中的集合List和Map都是泛型的 c.Data中不包含其它的POJO
【Kakfa五】Kafka Producer和Consumer基本使用 bit1129 kafka
0.Kafka服务器的配置一个Broker，一个Topic Topic中只有一个Partition（） 1. Producer： package kafka.examples.producers; import kafka.producer.KeyedMessage; import kafka.javaapi.producer.Producer; impor
lsyncd实时同步搭建指南——取代rsync+inotify ronin47
1. 几大实时同步工具比较 1.1 inotify + rsync 最近一直在寻求生产服务服务器上的同步替代方案，原先使用的是 inotify + rsync，但随着文件数量的增大到100W+，目录下的文件列表就达20M，在网络状况不佳或者限速的情况下，变更的文件可能10来个才几M，却因此要发送的文件列表就达20M，严重减低的带宽的使用效率以及同步效率；更为要紧的是，加入inotify
java-9. 判断整数序列是不是二元查找树的后序遍历结果 bylijinnan java
public class IsBinTreePostTraverse{ static boolean isBSTPostOrder(int[] a){ if(a==null){ return false; } /*1.只有一个结点时，肯定是查找树 *2.只有两个结点时，肯定是查找树。例如{5,6}对应的BST是 6 {6,5}对应的BST是
MySQL的sum函数返回的类型 bylijinnan java spring sql mysql jdbc
今天项目切换数据库时，出错访问数据库的代码大概是这样： String sql = "select sum(number) as sumNumberOfOneDay from tableName"; List<Map> rows = getJdbcTemplate().queryForList(sql); for (Map row : rows
java设计模式之单例模式 chicony java设计模式
在阎宏博士的《JAVA与模式》一书中开头是这样描述单例模式的：　　作为对象的创建模式，单例模式确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例。这个类称为单例类。单例模式的结构　　单例模式的特点：单例类只能有一个实例。单例类必须自己创建自己的唯一实例。单例类必须给所有其他对象提供这一实例。　　饿汉式单例类 publ
javascript取当月最后一天 ctrain JavaScript
 <script language=javascript> var current = new Date(); var year = current.getYear(); var month = current.getMonth(); showMonthLastDay(year, mont
linux tune2fs命令详解 daizj linux tune2fs 查看系统文件块信息
一.简介： tune2fs是调整和查看ext2/ext3文件系统的文件系统参数，Windows下面如果出现意外断电死机情况，下次开机一般都会出现系统自检。Linux系统下面也有文件系统自检，而且是可以通过tune2fs命令，自行定义自检周期及方式。二.用法： Usage: tune2fs [-c max_mounts_count] [-e errors_behavior] [-g grou
做有中国特色的程序员 dcj3sjt126com 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有
Android：TextView属性大全 dcj3sjt126com textview
android:autoLink 设置是否当文本为URL链接/email/电话号码/map时，文本显示为可点击的链接。可选值(none/web/email/phone/map/all) android:autoText 如果设置，将自动执行输入值的拼写纠正。此处无效果，在显示输入法并输
tomcat虚拟目录安装及其配置 eksliang tomcat配置说明 tomca部署web应用 tomcat虚拟目录安装
转载请出自出处：http://eksliang.iteye.com/blog/2097184 1.-------------------------------------------tomcat 目录结构 config：存放tomcat的配置文件 temp ：存放tomcat跑起来后存放临时文件用的 work ：当第一次访问应用中的jsp
浅谈：APP有哪些常被黑客利用的安全漏洞 gg163 APP
首先，说到APP的安全漏洞，身为程序猿的大家应该不陌生；如果抛开安卓自身开源的问题的话，其主要产生的原因就是开发过程中疏忽或者代码不严谨引起的。但这些责任也不能怪在程序猿头上，有时会因为BOSS时间催得紧等很多可观原因。由国内移动应用安全检测团队爱内测（ineice.com）的CTO给我们浅谈关于Android 系统的开源设计以及生态环境。 1. 应用反编译漏洞：APK 包非常容易被反编译成可读
C#根据网址生成静态页面 hvt Web .net C#asp.net hovertree
HoverTree开源项目中HoverTreeWeb.HVTPanel的Index.aspx文件是后台管理的首页。包含生成留言板首页，以及显示用户名，退出等功能。根据网址生成页面的方法： bool CreateHtmlFile(string url, string path) { //http://keleyi.com/a/bjae/3d10wfax.htm stri
SVG 教程（一）天梯梦 svg
SVG 简介 SVG 是使用 XML 来描述二维图形和绘图程序的语言。学习之前应具备的基础知识：继续学习之前，你应该对以下内容有基本的了解： HTML XML 基础如果希望首先学习这些内容，请在本站的首页选择相应的教程。什么是SVG？ SVG 指可伸缩矢量图形 (Scalable Vector Graphics) SVG 用来定义用于网络的基于矢量
一个简单的java栈 luyulong java 数据结构栈
public class MyStack { private long[] arr; private int top; public MyStack() { arr = new long[10]; top = -1; } public MyStack(int maxsize) { arr = new long[maxsize]; top
基础数据结构和算法八：Binary search sunwinner Algorithm Binary search
Binary search needs an ordered array so that it can use array indexing to dramatically reduce the number of compares required for each search, using the classic and venerable binary search algori
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！刘星宇 c 面试
12个C语言面试题，涉及指针、进程、运算、结构体、函数、内存，看看你能做出几个！ 1.gets()函数问：请找出下面代码里的问题： #include<stdio.h> int main(void) { char buff[10]; memset(buff,0,sizeof(buff));
ITeye 7月技术图书有奖试读获奖名单公布 ITeye管理员活动 ITeye 试读
ITeye携手人民邮电出版社图灵教育共同举办的7月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 7月试读活动回顾： http://webmaster.iteye.com/blog/2092746 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《Java性能优化权威指南》