YZT8848

论文解读：DELPHI：用于蛋白质相互作用位点预测的精确深度集成模型

期刊： Briefings in Bioinformatics

出版日期 2022-11-22

websever:https://iasri-sg.icar.gov.in/pldbpred/

网址： PlDBPred: a novel computational model for discovery of DNA binding proteins in plants | Briefings in Bioinformatics | Oxford Academic

摘要

DNA结合蛋白（DBPs）在许多细胞过程中发挥着至关重要的作用，包括核苷酸识别、转录控制和基因表达调控。大多数现有的用于识别DBP的计算技术主要适用于人类和小鼠数据集。尽管一些模型已经在拟南芥上进行了测试，但当应用于其他植物物种时，它们的准确性很差。因此，开发一种有效的计算模型来预测植物DBP是当务之急。在这项研究中，我们开发了一个用于植物特定DBP识别的综合计算模型。五个浅层学习和六个深度学习模型最初用于预测，其中浅层学习方法优于深度学习算法。特别是，支持向量机实现了最高的重复5倍交叉验证准确率，受试者工作特征曲线下面积（AUC-ROC）为94.0%，精密度-召回曲线下面积为93.5%。在独立数据集的情况下，所开发的方法获得了93.8%的AUC-ROC和94.6%的AUC-PR。与现有技术中使用独立数据集的工具相比，所提出的模型实现了更高的精度。总体结果表明，与现有的植物DBP预测模型相比，所开发的计算模型更有效、更可靠。为了方便大多数实验科学家，开发的预测服务器PlDBPred可在https://iasri-sg.icar.gov.in/pldbpred/.The还提供了源代码https://iasri-sg.icar.gov.in/pldbpred/source_code.php用于使用大型数据集进行预测

数据集

UniProt数据库[29]（于21年6月14日访问）用于编译当前研究的植物DBP（阳性数据集）和非DBP（阴性数据集）序列。用GO术语“DNA结合”（GO:00033677）注释的蛋白质序列被视为DBP序列，而没有注释的蛋白质被视为非DBP序列。对于35种不同的植物，共收集了1812个DBP和2284个非DBP序列。去除了具有非标准氨基酸（B、J、O、U、X和Z）和少于50个氨基酸的蛋白质序列。DBP和非DBP数据集都进行了同源性降低，以消除预测准确性上的同源性偏差。使用CD-HIT方法[30]去除每个数据集中与任何其他序列具有>40%序列同一性的序列。849个DBP和1848个非DBP序列在处理后被保留。为了避免对具有更多观测值的非DBP类的预测偏差，考虑了具有相等数量的DBP和非DBP序列的平衡数据集。换句话说，从1848个非DBP序列中随机选择了849个非DBP-序列。

方法

PSSM衍生进化特征的生成

尽管基于序列的特征已被证明在许多预测任务中是有效的，但许多研究表明，从PSSM[31]剖面中获得的进化特征比基于序列的特性[13，24]提供的信息要多得多。基于PSSM的特征描述符已被用于几种生物信息学应用[32-33]。通过在NCBI非冗余（NR）数据库上运行PSI-BLAST[31](ftp://ftp.ncbi.nih.gov/blast/db/nr)，在本研究中获得了每个蛋白质序列的PSSM图谱。PSSM轮廓是一个L×20维矩阵，可以写成

其中L是蛋白质长度，Pi，j表示氨基酸j在蛋白质序列的位置i处的出现概率。在当前的研究中，考虑了10种不同的基于PSSM的特征，包括PSSMBLOCK、AADP-PSSM、PSSM-DWT、EDPEEDP-MEDP、MBMGAC-PSSM、PSSM400、PSSM-AC、RPSM、SOMAPSSM和DFMCA-PSSM。PSSMCOOL[34]R包用于实现所有功能。在补充文件1中，每个基于PSSM的特征集都进行了简短的描述，并有适当的引用。

利用浅层学习和深度学习算法进行预测

我们使用了五种不同类型的浅层学习方法，如SVM[35]、极限梯度提升（XGB）[36]、RF[37]、自适应提升（ADB）[38]和LogitBoost[39]。除了浅层学习方法外，还使用了深度学习模型的六种变体，如1D卷积神经网络（CNN_1D）[40]、基于注意力的CNN（ABCNN）[41]、递归神经网络（RNN）[42]、双向递归神经网（BRNN）[43]、深度残差神经网络（ResNet）[44]和自动编码器（AE）[45]。R包e1071、randomForest、xgboost、adabag和caTools分别用于实现SVM、RF、XGB、ADB和LogitBoost方法。使用python的PyTorch和TensorFlow模块实现了深度学习模型。用于实现学习模型以及参数配置的软件在补充文件1（补充表1）中提供，并有适当的引用。

特征选择

通过消除重复和噪声特征，特征选择降低了计算复杂度，同时提高了分类精度[46]。在这项工作中，使用SVM递归特征消除（SVM-RFE）方法选择了重要特征[47]。SVM-RFE方法是一种后向特征消除方法，其中信息量最小的特征在第一次迭代中被消除，最显著的特征在最后一次迭代中消除。确定应保留多少特征进行分析是至关重要的。在当前的研究中，实现选择了最佳分类精度。SVM-RFE方法是使用sigFeature R包实现的。

交叉验证和性能指标

使用重复的5倍交叉验证方法评估分类模型的性能，其中实验重复100次。为了进行五倍交叉验证[49]，将每个DBP和非DBP数据集随机分为五个大小相等的亚组。从每个DBP和非DBP类中随机选择的一个子集被用作交叉验证的每个折叠中的测试集，而来自两个类的其余四个子集被组合作为训练集。分类进行了五次，每次折叠都有单独的训练和测试集。通过对所有五个测试集以及100个复制的准确性进行平均来确定性能指标。补充文件1（补充图S1）中提供了描述所提出方法的所有步骤的f低图。准确度、F-评分、受试者工作特征曲线下面积（AUROC）、精密度-召回曲线（AUC-PR）下面积、灵敏度、特异性、精密度和Matthews相关系数（MCC）被考虑来衡量预测模型的性能[50]。表1中提供了性能指标列表

结果

特征集选择分析

针对10个不同特征集中的每一个，分别评估11种算法中的每一种的预测性能，以分析每个特征集的有效性。此外，50%的数据集用于分析。除了几个显著的例外，SVM、RF、XGB和ADB被发现比深度学习模型表现更好，除了LogitBoost（图1）。

在所检查的深度学习模型中，Auto Encoder的精度最高（图1）。对于特征集AADP-PSSM、PSSM-DWT、MEDP-PSSM、MBMGACPSSM、RPSM、SOMA-PSSM和DFMCA-PSSM，SVM、RF、XGB和ADB的AUC-ROC和AUC-PR≥90%（图1），而PSSMBLOCK、PSSM400和PSSM-MAC的AUC-ROC和AUC-PR<90%（图一）。因此，考虑了七个特征集和四个精度更高的浅层学习算法（SVM、RF、XGB、ADB）进行进一步分析。

特征选择的结果

由于合并了选定的七个特征集，总共有1960个特征。每个特征集都是从PSSM导出的，因此组合的特征集可能包含冗余信息，这可能会降低预测精度。因此，为了选择用于DBP和非DBP分类的非冗余判别特征，应用了SVM-RFE特征选择方法。最后，选择了一个由1890个特征组成的特征集，发现这些特征具有更高的AUC-ROC（94.0%）和AUC-PR（93.5%）值（图2）。

模型选择分析

表2中提供了四种浅层学习方法的性能。尽管四种学习算法的准确性没有太大差异，但SVM的表现比其他三种学习算法要好一些（灵敏度：86.9%，特异性：87.5%，准确度：87.2%，精密度：87.4%，F评分：87.1%，AUC-ROC:94.0%，AUC-PR:93.5%和MCC：73.5%）。

就敏感性而言，XGB的表现优于其他三种学习方法，而SVM的特异性得分最高，其次是RF、ADB和XGB。与RF和ADB相比，XGB在其余六个性能矩阵中表现更好。继SVM之后，发现XGB的总体表现优于RF和ADB模型。

独立测试集结果

在与训练数据集完全不同的独立数据集上进一步评估所提出的模型（用选定特征训练的SVM）。我们从UniProt数据库（于21年11月15日访问）中收集了植物DBP序列，以创建阳性独立集。对于35种不同的植物，共获得1403个DBP序列。在去除具有非标准残基和长度小于50个氨基酸的蛋白质序列后，保留497个DBP序列的非冗余数据集进行分析。在1848个序列的整个负集合中，在消除了用于训练集的849个序列之后，899个序列被用于独立负集合。然而，为了进行公平的预测，考虑了899个随机选择的500个非DBP序列。简而言之，将500个非DBP序列和497个DBP序列组合起来形成独立的数据集。除AUC-ROC和AUC-PR外，SVM的性能指标略高于其他三种学习技术（表3）。就AUROC和AUC-PR而言，XGB（94.1%；94.8%）和RF（94.0%；94.8%）均优于SVM（93.8%；94.6%）（表3）。所有四个模型的总体精度各不显著other相应的5倍交叉验证精度，表明预测精度既没有出现高估也没有出现低估。

与现有技术比较

还使用我们的独立测试数据集评估了七种现有技术的DBP预测方法的性能：DNAbinder[13]、DPP-PseAAC[17]、StackDPPred[24]、iDRBP_MMC[26]、iDRBP-PCT[23]、PDBP融合[28]和DeepDRBP-2 L[27]，该数据集包括497个DBP和500个非DBP。所有考虑的现有模型都已在拟南芥上进行了评估，并声称在其他植物物种中也能达到类似的性能。性能指标如表4所示。在考虑的七种现有方法中，PDBP融合具有最高的总体准确度（75.8%），而IDRBP-PCT具有最高的准确度（91.4%）和F评分（75.2%）。此外，DNAbinder在准确度方面表现最差（51.0%），DPP-PseAAC在准确度（49.8%）和F-评分（52.8%）方面表现最糟。在这个测试数据集上，我们的方法（用选定特征训练的SVM）比现有模型实现了更高的准确度（88.0%）、准确度（92.6%）、F-评分（87.3%）和MCC（76.4%）（表4）。使用我们模型的完整训练数据集，还评估了现有工具的性能，并发现与测试集的精度相似（补充文件1的补充表2）。

与特定模型相比

Motion等人[51]提出的方法是唯一一种基于植物的DBP预测方法。在这种方法中，通过使用拟南芥的129个DBP和129个非DBP（随机取自1767个非DBPs）进行交叉验证分析。由于分区数据集不可访问，我们使用229个DBP和229个非DBP（随机取自1767个拟南芥的非DBP）进行5倍的交叉验证分析。该实验进一步重复100次，每次使用229个非DBP（1767个非DBPs中）的随机集合以及相同的DBPs集合。所提出的方法（PlDBPred）在准确性方面优于现有方法约4%（表5）。还发现，所提出的方法的MCC比Motion等人[51]开发的方法高出约7%（表5）。在另一种设置中，Motion等人[51]在用拟南芥数据训练模型后，使用其他植物物种的数据集（111个DBP和516个非DBP）作为测试集。按照类似的方法，我们还使用我们训练的模型来预测测试集，并比较准确性。我们观察到PlDBPred的准确性比Motion等人[51]的方法高出约8%（表5）。还发现PlDBPred的MCC远高于现有方法（表5）

讨论

DBPs的预测对未来的蛋白质组学和基因组学研究具有重要的理论和实践意义[3，54]。由于DBP家族数量众多，DNA特征多样，在蛋白质组中鉴定DBP是一项具有挑战性的工作。已经提出了几种寻找DBP的计算方法。然而，他们中的大多数人专注于人类数据，而只有一小部分人专注于拟南芥。到目前为止，只有一种基于SVM的技术，准确率为74.0%[51]，植物研究主要忽略了这一领域。

在这项研究中，开发了一种名为PlDBPred的计算工具，该工具使用浅层学习，利用进化特征信息从蛋白质序列中预测植物特异性DBP。在人类数据集上先前的DBP预测中，基于PSSM的进化特征已成功与其他基于序列的特征相结合[13，24]。因此，在当前的研究中，我们考虑了从PSSM矩阵中获得的进化特征。当存在冗余或不相关的特征时，预测准确性会受到影响。因此，我们使用SVM-RFE[55]来确定DBP和非DBP最准确分类的理想特征集。深度学习和浅层学习算法最初都用于预测模型。浅层学习模型的表现优于深度学习模型。因此，只有浅层学习方法用于最终预测分析，该分析使用重复的5倍交叉验证方法进行。SVM的性能略高于其他浅层学习技术（RF、XGB、ADB）。还使用独立的测试数据集评估了所提出的计算方法（具有选定特征的SVM）用于识别植物特定DBP的性能，以确认其稳健性。研究发现，独立数据集的总体准确性与交叉验证的准确性相似。这表明准确性并没有被高估或低估。为了进一步评估所开发模型的可靠性，我们使用独立测试数据集将PlDBPred的性能与其他七种最先进的方法进行了比较。我们发现，我们的方法在准确性方面优于比较模型。用植物测试数据集对现有模型的评估只是为了强调，尽管对人类和小鼠等其他真核生物物种产生了更高的准确性，但现有工具在预测植物特异性DBP方面并不那么有效。已知DBP对每个王国都具有高度特异性，高达47%的DNA结合转录因子属于谱系特异性家族[56]。然而，现有的模型是基于来自广泛的真核生物和原核物种的蛋白质序列开发的，导致了更通用的模型，该模型未能捕捉谱系特异性DNA结合蛋白的变异。换句话说，现有的DBP预测模型无法捕捉植物的谱系特异性蛋白质家族，导致准确性差。除了AADP-PSSM特征描述符外，本研究中使用的其余六个特征描述符（PSSM-DWT、MEDPPSSM、MBMGAC-PSSM、RPSM、SOMA-PSSM和DFMCA-PSSM）都没有在早期的DBP识别模型中进行过探索，这可能是所提出方法具有更高精度的可能原因之一。

此外，将所提出的模型的有效性与Motion等人[51]提出的唯一植物特定DBP预测模型进行了比较。除了测试数据集，我们还使用Motion等人[51]提供的训练数据集来比较我们模型的性能。所提出的模型在训练集和测试集方面都优于Motion等人[51]提出的模型，实现了更高的准确性。DBPred的更高准确性可能归因于方法的改进，因为基于训练数据集发现所提出的模型的准确性更高。

我们使用我们的模型，利用拟南芥（AT）、普通拟南芥（HV）和番茄（SL）的全蛋白质组数据集来预测DBP，以证明对DBP进行可靠的高通量全蛋白质组预测的能力。对于所有三个蛋白质组数据集，发现预测的DBP在DNA结合和相关转录生物学过程中显著富集。此外，细胞成分富集分析显示，相当一部分预测的DBP是在细胞核中发现的。在处理拟南芥、番茄和普通番茄的输入数据集时，共鉴定出87个、28个和7个实验验证的DBP。PlDBPred在拟南芥中准确预测了总共79个（90.80%）实验验证的DBP，在番茄中准确预测24个（85.72%），在普通番茄中全部准确预测7个（100%）。补充文件2包含所有经过实验验证的DBPs。

结论

与当前方法相比，所提出的方法PlDBPred对植物中的DBP提供了高得多的广义预测能力。由于令人鼓舞的结果，PlDBPred可以通过仅利用序列信息有效地用于植物特异性蛋白质的大规模注释。为了定位特定于工厂的DBP，我们开发了一个在线预测工具PlDBPred(https://iasri-sg.icar.gov.in/pldbpred/). 预计所提出的方法将补充现有的识别植物中DBP的模型和实验技术。

【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
SpringBoot单元测试全攻略：MockMVC+Testcontainers+覆盖率分析 fanxbl957 Web spring boot 单元测试后端
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot单元测试全攻略：
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
从文本到语音：使用 ElevenLabs 和 FFmpeg 实现语音合成与播放曦紫沐语音模型 ffmpeg ElevenLabs 语音合成
摘要在当今的人工智能时代，语音合成技术正变得越来越普及。ElevenLabs是一个强大的语音合成平台，能够生成高质量的语音音频。本文将详细介绍如何结合Python、ElevenLabsAPI和FFmpeg工具集，实现从文本到语音的转换，并通过ffplay播放生成的音频文件。同时，我们将解决常见的问题，如ffplay未找到或音频无法播放等。1.引言随着人工智能技术的发展，语音合成（Text-to-S
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
ORACLE 11g 使用ROWNUM完美解决ORA-00600 内部错误代码有点智慧
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！1，ORA-00600：内部错误代码Oracle从11.2.0.1升级到11.2.0.4，开发人员报告说一个job运行失败，调试有报错信息，ORA-00600:内部错误代码，参数：[rwoirw:checkret
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
Python就业薪资好不好，学Python工作机会多吗？ Python小辰
Python就业薪资好不好？学Python工作机会多吗？人工智能时代的来临让Python崭露头角，各大企业纷纷加大对相关人才的招聘力度吸引了很多人入行学习Python。近年来Python开发发展迅猛，吸引了很多科技公司入驻，且看小编的分析。Python薪资好不好?数据是最有力的答案。职友集统计数据显示，全国Python工程师的平均月资达19160，其中20-30K的工程师数量超过了四成。来自智联招
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
机器人-组成结构-感知 - 决策 - 执行具身智能-查布嘎具身智能机器人人工智能
目录一、感知系统内部传感器：外部传感器：二、智能决策系统机器学习家族1.1机器学习2.1深度学习2.2深度学习模型(主要属于监督/强化学习范畴，但结构通用)：3.1监督学习3.2监督学习模型4.1半监督学习4.2无/半监督学习模型：5.1无监督学习5.2生成模型(可属于监督/无监督)：6.1强化学习7.1其他学习三、控制系统（运控）①对应小脑和脊柱一、感知系统①对应人体的五官。由具有不同功能的各种
深度学习篇---矩阵 Atticus-Orion 嵌入式知识篇上位机知识篇嵌入式硬件篇深度学习矩阵人工智能
在机械臂解算、深度学习网络等硬件和软件领域中，矩阵运算作为核心数学工具，承担着数据表示、变换、映射和优化的关键作用。以下从具体领域出发，详细总结涉及的矩阵运算及对应的核心知识：一、机械臂解算领域机械臂解算（运动学、动力学分析）的核心是描述“关节空间”与“操作空间”的映射关系，矩阵运算用于精准刻画坐标系转换、运动传递和力/力矩分析。1.运动学解算（正/逆运动学）核心目标：通过矩阵描述关节角度与末端执
机器学习入门（五）：线性回归—从模型函数到目标函数米饭超人
从数据反推公式假设我们获得了这样一张表格，上面列举了美国纽约若干程序员职位的年薪：enterimagedescriptionhere大家可以看到，表格中列举了职位、经验、技能、国家和城市几项特征。除了经验一项，其他都是一样的。不同的经验（工作年限），薪水不同。而且看起来，工作年头越多，工资也就越高。那么我们把Experience与Salary抽取出来，用x和y来分别指代它们。enterimaged
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移
AI驱动的电路仿真革命：从物理模型到智能学习的范式转移人工智能正颠覆传统电路仿真方法，本文将深入解析AI在电路建模、优化与故障诊断中的前沿应用，揭示智能仿真如何提升10倍效率并突破物理限制。一、AI电路仿真的数学基础1.1图神经网络建模电路拓扑电路可抽象为图结构G=(V,E)G=(V,E)G=(V,E)：VVV：节点（电子元件）EEE：边（连接关系）图卷积网络(GCN)更新公式：H(l+1)=σ(
MCP协议技术解析：AI时代的通信基础设施革命
MCP协议技术解析：AI时代的通信基础设施革命在AI从工具演变为协作伙伴的进程中，MCP协议正在成为连接智能体与现实世界的“数字神经系统”。当前人工智能技术正经历从孤立模型向生态系统协作的关键转型，而通信协议作为AI能力的“连接器”，其设计直接决定了智能系统的边界与效率。MCP协议（ModelContextProtocol）作为新一代AI通信基础设施，正在开发者社区引发一场静默革命。本文将从技术原
GENERALIST REWARD MODELS: FOUND INSIDE LARGELANGUAGE MODELS 樱花的浪漫大模型与智能体对抗生成网络与动作识别强化学习语言模型人工智能自然语言处理深度学习机器学习计算机视觉
GeneralistRewardModels:FoundInsideLargeLanguageModelshttps://arxiv.org/pdf/2506.232351.概述将大型语言模型（LLMs）与复杂的人类价值观（如乐于助人和诚实）对齐，仍然是人工智能发展中的一个核心挑战。这项任务的主要范式是来自人类反馈的强化学习（RLHF）[Christianoetal.,2017;Baietal.,
Python深度学习实践：LSTM与GRU在序列数据预测中的应用 AI智能应用 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：LSTM与GRU在序列数据预测中的应用作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来序列数据预测是机器学习领域的一个重要研究方向，涉及时间序列分析、自然语言处理、语音识别等多个领域。序列数据具有时间依赖性，即序列中每个元素都受到前面元素的影响。传统的机器学习算法难以捕捉这种时间依赖性，而深度学习
一个例子带你入门机器学习
目录1.为建模选择数据2.选择预测目标3.选择“特征”4.构建您的模型（这篇文章将使用经典墨尔本房价数据集作为例子，引导机器学习的流程，数据集为melb_data.csv，请在csdn的下载区自行下载，运行代码时需要将数据集下载在同个目录下）1.为建模选择数据数据集有太多的变量，多到难以理解，甚至无法很好地打印出来。如何将这海量的数据削减为能够理解的内容？我们将首先凭借直觉选择几个变量。后续将介绍
初探机器学习与力学研究的交叉领域 faderbic 机器学习人工智能深度学习
目录关于如何踏入机器学习领域机器学习与力学研究的交叉方向1.使用机器学习加速有限元求解2.结合有限元计算和机器学习预测复杂材料结构与力学性能的关系3.结构健康检测4.疲劳寿命预测总结关于如何踏入机器学习领域因为我本科的专业是力学，所以当我开始关注机器学习领域时，首先考虑的是机器学习和力学的交叉领域。对于很多对人工智能感兴趣的朋友，想加入人工智能的潮流却不知道从何学起，我提供一个思路，我认为将自己学
[NIPST AI]对抗性机器学习攻击和缓解的分类和术语 Anooyman 人工智能网络安全人工智能大语言模型网络安全安全
原文link：https://nvlpubs.nist.gov/nistpubs/ai/NIST.AI.100-2e2025.pdfIntroduction人工智能（AI）系统在过去几年中持续全球扩展。这些系统正在被众多国家开发并广泛部署于各自的经济体系中，人们在生活的许多领域都获得了更多使用AI系统的机会。本报告区分了两大类AI系统：预测型AI（PredictiveAI，PredAI）和生成型A
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO 深度学习计算机视觉人工智能
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现打架检测（C#代码，UI界面版）工业相机使用YoloV8模型实现打架检测工业相机通过YoloV8模型实现打架检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）格林威机器视觉工业相机数码相机 YOLO 深度学习人工智能视觉检测 c#
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人脸识别检测（C#代码，UI界面版）工业相机使用YoloV8模型实现人脸的检测工业相机通过YoloV8模型实现人脸识别检测的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）格林威工业相机机器视觉数码相机 YOLO c#人工智能计算机视觉开发语言
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现人物识别（C#代码，UI界面版）工业相机使用YoloV8模型实现人物识别工业相机实现YoloV8模型实现人物识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实现
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现动物分类（C#源码，UI界面版）格林威机器视觉工业相机数码相机 YOLO 深度学习计算机视觉人工智能视觉检测 c#
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现动物分类（C#源码，UI界面版））工业相机使用YoloV8模型实现动物分类工业相机实现YoloV8模型实现动物分类的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入YoloV8模型重要核心代码代码实
通俗易懂：什么是决策树？淦暴尼算法 python 决策树算法机器学习
1.引言：决策树就像“选择题”你是否曾经在生活中做过“选择题”？比如：今天要不要带伞？晚饭吃什么？该不该买那件心仪已久的商品？其实，我们的大脑经常会像“决策树”一样，通过一连串问题和判断，逐步缩小选择范围，最终做出决定。**决策树（DecisionTree）**就是这样一种模拟人类决策过程的机器学习模型。它通过“提问-分支-决策”的方式，把复杂问题拆解成一系列简单的判断，广泛应用于分类（如判断邮件
java毕业设计-基于Javaweb的家常小菜烹饪学习管理系统的设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 程序猿刘 vue spring boot 毕业设计 java 课程设计学习
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费开题报告、任务书、全bao定制+
骗子太猖獗了，打着摩根士丹利何晓斌名义带股民进入虚假宝丰能源节能减排碳交易市场，大量股民被骗真相曝光墨守成法
为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么不能提现呢？其实都是骗子给你的一串数字而已！这些新平台打着“低风险”、“高收益”、“慈善公益投票”等噱头先让投资人尝到甜头再通过恶意操作将投资人
java毕业设计源码案例-基于ssm+协同过滤的个性化小说推荐系统设计与实现(源码+LW+部署文档+全bao+远程调试+代码讲解等) 项目帮 springboot java 计算机毕设 java 课程设计开发语言
博主介绍：✌️码农一枚，专注于大学生项目实战开发、讲解和毕业文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌️技术范围：：小程序、SpringBoot、SSM、JSP、Vue、PHP、Java、python、爬虫、数据可视化、大数据、物联网、机器学习等设计与开发。主要内容：免费功能设计，开题报告、任务书、全b
AI 大模型重塑软件开发流程万花丛中一抹绿人工智能
一、AI大模型的定义与发展历史AI大模型是基于海量数据训练的深度学习模型，具备强大的自然语言理解、逻辑推理和知识生成能力。在软件开发领域，以GPT-4、CodeLlama、GitHubCopilotX为代表的大模型，能理解代码语法、语义及业务逻辑，实现代码生成、漏洞检测等复杂任务。其发展可追溯至2017年，谷歌提出Transformer架构，为大模型奠定了核心基础。2018年，GPT-1问世，参数
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本