李划水员

A deep-learning framework for multi-levelpeptide–protein interaction prediction文章梳理

作者：清华大学的曾坚阳老师团队

期刊：Nature Communication

时间：2021.9.15

0写在前面的疑惑

1）模型中，三个分类通道有一个分支将输出结果给与数字通道，目的是什么？

1动机

多肽通过与多种蛋白质相互作用并参与许多细胞过程，如程序性细胞死亡、基因表达调控和信号转导，因此，多肽在人类生理中发挥着至关重要的作用。由于其安全性、良好的人体耐受性，以及良好的灵活性和构象刚性之间的平衡，目前，肽已成为设计新的其他药物的良好起点，而准确识别肽蛋白相互作用(pepis)对这类疗法的发明至关重要。尽管如此，大多数现有的预测方法严重依赖于高分辨率的结构数据，通过实验来确定PepPIs通常是费时和昂贵的。为了缓解这个问题，提出了CAMP，一种深度学习框架，用于同时预测多肽-蛋白相互作用(pepPIs)和识别多肽序列的结合残基。

2贡献

1）提出了用于多级肽蛋白相互作用预测的深度学习框架——CAMP，包括二元相互作用预测和肽结合残基预测。

2）根据肽和蛋白质的一级序列构建它们的综合特征图谱，包括二级结构、疏水性、亲水性和极性、内在的无序趋势，以及由序列比对获得的进化信息，以增强肽蛋白相互作用预测。

3）设计了一个多通道特征提取器，从物理化学和生物化学特征中学习潜在的信息。

3模型与算法

3.1 数据管理及标签提取

1)从RCSB PDB和DrugBank中已知的药物靶标对中提取多肽蛋白复合物结构;

2)利用蛋白质配体相互作用预测因子(PLIP)识别每个PDB复合物中肽与蛋白质之间的非共价相互作用，仅保留具有非共价相互作用的肽蛋白对作为阳性样品;

3)从PepBDB中获得肽结合残基标签，PepBDB是由RCSB PDB 衍生的肽蛋白复合物结构数据库;

4)基于多肽和蛋白质的一级序列，生成多肽和蛋白质的残差级结构和物理化学固有联系、内在无序倾向和蛋白质进化信息;

5)整合多级标签，即肽-蛋白对的二元相互作用标签和肽结合残基标签进行训练过程。

个人理解及补充：

a. RCSB PDB 是一个可以直接连接蛋白质的数据库

b. PLIP：蛋白质配体相互作用预测器

c. RSCB产生的是蛋白质-肽对，DrugBank产生的是具有相应靶点的肽药物，是蛋白质-肽药物对，肽药物也是肽，所以（蛋白质，肽）+（蛋白质，肽（药物））à通过PepPIs丰富了蛋白质-肽的数据库。

d. 鉴定肽相互作用残基的模型。原论文参考文献28

3.2 CAMP模型

CAMP利用两个多通道特征提取器分别对它们进行处理。

每个提取器包含一个数字通道和三个分类通道。该数值通道用于提取预定义的密集特征(即蛋白位置特异性评分矩阵(PSSM)和蛋白和肽序列中每个残基的内在无序趋势)。每个分类通道包含一个自学习的单词嵌入层，它采用输入肽或蛋白质的分类特征之一(即原始氨基酸、二级结构、极性和亲水性)。

在这里，设计了这样一个多通道架构，是因为输入配置文件包含了不同尺度的多方面特征，如果只使用简单的编码器，这可能会带来不一致。

接下来，CAMP利用两个卷积神经网络(CNN)模块分别提取多肽和蛋白质的隐藏上下文特征。此外，CAMP采用自我注意机制-来了解残基之间的长期依赖关系以及蛋白质和多肽个体残基对最终相互作用预测的贡献。

然后，CAMP结合所有提取的特征，使用三个完全连接层来预测给定的肽蛋白对之间是否存在相互作用。

CAMP取每个位置具有sigmoid激活功能的肽CNN模块的输出，预测每个肽残基是否与伴侣蛋白结合。在问题中，二元交互预测是我们的基本任务，我们的目标是通过提供多级监督信息来解决这个问题。在这里，额外的结合残基标签不仅可以提供额外的信息，以提高的主要任务的性能，而且还可以通过识别肽中的关键残基来为pepPIs带来新的见解。

4 实验结果

采用以下实验证明模型的优越性。

CAMP在二进制交互预测方面优于baseline方法à模型体系结构和特征选择方案是我们预测任务的最优方案。

肽结合残基表征的新见解à能够准确预测结合残基，为进一步理解肽与伴侣蛋白的相互作用机制提供可靠的证据。

CAMP在附加基准数据集上的通用性à进一步说明在二元相互作用预测和肽结合残基鉴定方面的通用性

CAMP在三个相关任务中的扩展应用à进一步研究了CAMP在预测多肽PBD相互作用预测、结合亲和评价和多肽虚拟筛选等方面的应用潜力

4.1 CAMP在二进制交互预测方面优于baseline方法

1) 对pepPIs进行二元分类是CAMP的主要目标。在这里，比较了CAMP与其他最新基线方法的分类性能，包括基于相似度的矩阵分解方法NRLMF，基于深度学习的PPI预测模型PIPR，以及基于深度学习的CPI预测模型DeepDTA。所有的预测方法都在一个基准数据集上进行了交叉验证。采用特性曲线下面积(AUC)和精确查全曲线下面积(AUPR)来评价各模型的性能。此部分将蛋白质和肽分成不同簇，使得来自同一簇的实体不会同时出现在训练和测试集中，分别是下图的Novel Protein 和Novel Peptide，而Novel Pair是来自同一簇的蛋白质或多肽不会同时出现在训练集和测试集中

下图显示，CAMP始终优于最先进的基线方法，AUC和AUPR分别增加了10%和15%。在“Novel Peptide setting”下的模型性能似乎比其他的要好。

这可以通过以下事实来解释，即基准集中的肽彼此之间的相似性比蛋白质小，因此在基于相似性进行聚类之后，肽在训练和测试集中的分布没有太大变化。这样的测试结果表明，在所有交叉验证设置下，CAMP可以获得比基线方法更好和更健壮的性能。

2) 进行了综合消融研究，以证明CAMP的单个成分的重要性，消融研究(如下图)表明，当前的模型体系结构和特征选择方案是预测任务的最优方案。

4.2 肽结合残基表征的新见解

作者设计了一个监督预测模块来识别肽序列中的结合残基。首先利用来自PepBDB的相互作用信息构建了一组肽结合残基的合格标签的全面结构数据库，包含从RCSB PDB已知的相互作用肽蛋白复合物，以及涉及氢键和疏水接触的肽结合残基信息。在这种监督信息的支持下，使用五倍交叉验证程序进行肽结合残基鉴定时，CAMP获得了0.806的平均AUC和0.514的马修斯相关系数(MCC) (下图a，b)。

为了进一步证明CAMP在结合残基预测中的性能，还选择了四个有代表性的案例(根据预测的肽结合残基的平均AUC分数分别排名约1%、35%、50%和85%)，并将预测的残基与真实的相互作用残基进行比较。图c显示了第一个例子，HIV-1特异性细胞进入抑制剂和HIV-1 GP41三聚体核心的复合物(PDB ID: 1FAV)。肽抑制剂有33个氨基酸，其中12个是结合残基。CAMP鉴定了所有这些结合残基，没有任何假阳性。这样的预测是我们预测任务中最理想的情况，我们发现30.2%的结合残基鉴定像这种情况一样完全准确。

图d显示了第二个例子，HIV-1 gp120包膜糖蛋白和CD4受体的复合物(PDB ID: 4JZW)，其平均AUC排名在前35%左右。该肽有28个氨基酸，其中13个是结合残基。我们预测的结合残基沿着肽序列覆盖了11个真正的结合残基，遗漏了两个真正的结合残基（已经用红点标出）。

图e显示了第三个例子，来自组蛋白脱乙酰酶的肽和锚蛋白重复家族A蛋白的复合物(PDB ID: 3V31)。在我们的预测中，这一对在AUC方面排名中位数，CAMP成功识别了11/13的真结合残基，其中有一个假阳性。

图f显示了最后一个例子，t淋巴瘤侵袭和转移诱导蛋白和8个残基磷酸化的syndecan-1肽(PDB ID: 4GVC)的复合物，在我们的预测中排名~85%，平均AUC为0.571。所有8个残基(包括1个假阳性)都被CAMP预测为结合残基。

总的来说，测试结果表明，CAMP能够准确预测结合残基，从而为进一步理解肽与伴侣蛋白的相互作用机制提供可靠的证据。

4.3 CAMP在附加基准数据集上的通用性

作者在来自PDB的额外独立数据集上评估了CAMP，并遵循与构建之前的基准数据集相同的策略。为了证明CAMP对二元交互预测的鲁棒性，评估了CAMP和基线模型对测试数据集的几个变化的正-负比率的性能。每个模型首先在完整的基准数据集上进行训练，然后使用集成版本(即五个模型的平均预测)对额外的测试数据集进行预测。图a和图b显示CAMP在所有场景下取得了最好的结果，表明CAMP优于基线方法，具有相对稳健的性能。还观察到，随着正负比从1:1下降到1:10，所有方法的曲线下面积(AUC)均略有增加。这可能是因为样本量的增加给模型带来了更多需要学习的信息。随着阳性与阴性比值的增加，所有方法的AUPR均明显低于AUC。这主要是因为AUPR通常更受阳性与阴性样本比例的影响。

还评估了CAMP对肽结合残基识别的预测结果。从PepBDB29中获得了注释的肽序列结合残基。从测试数据集来看，总共有208种peppi具有这样的肽结合残基标签。图c和d显示CAMP能够维持其对上述附加数据集的预测能力。

4.4 CAMP在三个相关任务中的扩展应用。

进一步研究了CAMP在预测多肽PBD (protein binding domain)相互作用预测、结合亲和评价和多肽虚拟筛选等方面的应用潜力。

HSM专注于一个相当相关的问题，即预测多肽和球状PBD之间的相互作用。

在预测肽PBD相互作用方面，将CAMP与HSM的两种报告模型进行了比较，即HSM- id(其中针对每个PBD酶家族训练了8个单独的模型)和HSM- D(其中针对所有家族训练了一个统一的模型)。在这里，比较了CAMP和HSM模型预测肽PBD相互作用的性能。特别是，使用相同的数据集和HSM论文中使用的8倍交叉验证设置来评估CAMP的性能。下图显示CAMP在除PDZ外的所有域家族中都显著优于HSM-ID和HSM-D。还注意到，HSM-ID和HSM-D在不同的家庭中有很大的预测差异。正如HSM的论文所解释的，这可能是由于数据的偏态分布(即，来自不同家庭的对的数量是不平衡的)。对于像PDZ这样的数据量大的家族，HSM模型可以学习得很好，但对于那些数据量相对较小的家族，如磷酸酪氨酸结合家族的域，HSM模型的性能明显下降。CAMP的性能更稳健，受波动数据大小的影响更小。这些结果表明CAMP也适用于解决相关肽PBD相互作用的预测问题。

接下来，研究了CAMP是否也可以用来评估肽蛋白对的结合亲和力。在这里，将CAMP与几种基线方法进行了比较，包括random forest(一种传统的基于机器学习的框架)，DeepDTA(一种基于深度学习的框架),Auto Dock CrankPep(一种基于结构的对接方法)，如下图所示，与所有基线方法相比，CAMP具有更高的Pearson相关系数和更小的RMSE预测误差。考虑到CAMP并不是专门为亲和预测而设计的，且训练数据有限，比较结果令人满意，进一步说明CAMP在预测肽和蛋白质结合亲和方面的巨大潜力。

此外，评估了CAMP和各种对接方法的能力，包括cab - dock, MDockPeP, Auto- Dock CrankPep v1.0，和GalaxyPepDock，虚拟筛选的肽。我们观察到本模型拥有更好的性能 (见下图)。因为这些小对接方法最初是专为绑定姿势预测而不是虚拟筛选。基于以上事实，认为CAMP比基于结构的对接方法在肽虚拟筛选中提供了更合适、更强大的工具。

5 总结

1）优势：在本研究中，提出了CAMP，一个用于多级肽蛋白相互作用预测的深度学习框架，包括二元相互作用预测和肽结合残基预测。首先生成了一系列基于序列的特征来构建肽和蛋白质的特征图谱。与传统的肽或蛋白质特征表征(如k-mer)相比，综合特征图谱结合了信息结构注释特征、进化信息和内在紊乱倾向评分，以增强肽蛋白相互作用预测。然后利用多通道特征提取器分别处理数值特征和分类特征，避免了多源特征的不一致性。综合交叉验证评价表明，CAMP在二元相互作用预测方面优于目前最先进的基线方法。此外，试图通过识别肽结合残基来破译肽蛋白相互作用的潜在机制。发现CAMP可以准确地检测出肽序列中的结合残基。还提出了具有代表性的案例来可视化肽结合残基识别任务的结果，并检查了Semaglutide及其类似物的预测靶点。验证了CAMP在肽PBD相互作用预测、肽蛋白对结合亲和评价、肽虚拟筛选等方面的应用潜力。所有这些结果表明CAMP可以提供准确的肽蛋白相互作用预测，并有助于理解肽结合机制。

2）局限性：不能直接从给定的肽蛋白对中的蛋白质序列预测结合残基；蛋白质结合残基预测的结果相对不令人满意；利用PLIP从共晶复合物结构中提取蛋白结合残基的正标记时，可能会出现一定的不确定性

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
午饭吃米好还是吃面好？第二梦想
1，午饭后和同事谈论午饭是吃米好还是吃面好，记得这个话题在网上曾经有过激烈地争论。2，米和面作为主食，都是通过碳水化合物来提供能量，通过数据对比两者在热量、碳水化合物、脂肪、蛋白质各方面都是十分接近的。3，那为什么有的人就觉得吃面才有舒服的饱腹感，有的人就觉得吃米才好消化呢？应该是长期饮食习惯不同导致的差异。4，我觉得中午吃米饭好，根据自身经验吃米饭极少吃撑，而吃面则十有八九下午都会嗳气，也有多次
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
音视频知识图谱 2022.04 关键帧Keyframe
前些时间，我在知识星球上创建了一个音视频技术社群：关键帧的音视频开发圈，在这里群友们会一起做一些打卡任务。比如：周期性地整理音视频相关的面试题，汇集一份音视频面试题集锦，你可以看看《音视频面试题集锦2022.04》。再比如：循序渐进地归纳总结音视频技术知识，绘制一幅音视频知识图谱。下面是2022.04月知识图谱新增的内容节选：1）图谱路径：**采集/音频采集/声音三要素/响度******主观计量响
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
【深度学习】训练过程中一个OOM的问题，太难查了 weixin_40293999 深度学习深度学习人工智能
现象：各位大佬又遇到过ubuntu的这个问题么？现象是在训练过程中，ssh上不去了，能ping通，没死机，但是ubunutu的pc侧的显示器，鼠标啥都不好用了。只能重启。问题原因：OOM了95G，尼玛！！！！pytorch爆内存了，然后journald假死了，在journald被watchdog干掉之后，系统就崩溃了。这种规模的爆内存一般，即使被oomkill了，也要卡半天的，确实会这样，能不能配
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
全自动解密解码神器 — Ciphey K'illCode python_模块 python vscode
Ciphey是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。简单地来讲，你只需要输入加密文本，它就能给你返回解密文本。就是这么牛逼。有了Ciphey，你根本不需要知道你的密文是哪种类型的加密，你只知道它是加密的，那么Ciphey就能在3秒甚至更短的时间内给你解密，返回你想要的大部分密文的答案。下面就给大家介绍Ciphey的实战使用教程。1.准备开始之前，你要确保Python和pip已
埃隆·马斯克表示特斯拉“没有必要”授权 xAI 模型喜好儿网人工智能 AIGC 马斯克
埃隆·马斯克近日在社交媒体上对《华尔街日报》的一篇报道进行了反驳。该报道指出，马斯克旗下的电动汽车公司特斯拉可能与人工智能初创公司xAI达成了一项收入分享协议，以便特斯拉能够使用xAI的人工智能模型。据称，这些模型将被集成到特斯拉的全自动驾驶（FSD）软件中，并可能用于开发特斯拉汽车的语音助手以及人形机器人擎天柱的软件。喜好儿网然而，马斯克否认了这一说法，他在社交媒体平台上表示，尽管特斯拉确实与x
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {