啊啦灯神叮

DeepGS：Deep Representation Learning of Graphs and Sequences for DTA | CNN,GAT,BiGRU,Prot2Vec

DeepGS: Deep Representation Learning of Graphs and Sequences for Drug-Target Binding Affinity Prediction（DTA）
这是一篇预测药物和靶标结合亲和力的文章，发表在ECAI2020上。文章最大的创新点在于首次提出三通道，在此之前都是使用二通道预测。

ECAI 2020：European Conference on Artificial Intelligence 欧洲人工智能会议

一、Introduction

（1）背景

近年来，随着深度学习模型在各个领域的成功应用与亲和力数据量的增加，深度学习技术被应用于DTA预测。而现存模型使用独热编码或只考虑分子的拓扑结构，而不考虑分子的局部化学背景。

（2）本文工作

本文提出了一个基于深度学习的 DTA预测模型DeepGS，将氨基酸序列和SMILES串编码为分布式表示，而且同时考虑了药物的分子结构和化学背景。作者将DeepGS与一些模型进行比较，实验结果证明了DeepGS的表现最好。

二、模型介绍

模型以蛋白质序列、药物的分子结构还有药物的SMILES串作为输入，以药物靶标结合亲和力作为输出。
模型主要分为三个部分。使用CNN来学习蛋白质序列（提取特征），使用GAT和BiGRU来学习药物。
具体来说步骤如下：
step1：分别使用Prot2Vec和Smi2Vec将蛋白质和药物序列中的符号编码成分布式表示；并将序列转换为矩阵，其中每一行表示序列中的符号；
step2：从蛋白质矩阵、分子矩阵、分子结构图中提取特征。①对于蛋白质序列，我们考虑氨基酸的局部化学背景，通过CNN提取特征；②对于药物分子图，使用GAT提取药物的拓扑结构信息（后面详细讲）；③使用BiGRU捕捉药物的局部化学背景。至此，我们获得了蛋白质的一个潜在表达和药物的两个潜在表达。
step3：DeepGS将三个潜在表示传递给神经网络以预测结合亲和力。

1.蛋白质的表示

（1）使用氨基酸序列表示靶蛋白。对于序列 L = { xi | i=1,2,…,l } ，采用N-gram算法将它分为三个一组的biological word ：[x1,x2,x3]，[x4,x5,x6]，[x7,x8,x9]
（2）使用Prot2Vec将biological word 编码成d维向量，目标序列就转化成了一个矩阵，每一行都是一个生物单词的嵌入。
（3）将矩阵输入到CNN，提取蛋白质的化学环境。

（1）①20种氨基酸，每一种都有对应的字母缩写。
②序列中，xi 表示第i个氨基酸，l表示序列长度。
③N-gram设置：，N设为3（为了在训练可行性和词汇量之间进行权衡）。
N-gram介绍：N-Gram是一种基于统计语言模型的算法。它的基本思想是将文本里面的内容按照字节进行大小为N的滑动窗口操作，形成了长度是N的字节片段序列，每一个字节片段称为gram。
（2）Prot2Vec：用n维向量来表示蛋白质。对于每个biological word，从预训练的嵌入字典中查找每个单词的嵌入向量。
这个嵌入字典来自Swiss-Prot，Swiss-Prot是一个经过注释的蛋白质序列数据库，包含56万个手工注释的序列。

【Q】为什么使用Prot2Vec？【A】因为它可以捕获靶蛋白中的局部化学信息。
【Q】为什么采用N-garm模型？【A】因为单个氨基酸通常无意义。

2.药物的表示

（1）药物分子图
①使用RDKit工具包将SMILES串转化为分子图
②将 graph attention network (GAT)应用于分子图：
A. 计算每个原子的临边信息和分子指纹并拼成一个向量；
B. 通过传播相邻节点的信息来更新向量；
C. 通过聚合每个原子的向量来获得对分子的表示。

（1）RDKit是一个用于化学信息学的开源工具包，里面有很多将化学与机器学习联系起来的、非常实用的库。RDKit基于对化合物2D和3D分子操作，利用机器学习方法进行化合物描述符生成，fingerprint生成，化合物结构相似性计算，2D和3D分子展示等。基于PYTHON语言进行调取使用。
将SMILES串转化为图G：from rdkit import Chem，①将SMILES转化为RDKIT的mol对象，同时生成一个空的图；②提取原子的特征和化学键特征并加入图中。
（2）基于GAT的分子结构建模方法通过聚合 r-半径子图的表示来提取药物的拓扑特征。
分子指纹：以r为半径的子图，使用WL算法（Weisfeiler-Lehman）来计算分子指纹。
a：给出两个标签 Label 的图
b：考虑节点邻域的标签，并对此排序。
c：对标签进行压缩映射
d：得到新标签

（2）药物化学背景
① 使用Smi2Vec将药物表示为100维的向量，组成矩阵；
② 使用BiGRU获得药物的潜在表示。

Smi2Vec算法介绍：
A. SMILES串被分成单个原子或字符 xj（长度为m）；
B. 从预训练的字典中查找每个原子embedding来进行映射，若不在字典中就随机生成一个值；
C. 把embedding vector聚合起来组成一个矩阵（A），每一行表示表示一个原子预训练后的向量。

【Q】为什么不用one-hot？
【A】one-hot比较稀疏，而且不能表示语意之间的关系。Smi2Vec通过embedding将高维稀疏矩阵转化为低维稠密矩阵，而且具有相似语意的映射在空间的相似位置

BiGRU（双向BRU）采用固定大小的矩阵作为输入，而SMILES字符串的长度可能会有所不同，解决方案是：当训练BiGRU和CNN时，我们将输入序列的长度固定在某个值。如果输入序列的长度大于l，我们将裁剪输入序列；如果小于l，则在输入序列的末尾使用零填充。在“实验结果”部分的模型灵敏度部分会详细介绍。
> BiGRU介绍：
BiGRU结构：BiGRU由两个信息传递相反的GRU循环层构成，一种是按时间顺序传递信息，这有助于我们从以前的表述中学习，另一种是按时间逆序传递信息，这有助于我们从未来的表述中学习。这样每个时间步的输出节点，都包含了输入序列中当前时刻完整的过去和未来的上下文信息。
BiGRU作用：为了更好地理解上下文和消除歧义，我们需要从将来的时间步中学习表示。
（e,g）“He said，Teddy bear was on sale”，“He said，Teddy Roosevelt was a great president”。在以上两个句子中，当我们看到单词“Teddy”和前两个单词“He said”时，我们可能无法理解这个句子是指总统还是泰迪熊。因此，要解决这种不确定性，我们需要向前看。这就是双向RNNs的功能。

3.DTA预测

将前面三部分得到的信息送到全连接层来预测亲和力：
①激活函数：ReLU
②损失函数：均方误差 mean Square error

全连接层，充当分类器的作用。
激活函数，就是在人工神经网络的神经元上运行的函数，负责将神经元的输入映射到输出端。
①ReLU：用于隐层神经元输出，公式为f(x) = max(0, x)，是一个线性函数。

【Q】前面三部分信息怎么处理的？
【A】（1）对于CNN模块，用三个连续的2D卷积层；
（2）对于GAT模块，使用两个图注意力层来更新图中的节点向量（考虑它们的邻居节点）；
（3）对于BiGRU模块，使用一个BiGRU层。

三、实验设置

（1）数据集

将数据集分成大小相同的6个子集，五份做训练集，一份做测试集：
①Davis数据集，包含68种药物、442种靶标、30056种药物-靶标相互作用。
②KIBA数据集，包含2111种药物、229种靶标、118254种药物-靶标相互作用。

（1）数据集介绍：
①Davis数据集是Davis 等人2011年发现的亲和力进行的实验的数据
②KIBA数据集是从ChEMBL和STITCH收集的，这确保了KIBA中的数据是经过实验验证的。KIBA数据集结合了各种生物活性类型，包括Kd,Ki和IC50，并消除不同生物活性类型之间的不一致，这大大降低了数据集中的偏差。
其中ChEMBL一个大型的、开放访问的药物发现数据库,旨在收集药物研究和开发过程中的药物化学数据和知识；STITCH是一个用于检测化合物和蛋白质之间相互作用关系的数据库。
（2）亲和力值怎么得到：
①Davis数据集是用Kd值取log作为亲和力值。
②对于KIBA数据集，它从多个来源（即Ki、Kd和IC50）集成到一个生物活性矩阵中，我们使用矩阵中的值（即KIBA值）作为亲和力值。

有关Kd，Ki，和IC50：
①Kd：（dissociation constant，解离常数），反映了蛋白质与小分子的亲和力，值越小亲和力越强。
②Ki：（inhibitor constant 抑制剂常数）针对的是蛋白质与抑制剂，反映的是抑制剂对靶标的抑制强度，值越小说明生物活性越高，抑制能力越强。
③IC50：半抑制浓度,达到50%抑制效果时抑制剂的浓度。半数抑制是用来衡量抗体灵敏度的。值越低，说明抗体的灵敏度越高。

（2）评估指标

①MSE：Mean Square Error，均方误差

其中y^是预测值，y是真实值，N是药物对儿的数量。

②CI：Concordance Index，一致性指数

CI 一致性指数用来检验亲和力值对相应药物-靶标相互作用的排序是否与基本事实相同，计算方法是把数据集中的所有研究对象随机地两两组成对子。
Z是（不同亲和力值的）药物-靶标对数量。y是实际值，f是预测值。ζ(b)是一个阶跃函数（读作Zeta），ζ(b)=0或0.5时都代表模型没有起作用。
【e.g 两个药物-靶标对，如果效果较好的一对其预测的亲和力值比另外一对较高，那么预测结果与实际结果相符，ζ=1】

③r2m：

r2m用来评估（线性回归模型中）模型拟合程度，r和r0 分别是有无截距时的真实值和预测值之间的相关系数。越接近1效果越好。r2m可用于评估QSAR模型的外部预测性能。

④AUPR：Area Under Precision Recall，PR曲线下的面积。

AUPR：PR曲线下的面积，PR曲线是召回率和正确率组成的曲线图。
AUPR作用：用来衡量不平衡数据集中模型的性能，值越大越好.
PR曲线横坐标是召回率（查全率）recall = TP/(TP + FN)，即对于所有的正例样本，有多少被预测出来了；
纵坐标是准确率（查准率）precision = TP/(TP+FP)，即所有预测为正例的样本，哪些预测对了。
（TP真正例，FP假正例，FN假反例）

（3）基准方法

①KronRLS：Kronecker Regularized Least Square

KronRLS方法：这方法基于Kronecker正则化最小二乘法。（用来最小化目标函数）。
xi 是输入（训练输入特征），yi 是真实值，f是非线性函数，λ是一个预定义的正则化参数，||f||2k 是以k为内核的范数。

②SimBoost
SimBoost模型：也是一个用来预测药物-靶标结合亲和力的模型，它使用了gradient boosting machine模型来表示输入特征与亲和力之间的非线性关系。

gradient boosting machine梯度提升机
简单理解：把预测的函数或模型看成参数
类比：神经网络中的梯度下降
方法：梯度下降
目的：每次迭代让损失减小。

③DeepCPI
将损失函数替换为MSE均方误差，输出层维度设为1。

DeepCPI模型最初专门用于DTI预测，它使用（基于r-radius指纹表示的）GNN来编码药物的分子结构，使用CNN来编码蛋白质序列，使用注意力机制来连接药物和蛋白质进行预测。在这里不能直接用于DTA任务，所以需要做一些改动。

④DeepDTA
DeepDTA以药物或者蛋白质序列的one-hot编码作为输入，分别针对药物和靶标训练两个CNN，分别从从SMILES串和蛋白质序列中学习特征，将学习到的特征连接起来并传到名为DeepDTA全连接层来预测亲和力。3个全连接层，层层之间引入dropout=0.1防拟合。

四、实验结果

(1) 与其他模型比较

上图为在Davis数据集上是表现，下图是在KIBA数据集上的表现。
(1) 在Davis数据集上，DeepGS表现最好。
①基于深度学习的模型中，文章提出的DeepGS效果最好，原因有两个：Ⅰ与DeepCPI相比，DeepGS考虑了药物的拓扑结构和化学背景；Ⅱ 与DeepDTA相比，DeepGS既考虑了分子的拓扑结构，又使用了Smi2Vec和Prot2Vec，比DeepDTA的one-hot效果好。

这是因为one-hot比较稀疏，而且不能表示语意之间的关系。Smi2Vec和Prot2Vec通过embedding将高维稀疏矩阵转化为
低维稠密矩阵，而且具有相似语意的映射在空间的相似位置。

②KronRLS不如基于深度学习的模型效果要好，这是因为KronRLS等传统模型严重依赖于手工设计的特征提取以及药物和靶标的相似矩阵。
（2）在KIBA数据集上，DeepGS总体效果也是最好的，一致性指数CI略低于DeepDTA的原因是KIBA数据集的数据异质性（数据来源比较多样：Kd, Ki, IC50）。

(2) 预测值与实际值

模型在两个数据集上亲和力的预测值和实际值如图。越靠近 p = m 这条线，预测值和实际值越接近，说明模型效果越好。我们可以看出在两个数据集上，预测值和实际值都是比较接近的，说明模型有好的预测效果。

第一个图集中在5-6，是因为亲和力值为5的占数据集的一半以上。第二个图集中在10-14原因相同。

【Q】亲和力值怎么得到?
【A】①Davis数据集是用Kd值取log作为亲和力值。
②对于KIBA数据集，它从多个来源（即Ki、Kd和IC50）集成到一个生物活性矩阵中，我们使用矩阵中的值（即KIBA值）作为亲和力值。

(3) 模型灵敏度

灵敏度分析，就是改变模型（公式）的某个参数，引起这个模型输出的变化的程度。
方法：当训练BiGRU和CNN时，我们将输入序列的长度固定在某个值。如果输入序列的长度大于l，我们将裁剪输入序列；如果小于l，则在输入序列的末尾使用零填充。
长度设置：对于药物的输入序列（SMILES串），将其长度设置为[50, 100, 500]，如上图；（平均长度64）
对于蛋白质的输入序列（即氨基酸），将其长度设置为[500, 1000 2000]，如下图。（平均长度788）
结果：①药物长度50与100，蛋白质长度500与1000，模型性能差距较大；②药物长度100与500，蛋白质长度1000与2000，模型性能差距较小。
原因：大多数SMILES串的长度在50-100之间，平均长度64。因此当SMILES串长度为100和500时，几乎不需要裁剪的SMILES串，SMILES串缺少的信息就比较少，性能差距很小；但长度为50时，可能需要裁剪较长的SMILES序列，导致性能下降。蛋白质序列长度集中在500-1000之间，平均长度788，原因是一样的。
这表明：当序列长度l 大于数据集中序列平均长度时，性能降低可能很小。

五、结论

本文提出了一个用来DTA预测的模型DeepGS，模型性能较好，其亮点如下：
（1）模型同时考虑了药物的局部化学背景和拓扑结构；
（2）使用了嵌入技术（Smi2V ec和PROT2Vec）将氨基酸和SMILES串编码成分布式表示。

《量子门与AI神经元：计算世界的奇妙碰撞》程序猿阿伟人工智能量子计算
在当今科技飞速发展的时代，量子计算和人工智能作为前沿领域，正不断颠覆我们对计算和智能的认知。量子门操作和AI中的神经元计算过程，分别作为这两大领域的核心机制，看似处于不同维度，却有着千丝万缕的联系，它们之间的区别与关联，犹如一把钥匙，为我们打开了通往更高级计算与智能世界的大门。量子门操作是量子计算的基础，它利用量子力学的奇妙特性，如叠加和纠缠，对量子比特进行操控。量子比特，作为量子信息的基本单元，
自建智能算力中心 vs 第三方算力租赁：AI企业的算力博弈与最优解
人工智能的爆发式增长正在重塑全球产业格局。从ChatGPT到DeepSeek，从自动驾驶到智能医疗，AI模型的训练和推理需求呈现指数级增长。在这场技术革命中，算力已成为企业竞争的“命脉”。然而，面对动辄数亿元的硬件投入和复杂的运维挑战，AI企业正面临一个关键抉择：自建智能算力中心，还是选择第三方算力租赁？本文将从成本、效率、风险及适用场景等维度展开深度分析，为企业提供决策参考。一、成本对比：重资产
还在为找图发愁？图生生AI以图生图，一键生成专属风格！图生生人工智能 ai AI作画图生生
你是否也遇到过这样的烦恼：想为文章配图，却找不到风格合适的图片？设计海报时，灵感枯竭，不知从何下手？看到喜欢的图片风格，却无法应用到自己的作品中？别担心，图生生AI生图来帮你！只需上传一张图片，AI就能自动生成相似风格的图片，让你轻松拥有专属图库！图生生AI生图是一款基于人工智能技术的图片生成工具，它能够深度学习和理解图片的风格、色彩、构图等元素，并以此为基础生成全新的图片。无论你是设计师、自媒体
深度学习中的Channel，通道数是什么？ %KT% 深度学习深度学习人工智能
参考文章：直观理解深度学习的卷积操作，超赞！-CSDN博客如何理解卷积神经网络中的通道（channel）_神经网络通道数-CSDN博客深度学习-卷积神经网络—卷积操作详细介绍_深度卷积的作用-CSDN博客正文：在跑深度学习代码的过程中，经常遇到的一个报错是：模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是：torch.size([16,3,24,24])。这四个参数的含义如下：16
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
远程调试Python脚本之ptvsd 工头阿乐 PyTorch 深度学习 python 开发语言
深度学习文章目录深度学习前言前言有时候需要远程调试Python脚本，怎么办呢…以下这段代码用于远程调试Python脚本，特别是通过VisualStudioCode（VSCode）的远程调试功能。它会在指定的服务器IP和端口上等待调试器的连接。#检查是否提供了服务器IP和端口ifargs.server_ipandargs.server_port:#远程调试-参见https://code.visual
yolo模型coco数据集详解工头阿乐深度学习 YOLO
深度学习文章目录深度学习前言前言instances_train2017.json和instances_val2017.json文件均分为五大部分，这五部分对应的关键字分别为info、licenses、images、annotations、categories。{"info":info,"licenses":[license1,license2,license3,...],"images":[ima
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
Lec01-什么是安全？蛋蛋deべ忧桑安全
本文使用人工智能协助翻译，内容仅供参考，可能有错误或遗漏。如果你对内容或超链接有疑问，可以查看原文。参考资料地址：https://github.com/PKUFlyingPig/MIT6.16006.1600课程团队：HenryCorrigan-Gibbs,YaelKalai,BenKettle(TA),NickolaiZeldovich2022年秋季[!warning]免责声明本套笔记为正在进行
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
大模型黑书阅读笔记--第一章 53年7月11天大模型黑书笔记人工智能自然语言处理语言模型
cnn,rnn达到了极限，憋了三十年（这段时间已经有注意力了，并且注意力也加到了cnn，rnn中，但没啥进展）憋来了工业化最先进的transformertransformer的核心概念可以理解为混合词元（token），rnn通过循环函数顺序分析次元，而transformer模型不是顺序分析，而是将每个词元与序列中其他词元关联起来。为突破cnn的极限，注意力的概念出来了：cnn做序列处理时只关注最后
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
NLP高频面试题（四）——BN和LN的区别与联系，为什么attention要用LN Chaos_Wang_ NLP常见面试题自然语言处理人工智能
在深度学习模型中，Normalization是一种极为重要的技巧，BatchNormalization（BN）和LayerNormalization（LN）是其中最为常用的两种方法。然而，二者在实际应用中有着明显的区别与联系，尤其在Transformer的Attention机制中，LN有着独特的优势。一、BN与LN的核心区别与联系1.BatchNormalization(BN)BN的思想源于一个叫
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
Browser Use开启AI辅助网页操作新时代 CodeJourney. python 人工智能算法数据库
在当今数字化时代，人们的工作和生活与互联网紧密相连。每天，我们都要花费大量时间在各类网站之间穿梭，进行诸如填写表单、查询信息、比价等重复性操作。这些工作不仅耗费精力，还容易因疲劳而出错，严重影响了工作效率。而现有的自动化工具，要么需要掌握专业的编程知识才能使用，要么在功能上存在局限性，让普通技术用户望而却步。不过，随着人工智能技术的飞速发展，一款名为BrowserUse的开源项目应运而生，为我们带
ChatGPT + Vue3：如何打造 AI 智能助手？ Js_x chatgpt 人工智能
引言人工智能（AI）正快速渗透到前端开发领域，越来越多的开发者希望将ChatGPT集成到自己的应用中，为用户提供智能对话、自动回复、辅助决策等功能。本文将介绍如何使用Vue3+OpenAIAPI搭建一个AI智能助手，让你的应用拥有强大的AI交互能力。1.项目准备1.1技术栈选择本项目将使用以下技术：Vue3-现代化的前端框架，响应式强，适合构建交互式应用。Vite-高效的Vue3项目构建工具，提升
用 AI 提高开发效率：自动生成代码、优化 SQL 查询、写测试用例 Js_x 人工智能 sql 测试用例
引言人工智能（AI）正在深刻改变软件开发行业。从代码自动补全到SQL查询优化，再到自动化测试，AI工具已经成为开发者提高生产力的重要助手。本文将介绍ChatGPT、GitHubCopilot、Tabnine等AI编程工具的实际应用，帮助开发者更高效地编写代码、优化数据库查询，并自动生成测试用例。1.AI代码生成：提升开发效率1.1ChatGPT代码生成ChatGPT具备强大的自然语言处理能力，可以
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
人工智能专业毕业设计选题清单：热点课题推荐 HaiLang_IT 人工智能算法 python
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
RAG问答系统：检索增强生成框架 ZhangJiQun&MXP 2021 论文教学大模型语言模型
目录RAG（Retrieval-AugmentedGeneration）框架一、RAG框架的定义二、RAG框架的工作原理三、RAG框架的举例说明四、RAG框架的优势RAG问答系统二、工作流程三、优势四、应用场景RAG（Retrieval-AugmentedGeneration）框架即检索增强生成框架，是一种结合了信息检索技术与语言生成模型的人工智能技术。以下是对RAG框架的详细解释及举例说明：一、
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
PyTorch 深度学习实战（12）：Actor-Critic 算法与策略优化进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们介绍了强化学习的基本概念，并使用深度Q网络（DQN）解决了CartPole问题。本文将深入探讨Actor-Critic算法，这是一种结合了策略梯度（PolicyGradient）和值函数（ValueFunction）的强化学习方法。我们将使用PyTorch实现Actor-Critic算法，并应用于经典的CartPole问题。一、Actor-Critic算法基础Actor-Cri
PyTorch 深度学习实战（17）：Asynchronous Advantage Actor-Critic (A3C) 算法与并行训练进取星辰 PyTorch 深度学习实战深度学习 pytorch 算法
在上一篇文章中，我们深入探讨了SoftActor-Critic(SAC)算法及其在平衡探索与利用方面的优势。本文将介绍强化学习领域的重要里程碑——AsynchronousAdvantageActor-Critic(A3C)算法，并展示如何利用PyTorch实现并行化训练来加速学习过程。一、A3C算法原理A3C算法由DeepMind于2016年提出，通过异步并行的多个智能体（Worker）与环境交互
全网测评：2025年最值得中小企业入局的AI无人直播软件花落谁家？ V_13135861102 人工智能
全网测评：2025年最值得中小企业入局的AI无人直播软件花落谁家？在数字化时代，人工智能技术的快速发展为各行各业带来了深刻的变革。直播电商领域也迎来了前所未有的机遇，AI无人直播软件应运而生，逐步改变着传统电商和直播行业的运营模式。对于预算有限、希望实现高效营销的中小企业而言，选择一款合适的AI无人直播软件显得尤为重要。本文将测评几款热门的AI无人直播软件，帮助中小企业找到最适合自己的入局之选。一
大模型转型之路：必要性与未来前景，迎接智能时代的浪潮_转行大模型大模型入门学习人工智能语言模型 AI 大模型 AI大模型程序员转行
随着人工智能（AI）技术的迅猛发展，特别是大型语言模型（LLM,LargeLanguageModels）的崛起，各行各业正迎来一场前所未有的技术革命。对于普通程序员而言，转行进入大模型领域不仅是对个人职业发展的战略性投资，也是顺应时代潮流、把握未来机遇的重要选择。本文将探讨转行大模型的必然性和该领域的未来发展前景。一、转行大模型的必然性技术普及化与学习资源丰富互联网的发展极大地降低了知识获取的成本
7招教你掌握用DeepSeek辅助论文写作的提示词技巧学境思源AcademicIdeas 学境思源 AI写作 ChatGPT 人工智能
随着人工智能技术的快速发展，大模型（如DeepSeek、ChatGPT等）已经成为论文写作的重要辅助工具。合理运用提示词（Prompt），不仅能极大提高写作效率，还能辅助生成高质量的学术内容。今天的内容将分享如何利用DeepSeek的提示词技巧，助力论文写作。1.明确写作目标，让AI理解你的需求在使用大模型时，清晰的写作目标至关重要。一个好的提示词应当包括：写作主题、内容范围、格式要求、风格倾向等
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found