xunan003

关于深度学习在生物学领域的应用分析

申明：本文来源于对论文“Applications of Deep Learning in Biomedicine”的理解。

深度学习研究及其在生物医药领域的潜在应用

深度学习已经在各种生物学应用中取得成功。在本节中，我们回顾了在各个研究领域进行深度学习的挑战和机会，并在可能的情况下回顾将深度学习应用于这些问题的研究（表1）。我们首先回顾了生物标志物开发的重要领域，包括基因组学，转录组学，蛋白质组学，结构生物学和化学。然后，我们回顾一下药物发现和再利用的前景，包括使用多平台数据。

生物标志物。生物医学的一个重要任务是将生物学数据转化为反映表型和物理状态（如疾病）的有效生物标志物。生物标志物对于评估临床试验结果[18]以及检测和监测疾病，特别是像癌症这样的异质性疾病，是至关重要的[19,20]。识别敏感特异性生物标志物对于现代转化医学来说是一个巨大的挑战[21,22]。计算生物学是生物标志物发展。事实上，从基因组学到蛋白质组学都可以使用任何数据来源;这些在下一节中讨论。

基因组学。新一代测序（NGS）技术已经允许生产大量的基因组数据。这些数据的大部分分析都可以用现代计算方法在计算机上进行。这包括基因组的结构注释（包括非编码调控序列，蛋白质结合位点预测和剪接位点）。

基因组学的一个重要分支是宏基因组学，也被称为环境，生态基因组学或社区基因组学。NGS技术揭示了未经培育且以前没有得到充分研究的微生物的自然多样性。

宏基因组学中有几个生物信息学挑战。一个主要挑战是序列数据的功能分析和物种多样性的分析。深信念网络和经常性神经网络的使用已经允许通过表型分类宏基因组学pH数据和人类微生物组数据。与基线方法相比，这些方法并没有提高分类准确性作为强化学习，但确实提供了学习数据集的分层表示的能力.[23]但是，Ditzler等强调DNN可以改善现有的宏基因组学分类算法，特别是在大数据集和适当选择网络参数的情况下。

表1. 深度学习技术应用于不同类型生物医学数据的总结

应用	数据源	研究目的	DL技术	准确率
利用深度学习增强癌症诊断和分类[28]	13种不同的癌症基因表达数据集（13 different gene expression data sets of cancers）	癌症检测，癌症类型分类	稀疏和堆栈自动编码器+ Softmax回归	对于每个数据集的准确度都比基准更好
深度学习组织调节拼接代码[32]（Deep Learning of the Tissue-Regulated Splicing Code）	从RNA-Seq数据分析11 019个小鼠替代外显子（11 019 mouse alternative exons profiled from RNA-Seq data）	拼接模式识别	自动编码器+ DNN（3层）+薄荷（超参数选择）	AUC优于基线准确度
深卷积神经网络注释基因表达模式的小鼠脑[30]	由Allen Institute for Brain Science的小鼠脑的四个发育阶段的ISH图像	基因表达注释	CNN（Overfeat）	AUC=0.894
多模式深度学习方法的多平台癌症数据的综合数据分析[52]	卵巢癌和乳腺癌数据集（ovarian and breast cancer data sets）	聚集癌症患者	DBNs
lncRNA-MFDL：通过融合多个特征和使用深度学习鉴定人类长的非编码RNA[34]	Gencode和RefSeq的蛋白质编码和非编码序列（protein-coding and noncoding sequences from Gencode and RefSeq）	鉴定长的非编码RNA	lncRNA-MFDL（深层堆叠网络，每个单元DNN）	ACC = 97.1%
用于宏基因组分类的多层和递归神经网络[23]	pH微生物组测序数据集和人微生物组测序数据集（pH microbiome sequencing data set and human microbiome sequencing data set）	宏基因组分类	MLP, DBN, RNN	comparison
Multi-Level Gene/MiRNA Feature Selection using Deep Belief Nets and Active Learning[27]	来自6种癌症的MiRNA表达数据（MiRNA expression data from 6 type of cancers）	Gene/MiRNA特征选择（基因表达）	MLFS（DBN +特征选择+无监督主动学习）（MLFS (DBN + feature selection + unsupervised active learning)）	F1 = 84.7%
成对输入神经网络用于目标配体相互作用预测[45]	sc-PDB数据库（sc-pdb：用于鉴定蛋白质中“可药用”结合位点的变化和多样性的数据库）	蛋白质 - 配体预测	PINN (SVD + Autoencoder/RBM)	AUC = 0.959
非编码变量与深度学习序列模型的预测效应[49]	来自ENCODE和Roadmap Epigenomics项目的160种不同TF，125种DHS谱和104种组蛋白标记谱的690 TF结合谱	从序列中预测非编码变异效应	DeepSEA (CNN)	AUC = 0.923 (histone)
通过深度学习预测DNA和RNA结合蛋白的序列特异性[48]	506 ChIP-seq实验，DREAM5 TF-DNA基序识别挑战	DNA和RNA结合蛋白的特异性分类	DeepBind（CNN）	train, AUC = 0.85; validation, AUC > 0.7
具有双模深信道网络的蜂窝信号系统的跨物种学习[36]	来自SBV IMPROVER挑战的磷酸化蛋白质组学数据	跨物种学习（模拟细胞信号系统）	bDBN (bimodal DBN) and sbDBN (semirestricted bimodal DBN)	AUC = 0.93
表达数量性状基因（eQTL）的鉴定与阐明及其调控机制的深入研究[35]	GEUVADIS（来自从参与1000基因组项目的个体中提取的337个淋巴母细胞系的选择的RNA-Seq和全基因组范围的SNP-阵列数据的组合）	确定eQTL	MASSQTL（DNN）	AUC = 0.85
建立RNA结合蛋白靶点结构特征的深度学习框架[43]	源自doRiNA的24个数据集（转录后调节中的RNA相互作用数据库）	预测RNA结合蛋白的结合位点（RBP靶标识别）	DBN（多模式DBN）	AUC = 0.983 on PTB HITS-CL
DeepCNF-D：通过加权深度卷积神经场预测蛋白质有序/无序区域[42]	来自CASP的CASP9, CASP10数据集（蛋白质结构预测的关键评估）	预测蛋白质有序/无序区域	DeepCNF (CRF + CNN)	AUC = 0.855 on CASP9 AUC = 0.898 on CASP10
用深度神经网络分割微阵列[29]	两个数据集，来自2006年Lehmussola等人的微阵列图像	微阵列分割	CNN	MAE = 0.25
深度学习药物引起的肝损伤[46]	四个数据集，化合物，化学结构注释DILI阳性或DILI阴性（four data sets, compounds, chemical structure annotated DILI-positive or DILI-negative properties）	药物性肝损伤预测	RNN（递归神经网络）	AUC = 0.955
从头算蛋白质二级结构预测的深度学习网络方法[38]	训练，Protein Data Bank; 验证，CASP9，CASP10（蛋白质结构预测的关键评估）	从头算蛋白质二级结构预测	DNSS（多模RBM）	Q3 = 90.7%, Sov = 74.2%
蛋白质接触图预测的深层架构[39]	ASTRAL database	蛋白质接触图预测	RNN + DNN	ACC ∼ 30%
用深机器学习网络建模药物样分子的环氧化作用[47]	Accelrys代谢物数据库（AMD）：389个环氧化分子，811个非氧化分子（Accelrys Metabolite Database (AMD): 389 epoxidized molecules, 811 nonepoxidized molecules）	建模分子的环氧化性质	CNN	AUC better than baseline accuracy
DNdisorder：使用增强和深度网络预测蛋白质紊乱[41]	DISORDER723, CASP9, CASP10	预测蛋白质有序/无序区域	RBM	AUC better than baseline accuracy
Basset：用深度卷积神经网络学习可访问基因组的规则代码[50]	来自ENCODE和Epigenomics Roadmap项目的164个细胞类型的DNasel-seq数据	学习DNA序列的功能活动	CNN	AUC = 0.892

a首字母缩写词：CNN=卷积神经网络，DNN=深度神经网络，RNN=递归神经网络，DBN=深信念网络，RBM=限制玻尔兹曼机器，MLP=多层感知器，MLFS=多级特征选择，PINN= 网络，CRF=条件随机场。

转录。转录组学分析利用各种类型转录物（信使RNA（mRNA），长非编码RNA（lncRNA），微小RNA（miRNA）等）丰度的变化来收集各种功能信息，从剪接代码到各种疾病的生物标志物。

转录组学数据通常从不同类型的平台（各种微阵列平台，测序平台）获得，其不同之处在于测量的基因组和信号检测方法。许多因素导致基因表达数据的变异性。因此，即使对于单个平台分析也需要标准化。跨平台分析需要规范化技术，这可能是一个重大挑战。由于DNN具有较高的泛化能力，因此特别适合于跨平台分析。他们也能很好地处理基因表达数据的其他一些主要问题，比如数据集的大小以及对降维和选择性/不变性的需求，下面我们将回顾几个已经使用的DNN 用不同类型的基因表达数据来获得不同程度的成功。

表格数据应用程序。基因表达数据可以表示的一种方式是作为矩阵的表格形式，其包含关于转录物表达的定量信息。这些数据是高维度的，由于数据中的信噪比损失，使得统计分析成为问题。[25]

高维数据可以通过两种方式处理：

I. 降维：

A.特征提取，例如用SVM或随机森林算法;

B.特征子集选择;

C.途径分析;

II. 使用对高维度较不敏感的方法，如随机森林或深层信念网络。

诸如主成分分析（PCA），奇异值分解，独立分量分析或非负矩阵分解等方法是常见的前沿方法。然而，上述方法将数据转换成许多难以用生物学解释的组件。此外，这种降维方法基于基因表达谱提取特征而不管基因之间的相互作用。通路分析可以减少变量的数量，减少错误率并保留更多的生物相关信息。[25,26]

深度学习在处理高维基质转录组学数据方面也取得了一些成功。在另一种方法中，将基因表达的特征与非编码转录物如miRNA的区域一起提取; 这是通过使用深度信念网络和主动学习来实现的，其中使用了深度学习特征提取器来减少六个癌症数据集的维度，并且胜过了基本特征选择方法[27]。主动学习与分类的应用提高了准确性，并且允许选择与癌症相关的特征（改进的癌症分类），而不仅仅基于基因表达谱。使用miRNA数据的特征选择是使用与先前选择的特征子集的目标基因的关系实施的。

在另一个深度学习应用中，Fakoor等人利用自编码器网络进行推广，并将其应用于使用从具有不同基因集合的不同类型的微阵列平台（Affimetrix家族）获得的微阵列基因表达数据的癌症分类[28]。他们通过PCA和非监督非线性稀疏特征学习（通过自动编码器）结合使用降维来构建用于微阵列数据的一般分类的特征。癌症和非癌细胞分类的结果显示出了重要的改进，特别是使用监督微调，这使得特征不那么通用，但即使对于没有跨平台标准化的数据也能获得更高的分类准确性。自动编码器的全球泛化能力有助于使用不同微阵列技术收集的数据，因此可能对来自公共领域的数据进行大规模综合分析有前途。

图像处理应用。基因表达也可以以可视形式存储为图像，例如来自微阵列的图像荧光信号或RNA原位杂交荧光或放射性信号。在一些应用中，以图像处理性能优越著称的CNN已经显示出改善这些图像分析的潜力。

在微阵列分析中，由于斑点大小，形状，位置或信号强度的变化，检测信号和识别荧光斑点可能是具有挑战性的，并且荧光信号强度通常对应于基因或序列表达水平差。在对这个问题的深度学习技术的一个应用中，CNN被用于微阵列图像分割，并且在准确性方面显示出类似于基准方法的准确度的结果，但是训练更简单并且对计算源的要求更少。[29]

将CNN应用于基于图像的基因表达数据的另一个机会是RNA原位杂交，这是一种繁琐的技术，当允许这样的操作时，能够使基因表达在一组细胞，组织切片或整个生物体中定位和可视化。这种方法促进强大的纵向研究，说明发展过程中的表达模式的变化。它被用于构建详细的Allen DevelopmentMouse Brain Atlas，其中包含超过2000个基因的表达图谱，每个基因在多个脑部分中进行说明。过去，这些手动标注是耗时的，昂贵的，有时也是不准确的。然而，最近，Zeng等人使用深度预训练CNN进行自动注释[30]。要做到这一点，神经网络模型训练原始自然原位杂交图像的不同层次的发展中国家的大脑没有关于坐标（空间信息）的确切信息;这种技术在四个发展阶段的多个大脑水平上实现了卓越的准确性。

剪接。深度学习的另一个应用领域是剪接。剪接是在真核生物中提供蛋白质生物多样性的主要因素之一;此外，最近的研究显示“拼接代码”与各种疾病之间的联系[31]。然而，现代科学仍然不能全面地理解控制剪接调控的机制。剪接调节的现代概念包括转录水平，特定信号调节序列元件（剪接增强子或沉默子）的存在，剪接位点的结构和剪接因子的状态（例如特定位点的磷酸化可能改变剪接因子活性）。所有这些因素使分析变得复杂，因为它们之间存在大量元素和复杂的非线性相互作用。现有的拼接预测软件需要高通量测序数据作为输入，并且面临着原始读取比常规基因短的问题，以及基因组中假性基因的高重复水平和存在。因此，拼接机制的分析算法很慢，需要高度的组合计算来源，深度学习可能会在这方面提供改进。在使用五个组织特异性RNA-seq数据集的一个深度学习应用中，使用隐变量来开发DNN以用于基因组序列和组织类型中的特征，并且被证明优于贝叶斯方法预测个体内和组织间的组织剪接外显子拼接的转录本百分比的变化（拼接代码度量）[32]。

非编码RNA。非编码RNA是生物学中的另一个问题，需要复杂的计算方法，如深度学习。非编码RNAs非常重要，涉及转录，翻译和表观遗传学的调控[33]，但是它们仍然难以与编码蛋白质的RNA区分开来。对于短的非编码RNA，这个任务已经很好地解决了，但是对于lncRNA来说这是相当具有挑战性的。lncRNAs组成异构类，可能含有推定的复制起点（ORF），短的蛋白质样序列。开发了一种新的深层次的学习方法，称为lncRNAMFDL，用于鉴定lnc-RNAs，使用ORF，k相邻碱基，二级结构和预测的编码结构域序列等多种特征的组合[34]。该方法使用从Gencode（lncRNA）和Refseq（蛋白质编码mRNA数据）的序列数据中提取的五个单独特征，并且在人类数据集中导致97.1％的预测准确性。

表达量性状基因座分析。最后，数量性状基因座（QTL）分析有潜力进行深入的学习。 QTL分析鉴定含有多态性的遗传基因座，所述多态性导致复杂的多基因性状（例如，体重，药物反应，免疫应答）的表型变异。显示遗传变异的一个这样的“性状”是给定组织和/或条件中任何给定基因的表达或转录本丰度。表达QTL（eQTL）是影响转录本丰度的遗传变异的基因座。 eQTL分析已经导致了对人类基因表达调控的洞察力，但面临着许多挑战。在局部调节表达的eQTL（顺式-eQTL）相对容易用有限数量的统计测试来鉴定，但是调节基因组中其它位置的基因表达的位点（trans-eQTL）更难以检测到。最近，为了解决使用各种编码的生物特征（诸如物理蛋白质相互作用网络，基因注释，进化保守，局部序列信息以及来自ENCODE项目的不同功能元件）的反式eQTL预测问题的深度学习方法MASSQTL[35]被提出。DNN利用来自其各自交叉验证折叠的9个DNN模型，优于其他机器学习模型，并且提供了对基因表达的调控架构的基础的新机制。深解码系统也被用来对trans-eQTL特征向量进行聚类，然后通过t-SNE降维技术进行可视化。

蛋白质组学。与转录组学相比，蛋白质组学是一个相当欠发达的研究领域，数据依然稀少，用于分析的计算方法较少。即使有相似的信号编码和传输机制，人类蛋白质组学数据的缺乏以及将模型生物体结果转化为人类的困难也使分析变得复杂。

深度学习可以以多种方式使蛋白质组学受益，因为一些方法不需要像其他机器学习算法那样的大量培训案例。深度学习方法的其他优点是他们建立数据的分层表示，并从复杂的相互作用中学习一般特征，从而有利于蛋白质的蛋白质组学和网络分析。例如，使用磷酸化数据，双峰深信念网络已被用于预测大鼠细胞对相同刺激的刺激的细胞反应[36]。与传统的管线相比，开发的算法获得了相当的准确性。

结构生物学和化学。结构生物学包括蛋白质折叠分析，蛋白质动力学，分子建模和药物设计。二级和三级结构是蛋白质和RNA分子的重要特征。对于蛋白质，适当的结构测定对于酶功能预测，催化中心和底物结合的形成，免疫功能（抗原结合），转录因子（DNA结合）和转录后修饰（RNA结合）是重要的。丧失适当的结构会导致功能丧失，并且在某些情况下会导致可能导致神经退行性疾病（如阿尔茨海默病或帕金森病）的异常蛋白质的聚集。[37]

基于复合同源性的比较建模是预测蛋白质二级结构的一种可能方式，但是受现有注释良好的化合物的量限制。另一方面，机器学习从头预测是基于公认的具有公知结构的化合物的模式，但是还不够精确以至于不能实际使用。从头开始使用深度学习方法通过使用蛋白质测序数据改进了结构预测[38]。同样，深度学习已经被应用于使用ASTRAL数据库数据和复杂的三阶段方法来预测二级结构元素和氨基酸残基之间的接触和取向[39]。所使用的方法是分析偏倚和高度可变数据的有效工具。

三维结构的不变性在功能上也是重要的。然而，有几种蛋白质没有独特的结构参与基本的生物过程，如细胞周期的控制，基因表达的调控，分子信号传递。此外，最近的研究显示一些无序蛋白质的显着性[37]; 许多癌基因蛋白具有非结构域，并且错误折叠蛋白的异常聚集导致疾病发展[40]。这种没有固定三维结构的蛋白被称为固有无序蛋白（IDP），而没有恒定结构的结构域被称为固有无序区（IDR）。

许多参数将IDP / IDR与结构化蛋白质区分开来，从而使预测过程具有挑战性。这个问题可以使用深度学习算法来解决，这些算法能够考虑各种各样的特征。2013年，Eickholt和Cheng发表了一个基于序列的深度学习预测指标DNdisorder，与先进的预测指标相比，改进了对无序蛋白质的预测[41]。后来在2015年，Wang等人提出了一种新的方法，DeepCNF，使用来自蛋白质结构预测的临界评估（CASP9和CASP10）的实验数据，能够准确预测多个参数，如IDPs或具有IDR的蛋白质。DeepCNF算法通过利用众多特征，比基线单从头（从头算）预测指标执行得更好[42]。

另一类重要的蛋白质是结合单链或双链RNA的RNA结合蛋白。这些蛋白质参与RNA的各种转录后修饰：剪接，编辑，翻译调控（蛋白质合成）和聚腺苷酸化。RNA分子形成不同类型的臂和环，需要识别和形成RNA和蛋白质之间连接的二级和三级结构。RNA的二级和三级结构是可预测的，并且已经被用于建模结构偏好偏好和通过应用深度信念网络预测RBP的结合位点[43]。深度学习框架在真正的CLIP-seq（交联免疫沉淀高通量测序）数据集上进行了验证，以显示从原始序列和结构分布中提取隐藏特征的能力，并准确预测RBP的位点。

药物发现和再利用。计算药物生物学和生物化学广泛应用于药物发现，开发和再利用的几乎每个阶段。过去数十年来，不同的研究团体和公司在全球范围内开发了大量用于计算机模拟药物发现和目标延伸的计算方法，以减少时间和资源消耗。虽然存在许多方法[44]，但是还没有一个是最优的（例如，无法执行通量筛选或者通过蛋白质类别进行限制），现在一些研究表明深度学习是一个重要的考虑方法（表1）。

药物发现的重要任务之一就是预测药物靶点的相互作用。靶标（蛋白质）通常具有一个或多个与底物或调节分子的结合位点; 这些可以用于建立预测模型。然而，包括其他蛋白质的成分可能会给分析带来偏见。成对输入神经网络（PINN）接受具有从蛋白质序列和靶分布获得的特征的两个载体的能力被Wang等人用来计算靶标-配体相互作用[45]。神经网络的这种优势比其他代表性的靶标-配体相互作用预测方法有更好的准确性。

药物发现和评估是昂贵，耗时且具有风险; 计算方法和各种预测算法可以帮助降低风险并节省资源。一个潜在的风险是毒性; 例如，肝毒性（肝毒性）是从生产中去除药物的常见原因。用计算方法预测肝毒性可能有助于避免可能的肝毒性药物。使用深度学习，可以有效地确定原始化学结构的化合物毒性，而不需要复杂的编码过程[46]。使用CNN也可以预测诸如环氧化的性质，这意味着高反应性和可能的毒性; 这是休斯等人首次实施的。通过使用环氧化分子和氢氧化物分子的简化分子输入线入口规格（SMILES）格式数据作为阴性对照[47]。

多平台数据（Multiomics）。使用多平台数据的能力是深度学习算法的主要优势。由于生物系统复杂，具有多个相互关联的元素，基因组学，表观基因组学和转录组学数据的系统级整合是提取最有效且有生物学意义的结果的关键。整合过程在计算上不是微不足道的，但收益是生物标志物特异性和灵敏度比单一来源方法的增加。

计算生物学中需要分析组合数据的主要领域之一是计算表观遗传学。有联合分析基因组，转录组，甲基化组特征和组蛋白修饰提供了准确的表观基因组预测。

一些研究人员已经开发出深度学习方法，可用于分析来自多个来源的数据（表1）。Alipanahi等人开发了基于深度学习的方法DeepBind（tools.genes.toronto.edu/deepbind/），以在各种疾病中计算核苷酸序列结合转录因子和RNA结合蛋白的能力，并表征单点突变对结合特性的影响。DeepBind软件受CNN启发，对技术不敏感; 相反，它与从微阵列到序列的定性不同形式的数据是相容的。CPU的实现也允许用户并行化计算过程[48]。在另一个基于CNN的应用程序中，Zhou和Troyanskaya设计了DeepSEA框架来预测染色质特征和疾病相关序列变异的评估。与其他计算方法不同，他们的算法能够捕获每个结合位点的大规模上下文序列信息，用于注释从头序列变异体[49]。开发了类似的CNN管线，揭示了序列变异对染色质调控的影响，并对DNase-seq（DNase I测序）数据进行了培训和测试[50]。一种名为Bassed的深度学习软件优于基线方法，并且在所有数据集上达到平均AUC0.892。最后，随着深层特征选择模型的发展，深度学习被用于识别主动增强器和促进器，该模型利用了DNN对复杂非线性相互作用进行建模的能力，并学习了高层次的广义特征[51]。模型从多平台数据中选择特征，并按照重要性进行排序。在这些应用中，深度学习方法是染色质性质的更敏感和更有力的预测因子，也是复杂生物标志物发展的关键。

癌症是一组异质性疾病的广泛名称，其中一些是由基因突变引起的，因此使用多平台数据的癌症分类可以揭示潜在的病理学。Liang等人开发了一个具有多平台数据的深层信念网络模型，用于癌症患者的聚类[52]。使用受限玻尔兹曼机对每种输入模式定义的特征进行编码。这种方法的一个优点是深层信念网络不需要具有正态分布的数据，因为其他聚类算法和遗传（生物）数据不是正态分布的。

最后，从自然语言处理的角度来看，深度学习在通过巨大的非结构化（研究出版物和专利）和结构化数据（知识注释图，如基因本体论[53]或Chembl[54]）浏览时，通过检验假设的合理性。这些数据库一起形成了一个庞大的，多平台的数据集，如果结合起来，这些数据集将更加丰富和全面。

总之，现代生物数据的庞大规模，对于以人为本的分析来说太庞大而复杂。机器学习，特别是深度学习与人类专业知识相结合，是将多个大型多平台数据库完全集成的唯一途径。深度学习使人类能够做到以前无法想象的事情：具有数百万输入的图像识别，语音识别以及接近人类能力的语音自动化。虽然深度学习和特别是无监督的深度学习仍处于起步阶段，特别是在生物学应用方面，但最初的研究支持它作为一种有希望的方法，尽管在实施中不受限制和挑战，但可以克服生物学数据的一些问题，对数百万间接和相互关联的疾病机制和途径的新见解。

参考文献

(1)EMBL-European Bioinformatic Institute. EMBL-EBI Annual Scientific Report 2014.2014, p 142.

(2)Greene, C. S.; Troyanskaya, O. G. Chapter 2: Data-Driven View of DiseaseBiology. PLoS Comput. Biol. 2012, 8 (12), e1002816.

(3)Nussinov, R. Advancements and Challenges in Computational Biology. PLoS Comput.Biol. 2015, 11 (1), e1004053.

(4)Libbrecht, M. W.; Noble, W. S. Machine Learning Applications in Genetics andGenomics. Nat. Rev. Genet. 2015, 16 (6), 321−332.

(5)LeCun, Y.; Bengio, Y.; Hinton, G. Deep Learning. Nature 2015, 521 (7553),436−444.

(6)Bengio, Y.; LeCun, Y. Scaling Learning Algorithms towards AI. Large ScaleKernel Mach. 2007, No. No. 1, 321−360.

(7)Bengio, Y.; Delalleau, O.; Simard, C. Decision Trees Do Not Generalize To NewVariations. Comput. Intell. 2010, 26 (4), 449−467.

(8)Oquab, M.; Bottou, L.; Laptev, I.; Sivic, J. Learning and TransferringMid-Level Image Representations Using Convolutional Neural Networks. Cvpr 2014,1717−1724.

(9)Mnih, V.; Kavukcuoglu, K.; Silver, D.; Rusu, A.; Veness, J.;

Bellemare,M.; Graves, A.; Riedmiller, M.; Fidjeland, A.; Ostrovski, G.; Petersen, S.;Beattie, C.; Sadik, A.; Antonoglou, I.; King, H.; Kumaran, D.; Wierstra, D.;Legg, S.; Hassabis, D. Human-Level Control through Deep Reinforcement Learning.Nature 2015, 518 (7540), 529−533.

(10)Gatys, L. A.; Ecker, A. S.; Bethge, M.; Sep, C. V. A Neural Algorithm ofArtistic Style; pp 3−7.

(11)Schmidhuber, J. Deep Learning in Neural Networks: An Overview. Neural Networks2015, 61, 85−117.

(12)Solovyeva, K. P.; Karandashev, I. M.; Zhavoronkov, A.; Dunin-Barkowski, W. L.Models of Innate Neural Attractors and Their Applications for NeuralInformation Processing. Front. Syst. Neurosci. 2016, DOI:10.3389/fnsys.2015.00178.

(13)Baralis, E.; Fiori, A. Exploring Heterogeneous Biological Data Sources. In 200819th International Conference on Database and Expert Systems Applications;IEEE: 2008; pp 647−651.

(14)Bengio, Y.; Goodfellow, I. J.; CourvilleA. Deep Learning; 2015.

(15)Krizhevsky, A.; Sutskever, I.; Hinton, G. E. ImageNet Classification with DeepConvolutional Neural Networks. Adv. Neural Inf. Process. Syst. 2012, 1−9.

(16)Snoek, J.; Larochelle, H.; Adams, R. P. Practical Bayesian Optimization ofMachine Learning Algorithms; 2012; pp 1−12.

(17)Mockus, J.; Tiesis, V.; Zilinskas, A. The application of Bayesian methods forseekeng the extremum. In Towards Global Optimization; Dixon, L. C. W., Szegö,G. P., Eds.; North-Holland: Amsterdam; 1978Vol. 2, pp 117−129.

(18)Bakhtiar, R. Biomarkers in Drug Discovery and Development. J. Pharmacol.Toxicol. Methods 2008, 57 (2), 85−91.

(19)Lezhnina, K.; Kovalchuk, O.; Zhavoronkov, A. A.; Korzinkin, M. B.; Zabolotneva,A. A.; Shegay, P. V.; Sokov, D. G.; Gaifullin, N. M.; Rusakov, I. G.; Aliper,A. M.; Roumiantsev, S. A.; Alekseev, B. Y.; Borisov, N. M.; Buzdin, A. A. NovelRobust Biomarkers for Human Bladder Cancer Based on Activation of IntracellularSignaling Pathways. Oncotarget 2014, 5 (19), 9022−9032.

(20)Shepelin, D.; Korzinkin, M.; Vanyushina, A.; Aliper, A. Molecular PathwayActivation Features Linked with Transition from Normal Skin to Primary andMetastatic Melanomas in Human. Oncotarget 2016, 7 (1), 656−670.

(21)Borisov, N. M.; Terekhanova, N. V.; Aliper, A. M.; Venkova, L. S.; Smirnov, P.Y.; Roumiantsev, S.; Korzinkin, M. B.; Zhavoronkov, A. A.; Buzdin, A. A.Signaling Pathways Activation Profiles Make Better Markers of Cancer thanExpression of Individual Genes. Oncotarget 2014, 5 (20), 10198−10205.

(22)Brooks, J. D. Translational Genomics: The Challenge of Developing CancerBiomarkers. Genome Res. 2012, 22 (2), 183−187.

(23)Ditzler, G.; Polikar, R.; Member, S.; Rosen, G.; Member, S. Multi-Layer andRecursive Neural Networks for Metagenomic Classification. IEEE Trans.Nanobiosci. 2015, 14 (6), 608−616.

(24)Järvinen, A.-K.; Hautaniemi, S.; Edgren, H.; Auvinen, P.; Saarela, J.;Kallioniemi, O.-P.; Monni, O. Are Data from Different Gene ExpressionMicroarray Platforms Comparable? Genomics 2004, 83 (6), 1164−1168.

(25)Hira, Z. M.; Gillies, D. F. A Review of Feature Selection and FeatureExtraction Methods Applied on Microarray Data. Adv. Bioinf. 2015, 2015 (1),198363.

(26)Buzdin, A. A.; Zhavoronkov, A. A.; Korzinkin, M. B.; Roumiantsev, S. A.;Aliper, A. M.; Venkova, L. S.; Smirnov, P. Y.; Borisov, N. M. The OncoFinderAlgorithm for Minimizing the Errors Introduced by the High-Throughput Methodsof Transcriptome Analysis. Front. Mol. Biosci. 2014, DOI:10.3389/fmolb.2014.00008.

(27)Ibrahim, R.; Yousri, N. A.; Ismail, M. A.; El-Makky, N. M. Multi- Levelgene/MiRNA Feature Selection Using Deep Belief Nets and Active Learning. Eng.Med. Biol. Soc. (EMBC), 2014 36th Annu. Int. Conf. IEEE 2014, 3957−3960.

(28)Fakoor, R.; Huber, M. Using Deep Learning to Enhance Cancer Diagnosis andClassification. In Proceeding 30th Int. Conf. Mach. Learn. Atlanta, GA, 2013,Vol. 28.

(29)Jones, A. L. Segmenting Microarrays with Deep Neural Networks 2015, DOI:10.1101/020404.

(30)Zeng, T.; Li, R.; Mukkamala, R.; Ye, J.; Ji, S. Deep Convolutional NeuralNetworks for Annotating Gene Expression Patterns in the Mouse Brain. BMCBioinf. 2015, 16 (1), 147.

(31)Xiong, H. Y.; Alipanahi, B.; Lee, L. J.; Bretschneider, H.; Merico, D.; Yuen,R. K. C.; Hua, Y.; Gueroussov, S.; Najafabadi, H. S.; Hughes, T. R.; Morris,Q.; Barash, Y.; Krainer, Ad. R.; Jojic, N.; Scherer, S. W.; Blencowe, B. J.;Frey, B. J. The human splicing code reveals new insights into the geneticdeterminants of disease. Science 2015, 347 (6218), 1254806.

(32)Leung, M. K. K.; Xiong, H. Y.; Lee, L. J.; Frey, B. J. Deep Learning of theTissue-Regulated Splicing Code. Bioinformatics 2014, 30 (12), i121−i129.

(33)Cech, T. R.; Steitz, J. A. The Noncoding RNA Revolution Trashing Old Rules to Forge NewOnes.pdf. Cell 2014, 157 (1), 77−94.

(34)Fan, X.-N.; Zhang, S.-W. lncRNA-MFDL: Identification of Human Long Non-CodingRNAs by Fusing Multiple Features and Using Deep Learning. Mol. BioSyst. 2015,11 (3), 892−897.

(35)Witteveen, M. J. Identification and Elucidation of Expression QuantitativeTrait Loci (eQTL) and Their Regulating Mechanisms Using Decodive Deep Learning;2014; pp 1−17.

(36)Chen, L.; Cai, C.; Chen, V.; Lu, X. Trans-Species Learning of CellularSignaling Systems with Bimodal Deep Belief Networks. Bioinformatics 2015, 31,3008−3015.

(37)Ross, C. A.; Poirier, M. A. Opinion: What Is the Role of Protein Aggregation inNeurodegeneration? Nat. Rev. Mol. Cell Biol. 2005, 6(11), 891−898.

(38)Spencer, M.; Eickholt, J.; Cheng, J. A Deep Learning Network Approach to abInitio Protein Secondary Structure Prediction. IEEE/ ACM Trans. Comput. Biol.Bioinf. 2015, 12 (1), 103−112.

(39)Di Lena, P.; Nagata, K.; Baldi, P. Deep Architectures for Protein Contact MapPrediction. Bioinformatics 2012, 28 (19), 2449−2457.

(40)Babu, M. M.; van der Lee, R.; de Groot, N. S.; Gsponer, J. IntrinsicallyDisordered Proteins: Regulation and Disease. Curr. Opin. Struct. Biol. 2011, 21(3), 432−440.

(41)Eickholt, J.; Cheng, J. DNdisorder: Predicting Protein Disorder Using Boostingand Deep Networks. BMC Bioinf. 2013, 14 (1), 88.

(42)Wang, S.; Weng, S.; Ma, J.; Tang, Q. DeepCNF-D: Predicting ProteinOrder/Disorder Regions by Weighted Deep Convolutional Neural Fields. Int. J.Mol. Sci. 2015, 16 (8), 17315−17330.

(43)Zhang, S.; Zhou, J.; Hu, H.; Gong, H.; Chen, L.; Cheng, C.; Zeng, J. A DeepLearning Framework for Modeling Structural Features of RNA-Binding ProteinTargets. Nucleic Acids Res. 2016, 44 (4), e32.

(44)Schirle, M.; Jenkins, J. L. Identifying Compound Efficacy Targets in PhenotypicDrug Discovery. Drug Discovery Today 2015, 21(1), 82.

(45)Wang, C.; Liu, J.; Luo, F.; Tan, Y. Pairwise Input Neural Network forTarget-Ligand Interaction Prediction. 2014 IEEE Int. Conf. Bioinf. Biomed.(BIBM) 2014, 67−70.

(46)Xu, Y.; Dai, Z.; Chen, F.; Gao, S.; Pei, J.; Lai, L. Deep Learning forDrug-Induced Liver Injury. J. Chem. Inf. Model. 2015, 55, 2085−2093.

(47)Hughes, T. B.; Miller, G. P.; Swamidass, S. J. Modeling Epoxidation ofDrug-like Molecules with a Deep Machine Learning Network. ACS Cent. Sci. 2015,1 (4), 168−180.

(48)Alipanahi, B.; Delong, A.; Weirauch, M. T.; Frey, B. J. Predicting the SequenceSpecificities of DNA- and RNA-Binding Proteins by Deep Learning. Nat.Biotechnol. 2015, 33, 831−838.

(49)Zhou, J.; Troyanskaya, O. G. Predicting Effects of Noncoding Variants with DeepLearning−based Sequence Model. Nat. Methods 2015, 12 (10), 931−934.

(50)Kelley, D. R.; Snoek, J.; Rinn, J. Basset: Learning the Regulatory Code of theAccessible Genome with Deep Convolutional Neural Networks; 2015.

(51)Li, Y.; Chen, C.-Y.; Wasserman, W. Deep Feature Selection: Theory andApplication to Identify Enhancers and Promoters. In Research in ComputationalMolecular Biology SE-20; Przytycka, T. M., Ed.; Lecture Notes in ComputerScience; Springer International Publishing: 2015; Vol. 9029, pp 205−217.

(52)Liang, M.; Li, Z.; Chen, T.; Zeng, J. Integrative Data Analysis ofMulti-Platform Cancer Data with a Multimodal Deep Learning Approach. IEEE/ACMTrans. Comput. Biol. Bioinf. 2015, 12 (4), 928−937.

(53)Ashburner, M.; Ball, C. A.; Blake, J. A.; Botstein, D.; Butler, H.; Cherry, J.M.; Davis, A. P.; Dolinski, K.; Dwight, S. S.; Eppig, J. T.; Harris, M. A.;Hill, D. P.; Issel-Tarver, L.; Kasarskis, A.; Lewis, S.; Matese, J. C.;Richardson, J. E.; Ringwald, M.; Rubin, G. M.; Sherlock, G. Gene Ontology: Toolfor the Unification of Biology. Nat. Genet. 2000, 25 (1), 25−29.

(54)Papadatos, G.; Davies, M.; Dedman, N.; Chambers, J.; Gaulton, A.; Siddle, J.;Koks, R.; Irvine, S. A.; Pettersson, J.; Goncharoff, N.; Hersey, A.;Overington, J. P. SureChEMBL: A Large-Scale, Chemically Annotated PatentDocument Database. Nucleic Acids Res. 2016, 44, D1220 .

你可能感兴趣的:(深度学习,机器学习)

最新1区9+非肿瘤纯生信，逻辑清晰易懂，机器学习筛选关键基因的纯生信也可以发高水平期刊，抓紧上车！生信小课堂
影响因子：9.186关于非肿瘤生信，我们也解读过很多，主要有以下类型1单个疾病WGCNA+PPI分析筛选hub基因2单个疾病结合免疫浸润，热点基因集，机器学习算法等。3两种相关疾病联合分析，包括非肿瘤结合非肿瘤，非肿瘤结合肿瘤或者非肿瘤结合泛癌分析4基于分型的非肿瘤生信分析5单细胞结合普通转录组生信分析目前非肿瘤生信发文的门槛较低，欢迎大家！研究概述：本研究首先使用R语言在三个基因表达数据集中找到
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
深入TA-Lib：量化技术指标详解
深入TA-Lib：量化技术指标详解本文系统讲解TA-Lib技术指标分析，涵盖基础、数据处理、趋势与动量指标、均量线、布林线等，并结合Python代码与大数据、机器学习实战案例，助力读者掌握量化交易实战技巧。本文系统梳理了TA-Lib技术指标分析的核心内容，包括TA-Lib基础、数据处理、趋势与动量指标、均量线、布林线等关键技术指标分析方法，并结合Python代码示例与大数据、机器学习的融合实战案例
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
#Datawhale组队学习#7月-强化学习Task1 fzyz123 Datawhale组队学习强化学习人工智能 AI
这里是Datawhale组织的组队学习《强化学习入门202507》，Datawhale是一个开源的社区。第一章绪论1.1为什么要学习强化学习？强化学习（ReinforcementLearning,RL）是机器学习中专注于智能体（Agent）如何通过与环境交互学习最优决策策略的分支。与监督学习依赖静态数据集、无监督学习聚焦数据内在结构不同，强化学习的核心在于序贯决策：智能体通过试错探索环境，根据行动
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java 大视界 -- Java 大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）青云交大数据新视界 Java 大视界 java 大数据机器学习金融情绪指数投资决策量化策略情绪分析
Java大视界--Java大数据机器学习模型在金融市场情绪指数构建与投资决策支持中的应用（339）引言：正文：一、Java构建的金融市场情绪数据采集与预处理体系1.1多源异构数据接入引擎1.2数据采集延迟测试报告1.3情绪数据预处理管道二、Java驱动的金融市场情绪指数构建模型2.1多维度情绪指数计算框架2.2情绪指数与投资决策的映射模型三、Java在金融投资决策支持中的实战应用3.1量化私募情绪
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round