TargetNet: Functional microRNA Target Prediction with Deep Neural Networks

出发点:

MicroRNAs (miRNAs)通过与信使RNA(mRNA)的靶位点结合,在基因表达调控中发挥关键作用。因此识别miRNA的功能靶点至关重要,但是这个预测是一个巨大的挑战。以前的计算算法存在很大局限性,使用保守的候选目标位点(CTS)选择标准,主要侧重规范位点类型,依赖费力且耗时的人工特征提取,没有充分利用miRNA-CTS相互作用的基础信息。

结果

本文章,作者提出了一种新的基于深度学习的功能性miRNA目标预测算法TargetNet。
TargeNet有三个关键组成部分:
(1)放宽CTS选择标准,适应种子区域的不规则性;
(2)融合扩展种子区域对齐的新型miRNA-CTS序列编码方案;
(3)基于深度残差网络的预测模型。
该模型使用miRNA-CTS对数据集进行训练,并使用miRNA-mRNA对数据集进行评估。TargetNet改进了先前用于功能miRNA目标分类的最先进算法。此外也显示了在区分高功能miRNA靶标方向的巨大潜力。

代码

链接:Link

背景

1:
基因表达调控是生物过程的重要调控部分。不同基因的表达水平受多种机制控制。miRNA在60%以上的人类蛋白编码基因转录后调控中发挥关键作用。miRNA是一种小的非编码RNA,可以与mRNA的靶标位点结合。这种结合导致mRNA的有效翻译受到抑制,从而下调靶标基因的表达。

2:
大部分的miRNA靶点预测算法都按以下三个步骤出发:
(a)候选靶标位点的选择(CTSs)
给定miRNA-mRNA对,算法使用ige滑动窗口来识别符合特定标准的mRNA的 3 ’ UTRs中的CTSs。
(b)使用预测模型来识别每个miRNA-CTS对 是功能性的还是非功能性的。
© 对预测进行最后处理
一般而言,如果至少有一个miRNA-CTS对被预测为功能性的,那么一个miRNA-mRNA对就会被预测为功能性的。

方法

TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第1张图片

TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第2张图片
大致步骤分为以下几点:
(1)候选靶标位点的选择
(2)输入编码
(3)网络模型训练预测

(1)位点选择:

在这里插入图片描述
miRNA和mRNA的描述如上
对于miRNA而言,其长度是不定的,但平均长度为22个核苷酸。
而对于mRNA,则将其通过滑动窗口,其滑动步长为1,将其分成长度为40个核苷酸的候选位点。

然而对于TargetNet网络模型,在对候选位点CTS的选择标准上采用了类似miRAW中使用的宽松选择方法。

首先将miRNA序列分为以下几个子序列:
TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第3张图片
ES和DS分别表示miRNA序列的扩展种子区域和下游核苷酸。

同样,将候选位点CTS也划分成以下子序列:
TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第4张图片
值得注意的是,对于CTS序列而言,其描述是3撇端到5撇端的。

划分完之后,这时对扩展的种子区域进行序列对比:
在这里插入图片描述
通过Biopython两两配对软件包,找到他们的最佳全局匹配,如果对其分数大于等于6,则满足放宽的CTS选择标准。

(2)输入编码

TargetNet与其他基于深度学习的方法最不同的部分就是对miRNA-CTS对的编码方式。
相比之下,以前的方法,都是使用Onehot对序列进行编码,而TargetNet网络则是加入了关于miRNA-CTS对扩展种子区域如何对齐和形式绑定的额外信息。

具体而言即将扩展区域的序列替换成了对比结果,即:
TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第5张图片
由于对齐结果可能存在差异,所以EmiRNA和EiCTS的长度都是可变的。

当然最后对EmiRNA和EiCTS使用零填充,为后面级联做准备
TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第6张图片
使用零填充(1)对齐扩展种子区域的位置,(2)使Ei成为一个10 × 50大小的矢量。提出的输入编码的优点是,它使以下ResNet更容易充分利用miRNA-CTS相互作用的信息。现在,输入向量不仅能够表示miRNA-CTS序列,还能够表示在其扩展的种子区域内如何形成配对、不匹配或缺口。

(网络构建及训练)

网络构建上使用了两层残差网络。
而对于miRNA-mRNA的最终判断则是,在模型之后做的一个后期处理,即是否为功能性的这么个预测概率用以下公式表明:
在这里插入图片描述

结果

TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第7张图片
TargetNet: Functional microRNA Target Prediction with Deep Neural Networks_第8张图片

你可能感兴趣的:(算法,机器学习,深度学习)