BIB论文介绍(Briefings in Bioinformatics, Volume 22, Issue 6, November 2021)

一、StackIL6: a stacking ensemble model for improving the prediction of IL-6 inducing peptides(StackIL6:一种改进IL-6诱导肽预测的堆叠集成模型)

Received: 15 January 2021
Revision received: 30 March 2021
Accepted: 10 April 2021
Published: 08 May 2021

要点
1、提出了一种新的基于堆叠策略的集成模型StackIL6,用于准确和稳定地识别IL-6诱导肽。
2、StackIL6集成了12个不同的特征描述符(来自三组主要的特征描述符,包括基于成分的特征、基于成分转换分布的特征和基于物理化学性质的特征)和5种不同的流行机器学习算法训练的一些基线模型。
3、大量的基准测试实验表明,StackIL6的性能明显优于现有的方法(IL6PRED),通过训练和独立数据集评估,StackIL6明显优于其组成的基线模型,突出了其出色的识别能力和泛化能力。

论文整体流程图:

二、NeuroPred-FRL: an interpretable prediction model for identifying neuropeptide using feature representation learning(一种利用特征表征学习识别神经肽的可解释预测模型)

Received: 07 February 2021
Revision received: 23 March 2021
Accepted: 09 April 2021
Published: 11 May 2021

要点
1、NeuroPred-FRL采用特征表示学习算法,从给定的肽序列中准确预测NPs。
2、NeuroPred-FRL是元机器学习分类器,它从6个分类器11种编码方案生成的66个概率特征得分中学习最优鉴别能力。
3、大量的基准测试实验表明,NeuroPred-FRL在训练和独立数据集上都明显优于现有方法,突出了其优越的泛化能力。
4、利用鲁棒SHAP算法揭示了NeuroPred-FRL的一些预测机制。

论文整体流程图:

数据集构建、特征提取、各种ML分类器的探索、基线模型构建和最终的元预测器。
位置特异性特征、基于物理化学的特征、基本局部排列BLAST特征和基于氨基酸频率的特征。

三、NSL2CD: identifying potential circRNA–disease associations based on network embedding and subspace learning(NSL2CD:基于网络嵌入和子空间学习识别circRNA与疾病的潜在关联)

Received: 14 February 2021
Revision received: 29 March 2021
Accepted: 14 April 2021
Published: 05 May 2021

要点:
1、circRNA作为一种有前途的癌症生物标志物,在多种人类复杂疾病中发挥重要作用。
2、积累的可用生物医学数据为用硅方法破译环状RNA的分子行为创造了一个前所未有的机会。
3、提出一种基于网络嵌入的自适应子空间学习方法来发现环状RNA与疾病之间的关系。
4、实验结果表明,NSL2CD在预测circRNA与疾病的潜在关联方面具有优越的性能。

论文整体流程图:

计算疾病对和circRNA对的相似性来构建网络,选择DeepWalk来学习基于已知关联网络的circRNA的潜在特征表示。

四、Integrative machine learning framework for the identification of cell-specific enhancers from the human genome(从人类基因组识别细胞特异性增强子的综合机器学习框架)

Received: 16 March 2021
Revision received: 08 June 2021
Accepted: 14 June 2021
Published: 05 July 2021

要点:
1、提出了一个称为Enhancer-IF的整合ML框架,并将其作为一个用户友好的web服务器,用于从人类基因组中准确识别细胞特异性增强子。
2、Enhancer-IF基于5种经典的ML算法训练了一些具有异构特征编码的基线模型,并使用集成方法对后续的元模型进行集成,以实现最终预测。
3、大量的基准测试实验表明,Enhancer-IF在训练和独立数据集上都优于其组成的基线模型,从而突出了其优秀的泛化能力。

论文整体流程图:

K间隔核酸对的组成(CKSNAP)
伪三核苷酸组成(PseTNC)
伪二核苷酸组成(PseDNC)
二核苷酸的物理化学性质(DPCP)
三核苷酸的物理化学性质(TPCP)

五、Porpoise: a new approach for accurate prediction of RNA pseudouridine sites(一种精确预测RNA假尿苷位点的新方法)

Received: 14 April 2021
Revision received: 19 May 2021
Accepted: 08 June 2021
Published: 05 July 2021

要点:
1、开发了一种新的堆叠方法,称为Porpoise,用于从RNA序列信息改进和健壮地预测RNA伪嘌呤位点。
2、对18种特征编码方案和9种常用机器学习算法的性能进行了全面的基准测试,用于预测RNA伪尿嘧啶位点,并为每个物种特定模型确定最佳的碱基分类器。
3、广泛的基准测试和独立测试表明,与几个最先进的预测器相比,Porpoise实现了优越的预测性能。
4、实现了Porpoise的在线网络服务器。

论文整体流程图:

六、HelPredictor models single-cell transcriptome to predict human embryo lineage allocation(预测人类胚胎谱系分配的单细胞转录组)

Received: 05 March 2021
Revision received: 15 April 2021
Accepted: 29 April 2021
Published: 26 May 2021

要点:
1、综合比较和评价了采用函数富集的三种特征选择方法(F-score、PCA和CV2)和四种分类算法(SVM、RF、LR和GNB)。
2、与PCA和CV2相比,F-score方法可以发现单细胞转录组中观察到的高变量和发育相关因素。
3、提出了一个机器学习平台,HelPredictor,用于预测人类着床前胚胎谱系,并提供位于PCA图中的相对基因表达水平。
4、K-mean聚类结果表明,根据胚胎谱系特异性和阶段特异性基因表达模式,具有代表性的动态基因表达模式提供了潜在的生物标志物。

论文整体流程图:

最终快速有效地揭示潜在的谱系特异性和阶段特异性生物标记物。

你可能感兴趣的:(机器学习,深度学习,人工智能)