González 2016 神经网络

González-Camacho JM, Crossa J, Pérez-Rodríguez P, et al (2016) Genome-enabled prediction using probabilistic neural network classifiers. BMC Genomics 17:208. doi: 10.1186/s12864-016-2553-1

使用概率神经网络分类器的基因组使能预测


抽象

背景

多层感知器(MLP)和径向基函数神经网络(RBFNN)已被证明是有效的基因组预测。
在这里,我们评估和比较MLP分类器与概率神经网络(PNN)的分类性能,预测使用基因组和表型数据作为输入变量的一个个体在感兴趣的表型类别中成员的概率。
我们使用16个玉米和17个小麦基因组和表型数据集与不同的性状 - 环境组合(样本大小范围从290到300个人)与1.4 k和55 k SNP芯片。
使用基于每个性状的经验分布,基于两个百分位数(15-85%和30-70%)构建的连续性状分类为三个类别(上,中和下)来对分类器进行测试。
我们集中在上和下级的15和30%百分位数选择最好的个体,如通常在基因组选择。
小麦数据集也用于两类。
评估两个分类器的预测准确性的标准是受试者工作特征曲线下面积(AUC)和精确回忆曲线下面积(AUCpr)。
通过优化特定类别的AUC的AUC来估计两个分类器的参数。

结果

提供足够的证据来得出结论,PNN比MLP更为精确分配玉米和小麦品系,为分析复杂性状正确的上部,中部或下部类AUC和AUCpr标准。
连续性状分为两类和三类的小麦数据集的结果表明,当将个体分为上和下(15或30%)类别时,具有三类的PNN的性能高于具有两类的性能。

结论

的PNN分类器使用AUC和AUCpr选择特定类的个体,当跑赢MLP分类在所有33(玉米和小麦)的数据集。
使用具有高斯径向基函数的PNN似乎在用于鉴定最佳个体的基因组选择中是有前景的
将连续特征分类为三个类别通常比使用两个类别时提供更好的分类,因为当类别平衡时分类精度提高。

你可能感兴趣的:(González 2016 神经网络)