微生物多样性(扩增子或16S rDNA测序)-数据处理与统计方法描述

一、数据的处理与统计

Miseq测序获得的是双端序列数据,根据两端序列的互补区域,进行拼接获得单条完整序列,同时对序列的质量和拼接的效果进行质控过滤,根据序列首尾两端index序列和引物序列区分序列来自于哪一个样品,并获得高质量序列。

通过统计汇总表格,可以体现本批次样品数据的相关统计,包括片段的长度、原始数据序列数量、 总碱基数、每例样品的测序序列数等。

二、数据处理部分在论文中的描述

a)关于数据总量的描述

      例如:All rawdata was merged based on overlap, and quality filtered. XX,XXXX reads have been get from XXX samples. The average length of  the reads was XXX bp. ……

b) 关于每例样品的平均数据量的描述

      例如:XXX samples were sequencing by Illumina Miseq platform, X,XXX±XXX high quality reads per sample was get for bioinformation analysis. ……

注意事项及说明:

关于表示每例样品的测序量可以采用Mean ± SD 方式进行表示,但是有时候需要借助Excel进行统计每例样品测序数据,计算平均值和SD值。

你可能感兴趣的:(微生物多样性(扩增子或16S rDNA测序)-数据处理与统计方法描述)