遗传多样性软件 DARwin 6使用

DARwin6 can be directly downloaded from the web site http://darwin.cirad.fr/
应该是没有发表正式文章

貌似可以以进行聚类分析为主,还可Principal Coordinate analysis,引物从原始数据到聚类文件输入文件-计算dissimilarities-得到树文件


建树流程

现在就是明白软件的对于基因型SSR数据的输入格式,软件以.var 格式作为软件的输入格式,其格式具体内容如下:
1 2 3 行都是一些特定的描述,之后为你的数据

var格式

输入文件 .VAR components`具体的数据格式包括:

Single data: 显性数据。单倍体数据,0/1格式数据
Sequence data:序列数据
本实验为带有基因型的SSR数据,即是软件中的
Allelic data: 第一行需表明倍性,第二行位点数和等位基因树

Allelic data.png

最方便得到.var文件就是预先处理自己文件为一下这种文本格式,本次将999作为missing data
DataMatrix

然后import这个文件即可,会输出Var格式的文件作为标准的软件输入格式文件,可选择什么作为missingdata。这种情况会清除DataMatrix里的对于样本的命名,重新按顺序从1开始进行命名,很不友好,尝试自己将DataMatrix更改为var格式,是可以的只要第一列即样本列只是数字即可,后续进行转换吧。重命名后也会很迷惑,还是使用原文件DataMatrix用软件转换成var吧,之后的树形文件中的标签可以直接使用itol进行更改
import

输入文件 .AFT 文件

计算PCA时的输入文件,不关注

中间文件 .DIS 文件

计算得到的dissimilarity matrix 可从其他软件计算得到,应该也可以从var文件中使用DARwin计算得到。

image.png

如何计算dissimilarity matrix

导入生成的标准var文件,由于矩阵是计算根据valid values计算两个样本之间
image.png

,所以应舍弃missing data,如何舍弃missing data,就是在原文件中设置missing data为特定值,其他位点不会出现的数值,比如999,且需要导入文件后设置999为missing data,方便软件识别。导入var文件后,点击set,在出现的页面进行操作。
image.png

而对于missing data如何进行操作,可删除整个样本或整个位点,一般选择第三个选项也是默认。

然后设置bootstraps,点击右上save即可,得到dis文件

结果文件 .ARB

应该时对树形文件的描述,看不懂

根据dis文件可得到聚类的arb文件,但这个文件在其他文件不能识别,可将arb文件export为nexus格式
image.png

然后就可以使用itol等软件进行编辑了。

你可能感兴趣的:(遗传多样性软件 DARwin 6使用)