遗传多样性软件 Powermarker 使用说明

powermarker
Liu, K. and S.V. Muse, PowerMarker: an integrated analysis environment for genetic marker analysis. Bioinformatics, 2005. 21(9): p. 2128-2129.
下载地址

如果遇到|

Registered JIT Debugger is not available的问题,尝试卸载已有 .NET Framework 并选择安装新的 .NET Framework,安装.NET Framework是确保当前电脑时间为当前时间。关于.NET Framework的版本可选择1.1。打开下载的powermarker安装软件,要是提示没有安装.NET Framework,会让你选择是否跳转到当前需要的.NET Framework版本网页,安装.NET Framework后再安装 powermarker, powermarker的使用需要更改电脑时间为以前 如2011年。

|

软件已许久没有更新,使用时需要更改电脑时间,才可以使用

案例
跟着案例操作,顺利得到个体聚类结果,看来还是得学一下ggtree

本次使用主要 是用来计算PIC 及建树
以下内容记录自手册

Chapter 2: Tutorial

2.1 Creating a project

分析前需要先建立project

2.2: Importing a dataset

(1)导入数据,从文件或剪切板,需要选择表头中名称的类型,即样本名 种群名与loci 是属于不同类型标签,样本和种群名属于 categorical type, loci属于
Marker type, 接着指定数据文件中缺失数据,比如确实等位基因为0 , 就在填写Missing allele 后填写0, 软件会将0识别为缺失数据。
导入powermarker的文本格式的格式如下,第一列,第二列为样本id及种群名称,需要在软件内选择第一列第二列属于什么内容。

软件下载后Sample文件夹里有软件的样例数据可参考
image.png

image.png

其他格式

(2)对导入的数据进行一定的编辑
需要选择数据中的表头类型,选择数据中sample. pop 为categorical类型,点击column下的表头然后点击下方的蓝色类型(Marker等)即可修改数据中表头类型。


txt数据导入后

(3) 其他参数

DataType默认选择第三个, unknown。Missing Values 填写数据中缺失数据的表示 ,这里我的数据中,0代表确实数据,数据读入后,会以?/?表示缺失数据
读入的结果

参数

数据导入成功后就可以进行分析

2.3: Choosing a subset from the dataset

可计算Missing proportion,并根据值筛选子集

2.4: Producing a table of summary statistics

,CERVUS软件也可以计算PIC, Powermarker 也可计算 如下其他参数

image.png

点击Analysis-Summary Statistics-General中选择需要计算的原始数据,即可得到包括PIC等参数的表格。
发现 Genalex与Powermarker的相同参数结果相同,Genalex中的Ho是 Powermarker 中的Heterozygosity, Genalex中的He 是Powermarker 中的GeneDiversity

2.4 做聚类

首先是对数据计算频率,然后计算距离,然后建树,如下图

image.png

(1)计算频率,可选择Lever,就是之后对群体或样本进行聚类。并选择数据,点击summit
计算frequency

(2) 计算距离,需选择Methods, 并选择数据,点击summit!
DIstance

(3)选择建树方法,并选择数据,点击summit
建树

(4) Bootstrap
结果是一个tree list, 用 Phylip,可得到consensus tree
“”The output is a list of trees that can be summarized to obtain a consensus
tree by the program “consensus” in Phylip package (Felsenstein 1993).“”

你可能感兴趣的:(遗传多样性软件 Powermarker 使用说明)