遗传多样性软件 Clumpp 使用说明

运行structure时同一个k,会有多个run,使用clumpp软件可分析多个run,得到一个结果。配置输入文件后,在win下或命令行运行即可得到输出文件。

4 Input files

需要读取参数文件,及qmatrices(structure harvest可直接获得每个k值的对应文件)

4.1 paramfile

参数文件,参数文件参数可被命令行命令参数代替。
软件一次运行只能对个体或种群进行计算,选定DATETYTE


paranfile

4.2 indfile

CLUMPP的个体和群体输入文件不同,
在 paramfile 表明输入文件 及输入文件类型(Datatype,设置DATATYPE = 0,)具体含义,从注释中可以看明白。每个k的run中的个体顺序应一致。Clumpp indfile与distruct indfile_indivq一样。


indfile

4.3 popfile

参数文件中需设置DATATYPE=1。文件内容含义,与idstruct中Popfile一致。


popfile

4.4 permutation file

不同run的不同排列也会造成结果的差异。使用Greedy or the LargeKGreedy 时,需指定permutation file。
permutation file

5 Usage options

大写参数 后一个多个空格,后参数值。miscfile为此次运行后的output的使用参数

5.1 Main parameters

DATATYPE(int) : 0 为 individual q-matrices, 1为population q-matrices
INDFILE(string):individual q-matrices 文件名字,需要 DATATYPE=0
POPFILE(string):population q-matrices文件名字,需要 DATATYPE=1
OUTFILE (string):输出文件。所有runs的平均 q-matrices
MISCFILE(string): 输出此次运行CLUMPP的参数
M(int): 需要使用的比对算法,
W(boolean): 针对POPFILE的参数,
K (int) :Number of clusters, 使用输入文件的K
DATATYPE为1时填写种群数量(K值)。

5.2 Additional parameters for the Greedy and LargeKGreedy algorithms

GREEDY OPTION (int):需要M = 2 or M = 3。为1-测试所有可能的order, 为2-测试随机次数的order, 为3-使用自己预设的order。
REPEATS (int) : GREEDY OPTION 为2时, REPEATS为随机次数GREEDY OPTION 为3时,REPEATS为自己预设的order次数。GREEDY OPTION 为1时,REPEATS 无意义
PERMUTATIONFILE (string):4.4 permutationfle 文件,需要 M = 2 or M = 3 together with GREEDY OPTION = 3。

5.3 Optional outputs

PRINT PERMUTED DATA (int) :0 不打印输入的矩阵,1 打印输入文件的矩阵到一个文件,2 打印输入文件中不同矩阵到不同文件。
PERMUTED DATAFILE (string): 没看懂
PRINT EVERY PERM (boolean):为1时,打印每次测试的run order。为0时,不打印这些信息
EVERY PERMFILE (string):打印每次测试的run order到某个文件
,需要PRINT EVERY PERM = 1。
PRINT RANDOM INPUTORDER (boolean):为1时,打印所有随机run order。为0时,不打印。 需要 GREEDY ORDER = 2
RANDOM INPUTORDERFILE (string):随机order打印到某个文件,需要GREEDY ORDER = 2 and PRINT RANDOM INPUTORDER = 1。

5.4 Advanced options

OVERRIDE WARNINGS (boolean): 为0时,打印warnings 到屏幕。为1时,不打印warnings。
ORDER BY RUN (integer):没看懂。

6 Output files

out file and misc file是每次运行都会生成的结果文件。0

6.1 outfile

软件输出的文件,也是distruct的输入文件

6.2 miscfile

运行软件使用的参数,输出到文件

6.3 permuted data file

使用K=5 测试,需要很久很久,完全不知道是停止运行还是正在运行,可能需要更改M参数,选择其他方法。需要更改MGREEDY_OPTION,及 REPEATS参数。选择FullSearch方法会产生很大的REPEATS 执行。

你可能感兴趣的:(遗传多样性软件 Clumpp 使用说明)