SMC++计算历史有效群体含量(自用)

1转为SMC++输入格式

首先对VCF文件进行bgzip压缩和建tbi索引

smc++ vcf2smc test.vcf.gz CHR1.smc.gz CHR1 POP1:sample1,sample2
#CHR1取决于VCF文件里contig是啥,且需要和表头染色体长度一栏一致
#POP1是自定义的群体名称,会在最后一步的画图中体现,也可以在输出的csv文件中更改
#sample1是vcf文件里的样品名
#官网说最多支持两个亚群同时计算,不过我没试过

2分析

普通版
smc++ estimate -o analysis 1.26e-08 *.smc.gz
#仅需修改“1.26e-08”,即突变率
进阶版
smc++ estimate --spline cubic --knots 15 --timepoints 1000 1000000  --cores 20  -o analysis 1.26e-08 *.smc.gz
#–spline 线条类型 cubic为平滑曲线吧
#–knots 节点,就是绘图曲线的点数
#–timepoints 时间范围,单位为多少代,如1000 1000000 为1000代到1000000代
#--cores 计算核数
分析这一步比较吃cpu

3画图

普通版
smc++ plot plot.pdf *.final.json
#输出PDF,简单直接但是不好看
进阶版
smc++ plot plot.pdf *.final.json -g 6 --ylim 0 100000000 -c
#-c --csv 输出绘图文件,利用该文件在R中绘图(也许可以画折线图)
#-g 代数,如人为25,鼠为1 ,牛为6或5
#–ylim Y轴范围
#–xlim X轴范围

部分内容参考官网
https://github.com/popgenmethods/smcpp
生信菜鸟1号
https://blog.csdn.net/weixin_45694863/article/details/126801831

你可能感兴趣的:(SMC++计算历史有效群体含量(自用))