2021-09-22 sequoia()学习记录

sequoia(

GenoM=NULL,

  LifeHistData=NULL,

  SeqList=NULL,

  Module="ped",

  MaxSibIter=42,

  Err=1e-04,

  ErrFlavour="version2.0",

  MaxMismatch=NA,

  Tfilter=-2,

  Tassign=0.5,

  MaxSibshipSize=100,

  DummyPrefix=c("F","M"),

  Complex="full",

  Herm="no",

  UseAge="yes",

  args.AP=list(Flatten=NULL, Smooth=TRUE),

  FindMaybeRel=FALSE,

  CalcLLR=TRUE,

  quiet=FALSE,

  Plot=NULL

)

GenoMtxt格式,行是个体,列是SNP,0,1,2,-9(缺失值),行名为个体ID,无列名

LifeHistDatatxt格式,三列,ID(不超过30个字符)sex(1 = female, 2 = male, 3

= unknown, 4 = hermaphrodite)Birthyear(正整数,NA或负整数表缺失值),无列名,但顺序很重要

SeqList前一次运行的结果

Modulepre(只检查输入)dup(还检查重复基因型)par(还检查亲子分配)ped(执行完整的谱系重建,包括同胞聚类和祖父母分配)

Err估计的基因分型错误率,作为单个数字或 3x3 矩阵。 错误率在 SNP 中被假定为常数,而缺失被假定为随机的

ErrFlavour:当Err是一个数字时,输入Err,得到3x3矩阵的函数,如果Err本身是函数那就不用了,根据包的版本输入默认值,可以是'version2.0', 'version1.3', or'version1.1'

Tfilter:似然比的阈值,通常是个负数,数值越小孤儿的数量就越少,但是耗时也会变长

MaxSibshipSize:单个个体最大后代数量

DummyPrefix: 母本父本的字符

Complex: 育种系统的复杂性。“full”(默认)、“simp”(简化,没有明确考虑近交关系)、“mono”(一夫一妻制)。

Herm: 雌雄同体的情况,“no”“A”区别父母本(当有个体sex=4s时默认为此选项),“B”不区别

Useage:“yes”(默认),“no”或“extra”(根据先验年龄额外再算几轮,可能会增加分配,但会增加错误分配的风险)仅在完全重建期间使用。

args.AP:用于调用MakeAgePrior()函数

FindMaybeRel:弃用,Ture或False,在谱系重建后识别未指定的可能亲属对,在大型数据集中可能很耗时,可用GetMaybeRel单独计算

CalcLLR: Ture或False,用于计算所指派的父母的似然比,耗时,可以用CalcOHLLR单独计算

Quiet:抑制消息TRUE/FALSE/"verbose".

Plot:展示图表,当quiet为TRUE时plot为FALSE,反之quiet为FALSE或“verbose”时plot为TRUE。如果出现“figure margins too large”错误,请放大绘图区域(用鼠标拖动)。 如果出现“invalid graphics state”,可以通过使用 dev.off() 清除绘图区域。

# === EXAMPLE 2: real data  ===

# ideally, select 400-700 SNPs: high MAF& low LD

# save in 0/1/2/NA format (PLINK's--recodeA)

GenoM <- GenoConvert(InFile = "inputfile_for_sequoia.raw",

                     InFormat ="raw")  # can also do Colonyformat

SNPSTATS <- SnpStats(GenoM)

# perhaps after some data-cleaning:

write.table(GenoM,file="MyGenoData.txt", row.names=T, col.names=F)


# later:

GenoM <- as.matrix(read.table("MyGenoData.txt",row.names=1, header=F))

LHdata <-read.table("LifeHistoryData.txt", header=T) # ID-Sex-birthyear

SeqOUT <- sequoia(GenoM, LHdata,Err=0.005)

SummarySeq(SeqOUT)


writeSeq(SeqOUT,folder="sequoia_output")  #several text files

你可能感兴趣的:(2021-09-22 sequoia()学习记录)