国科大课程:基因组信息系统与实践笔记(19/4/23)——ligc

tip:昆虫,水生动物基因组杂合度较高。

植物基因组组装的挑战


gene family,tandem replicates,polyploid,genome size,high heterozygosity,clustered located repeat,high repeat content

Genome survey

图片发自App

kmer评估基因组大小和基因组杂合度

M=N*(L-K+1)/L

M:kmer peak;N:real sequencing depth;L:read length;K:kmer length

图片发自App

杂合度和重复度的评估

基因组注释之后将外源污染序列识别并去除(kmer低频区):比对

重复序列的特征:真核/原核


图片发自App

2019/4/30

基因组学分析与实践

基因组组装

resequencing genome

de novo assembly

de bruijin(k-mer)

图片发自App

动物基因组intron普遍偏长,可以采用unigene

基因组拼接评估:

图片发自App

depth VS coverage

基因结构及功能注释

蛋白,rna,软件预测三种都有的最准确

图片发自App







你可能感兴趣的:(国科大课程:基因组信息系统与实践笔记(19/4/23)——ligc)