TBtools基因家族分析详细教程(3)基因家族成员的进化分析2

  • 基因-共线性的定义与常见算法原理
  • 物种内的共线性分析
    文件准备(物种比对到自身的.blast文件,物种基因信息文件.gff文件),运行MCScanX,输出collinear和tandem文件
  • 基因家族成员的来源分析(如何复制得到)
  • 不同物种之间的共线性分析
  • 共线性分析结果可视化

1 共线性分析:与同线性的联系

用途:

  • 识别直系同源gene
  • 蛋白编码基因注释
  • 发现进化事件

2物种内的共线性分析

3基因家族来源分析

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第1张图片

4不同物种之间的共线性分析

共线性分析

数据文件下载genome.fa,gff3,protein.fa

2数据文件格式转换(TBtools)

3共线性分析

4解读文本输出结果

-----开始----

1 下载菠萝,水稻,拟南芥,香蕉的基因组和注释文件

  • 通过TBtools由上述文件得到CDS和protein文件(前面已讲)
  • 把菠萝蛋白比对到自身(用时相对较长)得到blast结果文件
TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第2张图片

2 获得所有基因的位置信息

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第3张图片

如下


TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第4张图片

下面可以把刚才得到的blast结果文件简化,也可以不做,做的话,下面

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第5张图片

3 菠萝自身的比对的结果如下

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第6张图片
image.png

可视化

先得到串联重复序列的link文件
上面得到的.tandem文件用excel打开并进行分列,另存为txt文件

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第7张图片
image.png

结果
TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第8张图片
GRAS基因家族在染色体上的位置并显示串联重复序列

可以看到有串联重复序列
再把pineapple2pineapple.blast.tab.collinearity文件转换为link文件
TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第9张图片
获得基因间关系的link文件

结果如下
TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第10张图片
image.png

可以看出和视频中不一样,因为我和作者用的不是同一个基因家族
对于比对到自身的(单个基因组)的还可以做其他的
TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第11张图片
设置

结果
TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第12张图片

也可以选择性展示


TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第13张图片
circle gene view.300dpi.jpg

4不同物种之间的共线性分析

分析菠萝与水稻之间的共线性区块

  • 需要菠萝的所有蛋白序列比对到水稻的所有蛋白序列
  • 两个基因组的所有基因的位置关系

按前述步骤分别得到水稻的CDS和protein,方法不再赘述
这里需要说明的是,视频中CDS的总序列数为66338,我下载了几个水稻品种包括reference geonome均不是,就用以下信息吧


TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第14张图片
image.png

取最长的可变剪切本,以使下一步分析更加准确


TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第15张图片

接下来,这一步看具体请看需要不需要做
TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第16张图片

################################

下面开始两个基因组比较

开始菠萝和水稻比对

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第17张图片
image.png

然后水稻比对菠萝

都比对完之后,开始merge两个比对后的blast文件


TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第18张图片
image.png

同样gff文件也要merge

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第19张图片
image.png

然后


TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第20张图片

得到pineapple_rice.collinearity文件
然后


TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第21张图片

mutiple synteney plotter

TBtools基因家族分析详细教程(3)基因家族成员的进化分析2_第22张图片
mutiple synteney plotter

新建一个multiple文件夹

接下来在做菠萝和香蕉的比对
步骤按上面
提取cds,pro(考虑可变剪切,可以选择最大长度可变剪切序列),然后互相比对得到blast结果
上面个gff和blast结果分别merge,就可以比对了

你可能感兴趣的:(TBtools基因家族分析详细教程(3)基因家族成员的进化分析2)