基因家族分析——TBtools

本次笔记分享主要参照 Y大宽和生信札记 的推文以及自己实际用过过程中的一些心得编写!

一、大致思路



基因家族分析——TBtools_第1张图片

也可以参见:基因家族分析

二、具体操作

2.1参考序列准备

a.可以以模式植物该基因家族的全部蛋白质序列作为参考(如拟南芥),序列批量下载以拟南芥BZR基因家族为例

进入TAIR官网——download——genes——gene families——gene- families-seq-updata.txt(右键将此链接保存即可获得拟南芥所有基因家族成员的ID号)

基因家族分析——TBtools_第2张图片
基因家族分析——TBtools_第3张图片


基因家族分析——TBtools_第4张图片
基因家族分析——TBtools_第5张图片
基因家族分析——TBtools_第6张图片

复制粘贴BZR任意一个基因(如:At2g35530)到search框,点击search,进入下一个页面,点击get all sequences,在弹出的框里输入目的基因ID号即可获得相应的序列(Dataset:根据自己的需要选择

基因家族分析——TBtools_第7张图片
基因家族分析——TBtools_第8张图片
基因家族分析——TBtools_第9张图片

其他批量获取序列的方法可以参见:如何在NCBI批量下载基因家族序列?

b.隐马尔科夫模型下载(以WRKY基因家族为例)

进入pfam官网——keyword search:WRKY-GO——点击PF03106——Curation&model——Download即可下载相关文件


基因家族分析——TBtools_第10张图片
基因家族分析——TBtools_第11张图片
基因家族分析——TBtools_第12张图片
基因家族分析——TBtools_第13张图片

2.2候选基因的ID的获取

可利用tbtools中的双向blast或者simple HMM search程序获得候选基因的ID。具体操作参考

TBtools基因家族分析详细教程(1)和使用HMM进行基因家族鉴定?无人不能

2.3基于保守结构域进一步筛选,具体参见Batch SMART 最强序列特征[结构域]预测软件

用过SMART  NCBI-CDD  Pfam(在线工具)还有TBtools的batch SMART以后,个人觉得TBtools的TBtools的batch SMART非常好用,强烈推荐。

2.4基因定位染色体

a.使用TBtools绘制

       在第一个框里输入目标物gff3文件,第二个框里输入鉴定出来的目标基因家族的基因成员ID——start即可获得

基因家族分析——TBtools_第14张图片
基因家族分析——TBtools_第15张图片
图片来源于文献:结果图

b.使用在线网站绘制:

网址:http://mg2c.iask.in/mg2c_v2.0/

使用方法参见:基因家族成员在染色体上的位置

染色体长度信息查找方法:

查找玉米各基因位置及染色体长度信息



基因家族分析——TBtools_第16张图片

2.5共线性分析

参见: 任何人!一键完成物种间的共线性分析与可视化和花舞lala:零基础多物种间共线性分析

注意ctl文件的修改(即去掉不想展示的染色体)

如修改以后,TBtools运行报错如下图(文本出现""),只需用记事本打开修改过的ctl 文件——删除 ""——保存即可。

基因家族分析——TBtools_第17张图片
图片来源于网络

本次只分享仅写了对于我自己来说计较容易出错的地方。如有错误的地方,欢迎指正!

TBtools——基因家族分析推荐看:生信札记  和  Y大宽 的推文,讲解非常详细。如果想要对基因家族分析过程中涉及的专业名词有一个大致的理解,推荐看:山东大学或者河南科技大学在中国慕课平台开设的公开课《生物信息学》。

你可能感兴趣的:(基因家族分析——TBtools)