以果蝇蛋白序列注释转录组数据

本篇的主要内容是:以果蝇蛋白序列数据为参考序列,注释转录组CDS序列。

  1. 下载果蝇蛋白序列

打开Flybase下载果蝇序列(ftp://ftp.flybase.net/genomes/Drosophila_melanogaster/dmel_r6.28_FB2019_03/fasta/)

捕获.PNG

2.创建工作目录,将参考序列放到工作目录

解压缩文件
可以查看文件


捕获2.PNG
  1. 构建本地数据库

参考https://www.jianshu.com/p/775b463a0ec9

  1. 比对数据

命令如下

捕获4.PNG

这一步消耗大量时间。建议长时间等待。

  1. 利用Excel简单注释

将比对结果粘贴到Excel上

捕获5.PNG

将比对的Flybase上的蛋白ID利用flybase重新注释蛋白名称


捕获6.PNG
捕获7.PNG
捕获8.PNG

最右侧就是Flybase中基因名及蛋白编号。可方便查询。

你可能感兴趣的:(以果蝇蛋白序列注释转录组数据)