学习笔记| RNA-seq之biomart基因注释

biomart是一个R package,能够完成基因注释的工作。在我得到差异表达基因之后,可以直接使用该包直接注释。

网络上许多代码已经过时,特此更新用法。

1 安装

# Windows10,  R 4.0.5
install.packages("BiocManager")
BiocManager::install("biomaRt")

2 pipeline

首先要选择数据库合dataset
先强迫自己看文档学习,help("useMart")看文档

useMart()文档

意思是自己输入biomart database的名字,需要选择dataset,host选项填上需要连接的网站,OK尝试一下

# 用连接ensembl数据库作为例子
library("biomaRt")
mart <- useMart(biomart="ensembl")

#查看有什么dataset可以选择
listDatasets(mart)

#选择一个人的基因注释,加上host连接,不加host需要选择国外mirror
mart <- useMart(biomart="ensembl",dataset="hsapiens_gene_ensembl",host="www.ensembl.org")

接下来就可以做基因注释了

# getBM 获取注释
hg_symbols<-getBM(attributes=c('ensembl_gene_id','hgnc_symbol',"chromosome_name", "start_position","end_position", "band"), filters= 'ensembl_gene_id', values = my_ensembl_gene_id, mart)

NOTE

  1. attributers()里面的值为我们输出的ID类型
  2. filters()里面的值为我们输入的ID类型
  3. gene= 这个值就是我们要输入的数据
  4. mart= 这个值是我们所选定的数据库的基因组
  5. listFilters(mart)用于查看可用于输入的数据
  6. listAttributes(mart)用于查看可选的输出数据

3 Reference

bioMart进行基因id的转换 - sryjm - 博客园 (cnblogs.com)

你可能感兴趣的:(学习笔记| RNA-seq之biomart基因注释)