Day11-生信人的20个R语言习题第5题-2019-06-20

5.理解toTable的用法

原是描述:理解 head(toTable(hgu95av2SYMBOL)) 的用法,找到 TP53 基因对应的探针ID。

#先看一下hgu95av2SYMBOL是什么
?hgu95av2SYMBOL
# hgu95av2SYMBOL is an R object that provides mappings between manufacturer identifiers and gene abbreviations.
大致意思就是说,hgu95av2SYMBOL是一个R对象,它描述厂家的标记符(identifiers)与基因缩写之间的映射关系。
###### 再看一下toTable的用法
?toTable
These methods are part of the Bimap interface (see ?Bimap for a quick overview of the Bimap objects and their interface).
#大致意思是说,toTable是一种能够以数据框的形式来操作一个Bimap对象的方法,也就是把Bimap对象转换为一个数据框,这些方法是Bimap interface方法的一部分。Bimap指的是一种映射关系,例如探针的编号与基因名称之间的映射,如下所示:
summary(hgu95av2SYMBOL)
# 查看hgu95av2SYMBOL大致信息
# SYMBOL map for chip hgu95av2 (object of class "ProbeAnnDbBimap")
# |
#   | Lkeyname: probe_id (Ltablename: probes)
# |    Lkeys: "1000_at", "1001_at", ... (total=12625/mapped=11471)
# |
#   | Rkeyname: symbol (Rtablename: gene_info)
# |    Rkeys: "A1BG", "A2M", ... (total=59682/mapped=8595)
# |
#   | direction: L --> R
gene_id <- toTable(hgu95av2SYMBOL)
head(gene_id) #这是一个数据框
# probe_id  symbol
# 1   1000_at   MAPK3
# 2   1001_at    TIE1
# 3 1002_f_at CYP2C19
# 4 1003_s_at   CXCR5
# 5   1004_at   CXCR5
# 6   1005_at   DUSP1
str(gene_id)
# 'data.frame': 11471 obs. of  2 variables:
#   $ probe_id: chr  "1000_at" "1001_at" "1002_f_at" "1003_s_at" ...
# $ symbol  : chr  "MAPK3" "TIE1" "CYP2C19" "CXCR5" ...
filter(gene_id,symbol=="TP53")
# 找到 TP53 基因对应的探针ID
# probe_id symbol
# 1   1939_at   TP53
# 2 1974_s_at   TP53
# 3  31618_at   TP53
library(dplyr)
filter(gene_id,symbol=="TP53")
# 找到 TP53 基因对应的探针ID
# probe_id symbol
# 1   1939_at   TP53
# 2 1974_s_at   TP53
# 3  31618_at   TP53

你可能感兴趣的:(Day11-生信人的20个R语言习题第5题-2019-06-20)