2020.2.2 R语言|Practice2

2020.2.2 R语言|Practice2

今日学习内容一览

一、Jimmy 生信技能树B站P7-P10(课上积累)

二、R语言初级练习题目三道代码过程

三、Markdown和R Markdown的学习网站收藏

  • R语言初级练习题目三道 代码过程

  1. 根据R包org.Hs.eg.db找到下面ensembl 基因ID 对应的基因名(symbol)
    • 首先得到gene_id和ensemble_id的关系矩阵g2e以及gene_id和symbol的关系矩阵g2s.

      library(org.Hs.eg.db) install.packages("org.Hs.eg.db") library(org.Hs.eg.db) g2s=toTable(org.Hs.egSYMBOL) g2e=toTable(org.Hs.egENSEMBL)

      g2e.png

g2s.png
  • 其次绘制出样本矩阵,并提取小数点前面的数字新增一列

    a=read.table("寻找基因.txt") library(stringr) library("str_split") str_split(a$V1,'[.]') unlist(str_split(a$V1,'[.]')) class(unlist(str_split(a$V1,'[.]'))) a$ensembl_id=str_split(a$V1,'[.]',simplify = T)[,1]

  • 通过共有的ensembl_id建立样本矩阵与g2e的合并矩阵,再通过合并矩阵与g2s共有的gene_id建立第二个合并矩阵,最后通过match函数调整顺序后导出储存即可。
`b=merge(a,g2e,by='ensembl_id',all.x=T)
 d=merge(b,g2s,by='gene_id',all.x=T)
 d=d[order(d$V1,)]
 d=d[match(a$ensembl_id,d$ensembl_id)]
 head(match(a$ensembl_id,d$ensembl_id,))
 d=d[match(a$ensembl_id,d$ensembl_id),]
 write.csv('d,gene find.csv')`
  1. 根据R包hgu133a.db找到下面探针对应的基因名(symbol)
    • 首先使用read.table函数读取样本文件

      rm(list=ls()) options(stringsAsFactors = F) a=read.table('基因ID转换.txt')

    • 其次使用hgu133plus2.db这个R包导出probe_id与symbol的对应矩阵,最终使用merge函数合并原样本矩阵和对应矩阵共有的probe_id即可

      library(hgu133plus2.db) ids=toTable(hgu133plus2SYMBOL) colnames(ids) colnames(a)='probe_id' d=merge(a,ids,by='probe_id')

      d.png
  1. 找到R包CLL内置的数据集的表达矩阵里面的TP53基因的表达量,并且绘制在 progres.-stable分组的boxplot图
    • 读取内置数据库CLL并查看矩阵,同时使用pData查看其分组信息

      rm(list=ls()) library(CLL) data(sCLLex) expr <- exprs(sCLLex) pdata <- pData(sCLLex) head(expr)

  • 使用hgu95av2.db这个R包得到probe_id和symbol的表达关系矩阵,再使用grep函数挑选出其中symbol==TP53的probe_id并建立为一个新矩阵

    library(hgu95av2.db) probe_sym <- toTable(hgu95av2SYMBOL) tp53_probes <- probe_sym[grep("TP53$", probe_sym$symbol),]

  • 使用boxplot函数对三个相应的探针ID绘图

    boxplot(expr['1939_at',]~pdata$Disease) boxplot(expr['1974_s_at',]~pdata$Disease) boxplot(expr['31618_at',]~pdata$Disease)

    1939.png
1974.png
31618.png
  • 最后,使用ggpubr合并图像,调整各项参数,改变检验方法等。

    library(ggpubr) tp53_pub <- cbind(expr['1939_at',], as.data.frame(pdata$Disease)) colnames(tp53_pub) <- c('Expression',"Group") p <- ggboxplot(tp53_pub, y='Expression', x='Group',fill = 'Group', palette = 'aaas' ,add = 'jitter')p + stat_compare_means() p + stat_compare_means(method = 't.test')

    Rplot.png

  • Markdown和R Markdown的学习网站收藏

  1. Markdown基本语法
  2. 进阶版Markdown的使用
  3. R Markdown

你可能感兴趣的:(2020.2.2 R语言|Practice2)