教你分析后缀为gpr的芯片数据

欢迎关注”生信修炼手册”!

分析芯片数据,我们首先需要确定芯片平台。不同的芯片平台技术不同,既有单通道,也有双通道,而且输出文件的格式也不同。

目前常见的平台有以下几种

1.g enepix

2. illumina beadchip

3. Agilent

4. Affymetrix

对于前三种平台而言,我们都可以通过limma包来进行处理, 本文主要介绍genepix的芯片处理。

示例文件如下

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE123273

可以看到原始数据是后缀为gpr的文件

教你分析后缀为gpr的芯片数据_第1张图片

gpr文件格式的解释可以查看如下链接

https://support.moleculardevices.com/s/article/GenePix-File-Formats#gpr

对于该种类型的文件,其读取的代码如下

> files <- c("GSM3498849_1.gpr", "GSM3498850_2.gpr", "GSM3498851_3.gpr")
> RG <- read.maimages(files, source="genepix")
Read GSM3498849_1.gpr
Read GSM3498850_2.gpr
Read GSM3498851_3.gpr

读取之后,就可以按照如下步骤进行分析

1. 背景校正

2. 归一化

3. 差异分析

详细代码示例如下

> RG <- backgroundCorrect(RG, method="normexp")
Array 1 corrected
Array 2 corrected
Array 3 corrected
Array 1 corrected
Array 2 corrected
Array 3 corrected
> MA <- normalizeWithinArrays(RG)
# design参数设置样本分组
> fit <- lmFit(MA, design=c(-1,1,1))
> fit <- eBayes(fit)
> topTable(fit)
      Block Row Column     ID            Name       logFC  AveExpr         t
5885     14   8     11 168760 hsa-miR-4749-5p  0.01300731 5.741990  4.761650
12659    29  16      9 147276 hsa-miR-3616-3p  0.01229513 5.799412  4.412873
15751    36  16     21 148139                  0.01121546 7.842754  4.306584
11168    26   8     14 168593 hsa-miR-4726-3p -0.01151703 5.808141 -4.305364
12498    29   9      2 168858 hsa-miR-4638-3p  0.01260462 5.786310  4.302333
6889     16  14      3 146021                  0.01419926 6.284739  4.230745
3154      8   4      8 146104                 -0.01090889 5.837304 -4.211572
12422    29   5     14 147887    hsa-miR-3147 -0.01091577 5.800989 -4.192148
7157     17   6      7 148290 hsa-miR-3616-5p  0.01202037 5.825296  4.114572
9789     23   5     21 147799 hsa-miR-3156-5p  0.01090652 6.227845  4.113549
          P.Value adj.P.Val         B
5885  0.009187984 0.8836195 -3.202626
12659 0.011921747 0.8836195 -3.516772
15751 0.012945237 0.8836195 -3.615882
11168 0.012957595 0.8836195 -3.617029
12498 0.012988347 0.8836195 -3.619880
6889  0.013741047 0.8836195 -3.687594
3154  0.013951536 0.8836195 -3.705856
12422 0.014168777 0.8836195 -3.724413
7157  0.015078212 0.8836195 -3.799079
9789  0.015090679 0.8836195 -3.800071

·end·

—如果喜欢,快分享给你的朋友们吧—

原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!

本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。

  更多精彩

  • KEGG数据库,除了pathway你还知道哪些

  • 全网最完整的circos中文教程

  • DNA甲基化数据分析专题

  • 突变检测数据分析专题

  • mRNA数据分析专题

  • lncRNA数据分析专题

  • circRNA数据分析专题

  • miRNA数据分析专题

  • 单细胞转录组数据分析专题

  • chip_seq数据分析专题

  • Hi-C数据分析专题

  • HLA数据分析专题

  • TCGA肿瘤数据分析专题

  • 基因组组装数据分析专题

  • CNV数据分析专题

  • GWAS数据分析专题

  • 机器学习专题

  • 2018年推文合集

  • 2019年推文合集

  • 2020推文合集

  写在最后

转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。

扫描下方二维码,关注我们,解锁更多精彩内容!

教你分析后缀为gpr的芯片数据_第2张图片

一个只分享干货的

生信公众号

你可能感兴趣的:(大数据,数据分析,编程语言,人工智能,机器学习)