GEO图表

1.图表介绍

(1) 热图

1
  • 差异基因热图
    group: 粉红色untrt为对照组
    中线以上的基因为下调基因

(2)散点图

2
  • 以一个向量作为纵坐标,横坐标默认按照下标排序

(3)箱线图

3
  • 箱线图展示单个基因在两组之间表达量的差异
    一组数据分布的直观体现,展示数据群体数据整体分布,不展示每一个数据的样子
    输入数据是一个数值型向量作为纵坐标和一个字符串向量(有重复值且取值数量有限)作为横坐标


    4

离群点:比Q1小1.5倍的四分位距(箱高)或比Q3大1.5倍四分位距的点
max: 最大值
75%: Q3,四分之一的数比我大
median: Q2,中位数(Q1、Q2、Q3统称为四分位数)
25%: Q1, 四分之一的数比我小
min: 最小值

(4)火山图

5
6
7
  • P值越小 → -log10(Pvalue)越大 → 差异越显著

(5)主成分分析

8
  • 一个点代表数据框中的一行,点与点之间的距离代表相似性,距离越近越相似(Dim1,Dim2代表主成分1和主成分2能解释数据变化趋势的百分之多少,后面的百分数可以去掉不用显示)

2.表达芯片分析思路

  • 探针的表达量反应基因的表达量
9
探针注释(探针与基因的对应关系)
  • 注释来源
    1) Biocoductor的注释包
    2)GPL的soft文件解析
    3)官网下载对应产品的注释表格
    4)自主注释
    https://mp.weixin.qq.com/s/mrtjpN8yDKUdCSvSUuUwcA

3.富集分析

(1)id转换:bitr()

entrezid id是富集分析最好的基因id

  • 输入数据:
    差异基因的entrezid id
    所有基因的entrezid id

(2)富集分析结果

10

你可能感兴趣的:(GEO图表)