生物统计-数据可视化

可视化工具:R包,ggplot,ggplot2,
两种可视化变量:类别型、定量型。饼图、柱状图。条形图、散点图、箱线图
样本统计值:中位数、均值、方差、标准差
分位数:一分位数,三分位数、IQR,interquantile range,Q3-Q1
数据可视化原则

  • 通过图形反映数据信息,饼图以面积和角度反映比例,条形图用来观察数据的差异
  • 知道什么时候表示坐标轴的0点
  • 不要操作数据(Do not distort quantities)
  • 类别型数据按某种方式进行排序
  • 可能的话展示数据全貌
  • 使用正确的坐标轴,如男女身高主要在横轴的比较
  • 考虑对数据的数学转换,对数化处理
  • 应用颜色
  • 编码第三个变量,即颜色、点的大小或其他
  • 避免使用假的三维图
  • 避免使用过多有效位数字

总之,对待分析的数据有基本的认识,并使用正确的图表展示数据。



























你可能感兴趣的:(生物统计-数据可视化)