可视化 | (一)数据基础及基本数据可视化方法


文章目录

  • 数据可视化的基本流程
  • 数据属性
  • 基本可视化图表类型
    • 数据分析三规则
    • 条形图(Bar Chart)
    • 饼图(Pie Chart)
    • 衡量易变性 (measure variability)
      • range
      • The median
      • Quartiles
      • Interquartile Range
    • 盒须图(Boxplot)
    • 直方图(Histograms)
    • 茎叶显示(Stem and Leaf Displays)
  • 小结

数据可视化的基本流程

可视化 | (一)数据基础及基本数据可视化方法_第1张图片

  • Parameter refinement:参数优化

数据属性

  • Nominal(标称)
    在这里插入图片描述
  • Ordinal(序数)
    在这里插入图片描述
  • Quantitative(数量)
    可视化 | (一)数据基础及基本数据可视化方法_第2张图片

可视化 | (一)数据基础及基本数据可视化方法_第3张图片

基本可视化图表类型

数据分析三规则

  1. 显示在原始数据中不明显的方面,使您能够清楚地思考可能隐藏在数据中的模式和关系。
  2. 显示数据中的重要特征和模式。您还可能看到一些您没有想到的东西:异常的(可能是错误的)数据值或意外的模式。
  3. 制作一张图片——告诉别人你的数据的最好方法是用一张精心选择的图片。
    可视化 | (一)数据基础及基本数据可视化方法_第4张图片

条形图(Bar Chart)

  • 条形图:显示每个类别的计数或相对频率
    可视化 | (一)数据基础及基本数据可视化方法_第5张图片
    可视化 | (一)数据基础及基本数据可视化方法_第6张图片
    可视化 | (一)数据基础及基本数据可视化方法_第7张图片
    可视化 | (一)数据基础及基本数据可视化方法_第8张图片

饼图(Pie Chart)

  • 饼图:显示每个类别中整体的比例
    可视化 | (一)数据基础及基本数据可视化方法_第9张图片

衡量易变性 (measure variability)

range

  • range = largest - smallest
    可视化 | (一)数据基础及基本数据可视化方法_第10张图片

The median

  • a measure of center
    可视化 | (一)数据基础及基本数据可视化方法_第11张图片

Quartiles

  • Measuring spread by examining the middle
    可视化 | (一)数据基础及基本数据可视化方法_第12张图片
    可视化 | (一)数据基础及基本数据可视化方法_第13张图片
  • Step 1: find the median of all the data (the median divides the data in half)
  • Step 2a: find the median of the lower half; this median is Q1;
  • Step 2b: find the median of the upper half; this median is Q3.

  • when n is odd include the overall median in both halves;
  • when n is even do not include the overall median in either half.
    可视化 | (一)数据基础及基本数据可视化方法_第14张图片

可视化 | (一)数据基础及基本数据可视化方法_第15张图片

Interquartile Range

  • Measures spread of middle 50% of the data
    可视化 | (一)数据基础及基本数据可视化方法_第16张图片

盒须图(Boxplot)

可视化 | (一)数据基础及基本数据可视化方法_第17张图片
可视化 | (一)数据基础及基本数据可视化方法_第18张图片

  • construct box:末端位于Q1和Q3;在框中标记中间的位置(通常用一条线或“+”)
  • 围栏通过移动距离1.5(IQR)来确定
    • 上围栏比上四分位数多1.5*IQR
    • 下围栏比下四分位数低1.5*IQR
    • 注意:围栏只有助于构建箱线图,它们不会出现在最后的箱线图显示中。
  • whiskers:从盒子的左右两端画线到极值。
  • outliers:极端值
    可视化 | (一)数据基础及基本数据可视化方法_第19张图片

直方图(Histograms)

可视化 | (一)数据基础及基本数据可视化方法_第20张图片

  • 直方图显示了三种一般类型的信息:
    • 它提供了数据的近似中心位置的可视化指示。
    • 我们可以了解数据中传播或变化的程度
    • 我们可以观察到其分布的形状

茎叶显示(Stem and Leaf Displays)

可视化 | (一)数据基础及基本数据可视化方法_第21张图片

  • 优点
    • each measurement displayed(显示全面)
    • ascending order in each stem row(叶子升序排列)
    • relatively simple (data set not too large)(针对数据集不大的情况相对简单)
  • 缺点:display becomes unwieldy for large data sets(大数据集不适用)

小结

可视化 | (一)数据基础及基本数据可视化方法_第22张图片

你可能感兴趣的:(#,可视化技术,数据分析,信息可视化)