学习打卡7.24

用Excel绘图

饼图

适合使用饼图的条件
学习打卡7.24_第1张图片
注意:不用在图中加入标题,标题的位置一般为表上图下

实例

学习打卡7.24_第2张图片

特殊情况

类别太多

解决方法:使用柱状图

类别太少

学习打卡7.24_第3张图片

不是全集

比如:手机品牌和销量
解决方法:加上一个其它

预处理

先排序后画图
学习打卡7.24_第4张图片

复合饼图

学习打卡7.24_第5张图片

柱状图

优势:柱状图常常用于展示多个分类(单个分类也可以)的数据变化和同类别各变量之间的比较情况。堆积柱状图可用于比较同类别各变量和不同类别变量总和差异;百分比堆积柱状图适合展示同类别的每个变量的比例。

实例

学习打卡7.24_第6张图片

3种柱状图

普通柱状图

学习打卡7.24_第7张图片

堆积柱状图

比较同类别各变量和不同类别变量总和差异
学习打卡7.24_第8张图片

百分比柱状图

适合展示同类别的每个变量的比例
学习打卡7.24_第9张图片

条形图

横着的柱状图
**优势:**类别数过多时,如果要加入数据标签,那么使用条形图比较合适 柱状图的数看起来有点拥挤

实例

学习打卡7.24_第10张图片

双向条形图

学习打卡7.24_第11张图片

用柱状图可视化回归结果

学习打卡7.24_第12张图片
学习打卡7.24_第13张图片
(1)用红色和黑色区分了显著和不显著的系数估计。红色是指系数估计跟0有显著差异,而黑色是指没有。因此解读的时候,关注红色柱子即可。
(2)柱子朝上,说明自变量和因变量的关系是正向的。自变量取值增加的时候,因变量取值也增加。类似地,如果柱子朝下,说明自变量和因变量的关系是负向的。自变量取值越大,因变量取值则越小。
(3)若对自变量进行了标准化,那么柱子的高度,也就是系数的估计值有可比性,可以直观地区分出自变量对因变量的影响大小。

直方图

直方图是显示数据频数或频率的柱状图

实例

学习打卡7.24_第14张图片

直方图和柱状图的区别

学习打卡7.24_第15张图片

组距的影响

学习打卡7.24_第16张图片
学习打卡7.24_第17张图片
组距会影响直方图呈现出来的数据分布,因此在绘制直方图的时候需要多次尝试改变组距

常见的模式

学习打卡7.24_第18张图片

频率分部直方图

实例

学习打卡7.24_第19张图片

绘制方法

数据分析功能
学习打卡7.24_第20张图片

折线图

如果数据是时间序列数据(如日、月、季度或年度数据),则应该考虑使用折线图,尤其是时间跨度长且存在多个时间序列时,更应该使用折线图。(折线图也经常被称为时间序列图,或简称为时序图)
当然,时间序列期数较少时,也可以考虑使用柱状图

实例

学习打卡7.24_第21张图片

双坐标轴折线图

学习打卡7.24_第22张图片

柱形图顶端的折线图

学习打卡7.24_第23张图片

散点图

学习打卡7.24_第24张图片

实例

学习打卡7.24_第25张图片

带有标记的散点图

学习打卡7.24_第26张图片

箱线图

箱线图也称箱须图、箱形图、盒图,用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱形图包含数学统计量,不仅能够分析不同类别数据各层次水平差异,还能揭示数据间离散程度、异常值、分布差异等等。
学习打卡7.24_第27张图片

作用

配合定性变量画分组箱线图,作比较。如果只有一个定量变量,很少用一个箱线图去展示其分布,更多选择直方图。箱线图更有效的使用方法是作比较。

总结

对于同一组数据,不同的同学绘制出来的效果可能截然不同,好的图形能够让读者一样就能看出数据的规律和特点,其传递给读者的信息是准确和有效的,准确是指我们不能随意绘制图形,因为每个统计图适用的数据是有限制的;有效是指图形传递出来的信息和你得到的结论是吻合的;这是一个图形要满足的最基本两点。另外,要评价一个图形是否画的好,主要看其是否简洁和美观,我们绘制出来的图表包含的信息一定要清晰明显,不能花里胡哨,另外一定要注意图形的配色。

你可能感兴趣的:(学习打卡7.24)