数据可视化基础(一)
01 常用统计图
数据可视化,即将数据以图形化的形式展示出来,常用统计图:
①折线图:以折现的上升或下降来表示统计数量的增减变化的统计图
特点:能够显示数据的变化趋势,反应事物的变化情况。(变化)
②直方图:由一系列高度不等的纵向条纹或线段表示数据的分布情况,一般用横轴表示数据范围,纵轴表示分布情况。
特点:绘制连续型的数据,展示一组或者多组数据的分布状况(统计)
③条形图:排列在工作表的列或行中的数据可以绘制到条形图中。
特点:绘制离散型的数据,能够一眼看出各个数据的大小,比较数据之间的差距。
④散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。
特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)
02 Numpy基础
Numpy是效率很高的一个数学库,主要用于数组和矩阵运算,其核心数据类型是ndarry,可以认为是一种n维的数组结构。
① 引入numpy库:
import numpy as np(惯例写法)
② 创建数组:
(1)使用array()函数可将Python的列表数据直接转换为ndarry类型
(2)使用Numpy函数创建数组
1.data1=np.zeros((2,3)):创建了一个2行3列,元素值均为0.0的二维数组。
2.data2=np.ones((2,3)):创建了一个2行3列,元素值均为1.0的二维数组。
3.data3=np.arange(1,5,0.2)
该语句创建一维数组,数组取值范围为[1,5),数组元素包括左侧数值1,但不包括右侧数值5,0.2为步长值。
4.data4=np.linspace(1,5,9)
创建一个一维数组,取值范围[1,5],9表示将数据等分为9份。
5.data5=np.arange(12).reshape((3,4))
先产生数据范围在[0,12)的自0开始到12结束的12个整数的一维数组(),步长为默认值1.其后的reshape表示将此数组重新划分为3行4列的二维数组。
6.data6=np.random.random((2,3))
产生数值范围在[0.0,1.0)的2行3列的二维数组。
7.data7=np.random.randint(1,10)
生成一个值范围在[1,10)的整数。
图片1 使用array函数创建数组
图片2 使用Numpy函数创建数组
03 使用Matplotlib绘制折线图
①引入matplotlib库
import matplotlib.pyplot as plt
绘制图形的一般步骤:1.准备图形数据(如使用Numpy)2.生成绘图画布plt.figure() 3.选择合适的图形绘制 4.渲染图形并画出图形
②基本格式:
plt.plot(x,y,color=”color”,marker=”o”,linestyle=”dashed”,label=”label”,其他参数)
示例1:绘制函数y=sin(x),x取值范围为[-π,π]的数据线。
代码如下图所示:
代码的运行结果如下所示:
示例2:在同一窗口中绘制y=sin(x)和y=cos(x)的图像,x的取值范围为[-π,π]。
代码如下图所示:
代码的运行结果如下图所示:
欢迎关注我的个人微信公众号:全哥的学习生涯,里面分享的是关于自己医学专业上的学习经验,与本专业之外包括日语、英语以及数据分析中的重点知识汇总、学习方法与心得,当然,还有我自己的保研历程与经验、一些生活上的感悟等等