用Python进行数据分析-01


数据可视化基础(一)

01  常用统计图

数据可视化,即将数据以图形化的形式展示出来,常用统计图:

①折线图:以折现的上升或下降来表示统计数量的增减变化的统计图

特点:能够显示数据的变化趋势,反应事物的变化情况。(变化)

②直方图:由一系列高度不等的纵向条纹或线段表示数据的分布情况,一般用横轴表示数据范围,纵轴表示分布情况。

特点:绘制连续型的数据,展示一组或者多组数据的分布状况(统计)

③条形图:排列在工作表的列或行中的数据可以绘制到条形图中。

特点:绘制离散型的数据,能够一眼看出各个数据的大小,比较数据之间的差距。

④散点图:用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联或总结坐标点的分布模式。

特点:判断变量之间是否存在数量关联趋势,展示离群点(分布规律)

02   Numpy基础

Numpy是效率很高的一个数学库,主要用于数组和矩阵运算,其核心数据类型是ndarry,可以认为是一种n维的数组结构。

① 引入numpy库:

import  numpy  as  np(惯例写法)

② 创建数组:

(1)使用array()函数可将Python的列表数据直接转换为ndarry类型

(2)使用Numpy函数创建数组

1.data1=np.zeros((2,3)):创建了一个2行3列,元素值均为0.0的二维数组。

2.data2=np.ones((2,3)):创建了一个2行3列,元素值均为1.0的二维数组。

3.data3=np.arange(1,5,0.2)

该语句创建一维数组,数组取值范围为[1,5),数组元素包括左侧数值1,但不包括右侧数值5,0.2为步长值。

4.data4=np.linspace(1,5,9)

创建一个一维数组,取值范围[1,5],9表示将数据等分为9份。

5.data5=np.arange(12).reshape((3,4))

先产生数据范围在[0,12)的自0开始到12结束的12个整数的一维数组(),步长为默认值1.其后的reshape表示将此数组重新划分为3行4列的二维数组。

6.data6=np.random.random((2,3))

产生数值范围在[0.0,1.0)的2行3列的二维数组。

7.data7=np.random.randint(1,10)

生成一个值范围在[1,10)的整数。

图片1 使用array函数创建数组

图片2  使用Numpy函数创建数组

03   使用Matplotlib绘制折线图

①引入matplotlib库

import matplotlib.pyplot as plt

绘制图形的一般步骤:1.准备图形数据(如使用Numpy)2.生成绘图画布plt.figure()  3.选择合适的图形绘制  4.渲染图形并画出图形

②基本格式:

plt.plot(x,y,color=”color”,marker=”o”,linestyle=”dashed”,label=”label”,其他参数)

示例1:绘制函数y=sin(x),x取值范围为[-π,π]的数据线。

代码如下图所示:

代码的运行结果如下所示:

示例2:在同一窗口中绘制y=sin(x)和y=cos(x)的图像,x的取值范围为[-π,π]

代码如下图所示:

代码的运行结果如下图所示:

欢迎关注我的个人微信公众号:全哥的学习生涯,里面分享的是关于自己医学专业上的学习经验,与本专业之外包括日语、英语以及数据分析中的重点知识汇总、学习方法与心得,当然,还有我自己的保研历程与经验、一些生活上的感悟等等

你可能感兴趣的:(用Python进行数据分析-01)