Python 数据分析入门教学

Python 数据分析入门教学_第1张图片
Python

前言

python可以说是黑魔法了,利用python可以做到很多酷酷的事情,也应了那句 "人生苦短,我用python"
  python可以做爬虫采集数据可视化统计web开发,还可以开发简易的端口漏洞采集工具。总之利用python你可以做到任何你想做到的事情。今天我来简单的介绍下 pyhton数据可视化库之一的 matplotlib库 。 虽然python还有很多可视化统计库但是大部分都以matplotlib为基础,所以学习matplotlib库对以后用python开发数据可视化统计来说很重要。

首先在使用前你需要下载matplotlib库

pip install matplotlib 

然后再创建一个.py结尾的文件 并且在开头书写代码

import matplotlib.pyplot as plt 

散点图

我们首先来用matplotlib库画一个散点图 使用的方法是 scatter()

Python 数据分析入门教学_第2张图片
散点图

使用matplotlib.pyplot.scatter()方法来做散点图,第一个参数作为x轴,第二参数作为y轴,注意两个参数都只能是列表数据或者Series

# 使用列表数据作为坐标轴 这里的plt即是pyplot方法简写
import matplotlib.pyplot as plt
weight = [600,150,200,300,200,100,125,180] 
height = [60,65,73,70,65,58,66,67]
plt.scatter(height, weight)      //画出设订的点 height代表x轴 weight代表y轴
plt.show()      //这里告诉python 显示画出的散点图

方法:

plt.scatter(x,y) //表示画出对应的点
plt.title('')  //用来绘制表格标题
plt.xlabel('')   //用来绘制表格X轴标题
plt.ylabel('')  //用来绘制表格Y轴标题

折线图

然后我们试一试折线图 使用的方法是plot()

Python 数据分析入门教学_第3张图片
折线图
# 使用列表数据作为坐标轴
age = [5, 10, 15, 20, 25, 30]
height = [25, 45, 65, 75, 75, 75]
plt.plot(age, height)  //这里放入 x轴和y轴的点
plt.title('Age vs Height') //表格标题
plt.xlabel('age')    //x轴标题
plt.ylabel('Height')  //y轴标题
plt.show()

条形图

接下来是条形图 使用的方法是 barh()和bar()

条形图有两个方法 barh()方法用来绘制水平型条形图

Python 数据分析入门教学_第4张图片
水平条形图

现在要按月份统计烧毁的面积

先做一个透视图

area_by_month = forest_fires.pivot_table(index="month", values="area", aggfunc=numpy.sum) //计算每个月的烧毁面积
plt.barh(range(len(area_by_month)), area_by_month)
plt.title('Month vs Area')  //表格标题
plt.xlabel('month')   //x轴标题
plt.ylabel('area')   //y轴标题
plt.show()

而bar()方法用来绘制垂直条形图 如下图:参数同barh()相同

Python 数据分析入门教学_第5张图片
垂直条形图

主题

接下来我们考虑的是绘制表格的美观问题 我们可以设置不同的作图主题 使用style.ues()函数

这里简单介绍两个主题:

fivethirtyeight

Python 数据分析入门教学_第6张图片
fivethirtyeight

ggplot

Python 数据分析入门教学_第7张图片
ggplot

通常使用的主题:fivethirtyeight,ggplot,dark_background,bmh

推荐入门python数据分析书籍:
《利用python进行数据分析》

总结

总体来说python是一门非常神奇的语言,可以利用它做到你很多意想不到的事情,我上大学的时候用python爬虫爬过学校的所有妹子图(:-)),也做过自动生成验证码或者一些便利生活的脚本什么的,总之python这门语言会让你对学习它充满兴趣,而近几年随着大数据时代的来临,统计学也越来越重要,数据分析对一个公司有着至关重要的地位,利用python也可以简单的处理这些,当然还有R语言这种专门对付数据统计的语言,总之今天的分享就到这里.

你可能感兴趣的:(Python 数据分析入门教学)