利用Python进行数据分析(附详细案例)

一、前期准备

分析要用到两个包:NumPy和Pandas,首先确保jupyter中成功安装了这两个包。

#导入numpy包
import numpy as np
#导入pandas包
import pandas as pd

二、基础知识

2.1 一维数据分析:NumPy
利用Python进行数据分析(附详细案例)_第1张图片
2.2 一维数据结构:Pandas
利用Python进行数据分析(附详细案例)_第2张图片
2.3 二维数据分析:numpy对应array
利用Python进行数据分析(附详细案例)_第3张图片
2.4 二维数据分析:pandas对应数据框DateFrame

此处遇到一个问题:读取Excel文件报错。

解决方法:

1 查看Excel文件存放路径

具体操作:点击文件名,鼠标右键,选择“属性”,找到下面标红的两个地方。
利用Python进行数据分析(附详细案例)_第4张图片
2 将上面标红的两处合成文件的路径,

格式为文件夹\文件名,比如F:\ann\Untitled1.ipynb

3 最后把路径中全部的斜杠(/)或者反斜杠(\)替换为双反斜杠(\)

最后的路径为F:\ann\Untitled1.ipynb

三、Python具体案例分析:药店销售数据

利用Python进行数据分析(附详细案例)_第5张图片

3.1 提出问题

分析指标:

月均消费次数
月均消费金额
客单件
消费趋势

3.2 理解数据
利用Python进行数据分析(附详细案例)_第6张图片
3.3 清洗数据
利用Python进行数据分析(附详细案例)_第7张图片
3.3.1 选择子集
在这里插入图片描述
3.3.2 列名重命名
利用Python进行数据分析(附详细案例)_第8张图片
3.3.3 缺失数据处理(dropna()函数)

Python缺失值有3种:None,NA,NaN。(分析数据时,如果遇到什么错误,比如float错误,就要考虑是否为缺失值,若是,则需要处理掉)。

  1. Python内置的None值;
  2. pandas中,将缺失值表示 为NA,表示不可用not available;
  3. 对应数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据;

None和NaN的区别:None是Python的一种数据类型(NoneType),NaN是浮点类型(float),两个都用作空值。
利用Python进行数据分析(附详细案例)_第9张图片
3.3.4 数据类型转换
利用Python进行数据分析(附详细案例)_第10张图片
3.3.5 数据排序
利用Python进行数据分析(附详细案例)_第11张图片
3.3.6 异常值处理
利用Python进行数据分析(附详细案例)_第12张图片
3.4 构建模型

3.4.1 指标1:月均消费次数=总消费次数/月份数
利用Python进行数据分析(附详细案例)_第13张图片
3.4.2 指标2:月均消费金额=总消费金额/月份数
利用Python进行数据分析(附详细案例)_第14张图片
3.4.3 指标3:客单价=总消费金额/总消费次数

客单价(per customer transaction):商场(超市)每位顾客平均购买商品的金额,即是平均交易金额。
利用Python进行数据分析(附详细案例)_第15张图片

3.4.3 消费趋势
利用Python进行数据分析(附详细案例)_第16张图片

最后

在学习python中有任何困难不懂的可以微信扫描下方CSDN官方认证二维码加入python交流学习
多多交流问题,互帮互助,这里有不错的学习教程和开发工具。

python兼职资源+python全套学习资料

一、Python所有方向的学习路线

Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、Python必备开发工具

在这里插入图片描述

三、Python视频合集

观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述

四、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。在这里插入图片描述

五、Python练习题

检查学习结果。
在这里插入图片描述
最后,千万别辜负自己当时开始的一腔热血,一起变强大变优秀。

你可能感兴趣的:(python,编程,数据分析,python,数据分析,pandas)