数据化分析简单实例——销售预测

前段时间忙东忙西的,已经很久没有发文章了,但是非常感谢各位朋友们的关注与赞赏,让我觉得做这件事情很有动力。以后我也会努力更新,感谢大家的支持与鼓励。

关注文末公众号,后台回复"销售预测"获得数据

1、案例概述

本节通过一个简单的案例, 来介绍如何使用Python进行数据化运营分析。

案例场景: 每个销售型公司都有一定的促销费用, 促销费用可以带来销售量的显著提升; 当给出一定的促销费用时, 预计会带来多大的商品销售量?

2、案例过程

#1、模块读入
import pandas as pd
from matplotlib import pyplot as plt
from sklearn import linear_model
from sklearn.metrics import mean_squared_error, r2_score
#2、数据读入
raw_data = pd.read_csv('data.txt')

数据预处理部分由于本文分析的是一个简单的案例,不存在数据的缺失与异常情况,因此这部分只是将数据进行了简单的分割为测试数据与训练数据。

#3、数据预处理
num = int(len(raw_data)*0.7)
x,y = raw_data[['money']],raw_data[['amount']]
x_train, x_test = x[:num],x[num:]
y_train, y_test = y[:num],y[num:]

在本阶段, 主要实现对读取的列表数据进行清洗转换, 以满足数据分析展示和数据建模的需要。 代码如下:

#4、数据可视化
plt.scatter(x_train,y_train)
数据化分析简单实例——销售预测_第1张图片
image.png

通过散点图发现, x和y的关系呈现明显的线性关系: 当x增大时, y增大; 当x减小时, y减小。 初步判断可以选择线性回归进行模型拟合。

#5、数据建模
model = linear_model.LinearRegression()
model.fit(x_train,y_train)

模型已经创建完成, 本阶段进行模型拟合的校验和评估, 代码如下:

#6、模型评估
predict_y = model.predict(x_test)
print('mean squared error:%.0f'%mean_squared_error(y_test,predict_y))
print('variance score:%.2f'%r2_score(y_test,predict_y))

mean squared error:65823229
variance score:0.72
该回归方程的决定系数R的平方是0.72, 整体拟合效果不错。

#7、线性回归参数确定
model_coef = model.coef_
model_intercept = model.intercept_
print('Coef is :',model_coef)
print('iIntercept is :',model_intercept)

我们已经拥有了一个可以预测的模型, 现在我们给定促销费用( x) 为84610, 销售预测代码如下:

#8、销售预测应用
new_x = 84610
pre_y = int(model.predict([[new_x]]))
print('预测销量为:',pre_y)

文章主要是对《Python数据分析与数据化运营》的记录,也希望和大家多多交流学习。


数据化分析简单实例——销售预测_第2张图片
qrcode_for_gh_8341e75b58d6_258.jpg

你可能感兴趣的:(数据化分析简单实例——销售预测)