想你依然心痛

Python数据挖掘：入门、进阶与实用案例分析——自动售货机销售数据分析与应用

文章目录

摘要
01 案例背景
02 分析目标
03 分析过程
04 数据预处理
- 1. 清洗数据
- - 1.1 合并订单表并处理缺失值
  - 1.2 增加“市”属性
  - 1.3 处理订单表中的“商品详情”属性
  - 1.4 处理“总金额（元）”属性
- 2.属性选择
- 3.属性规约
05 销售数据可视化分析
- 1.销售额和自动售货机数量的关系
- 2.订单数量和自动售货机数量的关系
- 3.畅销和滞销商品
- 4.自动售货机的销售情况
- 5.订单支付方式占比
- 6.各消费时段的订单用户占比
06 销售额预测
- 1.统计周销售额
- 2.平稳性检验
- 3.差分处理
- 4.模型定阶
- 5.模型预测
推荐阅读
赠书活动

摘要

摘要：本案例将主要结合自动售货机的实际情况，对销售的历史数据进行处理，利用pyecharts库、Matplotlib库进行可视化分析，并对未来4周商品的销售额进行预测，从而为企业制定相应的自动售货机市场需求分析及销售建议提供参考依据。更多详细内容请参考《Python数据挖掘：入门进阶与实用案例分析》一书。

01 案例背景

近年来，随着我国经济技术的不断提升，自动化机械在人们日常生活中扮演着越来越重要的角色，更多的被应用在不同的领域。而作为新的一种自动化零售业态，自动售货机在日常生活中应用越来越广泛。自动售货机销售产业在走向信息化、合理化同时，也面临着高度同质化、成本上升、毛利下降等诸多困难与问题，这也是大多数企业所会面临到的问题。

为了提高市场占有率和企业的竞争力，某企业在广东省某8个市部署了376台自动售货机，但经过一段时间后，发现其经营状况并不理想。而如何了解销售额、订单数量与自动售货机数量之间的关系，畅销或滞销的商品又有哪些，自动售货机的销售情况等，已成为该企业亟待解决的问题。

02 分析目标

获取了该企业某6个月的自动售货机销售数据，结合销售背景进行分析，并可视化展现销售现状，同时预测未来一段时间内的销售额，从而为企业制定营销策略提供一定的参考依据。

03 分析过程

04 数据预处理

1. 清洗数据

1.1 合并订单表并处理缺失值

由于订单表的数据是按月份分开存放的，为了方便后续对数据进行处理和可视化，所以需要对订单数据进行合并处理。同时，在合并订单表的数据后，为了了解订单表的缺失数据的基本情况，需要进行缺失值检测。合并订单表并进行缺失值检测，操作结果如图1所示。

图1 合并订单表并进行缺失值检测的结果

由操作结果可知，合并后的订单数据有350867条记录，且订单表中含有缺失值的记录总共有279条，其数量相对较少，可直接使用删除法对其中的缺失值进行处理。

合并订单表、查看缺失值并处理缺失值，如代码清单1所示。

代码清单1 合并订单表、查看缺失值并处理缺失值

import pandas as pd
 

# 读取数据

data4 = pd.read_csv('../data/订单表2018-4.csv', encoding='gbk')

data5 = pd.read_csv('../data/订单表2018-5.csv', encoding='gbk')

data6 = pd.read_csv('../data/订单表2018-6.csv', encoding='gbk')

data7 = pd.read_csv('../data/订单表2018-7.csv', encoding='gbk')

data8 = pd.read_csv('../data/订单表2018-8.csv', encoding='gbk')

data9 = pd.read_csv('../data/订单表2018-9.csv', encoding='gbk')

# 合并数据

data = pd.concat([data4, data5, data6, data7, data8, data9], ignore_index=True)

print('订单表合并后的形状为', data.shape)

# 缺失值检测

print('订单表各属性的缺失值数目为：\n', data.isnull().sum())

data = data.dropna(how='any')  # 删除缺失值

1.2 增加“市”属性

为了满足后续的数据可视化需求，需要在订单表中增加“市”属性，操作结果如图2所示。

图2 增加“市”属性

增加“市”属性如代码清单2所示。

代码清单2 增加“市”属性

# 从省市区属性中提取市的信息，并创建新属性

data['市'] = data['省市区'].str[3: 6]

print('经过处理后的数据前5行为：\n', data.head())

1.3 处理订单表中的“商品详情”属性

通过浏览订单表数据发现，在“商品详情”属性中存在有异名同义的情况，即两个名称不同的值所代表的实际意义是一致的，如“脉动青柠X1;”“脉动青柠x1;”等。因为此情况会对后面的分析结果造成一定的影响，所以需要对订单表中的“商品详情”属性进行处理，增加“商品名称”属性，如代码清单3所示。

代码清单3 处理订单表中的“商品详情”属性

# 定义一个需剔除字符的列表error_str

error_str = [' ', '(', ')', '（', '）', '0', '1', '2', '3', '4', '5', '6',

             '7', '8', '9', 'g', 'l', 'm', 'M', 'L', '听', '特', '饮', '罐',

             '瓶', '只', '装', '欧', '式', '&', '%', 'X', 'x', ';']

# 使用循环剔除指定字符

for i in error_str:

    data['商品详情'] = data['商品详情'].str.replace(i, '')

# 新建“商品名称”属性，用于新数据的存放

data['商品名称'] = data['商品详情']

1.4 处理“总金额（元）”属性

此外，当浏览订单表数据时，发现在“总金额（元）”属性中，存在极少订单的金额很小，如0、0.01等。在现实生活中，这种记录存在的情况极少，且这部分数据不具有分析意义。因此，在本案例中，对订单的金额小于0.5的记录进行删除处理，操作结果如图3所示。

图3删除后的数据量

由操作结果可知，删除前的数据行列数目为(350617, 17)，删除后的数据行列数目为(350450, 17)。

删除“总金额（元）”属性中订单的金额较少的记录如代码清单4所示。

代码清单4 删除“总金额（元）”属性中订单的金额较少的记录

# 删除金额较少的订单前的数据行列数目

print(data.shape)

# 删除金额较少的订单后的数据行列数目

data = data[data['总金额（元）'] >= 0.5]

print(data.shape)

2.属性选择

因为订单表中的“手续费（元）”“收款方”“软件版本”“省市区”“商品详情”“退款金额（元）”等属性对本案例的分析没有意义，所以需要对其进行删除处理，选择合适的属性，操作的结果如图4所示。

图4属性选择

属性选择如代码清单5所示。

代码清单5 属性选择

# 对于订单表数据选择合适的属性

data = data.drop(['手续费（元）', '收款方', '软件版本', '省市区', '商品详情', '退款金额（元）'], axis=1)

print('选择后，数据属性为：\n', data.columns.values)

3.属性规约

在订单表“下单时间”属性中含有的信息量较多，并且存在概念分层的情况，需要对属性进行数据规约，提取需要的信息。提取相应的“小时”属性和“月份”属性，进一步泛化“小时”属性为“下单时间段”属性，规则如下：

Ø当小时≤5时，为“凌晨”；

Ø当5＜小时≤8时，为“早晨”；

Ø当8＜小时≤11时，为“上午”；

Ø当11＜小时≤13时，为“中午”；

Ø当13＜小时≤16时，为“下午”；

Ø当16＜小时≤19时，为“傍晚”；

Ø当19＜小时≤24，为“晚上”。

在Python中规约订单表的属性，如代码清单6所示。

代码清单6 规约订单表的属性

# 将时间格式的字符串转换为标准的时间格式

data['下单时间'] = pd.to_datetime(data['下单时间'])

data['小时'] = data['下单时间'].dt.hour  # 提取时间中的小时

data['月份'] = data['下单时间'].dt.month  # 提取时间中的月份

data['下单时间段'] = 'time'  # 新增“下单时间段”属性，并将其初始化为time

exp1 = data['小时'] <= 5  # 判断小时是否小于等于5

# 若条件为真，则时间段为凌晨

data.loc[exp1, '下单时间段'] = '凌晨'

# 判断小时是否大于5且小于等于8

exp2 = (5 < data['小时']) & (data['小时'] <= 8)

# 若条件为真，则时间段为早晨

data.loc[exp2, '下单时间段'] = '早晨'

# 判断小时是否大于8且小于等于11

exp3 = (8 < data['小时']) & (data['小时'] <= 11)

# 若条件为真，则时间段为上午

data.loc[exp3, '下单时间段'] = '上午'

# 判断小时是否小大于11且小于等于13

exp4 = (11 < data['小时']) & (data['小时'] <= 13)

# 若条件为真，则时间段为中午

data.loc[exp4, '下单时间段'] = '中午'

# 判断小时是否大于13且小于等于16

exp5 = (13 < data['小时']) & (data['小时'] <= 16)

# 若条件为真，则时间段为下午

data.loc[exp5, '下单时间段'] = '下午'

# 判断小时是否大于16且小于等于19

exp6 = (16 < data['小时']) & (data['小时'] <= 19)

# 若条件为真，则时间段为傍晚

data.loc[exp6, '下单时间段'] = '傍晚'

# 判断小时是否大于19且小于等于24

exp7 = (19 < data['小时']) & (data['小时'] <= 24)

# 若条件为真，则时间段为晚上

data.loc[exp7, '下单时间段'] = '晚上'

data.to_csv('../tmp/order.csv', index=False, encoding = 'gbk')

05 销售数据可视化分析

在销售数据中含有的数据量较多，作为企业管理人员以及决策制定者，无法直观了解目前自动售货机的销售状况。因此需要利用处理好的数据进行可视化分析，直观地展示销售走势以及各区销售情况等，为决策者提供参考。

1.销售额和自动售货机数量的关系

探索6个月销售额和自动售货机数量之间的关系，并按时间走势进行可视化分析，结果如图5所示。

图5 销售额和自动售货机数量之间的关系

由图5可知，4月至7月，自动售货机的数量在增加，销售额也随着自动售货机的数量增加而增加；8月，虽然自动售货机数量减少了4台，但是销售额还在增加；9月相比8月的自动售货机数量减少了6台，销售额也随着减少。可以推断出销售额与自动售货机的数量存在一定的相关性，增加自动售货机的数量将会带来销售额的增长。出现该情况可能是因为广东处于亚热带，气候相对炎热，而7、8、9月的气温也相对较高，人们使用自动售货机的频率也相对较高。

探索销售额和自动售货机数量之间的关系如代码清单7所示。

代码清单7 销售额和自动售货机数量之间的关系

import pandas as pd

import numpy as np

from pyecharts.charts import Line

from pyecharts import options as opts

import matplotlib.pyplot as plt

from pyecharts.charts import Bar

from pyecharts.charts import Pie

from pyecharts.charts import Grid

 

data = pd.read_csv('../tmp/order.csv', encoding='gbk')

def f(x):

    return len(list(set((x.values))))

# 绘制销售额和自动售货机数量之间的关系图

groupby1 = data.groupby(by='月份', as_index=False).agg({'设备编号': f, '总金额（元）': np.sum})

groupby1.columns = ['月份', '设备数量', '销售额']

line = (Line()

        .add_xaxis([str(i) for i in groupby1['月份'].values.tolist()])

        .add_yaxis('销售额', np.round(groupby1['销售额'].values.tolist(), 2))

        .add_yaxis('设备数量', groupby1['设备数量'].values.tolist(), yaxis_index=1,symbol='triangle')

        .set_series_opts(label_opts=opts.LabelOpts(is_show=True, position='top', font_size=10))

        .set_global_opts(

            xaxis_opts=opts.AxisOpts(name='月份', name_location='center', name_gap=25),

            title_opts=opts.TitleOpts(title='销售额和自动售货机数量之间的关系'),

            yaxis_opts=opts.AxisOpts( name='销售额（元）', name_location='center', name_gap=60,

                axislabel_opts=opts.LabelOpts(

                formatter='{value}')))

        .extend_axis(

            yaxis=opts.AxisOpts( name='设备数量（台）', name_location='center', name_gap=40,

                axislabel_opts=opts.LabelOpts(

                formatter='{value}'), interval=50))

        )

line.render_notebook()

2.订单数量和自动售货机数量的关系

探索6个月订单数量和自动售货机数量之间的关系，并按时间走势进行可视化分析，结果如图6所示。

图6 订单数量和自动售货机数量之间的关系

由图6可知，4月至7月，自动售货机数量呈上升趋势，订单数量也随着自动售货机数量增加而增加，而8月至9月，自动售货机数量在减少，订单数量也在减少。这说明了订单数量与自动售货机的数量是严格相关的，增加自动售货机会给用户带来便利，从而提高订单数量。同时，结合图5可知，订单数量和销售额的变化趋势基本保持一样的变化趋势，这也说明了订单数量和销售额存在一定的相关性。

由于各市的设备数量并不一致，所以探索各市自动售货机的平均销售总额，并进行对比分析，结果如图7所示。

图7 各市自动售货机平均销售总额

由图7可知，深圳市自动售货机平均销售总额最高，达到了6538.28元，排在其后的是珠海市和中山市。而最少的是清远市，其平均销售总额只有414.27元。出现此情况可能是因为不同区域的人流量不同，而深圳市相对于其他区域的人流量相对较大，清远市相对于其他区域的人流量相对较小。此外，广州市的人流量也相对较大，但其平均销售总额却相对较少，可能是因为自动售货机放置不合理导致的。

探索订单数量和自动售货机数量之间的关系，以及各市自动售货机的平均销售总额如代码清单8所示。

代码清单8 订单数量和自动售货机数量之间的关系

groupby2 = data.groupby(by='月份', as_index=False).agg({'设备编号': f, '订单编号': f})

groupby2.columns = ['月份', '设备数量', '订单数量']

# 绘制图形

plt.figure(figsize=(10, 4))

plt.rcParams['font.sans-serif'] = ['SimHei']

plt.rcParams['axes.unicode_minus'] = False

fig, ax1 = plt.subplots()  # 使用subplots函数创建窗口

ax1.plot(groupby2['月份'], groupby2['设备数量'], '--')

ax1.set_yticks(range(0, 350, 50))  # 设置y1轴的刻度范围

ax1.legend(('设备数量',), loc='upper left', fontsize=10)

ax2 = ax1.twinx()  # 创建第二个坐标轴

ax2.plot(groupby2['月份'], groupby2['订单数量'])

ax2.set_yticks(range(0, 100000, 10000))  # 设置y2轴的刻度范围

ax2.legend(('订单数量',), loc='upper right', fontsize=10)

ax1.set_xlabel('月份')

ax1.set_ylabel('设备数量（台）')

ax2.set_ylabel('订单数量（单）')

plt.title('订单数量和自动售货机数量之间的关系')

plt.show()

 

gruop3 = data.groupby(by='市', as_index=False).agg({'总金额（元）':sum, '设备编号':f})

gruop3['销售总额'] = np.round(gruop3['总金额（元）'], 2)

gruop3['平均销售总额'] = np.round(gruop3['销售总额'] / gruop3['设备编号'], 2)

plt.bar(gruop3['市'].values.tolist(), gruop3['平均销售总额'].values.tolist(), color='#483D8B')

# 添加数据标注

for x, y in enumerate(gruop3['平均销售总额'].values):

    plt.text(x - 0.4, y + 100, '%s' %y, fontsize=8)

plt.xlabel('城市')

plt.ylabel('平均销售总额（元）')

plt.title('各市自动售货机平均销售总额')

plt.show()

3.畅销和滞销商品

查找6个月销售额排名前10和后10的商品，从而找出畅销商品和滞销商品，并对其销售额进行可视化分析，结果如图8、图9所示。

图8 销售额前10的商品

![在这里插入图片描述](https://img-blog.csdnimg.cn/55df073ee9084cd68486f90bf14803f6.jpeg#pic_center)

图9 销售额后10的商品

由图8可知，销售额排在第一的是商品0015，达到了56230.2元，其次是商品0013和商品0004等商品。由图9可知，销售额排在最后的商品是商品0104、商品0687和商品0540，其销售金额只有1元。

探索6个月销售额排名前10和后10的商品如代码清单9所示。

代码清单9 10种畅销商品、10种滞销商品

# 销售额前10的商品

group4 = data.groupby(by='商品ID', as_index=False)['总金额（元）'].sum()

group4.sort_values(by='总金额（元）', ascending=False, inplace=True)

d = group4.iloc[: 10]

x_data = d['商品ID'].values.tolist()

y_data = np.round(d['总金额（元）'].values, 2).tolist()

bar = (Bar(init_opts=opts.InitOpts(width='800px',height='600px'))

       .add_xaxis(x_data)

       .add_yaxis('', y_data, label_opts=opts.LabelOpts(font_size=15))

       .set_global_opts(title_opts=opts.TitleOpts(title='畅销前10的商品'),

                        yaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(

                            formatter='{value}',font_size=15)),

                        xaxis_opts=opts.AxisOpts(type_='category',

                            axislabel_opts=opts.LabelOpts({'interval': '0'}, font_size=15, rotate=30))))

bar.render_notebook()

 

h = group4.iloc[-10: ]

x_data = h['商品ID'].values.tolist()

y_data = np.round(h['总金额（元）'].values, 2).tolist()

bar = (Bar()

       .add_xaxis(x_data)

       .add_yaxis('', y_data, label_opts=opts.LabelOpts(position='right'))

       .set_global_opts(title_opts=opts.TitleOpts(

                        title='滞销前10的商品'),

                        xaxis_opts=opts.AxisOpts(

                            axislabel_opts={'interval': '0'}))

       .reversal_axis()

       )

grid = Grid(init_opts=opts.InitOpts(width='600px', height='400px'))

grid.add(bar, grid_opts=opts.GridOpts(pos_left='18%'))

grid.render_notebook()

4.自动售货机的销售情况

探索6个月销售额前10以及销售额后10的设备及其所在的城市，并进行可视化分析，结果如图10、图11所示。

图10 销售额前10的设备及其所在市

图11 销售额后10的设备及其所在市

由图10可知，销售额靠前的设备所在城市主要集中在中山市、广州市、东莞市和深圳市，其中，销售额前3的设备都集中在中山市。由图11可知，广州市的设备113024、112719、112748的销售额只有1元，而销售额后10的设备全部在广州市和中山市。

探索6个月销售额前10以及销售额后10的设备及其所在的城市如代码清单10所示。

代码清单10 销售额前10、后10的设备及其所在市

group5 = data.groupby(by=['市', '设备编号'], as_index=False)['总金额（元）'].sum()

group5.sort_values(by='总金额（元）', ascending=False, inplace=True)

b = group5[: 10]

label = []

# 销售额前10的设备及其所在市

for i in range(len(b)):

    a = b.iloc[i, 0] + str(b.iloc[i, 1])

    label.append(a)

x = np.round(b['总金额（元）'], 2).values.tolist()

y = range(10)

plt.bar(x=0, bottom=y, height=0.4, width=x, orientation='horizontal')

plt.xticks(range(0, 80000, 10000))  # 设置x轴的刻度范围

plt.yticks(range(10), label)

for y, x in enumerate(np.round(b['总金额（元）'], 2).values):

    plt.text(x + 500, y - 0.2, "%s" %x)

plt.xlabel('总金额（元）')

plt.title('销售额前10的设备及其所在市')

plt.show()

 

l = group5[-10: ]

label1 = []

for i in range(len(l)):

    a = l.iloc[i, 0] + str(l.iloc[i, 1])

    label1.append(a)

x = np.round(l['总金额（元）'], 2).values.tolist()

y = range(10)

plt.bar(x=0, bottom=y, height=0.4, width=x, orientation='horizontal')

plt.xticks(range(0, 4, 1))  # 设置x轴的刻度范围

plt.yticks(range(10), label1)

for y, x in enumerate(np.round(l['总金额（元）'], 2).values):

    plt.text(x, y, "%s" %x)

plt.xlabel('总金额（元）')

plt.title('销售额后10的设备及其所在市')

plt.show()

统计各城市销售额小于100的设备数量，并进行可视化分析，结果如图12所示。

图12 各市销售额小于100的设备数量

由图12可知，销售额小于100的设备在广州市有52台，中山市有20台，佛山市有10台。出现这种情况的原因可能是设备放置位置的不合理，或设备放置过多造成的，因此可以适当调整自动售货机放置的位置和数量，减少设备和人员的浪费。

探索各城市销售额小于100元的设备数量如代码清单11所示。

代码清单11 各城市销售额小于100元的设备数量

l_b = group5[group5['总金额（元）'] < 100]

lb = l_b.groupby(by='市', as_index=False)['设备编号'].count()

x_data = lb['市'].values.tolist()

y_data = lb['设备编号'].values.tolist()

bar = (Bar(init_opts=opts.InitOpts(width='500px', height='400px'))

       .add_xaxis(x_data)

       .add_yaxis('', y_data)

       .set_global_opts(title_opts=opts.TitleOpts(

                title='各市销售额小于100的设备数量'))

       )

bar.render_notebook()

5.订单支付方式占比

对自动售货机上各商品订单的支付方式进行统计，并进行可视化分析，结果如图13所示。

图13 订单支付方式占比

由图13可知，订单的主要支付方式有4种，即微信、支付宝、会员余额和现金，其中支付方式最多的是微信支付，在所有支付方式中占到了89.05%。其次是支付宝支付，其占比为9.87%，而现金支付和会员余额支付的占比不到1%。

分析订单支付方式占比如代码清单12所示。

代码清单12 分析订单支付方式占比

group6 = data.groupby(by='支付状态')['支付状态'].count()

method = group6.index.tolist()

num = group6.values.tolist()

pie_data = [(i, j) for i, j in zip(method, num)]

pie = (Pie()

     .add('', pie_data, label_opts=opts.LabelOpts(formatter='{b}:{c}({d}%)'))

     .set_global_opts(title_opts=opts.TitleOpts(title='订单支付方式占比')))

pie.render_notebook()

6.各消费时段的订单用户占比

在自动售货机的商品下单时间段上，统计各消费时段的订单用户数量，并进行可视化分析，结果如图14所示。

图14 各消费时段的订单用户占比

由图14可知，当消费时间段在下午时，其订单用户最多，占比达到了21.44%，其次是晚上，占比是17.36%，上午的占比也有17.08%，其余时间段的占比相对较少。

分析各消费时段的订单用户如代码清单13所示。

代码清单13 分析各消费时段的订单用户

group7 = data.groupby(by='下单时间段')['购买用户'].count()

times = group7.index.tolist()

num = group7.values.tolist()

pie_data_2 = [(i, j) for i, j in zip(times, num)]

pie = (Pie()

       .add('', pie_data_2, label_opts=opts.LabelOpts(formatter='{b}:{c}({d}%)'),

            radius=[60, 200], rosetype='radius', is_clockwise=False)

       .set_global_opts(title_opts=opts.TitleOpts(title='各消费时段的订单用户占比'))

       )

pie.render_notebook()

06 销售额预测

精准的销售额预测对于企业运营有着非常重要的指导意义，可以指导运营后台提前进行合理的资源配置，帮助企业管理人员制定合理的目标。同时，还可以更好地帮助企业采取更为针对性的促销手段，更加明确市场的需求，可以根据不同区域、不同时间划分等制定更加有效、合理的配货方案和商品价格，从而增加企业经营收益。

自动售货机的销售额预测指的是从售货机已有销售额的订单数据资料中，总结出商品销售额的变化规律，并根据该规律构建ARIMA模型，动态预测未来4周内商品的销售额。

ARIMA模型的建模步骤如图15所示。

图15 ARIMA模型的建模步骤

1.统计周销售额

通过观察订单数据，发现该数据集记录的是当前日期时间下，售货机所售卖商品的订单状况，其出货状态有出货成功、出货失败、未出货等多种情况。然而，为预测未来4周的销售额，其所需样本数据应为实际的周销售额数据，因此，需要筛选状态为出货成功的数据并统计各周销售额，如代码清单14所示。

代码清单14 筛选出货成功数据并统计各周销售额

import pandas as pd

import matplotlib.pyplot as plt

from statsmodels.tsa.stattools import adfuller as ADF

from statsmodels.graphics.tsaplots import plot_acf

from statsmodels.stats.diagnostic import acorr_ljungbox

from statsmodels.tsa.arima_model import ARIMA

 

data = pd.read_csv('../tmp/order.csv', encoding='gbk')

# 提取出货状态为“出货成功”的下单时间和总金额（元）数据

data_info = data.loc[data['出货状态'] == '出货成功', ['下单时间', '总金额（元）']]

data_info = data_info.set_index('下单时间')  # 将下单时间设为索引

# 将索引修改为日期时间格式

data_info.index = pd.to_datetime(data_info.index)

# 按周对总金额进行汇总，即求和

data_w = data_info.resample('W').sum()

2.平稳性检验

在使用ARIMA模型进行销售额预测之前，需要查看时间序列是否平稳，若数据非平稳，在数据分析挖掘的时候，则可能会产生“伪回归”等问题，从而影响分析结果。通过时间序列的时序图、自相关图及其单位根查看时间序列平稳性，时序图如图16所示，自相关图如图17所示，单位根检验结果如图18所示。

图16 原始序列的时序图

图17 原始序列的自相关图

图18 原始序列的单位根检验结果

由图16可知，时序图显示该序列具有明显的递增趋势，可以判断为原始序列数据是非平稳序列；图17的自相关图显示的自相关系数大部分均大于零，说明序列间具有一定的长期相关性。由图18可知，在单位根检验统计量中，p值为0.251134，其值显著大于0.05，可以推断出该序列为非平稳序列（非平稳序列一定不是白噪声序列）。

绘制时序图、自相关图并进行单位根检验如代码清单15所示。

代码清单15 绘制时序图、自相关图并进行单位根检验

# 平稳性检验

# 判断是否为时间序列

plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签

plt.rcParams['axes.unicode_minus'] = False  # 显示负号

plt.figure(figsize=(8, 5))

plt.plot(data_w)

plt.tick_params(labelsize=14)  # 设置坐标轴字体大小

plt.show()

 

# 定义绘制自相关图函数

def draw_acf(ts):

    plt.figure(facecolor='white', figsize=(10, 8))

    plot_acf(ts)

    plt.show()

# 定义单位根检验函数

def testStationarity(ts):

    dftest = ADF(ts)

    # 对ADF求得的值进行语义描述

    dfoutput = pd.Series(dftest[0:4], index = ['Test Statistic','p-value','#Lags Used',

                                               'Number of Observations Used'])

    for key, value in dftest[4].items():

        dfoutput['Critical Value (%s)'%key] = value

    return dfoutput

 

# 自相关

draw_acf(data_w)

# 单位根检验

print('单位根检验结果为：\n', testStationarity(data_w))

3.差分处理

在进行平稳性检验后，发现原始序列数据属于非平稳序列，而在使用ARIMA模型进行销售额预测时，需要序列数据是平稳序列，以避免序列中的随机游走形势影响预测结果。在Python中，可以通过二阶差分处理对数据进行平稳化操作，并查看二阶差分之后序列的平稳性和白噪声，其中二阶差分后序列的时序图如图19所示，二阶差分后序列的自相关图如图20所示，二阶差分后序列的单位根检验结果如图21所示，二阶差分后序列的白噪声检验结果如图22所示。

图19 二阶差分后序列的时序图

图20 二阶差分后序列的自相关图

图21 二阶差分后序列的单位根检验结果

图22 二阶差分后序列的白噪声检验结果

由图19可知，该序列无明显趋势，较为稳定；图20的自相关图显示自相关系数较为均匀，且较为接近于0，有较强的短期相关性。由图21可知，二阶差分后序列的单位根检验p值远小于0.05，可以判断出差分处理后的序列是平稳序列。由图22可知，在白噪声检验结果中，输出的p值小于0.05，同时结合单位根检验结果可以判断二阶差分之后的序列是平稳非白噪声序列。

差分处理并查看序列平稳性和白噪声如代码清单16所示。

代码清单16 差分处理并查看序列平稳性和白噪声

# 二阶差分处理

data_w_T1 = data_w.diff().dropna()

data_w_T2 = data_w_T1.diff().dropna()

# 差分后的时间序列图

plt.figure(figsize=(8, 5))

plt.plot(data_w_T2)

plt.tick_params(labelsize=14)

plt.show()

 

# 差分自相关

draw_acf(data_w_T2)

# 差分单位根检验

print('差分单位根检验结果为：\n', testStationarity(data_w_T2))

# 白噪声检验

print('差分白噪声检验结果为：\n', acorr_ljungbox(data_w_T2, lags=1))

4.模型定阶

通常情况下，在进行模型预测前，需要寻找最优模型，以提高预测结果的准确性。针对ARIMA模型，可以通过BIC矩阵进行模型定阶。由于4.4.3小节进行了二阶差分处理，所以d＝2。通过计算ARIMA(p,2,q)中所有组合的BIC信息量，取最小BIC信息量所对应的模型阶数，进而确定p值和q值，结果如图23所示。

图23 模型定阶

由操作结果可知，当p值为0、q值为1时，BIC值最小，到此p、q定阶完成。

模型定阶如代码清单17所示。

代码清单17 模型定阶

# 通过BIC矩阵进行模型定阶

data_w = data_w.astype(float)

pmax = 3

qmax = 3

bic_matrix = []  # 初始化BIC矩阵

for p in range(pmax+1):

    tmp = []

    for q in range(qmax+1):

        try:

            tmp.append(ARIMA(data_w, (p, 2, q)).fit().bic)

        except:

            tmp.append(None)

        bic_matrix.append(tmp)

bic_matrix = pd.DataFrame(bic_matrix)

# 找出最小值位置

p, q = bic_matrix.stack().idxmin()

print('当BIC最小时，p值和q值分别为: ', p, q)

5.模型预测

应用ARIMA(0, 2, 1)模型对未来4周内商品的销售额进行预测，结果如图24所示。

图24预测未来4周的销售额

预测未来4周内商品的销售额如代码清单18所示。

代码清单18 预测未来4周内商品的销售额

# 构建ARIMA(0, 2, 1)模型

model = ARIMA(data_w, (p, 2, q)).fit()

 

# 预测未来4周的销售额

print('预测未来4周的销售额，其预测结果、标准误差、置信区间如下。\n', model.forecast(4))

注：利用ARIMA模型向前预测的周期越长，其误差越大。

赠书活动

本次送书1~4本【取决于阅读量，阅读量越多，送的越多】
⌛️活动时间：截止到2023-10月 26号
✳️参与方式：关注博主+三连（点赞、收藏、评论）

转载自:https://blog.csdn.net/u014727709/article/details/133796236
欢迎start，欢迎评论，欢迎指正

你可能感兴趣的:(#,赠书活动,数据挖掘,python,数据分析,售货机,销售)

理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动李蕾1229
为促进我校教师专业发展，发挥骨干教师的引领带头作用，11月6日下午，我校举行新老教师师徒结对仪式暨名师专业工作室工作交流活动。图片发自App会议由教师发展处李蕾主任主持，首先，由范校长宣读新老教师结对名单及双方承担职责。随后，两位新调入教师陈玉萍、莫正杰分别和他们的师傅鲍元美、刘召彬老师签订了师徒结对协议书。图片发自App图片发自App师徒拥抱、握手。有了师傅就有了目标有了方向，相信两位新教师在师
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
水泥质量纠纷案代理词徐宝峰律师
贵州领航建设有限公司诉贵州纳雍隆庆乌江水泥有限公司产品质量纠纷案代理词尊敬的审判长、审判员：贵州千里律师事务所接受被告贵州纳雍隆庆乌江水泥有限公司的委托，指派我担任其诉讼代理人，参加本案的诉讼活动。下面，我结合本案事实和相关法律规定发表如下代理意见，供合议庭评议案件时参考：原告应当举证证明其遭受的损失与被告生产的水泥质量的因果关系。首先水泥是一种粉状水硬性无机胶凝材料。加水搅拌后成浆体，能在空气中
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
2019-08-08 65454
东莞家庭聚会出行旅游去哪里玩住？想起来有很久没有和家里人聚会啦，这次组织家人来到威廉古堡别墅轰趴，一大家子27个人，在别墅订了一天办，玩的非常的开心，小孩子玩游戏机，也很放心不会丢，我们就在唱歌、打麻将、打桌球一系列的活动，还准备小次等小孩生日在别墅举办，还可以给孩子做一个生日的策划
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
读书||陶新华《教育中的积极心理学》1—28 流水淙淙2022
读一本好书，尤如和一位高尚者对话，亦能对人的精神进行洗礼。但是若不能和实践结合起来，也只能落到空读书的状态。读书摘要与感想1、塞利格曼在《持续的幸福》一书中提出了幸福2.0理论，提出幸福由5个元素决定——积极情绪、投入的工作和生活、目标和意义、和谐的人际关系、成就感。2、人的大脑皮层在进行智力活动时，都伴有皮下中枢活动，对这些活动进行体验请假，并由此产生了情感解读。人的情绪情感体验总是优先于大脑的
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
2018-12-29 枫叶红时总多离别
2018年12月29日星期六昨天老师就告诉我们，今天下午不用上课，是图书漂流活动会。我觉得很兴奋，好期待。到了下午，我帮好忙就到外面去买书，刚一出去，就有一大帮的大哥哥、大姐姐围着我问要不要买书，买一本书送一颗糖。我看到了一本《小老虎比上树》的书，问大姐姐多少钱，大姐姐说这本书原价13块，现在便宜4块钱也就是9块钱卖给你，我就把一张10块钱给她找，她找了我一块钱。我现在想想我今天只带了10块钱，现
那个严厉的启蒙老师小米星的天空
本文参加鹏哥教师节征文活动我的启蒙老师李老师，大概是唯一动手打过我，但是我仍然很感恩的老师吧。李老师当年四十多岁，擅长珠心算教学，算是我们乡镇小学的王牌老师。李老师很严厉，不仅要骂学生，还要动手打人，他的大眼睛一瞪，全班同学都瑟瑟发抖。在九十年代，家长不像现在这样宠溺孩子。许多家长都跟老师说，管得严一点，不听话就给我打。那时候棍棒教育是很正常的，教室里的木质米尺，常常因为被用来打调皮男生的屁股而折
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http