东离与糖宝

Python数据挖掘入门进阶与实用案例：自动售货机销售数据分析与应用

文章目录

写在前面
01 案例背景
02 分析目标
03 分析过程
04 数据预处理
- 1. 清洗数据
- 2.属性选择
- 3.属性规约
05 销售数据可视化分析
- 1.销售额和自动售货机数量的关系
- 2.订单数量和自动售货机数量的关系
- 3.畅销和滞销商品
- 4.自动售货机的销售情况
- 5.订单支付方式占比
- 6.各消费时段的订单用户占比
06 销售额预测
- 1.统计周销售额
- 2.平稳性检验
- 3.差分处理
- 4.模型定阶
- 5.模型预测
写作末尾

写在前面

本案例将主要结合自动售货机的实际情况，对销售的历史数据进行处理，利用pyecharts库、Matplotlib库进行可视化分析，并对未来4周商品的销售额进行预测，从而为企业制定相应的自动售货机市场需求分析及销售建议提供参考依据。更多详细内容请参考《Python数据挖掘：入门进阶与实用案例分析》一书。

01 案例背景

近年来，随着我国经济技术的不断提升，自动化机械在人们日常生活中扮演着越来越重要的角色，更多的被应用在不同的领域。而作为新的一种自动化零售业态，自动售货机在日常生活中应用越来越广泛。自动售货机销售产业在走向信息化、合理化同时，也面临着高度同质化、成本上升、毛利下降等诸多困难与问题，这也是大多数企业所会面临到的问题。

为了提高市场占有率和企业的竞争力，某企业在广东省某8个市部署了376台自动售货机，但经过一段时间后，发现其经营状况并不理想。而如何了解销售额、订单数量与自动售货机数量之间的关系，畅销或滞销的商品又有哪些，自动售货机的销售情况等，已成为该企业亟待解决的问题。

02 分析目标

获取了该企业某6个月的自动售货机销售数据，结合销售背景进行分析，并可视化展现销售现状，同时预测未来一段时间内的销售额，从而为企业制定营销策略提供一定的参考依据。

03 分析过程

04 数据预处理

1. 清洗数据

1.1 合并订单表并处理缺失值

由于订单表的数据是按月份分开存放的，为了方便后续对数据进行处理和可视化，所以需要对订单数据进行合并处理。同时，在合并订单表的数据后，为了了解订单表的缺失数据的基本情况，需要进行缺失值检测。合并订单表并进行缺失值检测，操作结果如图1所示。

由操作结果可知，合并后的订单数据有350867条记录，且订单表中含有缺失值的记录总共有279条，其数量相对较少，可直接使用删除法对其中的缺失值进行处理。

合并订单表、查看缺失值并处理缺失值，如代码清单1所示。

import pandas as pd

# 读取数据
data4 = pd.read_csv('../data/订单表2018-4.csv', encoding='gbk')
data5 = pd.read_csv('../data/订单表2018-5.csv', encoding='gbk')
data6 = pd.read_csv('../data/订单表2018-6.csv', encoding='gbk')
data7 = pd.read_csv('../data/订单表2018-7.csv', encoding='gbk')
data8 = pd.read_csv('../data/订单表2018-8.csv', encoding='gbk')
data9 = pd.read_csv('../data/订单表2018-9.csv', encoding='gbk')

# 合并数据
data = pd.concat([data4, data5, data6, data7, data8, data9], ignore_index=True)
print('订单表合并后的形状为', data.shape)
# 缺失值检测
print('订单表各属性的缺失值数目为：\n', data.isnull().sum())
data = data.dropna(how='any')  # 删除缺失值

1.2 增加“市”属性

为了满足后续的数据可视化需求，需要在订单表中增加“市”属性，操作结果如图2所示。

增加“市”属性如代码清单2所示。

# 从省市区属性中提取市的信息，并创建新属性

data['市'] = data['省市区'].str[3: 6]

print('经过处理后的数据前5行为：\n', data.head())

1.3 处理订单表中的“商品详情”属性

通过浏览订单表数据发现，在“商品详情”属性中存在有异名同义的情况，即两个名称不同的值所代表的实际意义是一致的，如“脉动青柠X1;”“脉动青柠x1;”等。因为此情况会对后面的分析结果造成一定的影响，所以需要对订单表中的“商品详情”属性进行处理，增加“商品名称”属性，如代码清单3所示。

# 定义一个需剔除字符的列表error_str
error_str = [' ', '(', ')', '（', '）', '0', '1', '2', '3', '4', '5', '6',
             '7', '8', '9', 'g', 'l', 'm', 'M', 'L', '听', '特', '饮', '罐',
             '瓶', '只', '装', '欧', '式', '&', '%', 'X', 'x', ';']

# 使用循环剔除指定字符
for i in error_str:
    data['商品详情'] = data['商品详情'].str.replace(i, '')

# 新建“商品名称”属性，用于新数据的存放
data['商品名称'] = data['商品详情']

1.4 处理“总金额（元）”属性

此外，当浏览订单表数据时，发现在“总金额（元）”属性中，存在极少订单的金额很小，如0、0.01等。在现实生活中，这种记录存在的情况极少，且这部分数据不具有分析意义。因此，在本案例中，对订单的金额小于0.5的记录进行删除处理，操作结果如图3所示。

由操作结果可知，删除前的数据行列数目为(350617, 17)，删除后的数据行列数目为(350450, 17)。

删除“总金额（元）”属性中订单的金额较少的记录如代码清单4所示。

# 删除金额较少的订单前的数据行列数目
print(data.shape)

# 删除金额较少的订单后的数据行列数目
data = data[data['总金额（元）'] >= 0.5]
print(data.shape)

2.属性选择

因为订单表中的“手续费（元）”“收款方”“软件版本”“省市区”“商品详情”“退款金额（元）”等属性对本案例的分析没有意义，所以需要对其进行删除处理，选择合适的属性，操作的结果如图4所示。

属性选择如代码清单5所示。

# 对于订单表数据选择合适的属性
data = data.drop(['手续费（元）', '收款方', '软件版本', '省市区', '商品详情', '退款金额（元）'], axis=1)
print('选择后，数据属性为：\n', data.columns.values)

3.属性规约

在订单表“下单时间”属性中含有的信息量较多，并且存在概念分层的情况，需要对属性进行数据规约，提取需要的信息。提取相应的“小时”属性和“月份”属性，进一步泛化“小时”属性为“下单时间段”属性，规则如下：

在Python中规约订单表的属性，如代码清单6所示。

# 将时间格式的字符串转换为标准的时间格式
data['下单时间'] = pd.to_datetime(data['下单时间'])
data['小时'] = data['下单时间'].dt.hour  # 提取时间中的小时
data['月份'] = data['下单时间'].dt.month  # 提取时间中的月份
data['下单时间段'] = 'time'  # 新增“下单时间段”属性，并将其初始化为time
exp1 = data['小时'] <= 5  # 判断小时是否小于等于5

# 若条件为真，则时间段为凌晨
data.loc[exp1, '下单时间段'] = '凌晨'

# 判断小时是否大于5且小于等于8
exp2 = (5 < data['小时']) & (data['小时'] <= 8)

# 若条件为真，则时间段为早晨
data.loc[exp2, '下单时间段'] = '早晨'

# 判断小时是否大于8且小于等于11
exp3 = (8 < data['小时']) & (data['小时'] <= 11)

# 若条件为真，则时间段为上午
data.loc[exp3, '下单时间段'] = '上午'

# 判断小时是否小大于11且小于等于13
exp4 = (11 < data['小时']) & (data['小时'] <= 13)

# 若条件为真，则时间段为中午
data.loc[exp4, '下单时间段'] = '中午'

# 判断小时是否大于13且小于等于16
exp5 = (13 < data['小时']) & (data['小时'] <= 16)

# 若条件为真，则时间段为下午
data.loc[exp5, '下单时间段'] = '下午'

# 判断小时是否大于16且小于等于19
exp6 = (16 < data['小时']) & (data['小时'] <= 19)

# 若条件为真，则时间段为傍晚
data.loc[exp6, '下单时间段'] = '傍晚'

# 判断小时是否大于19且小于等于24
exp7 = (19 < data['小时']) & (data['小时'] <= 24)

# 若条件为真，则时间段为晚上
data.loc[exp7, '下单时间段'] = '晚上'
data.to_csv('../tmp/order.csv', index=False, encoding = 'gbk')

05 销售数据可视化分析

在销售数据中含有的数据量较多，作为企业管理人员以及决策制定者，无法直观了解目前自动售货机的销售状况。因此需要利用处理好的数据进行可视化分析，直观地展示销售走势以及各区销售情况等，为决策者提供参考。

1.销售额和自动售货机数量的关系

探索6个月销售额和自动售货机数量之间的关系，并按时间走势进行可视化分析，结果如图5所示。

由图5可知，4月至7月，自动售货机的数量在增加，销售额也随着自动售货机的数量增加而增加；8月，虽然自动售货机数量减少了4台，但是销售额还在增加；9月相比8月的自动售货机数量减少了6台，销售额也随着减少。可以推断出销售额与自动售货机的数量存在一定的相关性，增加自动售货机的数量将会带来销售额的增长。出现该情况可能是因为广东处于亚热带，气候相对炎热，而7、8、9月的气温也相对较高，人们使用自动售货机的频率也相对较高。

探索销售额和自动售货机数量之间的关系如代码清单7所示。

import pandas as pd
import numpy as np
from pyecharts.charts import Line
from pyecharts import options as opts
import matplotlib.pyplot as plt
from pyecharts.charts import Bar
from pyecharts.charts import Pie
from pyecharts.charts import Grid

data = pd.read_csv('../tmp/order.csv', encoding='gbk')

def f(x):
    return len(list(set((x.values))))
# 绘制销售额和自动售货机数量之间的关系图
groupby1 = data.groupby(by='月份', as_index=False).agg({'设备编号': f, '总金额（元）': np.sum})
groupby1.columns = ['月份', '设备数量', '销售额']
line = (Line()
        .add_xaxis([str(i) for i in groupby1['月份'].values.tolist()])
        .add_yaxis('销售额', np.round(groupby1['销售额'].values.tolist(), 2))
        .add_yaxis('设备数量', groupby1['设备数量'].values.tolist(), yaxis_index=1,symbol='triangle')
        .set_series_opts(label_opts=opts.LabelOpts(is_show=True, position='top', font_size=10))
        .set_global_opts(
            xaxis_opts=opts.AxisOpts(name='月份', name_location='center', name_gap=25),
            title_opts=opts.TitleOpts(title='销售额和自动售货机数量之间的关系'),
            yaxis_opts=opts.AxisOpts( name='销售额（元）', name_location='center', name_gap=60,
                axislabel_opts=opts.LabelOpts(
                formatter='{value}')))
        .extend_axis(
            yaxis=opts.AxisOpts( name='设备数量（台）', name_location='center', name_gap=40,
                axislabel_opts=opts.LabelOpts(
                formatter='{value}'), interval=50))
        )
line.render_notebook()

2.订单数量和自动售货机数量的关系

探索6个月订单数量和自动售货机数量之间的关系，并按时间走势进行可视化分析，结果如图6所示。

由图6可知，4月至7月，自动售货机数量呈上升趋势，订单数量也随着自动售货机数量增加而增加，而8月至9月，自动售货机数量在减少，订单数量也在减少。这说明了订单数量与自动售货机的数量是严格相关的，增加自动售货机会给用户带来便利，从而提高订单数量。同时，结合图5可知，订单数量和销售额的变化趋势基本保持一样的变化趋势，这也说明了订单数量和销售额存在一定的相关性。

由于各市的设备数量并不一致，所以探索各市自动售货机的平均销售总额，并进行对比分析，结果如图7所示。

由图7可知，深圳市自动售货机平均销售总额最高，达到了6538.28元，排在其后的是珠海市和中山市。而最少的是清远市，其平均销售总额只有414.27元。出现此情况可能是因为不同区域的人流量不同，而深圳市相对于其他区域的人流量相对较大，清远市相对于其他区域的人流量相对较小。此外，广州市的人流量也相对较大，但其平均销售总额却相对较少，可能是因为自动售货机放置不合理导致的。

探索订单数量和自动售货机数量之间的关系，以及各市自动售货机的平均销售总额如代码清单8所示。

groupby2 = data.groupby(by='月份', as_index=False).agg({'设备编号': f, '订单编号': f})
groupby2.columns = ['月份', '设备数量', '订单数量']

# 绘制图形
plt.figure(figsize=(10, 4))
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
fig, ax1 = plt.subplots() # 使用subplots函数创建窗口
ax1.plot(groupby2['月份'], groupby2['设备数量'], '--')
ax1.set_yticks(range(0, 350, 50))  # 设置y1轴的刻度范围
ax1.legend(('设备数量',), loc='upper left', fontsize=10)
ax2 = ax1.twinx()  # 创建第二个坐标轴
ax2.plot(groupby2['月份'], groupby2['订单数量'])
ax2.set_yticks(range(0, 100000, 10000))  # 设置y2轴的刻度范围
ax2.legend(('订单数量',), loc='upper right', fontsize=10)
ax1.set_xlabel('月份')
ax1.set_ylabel('设备数量（台）')
ax2.set_ylabel('订单数量（单）')
plt.title('订单数量和自动售货机数量之间的关系')
plt.show()
gruop3 = data.groupby(by='市', as_index=False).agg({'总金额（元）':sum, '设备编号':f})
gruop3['销售总额'] = np.round(gruop3['总金额（元）'], 2)
gruop3['平均销售总额'] = np.round(gruop3['销售总额'] / gruop3['设备编号'], 2)
plt.bar(gruop3['市'].values.tolist(), gruop3['平均销售总额'].values.tolist(), color='#483D8B')
# 添加数据标注
for x, y in enumerate(gruop3['平均销售总额'].values):
    plt.text(x - 0.4, y + 100, '%s' %y, fontsize=8)
plt.xlabel('城市')
plt.ylabel('平均销售总额（元）')
plt.title('各市自动售货机平均销售总额')
plt.show()

3.畅销和滞销商品

查找6个月销售额排名前10和后10的商品，从而找出畅销商品和滞销商品，并对其销售额进行可视化分析，结果如图8、图9所示。

由图8可知，销售额排在第一的是商品0015，达到了56230.2元，其次是商品0013和商品0004等商品。由图9可知，销售额排在最后的商品是商品0104、商品0687和商品0540，其销售金额只有1元。

探索6个月销售额排名前10和后10的商品如代码清单9所示。

# 销售额前10的商品
group4 = data.groupby(by='商品ID', as_index=False)['总金额（元）'].sum()
group4.sort_values(by='总金额（元）', ascending=False, inplace=True)
d = group4.iloc[: 10]
x_data = d['商品ID'].values.tolist()
y_data = np.round(d['总金额（元）'].values, 2).tolist()
bar = (Bar(init_opts=opts.InitOpts(width='800px',height='600px'))
       .add_xaxis(x_data)
       .add_yaxis('', y_data, label_opts=opts.LabelOpts(font_size=15))
       .set_global_opts(title_opts=opts.TitleOpts(title='畅销前10的商品'),
                        yaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(
                            formatter='{value}',font_size=15)),
                        xaxis_opts=opts.AxisOpts(type_='category',
                            axislabel_opts=opts.LabelOpts({'interval': '0'}, font_size=15, rotate=30))))
bar.render_notebook()

h = group4.iloc[-10: ]
x_data = h['商品ID'].values.tolist()
y_data = np.round(h['总金额（元）'].values, 2).tolist()
bar = (Bar()
       .add_xaxis(x_data)
       .add_yaxis('', y_data, label_opts=opts.LabelOpts(position='right'))
       .set_global_opts(title_opts=opts.TitleOpts(
                        title='滞销前10的商品'),
                        xaxis_opts=opts.AxisOpts(
                            axislabel_opts={'interval': '0'}))
       .reversal_axis()
       )
grid = Grid(init_opts=opts.InitOpts(width='600px', height='400px'))
grid.add(bar, grid_opts=opts.GridOpts(pos_left='18%'))
grid.render_notebook()

4.自动售货机的销售情况

探索6个月销售额前10以及销售额后10的设备及其所在的城市，并进行可视化分析，结果如图10、图11所示。

由图10可知，销售额靠前的设备所在城市主要集中在中山市、广州市、东莞市和深圳市，其中，销售额前3的设备都集中在中山市。由图11可知，广州市的设备113024、112719、112748的销售额只有1元，而销售额后10的设备全部在广州市和中山市。

探索6个月销售额前10以及销售额后10的设备及其所在的城市如代码清单10所示。

group5 = data.groupby(by=['市', '设备编号'], as_index=False)['总金额（元）'].sum()
group5.sort_values(by='总金额（元）', ascending=False, inplace=True)
b = group5[: 10]
label = []

# 销售额前10的设备及其所在市
for i in range(len(b)):
    a = b.iloc[i, 0] + str(b.iloc[i, 1])
    label.append(a)
x = np.round(b['总金额（元）'], 2).values.tolist()
y = range(10)
plt.bar(x=0, bottom=y, height=0.4, width=x, orientation='horizontal')
plt.xticks(range(0, 80000, 10000))  # 设置x轴的刻度范围
plt.yticks(range(10), label)

for y, x in enumerate(np.round(b['总金额（元）'], 2).values):
    plt.text(x + 500, y - 0.2, "%s" %x)
plt.xlabel('总金额（元）')
plt.title('销售额前10的设备及其所在市')
plt.show()
l = group5[-10: ]
label1 = []

for i in range(len(l)):
    a = l.iloc[i, 0] + str(l.iloc[i, 1])
    label1.append(a)
x = np.round(l['总金额（元）'], 2).values.tolist()
y = range(10)
plt.bar(x=0, bottom=y, height=0.4, width=x, orientation='horizontal')
plt.xticks(range(0, 4, 1))  # 设置x轴的刻度范围
plt.yticks(range(10), label1)

for y, x in enumerate(np.round(l['总金额（元）'], 2).values):
    plt.text(x, y, "%s" %x)
plt.xlabel('总金额（元）')
plt.title('销售额后10的设备及其所在市')
plt.show()

统计各城市销售额小于100的设备数量，并进行可视化分析，结果如图12所示。

由图12可知，销售额小于100的设备在广州市有52台，中山市有20台，佛山市有10台。出现这种情况的原因可能是设备放置位置的不合理，或设备放置过多造成的，因此可以适当调整自动售货机放置的位置和数量，减少设备和人员的浪费。

探索各城市销售额小于100元的设备数量如代码清单11所示。

l_b = group5[group5['总金额（元）'] < 100]
lb = l_b.groupby(by='市', as_index=False)['设备编号'].count()
x_data = lb['市'].values.tolist()
y_data = lb['设备编号'].values.tolist()
bar = (Bar(init_opts=opts.InitOpts(width='500px', height='400px'))
       .add_xaxis(x_data)
       .add_yaxis('', y_data)
       .set_global_opts(title_opts=opts.TitleOpts(
                title='各市销售额小于100的设备数量'))
       )
bar.render_notebook()

5.订单支付方式占比

对自动售货机上各商品订单的支付方式进行统计，并进行可视化分析，结果如图13所示。

由图13可知，订单的主要支付方式有4种，即微信、支付宝、会员余额和现金，其中支付方式最多的是微信支付，在所有支付方式中占到了89.05%。其次是支付宝支付，其占比为9.87%，而现金支付和会员余额支付的占比不到1%。

分析订单支付方式占比如代码清单12所示。

group6 = data.groupby(by='支付状态')['支付状态'].count()
method = group6.index.tolist()
num = group6.values.tolist()
pie_data = [(i, j) for i, j in zip(method, num)]
pie = (Pie()
     .add('', pie_data, label_opts=opts.LabelOpts(formatter='{b}:{c}({d}%)'))
     .set_global_opts(title_opts=opts.TitleOpts(title='订单支付方式占比')))
pie.render_notebook()

6.各消费时段的订单用户占比

在自动售货机的商品下单时间段上，统计各消费时段的订单用户数量，并进行可视化分析，结果如图14所示。

由图14可知，当消费时间段在下午时，其订单用户最多，占比达到了21.44%，其次是晚上，占比是17.36%，上午的占比也有17.08%，其余时间段的占比相对较少。

分析各消费时段的订单用户如代码清单13所示。

group7 = data.groupby(by='下单时间段')['购买用户'].count()
times = group7.index.tolist()
num = group7.values.tolist()
pie_data_2 = [(i, j) for i, j in zip(times, num)]
pie = (Pie()
       .add('', pie_data_2, label_opts=opts.LabelOpts(formatter='{b}:{c}({d}%)'),
            radius=[60, 200], rosetype='radius', is_clockwise=False)
       .set_global_opts(title_opts=opts.TitleOpts(title='各消费时段的订单用户占比'))
       )
pie.render_notebook()

06 销售额预测

精准的销售额预测对于企业运营有着非常重要的指导意义，可以指导运营后台提前进行合理的资源配置，帮助企业管理人员制定合理的目标。同时，还可以更好地帮助企业采取更为针对性的促销手段，更加明确市场的需求，可以根据不同区域、不同时间划分等制定更加有效、合理的配货方案和商品价格，从而增加企业经营收益。

自动售货机的销售额预测指的是从售货机已有销售额的订单数据资料中，总结出商品销售额的变化规律，并根据该规律构建ARIMA模型，动态预测未来4周内商品的销售额。

ARIMA模型的建模步骤如图15所示。

1.统计周销售额

通过观察订单数据，发现该数据集记录的是当前日期时间下，售货机所售卖商品的订单状况，其出货状态有出货成功、出货失败、未出货等多种情况。然而，为预测未来4周的销售额，其所需样本数据应为实际的周销售额数据，因此，需要筛选状态为出货成功的数据并统计各周销售额，如代码清单14所示。

import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.stattools import adfuller as ADF
from statsmodels.graphics.tsaplots import plot_acf
from statsmodels.stats.diagnostic import acorr_ljungbox
from statsmodels.tsa.arima_model import ARIMA

data = pd.read_csv('../tmp/order.csv', encoding='gbk')
# 提取出货状态为“出货成功”的下单时间和总金额（元）数据
data_info = data.loc[data['出货状态'] == '出货成功', ['下单时间', '总金额（元）']]
data_info = data_info.set_index('下单时间')  # 将下单时间设为索引
# 将索引修改为日期时间格式
data_info.index = pd.to_datetime(data_info.index)
# 按周对总金额进行汇总，即求和
data_w = data_info.resample('W').sum()

2.平稳性检验

在使用ARIMA模型进行销售额预测之前，需要查看时间序列是否平稳，若数据非平稳，在数据分析挖掘的时候，则可能会产生“伪回归”等问题，从而影响分析结果。通过时间序列的时序图、自相关图及其单位根查看时间序列平稳性，时序图如图16所示，自相关图如图17所示，单位根检验结果如图18所示。

由图16可知，时序图显示该序列具有明显的递增趋势，可以判断为原始序列数据是非平稳序列；图17的自相关图显示的自相关系数大部分均大于零，说明序列间具有一定的长期相关性。由图18可知，在单位根检验统计量中，p值为0.251134，其值显著大于0.05，可以推断出该序列为非平稳序列（非平稳序列一定不是白噪声序列）。

绘制时序图、自相关图并进行单位根检验如代码清单15所示。

# 平稳性检验
# 判断是否为时间序列
plt.rcParams['font.sans-serif'] = ['SimHei']  # 显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 显示负号
plt.figure(figsize=(8, 5))
plt.plot(data_w)
plt.tick_params(labelsize=14)  # 设置坐标轴字体大小
plt.show()
# 定义绘制自相关图函数
def draw_acf(ts):
    plt.figure(facecolor='white', figsize=(10, 8))
    plot_acf(ts)
    plt.show()
# 定义单位根检验函数
def testStationarity(ts):
    dftest = ADF(ts)
    # 对ADF求得的值进行语义描述
    dfoutput = pd.Series(dftest[0:4], index = ['Test Statistic','p-value','#Lags Used',
                                               'Number of Observations Used'])
    for key, value in dftest[4].items():
        dfoutput['Critical Value (%s)'%key] = value
    return dfoutput
# 自相关
draw_acf(data_w)
# 单位根检验
print('单位根检验结果为：\n', testStationarity(data_w))

3.差分处理

在进行平稳性检验后，发现原始序列数据属于非平稳序列，而在使用ARIMA模型进行销售额预测时，需要序列数据是平稳序列，以避免序列中的随机游走形势影响预测结果。在Python中，可以通过二阶差分处理对数据进行平稳化操作，并查看二阶差分之后序列的平稳性和白噪声，其中二阶差分后序列的时序图如图19所示，二阶差分后序列的自相关图如图20所示，二阶差分后序列的单位根检验结果如图21所示，二阶差分后序列的白噪声检验结果如图22所示。

由图19可知，该序列无明显趋势，较为稳定；图20的自相关图显示自相关系数较为均匀，且较为接近于0，有较强的短期相关性。由图21可知，二阶差分后序列的单位根检验p值远小于0.05，可以判断出差分处理后的序列是平稳序列。由图22可知，在白噪声检验结果中，输出的p值小于0.05，同时结合单位根检验结果可以判断二阶差分之后的序列是平稳非白噪声序列。

差分处理并查看序列平稳性和白噪声如代码清单16所示。

# 二阶差分处理
data_w_T1 = data_w.diff().dropna()
data_w_T2 = data_w_T1.diff().dropna()

# 差分后的时间序列图
plt.figure(figsize=(8, 5))
plt.plot(data_w_T2)
plt.tick_params(labelsize=14)
plt.show()

# 差分自相关
draw_acf(data_w_T2)
# 差分单位根检验
print('差分单位根检验结果为：\n', testStationarity(data_w_T2))
# 白噪声检验
print('差分白噪声检验结果为：\n', acorr_ljungbox(data_w_T2, lags=1))

4.模型定阶

通常情况下，在进行模型预测前，需要寻找最优模型，以提高预测结果的准确性。针对ARIMA模型，可以通过BIC矩阵进行模型定阶。由于4.4.3小节进行了二阶差分处理，所以d＝2。通过计算ARIMA(p,2,q)中所有组合的BIC信息量，取最小BIC信息量所对应的模型阶数，进而确定p值和q值，结果如图23所示。

由操作结果可知，当p值为0、q值为1时，BIC值最小，到此p、q定阶完成。

模型定阶如代码清单17所示。

# 通过BIC矩阵进行模型定阶
data_w = data_w.astype(float)
pmax = 3
qmax = 3
bic_matrix = []  # 初始化BIC矩阵
for p in range(pmax+1):
    tmp = []
    for q in range(qmax+1):
        try:
            tmp.append(ARIMA(data_w, (p, 2, q)).fit().bic)
        except:
            tmp.append(None)
        bic_matrix.append(tmp)
bic_matrix = pd.DataFrame(bic_matrix)
# 找出最小值位置
p, q = bic_matrix.stack().idxmin()
print('当BIC最小时，p值和q值分别为: ', p, q)

5.模型预测

应用ARIMA(0, 2, 1)模型对未来4周内商品的销售额进行预测，结果如图24所示。

预测未来4周内商品的销售额如代码清单18所示。

# 构建ARIMA(0, 2, 1)模型
model = ARIMA(data_w, (p, 2, q)).fit()
 
# 预测未来4周的销售额
print('预测未来4周的销售额，其预测结果、标准误差、置信区间如下。\n', model.forecast(4))

注：利用ARIMA模型向前预测的周期越长，其误差越大。

写作末尾

《Python数据挖掘：入门、进阶与实用案例分析》：免费包邮送出
根据博客阅读量本次活动一共赠书若干本，评论区抽取若干位小伙伴免费送出2本书
参与方式：关注博主、点赞、收藏、评论区任意评论（不低于10个字，被折叠了无法参与抽奖，切记要点赞+收藏，否则抽奖无效，每个人最多评论三次）
活动截止时间：2023-10-17 12:00:00
开奖时间：2023-10-21 14:00:00
中奖通知方式：私信通知
中奖名单公布：https://bbs.csdn.net/forums/8318f682fbdb4e94b09bb465f04c4408

你可能感兴趣的:(合作推广,数据挖掘,python,数据分析,大数据)

「Python系列」Python uWSGI ·零落· Python入门到掌握 python 开发语言 uWSGI
文章目录一、PythonuWSGI简介二、PythonuWSGI安装配置三、PythonuWSGI应用案例前提条件步骤1：创建Django项目步骤2：配置Django项目步骤3：创建uWSGI配置文件步骤4：启动uWSGI步骤5：配置Web服务器四、PythonuWSGI常见问题常见问题1：uWSGI无法找到应用模块常见问题2：uWSGI和Nginx通信问题常见问题3：uWSGI进程管理常见问题4
Python系列（亲测有效）：uwsgi: command not found（python环境明明安装了）、uwsgi出现invalid request block size: 21573 (max 坦笑&&life #python python 网络开发语言
uwsgi:commandnotfound（python环境明明安装了）、uwsgi出现invalidrequestblocksize:21573(max一.uwsgi:commandnotfound问题描述：uwsgi:commandnotfound解决办法：找到uwsgi执行位置，建立软链接软连接做了，测试uwsgi是否正常运行创建test.py文件如下：运行方式运行方式一：运行方式二：访问均
基于opencv消除图片马赛克小苗爸爸 opencv 人工智能计算机视觉
以下是一个基于Python的图片马赛克消除函数实现，结合了图像处理和深度学习方法。由于马赛克消除涉及复杂的图像重建任务，建议根据实际需求选择合适的方法：importcv2importnumpyasnpfromPILimportImagedefremove_mosaic(image_path,output_path,method='traditional',block_size=10,scale_f
部署Django+nginx+uwsgi到ubuntu服务器 Mr番茄蛋问题解决 python Linux
前提：Django程序可以正常运行，注意服务器python版本和本地版本可能不一致，有可能不能正常运行Django程序。安装过程更新ubuntu的python比如更新到3.6，先拉取新的仓库，再更新安装sudoadd-apt-repositoryppa:jonathonf/python-3.6sudoaptupdatesudoaptinstallpython3.6创建虚拟环境安装虚拟环境命令sud
Python将json格式数据存储到Mysql数据库代码轨迹 Python python 数据库 json
Python操作Mysql数据库1.安装pipinstallmysql-connector-python2.数据库插入json格式数据importmysql.connectorimportjsonfromdatetimeimportdatetime#创建数据库连接db=mysql.connector.connect( host="localhost", #MySQL服务器地址 user="ro
【AI深度学习基础】Pandas完全指南入门篇：数据处理的瑞士军刀（含完整代码） arbboter 人工智能人工智能深度学习 pandas 数据处理数据分析数据清洗数据分析效率提升
Pandas系列文章导航入门篇进阶篇终极篇一、引言在大数据与AI驱动的时代，数据预处理和分析是深度学习与机器学习的基石。Pandas作为Python生态中最强大的数据处理库，以其灵活的数据结构（如DataFrame和Series）和丰富的功能（数据清洗、转换、聚合等），成为数据科学家和工程师的核心工具。Pandas以Series（一维标签数组）和DataFrame（二维表格）为核心数据结构，提供高
怎么做好备件管理？备件管理系统都包括哪些功能模块？沃丰科技低代码人工智能系统架构
数字化转型成为大趋势，在全球供应链面临挑战的背景下，备件仓储、备件管理的数字化升级对企业、对行业有着至关重要的意义。如何借助售后服务系统，加强整个备件管理链条清晰程度，沉淀管理数据，通过数据挖掘明确备件的损坏规律，对未来设备管理流程进行优化成为各大企业的关注点。进一步来说，备件是设备修理的主要物质基础，做好备件管理，及时供应备件，可以缩短修理时间、减少损失，供应质量优良的备件，可以保证修理质量和修
bash: uwsgi: 未找到命令大胖丫 bash 开发语言
针对你提出的“bash:uwsgi:commandnotfound”问题，以下是一些可能的解决方案，请按照步骤逐一排查：‌1、检查uwsgi命令是否正确‌：确保你输入的命令是uwsgi，而不是uWSGI或其他变体。‌2、确认uwsgi是否已安装‌：使用pipshowuwsgi命令来检查uwsgi是否已安装在你的Python环境中。如果未安装，可以使用pipinstalluwsgi或pip3inst
Github 2024-09-30 开源项目周报 Top15 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，本周(2024-09-30统计)共有15个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目7JupyterNotebook项目2Dart项目1Ruby项目1HTML项目1C#项目1TypeScript项目1Rust项目1非开发语言项目1AutoGPT:人工智能革命的先锋创建周期：486天开发语言：Python协议类型：MI
python json转化为字典_Python处理json字符串转化为字典 weixin_39636691 python json转化为字典
原博文2015-11-0923:02−有一个需求，需要用python把json字符串转化为字典inp_str="{'k1':123,'k2':'345',’k3’,’ares’}"importjsoninp_str="{'k1':123,'k2':'345',’k3’,...相关推荐2017-11-1711:57−在工作中遇到一个小问题，需要将一个python的字符串转为字典，比如字符串：user
python保存字典到xml文件_如何将Python字典序列化为XML？ weixin_39725193
使用dicttoxml包将Python字典转换为xml表示形式。首先，安装dicttoxml软件包pip3installdicttoxml创建一个字典对象>>>D1={"name":"Ravi","age":21,"marks":55}现在dicttoxml()从dicttoxml包中导入函数，并使用D1作为参数。该函数返回已编码的字符串作为字典的xml表示形式>>>fromdicttoxmlim
python保存字典到xml文件_Python将字典转换为XML的方法 weixin_39872123
问题你想使用一个Python字典存储数据，并将它转换成XML格式。解决方案尽管xml.etree.ElementTree库通常用来做解析工作，其实它也可以创建XML文档。例如，考虑如下这个函数：fromxml.etree.ElementTreeimportElementdefdict_to_xml(tag,d):'''Turnasimpledictofkey/valuepairsintoXML''
对“预训练”的理解衣衣困深度学习神经网络自然语言处理
预训练有什么用传统的机器学习是偏数学的，对数据的量不做过多要求，而深度学习的项目通常是有大量的数据可供使用。在平常的任务或者项目中，我们可能并没有大量数据，只有少量数据，在这时我们就可以通过“借用”有大数据支持的模型的参数，作为基准，这样就能提高效率和准确率。因为他们神经网络的浅层是相似的，也就是说，在任务相似的情况下，可以用已有的模型即“预训练”好的模型参数实现小数据量的模型训练。预训练可以节省
Python 3.8.10 for Windows：开启编程之旅的完美选择裴涓斐Kathy
Python3.8.10forWindows：开启编程之旅的完美选择python3.8.zip项目地址:https://gitcode.com/open-source-toolkit/dd07d项目介绍Python3.8.10forWindows是一款专为Windows用户设计的Python安装包，旨在为Windows7及更高版本的操作系统提供稳定、高效的Python环境。无论您是Python编程
Python 3.8.10 AMD64 安装包卢枫岱
Python3.8.10AMD64安装包项目地址:https://gitcode.com/open-source-toolkit/03899描述本仓库提供了一个Python3.8.10的AMD64安装包，旨在解决原下载地址网速过慢的问题，帮助用户节省下载时间。资源文件文件名:python-3.8.10-amd64.exe版本:Python3.8.10架构:AMD64使用方法点击仓库中的python
Java 大视界 -- Java 大数据机器学习模型的可解释性增强技术与应用（107）青云交大数据新视界 Java 大视界大数据 java 可解释性 AI SHAP LIME 因果推理可视化交互
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- Java 大数据在智慧环保污染源监测与预警中的应用（104）青云交大数据新视界 Java 大视界 java 大数据智慧环保污染源监测实时预警 Flink LSTM
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- Java 大数据分布式文件系统的性能调优实战（101）青云交大数据新视界 Java 大视界 java 大数据 Java 大数据分布式文件系统性能调优 HDFS Impala
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- 深入剖析 Java 大数据实时 ETL 中的数据质量保障策略（97）青云交大数据新视界 Java 大视界 Java大数据实时ETL 数据质量保障数据清洗数据校验机器学习算法统计方法
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- 绿色大数据：Java 技术在节能减排中的应用与实践（90）青云交大数据新视界 Java 大视界 java 大数据绿色大数据节能减排算法优化分布式计算资源管理
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- 大数据伦理与法律：Java 技术在合规中的作用与挑战（87）青云交大数据新视界 Java 大视界 java 大数据大数据伦理大数据法律数据加密访问控制应对策略
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
Java 大视界 -- 区块链赋能 Java 大数据：数据可信与价值流转（84）青云交大数据新视界 Java 大视界 java 大数据数据可信价值流转智能合约共识机制区块链
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
AI绘画商业实战教程（附带AI工具+教程资料）SD+MJ变现教程我算是程序猿 AI作画人工智能 stable diffusion AIGC midjourney
家人们，当下AI发展迅猛，利用AI制作的科技科普视频在各大平台备受瞩目。许多新账号依靠这类视频，短期内就实现了粉丝的飞速增长。有个账号才发18条作品，粉丝就涨到35万，单条最高点赞40万！科技科普赛道受众广泛，尤其是科技爱好者和学生群体。通过AI讲解前沿科技知识，视频一经发布就容易走红。而且变现方式丰富，不管是接科技产品推广、平台奖励，还是开设线上科技课程，都能轻松盈利。有博主靠推广科技产品，收益
一键生成Python项目依赖清单：pipreqs完全指南北岭敲键盘的荒漠猫 #python开发 python 开发语言
省流:pipinstallpipreqspipreqs./--encoding=utf8--force一键生成Python项目依赖清单：pipreqs完全指南作为Python开发者，你是否经历过这些痛苦场景？✅项目迁移到新环境时，发现漏装了几个依赖包，调试到崩溃…✅用pipfreeze导出依赖，结果混入一堆无关的全局包，臃肿不堪…✅手动维护requirements.txt，每次更新都要反复核对版本
紫光展锐5G融云方案，开启云终端新时代紫光展锐官方 5G 云电脑云终端
近年来，云终端凭借便捷、高效、高性价比的优势正逐步在各行各业渗透。研究机构IDC的数据显示，2024上半年，中国云终端市场总体出货量达到166.3万台，同比增长22.4%，销售额29亿元人民币，同比增长24.9%，均超预期。紫光展锐积极携手各大合作伙伴，共同打造云端生态，大力推动云终端在政企、金融类等领域应用落地。云终端增长势头良好两大应用场景被看好云电脑将传统个人电脑的硬件资源和软件应用虚拟化，
Java 大视界 -- 基于 Java 的大数据流处理容错机制与恢复策略（113）青云交大数据新视界 Java 大视界 java 大数据流处理容错机制 Checkpoint Exactly-Once 故障恢复
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
MWC 2025｜紫光展锐联手美格智能发布5G通信模组SRM812 紫光展锐官方 5G
在2025年世界移动通信大会（MWC2025）期间，紫光展锐携手美格智能正式推出了基于紫光展锐V620平台的第二代5GSub6GR16模组SRM812，以超高性价比方案，全面赋能合作伙伴，加速5G规模化应用在各垂直领域的全面落地。展锐芯赋能，全面支持R16关键特性SRM812模组基于紫光展锐推出的V620平台设计，V620是业界首款全面支持R16的5G宽带物联网芯片平台，具备强劲的射频能力和全网通
思考–如何学习陌生的知识后知后觉的先行者思考学习
思考–如何学习陌生的知识面对新知识的学习，可以遵循以下系统化的方法，既提高效率又减少迷茫感：一、明确学习目标：打破“学什么都要学全”的误区核心原则二八定律：80%的实用场景只需掌握20%的核心知识。场景驱动：明确“学这个知识要解决什么问题？”（例如：学Python是为了数据分析还是自动化办公？）。快速定位重点通过行业标杆案例、岗位JD或技术文档，提取高频关键词（如“神经网络”之于AI、“API调用
python:类属性与方法 muxue178 python 开发语言
1.类的属性'''类属性：不能用实例化对象对类属性进行修改只类用类对象对其属性进行修改'''classPolice(object):name='警察'Police.name='交通警察'print(Police.name)police=Police()police.name='民警'print(police.name)print(Police.name)运行结果：交通警察民警交通警察即原理是在对类
【python】错误处理、异常捕获、调试和单元测试详解 echo 慧 Python学习 python 单元测试异常调试错误
错误、异常和调试测试1.错误1.1语法错误1.2逻辑错误2.异常2.1ZerDevisionError2.2FileNotFoundError2.3IndexError2.4keyError2.5ValueError2.6TypeError3.异常处理方法3.1try-except捕获异常3.2else和finally子句4.抛出异常4.1使用raise主动抛出异常4.2重新抛出异常5.自定义异常
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p