将不同量级的序列转化为同一量级

联合多重时间序列本身是一件挑战性十足的事,数据样本的不均衡导致了不同时间序列对于模型的影响程度是不同的。拿商品销售为例,销售数量多一个数量级,商品数量就少一个数量级,每个月卖10个的商品如果有100,000种,每个月卖100个的商品就只有10,000种,每个月卖1000个的商品就只有1000种。(满足幂律分布:y = 1,000,000 / x)这种不均衡样本导致输入值的量级差异,商品A每天销售数百个,商品B每天销售数万个,两个商品共同训练时商品A的信息会被忽略掉,因为相对于B而言,A对神经网络参数的影响太低。但是,A时间序列中隐含的信息是有价值的,数百个销售额仍然能够反映季节性和趋势性的变化。
将不同量级的序列转化为同一量级_第1张图片
而对于这种样本量级差异的解决方法,需要对商品销售量进行缩放,对应到神经网络中,即输入到神经网络前除以v, 输出后乘以v。(需要确保输入值除以v,进入神经网络在每一个节点计算以及每次迭代后,输出后乘以v,与不进行乘除操作是等价的。)如何选择为每一个商品选择对应的v是一个挑战,实践发现使用商品的历史销量均值是一个不错的选择。
将不同量级的序列转化为同一量级_第2张图片
本文转载自:https://amazonaws-china.com/cn/blogs/china/time-series-prediction-with-deep/?nc1=b_rp

你可能感兴趣的:(时间序列分析,#,深度学习,神经网络,算法)