关于双十一销售额造假的推断

双十一过去了,很多人关注双十一的销售额, 然后就看到了这样一个图片

image.png

这个图的意思是:把双十一历年数据进行二项式拟合,发现拟合R值特别接近1,认为从概率学上来说不可能事件,进而推断数据造假。 对于这类文章,我从来都是抱着怀疑和自我求证的态度, 下面我就自我求证下。

image.png

如上图, 我把双十一历年数据整理好,做了几个维度的二项式拟合。分为实验组和对照组。
实验组:

  • 2009-2019年全部数据。 实验组满足上文中所说拟合后R值接近1;

对照组:

    1. 将十年数据分割,看看前5年数据和5年数据的拟合结果。 如图2009-2014 ,2014-2019. 可以看到拟合R值依然在1左右。只是我们看到二项式的系数,前两个和后面的已经不一样了。
    1. 我还尝试了从2009 分别到2017,2018,2019年数据, 可以看到无论是R值还是系数,都是变化的。
    1. 我又尝试手动修改其中任何年付的数据, 比如给2012年增加20,或者18年减少100,其结果R值变化依然很小。


      2012年增加20

      2018年减少100

结论:1. 二项式拟合,对于这里销售数据都可以拟合出R值在1左右的,无论是京东还是淘宝。这个是个正常现象,并不是上文说的是很特殊现象。

  1. 敲黑板重点: 上图中其实弄混了概念了。概率论中的不可能事件是说的概率小于5% 的事件, 这个数值是概率。 而作者把R值偷换成概率,用R值接近1 来诱导人民以为这事概率很低。
    所以, 并不能通过上面的拟合就推导出淘宝双十一造假,证据不足。

你可能感兴趣的:(关于双十一销售额造假的推断)