机器学习-近9年双色球开奖数据的频繁项集

绝大多数的人都有过一夜暴富的梦想,购买双色球便是实现这种梦想的方式之一,因此各种专家号推荐层出不穷。

在这里我想尝试用机器学习的方法来揭开双色球的秘密,即一切用数据说话。本着娱乐至上的目的为大家带来一次“杀号定胆”的游戏。

数据采集

双色球历史数据: 2009~2017的1229期开奖数据
采集方式: Python 网络爬虫
具体代码: 文末有相关链接

数据分析

相关算法: Apriori 或者 FP-Growth
数据类型: 标称型
双色球数据结构: [‘02’,’13’,’22’,’23’,’26’,’33’,’b02’]
算法结果: 输出历史开奖的单个号码和组合号码的出现频率

分析结果报告

通过数据分析后,我将算法结果总结了一份双色球历史开奖数据报告,大家各取所需哈。


机器学习-近9年双色球开奖数据的频繁项集_第1张图片



机器学习-近9年双色球开奖数据的频繁项集_第2张图片



机器学习-近9年双色球开奖数据的频繁项集_第3张图片


红色球单个号码依据随机均匀分布,出现频率为:2/11
蓝色球单个号码依据随机均匀分布,出现频率为:1/16
以下号码除33,b02(最不常出现号码)外,出现频率均超过平均频率


机器学习-近9年双色球开奖数据的频繁项集_第4张图片


偷偷告诉你们一个秘密,听说红01和蓝12更配哦。

结论

从数据来看,双色球号码是比较服从均匀分布的;小玩怡情,大玩伤身,好了,我要去买一注最常出现的和一注最不常出现的双色球了。

相关代码链接:数据收集以及分析算法

你可能感兴趣的:(机器学习-近9年双色球开奖数据的频繁项集)