我用Python爬虫获取数据,分析双色球中奖概率,差点就中了

很多人喜欢买彩票,但是经常买彩票的人要么想着一夜暴富,要么想着改变命运,要么是娱乐娱乐,但是小编也要提醒大家一句,哪里能赚钱,哪里就有奸商,做事须谨慎。

我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第1张图片
前两天,在网上看到一个有意思的问题:彩票预测靠谱么?为什么还有那么多的人相信彩票预测?

暂且不说,彩票预测是否靠谱?彩票预测也分人而异,江湖上骗术很多,有些甚至会误以为彩票预测的准确度可以很高,这些操盘手法,让不知原理的彩民心甘情愿地掏钱买料。

我们今天就利用Python的爬虫技术爬取近16年来所有的双色球数据,看看这些年哪些数字出现的次数比较高。有的小伙伴可能不知道双色球是什么?双色球顾名思义就是两种颜色的球,一个红色,一个蓝色。红球从1-33中取出6个,篮球从1-16取出1个,如果你买的跟开奖号码一样,恭喜你几百万到手。
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第2张图片
爬虫的部分程序如下图所示:
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第3张图片

爬虫的思路很简单,主要是遍历爬取120几页的数据,GetPage函数取逐页解析,然后用bs取解析一些,并把数据保存在lottery文件里面。
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第4张图片
用requests取伪装一个header取请求数据,这些都是非常基本的爬虫知识,这里就不过多描述。

小编一共爬取到了2441条数据,包含了从2003年2月到2019年7月的所有中奖彩票数据。有了数据之后,小编先进行了一下数据的分析,看看红色球和蓝色球当中,究竟哪些数字出现的频率较高。红色球的各个数字出现频率如下图所示。
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第5张图片
从图上可以看出来,数字1出现的次数最高,而数字33出现的频率最低。蓝色球数字出现的频率如下图所示。
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第6张图片
可以看出,蓝色球当中数字12出现的频率最高,而数字8出现的频率最低。所以按照各个数字的出现频率,小编统计了一下。按照出现的频率来买,总比随机买让我感到安心。概率统计的部分代码如下图所示。

我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第7张图片
下面小编利用线性回归来进行预测。小编对每个位置上的数字都分别训练一个模型。如下图所示:
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第8张图片
绿色数字代表的是中奖号码的每一个位置,黄色数字就代表着每一个位置下的编号,小编就是将每个位置上的号码分别存储,以每个中奖号码作为Y值,而其每个编号作为X值,以此构成X、Y训练数据,而我们只需要预测每一个位置上的下一期中奖号码,然后将其拼接起来,就可以构成我们的下一期预测号码。部分程序如下图所示:
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第9张图片
小编首先是将各个位置上的中奖号码分别存储到csv文件当中,然后从各个csv文件中读取数据,作为X、Y训练数据进行返回。

最后再针对每个位置上的中奖号码训练各自的模型即可得到我们的下一期预测号码,结果如下图所示。
我用Python爬虫获取数据,分析双色球中奖概率,差点就中了_第10张图片
上面的预测号码只是一个小小的预测,结果不一定准确,致富其实还是需要靠好好学习,靠努力去赢得未来。所以大家把彩票当做娱乐就可以了,千万别迷信。

结尾

最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“01”即可领取。

你可能感兴趣的:(我用Python爬虫获取数据,分析双色球中奖概率,差点就中了)