机器学习预测足球比赛项目——FootBallPrediction

引言

足球是世界上第一大运动,同时中国的市场也是巨大的,并且足球预测是一个趋势性行业。越来越多的人变成了足球球迷,足球彩民,本项目初衷做出一个卓越的AI产品(人工智能产品)准确预测足球比赛结果,帮助越来越多的足球彩民实现物质和精神上的升华。

项目背景

FBP项目全称FootBallPrediction,历经9个月完成的足球比赛预测项目。项目结合大数据+机器学习,不断摸索开发了一款软件。软件根据各大博彩公司赔率多维度预测足球比赛结果(包含胜和不胜)。机器学习用的是自己建立的“三木板模型”算法,已在国家期刊发表论文并被万方数据库收录。目前准确率可达80%。目前软件版本为14.0。FBP项目在Github网站已经有超过80人关注(https://github.com/acredjb/FBP),并在自己创建的微信群里已经吸引了很多人,并且每天均有部分人根据预测结果参考投注竞彩,参考的人都获得了相应的收益。 现在想通过认识更多的有识之士,一起探索如何将项目做大做强,找到合伙人,实现共赢。希望感兴趣的同仁联系本人,微信号acredjb。公众号AI金胆(或AI-FBP),每天都有程序预测的足球比赛。

三木板模型算法论文地址:http://wanfangdata.com.cn 搜索“基于机器学习的预测算法模型及其在环评领域的应用”。

在一场比赛开始前,菠菜公司90%是知道赛果的,他们已经有精算师分析基本面、伤病等信息,我只要站在他们的肩膀上进一步分析就可以了(无需再分析基本面等信息)。  

产品概述

  • 体系结构

A、数据清洗原则

1、只抓取主队为让球方(上盘)的场次,保证数据具有一致性。

2、只抓取主队胜赔,作为影响因子。

3、过滤掉蚊子肉,将Oddset<1.45或伟德<1.45的场次过滤掉。

B、机器学习原则

开发FBP项目中的核心模型:三木板模型(参考万方数据库论文),即任意选取三家菠菜公司的赔率作为组合对象与历史数据的三家比较,统计出历史数据标签y/n(胜/不胜)的数量,并输出符合条件“y>n*3或n>y*3”的结果(3为参数,目前尚未调整过此参数,可根据算法模型及评估结果适时调整)。此结果作为选择信心场次的依据。

其余KNN、bagging、反向传播等算法参考详细设计书。

  • 评估模型原则

用正向激励和反向激励统计出哪些组合对比赛结果有较大的影响,作为今后选择信心场次的优先依据。(参考详细设计书)

功能介绍

依托FBP项目,通过AI程序预测每天足球比赛,将符合程序模型且预测信心指数较高的比赛,发布到公众号AI金胆。

其他功能详述参考详细设计书。

产品优势

  1. 准确率高,达到80%左右
  2. 不断更新预测模型的数据,随着历史数据的不断更新,不断迭代修正原始模型,符合机器学习中的反向传播算法理论,准确率会不断提高,并稳定在高准确率
  3. 不受个人情绪影响,完全由程序输出看好的比赛
  4. 对比同行公众号推荐:大多数都是人为看盘口,现在是人工智能时代,必定被机器学习淘汰。别的公众号推篮球、足球,足球还推让2球,大小球,角球,能有那么多精力,很难相信做的专业。甚至还有推荐让平让负双选,最后还是预测错误。FBP程序只预测主队为上盘的比赛,只推胜或不胜(也就是让负),简约而不简单。
  5. 高赔率优势,赔率一般在1.8-2.2之间。
  6. 最重要的一点:程序给出当天预测的信心指数,完全数据量化的数值,根据指数的大小分配投资金额。目前三次>9.0的全部命中。
  7. 时间早,可以提前1天做出程序预测
  8. 不受操盘手影响,无视盘口的变化
  9. 预测模型是一个“历史赔率组合不断迭代修正”的过程,符合机器学习中的反向传播算法理论,以大数据赔率组合情况产生的结果做预测
  10. 系统化的方式描述预测规则,处理历史数据,观察预测在过去的表现如何,进而根据具体结果合理的改进这些预测规则
  11. 还会结合新的规则、程序目前可能忽略的预测规则(如程序1.0版本只考虑了各大菠菜公司的赔率,程序2.0就增加了联赛的维度,程序3.0又增加了阶段性数据作为新的预测规则),此时的程序预测能力就提高了很多,更精确、更快、更不受情绪干扰
  12. 并不是盲从程序的建议,而在程序预测的同时,本人也进行分析(结合基本面尤其是历史交锋),然后对二者进行对比。当程序的决策与我不同,我会追溯原因并总结。

技术支持

  1. Github网站:https://github.com/acredjb/FBP
  2. Kaggle网站:https://www.kaggle.com/FootballPrediction
  3. 微信号:acredjb
  4. 公众号:AI金胆

你可能感兴趣的:(算法,数据结构,其他,数据挖掘)