足球大数据分析大小球胜平负的技巧与实例附分析软件

  • 时间:
  • 浏览:1
  • 来源:跟我学网络

最后发布:2019-05-10 17:27:28首次发布:2019-05-10 17:27:28

前阵子熬夜看欧冠,利物浦 3-0 击败巴萨晋级决赛,赛后一个同为球迷的朋友问我“现在大数据能分析足球比赛的胜平负或者大小球吗?”

我一听,没有做很肯定的回答。早些世界杯的时候,百度体育运用大数据的技术预测过,关注过的朋友都知道,准确率不理想。后来我仔细的想了想,任何数据,你只要去挖掘,绝对是有价值的,足球赛事的数据也一样。由于之前自己也买过足球财票,北京单场、混合过关、任九都玩过,对赔率、亚盘稍有了解。这几天自己写了个爬虫,把近十年欧洲五大联赛足球的赛事数据爬了下来,包扣欧赔、亚盘、大小球、比分数据。

大数据的技能

数据收集: ETL东西担任将散布的、异构数据源中的数据如联系数据、平面数据文件等抽取光临时中间层后进行清洗、转化、集成,最终加载到数据仓库或数据集市中,成为联机剖析处理、数据发掘的根底。

数据存取: 联系数据库、NOSQL、SQL等。

根底架构: 云存储、散布式文件存储等。

数据处理: 自然言语处理(NLP,Natural Language Processing)是研讨人与核算机交互的言语问题的一门学科。处理自然言语的关键是要让核算机”了解”自然言语,所以自然言语处理又叫做自然言语了解也称为核算言语学。一方面它是言语信息处理的一个分支,另一方面它是人工智能的中心课题之一。

核算剖析: 假设查验、显著性查验、差异剖析、相关剖析、T查验、 方差剖析 、 卡方剖析、偏相关剖析、间隔剖析、回归剖析、简略回归剖析、多元回归剖析、逐步回归、回归猜测与残差剖析、岭回归、logistic回归剖析、曲线估量、 因子剖析、聚类剖析、主成分剖析、因子剖析、快速聚类法与聚类法、判别剖析、对应剖析、多元对应剖析(最优标准剖析)、bootstrap技能等等。

数据发掘: 分类 (Classification)、估量(Estimation)、猜测(Prediction)、相关性分组或相关规矩(Affinity grouping or association rules)、聚类(Clustering)、描绘和可视化、Description and Visualization)、杂乱数据类型发掘(Text, Web ,图形图像,视频,音频等)

 

有了数据就有了分析的支撑点,这几天把这些数据好好了研究了下,后台通过编写模型规则,逐步的做了验证,发现有很多赔率组合打出来的赛果都很接近,也就是我们常说的大概率赛果,显然大数据是能分析出足球赛事的大概率赛果的。由于预测分析准确率高的赔率组合很多,不一一说明,这里我只举例一种大概率分析组合,分享给有缘人。为此我还用java写了一个客户端软件,软件截图如下:

百度网盘地址

提取码: 4ggg 

这种组合必须是意大利足球甲级联赛(意甲),而且澳菜开出的初始盘口必须为主队受让半球(+0.5)盘口的比赛。

那么怎么分析呢?很简单,用赔率比较法,即比较【竞菜官网】与【威廉希尔】的欧赔初始赔率, 当【竞菜官网】的欧赔初始胜赔、平赔、负赔均低于【威廉希尔】的欧赔初始胜赔、平赔、负赔时,大数据统计下,这种赔率组合客队不败18-19赛季,准确率达到了100%,无一例外。

例子1

18-19赛季意大利足球甲级联赛第30轮  比赛时间:2019-04-04 03:00

热那亚 VS 国际米兰 最终比分0-4 足球大小球方面打出了大球

首先从mysql中可以看到竞菜官网与威廉希尔的欧赔初始赔率如下

从上图可以看出,竞菜官网的初始胜赔平赔负赔均低于威廉希尔的胜赔平赔负赔,符合上述我们说的足球大数据胜平负分析法。我们上述说到,符合此模型的比赛,大数据分析预测出的赛果是 客队不败,从赛果中我们发现90分钟结束,最终比分0-4,国米果真不败。

例子2

18-19赛季意大利足球甲级联赛第35轮  热那亚 VS 罗马 比赛时间:2019-04-04 03:00  最终比分 1:1

首先从mysql中可以看到竞菜官网与威廉希尔的欧赔初始赔率如下

从上图可以看出,竞菜官网的初始胜赔平赔负赔均低于威廉希尔的胜赔平赔负赔,符合上述我们说的足球大数据胜平负分析法。我们上述说到,符合此模型的比赛,大数据分析预测出的赛果是 客队不败,从赛果中我们发现90分钟结束,最终比分1-1,客队罗马果真不败,大小球方面打出了小球。

这里就不一个个验证了,我统计了一下这个赛季意甲这种模型组合一共有8场比赛,赛果客队全部保持不败,大家有兴趣的可以去验证一下。