泊松分布在足球预测中的应用:深入探讨与模型建立过程

abc350826712 6 2025-07-21 04:41:49

在众多应用程序或网站上,泊松方程在足球预测领域的应用屡见不鲜。笔者在很久以前便对泊松分布进行了研究。如今,本文将深入剖析泊松分布,利用其原理构建预测模型,详尽阐述构建过程,并对预测结果进行分析,以供大家共同探讨,激发更多思考。

首先,我们大概了解一下什么是泊松分布。

泊松分布这一概念是以法国数学家泊松的名字命名的,他生活在1781年至1840年之间,是19世纪概率统计学领域的杰出人物。在数学统计领域,以他的名字命名的理论众多,包括但不限于泊松定理、泊松公式、泊松方程、泊松过程、泊松积分、泊松级数、泊松变换、泊松代数、泊松比、泊松流、泊松核、泊松括号、泊松稳定性、泊松积分表示以及泊松求和法等。

简单而言,泊松分布是基于这样一个前提:我们已知某一事件的平均出现频率,同时假定各个事件的发生是互不干扰的。在这样的条件下,我们能够推算出这些不确定事件出现的概率分布。

泊松分布广泛应用于处理众多低概率事件,诸如二战期间V-2导弹对伦敦的攻击、交通事故的发生概率以及放射性物质的衰变过程等。

在足球比赛中,进球在某种程度上被视为一种低概率发生的情况,因此,在定义中我们可以将提及的事件替换为进球这一概念。

换言之,在足球赛事中,一旦掌握了双方球队预计的进球数,便可以计算出涵盖所有可能得分的概率分布(如图1所示,每种比分均有其对应概率,主队胜利的比分位于左下方,客队胜利的比分位于右上方,而中间则是平局的比分);进一步地,可依据此概率分布图推导出胜负平各结果的具体概率;此外,还能确定进球数上下限以及双方均进球等不同投注方式的概率。

图1展示了泊松分布的比分概率分布图。具体步骤如下:首先,确定研究对象为26个联赛,这其中包括了五大联赛以及它们各自的二级联赛,还有荷甲、荷乙、葡超、苏超、挪威超、俄超、瑞典超、瑞士超、土超、英甲、希腊超、巴甲、中超、日职、日职乙以及澳超。

选取数据样本的区间:本研究选取了2014至2015年度至2018至2019年度的五个赛季作为预测对象,若该联赛非跨年制,则预测范围将涵盖2014年至2018年度的赛季。同时,样本数据库的起始年份设定为2013至2014年度,并回溯至2006至2007年度的赛季。

选取被预测赛季前一个、前三个、前五个、前八个赛季的数据作为样本,对泊松分布的概率进行计算,共涉及四个样本,其中每个样本均包含被预测赛季的已赛场次信息。

若2014/15赛季尚未展开,那么在预测该赛季时,本研究将利用上一个赛季(2013/14)的数据来估算泊松分布的概率。在模拟预测过程中,会将2014/15赛季已进行的比赛场次纳入样本数据之中。此外,研究还将采用过去三个赛季(2011/12至2013/14)、五个赛季(2009/10至2013/14)以及八个赛季(2006/07至2013/14)的数据分别进行概率计算

这代表了一个持续变化的过程,若预测的是2015/16赛季,则所选数据样本将涵盖过去一个赛季(即2014/15赛季),以及前三个赛季(即2012/13至2014/15赛季),再往前推至过去五个赛季(即2010/11至2014/15赛季),甚至更早,包括过去八个赛季(即2007/08至2014/15赛季)。

在研究泊松分布的过程中,研究者们往往会选定一个特定的样本区间,比如三个或五个赛季。本研究中,作者选取了四个赛季作为样本跨度,其目的在于审视球队概率变化的趋势,这一选择与后续的研究方向紧密相连。具体而言,在确定了这四个样本跨度(即预测赛季前的一个、三个、五个和八个赛季)之后,我们必须对每个样本中各支球队的主场进球数和失球数进行统计,同时还要计算整个样本期间所有球队的平均主场进球数和平均主场失球数。

同样地,需对每支球队的客场进球平均数和失球平均数进行统计,并且计算整个样本中所有球队的平均客场进球数和平均客场失球数。

在预测西甲2018/19赛季时,以皇马为例(其他球队亦然),我们可以看到以下四个样本的统计数据:2017/18赛季,皇马在主场的场均进球为2.84,场均失球为1.05,客场场均进球为2.11,客场场均失球为1.26,而联赛平均主场场均进球为1.55(等同于联赛平均客场场均失球),联赛平均主场场均失球为1.15(等同于联赛平均客场场均进球);2015/16至2017/18赛季,皇马主场场均进球为2.86,主场场均失球为0.98,客场场均进球为2.42,客场场均失球为1.11,联赛平均主场场均进球为1.60,联赛平均主场场均失球为1.18;2013/14至2017/18赛季,皇马主场场均进球为3.06,主场场均失球为0.93,客场场均进球为2.44,客场场均失球为1.13,联赛平均主场场均进球为1.59,联赛平均主场场均失球为1.16;2010/11至2017/18赛季,皇马主场场均进球为3.22,主场场均失球为0.92,客场场均进球为2.37,客场场均失球为1.07,联赛平均主场场均进球为1.62,联赛平均主场场均失球为1.15。接下来,我们需要计算各支球队的相对优势,这包括主队主场进攻相对优势(数值越高越佳)、主队主场防守相对优势(数值越低越佳)、客队客场进攻相对优势(数值越高越佳)、客队客场防守相对优势(数值越低越佳)。

以皇家马德里为例(其他俱乐部亦然):在2017/18赛季,皇马在主场的进攻优势表现为场均进球数与联赛平均主场场均进球数的比值,即2.84除以1.55,结果为1.83;在防守方面,则是场均失球数与联赛平均主场场均失球数的比值,即1.05除以1.15,得出的优势为0.91。同样,皇马在客场的进攻优势为2.11除以1.15,等于1.83,而防守优势则为1.26除以1.55,结果为0.81。从2015/16赛季至2017/18赛季,皇马主场的进攻优势为2.86除以1.60,等于1.79,主场防守优势为0.98除以1.18,结果为0.83;客场进攻优势为2.42除以1.18,等于2.05,客场防守优势为1.11除以1.60,结果为0.69。从2013/14赛季至2017/18赛季,皇马主场的进攻优势为3.06除以1.59,等于1.92,主场防守优势为0.93除以1.16,结果为0.80;客场进攻优势为2.44除以1.16,等于2.10,客场防守优势为1.13除以1.59,结果为0.71。再从2010/11赛季至2017/18赛季,皇马主场的进攻优势为3.22除以1.62,等于1.99,主场防守优势为0.92除以1.15,结果为0.80;客场进攻优势为2.37除以1.15,等于2.06,客场防守优势为1.07除以1.62,结果为0.66。至于计算主队和客队的预期进球数,我们需要运用之前得出的数据,以皇马对阵西班牙人的比赛为例,将数据代入相关公式进行计算。当然,作者需要对这四个不同的数据集进行单独的计算。

泊松分布足球预测模型_足球欧赔数据库_足球比赛进球概率计算

图2 展示的进球预测公式6)用于计算泊松分布的概率,这一过程可通过EXCEL公式来完成,具体公式见图3。图3中展示了泊松分布的EXCEL计算公式。若以皇马对阵西班牙人的比赛为例,比分为3:1,且已知双方预期进球数,皇马主场预期进球数为3.05,西班牙人客场预期进球数为0.8,那么在EXCEL单元格中,我们应输入图4中的公式,其中比分3:1对应的进球数x1和x2分别为3和1,其他比分情况可参照此方法进行计算。

通过图4的计算,我们得知3:1的比分概率为8.05%。依照此法,我们能够计算出所有比分的概率。具体来说,将主队可能获胜的比分概率相加,便得到主胜的总概率;将所有平局比分概率相加,便得到平局的总概率;同理,将客队获胜的比分概率相加,便得到客胜的总概率。

同样,将双方各自进球的几率相加,即可得到双方均进球的几率;而将进球数超过2.5次的比分概率相加,则可得出大2.5球的几率。

根据六个既定步骤对每一场预测进行核算,构建起一个不断演变的模型体系;每当新增一个预测赛季数据时,模型中将自动移除最早收集的那个赛季的数据。

至此,26个联赛在过去五个赛季的数据中,泊松分布的概率计算已经完成,鉴于文章篇幅所限,图5仅展示了其中的一部分内容以供大家参考。

图52展示了概率的变化趋势及最终结果。首先,我们通过计算得出的泊松分布概率,能够帮助我们估算预测场次比赛结果的可能性。比如,我们可以通过比较预测场次平均欧赔概率与泊松分布概率的差异,为分析提供参考。然而,由于伤病影响、战意波动、天气状况以及心理博弈等众多难以量化的因素都可能成为导致差异的原因,因此在具体分析时,还需根据每场比赛的实际情况来调整。

这里笔者主要从大概率角度为大家提供宏观思路。

在众多让球盘别中,我将对-1.25至-3.75(主队让球)以及1.25至3.75(主队受让)的盘口统称为深盘。而在1球及以下的盘口中,平手盘、半球盘和一球盘的盘路概率相对较为平均。至于平半盘(包括-0.25和0.25)以及半一盘(包括-0.75和0.75),它们分别代表了下盘和上盘的特性。对于这两个盘口,我们应顺应趋势进行投注。若执意逆势而行,那无疑是自讨苦吃。

所以如图6所示,平半盘、半一盘、深盘为三个主要研究目标。

图6所展示的“历史概率”涉及26个联赛在过去5个赛季中,针对特定盘口的历史走势概率,比如主队让平半盘的胜率是-0.25,其中上盘胜率为42.13%,走盘率为0%,下盘胜率为57.87%。这表示这是一个未经筛选的原始历史概率数据,而平半盘的下盘胜率与半一盘的上盘胜率大致均在57%上下。

“主胜概率持续攀升”这一表述意味着,对于预测的赛事,其欧赔初盘所显示的主胜平均概率,已超过了基于过去一赛季数据样本得出的泊松分布主胜概率,同样也超过了基于过去三赛季数据样本得出的泊松分布主胜概率,以及基于过去五赛季数据样本得出的泊松分布主胜概率,更是远超基于过去八赛季数据样本得出的泊松分布主胜概率。

换句话说,主队在近期赛季的表现连续好于早期赛季。

“主胜概率持续降低”这一表述意味着,根据过去八个赛季的数据样本,对预测场次欧赔初盘的平均主胜概率进行的计算,是基于泊松分布得出的客队获胜概率。

换句话说,客队在近期赛季的表现连续好于早期赛季。

“*客胜概率连降”指的是被预测场次的欧赔初盘平均客胜概率

上一篇:西里安1 - 5赫根比赛盘口存疑!初盘差异大或藏冷门?
下一篇:已是最新文章
相关文章
返回顶部小火箭