泊松分布(Poisson Distribution)是一种离散的概率分布,用于预测特定时间内随机事件发生的次数。如每小时通过收费站的汽车数量,网站每天的注册人数,以及餐厅每小时的就餐人数等等。在使用泊松分布时需要满足四个条件。1,事件发生的次数可以根据时间或空间进行定义。2,事件的发生是小概率事件。3,事件之间相互独立,相互不产生影响。4,事件发生的概率是稳定的。在统计学中,如果一件事的发生满足这四个条件,就服从泊松分布。
下面是泊松概率函数的计算公式,其中x表示随机事件发生的次数,f(x)表示随机事件发生x次的概率,u表示上一个时间段随机事件发生的期望值或均值,e是自然常数(约为2.71828)。
我们通过一个用户提前赎回定期理财商品的例子来说明泊松分布的计算过程。用户在购买定期理财产品后,如果在到期日前需要用钱,向理财平台申请赎回,就属于提前赎回。现在大部分的理财平台都支持随时赎回,每个平台对于提前赎回的流程,时间和费用成本不尽相同。这些不在本文的讨论范围内。对于理财平台来讲,用户提前赎回会造成平台资金的损失,因此需要对提前赎回事件的发生次数进行估算。
我们假设在一个月中用户提前赎回事件的平均发生次数是12次,那么在下一个月中用户提前赎回事件发生10次的概率有多少呢?这里u是上一个时间段里事件发生的期望值或均值,这里我们假设是12次。X是随机事件发生的次数,这里是10次。f(10)是提前赎回事件发生10次的概率,也就是我们要求的结果。e是自然常数(约为2.71828)。
以下是泊松概率函数具体的计算过程。在Excel中可以通过POISSON()函数计算获得。也可以通过x=10,u=12两个值直接查表获得概率值。经过计算,一个月中用户提前赎回10次的概率是0.1048。
接下来我们还想知道一个月中用户提前赎回事件最有可能发生的次数,也就是发生概率最高的事件数。我们分别计算了u=12,x=1-20的概率值。在下表中,第一行是u值,第一列是x值,最后一列是u=12时x发生次数的概率值。绿色的部分表示概率值较高,黄色的次之,红色的概率值最低。如果上一个月中用户提前赎回的次数为12次的话,那么下个月用户提前赎回事件发生0次和1次是几乎不可能发生的事件,因此概率值几乎为0。发生2次到5次的概率值极低,意味着发生的概率也不大。9次到14次的概率值相对较高,其中发生12次和13次的概率值最高。因此,如果上一个月用户提前赎回的事件发生了12次,那么本月中该事件发生11次和12次的概率最高。
再从累计泊松概率的角度来看下,一个月中发生小于等于17次定期理财提前赎回事件的概率是0.937。大于17次的事件概率为1-0.937=0.063。也就是说有近95%的概率一个月中只会发生17次以内的提前赎回事件,而大于17次的概率仅为6.3%。
以下为泊松概率分布图,当上个月提前赎回事件发生12次时,本月提前赎回事件发生12次和13次的概率最高。一个月中发生17次以内提前赎回事件的概率约为95%,发生17次以上提前赎回事件的概率为6.3%。
—【所有文章及图片版权归 蓝鲸(王彦平)所有。欢迎转载,但请注明转自“蓝鲸网站分析博客”。】—