伯努利分布、二项分布、几何分布、超几何分布、泊松分布 一时失言乱红尘 2022-05-09 13:50 484阅读 0赞 导语 对于任何一个学习概率论的童鞋来说,各种分布都是很头痛的一件事情,本篇主要讨论的是离散型随机变量. 伯努利分布 伯努利分布就是我们常见的0-1分布,即它的随机变量只取0或者1,各自的频率分别取1−p1−p和pp,当x=0x=0或者x=1x=1时,我们数学定义为: p(x)=px∗(1−p)1−x p(x)=px∗(1−p)1−x 其它情况下p(x)=0p(x)=0,伯努利分布是一个非常好理解的分布,也是很多其它分布的基础。 离散型随机变量期望:E(x)=∑x∗p(x)E(x)=∑x∗p(x) 方差:D(x)=E(x2)−E2(x)D(x)=E(x2)−E2(x) 对于伯努利分布来说,E(x)=1∗p+0∗(1−p)=p,D(x)=12∗p−p2=p(1−p)E(x)=1∗p+0∗(1−p)=p,D(x)=12∗p−p2=p(1−p) 二项分布 二项分布是这样一种分布,假设进行n次独立实验,每次实验“成功”的概率为pp,失败的概率为1−p1−p,所有成功的次数XX就是一个参数为nn和pp的二项随机变量.数学公式定义为: p(k)=(nk)∗pk∗(1−p)n−k p(k)=(nk)∗pk∗(1−p)n−k 二项分布公式基于伯努利分布得到,因为二项分布中每项实验都是独立的,因此每一次实验都是一次伯努利实验,在nn次实验中,成功kk次,排列方式有(nk)(nk)种,根据乘法原理,即可得到二项分布的公式。 话外:对于均值和方差的计算,XiXi是标准的伯努利分布,总发生次数X=∑n1XiX=∑1nXi,所以E(X)=E(∑n1Xi)=∑n1E(Xi)=n∗pE(X)=E(∑1nXi)=∑1nE(Xi)=n∗p,同理方差D(x)=∑n1D(Xi)=n∗p∗(1−p)D(x)=∑1nD(Xi)=n∗p∗(1−p) 几何分布和负二项分布 这是一个比较简单的分布,其中负二项分布是几何分布的一般形式,几何分布与二项分布类似,也是由nn次伯努利分布构成,随机变量XX表示第一次成功所进行试验的次数,则 p(k)=P(X=k)=p∗(1−p)k−1,k=1,2,3,... p(k)=P(X=k)=p∗(1−p)k−1,k=1,2,3,... 负二项分布是几何分布的一般形式,表示直到成功r次停止,显而易见,当r=1时,它就是几何分布,则 P(X=k)=(k−1r−1)pr∗(1−p)k−r P(X=k)=(k−1r−1)pr∗(1−p)k−r 关于几何分布的期望与方差,E(X)=1/pE(X)=1/p,D(x)=(1−p)/p2D(x)=(1−p)/p2,关于期望的证明,E(X)=∑∞n=1n∗p∗qn−1=p∗∑∞n=1(qn)′=p∗(∑∞n=1qn)′=1/pE(X)=∑n=1∞n∗p∗qn−1=p∗∑n=1∞(qn)′=p∗(∑n=1∞qn)′=1/p,方差证明与期望证明类似,不再赘述… 超几何分布 非常常见的一种分布,常用来表示在NN个物品中有指定商品MM个,不放回抽取nn个,抽中指定商品的个数,即XX~H(N,n,M)H(N,n,M),则抽中k件的概率为: p(k)=P(X=k)=(Mk)∗(N−Mn−k)(Nn) p(k)=P(X=k)=(Mk)∗(N−Mn−k)(Nn) 实际应用中超几何分布例子很多,比如彩票开奖你所符合的数字个数等。 泊松分布 泊松分布是离散型随机变量分布中相对较难的一种,泊松频率函数定义为: P(X=k)=λk∗e−λk!,k=0,1,2,3,... P(X=k)=λk∗e−λk!,k=0,1,2,3,... 泊松分布是二项分布的极限形式,可有二项分布概率公式推导得出,其中λ=n∗pλ=n∗p,当n>>pn>>p时, p(k)=(nk)∗pk∗(1−p)n−k=n!∗pk∗(1−p)n−kk!∗(n−k)!=n!∗(λn)k∗(1−λn)n−kk!∗(n−k)!=λkk!∗n!(n−k)!∗k!∗(1−λn)n∗(1−λn)−k p(k)=(nk)∗pk∗(1−p)n−k=n!∗pk∗(1−p)n−kk!∗(n−k)!=n!∗(λn)k∗(1−λn)n−kk!∗(n−k)!=λkk!∗n!(n−k)!∗k!∗(1−λn)n∗(1−λn)−k 当nn->∞∞时,λnλn->0,n!(n−k)!∗k!n!(n−k)!∗k!->1,(1−λn)n(1−λn)n->e−λe−λ,(1−λn)−k(1−λn)−k->1,所以 p(k)−>λk∗e−λk! p(k)−>λk∗e−λk! 泊松分布的期望和方差均为λλ,证明过程严格按照定义即可,注意在证明过程中使用到了eλ的泰勒展开eλ的泰勒展开 泊松分布主要用来研究单位时间或单位空间内某时间的发生次数,同时事件的发生必须是相互独立的,比如单位时间内通过某一交通灯的车辆数等。λλ大概等于20时,泊松分布基本可以近似为正态分布进行处理。 泊松分布用来衡量事件的稳定性是一个不错的方法,再配合一些统计学上的检验方法,能够做很多东西,在之后的连续型随机变量中,有一种分布叫指数分布,它与泊松分布密不可分,可由泊松分布推导出 \--------------------- 作者:天空中的一缕微风 来源:CSDN 原文:https://blog.csdn.net/zlbflying/article/details/47777943?utm\_source=copy 版权声明:本文为博主原创文章,转载请附上博文链接!
还没有评论,来说两句吧...