二项分布
截图来源:Binomial distribution
三个二项分布例子对应的概率质量函数和累积分布函数
截图来源:Binomial distribution
考察二项分布方法有两种:
第一种:有
n
n
n 枚独立的硬币,并且每一枚硬币出现成功的概率都是
p
p
p. 同时抛掷它们,并记录正面出现的次数
第二种:有一枚独立的硬币抛掷
n
n
n 次,记录正面出现的次数
因为每次抛掷硬币都是独立的行为,所以抛掷
n
n
n 枚独立的硬币与抛掷一枚独立的硬币
n
n
n 次,这两种方法是等价的
二项式分布的概率质量函数(PMF)如下:
上图中二项式系数如下
二项式分布的累积分布函数(CDF)如下:
为确保是一个概率分布,要同时满足两个条件
(1)所有概率都是非负的;
(2)概率之和必须等于1
第一个条件毋庸置疑是满足的,我们证明第二个条件是否满足
根据二项式定理
(
x
+
y
)
n
=
∑
k
=
0
n
C
n
k
x
k
y
n
−
k
(x+y)^n=\sum_{k=0}^nC_n^kx^ky^{n-k}
(x+y)n=k=0∑nCnkxkyn−k
令
x
=
p
、
y
=
1
−
p
x=p、y=1-p
x=p、y=1−p
∑
k
=
0
n
P
(
X
=
k
)
=
∑
k
=
0
n
C
n
k
p
k
(
1
−
p
)
n
−
k
=
(
p
+
(
1
−
p
)
)
n
=
1
\sum_{k=0}^nP(X=k)=\sum_{k=0}^nC_n^kp^k(1-p)^{n-k}=(p+(1-p))^n=1
k=0∑nP(X=k)=k=0∑nCnkpk(1−p)n−k=(p+(1−p))n=1
计算均值、方差
利用期望的线性性质(避免了计算二项式系数之和):和的期望等于期望的和
一个服从
Bin
(
n
,
p
)
\text{Bin}(n,p)
Bin(n,p) 的随机变量
X
X
X 与
n
n
n 个相互独立且服从
Bern
(
n
,
p
)
\text{Bern}(n,p)
Bern(n,p) 的随机变量
X
i
X_i
Xi 之和
X
=
X
1
+
X
2
+
X
3
+
⋯
9
X
n
X=X_1+X_2+X_3+\cdots 9X_n
X=X1+X2+X3+⋯9Xn
因为每个
X
i
X_i
Xi 都服从
Bern
(
n
,
p
)
\text{Bern}(n,p)
Bern(n,p) 所以均值为
μ
X
=
p
\mu_X=p
μX=p,方差都是
σ
X
i
2
=
p
(
1
−
p
)
\sigma^2_{X_i}=p(1-p)
σXi2=p(1−p)
μ
X
=
E
[
X
]
μ
X
=
E
[
X
1
+
X
2
+
X
3
+
⋯
+
X
n
]
μ
X
=
E
[
X
1
]
+
⋯
+
E
[
X
n
]
μ
X
=
p
+
⋯
+
p
=
n
p
\mu_X=E[X]\\ ~\\ \mu_X=E[X_1+X_2+X_3+\cdots +X_n]\\ ~\\ \mu_X=E[X_1]+\cdots+E[X_n]\\ ~\\ \mu_X=p+\cdots +p=np
μX=E[X] μX=E[X1+X2+X3+⋯+Xn] μX=E[X1]+⋯+E[Xn] μX=p+⋯+p=np
例子: