チャポケのブログ

勉強したことをまとめておく。

統計 二項分布

ベルヌーイ試行

ベルヌーイ試行とは、起こる結果が「成功」又は「失敗」の2つしかない試行のこと。
確率変数X=1は「成功」、X=0は「失敗」を示すとして、「成功」の確率をpとすると、
ベルヌーイ試行の確率P(X)は、次のように表すことができる。

X0 (失敗)1 (成功)
P(X)1-pp

期待値E(X)と、分散V(X)は、次のようになる。


\begin{aligned}
E(X)&=p \\
V(X)&=p(1-p)
\end{aligned}

これの導出は次の通り。

\begin{aligned}
E(X) &= 0 \cdot (1-p) + 1 \cdot p \\
       &= p \\
V(X) &= (0-p)^2 \cdot (1-p) + (1-p)^2 \cdot p \\
        &= p(1-p)
\end{aligned}

二項分布

二項分布B(n,p)とは、確率pのベルヌーイ試行をn回行って、成功する回数Xを確率変数Xとする確率分布のこと。
二項分布B(n,p)の確率P(X)は、次のように表すことができる。


\begin{aligned}
P(X=k)&={}_nC_kp^k(1-p)^{n-k} \ \ \ (k=0,1,2,\cdots,n)
\end{aligned}

期待値E(X)と、分散V(X)は、次のようになる。


\begin{aligned}
E(X)&=np \\
V(X)&=np(1-p)
\end{aligned}

これの導出は次の通り。
一般に「確率変数の和の期待値は、それぞれの期待値の和になるE(X+Y)=E(X)+E(Y)」ので、
二項分布の期待値は、ベルヌーイ試行の期待値pn回足したものになる為。

一般に「独立な確率変数の和の分散は、それぞれの分散の和になるV(X+Y)=V(X)+V(Y)」ので、
二項分布の分散は、ベルヌーイ試行の分散p(1-p)n回足したものになる為。

例えば、n=10, \ p=0.5の二項分布の確率分布は次のようになる。

f:id:chapoke7:20200607185055p:plain

試行回数n=100を固定して、ベルヌーイ試行の確率pを変化させて比較すると次のようになる。

f:id:chapoke7:20200607190108p:plain

ベルヌーイ試行の確率p=0.5を固定して、試行回数nを変化させて比較すると次のようになる。

f:id:chapoke7:20200607192145p:plain