チャポケのブログ

勉強したことをまとめておく。

統計 ポアソン分布

ポアソン分布とは

確率pのベルヌーイ試行をn回行うとき、「成功」する回数X二項分布B(n,p)に従う。
二項分布のパラメータは確率p試行回数n回であるが、
この2つのパラメータの代わりに、1つのパラメータ\lambda = npを用いて、
「成功」する回数Xを確率変数Xとする確率分布をポアソン分布Po(\lambda)という。

ここでは、パラメータ\lambda = npを一定に保ったまま n \to \inftyとして、
「微小期間に確率pのベルヌーイ試行を行う」ことを、n回(無限回)連続して行っていると考えるとよい。

そうすると、ポアソン分布Po(\lambda)とは、
ある期間における事象が起こる平均回数\lambda」をパラメータとして与えたとき、
実際にある期間に事象が起こる回数Xを確率変数Xとする確率分布であると、いえる。

例で考える 例があったほうが理解しやすいので、次のような例を考える。
1時間に雷が3.6回落ちる天気のときに、実際に1時間の間に雷がX回落ちる確率は」
ここで、ポアソン分布パラメータ\lambda = 3.6で、ある期間は1時間となっている。

この例は、次のように少しずつ解釈を変形できる。
60分間に雷が3.6回落ちる天気のときに、実際に1時間の間に雷がX回落ちる確率は」
1分間に雷が0.06(=3.6/60)回落ちる天気のときに、実際に60分間の間に雷がX回落ちる確率は」
1分間に雷が1回落ちる確率が0.06である天気を、60回繰り返した場合に雷がX回落ちる確率は」
確率p=0.06のベルヌーイ試行をn=60回行うとき、成功する回数がX回である確率は」
ここで、ポアソン分布パラメータ\lambda = np = 0.06 \times 60 = 3.6となる。

また、次のようにも解釈を変形できる。
1秒間に雷が1回落ちる確率が0.001(=0.06/60)である天気を、3600回繰り返した場合に雷がX回落ちる確率は」
確率p=0.001のベルヌーイ試行をn=3600回行うとき、成功する回数がX回である確率は」
ここで、ポアソン分布パラメータ\lambda = np = 0.001 \times 3600 = 3.6となる。

上記を見ると、パラメータ\lambda = np を一定に保ったまま n \to \inftyとしても、
同様に解釈を変形できることがわかると思う。

\lambda = 3.6ポアソン分布の確率分布は次のようになるので、
実際に1時間の間雷が3回落ちる確率は21%程度になる。
f:id:chapoke7:20200621172658p:plain

ポアソン分布の確率

ポアソン分布Po(\lambda)の確率P(X)は、次のようになる。


\begin{aligned}
P(X=k)&= \frac{e^{-\lambda}\lambda^k}{k!} \ \ \ (k=0,1,2,\cdots)
\end{aligned}

これの導出は次の通り。
二項分布B(n,p)の確率P(X)の式に、p=\frac{\lambda}{n}を代入して、 n \to \infty とする。

\begin{aligned}
P(X=k)&= \lim_{n \to \infty} {}_nC_kp^k(1-p)^{n-k} \\
 &= \lim_{n \to \infty} \frac{n!}{k!(n-k)!} \left( \frac{\lambda}{n} \right)^k \left( 1-\frac{\lambda}{n} \right)^{n-k} \\
 &= \lim_{n \to \infty} \frac{\lambda^k}{k!} \left( 1-\frac{\lambda}{n} \right)^n \left( 1-\frac{\lambda}{n} \right)^{-k} \frac{n!}{(n-k)! n^k} \\
 &= e^{-\lambda} \frac{\lambda^k}{k!}
\end{aligned}
ただし、最後の式変形で、次の①②③を用いた。

\begin{aligned}
 \lim_{n \to \infty} \left( 1-\frac{\lambda}{n} \right)^n
 &= \lim_{n \to \infty} \left( 1+ (-\frac{\lambda}{n}) \right)^{(-\frac{n}{\lambda})(-\lambda)} \\
 &= \lim_{t \to 0} \left( 1+t \right)^{(\frac{1}{t})(-\lambda)} \\
 &\downarrow \ \ \ e = \lim_{t \to 0} \left( 1 + t \right)^{\frac{1}{t}} \ \ \ ネイピア数の定義式 \\
 &= e^{-\lambda}
\end{aligned}

\begin{aligned}
 \lim_{n \to \infty} \left( 1-\frac{\lambda}{n} \right)^{-k}
 = \left( 1-0 \right)^{-k} = 1
\end{aligned}

\begin{aligned}
 \lim_{n \to \infty} \frac{n!}{(n-k)! n^k}
 &= \lim_{n \to \infty} \frac{n \cdot (n-1) \cdot (n-2) \cdots (n-(k-1)) }{n^k} \\
 &= \lim_{n \to \infty} \frac{n}{n} \cdot \frac{n-1}{n} \cdot \frac{n-2}{n} \cdots \frac{n-(k-1)}{n} \\
 &= \lim_{n \to \infty} 1 \cdot (1-\frac{1}{n}) \cdot (1-\frac{2}{n}) \cdots (1-\frac{k-1}{n}) \\
 &= 1
\end{aligned}

ポアソン分布の期待値・分散

ポアソン分布Po(\lambda)の期待値E(X)と、分散V(X)は、次のようになる。


\begin{aligned}
E(X) &= \lambda \\
V(X) &= \lambda
\end{aligned}

これの導出は次の通り。
二項分布B(n,p)の期待値E(X)と、分散V(X)は、

\begin{aligned}
E(X) &= np \\
V(X) &= np(1-p)
\end{aligned}
である。
ここで、np=\lambdaを一定に保ったまま、n \to \infty としたものがポアソン分布Po(\lambda)なので、
p=\frac{\lambda}{n}を代入して、n \to \infty としてみると、

\begin{aligned}
E(X) &= \lim_{n \to \infty} n \frac{\lambda}{n} = \lambda \\
V(X) &= \lim_{n \to \infty} n \frac{\lambda}{n} (1-\frac{\lambda}{n}) = \lambda
\end{aligned}
と、ポアソン分布Po(\lambda)の期待値E(X)と、分散V(X)を求めることができる。

ポアソン分布の様子

ポアソン分布Po(\lambda)の確率分布は、パラメータ\lambdaを変化させて比較すると次のようになる。

f:id:chapoke7:20200621174216p:plain