チャポケのブログ

勉強したことをまとめておく。

統計 正規分布

正規分布

連続型確率変数Xが、平均\mu、分散\sigma ^2正規分布N(\mu, \sigma ^2)に従う場合、
確率密度関数f(x)は次式のようになる。


\begin{aligned}
  f(x) &= \frac{1}{\sqrt{2 \pi \sigma^2}} \exp \left\{- \frac{(x - \mu)^2}{2 \sigma^2} \right\} \ \ \ \ \ (-\infty < x < \infty)
\end{aligned}


例えば、平均\mu = 60標準偏差\sigma = 5, 10, 20正規分布は、次のようなグラフなる。

f:id:chapoke7:20200705152615p:plain

標準正規分布

平均\mu = 0、分散{\sigma}^2 = 1である標準正規分布N(0, 1)
確率密度関数f(x)は次式のようになる。


\begin{aligned}
  f(x) &= \frac{1}{\sqrt{2 \pi}} \exp \left\{- \frac{x^2}{2} \right\} \ \ \ \ \ (-\infty < x < \infty)
\end{aligned}

グラフは次のようになる。

f:id:chapoke7:20200725140938p:plain

正規分布の標準化

確率変数Xが、平均\mu、分散\sigma ^2正規分布N(\mu, \sigma ^2)に従う場合、


\begin{aligned}
  Y &= \frac{X - \mu}{\sigma}
\end{aligned}

の変数Yを求めると、変数Yは平均\mu = 0標準偏差{\sigma} = 1標準正規分布に従う。
このような変換を、正規分布の標準化という。

正規分布の標準化を行うと、標準正規分布を用いることができるようになる。

偏差値

確率変数Xが、平均\mu、分散\sigma ^2正規分布N(\mu, \sigma ^2)に従う場合、


\begin{aligned}
  Z &= \frac{X - \mu}{\sigma} \times 10 + 50
\end{aligned}

の変数Zを求めると、変数Zは平均\mu = 50標準偏差{\sigma} = 10正規分布に従う。
このようにして求めた変数Zは、偏差値という。

テストの点数から偏差値を求めることがよくある。 これは、テストの作り方によって平均値と分散が異なるから、 テストの点数で出来不出来を判断するより、 偏差値で判断した方が、実態を適切に評価できるためである。

偏差値 最上位からの割合
80 0.13%
70 2.28%
60 15.87%
50 50.00%
40 84.13%
30 97.72%
20 99.87%