重要な標本分布

第2章で,確率分布の基礎となる2項分布と正規分布の話をしました.ここでは,まず,正規分布の性質について考えます.

正規分布の加法性

確率変数$ X,Y$が独立で,それぞれ正規分布 $ N(\mu_{1},\sigma_{1}^2), N(\mu_{2},\sigma_{2}^2)$に従うとき,和$ aX+bY$は正規分布

$\displaystyle N(a\mu_{1}+b\mu_{2},a^2\sigma_{1}^2 + b^2\sigma_{2}^2)$

に従う.

定理 3..3  

$ X_{1},X_{2},\ldots,X_{n}$は互いに独立で正規分布 $ N(\mu,\sigma^2)$に従えば,

$\displaystyle \overline{X} = \frac{X_{1} + X_{2} + \cdots + X_{n}}{n} \sim N(\mu, \frac{\sigma^2}{n})$


証明 正規分布の加法性より,

$\displaystyle X_{1} + X_{2} + \cdots + X_{n} \sim N(n\mu, n\sigma^2)$

したがって,

$\displaystyle \overline{X} = \frac{1}{n}(X_{1} + X_{2} + \cdots + X_{n}) \sim N(\mu, \frac{n\sigma^2}{n^2}) = N(\mu, \frac{\sigma^2}{n})$

例題 3..8  

ある年齢の生徒の身長は120cmを平均値として,標準偏差が4.5cmの正規分布に従っているとする.このとき,50人の身長の平均が120.6cmよりも大きくなる確率を求めよ. $ X_{i}$をある年齢の生徒の身長とすると, $ X_{i} \sim N(120,4.5^2)$.50人の相加平均 $ \overline{X}$は定理3.6より $ \overline{X} \sim N(120,\frac{4.5^2}{50})$.よって

$\displaystyle P(\overline{X} > 120.5)$ $\displaystyle =$ $\displaystyle P(Z > \frac{120.5-120}{\frac{4.5}{\sqrt{50}}}) = P(Z > 0.9428)$  
  $\displaystyle =$ $\displaystyle 0.5 - P(0 < Z < 0.9528) = 0.5 - 0.32710 \approx 0.173$  

次に,$ X_{i}$が正規分布に従わない場合を考える.

[中心極限定理] $ X_{1},X_{2},\ldots,X_{n}$が互いに独立で,平均値$ \mu$,分散$ \sigma^2$の同じ確率分布に従うとする.このとき,$ n$が十分大きいならば

$\displaystyle \overline{X} = \frac{X_{1} + X_{2} + \cdots + X_{n}}{n} $   近似的に$\displaystyle  N(\mu, \frac{\sigma^2}{n}) $   に従う

$ n > 100$ならば近似度はよくなる.