$\chi ^{2}$分布(Chi square distribution)

$\chi ^{2}$分布は1つの自然数$n$を含む連続型分布で, $\chi^{2}(n)$と表し$n$をその自由度という。$\chi ^{2}$分布の密度関数$f_{n}(x)$は次の式で与えられる。

$\displaystyle f_{n}(x) = \left\{\begin{array}{ll}
\frac{1}{2^{\frac{n}{2}}\Gam...
...)}x^{\frac{n}{2}-1}e^{-\frac{1}{2}x} & x > 0\\
0 & x \leq 0
\end{array}\right.$

ここで,ガンマ関数$\Gamma(x)$

$\displaystyle \Gamma(x) = \int_{0}^{\infty}t^{x-1}e^{-t}dt (x > 0)$

で定義される。

$\chi ^{2}$分布の名前は次の性質から来ている。

定理 5..1  

確率変数 $X_{1},X_{2},\ldots,X_{n}$が同一の標準正規分布$N(0,1)$に従い,互いに独立ならば,その統計量

$\displaystyle \chi_{n}^{2} = X_{1}^{2} + X_{2}^{2} + \cdots + X_{n}^{2}$

は自由度$n$$\chi ^{2}$分布に従う。その期待値と分散は

$\displaystyle E(\chi_{n}^{2}) = n, V(\chi_{n}^{2}) = 2n$

定理 5..2  

[$\chi ^{2}$分布の加法性] $\chi_{n}^{2}, \chi_{m}^{2}$がそれぞれ自由度$n$,$m$$\chi ^{2}$分布に従い,互いに独立ならば, $\chi^{2} = \chi_{n}^{2} + \chi_{m}^{2}$は自由度$n+m$$\chi ^{2}$分布に従う。

標本確率変数 $X_{1},X_{2},\ldots,X_{n}$の標本分散$S^{2}$

$\displaystyle S^{2} = \frac{1}{n}\sum_{i=1}^{n}(X_{i} - \bar{X})^{2} = \frac{1}{n}\sum_{i=1}^{n}X_{i}^{2} - \bar{X}^{2}$

で定義される。しかし,この式から求まる標本標準偏差$S$は一般に標準偏差として用いられていない。その理由は,

$\displaystyle E(S^{2}) = \frac{n-1}{n}\sigma^{2}$

となり,$S^{2}$の期待値は母分散の期待値と異なる。そこで,多くのテキストでは,

$\displaystyle S^{2} = \frac{1}{n-1}\sum_{i=1}^{n}(X_{i} - \bar{X})^{2} = \frac{1}{n-1}\sum_{i=1}^{n}X_{i}^{2} - \bar{X}^{2}$

と定義している。この定義によれば,

$\displaystyle E(S^{2}) = \frac{n-1}{n-1}\sigma^{2} = \sigma^{2}$

となる。このような統計量$S^{2}$を母分散の不偏推定量という。

標本分散$S^{2}$に関して,次の定理がある。

定理 5..3  

$N(\mu, \sigma^{2})$の正規分布に従う母集団から無作為で得た標本を $\{X_{1},X_{2},\ldots,X_{n}\}$とすると,

$\displaystyle Y = \frac{1}{\sigma^{2}}\sum_{i=1}^{n}(X_{i} - \bar{X})^{2}$

は自由度が$n-1$$\chi ^{2}$分布に従って分布する。

演習問題 5..2  

1. 母集団が正規分布であるとする。$n$が20の標本から標本分散を求めたところ,その値は1.5であった。母分散が1のとき,標本分散が1.5より大きい確率を求めよ。