統計的検定の考え方(Statistical hypothesis testing)

超心理学では透視実験にESPカードを用います.カードは5種類からなっています.そこで1枚のカードを引いて裏向きに置いて,このカードの種類をあてさせます.カードを元に戻し同じ実験を5回繰り返したところ,ある学生は3回的中しました.そこで問題です.この学生の透視能力についてどのような判断を下すべきか考えてみましょう.

2つの結論が考えられます.

結論1. 透視能力が無くても,5回中3回ぐらいは偶然でも的中すると考えられるので,これだけのデータでは透視能力があるとはいえない.

結論2. 5回中3回的中することは滅多にないことだから透視能力があると考える方がもっともらしい.

この2つの結論のどちらを選ぶべきかの基準に確率が用いられます.

まずこの学生がカードをあてる確率は毎回一定で,その確率は$p$とします.5回の実験中的中する回数を$X$とすると, $X \sim B(5,p)$ に従います.ここで透視能力がないということは $\lceil p = 0.2\rfloor $,透視能力があるということは $\lceil p > 0.2\rfloor$ と表わせます.

そこで

$\displaystyle H_{0} : p = 0.2 \ \ \ ($透視能力がない$\displaystyle ) $

と仮定してみます.

ここで5回中3回以上的中する確率は

$\displaystyle P_{r}(X \geq 3)$ $\displaystyle =$ $\displaystyle P_{r}(X = 3) + P_{r}(X = 4) + P_{r}(X = 5)$  
  $\displaystyle =$ $\displaystyle {\binom {5}{3}} (0.2)^3(0.8)^2 + {\binom{5}{4}} (0.2)^4(0.8) + {\binom{5} {5}} (0.2)^5 = 0.057922$  

となり,この確率を有意確率(significant probability)といいます.

実験の結果がそれほど稀な現象ではない,つまり有意確率がそれほど小さくないと判断した場合は結論1を得ます.このことを仮説$H_{0}$容認するといいます.

実験の結果がきわめて稀な現象である,つまり 有意確率がきわめて小さいと判断した場合は結論2になります.このことを仮説$H_{0}$棄却するといいます.

有意確率がどの程度小さければ,$H_{0}$を棄却したらよいかという基準を有意水準(significance level) $\alpha$ とよび,$\alpha$ として $0.05, 0.01$ 等が良く用いられます.この問題で有意水準を $0.05$ とすると,仮説 $H_{0}$ は棄却されない(容認されます).つまりこの学生は透視能力がないと判断されます.

仮説 $H_{0}$ が棄却される $X$ の範囲は $P_{r}(X \geq 4) = 0.00672$ より $X \geq 4$ です.この範囲を棄却域(critical region)といいます.また $H_{0} : p = 0.2$帰無仮説(null hypothesis) $H_{1} : p > 0.2$対立仮説(alternative hypothesis)といいます.

母数 $\theta$ に関する帰無仮説 $H_{0} : \theta = \theta_{0}$ に対し対立仮説として次の3つがあります.

$\displaystyle H_{1} : \theta > \theta_{0}, \ H_{1} : \theta < \theta_{0}, \ H_{1} : \theta \not = \theta_{0}$

母数$\theta$に関する検定の手順
  1. 帰無仮説,対立仮説を立てる.
  2. 有意水準$\alpha$を定める.
  3. 帰無仮説のもとで検定に用いる統計量の分布を求める.
  4. 棄却域を定める.
  5. 検定統計量の実現値が棄却域に入るときは帰無仮説を棄却する.

(1) 母平均の検定

母集団が正規分布 $N(\mu,\sigma^2)$に従う,正規母集団から抽出された大きさ$n$の標本変量 $(X_{1},X_{2},\ldots,X_{n})$を考えます.このとき,これらの相加平均$\bar{X}$ $N(\mu, \frac{\sigma^2}{n})$に従がいます.ここで,母平均$\mu$についての検定を考えます.

(a) $\sigma^2$が既知の場合の$\mu$の検定(有意水準$\alpha$)

この場合は次の標本分布を用います.

$\displaystyle Z = \frac{{\bar X} - \mu }{\sqrt{\sigma^{2}/n}} \sim N(0,1) $

(b) $\sigma^2$が未知の場合の$\mu$の検定(有意水準$\alpha$)

この場合は次の標本分布を用います.

$\displaystyle T = \frac{{\bar X} - \mu }{\sqrt{{S^{\prime}}^{2}/n}} \sim t(n-1) $

(2) 母分散の検定

母集団が正規分布 $N(\mu,\sigma^2)$に従う,正規母集団から抽出された大きさ$n$の標本変量 $(X_{1},X_{2},\ldots,X_{n})$を考えます.ここで,母分散$\sigma^2$についての検定を考えます.

(a) $\mu$が既知の場合の$\sigma^2$の検定(有意水準$\alpha$)

この場合は次の標本分布を用います.

$\displaystyle \chi^2 = \frac{1}{\sigma^{2}}\sum_{i=1}^{n}(X_{i} - \mu)^{2} \sim \chi_{\alpha,n}^{2} $

(b) $\mu$が未知の場合の$\sigma^2$の検定(有意水準$\alpha$)

この場合は次の標本分布を用います.

$\displaystyle \chi^2 = \frac{n S^2}{\sigma^{2}} \sim \chi_{\alpha, n-1}^{2} $

noindent棄却域

(a) $\sigma^2$が既知の場合の$\mu$の検定(有意水準$\alpha$)

帰無仮説 $H_{0} : \mu = \mu_{0}$に対し次の3通りの対立仮説を考えます.

$\displaystyle (1) \ H_{1} : \mu > \mu_{0} \ (2) \ H_{1} : \mu < \mu_{0} \ (3) \ H_{1} \ \mu \neq \mu_{0} $

帰無仮説のもとで(つまり, $\mu = \mu_{0}$のとき)

$\displaystyle Z_{0} = \frac{{\bar X} - \mu_{0} }{\sqrt{\sigma^{2}/n}} \sim N(0,1) $

となります.有意水準$\alpha$に対して,

$\displaystyle{P_{r}(Z_{0} > z_{\alpha}) = \alpha}$であるような $z_{\alpha}$を正規分布表から読み取れば,有意水準$\alpha$の対立仮説(1)に対する帰無仮説の棄却域は $Z_{0} > z_{\alpha}$となります.

これより各対立仮説に対する帰無仮説の棄却域は次の通りです.

(1)の場合 $Z_{0} > z_{\alpha}$
(2)の場合 $Z_{0} < z_{\alpha}$
(3)の場合 $\vert Z_{0}\vert > z_{\frac{\alpha}{2}}$

例題 4..1  

ある大学では一年生に対して毎年同じテストを行なっている.昨年度の一年生の成績は平均64.5,分散20の正規分布に従っている.今年度の一年生にも同じテストを行ない,無作為に8人抽出したところ点数は次の通りであった.

66 73 55 69 70 67 62 71

今年度の一年生の平均点は昨年度より高いか有意水準$5\%$で検定せよ.ただし,今年度の分散は,昨年度と変わらないものとする.

今年度の1年生の平均点を$\mu$とおき,昨年度より高いかの検定を行なうので,以下の帰無仮説と対立仮説を立てる.

$\displaystyle H_{0}$ $\displaystyle :$ $\displaystyle \mu = 64.5$  
$\displaystyle H_{1}$ $\displaystyle :$ $\displaystyle \mu > 64.5$  

今年度の標本$X_{i}$ $X_{i} \sim N(\mu, 20)$と考えることができる.したがって,

$\displaystyle \bar{X} = \frac{1}{8}[66 + 73 + 55 + 69 + 70 + 67 + 62 + 71] = 533/8 = 66.625$

また, $\bar{X} \sim N(\mu, 20/8)$. 帰無仮説のもとで,標準化を行なうと,

$\displaystyle Z_{0} = \frac{66.625 - 64.6}{\sqrt{20/8}} = \frac{2.025}{1.58} = 1.28$

図 4.1: 正規分布
\begin{figure}\begin{center}
\includegraphics[width=6cm]{STATFIG/Fig4-3.png}
\end{center}\end{figure}

これより,$Z_{0}$は帰無仮説の棄却域に入っていない.したがって,帰無仮説を棄却できない.言い換えると,今年度の1年生は昨年度よりも優秀であるとは,結論付けることができない.

統計学演習問題 8

1 ある工場での経験によると7mmボルトの規格の製品の寸法はほぼ正規分布をしており,その標準偏差は0.20mmであるという.ある日の製品から16個のボルトを無作為抽出したところ,その寸法の平均が7.09mmであった.この日の製品の寸法の平均は規格から外れているか.有意水準 $\alpha = 0.05$で検定せよ.またこの日の製品の寸法の平均$\mu$の95$\%$信頼区間を求めよう.

2 1台の機械が製造する鋼球の直径(単位 mm)は正規分布に従っており,その分散は従来の経験から0.0016であるといわれている.ある日この機械が製造した鋼球から8個を抽出しその直径を測定したところ次のようになった.

$\displaystyle 11.97 \ 12.02 \ 12.06 \ 12.03 \ 11.99 \ 11.98 \ 12.12 \ 12.05 $

この日の製品の直径の分散は0.0016より大きいといえるか.有意水準 $\alpha = 0.05$で検定せよ.またこの日の製品の直径の分散の95$\%$信頼区間を求めよう.