母比率の区間推定(大標本の場合)(Confidence interval for population proportion)

母集団の中で,ある属性に対して事象$A$の起こる割合$p$を事象$A$母比率といいます. 母比率が$p$の二項母集団から抽出された大きさ$n$の標本を $(X_{1},\ldots,X_{n})$とします.ここで,

$\displaystyle X_{i} = \left\{\begin{array}{ll}
1 & Aのとき\\
0 & \bar{A}のとき
\end{array}\right.$

とします.このとき, $X = X_{1} + \cdots + X_{n}$とすると,$X$は標本中$A$であるものの個数を表す統計量で, $\displaystyle{\frac{X}{n}}$は事象$A$標本比率といいます.
$\frac{X}{n}$は母比率$p$の不偏推定量である

母比率$p$の二項母集団から大きさ$n$の標本 $(X_{1},\ldots,X_{n})$をとり, $X = X_{1} + \cdots + X_{n}$とすると$X$は二項分布$B(n,p)$に従います.ここで$n$が十分大きいときにはラプラスの定理によって,$X$は近似的に正規分布 $N(np,np(1-p))$に従い,標本比率 $\frac{X}{n} = \hat{p}$は近似的に正規分布 $N\left(p,\frac{p(1-p)}{n}\right)$に従います.よって,標準化を行うと

$\displaystyle \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1)$

したがって,

$\displaystyle P\left(\left\vert\frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\right\vert \leq z_{\frac{\alpha}{2}}\right) = 1- \alpha$

が成り立ちます.この式を書き直すと

$\displaystyle \hat{p} - z_{\frac{\alpha}{2}}\sqrt{\frac{p(1-p)}{n}}\ \leq p \leq p + z_{\frac{\alpha}{2}}\sqrt{\frac{p(1-p)}{n}}$

この両辺は母数$p$を含んでいるが,$n$が非常に大きいときには$\hat{p}$で近似できるので,母比率$p$の信頼度 $100(1 - \alpha)\% $の信頼区間は

$\displaystyle \left(\hat{p} - z_{\frac{\alpha}{2}}\sqrt{\frac{\hat{p}(1-\hat{p}...
...}}\ ,\ \hat{p} + z_{\frac{\alpha}{2}}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right)$


となります.

定理 3..2  

[ラプラスの定理] $X \sim B(n,p)$のとき,十分大きな$n$に対して
$X$は近似的に $N(np,np(1-p))$に従う.

例題 3..7  

サイコロを600回投げたところ,1の目が108回出たという.1の目が出る母比率$p$を信頼度$95\%$で区間推定せよ.

解答 標本比率は $\hat{p} = \frac{108}{600} = 0.18$.また, $z_{\frac{\alpha}{2}} = z_{\frac{0.05}{2}} = 1.96$であるから,上記の公式に代入すると

$\displaystyle \left(0.18 - 1.96 \sqrt{\frac{(0.18)(0.82)}{600}},\ 0.18 - 1.96 \sqrt{\frac{(0.18)(0.82)}{600}}\right)$

より, $(0.15, 0.21)$となります.