母比率の区間推定(大標本の場合)

母集団の中で,ある属性に対して事象$ A$の起こる割合$ p$を事象$ A$母比率といいます. 母比率が$ p$の二項母集団から抽出された大きさ$ n$の標本を $ (X_{1},\ldots,X_{n})$とします.ここで,

$\displaystyle X_{i} = \left\{\begin{array}{ll}
1 & Aのとき\\
0 & \bar{A}のとき
\end{array}\right.$

とします.このとき, $ X = X_{1} + \cdots + X_{n}$とすると,$ X$は標本中$ A$であるものの個数を表す統計量で, $ \displaystyle{\frac{X}{n}}$は事象$ A$標本比率といいます.
$\frac{X}{n}$は母比率$ p$の不偏推定量である

母比率$ p$の二項母集団から大きさ$ n$の標本 $ (X_{1},\ldots,X_{n})$をとり, $ X = X_{1} + \cdots + X_{n}$とすると$ X$は二項分布$ B(n,p)$に従います.ここで$ n$が十分大きいときにはラプラスの定理によって,$ X$は近似的に正規分布 $ N(np,np(1-p))$に従い,標本比率 $ \frac{X}{n} = \hat{p}$は近似的に正規分布 $ N\left(p,\frac{p(1-p)}{n}\right)$に従います.よって,標準化を行うと

$\displaystyle \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1)$

したがって,

$\displaystyle P\left(\left\vert\frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}}\right\vert \leq z_{\frac{\alpha}{2}}\right) = 1- \alpha$

が成り立ちます.この式を書き直すと

$\displaystyle \hat{p} - z_{\frac{\alpha}{2}}\sqrt{\frac{p(1-p)}{n}} \leq p \leq p + z_{\frac{\alpha}{2}}\sqrt{\frac{p(1-p)}{n}}$

この両辺は母数$ p$を含んでいるが,$ n$が非常に大きいときには$ \hat{p}$で近似できるので,母比率$ p$の信頼度 $ 100(1 - \alpha)\% $の信頼区間は

$\displaystyle \left(\hat{p} - z_{\frac{\alpha}{2}}\sqrt{\frac{\hat{p}(1-\hat{p}...
...}} , \hat{p} + z_{\frac{\alpha}{2}}\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\right)$


となります.

定理 3..2  

[ラプラスの定理] $ X \sim B(n,p)$のとき,十分大きな$ n$に対して
$ X$は近似的に $ N(np,np(1-p))$に従う.

例題 3..7  

サイコロを600回投げたところ,1の目が108回出たという.1の目が出る母比率$ p$を信頼度$ 95\%$で区間推定せよ.

解答 標本比率は $ \hat{p} = \frac{108}{600} = 0.18$.また, $ z_{\frac{\alpha}{2}} = z_{\frac{0.05}{2}} = 1.96$であるから,上記の公式に代入すると

$\displaystyle \left(0.18 - 1.96 \sqrt{\frac{(0.18)(0.82)}{600}}, 0.18 - 1.96 \sqrt{\frac{(0.18)(0.82)}{600}}\right)$

より, $ (0.15, 0.21)$となります.