比率の検定

母比率の検定(大標本の場合) 母集団の中で,ある属性に対して事象$ A$の起こる割合$ p$を事象$ A$母比率といいます.この母比率に関する仮説を,標本値から検定することを考えます.

母比率が$ p$の二項母集団から抽出された大きさ$ n$の標本を $ (X_{1},\ldots,X_{n})$とします.ここで,

$\displaystyle X_{i} = \left\{\begin{array}{ll}
1 & Aのとき\\
0 & \bar{A}のとき
\end{array}\right.$

とします.このとき, $ X = X_{1} + \cdots + X_{n}$とすると,$ X$は標本中$ A$であるものの個数を表す統計量で, $ \displaystyle{\frac{X}{n}}$は事象$ A$標本比率といいます. そのとき,母比率$ p$について, $ p_{0}(0 \leq p_{0} \leq 1)$を既知の値として,帰無仮説

$ H_{0}$: 「$ p = p_{0}$」,対立仮説 $ H_{1}$: 「 $ p \neq p_{0}$

を検定することが問題となります.

母比率$ p$の二項母集団から大きさ$ n$の標本 $ (X_{1},\ldots,X_{n})$をとり, $ X = X_{1} + \cdots + X_{n}$とすると$ X$は二項分布$ B(n,p)$に従います.ここで$ n$が十分大きいときにはラプラスの定理によって,$ X$は近似的に正規分布 $ N(np,np(1-p))$に従い,標本比率 $ \frac{X}{n} = \hat{p}$は近似的に正規分布 $ N\left(p,\frac{p(1-p)}{n}\right)$に従います.よって,標準化を行うと

$\displaystyle Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1)$

例題 4..5  

サイコロを600回投げたところ,1の目が108回出たという.1の目が出る母比率$ p$ $ \frac{1}{6}$か有意水準5%で検定せよ.

解答

1 
$ H_{0}$ : 「1の目の出る確率 $ p = \frac{1}{6}$
$ H_{1}$ : 「 $ p \neq \frac{1}{6}$

2 有意水準 $ \alpha = 0.05$

3 統計量

$\displaystyle Z = \frac{\hat{p} - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1)$

4 $ H_{0}$のもとで, $ \hat{p} = \frac{108}{600} = 0.18$より,

$\displaystyle Z_{0}$ $\displaystyle =$ $\displaystyle \frac{0.18 - \frac{1}{6}}{\sqrt{\frac{\frac{1}{6}(1-\frac{1}{6})}{600}}}$  
  $\displaystyle =$ $\displaystyle 0.088$  

5 対立仮説より,標準正規分布の両側確率を用いる.

$\displaystyle Z_{0} < Z_{\frac{0.05}{2}} = 1.96 $

したがって,$ H_{0}$を容認.

母比率の差の検定

2つの母集団$ A,B$の中で1つの特性$ C$を持つものの母比率を $ p_{1},p_{2}$とする.この母集団からそれぞれ大きさ $ n_{1},n_{2}$個の標本を抽出し,その特性を持つものの個数を $ X_{1},X_{2}$とする.このとき,母比率について

帰無仮説 $ H_{0}$: 「 $ p_{1} = p_{2}$」と対立仮説 $ H_{1}$: 「 $ p_{1} \neq p_{2}$

を検定することを考えます.帰無仮説のもとで,母比率の値 $ p_{1},p_{2}$は未知ですが,

$\displaystyle p_{1} = p_{2} = p, 1-p = q$

とおくと, $ n_{1},n_{2}$がある程度大きければ $ X_{1},X_{2}$の分布は正規分布 $ (N(n_{1}p, n_{1}pq), N(n_{2}p, n_{2}pq)$によってそれぞれ近似されるので,統計量

$\displaystyle \bar{X_{1}} = \frac{X_{1}}{n_{1}} \sim (N(p, \frac{pq}{n_{1}})$

$\displaystyle \bar{X_{2}} = \frac{X_{2}}{n_{2}}\sim (N(p, \frac{pq}{n_{2}})$

$\displaystyle \frac{X_{1}}{n_{1}} - \frac{X_{2}}{n_{2}} \sim N(0, (\frac{1}{n_{1}} + \frac{1}{n_{2}})pq)$

これより,

$\displaystyle Z = \frac{X_{1}/n_{1} - X_{2}/n_{2}}{\sqrt{(\frac{1}{n_{1}} + \frac{1}{n_{2}}) p(1-p)}} \sim N(0,1) $

ただし,共通の母比率$ p$は未知数ですので,観測比率

$\displaystyle p = \frac{X_{1} + X_{2}}{n_{1} + n_{2}}$

を用います.

例題 4..6  

テレビの視聴率調査で,ある番組について男性は400人中の無作為標本中120人が,女性は500人の無作為標本中180人が好きと答えた.実際に男女の好みに差があるといえるか,有意水準5%で検定せよ.

解答 ある番組を男性が好きな比率を$ p_{1}$,女性が好きな比率を$ p_{2}$とすると, $ p_{1} = \frac{120}{400}, p_{2} = \frac{180}{500}$

1 
$ H_{0}$ : 「男女で好みに差がない」 $ p_{1} = p_{2}$
$ H_{1}$ : 「男女で好みに差がある」 $ p_{1} \neq p_{2}$

2 有意水準 $ \alpha = 0.05$

3 統計量

$\displaystyle Z = \frac{X_{1}/n_{1} - X_{2}/n_{2}}{\sqrt{(\frac{1}{n_{1}} + \frac{1}{n_{2}}) p(1-p)}} \sim N(0,1) $

4 $ H_{0}$のもとで, $ p = \frac{120+180}{400+500} = \frac{1}{3}$より,

$\displaystyle Z_{0}$ $\displaystyle =$ $\displaystyle \frac{120/400 - 180/500}{\sqrt{(\frac{1}{400} + \frac{1}{500}) \frac{1}{3}(1-\frac{1}{3})}}$  
  $\displaystyle =$ $\displaystyle -1.897$  

5 対立仮説より,標準正規分布の両側確率を用いる.

$\displaystyle \vert Z_{0}\vert < Z_{\frac{0.05}{2}} = 1.96 $

したがって,$ H_{0}$を容認.

統計学演習問題 10

1 ある政党の支持率は従来28%であったが,最近の世論調査で無作為に抽出された3,000人有権者のうち支持率は25%であった.支持率が低下したと判断すべきか,有意水準5%で検定せよ.

2 あるテレビ番組の視聴率調査を男女別に行った.その結果,男性の無作為標本200人のうち25人が,女性の無作為標本300人のうち20人が見ていると答えた.このとき,男女の視聴率に差があるといえるか,有意水準5%で検定せよ.