散布度(dispersion)
5点満点のテストを行なったところ次のような度数分布表を得ました.
階級 | ||||
0 | 2 | 0.02 | 2 | 0.02 |
1 | 13 | 0.13 | 15 | 0.15 |
2 | 33 | 0.33 | 48 | 0.48 |
3 | 35 | 0.35 | 83 | 0.83 |
4 | 16 | 0.16 | 99 | 0.99 |
5 | 1 | 0.01 | 100 | 1.00 |
標本数 | |||||
100 | 253 | 2.53 | 741 | 1.01 | 1.00 |
この表のとについて説明します.
散布度 : データが平均のまわりに集中して分布するか,平均のまわりから散らばって分布するかの程度を表わすのが,散布度です.
度数分布表において,各階級数 に対する度数をとするとき,変量の平均 からの偏差の平方の平均:
実際の問題では階級に分ける前にすべてのデータを打ち込むので,変量に関する個のデータ
が与えられたとき,分散は次の式で与えられます.
ここで分散を簡単に計算する実用的な方法として次の簡便計算法があります.
上の式を導きなさい.
解答
標準偏差は平均値のまわりのデータの散らばりの大きさを表す量ですが,標準偏差が10点であるといっても平均点が30点のときと,60点のときでは違いがあることが分かります.この違いを表す量として,変動係数とよばれるものがあります.変動係数はデータの平均値 で標準偏差を割った割合 で表します.したがって,変動係数は平均値に対する相対的な散らばりの大きさを表します.
あるクラスの英語の試験の平均点はで標準偏差は.また,数学の試験の平均点はで標準偏差はでした.このクラスのA君の成績は英語が75点で数学が68点でした.A君のクラスでの成績は,英語と数学のどちらの順位が上でしょうか.
解答 2つの異なるものを比較するには,共に同じ土俵にもってこなくてはなりません.その方法として標準化とよばれるものがあります.
相関関係
2次元データの分布の特徴は2つの変数の平均値と分散だけでは表わすことが困難です.そこでの組のデータを
|
67 | 54 | 54 | 66 | 56 | 65 | 46 | 35 | 45 | 45 |
83 | 72 | 54 | 58 | 47 | 60 | 43 | 82 | 76 | 92 |
|