相関表
ある場所で1時間おきに二酸化硫黄と二酸化窒素の濃度を測定しました.このとき,二酸化硫黄と二酸化窒素の濃度の間にはどんな関係があるのか調べるために準備をします.
ある時刻での二酸化硫黄の濃度を,二酸化窒素の濃度をとし,軸に二酸化硫黄の濃度を軸に二酸化窒素の濃度をとって,座標 を持つ点を図示したものを相関図(correration diagram)といいます.
が増加するとき,も増加する傾向があるとき,とは正の相関(positive correration)があるといいます.これに反し,が増加するとき,が減少する傾向があるとき,とは負の相関(negative correration)があるといいます.
相関表
相関図ではデータの数が非常に多い場合には,その図示が困難となる場合があります.そのような場合には,2つの変量を同時に考えた度数分布表として表わすと便利です.このような表を相関表といいます.
回帰直線
二酸化硫黄と二酸化窒素の関係のように,変量の値 に,変量の値 がそれぞれ対応していると仮定します.このとき,平面上の個の点:
もし回帰直線が求められていれば,に対するの値(予測値 )は
では,どうすれば を最小にするを求めることができるでしょうか.ここで,の値が変化することにより, の値が変化するので,
0 | |||
0 |
0 | |||
0 |
第2式から, となるので,これを第1式に代入すると,
個のデータ について,のへの回帰係数は
回帰直線を用いることができるのはデータが,の時だけではありません.例えば,自動車の部品メーカーでは,あるセラミック部品の寸法を精度よく予測する課題に取り組むことになった.を予測するための変数として,次の3つの変数が考えられている.
|