相関表
ある場所で1時間おきに二酸化硫黄と二酸化窒素の濃度を測定しました.このとき,二酸化硫黄と二酸化窒素の濃度の間にはどんな関係があるのか調べるために準備をします.
ある時刻での二酸化硫黄の濃度を,二酸化窒素の濃度を
とし,
軸に二酸化硫黄の濃度を
軸に二酸化窒素の濃度をとって,座標
を持つ点を図示したものを相関図(correration diagram)といいます.
が増加するとき,
も増加する傾向があるとき,
と
は正の相関(positive correration)があるといいます.これに反し,
が増加するとき,
が減少する傾向があるとき,
と
は負の相関(negative correration)があるといいます.
相関表
相関図ではデータの数が非常に多い場合には,その図示が困難となる場合があります.そのような場合には,2つの変量を同時に考えた度数分布表として表わすと便利です.このような表を相関表といいます.
回帰直線
二酸化硫黄と二酸化窒素の関係のように,変量の値
に,変量
の値
がそれぞれ対応していると仮定します.このとき,平面上の
個の点:
もし回帰直線が求められていれば,に対する
の値(予測値
)は
では,どうすれば
を最小にする
を求めることができるでしょうか.ここで,
の値が変化することにより,
の値が変化するので,
![]() |
![]() |
![]() |
|
![]() |
![]() |
![]() |
![]() |
![]() |
0 | |
![]() |
![]() |
0 |
![]() |
![]() |
0 | |
![]() |
![]() |
0 |
第2式から,
となるので,これを第1式に代入すると,
個のデータ
について,
の
への回帰係数は
回帰直線を用いることができるのはデータが,
の時だけではありません.例えば,自動車の部品メーカーでは,あるセラミック部品の寸法
を精度よく予測する課題に取り組むことになった.
を予測するための変数として,次の3つの変数が考えられている.
![]() |
![]() |
![]() |
|
![]() |
![]() |
![]() |
|
![]() |
![]() |
![]() |
|