2015年3月8日日曜日

つまずかないR言語入門(相関係数、単回帰分析)

改めて、回帰分析を考えてみると、例えば身長と体重のように
関係性があるような2つの変量があるとき、一方の数値が
与えられたとき、もう一方の数値を予測するようなケースが
考えられます。
前回の例でいえば、スピードをあげていた車が慌ててブレーキを
かけた時の停止距離と、ゆっくり走っていた車が同様にブレーキを
かけた場合の制動距離は、相関関係がありそうだというのは、
直感的に理解できます。
ちなみに、

>cor(cars)

とすると、speedとdistの相関係数は、0.8068949
となり、
目安として、1.0≧相関係数絶対値≧0.7
にあれば、高い相関関係があるといわれているので、想像通りの
結果とも言える。
マーケティング的にいえば、宣伝費と売上の関係(?)とか
商圏の人口と売上高などの例が挙げられます。
ここで、予測したい変数を目的変数、目的変数を説明する変数を
説明変数と呼びます。
自動車の例でいえば、制動距離が目的変数、スピードが説明変数
ということになりますかね。
この直線を使えば、測定できなかったスピードでも、およその
制動距離が推測できる。という利点があります。

とくに説明変数が一つのときは、単回帰分析と言い、前回の直線が
それを示しています。

ちなみに説明変数が2つ以上の場合を重回帰分析と言います。


----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------

0 件のコメント:

コメントを投稿