2015年3月26日木曜日

つまずかないR言語入門(t検定)

自分自身のスキルアップを大きな目的にしているので、行きつ戻りつして
まだるっこしいところがあるのはご容赦ください。

さて、前回、例えば駐車場がある店舗数とそうでない店舗数を比較しました。
箱ヒゲ図では、

となりました。
では、駐車場のある店舗とない店舗数の平均値の差の検定(t検定)を行ってみたいと
思います。

> t.test(x$shop_n,x$shop_p,var.equal=T)

Two Sample t-test

data: x$shop_n and x$shop_p
t = 3.7, df = 54, p-value = 0.0005067
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
42.14835 141.85165
sample estimates:
mean of x mean of y
107.35714 15.35714
t値=3.7 自由度54、p値=0.0005057

帰無仮説として、平均値における真の差は0である。
p値が有意水準1%以下を下回っているので、帰無仮説を棄却
することが妥当という結論になる。

砕けていうと、板橋区の商業施設の駐車場のある店と、ない店の平均数は有意差が
あるということになる。
板橋区の商業施設は、平均的には駐車場を必要としない、商店街が並んでいるような
イメージなのかもしれない。
では、駐車場のある、無しで平均売上に有意な差があるかを検討してみる。

> t.test(x$sales_n,x$sales_p,var.equal=T)

Two Sample t-test

data: x$sales_n and x$sales_p
t = 1.0512, df = 54, p-value = 0.2978
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3586.677 11493.534
sample estimates:
mean of x mean of y
9314.786 5361.357

t値=1.0512 自由度54、p値=0.297
帰無仮説として、平均値における真の差は0である。
p値が有意水準約29%という結論になり、帰無仮説を棄却できない、つまり
板橋区の商業施設の駐車場のある店と、ない店の平均売上高は有意差が
ないということになる。

箱ヒゲ図で見てみると、

なんだか、腑に落ちない結論(ほんまかいな?)ではあるが、微力な筆者がRを使った結果ではある。
勉強たりないな!

----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------

0 件のコメント:

コメントを投稿