2015年3月13日金曜日

つまずかないR言語入門(オープンデータから読み取れること)

長野県須坂市の商業データをなんとか取り込んだ。

> x<-read.table("08.csv",sep=",",header=TRUE,row.names=1)
と打ち込み、
> x
とすれば、


となる。
売上高と従業員数に注目すると、従業員の数は大きく変化していないが、
売上高が、昭和51年と、平成19年では2倍以上に拡大しているのが判る。
変数xの売上高(sales)と同じく変数xの従業員数(employee)を各年度で割ってみると
数字で示すことができる。

> (x$sales)/(x$employee)

すると、
[1] 879.7255   1184.1150   1481.9854   1946.4864   1928.9300   2494.5890   2199.9728
[8] 2566.8377   1985.2440   1798.8853   1895.1024   2174.6851

ということで、一人あたり売上高が大きく向上していることが数字で裏付けられた。
さらにこれを、グラフ化してみよう。

こういった年度毎の変化には、棒グラフが適切かと思う。
そこで、棒グラフを示すコマンド、barplotを使い、

> barplot((x$sakes)/(x$employee))
とすると、


と、右肩上がりに一人当たり売上高の遷移が確認できる。

グラフとしての見栄えは、とても人前に出せるものではないので、
その当たりの修飾方法は次回エントリーで示します。

追記)つまずかないR言語などと大見栄をはったものの、自分を含め
つまずきそうなところを、明記していなかったので、以前のエントリーで
補記として、陥りそうな落とし穴について、追記していこうと思ってます。

----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------

0 件のコメント:

コメントを投稿