2015年3月15日日曜日

つまずかないR言語入門(埼玉県のオープンデータを使って)

いままで、長野県須坂市のオープンデータを使わせて戴いていたが、
今回、埼玉県のオープンデータが公開されているのを見て、
同じような分析をして見たい。

埼玉県オープンデータカタログ2014試行版が公開されている。
そこの県政情報・統計ページに、商業統計があり、須坂市と規模は違うが、
同様趣旨のデータを発見したので、読み込んでみた。
概要表(概要表-1~概要表-26)のエクセルファイルに平成19年商業統計調査概要一覧
があり、事業者数・従業者数、年間昇進販売額の推移を表した表があるので、
使用します。

EXCELファイルをダウンロードして、(私の場合はOpenoffice)で、開き
csv形式で保存。
漢字コードの問題(Shift-JIS,unicode,UTF-7)など、込み入っているので、
余分な説明を削除し、タイトルをshop,employee,salesとして保存。
ファイル名は"saitama.csv"とした。


> x<-read.table("saitama.csv",sep=",",header=TRUE,row.names=1)
として、
> summary(x)と入力すると

    shop    employee     sales  
Min.   :56427   Min. :220782    Min. :2.709e+08
1st Qu.  :63216   1st Qu.:327969    1st Qu.:8.864e+08
Median   :68882    Median :422684    Median :1.436e+09
Mean   :66822    Mean :389338    Mean :1.226e+09
3rd Qu.  :71908    3rd Qu.:462440    3rd Qu.:1.701e+09
Max.    :75330    Max. :504982    Max. :1.807e+09

前回同様グラフ化してみた。

> barplot((x$sales)/(x$employee),main="uriage/man",names.arg=c("49","51","54","57","60","63","3","6","9","11","14","16","19"),col=c("orange"))

と、平成3年をピークとしながらも、一人当たりの販売高が向上しているのが見て取れる。

年間売上高を見てみる。 >barplot((x$sales),main="uriage",names.arg=c("49","51","54","57","60","63","3","6","9","11","14","16","19"),col=c("blue"))

平成3年(1991年)に始まったとされるバブル崩壊が、グラフでも明確に読み取れる。
本日はここまでです。

----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------

0 件のコメント:

コメントを投稿