今回、埼玉県のオープンデータが公開されているのを見て、
同じような分析をして見たい。
埼玉県オープンデータカタログ2014試行版が公開されている。
そこの県政情報・統計ページに、商業統計があり、須坂市と規模は違うが、
同様趣旨のデータを発見したので、読み込んでみた。
概要表(概要表-1~概要表-26)のエクセルファイルに平成19年商業統計調査概要一覧
があり、事業者数・従業者数、年間昇進販売額の推移を表した表があるので、
使用します。
EXCELファイルをダウンロードして、(私の場合はOpenoffice)で、開き
csv形式で保存。
漢字コードの問題(Shift-JIS,unicode,UTF-7)など、込み入っているので、
余分な説明を削除し、タイトルをshop,employee,salesとして保存。
ファイル名は"saitama.csv"とした。
> x<-read.table("saitama.csv",sep=",",header=TRUE,row.names=1)
として、
> summary(x)と入力すると
shop employee sales
Min. :56427 Min. :220782 Min. :2.709e+08
1st Qu. :63216 1st Qu.:327969 1st Qu.:8.864e+08
Median :68882 Median :422684 Median :1.436e+09
Mean :66822 Mean :389338 Mean :1.226e+09
3rd Qu. :71908 3rd Qu.:462440 3rd Qu.:1.701e+09
Max. :75330 Max. :504982 Max. :1.807e+09
前回同様グラフ化してみた。
> barplot((x$sales)/(x$employee),main="uriage/man",names.arg=c("49","51","54","57","60","63","3","6","9","11","14","16","19"),col=c("orange"))
と、平成3年をピークとしながらも、一人当たりの販売高が向上しているのが見て取れる。
年間売上高を見てみる。 >barplot((x$sales),main="uriage",names.arg=c("49","51","54","57","60","63","3","6","9","11","14","16","19"),col=c("blue"))
平成3年(1991年)に始まったとされるバブル崩壊が、グラフでも明確に読み取れる。
本日はここまでです。
----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------
0 件のコメント:
コメントを投稿