実務的には、外部ファイル(たとえばマイクロソフトの
officeやLINUX系ならLibreofficeか)の表計算ソフトや
CSVファイルを使うケースが圧倒的に多いと考えられる。
そこで、今日は自治体が公開しているオープンデータを
取り込んで、すこし加工したのり、分析してみる。
ここでは、長野県須坂市のオープンデータサイト
から、
商業に関するデータを取り込んでみた。
ちなみに、同市のオープンデータはクリエイティブコモンズの
となっているので、2次利用させていただきます。
該当のアイコンをクリックすると、開くか保存するか
聞いてくるので、とりあえず開き、CSVファイル"08.csv"として
保存します。
保存先は以前説明した、Rの作業フォルダーにするのが
スムーズかと思います。
実は、ここで自分自身の漢字環境とカラムがnullの処理に
実力不足が露呈しまして、タイトルを英語表記、nullを0(ゼロ)
と置き換えていることをご了解ください。
Rを開き
>x<-read.table("08.csv",sep=",",header=TRUE,row.names=1)
として
>x
と打ち込むと
こんな画面が展開されるはずです。
これらをマーケティング的にどうみるか。
次回のエントリーで書きます。
(補遺)
ファイルの読み込みには、数種類のパターンがあるが、
基本は、今回使った
>x<-read.table("file.name",header=TRUE,row.names=1)
となると思う。
読み込むデータは、多くはcsvかtxtと思われる。
read.csvは、read.tableを使って、項目の区切り(sepatator)をsep=",",
read.txtは同じくsep="\t"とすることで、同等の意味を持たすことができる。
txtのセパレータは、使っているOSやキーボードの違いで、表記がことなるので、
"\t"であったり\であったりするので、注意していただきたい。
ちなみに、今回の例題を使って見ると
>x<-read.csv("08.csv,header=TRUE,row.names=1)であったり、
>x<-read.txt("08.txt",header=TRUE,sep="\t",row,names=1)
と同等の機能をもつはずである。
----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------
0 件のコメント:
コメントを投稿