2015年3月10日火曜日

つまずかないR言語入門(オープンデータファイルの読込)

前回までは、電卓的使い方と、Rに付属するデータの利用を理解してきた。

実務的には、外部ファイル(たとえばマイクロソフトの
officeやLINUX系ならLibreofficeか)の表計算ソフトや
CSVファイルを使うケースが圧倒的に多いと考えられる。
そこで、今日は自治体が公開しているオープンデータを
取り込んで、すこし加工したのり、分析してみる。

ここでは、長野県須坂市のオープンデータサイト から、
商業に関するデータを取り込んでみた。
ちなみに、同市のオープンデータはクリエイティブコモンズの


となっているので、2次利用させていただきます。

該当のアイコンをクリックすると、開くか保存するか
聞いてくるので、とりあえず開き、CSVファイル"08.csv"として
保存します。
保存先は以前説明した、Rの作業フォルダーにするのが
スムーズかと思います。
実は、ここで自分自身の漢字環境とカラムがnullの処理に 実力不足が露呈しまして、タイトルを英語表記、nullを0(ゼロ) と置き換えていることをご了解ください。

Rを開き

>x<-read.table("08.csv",sep=",",header=TRUE,row.names=1)

として >x と打ち込むと こんな画面が展開されるはずです。

ここからは、
これらをマーケティング的にどうみるか。
次回のエントリーで書きます。

(補遺) ファイルの読み込みには、数種類のパターンがあるが、
基本は、今回使った
>x<-read.table("file.name",header=TRUE,row.names=1)
となると思う。

読み込むデータは、多くはcsvかtxtと思われる。
read.csvは、read.tableを使って、項目の区切り(sepatator)をsep=",",
read.txtは同じくsep="\t"とすることで、同等の意味を持たすことができる。
txtのセパレータは、使っているOSやキーボードの違いで、表記がことなるので、 "\t"であったり\であったりするので、注意していただきたい。

ちなみに、今回の例題を使って見ると

>x<-read.csv("08.csv,header=TRUE,row.names=1)であったり、

>x<-read.txt("08.txt",header=TRUE,sep="\t",row,names=1)

と同等の機能をもつはずである。

----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------

0 件のコメント:

コメントを投稿