2015年3月2日月曜日

つまずかないR言語入門(ファイルを扱う)

データを毎回入力するケースは実務レベルでは少ないと考えられる。
一般的に、企業内でマーケティング用途にデータ分析しようとする場合、
蓄積されたexcelやBIツールから出力されたファイルを使うことが多いだろう。

とりあえず、今日は、ファイルの置き場所を気にせずにすむように、
あらかじめRに組み込まれている、"iris"というデータを使って、
ファイル操作に慣れよう。

>iris
と入力してリターンキーを叩くと、全150行のデータが画面に出力される。
あまりにデータが多いので、150行が一瞬の間に表示され全体像が見えない。
そこで、
>head(iris)
とすると、ヘッダータイトルを含んだ先頭6行、

Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
15.13.51.40.2setosa
24.93.01.40.2setosa
34.73.21.30.2setosa
44.63.11.50.2setosa
55.03.61.40.2setosa
65.13.91.70.4setosa


>tail(iris) とすると最終行から前6行が画面に出力されるので、
Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies
1456.73.35.72.5virginica
1466.73.05.22.3virginica
1476.32.55.01.9virginica
1486.53.05.22.0virginica
1496.23.45.42.3virginica
1505.93.05.11.8virginica/td>

こんな感じで、データの全体像は俯瞰できる。
ちなみに、irisはあやめ属の3種についてのsepal(がく片)とpetal(花弁)の
長さと幅を、調べたものです。
詳しくはこちらを参照ください。

http://d.hatena.ne.jp/tsutatsutatsuta /20121206 /1354737461

5列150行のデータファイルがRに取り込まれた訳です。
> summary(iris)で、ファイルを要約すると、次のようになります。


----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------

0 件のコメント:

コメントを投稿