一般的に、企業内でマーケティング用途にデータ分析しようとする場合、
蓄積されたexcelやBIツールから出力されたファイルを使うことが多いだろう。
とりあえず、今日は、ファイルの置き場所を気にせずにすむように、
あらかじめRに組み込まれている、"iris"というデータを使って、
ファイル操作に慣れよう。
>iris
と入力してリターンキーを叩くと、全150行のデータが画面に出力される。
あまりにデータが多いので、150行が一瞬の間に表示され全体像が見えない。
そこで、
>head(iris)
とすると、ヘッダータイトルを含んだ先頭6行、
Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | |
1 | 5.1 | 3.5 | 1.4 | 0.2 | setosa |
2 | 4.9 | 3.0 | 1.4 | 0.2 | setosa |
3 | 4.7 | 3.2 | 1.3 | 0.2 | setosa |
4 | 4.6 | 3.1 | 1.5 | 0.2 | setosa |
5 | 5.0 | 3.6 | 1.4 | 0.2 | setosa |
6 | 5.1 | 3.9 | 1.7 | 0.4 | setosa |
>tail(iris) とすると最終行から前6行が画面に出力されるので、
Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | |
145 | 6.7 | 3.3 | 5.7 | 2.5 | virginica |
146 | 6.7 | 3.0 | 5.2 | 2.3 | virginica |
147 | 6.3 | 2.5 | 5.0 | 1.9 | virginica |
148 | 6.5 | 3.0 | 5.2 | 2.0 | virginica |
149 | 6.2 | 3.4 | 5.4 | 2.3 | virginica |
150 | 5.9 | 3.0 | 5.1 | 1.8 | virginica/td> |
こんな感じで、データの全体像は俯瞰できる。
ちなみに、irisはあやめ属の3種についてのsepal(がく片)とpetal(花弁)の
長さと幅を、調べたものです。
詳しくはこちらを参照ください。
http://d.hatena.ne.jp/tsutatsutatsuta /20121206 /1354737461
5列150行のデータファイルがRに取り込まれた訳です。
> summary(iris)で、ファイルを要約すると、次のようになります。
----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------
0 件のコメント:
コメントを投稿