2015年3月4日水曜日

つまずかないR言語入門(データの要約)

irisのファイルを要約してみたが、少し詳しく見てみたい。
列に、Sepal(がく片)と Petal(花びら)の長さと幅がそれぞれ表示され、
右端はirisの種類を示している。

行方向は、それぞれ最小値、第一四分位、中央値、平均値、第三四分位、最大値を
示している。
四分位とはデータを昇順に並べて、4等分したものです。
小さい値から数えて、総数の1/4番目に当たる値が第1四分位、 真ん中に当たる値が第2四分位(=中央値)、
3/4番目にあたる値が第3四分位となります。

マーケティングの世界でも、例えば、顧客属性(年齢層、居住地、性別など)
などをざっくり把握する場面で、このsummaryが使えると思う。

前々回紹介した、箱ひげ図を使えば、さらに視覚的に把握するのには便利かもしれない。


----------------------
スマートテクノロジーネットワークのホームページはこちら
----------------------

0 件のコメント:

コメントを投稿