ある統計データがどんな分布になっているかを簡単に、Rで、調べる方法にはどんなものがあるのでしょうか? 正規分布、べき分布など分布にはいろいろ種類があります。100個くらいのデータが付与されたときに、どんな分布に近いかをRで * 簡単 * に調べるのはどうしたらいいのでしょうか? 複雑でなく、手軽で簡単な方法をお願いします。Rでなくてエクセルでもいいです。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2010/02/06 13:22:40
  • 終了:2010/02/13 13:25:03

回答(3件)

id:dacks1 No.1

dacks1回答回数89ベストアンサー獲得回数42010/02/06 14:30:50

id:isogaya

すみません。ちょっと違います。どの分布になっているかのチェック方法を知りたいのです。ベキ分布もふくまれているのでしょうか

2010/02/06 14:52:09
id:gappa No.2

gappa回答回数23ベストアンサー獲得回数32010/02/06 15:57:40

ポイント27pt

*簡単*な方法はないですね。

未知のデータがダブルピークの分布だったりした場合、当てずっぽうに分布を当てはめても無意味です。

サンプリングデータの分布形状や、平均、標準偏差、メジアン、最頻値などの数値を参考にモデルに当てはめて検定することになります

Rによる統計解析 第5章、第6章のあたり

Rによる統計解析

Rによる統計解析

  • 作者: 青木 繁伸
  • 出版社/メーカー: オーム社
  • メディア: 単行本

id:nobnob3 No.3

考え中回答回数324ベストアンサー獲得回数292010/02/06 20:48:22

ポイント26pt

統計の基本的な手法として、与えられたデータの性質を見るのに良い方法は、そのデータの代表値(平均値、中央値、最頻値、分散など)を求めることと、データをグラフ化することだと思います。

次に、Rで使えるコマンドを紹介します。

代表値を求めるコマンド

最小値,第1四分位数,中央値,平均値,第3四分位数,最大値を表示させることが出来ます.

> summary(データフレーム名$変数名)

データフレーム名を毎回入力するのが面倒であれば、attach(データフレーム名)を実行してみて下さい.

例えば,上記コマンドsummary(データフレーム名$変数名)は,summary(変数名)で同じ結果を得ることが出来るようになります.

標準偏差を求めるためには、

> sd(変数名,…)

を使って下さい。

また箱髭図を描くには

>boxplot(変数名,…)

ヒストグラム(棒グラフ)を作成するには

>hist(変数名)

データが正規分布しているかを調べるには

Q-Qプロットを使います。

>qqnorm(変数名)

データが正規分布しているかどうかを判定するにはシャピロ・ウィルクの検定などがありますが、

> shapiro.test(データベース名$変数名)

データ数にも左右されます。今はあまり考えなくても良いと思います。

Rに関する情報は、ネット上に沢山あるので、調べることを厭わなければ独学できます。

http://ichir.cocolog-nifty.com/blog/2007/02/post_fad0.html

コメントはまだありません

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません