人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

ある統計データがどんな分布になっているかを簡単に、Rで、調べる方法にはどんなものがあるのでしょうか? 正規分布、べき分布など分布にはいろいろ種類があります。100個くらいのデータが付与されたときに、どんな分布に近いかをRで * 簡単 * に調べるのはどうしたらいいのでしょうか? 複雑でなく、手軽で簡単な方法をお願いします。Rでなくてエクセルでもいいです。

●質問者: isogaya
●カテゴリ:コンピュータ 科学・統計資料
✍キーワード:いるか べき分布 エクセル データ 分布
○ 状態 :終了
└ 回答数 : 3/3件

▽最新の回答へ

1 ● dacks1
●27ポイント

この辺のソフトは使いやすいインターフェイスだと思います。

http://www.vector.co.jp/soft/win95/business/se055569.html

http://www.vector.co.jp/soft/win95/business/se090636.html

http://www.vector.co.jp/soft/win95/business/se223437.html

◎質問者からの返答

すみません。ちょっと違います。どの分布になっているかのチェック方法を知りたいのです。ベキ分布もふくまれているのでしょうか


2 ● gappa
●27ポイント

*簡単*な方法はないですね。

未知のデータがダブルピークの分布だったりした場合、当てずっぽうに分布を当てはめても無意味です。

サンプリングデータの分布形状や、平均、標準偏差、メジアン、最頻値などの数値を参考にモデルに当てはめて検定することになります

Rによる統計解析 第5章、第6章のあたり

Rによる統計解析

Rによる統計解析

  • 作者: 青木 繁伸
  • 出版社/メーカー: オーム社
  • メディア: 単行本


3 ● 考え中
●26ポイント

統計の基本的な手法として、与えられたデータの性質を見るのに良い方法は、そのデータの代表値(平均値、中央値、最頻値、分散など)を求めることと、データをグラフ化することだと思います。

次に、Rで使えるコマンドを紹介します。

代表値を求めるコマンド

最小値,第1四分位数,中央値,平均値,第3四分位数,最大値を表示させることが出来ます.

> summary(データフレーム名$変数名)

データフレーム名を毎回入力するのが面倒であれば、attach(データフレーム名)を実行してみて下さい.

例えば,上記コマンドsummary(データフレーム名$変数名)は,summary(変数名)で同じ結果を得ることが出来るようになります.

標準偏差を求めるためには、

> sd(変数名,…)

を使って下さい。

また箱髭図を描くには

>boxplot(変数名,…)

ヒストグラム(棒グラフ)を作成するには

>hist(変数名)

データが正規分布しているかを調べるには

Q-Qプロットを使います。

>qqnorm(変数名)

データが正規分布しているかどうかを判定するにはシャピロ・ウィルクの検定などがありますが、

> shapiro.test(データベース名$変数名)

データ数にも左右されます。今はあまり考えなくても良いと思います。

Rに関する情報は、ネット上に沢山あるので、調べることを厭わなければ独学できます。

http://ichir.cocolog-nifty.com/blog/2007/02/post_fad0.html

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ