アンケート集計をしました。
現状持っているデータから、単純な集計~クロス集計くらいまでは出せるのですが、もう一歩進んだ分析(例えば独立性の検定など)の切り口が見えてきません。
参考書籍を読んでいると、「クロス集計の結果から何らかの偏りがある部分を見つけ、xxxとyyyには何らかの関連性がありそうだ⇒独立性検定(カイ2乗検定)にかけてみよう」という感じで進めるようなことが書かれていますが、元のアンケートの質問方法がよくなかったせいか、あまり偏りも見られません。
アンケート作成時に、分析ステップのことをもう少し考えておくべきだったと思いますが、今となってはどうにもできません。
このようなとき、何か別の切り口はありますか?
具体例が示せないため回答しにくい質問かとは思いますが、よろしくお願いします。
簡単なマーケティングのようなものでしょうか。分析ツールに何を使っているのかわかりませんが、Excelを前提にお話しします。
まずは、クロス集計を眺めた印象に関係なく全ての変数の組み合わせで独立性の検定を試してみて、本当に有意な差が見られないのかどうか確認してください。データサイズによりますが意外と差が見られる場合があります。
何かしらの有意な差が見られた場合、いろいろグラフを描いてみてどのような分布なのか詳しく検討してみましょう。それで興味深い解釈が得られたら万々歳です。うまく解釈できなかった場合は連続変数なら回帰分析、名義尺度ならナイーブベイズを試してみて下さい。回帰分析は分析ツールで使えます。ナイーブベイズは以下のサイトを参考にしてください。
http://blogs.itmedia.co.jp/komeno/2014/09/it---1-fbb3.html
http://blogs.itmedia.co.jp/komeno/2014/09/it---2-6c35.html
まったく有意な差が見られなかった場合ですが、基本的にはこのデータで分析を続けるのは厳しいと思ってください。ただ、とりあえずナイーブベイズを試すだけ試してみるのは構わないと思います。なお、あまり差が見られないことについてtrioxさんは調査方法が悪かったと考えているようですが、差が見られるはずなのに見られなかったということも興味深い結果になりうるので考え直してみるのも手です。
また、分析によって何を知りたいのか目的がはっきりしているのであれば、クロス集計の結果に囚われず取りあえず目的にかなうような回帰分析のモデルを組んで実行してみるのが手っ取り早いです。このとき名義尺度はダミー変数に変換してください(ソフトによっては勝手にやってくれますがExcelではやってくれません)。詳しいことは述べませんが、最小二乗法を用いた回帰分析は信頼と実績のある手法なので他の手法と比べて気軽に使って大丈夫です。ただ、統計にうるさい人に見せるときは暫定的な分析だと断りを入れた方がいいでしょう。
なお、Excel以外のソフトを使っている場合、主成分分析やクラスター分析、コレスポンデンス分析、潜在クラス分析といったアプローチも浮上してきます。ただ、変数が多くないのであればまずは独立性の検定が基本です。
簡単なマーケティングのようなものでしょうか。分析ツールに何を使っているのかわかりませんが、Excelを前提にお話しします。
まずは、クロス集計を眺めた印象に関係なく全ての変数の組み合わせで独立性の検定を試してみて、本当に有意な差が見られないのかどうか確認してください。データサイズによりますが意外と差が見られる場合があります。
何かしらの有意な差が見られた場合、いろいろグラフを描いてみてどのような分布なのか詳しく検討してみましょう。それで興味深い解釈が得られたら万々歳です。うまく解釈できなかった場合は連続変数なら回帰分析、名義尺度ならナイーブベイズを試してみて下さい。回帰分析は分析ツールで使えます。ナイーブベイズは以下のサイトを参考にしてください。
http://blogs.itmedia.co.jp/komeno/2014/09/it---1-fbb3.html
http://blogs.itmedia.co.jp/komeno/2014/09/it---2-6c35.html
まったく有意な差が見られなかった場合ですが、基本的にはこのデータで分析を続けるのは厳しいと思ってください。ただ、とりあえずナイーブベイズを試すだけ試してみるのは構わないと思います。なお、あまり差が見られないことについてtrioxさんは調査方法が悪かったと考えているようですが、差が見られるはずなのに見られなかったということも興味深い結果になりうるので考え直してみるのも手です。
また、分析によって何を知りたいのか目的がはっきりしているのであれば、クロス集計の結果に囚われず取りあえず目的にかなうような回帰分析のモデルを組んで実行してみるのが手っ取り早いです。このとき名義尺度はダミー変数に変換してください(ソフトによっては勝手にやってくれますがExcelではやってくれません)。詳しいことは述べませんが、最小二乗法を用いた回帰分析は信頼と実績のある手法なので他の手法と比べて気軽に使って大丈夫です。ただ、統計にうるさい人に見せるときは暫定的な分析だと断りを入れた方がいいでしょう。
なお、Excel以外のソフトを使っている場合、主成分分析やクラスター分析、コレスポンデンス分析、潜在クラス分析といったアプローチも浮上してきます。ただ、変数が多くないのであればまずは独立性の検定が基本です。
質問者が何をやりたいのかよく分かりませんが、
> まずは、クロス集計を眺めた印象に関係なく全ての変数の組み合わせで独立性の検定を試してみて、本当に有意な差が見られないのかどうか確認してください。
そのとおり。データを見てから「どういう検定をするか」を判断するのは「後知恵」と呼ばれる行為であり、検定としては間違っています。
先ほどこちらに書こうと思って上に書いてしまいましたが、Excelの片側検定は後知恵検定になっています(バージョンによっては違うかもしれませんが)。これは間違った使い方なので注意しましょう。
質問者が何をやりたいのかよく分かりませんが、
2015/11/01 15:15:44> まずは、クロス集計を眺めた印象に関係なく全ての変数の組み合わせで独立性の検定を試してみて、本当に有意な差が見られないのかどうか確認してください。
そのとおり。データを見てから「どういう検定をするか」を判断するのは「後知恵」と呼ばれる行為であり、検定としては間違っています。