akdamar回答ポイント 100pt

決定木のアルゴリズムで使われるinformation gainとはどういう概念で、それをどのように分岐のルールに取り入れているのでしょうか？

Wikipediaを読むと「情報理論におけるエントロピーにあたる」と書いてあるのですが、このエントロピーというのは物理学のエントロピーとどう違うのですか？

（単なる検索結果へのリンクはいりません。本当に理解している方に自分の言葉で説明していただければ幸いです）

※ 有料アンケート・ポイント付き質問機能は2023年2月28日に終了しました。

ログインして回答する

ベストアンサー

Z9M9Z2006/06/12 23:03:12
満足50pt

AとBが、以下のように順番に並んでいたとします。

AAAABBAABABAABBBB

これはどこに分岐を入れるべきでしょうか。いくつか考えられます。

AAAA|BBAA BA BA BBBB = A4B0 | A4B8

AAAA BBAA|BA BA BBBB = A6B2 | A2B6

AAAA BBAA BA|BA BBBB = A7B3 | A1B5

AAAA BBAA BA BA|BBBB = A8B4 | A0B4

右側に書いたのは、分岐の左右でのAとBの頻度です。これらの候補からどれを選ぶかの基準として登場するのがinformation gainです。

Wikiにもあるように、AxByなら、p=x/(x+y) として - p log p - (1-p)log(1-p)で計算します。これが小さい分け方を選択します。

極端な例では、こんな並びの属性があれば、そこには自明な分岐があって、

AAA | BBB = A3B0 | A0B3

information gainは最小の0となっています。

同様に、どの属性（特徴量、変数）で分岐すべきかを選択するにも、この値の小さい属性＆分岐から選択するのが基本的な方法です。

物理のエントロピーとは「乱雑さの指標である」という概念的共通点があるだけと思っていますが、物理のエントロピーは記憶の彼方です、すいません。

スター
- akdamar 2006/06/13 10:02:33
  
  ありがとうございます！　とても具体的なイメージを持つことができました。
  
  もう少し詳しく教えていただけると助かるのですが、
  
  > AxByなら、p=x/(x+y) として - p log p - (1-p)log(1-p)で計算します。
  
  と、いうことは、このpは分岐の左右それぞれについて計算することになるのでしょうか。
  
  例えば上で挙げられている
  
  AAAA|BBAA BA BA BBBB = A4B0 | A4B8
  
  の場合でいえば、
  
  左のハコがp=4/(4+0)=1
  
  右のハコがp=4/(4+8)=0.333
  
  という理解でよいのでしょうか。
  
  初歩的な質問でまことにすみません。
  
  それから、ここでつかわれているlog xは底が2の対数ということでよろしいのでしょうか。

その他の回答

Z9M9Z2006/06/13 20:03:59
満足25pt

>>このpは分岐の左右それぞれについて計算することになるのでしょうか。

そうなります。両側のエントロピーの和が、分岐のよしあしになります。

>>左のハコがp=4/(4+0)=1

>>右のハコがp=4/(4+8)=0.333

>>という理解でよいのでしょうか。

はい。

>>それから、ここでつかわれているlog xは底が2の対数ということでよろしいのでしょうか。

はい。２が普通です。

スター
- akdamar 2006/06/15 10:35:04
  
  ありがとうございます。
  
  ついでにもうひとつ質問です。
  
  回答１では２つに分岐させるやり方を説明していただきましたが
  
  information gainを基準にしたアルゴリズムでは必ず２進木が生成されるのでしょうか？
  
  それともCHAIDのように３つ以上の分岐もありえるのでしょうか？

決定木のアルゴリズムで使われるinformation gainとはどういう概念で、それをどのように分岐のルールに取り入れているのでしょうか？

ベストアンサー

Z9M9Z2006/06/12 23:03:12
満足50pt

akdamar 2006/06/13 10:02:33

その他の回答

Z9M9Z2006/06/13 20:03:59
満足25pt

akdamar 2006/06/15 10:35:04

Z9M9Z2006/06/16 01:32:50
満足25pt

akdamar 2006/06/16 16:48:21

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

決定木のアルゴリズムで使われるinformation gainとはどういう概念で、それをどのように分岐のルールに取り入れているのでしょうか？

ベストアンサー

Z9M9Z2006/06/12 23:03:12 満足50pt

akdamar 2006/06/13 10:02:33

その他の回答

Z9M9Z2006/06/13 20:03:59 満足25pt

akdamar 2006/06/15 10:35:04

Z9M9Z2006/06/16 01:32:50 満足25pt

akdamar 2006/06/16 16:48:21

この質問へのコメント

この質問への反応（ブックマークコメント）

質問の情報

この質問のカテゴリ

この質問に含まれるキーワード

人気の質問

メニュー

PC版

Z9M9Z2006/06/12 23:03:12
満足50pt

Z9M9Z2006/06/13 20:03:59
満足25pt

Z9M9Z2006/06/16 01:32:50
満足25pt