1441082888 例えば入力として abbccab という順序ありの系列を受け取ったら、

画像のような木を出力する
それを、機械学習的な方法で学習する学習器にはどんなものがありますか?



・a b c などは大小が無い離散値で、これら入力記号の値域は決まっています。
・系列の長さは一定ではありません。

回答の条件
  • URL必須
  • 1人3回まで
  • 登録:2015/09/01 13:48:08
  • 終了:2015/09/10 14:50:08

ベストアンサー

id:opechuman No.1

opechuman回答回数16ベストアンサー獲得回数42015/09/02 17:23:09

ポイント50pt

https://ja.wikipedia.org/wiki/%E6%A7%8B%E6%96%87%E8%A7%A3%E6%9E%90

入力が記号列で出力がツリー型のグラフとなる解析で自分がぱっと思いつくのは言語処理の構文解析器で、教師あり学習が一般的ですが工夫次第では教師なし学習も考えられます。例として次のようなモデルが考えられます。統計学の知識があるなら、従属変数が2値変数のベクトルである回帰モデルを雑なイメージとして想像してもらえればいいと思います。Exyは記号xとyの組み合わせ分存在しうるわけですが、ツリー型という制約があるため全ての組み合わせの連結を評価する必要はない点に注意が必要です。

Exy: 記号xy間の連結の有無
Nxy: 2つの記号の属性や記号間の相対的位置関係
Exy = f(Nxy) + ε
x, y ∈ {a1, b2, b3,...} ※添え字の数字は記号列での順序

このとき、素性N、識別対象Eともに高次元となりがちのため、高次元でも汎化性能の高い手法が望ましいといえます。
近年、研究が日進月歩で進んでおり様々な手法が提案されてますが、それを全てレビューするのは大変だと思います。まずは実績のある手法としてサポートベクターマシンを試すのがいいのではないでしょうか。

また教師なし学習については他の方の回答に期待したいところですが、私の思いつく限りでは、何かしらの仮定を置いてクラスタリングの問題に帰着させることになるだろうと思います。

その他の回答(1件)

id:opechuman No.1

opechuman回答回数16ベストアンサー獲得回数42015/09/02 17:23:09ここでベストアンサー

ポイント50pt

https://ja.wikipedia.org/wiki/%E6%A7%8B%E6%96%87%E8%A7%A3%E6%9E%90

入力が記号列で出力がツリー型のグラフとなる解析で自分がぱっと思いつくのは言語処理の構文解析器で、教師あり学習が一般的ですが工夫次第では教師なし学習も考えられます。例として次のようなモデルが考えられます。統計学の知識があるなら、従属変数が2値変数のベクトルである回帰モデルを雑なイメージとして想像してもらえればいいと思います。Exyは記号xとyの組み合わせ分存在しうるわけですが、ツリー型という制約があるため全ての組み合わせの連結を評価する必要はない点に注意が必要です。

Exy: 記号xy間の連結の有無
Nxy: 2つの記号の属性や記号間の相対的位置関係
Exy = f(Nxy) + ε
x, y ∈ {a1, b2, b3,...} ※添え字の数字は記号列での順序

このとき、素性N、識別対象Eともに高次元となりがちのため、高次元でも汎化性能の高い手法が望ましいといえます。
近年、研究が日進月歩で進んでおり様々な手法が提案されてますが、それを全てレビューするのは大変だと思います。まずは実績のある手法としてサポートベクターマシンを試すのがいいのではないでしょうか。

また教師なし学習については他の方の回答に期待したいところですが、私の思いつく限りでは、何かしらの仮定を置いてクラスタリングの問題に帰着させることになるだろうと思います。

id:dethanc No.2

dethanc回答回数2ベストアンサー獲得回数02015/09/03 00:48:37

ポイント50pt

木が順序木であるという前提(※1)であればこんな方法もあるかなと。

・abbccabをa→b→b→c→c→a→bとする(この作業実は意味なしですが)
・できあがっている木を根から左側順にたどって
 R→N→a→B→b→B→B→N→N→b→B→N→c→B→c→B→B→B→N→a→B→b→B→B→B
 と表現。
 (Rが根,Nが節,Bが親ノードへ戻る事を意味する)

左側から系列側を2組のペアに分割(※2)
a→b
b→b
b→c
c→c
c→a
a→b

(※2 精度をあげるために3組以上にすることも可能)

系列と木をそれぞれ左からたどって

a→b,a→B→b
b→b,b→B→B→N→N→b
b→c,b→B→N→c
c→c,c→B→c
c→a,c→B→B→B→N→a
a→b,a→B→b
というトランザクションを抽出。

・これらのトランザクションをほかの事例からも集めて、アソシエーションルールを抽出する。
 アソシエーションルールについてはこちらを参照
 http://bdm.change-jp.com/?p=1341


大抵の問題はただ手法を使うだけでは効果は薄く、※1のような仮定や問題に特化した工夫をする必要があります。

id:TAK_TAK

アソシエーションルールでは、矛盾するトランザクションが得られたらどうしますか

2015/09/05 07:52:30
id:dethanc

アソシエーションルール自体は支持度と確信度がそれぞれのルールごとに得られますので、矛盾したものがあっても割合で評価できるようになってます。AならばBである確率が60%だ、とか。

2015/09/08 19:43:43
  • id:NAPORIN
    よくわからないけどプログラマならわかるのか…
  • id:NAPORIN
    その絵だとaabccbbの絵じゃないのとか思っちゃうんですけど
  • id:dethanc
    回答したいけど質問の意味が…

    系列表現の入力を受けたら図のような木を出力するものに対して法則を推測せよということでしょうか?
    人間の目で見ると、
    ・順序木を作っている
    ・なんか法則に従って幹をつけてるなぁ
    ぐらいのことはわかりますが。。
  • id:TAK_TAK
    系列表現の入力を受けたら図のような木を出力するものを、
    機械学習的な方法で構築する

    そういう方法、
    そういう学習器

    を、回答として得たいです。


  • id:a-kuma3
    abbccab から作られる木は、↓ではなくて、質問の画像のものが正解なのですか?
    http://f.st-hatena.com/images/fotolife/a/a-kuma3/20150902/20150902160557.png
  • id:NAPORIN
    「機械学習的な方法で学習」だから人は学習できなくてもいいのか。
    ゲーム実況動画のTASみたいなのでずーっと絵をかかせて最終的にそういう絵を書くものを選べば…つまりTASのことカー!?
  • id:TAK_TAK
    「今回は」そういう木を出力するとしました。

    http://f.st-hatena.com/images/fotolife/a/a-kuma3/20150902/20150902160557.png
    が正解になる場合もあると思います。


  • id:a-kuma3
    では、データ構造の話ではなく、お絵かきの話ということでしょうか?

    因みに、「学習する」ということは、正解が何かを教えてあげないとダメなんですが、その正解というのは明示できるのでしょうか?
  • id:TAK_TAK
    「今回は」そういう木が正解でした。
    正解はそのように事例として与えられます。

    正解がただ一つではなく
    正解を導くための方法が不明だからこその
    機械学習なのです。

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません