はてなのキーワードの関連付けを、70%は全く同じキーワードに、20%はかなり似たキーワードに、7%を少し似たキーワードに、3%を全く異なるキーワードに関連付けます。
そして、その関連付け全体を1つのシステムとして、メタシステムを作ります。はてなユーザーが日記を書くたびに、システムは新しく学習していきます。もし、はてなユーザーが数千万人(ココログ・ライブドア等と協力)いれば、人工知能として働かないでしょうか。
この妄想について、おかしい点を指摘してください。または、きちんと説明してある本を紹介してください。
URLはダミーです。
意識を持たせようとするなら喜怒哀楽等の感情の値を単語に持たせることが必要なのではないかと思います。データ処理だけでは「意識」と呼べるものが作成できないのではないでしょうか。
BlogPetはブログの言葉を借りて喜怒哀楽表現を出力しています。よって、喜怒哀楽は意識を持ったかどうかの判定には使えないと思います。また、意識にとって喜怒哀楽が必ずしも必要とは思えません。
確かに、現状のはてなキーワードのデータ処理だけでは無理だと思います。しかし、すべての言葉(楽しい・泣いた等)をキーワード化して、キーワードを連携させれば、システム出力できるのではないでしょうか。
いわゆる「意識の有無」がAIの定義だとしますと、チューリングテストのようなものを想定しているのでしょうか? であれば、意識の判定がキーになりそうな気がします。60年代からのAI研究では多くの批判が出ている点です。
http://www.kanzaki.com/docs/sw/
���^�����ƃZ�}���e�B�b�N�E�E�F�u
また、コンピュータでの意味理解などでは、Semantic Webも参考になるかと思います。SWのアプローチでは、単なるキーワードだけではなくって、それを構造化してコンピュータが推論できそうなレベルまで記述する試みだと思いますが、はてなキーワードはそれほど構造化されていないので、それをそのまま使うと表層的な表現しか手に入らない点が難しいことになるかと思います。
http://hatena.ne.jp/1141937510#
人力検索はてな - ネットで人工知能AIを作る。 はてなのキーワードの関連付けを、70%は全く同じキーワードに、20%はかなり似たキーワードに、7%を少し似たキーワードに、3%を全く..
ちょっと参考文献が見つかりませんが。
はてなのキーワードを使うということであれば、表層的なキーワードの持つ多義性、例:TOTO(トイレメーカー、RockBand、サッカーくじ)、や同義性、例:コンピュータ=計算機、をどう扱うか(扱えるのか)がポイントになりそうです。
もう一点は、Webを前提にするとハイパーリンクの限界があり、多対多のリンク関係が表現できないという問題があります。キーワード間の包含関係や同値の問題が最終的な課題になりそうな気がします。
と、色々書いてきましたが、いわゆるチューリングテストレベルの情報は、ある程度のコーパスがあれば実験できると思うので、まずは手を動かして作ってみるというのが早い気がします。
「メタ情報とセマンティック・ウェブ」は面白そう。AI研究の本をきちんと読まないと駄目だな。
なるほど。BlogPetもそうですね。
私が人工知能の定義づけをしなかったのが悪いのですが、「意識」をもつ人工知能です。
なぜ3%を全く異なるキーワードに関連付けて論理的ミスを作り出そうとしたかというと、人間にとって論理的には納得できなくても感覚的には納得できる内容をシステムが出力できれば、システムが「意識」を持ったと判定する第一段階をクリアできるのではないかと、考えたからです。