人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

書籍「集合知プログラミング」の6章ドキュメントフィルタリングの、pythonのコードをRubyに直してください。直して頂きたい箇所は、以下URLにある、sampletrainメソッドが動くところまでお願いしたいです。(つまり、関係するのは、trainメソッド、incfメソッド、inccメソッド、それとコンストラクタだと思います)
http://d.hatena.ne.jp/naoe/20090524#p1

(補足)Rubyも初心者ですが、pythonはもっとわかりません。特に「self.getfeatures=getfeatures」とインスタンス変数を宣言した後、「features=self.getfeatures(item)」とitemを引数としているところは、まったく理解できません。

●質問者: nemutaiyo
●カテゴリ:コンピュータ インターネット
○ 状態 :終了
└ 回答数 : 1/1件

▽最新の回答へ

1 ● rish314
●200ポイント ベストアンサー

naive bayes — Gist

私が数年前に書いたゴミコードでよければ参考にしてみてください。手元のプロジェクトではそれっぽく動いていますが動作は保証しません。この本、素敵な本ですが、誤植が多いので、有志による正誤表を参考にしながら読むといいかと思います。


nemutaiyoさんのコメント
おお!Rubyですね。しかも全ソース!質問して良かった。動作確認は明日行いますが、仮に動かなくてもとても参考になります。早速ベストアンサーに選ばせて頂きます。(また質問するかもしれません。その時はよろしくお願いします。)

rish314さんのコメント
喜んでいただけてなによりです。学習用に作成したコードで、書籍のものとは若干違っております(あんまりきれいなコードでもないけど)。不明な点があれば、ここのコメントを書くの欄で書いて頂ければ、しばらくはウオッチするので、返答しますよ。

nemutaiyoさんのコメント
ばっちり動いてます。featuresには"単語"=>"単語の出現数"を渡します。このソースは常に"単語の出現数"部分が1扱いですよね。でもinc_featureを少し変更すれば大丈夫なはず。大事に使わせて頂きます。

rish314さんのコメント
はい。その通りです。使ってやってください。
関連質問

●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ