対話形式のコーパスを出来るだけ効率的に多量に収集したいので

その方法を考えてください。

CMCではなく、実際に音声として発話することが出来る文の会話であることが条件です。


有料でも構いませんが、
データ量あたりの単価が安い方が良いです。

回答の条件
  • URL必須
  • 1人3回まで
  • 登録:2016/03/09 13:18:19
  • 終了:2016/03/16 20:48:21

ベストアンサー

id:kotaeru3 No.1

kotaeru3回答回数24ベストアンサー獲得回数42016/03/10 17:37:27

ポイント200pt

昔、人工無能の研究をやっていた者です。笑

この質問って、あまりに”深い”ので、
ここではなくて

http://qiita.com/GushiSnow/items/818d95e851800da35fde
http://research.nii.ac.jp/src/OGVC.html
http://www.tufs.ac.jp/ts/personal/usamiken/corpora.htm

など、サイトの運営者に質問される方が、
良い回答を得られるかと思いますが、
如何でしょうか?
※リンクは、”対話形式のコーパス”をググった物ですいません。

もしくは、何に使うか、想定されている回答等、
ご質問をもう少し詳細にされるか・・・

他の方の良い回答があれば、私の勘違いです。すいません。

id:TAK_TAK

何に使うのかと言うと対話の機械学習の為です。

売っているコーパスでは全然量が足りないです。
リンク先程度では全然足りません。



とにかく多量のテキスト化された対話を作りたいのです。

2016/03/10 18:13:14

この質問への反応(ブックマークコメント)

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません