こんな感じの技術を捜しているのですが、最近の情報(2012年以降の最新技術)がなかなか見つかりません。
http://itpro.nikkeibp.co.jp/article/NEWS/20091014/338833/
もじもじTVは残念な状態になっているようですが同様の技術を現在も開発・研究しているといった最新情報をさがしています。該当する書籍・情報などお願いします。
YouTubeのキャプション機能の記事(2011/7/15)は既読です。
音声全文検索・書き起こしサービスPodCastle
(産業技術総合研究所・ 産総研 TODAY Vol.12(2012) No.05)
テキストで書き起こす必要性
インターネット上の動画共有サービスや音声配信サービスの普及に伴い、誰でも視聴できる音声を伴う動画データや音声データが日常的に生成・蓄積され増え続けています。しかし、動画音声データはテキスト(文字)データと異なり、それ自体を索引として使えないため、発言内容などの詳細な情報の検索(全文検索)ができませんでした。
(略)
動画共有サービスに対応したPodCastleを公開
産総研では、音声認識誤りをユーザーが訂正できる独自のインタフェースを開発し、2008年に日本語のポッドキャスト*を対象とした音声全文検索サービスを一般公開しました。16万件以上の音声データが登録され、実際に58万単語以上が訂正されました。それらを学習することで音声認識性能の向上が可能なことを実証しました。さらに動画や英語への対応が求められてきました。
今回私たちは、ユーザーに協力してもらうことで性能が日々向上する音声情報検索技術を開発し、インターネット上にある日本語と英語の動画音声データを対象とした音声全文検索・書き起こしサービス「ポッドキャッスル(PodCastle)」(日本語版 http://podcastle.jp 、英語版 http://en.podcastle.jp)を2011年に一般公開し、実証実験を開始しました(図1)。
図1 実証実験中の音声全文検索・書き起こしサービス「ポッドキャッスル(PodCastle)」
このPodCastleでは、普及が進んでいる代表的な動画共有サービス(ニコニコ動画、YouTube、Ustream)に新たに対応しました。そして、複数のユーザーが協力し合って、話者名や改行を入力しながら読みやすい書き起こしを作成できる機能を実現しました(図2)。さらに、エジンバラ大学音声技術研究所の協力を得て、英語の動画音声データも音声認識と検索ができるように改良しました。誰でも無料で利用できる便利なサービスなので、多くの方々に使っていただければと願っています。
(以下略)
上記のPDF版
PodCastle(http://podcastle.jp)のサイトで、実際に動画の音声が日本語に変換されていますので、ご確認下さい。
(Google Chrome + IETabで再生確認)
音声全文検索・書き起こしサービスPodCastle
(産業技術総合研究所・ 産総研 TODAY Vol.12(2012) No.05)
テキストで書き起こす必要性
インターネット上の動画共有サービスや音声配信サービスの普及に伴い、誰でも視聴できる音声を伴う動画データや音声データが日常的に生成・蓄積され増え続けています。しかし、動画音声データはテキスト(文字)データと異なり、それ自体を索引として使えないため、発言内容などの詳細な情報の検索(全文検索)ができませんでした。
(略)
動画共有サービスに対応したPodCastleを公開
産総研では、音声認識誤りをユーザーが訂正できる独自のインタフェースを開発し、2008年に日本語のポッドキャスト*を対象とした音声全文検索サービスを一般公開しました。16万件以上の音声データが登録され、実際に58万単語以上が訂正されました。それらを学習することで音声認識性能の向上が可能なことを実証しました。さらに動画や英語への対応が求められてきました。
今回私たちは、ユーザーに協力してもらうことで性能が日々向上する音声情報検索技術を開発し、インターネット上にある日本語と英語の動画音声データを対象とした音声全文検索・書き起こしサービス「ポッドキャッスル(PodCastle)」(日本語版 http://podcastle.jp 、英語版 http://en.podcastle.jp)を2011年に一般公開し、実証実験を開始しました(図1)。
図1 実証実験中の音声全文検索・書き起こしサービス「ポッドキャッスル(PodCastle)」
このPodCastleでは、普及が進んでいる代表的な動画共有サービス(ニコニコ動画、YouTube、Ustream)に新たに対応しました。そして、複数のユーザーが協力し合って、話者名や改行を入力しながら読みやすい書き起こしを作成できる機能を実現しました(図2)。さらに、エジンバラ大学音声技術研究所の協力を得て、英語の動画音声データも音声認識と検索ができるように改良しました。誰でも無料で利用できる便利なサービスなので、多くの方々に使っていただければと願っています。
(以下略)
上記のPDF版
PodCastle(http://podcastle.jp)のサイトで、実際に動画の音声が日本語に変換されていますので、ご確認下さい。
(Google Chrome + IETabで再生確認)
ありがとうございます。
人力検索はほぼ引退した身なのですが、辞め際に大量のポイントを送りつけてきたユーザーがいるので使い道の無いポイントを大量に保持したままです。(アマゾン還元できる以上くらいには)
いずれ機会ができたら何か質問させていただくと思いますので、そのときに還元させていただくつもりでコメントいただいておきます。
>いずれ機会ができたら何か質問させていただくと思いますので、そのときに還元させていただくつもりでコメントいただいておきます。
気持ちだけいただいておきます。
私もそろそろ人力検索からフェードアウトを考えておりますので、次の機会には回答できないかもしれません。
ありがとうございます。
2013/09/25 00:21:04人力検索はほぼ引退した身なのですが、辞め際に大量のポイントを送りつけてきたユーザーがいるので使い道の無いポイントを大量に保持したままです。(アマゾン還元できる以上くらいには)
いずれ機会ができたら何か質問させていただくと思いますので、そのときに還元させていただくつもりでコメントいただいておきます。
>いずれ機会ができたら何か質問させていただくと思いますので、そのときに還元させていただくつもりでコメントいただいておきます。
2013/09/25 01:18:31気持ちだけいただいておきます。
私もそろそろ人力検索からフェードアウトを考えておりますので、次の機会には回答できないかもしれません。