【動画の音声をﾃｷｽﾄ化して検索できる技術】こんな感じの技術を捜しているのですが､最近の情報(2012年以降の最新技術)がなかなか見つかりません｡ http://itpro.nik…

音声全文検索･書き起こしｻｰﾋﾞｽPodCastle
(産業技術総合研究所･産総研 TODAY Vol.12(2012) No.05)

ﾃｷｽﾄで書き起こす必要性

ｲﾝﾀｰﾈｯﾄ上の動画共有ｻｰﾋﾞｽや音声配信ｻｰﾋﾞｽの普及に伴い､誰でも視聴できる音声を伴う動画ﾃﾞｰﾀや音声ﾃﾞｰﾀが日常的に生成･蓄積され増え続けています｡しかし､動画音声ﾃﾞｰﾀはﾃｷｽﾄ(文字)ﾃﾞｰﾀと異なり､それ自体を索引として使えないため､発言内容などの詳細な情報の検索(全文検索)ができませんでした｡

(略)

動画共有ｻｰﾋﾞｽに対応したPodCastleを公開

産総研では､音声認識誤りをﾕｰｻﾞｰが訂正できる独自のｲﾝﾀﾌｪｰｽを開発し､2008年に日本語のﾎﾟｯﾄﾞｷｬｽﾄ＊を対象とした音声全文検索ｻｰﾋﾞｽを一般公開しました｡16万件以上の音声ﾃﾞｰﾀが登録され､実際に58万単語以上が訂正されました｡それらを学習することで音声認識性能の向上が可能なことを実証しました｡さらに動画や英語への対応が求められてきました｡

今回私たちは､ﾕｰｻﾞｰに協力してもらうことで性能が日々向上する音声情報検索技術を開発し､ｲﾝﾀｰﾈｯﾄ上にある日本語と英語の動画音声ﾃﾞｰﾀを対象とした音声全文検索･書き起こしｻｰﾋﾞｽ｢ﾎﾟｯﾄﾞｷｬｯｽﾙ(PodCastle)｣(日本語版 http://podcastle.jp ､英語版 http://en.podcastle.jp)を2011年に一般公開し､実証実験を開始しました(図1)｡

図1 実証実験中の音声全文検索･書き起こしｻｰﾋﾞｽ｢ﾎﾟｯﾄﾞｷｬｯｽﾙ(PodCastle)｣

このPodCastleでは､普及が進んでいる代表的な動画共有ｻｰﾋﾞｽ(ﾆｺﾆｺ動画､YouTube､Ustream)に新たに対応しました｡そして､複数のﾕｰｻﾞｰが協力し合って､話者名や改行を入力しながら読みやすい書き起こしを作成できる機能を実現しました(図2)｡さらに､ｴｼﾞﾝﾊﾞﾗ大学音声技術研究所の協力を得て､英語の動画音声ﾃﾞｰﾀも音声認識と検索ができるように改良しました｡誰でも無料で利用できる便利なｻｰﾋﾞｽなので､多くの方々に使っていただければと願っています｡

(以下略)

上記のPDF版

PodCastle(http://podcastle.jp)のｻｲﾄで､実際に動画の音声が日本語に変換されていますので､ご確認下さい｡
(Google Chrome + IETabで再生確認)

(Google Chrome+IETabで再生)