携帯電話で話しながら相手の会話中に得られる発声音声を141ものパラメータで高度かつ高速にバッファ解析するとあるのですが、一体、どういう事なのでしょうか?
バッファ解析とは何ですか?
また、このサービスと似たような他社のサービスが行われているのであれば教えて下さい。
バッファ解析という場合には、一般的なコンピュータ用語のバッファとは異なると思います。
画像解析によく用いられる技術ですが、
ある一定の範囲内(バッファ領域)にあるデータを選び出す解析方法です。
私自身、音声認識には無知なので誤りがあるかもしれませんが、
会話している音声データからいくつかあるパラメータ
に近い周波数帯の音声を抽出して、
どのような音が多いだとか組み合わせのパターンによって、
それぞれの感情の度合いを分析しているのだと思います。
例えば、喜んでいるときに多い音がどの程度含まれているかなどを抽出している。
他社のサービスはわからないのですが、
バッファ解析自体は音声認識を利用したサービスには技術的に使われていると思います。
例えば、犬の感情を分析するタカラのバウリンガルなども
同じような技術が使われているはずです。
http://ja.wikipedia.org/wiki/%E9%9F%B3%E5%A3%B0%E8%AA%8D%E8%...
http://www.sgi.co.jp/solutions/bbu/ST/sdk.html
キモチ分析の類似として、↑は日本SGIさんの感情分析ソフトです。
私の理解を極めて簡単に説明すると、適当な時間単位で発声を区切り、その区間に最も多く現れる周波数の系列を追跡し、その高低のパターンにより感情を分類するということです。例えば、高めの周波数→興奮or怒り、低めの周波数→不安、のように。周波数の高低パターンは、事前学習としてシステムのトレーニングにより実現すると聞きました。周波数だけを追いかけるので、にこやかに相手を叱責している皮肉のようなものは検出できないとも聞きました。
↓は同社の学会発表の1つです(これ以前にもどこかで発表していたように思います。)
http://wwwsoc.nii.ac.jp/asj/H/backnum/backnumber2005.html
柴崎晃一(日本SGI株式会社),光吉俊二(株式会社エイ・ジー・アイ)"抑揚 からの感情認識の評価-感性制御技術(ST)の評価と、人間の感情の評価につい て-" 日本音響学会聴覚研究会資料 H-2005-89, Vol.35 (8)
なるほど。参考にさせてもらいます。ありがとうございます。