音声ﾃﾞｰﾀから発話者の年齢と性別の判定を実装できるｿｰｽｺｰﾄﾞなどを色々教えてください｡

音声ﾃﾞｰﾀから発話者の年齢と性別の判定

自分の声を認識するには｢ﾌｫﾙﾏﾝﾄ｣の影響が大きい - 首都大 | ﾏｲﾅﾋﾞﾆｭｰｽ

男女で発声のﾌｫﾙﾏﾝﾄ分布が異なるので､それを認識することで判定可能です｡ただし､変声期前の子供は性差が小さくて判別が難しい､複数人の同時発音や環境からの雑音に弱いなど､限界もあるので過度に期待しないでください｡ｽｷｬﾅで画像を文字認識するときに､誤字脱字がﾎﾟﾛﾎﾟﾛ出るのと同じようなことです｡

そもそも､ﾌｫﾙﾏﾝﾄっていうのが何かという話ですが､ここでは簡単に音声波形の特徴くらいに考えてください｡ﾌｰﾘｴ解析などの手法で抽出しますので､数学的な知識が必要です｡このﾌｰﾘｴ解析は､三角関数や微積分の延長線上なので､そう簡単でもありませんが､極端に難解でもありません｡

実装できるｿｰｽｺｰﾄﾞなど

具体的な実装方法は､音声認識の書籍を参考にしてください｡Amazonなどで｢音声認識｣と検索すれば､すぐ見つけられると思います｡

ここでは参考に､ﾗｲﾌﾞﾗﾘやAPIを貼っておきます｡今回､直接に求めている方向性とは少し違うかもしれませんが､なんせﾏｲｸﾛｿﾌﾄやｸﾞｰｸﾞﾙが出しているものなので､どこかで使い出はあると思います｡