学術論文ではありませんが、ナラコード の開発者である奈良總一郎氏の研究はご参考になるのではないでしょうか。
日本語の熟語の発音の85%は「きょう」「とう」「さん」等の僅か51種類の音節で占められる。(中略)最多頻度の音節は「さん」(6.54%)以下「とう」(5.61%)「ぎょう」(4.67%)「こう」(3.27%)「さい」(2.80%)と続き、51種類で85%、88種類で95%を占める。
株式会社ナラコム:ナラコード(あいうえおキーボード):理論的根拠:意外な事実9
これによれば、「日本語の主要音節数は51個である」と言えそうです。
ただし、
意外なことに、全音節のうち20.5%は「拗音」であった。
とありますので、単純に拗音を除外できるわけではないようです。
お役に立てることを祈りつつ。