ピッチを変えずにテンポを変更する方法を教えてください。


WAVEファイルの音の高さは変えずに倍速再生をしたいと考えています。
知りたいのは、音の高さを変えずに倍速再生ができるソフトではなく、そのアルゴリズムです。

実際にどのような処理をすれば音の高さを変えずに再生速度を変えられるのか、その理論がわかるサイトや書籍を教えてください。

回答の条件
  • URL必須
  • 1人2回まで
  • 登録:2004/11/19 23:05:19
  • 終了:--

回答(5件)

id:Rousseau No.1

Rousseau回答回数666ベストアンサー獲得回数02004/11/19 23:24:18

ポイント1pt

http://www.vector.co.jp/soft/win95/art/se174814.html

SoundPlayer Lilithの詳細情報 : Vector ソフトを探す!

そんなあなたにはこのソフトをお勧めします。

といきたかったのですが

なになに、そのアルゴニズムを教えてくださいと・・・

http://nagasm.suac.net/ASL/cmm/

Computer Music Tutorial

たとえば現在の

パソコンが、あと数年で「Pentium相当でクロック1GHz、メモリ128MB」(物理的

にはありえませんが、性能を比較するための表現です)

昔はこんな風に考えられて痛んだなぁと思った。

ざっと見たがこの文章にはそれらしきものは無かった。

http://www.hatena.ne.jp/awindow?qid=1100873119

awindowさんのプロフィール - はてな

どこかに必ずあるはずだけど見つけ切れません。

私の知る限り

音の高さを変えずに倍速再生ができるソフトは2種類知っています。

どちらも違うアルゴリズムを使っていたような・・・

id:tetsunon

そうなのです。

倍速再生できるソフトは見つかるのですが、どうやって倍速にしているかがわからないのです。

2004/11/20 09:13:51
id:shampoohat No.2

shampoohat回答回数347ベストアンサー獲得回数02004/11/20 01:00:41

ポイント50pt

ぱっと思いつくのはこれ。

乱暴に説明すると、

波形を「「波型×山形」みたいな関数の周期」に分解して、「波型×山形」じたいの形は変えずに、その配置間隔を調整します。

http://www.tokyodoshoten.co.jp/kinsyo/multi.htm

岩波講座 マルチメディア情報学 店頭在庫有

「文字と音の情報処理」が総論として分かりやすいです。PSOLAもここに記述してあったと思います。

倍速

これ自体は情報ではないですが、なんとなく雰囲気が分かるのではないかと思います。

〜 基本周期の約2倍の窓長を持つハニング窓によって抽出したピッチ波形(単位波形)を再配列する 〜

id:tetsunon

ありがとうございます。

PSOLAは知りませんでした。参考になります。

本も買ってみます。

2004/11/20 09:19:48
id:COODOO No.3

COODOO回答回数10ベストアンサー獲得回数02004/11/20 02:05:33

http://www.japan.steinberg.net/products/wavelab5/index.html

Home :: Steinberg Media Technologies GmbH

今の波形編集ソフトは大体できますよ。僕はSteinbergのWavelabを使ってます。

id:tetsunon

ありがとうございます。

ところで、このWavelabはどのようなアルゴリズムでピッチを変えずにテンポを変更しているのでしょうか?

2004/11/20 09:21:14
id:taro-r No.4

taro-r回答回数29ベストアンサー獲得回数02004/11/20 09:17:45

ポイント20pt

基本的にはピッチチェンジャー(シフター)と原理は同じです。ピッチチェンジャーはスピードを変えずに音程を変えますから,そういう処理をしたものを音程が変わらないように再生すればテンポが変わります。

音を細かく切って,足りないところに補間したり,余ったところを捨てたりするわけです。

ですから,当然音質は変わります。切る単位をどれくらいにするか,単に切るのでなく,なめらかになるように前後の情報をつかったりとか,その辺のノウハウでかなり音質がかわります。

あと,単音の楽器であれば,音声符号化の原理も利用できるかとはおもいますが…。音声符号化では声をピッチと周波数特性と別々に情報化して圧縮しますので…。

id:tetsunon

ありがとうございます。

だんだんつかめてきました。

窓で細かく切って、情報を捨てて並べてあげれば倍速になるわけですね。。

倍速再生できるソフトで変換すると高周波数のノイズが入るのも、その切った窓間のつなぎ目がなめらかにつながっていないから、でしょうか。。

母音だけの単音ならば同じパターンが繰り返されるので情報を捨てやすいのですが、通常の会話音声ではそれがむつかしいのですね。。。

2004/11/20 09:25:30
id:aska186 No.5

aska186回答回数158ベストアンサー獲得回数02004/11/20 09:59:21

ポイント50pt

数学的にはフーリエ変換という操作を行います。上記ページにあるように高速フーリエ変換(FFT)というアルゴリズムが開発され、パソコンでも実現できるようになりました。

語弊を恐れずにいえば、フーリエ変換後の世界では時間(テンポ)と周波数(ピッチ)を独立に操作できるのです。フーリエ変換後のデータでピッチだけをいじって逆変換すれば、ピッチは同じでテンポを変えることができます。

Googleで検索すると山ほど出てきますが、

ここのページが比較的コンパクトにまとまっていると思います。

id:tetsunon

ありがとうございます。

だいぶわかってきました。

時間領域でできるとばかり思っていたのですが、周波数領域での操作が必要なのですね。

2004/11/20 10:43:26

コメントはまだありません

この質問への反応(ブックマークコメント)

トラックバック

「あの人に答えてほしい」「この質問はあの人が答えられそう」というときに、回答リクエストを送ってみてましょう。

これ以上回答リクエストを送信することはできません。制限について

絞り込み :
はてなココの「ともだち」を表示します。
回答リクエストを送信したユーザーはいません