人力検索はてな
モバイル版を表示しています。PC版はこちら
i-mobile

ピッチを変えずにテンポを変更する方法を教えてください。

WAVEファイルの音の高さは変えずに倍速再生をしたいと考えています。
知りたいのは、音の高さを変えずに倍速再生ができるソフトではなく、そのアルゴリズムです。

実際にどのような処理をすれば音の高さを変えずに再生速度を変えられるのか、その理論がわかるサイトや書籍を教えてください。

●質問者: tetsunon
●カテゴリ:コンピュータ 科学・統計資料
✍キーワード:wave アルゴリズム サイト ソフト テンポ
○ 状態 :終了
└ 回答数 : 5/5件

▽最新の回答へ

1 ● Rousseau
●1ポイント

http://www.vector.co.jp/soft/win95/art/se174814.html

SoundPlayer Lilithの詳細情報 : Vector ソフトを探す!

そんなあなたにはこのソフトをお勧めします。

といきたかったのですが

なになに、そのアルゴニズムを教えてくださいと・・・

http://nagasm.suac.net/ASL/cmm/

Computer Music Tutorial

たとえば現在の

パソコンが、あと数年で「Pentium相当でクロック1GHz、メモリ128MB」(物理的

にはありえませんが、性能を比較するための表現です)

昔はこんな風に考えられて痛んだなぁと思った。

ざっと見たがこの文章にはそれらしきものは無かった。

http://www.hatena.ne.jp/awindow?qid=1100873119

awindowさんのプロフィール - はてな

どこかに必ずあるはずだけど見つけ切れません。

私の知る限り

音の高さを変えずに倍速再生ができるソフトは2種類知っています。

どちらも違うアルゴリズムを使っていたような・・・

◎質問者からの返答

そうなのです。

倍速再生できるソフトは見つかるのですが、どうやって倍速にしているかがわからないのです。


2 ● shampoohat
●50ポイント

http://www.google.co.jp/search?hl=ja&q=psola&lr=

ぱっと思いつくのはこれ。

乱暴に説明すると、

波形を「「波型×山形」みたいな関数の周期」に分解して、「波型×山形」じたいの形は変えずに、その配置間隔を調整します。

http://www.tokyodoshoten.co.jp/kinsyo/multi.htm

岩波講座 マルチメディア情報学 店頭在庫有

「文字と音の情報処理」が総論として分かりやすいです。PSOLAもここに記述してあったと思います。

倍速

http://www.pcl.cs.waseda.ac.jp/~mochi/research/

これ自体は情報ではないですが、なんとなく雰囲気が分かるのではないかと思います。

〜 基本周期の約2倍の窓長を持つハニング窓によって抽出したピッチ波形(単位波形)を再配列する 〜

◎質問者からの返答

ありがとうございます。

PSOLAは知りませんでした。参考になります。

本も買ってみます。


3 ● COODOO
●0ポイント

http://www.japan.steinberg.net/products/wavelab5/index.html

Home :: Steinberg Media Technologies GmbH

今の波形編集ソフトは大体できますよ。僕はSteinbergのWavelabを使ってます。

◎質問者からの返答

ありがとうございます。

ところで、このWavelabはどのようなアルゴリズムでピッチを変えずにテンポを変更しているのでしょうか?


4 ● taro-r
●20ポイント

http://ottotto.com/sound/08/dlyfam.htm

DELAY_FAMILY

基本的にはピッチチェンジャー(シフター)と原理は同じです。ピッチチェンジャーはスピードを変えずに音程を変えますから,そういう処理をしたものを音程が変わらないように再生すればテンポが変わります。

音を細かく切って,足りないところに補間したり,余ったところを捨てたりするわけです。

ですから,当然音質は変わります。切る単位をどれくらいにするか,単に切るのでなく,なめらかになるように前後の情報をつかったりとか,その辺のノウハウでかなり音質がかわります。

あと,単音の楽器であれば,音声符号化の原理も利用できるかとはおもいますが…。音声符号化では声をピッチと周波数特性と別々に情報化して圧縮しますので…。

◎質問者からの返答

ありがとうございます。

だんだんつかめてきました。

窓で細かく切って、情報を捨てて並べてあげれば倍速になるわけですね。。

倍速再生できるソフトで変換すると高周波数のノイズが入るのも、その切った窓間のつなぎ目がなめらかにつながっていないから、でしょうか。。

母音だけの単音ならば同じパターンが繰り返されるので情報を捨てやすいのですが、通常の会話音声ではそれがむつかしいのですね。。。


5 ● aska186
●50ポイント

http://ha8.seikyou.ne.jp/home/coppe/hp2/c/ongaku/mimikopi.html

数学的にはフーリエ変換という操作を行います。上記ページにあるように高速フーリエ変換(FFT)というアルゴリズムが開発され、パソコンでも実現できるようになりました。

語弊を恐れずにいえば、フーリエ変換後の世界では時間(テンポ)と周波数(ピッチ)を独立に操作できるのです。フーリエ変換後のデータでピッチだけをいじって逆変換すれば、ピッチは同じでテンポを変えることができます。

http://www.google.co.jp/search?hl=ja&q=%E9%AB%98%E9%80%9F%E3%83%...

Googleで検索すると山ほど出てきますが、

http://laputa.cs.shinshu-u.ac.jp/~yizawa/InfSys1/basic/index.htm

ディジタル信号処理

ここのページが比較的コンパクトにまとまっていると思います。

◎質問者からの返答

ありがとうございます。

だいぶわかってきました。

時間領域でできるとばかり思っていたのですが、周波数領域での操作が必要なのですね。

関連質問


●質問をもっと探す●



0.人力検索はてなトップ
8.このページを友達に紹介
9.このページの先頭へ
対応機種一覧
お問い合わせ
ヘルプ/お知らせ
ログイン
無料ユーザー登録
はてなトップ