演習でカラオケ練習機を作る
2015年6月29日 (月) 投稿者: メディア技術コース
みなさん、こんにちは、
この演習では、簡単に計算ができるケプストラム法を使って声の高さを求めます。
ケプストラムというのは周波数軸上の振動成分を分析する手法です。図1はケプストラムを理解するための模式図です。
図1 バイオリンの周波数成分分布のケプストラム分析
図1はバイオリンの音の周波数成分を表しています。基本周波数というのが、音の高さの感覚を決める周波数で、楽器音はこのように基本周波数の整数倍のところに「倍音」と呼ばれる振動成分を含みます。この周波数軸上の規則的な周波数分布を周期成分に分解するのがケプストラム分析です。1次は周波数軸に波1回分の半分が乗っていることに対応します。2次でちょうど1回分の波の振動ですね。この図では12次の周期成分が上のバイオリンの音の倍音の並びに一致していることがわかります。12次だと、波の繰り返しが6個ありますね。
有名な「サンプリング定理」によって、ディジタル信号の最高周波数は1秒間にいくつの音のサンプルがあるかというサンプリング周波数の半分であることがわかっています。図1では最高周波数が4800Hzです。これが、サンプリング周波数の半分ということなので、サンプリング周波数は4800Hzの2倍の9600Hzということになります。図1では基本周波数の周波数目盛の読みは800Hです。さて、今わかっている数値はサンプリング周波数9600Hzとケプストラムの値12です。これらの数をつかって、基本周波数の800Hzを求めるにはどうすればいいでしょうか?なんと、サンプリング周波数の9600Hzを12で割れば800Hzが求まることがわかります。なお、図1はわかりやすく説明するための模式図で、実際はもっと高いサンプリング周波数を使っています。
この原理をつかって、人の声の基本周波数を求めれば、カラオケ練習機の出来上がりです!
「授業紹介」カテゴリの記事
- トップレベルの論文を読み込む「CG技術特論」(大学院授業紹介)(2019.03.13)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- 専門演習「空間インタラクティブコンテンツ」2018後期(3)(2019.02.22)
- タンジブルインタラクションデザイン最終発表(2019.02.13)
- 専門演習「空間インタラクティブコンテンツ」2018後期(2)(2019.02.12)
「高校生向け」カテゴリの記事
- チュラロンコン大学からのインターン学生との再会(2019.03.14)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- ゲームの学会?!(2019.03.07)
- 香港理工大学デザイン学部の紹介(2019.03.04)
- 香港理工大学デザイン学部を訪問し、学部長Lee先生にお会いしました!(2019.03.03)