« 学生の社会デビュー応援: メディア専門演習(ユーザー体験価値デザイン)などの成果を横浜ガジェッド祭りで発表 | トップページ | 大学院講義3Dコンテンツテクノロジーと聖地巡礼 »

音声信号処理で使われる線形予測とは?

|

みなさん、こんにちは、

 
音をコンピュータで取り扱う技術の1つに線形予測分析というものがあります。今日は、線形予測とはどんなものかを簡単にご紹介しましょう。

Photo

                    図1 X3はX1とX2を2対1の比で外分する点
 
図1のような図は数学で見たことがあると思います。外分とか外挿と呼ばれる関係ですね?X2はX1とX3の間を1:1で内分する点です。見方を変えると、X3はX1とX2を2:1で外分する点ということになります。さて、この関係を式で書いてみましょう。

Photo_2

                    図2 X3をX1とX2の式で表すならば

 

この式は、X1とX2からX3を「予測」する式と見ることができないでしょうか?この式は2乗とか平方根とか複雑な演算は含まれない、いわゆる一次式ですね。一次式で表されることを「線形」と呼びます。図1のように直線状に変化する信号は、この「線形」の式で予測できるわけです。

音の信号は複雑な形をしていますが、それもこの「線形」の式で予測してしまおうというのが、線形予測分析です。直線状の信号であれば、2つの値で予測できたわけですが、複雑な形の信号はそうはいきません。もっとたくさんの値を使って予測します。次の式のような感じです。

Photo_3

                    図3 p個の過去の信号値で次の信号を予測
 
マイナスがついているのはおまじないです。α(アルファ)は定数で、線形予測係数と呼ばれています。いつもαを使うのでアルファパラメータとも呼ばれます。このαをうまく選んであげれば、複雑な変化をする信号も予測できるのです。
αをうまく選ぶにはどうするかというと、予測を正確にすれば良いわけですから、次の予測誤差ε(イプシロン)つまり、本当の値と予測値の差がなるべく小さくなるようにきめてあげればよいのです。

Photo_4

                    図4 予測誤差の式

 

α0を1とすると上から2番目のように大変規則的な式に書けることがわかります。マイナスをつけておいたおまじないのおかげで、演算はすべて+で書けるのです。

線形予測分析により、スペクトルを求めたり、音声合成を行ったりができます。つまり、線形予測係数は音の情報を持っているのです。それがどうしてかということを簡単に説明しましょう。次の図を見てください。

Photo_5

                    図5 変化信号の予測

 

上の波にくらべて下の波は変化が速いですね?音で言えば振動数(周波数)が違うということにあたります。これを予測できるということは、線形予測係数が音の周波数成分の情報を持っているということになるわけです。ですから、線形予測係数を求めることにより、音声を符号化して再合成したり、音の音色の分析をしたりできるようになるわけです。

 

相川 清明

 

 

« 学生の社会デビュー応援: メディア専門演習(ユーザー体験価値デザイン)などの成果を横浜ガジェッド祭りで発表 | トップページ | 大学院講義3Dコンテンツテクノロジーと聖地巡礼 »