大学の演習で「歌うボコーダ」を作る
2015年6月 4日 (木) 投稿者: メディア技術コース
みなさん、こんにちは、
メディア学部には「メディア専門演習」という演習があります。メディアの分野を広くカバーする20種もの演習の中から、好みの演習を2つ選んで学修します。「音・音声インタフェース」はそのうちの1つ。楽器音シンセサイザを作ったり、効果音を作ったりします。
第8回目はボコーダの作成でした。ボコーダとはボイス(声)とコーダー(符号化)を組み合わせた言葉です。声を符号にして送り、受け側で人の声に合成するもので、携帯電話などのディジタル通信機器の通信方式です。声は符号化されていますから、声を合成するときには、任意の声の高さで再生することができます。
「音・音声インタフェース」では、ボコーダを線形予測分析という音声の中身を調べる方法を使って作成します。そのしくみを図解したものが、図1です。
音声から予測誤差である声帯のパルス列が求まる過程を説明しましたが、その逆過程は、声帯から瞬間的に流れ出す気流が口の中や鼻の中を通ることにより人の声になる仕組みそのものになっているのです。つまり、線形予測フィルタの逆特性のフィルタ「逆フィルタ」は、口や鼻の音響特性に相当するのです。
それで、図2のように人工的なパルスをこの「逆フィルタ」に与えると、口や鼻の一種の「響き」のようなものが出てきます。この声帯パルスによる口や鼻の「響き」を一定周期で並べれば、繰り返される声帯の開閉によって音声が生じるのと全く同じ仕組みとなり、その周期に応じた周波数の音声になるわけです。例えば、百分の一秒間隔で繰り返し振動を作れば、1秒間に100回振動する音声になります。
図2 パルスで発生する振動を並べると音声になる
学生のみなさんは演習でどんなことをするのかを紹介しましょう。
1.自分の声を複数個録音する。「め」でも「にゃー」でも何でもいいです。
2.線形予測分析で「逆フィルタ」を作ります。
3.歌わせたいメロディの音の周波数に応じたパルス列を用意します。
4.パルス列を「逆フィルタ」に入れれば1音符相当の声ができます。
5.音符をつなげれば歌になります。
演習で学生のみなさんに作ってもらったプログラムで発生させた歌声の例を紹介しましょう。ここでは「ま」という音声を使っています。「め」とか「ま」は日本語では101種類あります。すべて収録しておけば、歌詞をつけて歌わせることもできます!
「授業紹介」カテゴリの記事
- トップレベルの論文を読み込む「CG技術特論」(大学院授業紹介)(2019.03.13)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- 専門演習「空間インタラクティブコンテンツ」2018後期(3)(2019.02.22)
- タンジブルインタラクションデザイン最終発表(2019.02.13)
- 専門演習「空間インタラクティブコンテンツ」2018後期(2)(2019.02.12)
「高校生向け」カテゴリの記事
- チュラロンコン大学からのインターン学生との再会(2019.03.14)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- ゲームの学会?!(2019.03.07)
- 香港理工大学デザイン学部の紹介(2019.03.04)
- 香港理工大学デザイン学部を訪問し、学部長Lee先生にお会いしました!(2019.03.03)