NICOGRAPH研究発表紹介:話し声を使って歌声を合成
2016年11月12日 (土) 投稿者: メディア技術コース
メディア学部の大淵です。
11月4日から6日まで富山大学で行われた「NICOGRAPH2016」で、音に関係する研究発表をいくつか行いました。今日はその中から、歌声合成の研究を紹介しようと思います。
メディア学部ブログを読んで下さるような皆さんなら、歌声合成ソフト「初音ミク」のことは聞いたことがありますよね。「初音ミク」では、楽譜を入力するだけで、あらかじめ用意されているキャラクターの歌声を作ることができます。「初音ミク」の元となっている「VOCALOID」というソフトは、素片連結型と呼ばれる方式を取っており、あらかじめ用意してある「素片」のデータを使って歌声を合成します。そして、誰か新しい人の声で歌って欲しい場合には、この素片のデータを新しく作り直す必要があるのですが、これがなかなかハードルが高いのです。
それに対し、HMM歌声合成と呼ばれる方式を使った、「Sinsy」というソフトもあります。HMM歌声合成では、隠れマルコフモデルという方式で計算によって歌声を作るのですが、新しい人の声を準備する際にもこの方式を活用できるので、比較的簡単に新しい人に対応することができます。そのためのツールも公開されているので、誰でも試してみることができます。
ただし、綺麗な歌声を作るためには、もととなるキャラクター(声優さん)に、いろんな音程で歌ってもらった声を録音する必要があります。いろんな高さの声のデータがあってこそ、それを変換して歌声が作れるというわけですね。ところが、わが研究室の大学院生である大石さんは「歌声は無いけど話し声ならある」という状況で、そのキャラクターの歌声を作ってしまおうという無謀な試みにチャレンジしているのです。
現時点では、まだすごく音痴な歌しかできていませんが、調べている中で面白いこともわかってきました。もとのキャラクターのファンの人にアンケートを取ってみると、そんな音痴な歌であっても「そのキャラクターらしさ」を結構感じているのです。今は、こういった研究のアプローチを通じて、「本人らしさ」とは何かについて更に調べていきたいと思っているところです。
最後に声優さんの名誉のために付け加えておくと、音痴なのはあくまでも我々が作ったソフトであって、声優さん本人ではありません。だってそのキャラクターの歌声は、誰も聞いたことが無いわけですから…
「研究紹介」カテゴリの記事
- 映像表現・芸術科学フォーラムにて卒研生が優秀発表賞を受賞(2019.03.17)
- 自由な言葉でライブパフォーマンスをアレンジする(2019.03.16)
- 先端メディア学II(2年生)の学生が人工知能学会の研究会で発表(2019.03.15)
- 映像表現・芸術科学フォーラムでの発表(2019.03.10)
- ゲームの学会?!(2019.03.07)