« 学生海外体験シリーズ:タイ、シラパコーン大学編 #2 | トップページ | 今年度は対面授業(+ハイブリッド少々) »

NICOGRAPH発表紹介: どんなハモりが綺麗に聞こえる?

2022年12月25日 (日) 投稿者: メディア技術コース

メディア学部の大淵です。

先日に続き、NICOGRAPHでの発表を紹介します。3年生の首藤拓海さんの「人の主観評価基準に基づく声のハーモニーのAI自動分類」です。このブログでも何度か紹介していますが、「先端メディアゼミナール」という科目を履修することで、3年生のうちから卒業研究に準じる活動をして、その成果を発表したものです。

この研究では、二人で合唱したときの「ハモり」に着目して、どんな声の組み合わせが人間にとって綺麗に聞こえるのかを調べました。単独で録音した声をコンピューター上でハモらせて、それを別の人に聞いてもらって良し悪しを判定してもらいました。そのようなデータが集まれば、あとはAIによる自動分類ができるはずだというのは、当研究室の定番のアプローチです。

ただ、今回はなかなか大量のデータが集められないので苦労しました。録音データを細切れにするなどしてデータ量を増やしたのですが、それでも限界があります。そこで思いついたのが、ボーカロイドによる合成音声を、人間の声にハモらせてみたらどうだろうということです。ボーカロイドの声にもいろんな声質のものがあって、なかなか面白いデータを取ることができました。

正直なところ、最初は「どうせ上手い人の声は誰と組み合わせても高評価で、下手な人の声は誰と組み合わせても低評価なんじゃないかな」と思っていたのですが、実際にやってみると、意外と「組み合わせの妙」のようなものがあって、面白い結果が得られました。ハモりに関する研究は、まだまだできることがいろいろありそうです。

研究紹介」カテゴリの記事

« 学生海外体験シリーズ:タイ、シラパコーン大学編 #2 | トップページ | 今年度は対面授業(+ハイブリッド少々) »