« 「しゃべりの間合い」間合い研究会のご案内 | トップページ | 学会発表(映像表現・芸術科学フォーラム 2021) »

映像表現・芸術科学フォーラムでの発表 [歌声処理編]

2021年3月11日 (木) 投稿者: メディア技術コース

メディア学部の大淵です。

こちらの記事でも紹介されている「映像表現・芸術科学フォーラム」で、私の研究室から7件の発表を行いました。件数が多いので、何回かに分けて紹介させていただこうと思います。第1回は「歌声処理編」です。

大学院生の津留紀陽さんは「声質に適した音楽ジャンルの自動推薦システムの研究」という発表を行いました。ユーザーの声を聞いて最も適した歌のジャンルを教えてくれるアプリを作るという研究なのですが、ポイントは、歌声ではなく話し声を入力するということです。歌声を入力して分析するなら話は簡単でしょうが、アプリに向かって歌うというのは結構な抵抗があるものです。そこで、普通の話し声を入力するだけで分析ができる方法を考えました。肝となるのは、大勢の人の話し声と歌声のデータを収録したパラレルコーパスと呼ばれるものの存在です。このコーパスを分析することにより、話し声と歌声の関連性を推測することができるというわけですね。

学部生の齋藤奏さんは「歌唱データと歌詞のアラインメントのための非歌詞音声自動検出手法」という発表を行いました。カラオケで曲の展開に合わせて字幕の色が変わっていく機能がありますが、あれを自動でできるようにしようという研究です。この研究を進めていくうちに、歌詞カードに書かれていない歌声(コーラスなど)の存在が、推定精度を大きく劣化させてしまうという問題に気付き、そこから研究の深掘りが始まりました。非歌詞音声の自動検出というサブテーマに絞って研究を進めることで、中身の濃い研究ができたのではないかと思います。そしてこの発表は、学会から優秀発表賞として表彰していただきました。

どちらの研究も、人間の生活に不可欠ではないものの、あると生活がより豊かになる、そんなところを目指しています。そんな研究をしてみたいという高校生の方は、ぜひメディア学部を目指して下さい。

 

研究紹介」カテゴリの記事

« 「しゃべりの間合い」間合い研究会のご案内 | トップページ | 学会発表(映像表現・芸術科学フォーラム 2021) »