« 映像表現・芸術科学フォーラムでの発表~演奏を人間らしくする | トップページ | 映像表現・芸術科学フォーラムでの発表~曲に合わせて映像を自動生成 »

映像表現・芸術科学フォーラムでの発表~声帯が振動していない音声

2022年3月22日 (火) 投稿者: メディア技術コース

メディア学部の大淵です。

映像表現・芸術科学フォーラム2022での発表を紹介する記事の2件目は、坂本涼介さんの「雑音駆動音声を用いた緊迫感の音響的分析」です。

人間の声は、声帯を振動させることで生じた音源が、のど・口・鼻など(まとめて声道といいます)で共振し、強まったり弱まったりしたものとして口から発せられます。のどに手をあてて「あー」と言うと、のどが振動しているのがわかると思います。一方、'k', 's', 'p'などの、いわゆる無声音と呼ばれる音では、声帯は振動していません。

声帯を振動させる音(有声音)は、基音と様々な倍音を含み、その間隔から「音の高さ」を定義することができます。一方、無声音に高さはありません。また、有声音は音の強弱を付けるのが簡単ですが、無声音では極端な強弱の表現は難しいです。そして音の高低や強弱があると、韻律情報(いわゆるイントネーション)が生成され、そこに感情を込めることができます。では、韻律情報以外の部分には、感情に類するものを伝える力は無いのでしょうか?

今回の研究では、音が伝える感情的な要素の中でも、特に「緊迫感」に着目し、韻律情報以外の要素がどのように緊迫感を伝えるかを調べました。韻律情報とそれ以外を同時に聴き分けることは難しいので、雑音駆動音声というテクニックを使っています。これは、普通に録音した音声をフーリエ変換し、わざと少し粗い分解能で周波数ごとの強度に変換した後、各周波数帯に対応する雑音に差し替えて再合成するという手法です。さまざまな音源とさまざまな雑音の組み合わせで声を作り、いろんな人に聴いてもらいました。その結果、元となる声の性質によって最適な雑音が変わることや、内容の伝わりやすさと緊迫感の強さは必ずしも一致しないことなど、いくつかの重要な知見を得ることができました。

災害時のアナウンスなど、声で緊迫感を伝えるというのはとても重要な研究テーマです。今回の成果を活かして、さらに研究を進めていきたいと思っています。

研究紹介」カテゴリの記事

« 映像表現・芸術科学フォーラムでの発表~演奏を人間らしくする | トップページ | 映像表現・芸術科学フォーラムでの発表~曲に合わせて映像を自動生成 »