« マレーシアからの日本留学 [その1] | トップページ | 学会発表 »

先端メディア学「感性表現による音声コミュニケーション」続き紹介

2017年11月30日 (木) 投稿者: メディア技術コース

みなさん、こんにちは、

先端メディア学「感性表現による音声コミュニケーション」スタート
を掲載しましたが、その後の様子をお話ししましょう。
音声認識や音声検索には音響特徴の分析が必要です。今週で10回目の授業になりますが、今までに、いろいろな音響特徴の分析法を勉強してきました。
 
スペクトル
サウンドスペクトログラム
雑音性特徴時系列
スペクトル重心時系列
ケプストラム時系列
スペクトル変化特徴時系列
各種スペクトル類似度
ベクトル空間法による検索
Graphical User Interfaceの作成
簡単な音声対話システム
 
などです。「時系列」という言葉がだくさん出てきますね。音響特徴の時間変化を表します。音声や音楽は音の三要素つまり音の大きさ、高さ、音色が時間的に変化するものですから、どうしてもその時間変化をとらえる必要があります。ケプストラムというのは対数スペクトルの逆フーリエ変換で、音声認識によく用いられます。声の高さを求めることもできます。ベクトル空間法というのは検索によく用いられる方法で、検索要求と検索対象のベクトルの類似度で検索を行います。

以上の音響特徴を求める方法は、それぞれ、MATLABのプログラムとして作成していますから、ずいぶん蓄積ができました。10回でこれだけマスターするのは、結構なハードワークですが、学生はバイタリティで克服してきました。
これらの技術がマスターできれば、いろいろな音声検索システムや音声分析システムが作成できます。
 
今後は、これらの基礎的方法を活用して、オリジナルの研究を進めることになっています。どのような研究が生まれるか楽しみにしています。
 
相川 清明

授業紹介」カテゴリの記事

研究紹介」カテゴリの記事

高校生向け」カテゴリの記事

« マレーシアからの日本留学 [その1] | トップページ | 学会発表 »