先端メディア学「感性表現による音声コミュニケーション」続き紹介
2017年11月30日 (木) 投稿者: メディア技術コース
みなさん、こんにちは、
先端メディア学「感性表現による音声コミュニケーション」スタート
を掲載しましたが、その後の様子をお話ししましょう。
音声認識や音声検索には音響特徴の分析が必要です。今週で10回目の授業になりますが、今までに、いろいろな音響特徴の分析法を勉強してきました。
スペクトル
サウンドスペクトログラム
雑音性特徴時系列
スペクトル重心時系列
ケプストラム時系列
スペクトル変化特徴時系列
各種スペクトル類似度
ベクトル空間法による検索
Graphical User Interfaceの作成
簡単な音声対話システム
などです。「時系列」という言葉がだくさん出てきますね。音響特徴の時間変化を表します。音声や音楽は音の三要素つまり音の大きさ、高さ、音色が時間的に変化するものですから、どうしてもその時間変化をとらえる必要があります。ケプストラムというのは対数スペクトルの逆フーリエ変換で、音声認識によく用いられます。声の高さを求めることもできます。ベクトル空間法というのは検索によく用いられる方法で、検索要求と検索対象のベクトルの類似度で検索を行います。
以上の音響特徴を求める方法は、それぞれ、MATLABのプログラムとして作成していますから、ずいぶん蓄積ができました。10回でこれだけマスターするのは、結構なハードワークですが、学生はバイタリティで克服してきました。
これらの技術がマスターできれば、いろいろな音声検索システムや音声分析システムが作成できます。
今後は、これらの基礎的方法を活用して、オリジナルの研究を進めることになっています。どのような研究が生まれるか楽しみにしています。
相川 清明
「授業紹介」カテゴリの記事
- トップレベルの論文を読み込む「CG技術特論」(大学院授業紹介)(2019.03.13)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- 専門演習「空間インタラクティブコンテンツ」2018後期(3)(2019.02.22)
- タンジブルインタラクションデザイン最終発表(2019.02.13)
- 専門演習「空間インタラクティブコンテンツ」2018後期(2)(2019.02.12)
「研究紹介」カテゴリの記事
- 映像表現・芸術科学フォーラムにて卒研生が優秀発表賞を受賞(2019.03.17)
- 自由な言葉でライブパフォーマンスをアレンジする(2019.03.16)
- 先端メディア学II(2年生)の学生が人工知能学会の研究会で発表(2019.03.15)
- 映像表現・芸術科学フォーラムでの発表(2019.03.10)
- ゲームの学会?!(2019.03.07)
「高校生向け」カテゴリの記事
- チュラロンコン大学からのインターン学生との再会(2019.03.14)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- ゲームの学会?!(2019.03.07)
- 香港理工大学デザイン学部の紹介(2019.03.04)
- 香港理工大学デザイン学部を訪問し、学部長Lee先生にお会いしました!(2019.03.03)