音声ドキュメント検索とは?
2010年12月 2日 (木) 投稿者: media_staff
メディア学部の相川です。最近注目されている「音声ドキュメント検索」を紹介します。最近パソコンの中にも、ネット上にも動画データや音声データ、音楽データがたくさん存在しています。Webページのテキストは検索エンジンで検索できますよね。画像や音は、それらにタイトルや解説文が付随していれば検索できますが、たとえば音声データの場合、その中で何をしゃべっているかということでは検索できません。そこでどうするかというと、最近性能が向上してきた音声認識の技術を使って音声を文章に変換します。文章になれば今までの文書検索技術で検索できるわけです。国立情報学研究所ではNTCIR(エンティサイル)と呼ばれる情報検索評価プロジェクトを実施しています。
http://research.nii.ac.jp/ntcir/ntcir-9/index-ja.html
情報処理学会音声言語情報処理研究会の音声ドキュメント処理ワーキンググループでは、音声ドキュメント検索性能評価をSpokenDocという名前でNTCIRに提案しています。私もこのワーキンググループメンバーの一人です。9月に開催された国際会議INTERSPEECH2010ではこのワーキンググループが中心となってスペシャルセッションを企画しました。
http://www.interspeech2010.org/SpecialSession.html
東京工科大学メディア学部ではこの音声ドキュメント検索に関連して、感性による効果音検索や楽器音特徴による音楽検索の研究を行っています。
「研究紹介」カテゴリの記事
- 映像表現・芸術科学フォーラムにて卒研生が優秀発表賞を受賞(2019.03.17)
- 自由な言葉でライブパフォーマンスをアレンジする(2019.03.16)
- 先端メディア学II(2年生)の学生が人工知能学会の研究会で発表(2019.03.15)
- 映像表現・芸術科学フォーラムでの発表(2019.03.10)
- ゲームの学会?!(2019.03.07)