« NPO法人ルーム・トゥ・リード ジャパン代表が「社会問題とメディア」で講演 | トップページ | プロジェクト演習~音声対話 »

音声ドキュメント検索とは?

|

メディア学部の相川です。最近注目されている「音声ドキュメント検索」を紹介します。最近パソコンの中にも、ネット上にも動画データや音声データ、音楽データがたくさん存在しています。Webページのテキストは検索エンジンで検索できますよね。画像や音は、それらにタイトルや解説文が付随していれば検索できますが、たとえば音声データの場合、その中で何をしゃべっているかということでは検索できません。そこでどうするかというと、最近性能が向上してきた音声認識の技術を使って音声を文章に変換します。文章になれば今までの文書検索技術で検索できるわけです。国立情報学研究所ではNTCIR(エンティサイル)と呼ばれる情報検索評価プロジェクトを実施しています。



http://research.nii.ac.jp/ntcir/ntcir-9/index-ja.html



情報処理学会音声言語情報処理研究会の音声ドキュメント処理ワーキンググループでは、音声ドキュメント検索性能評価をSpokenDocという名前でNTCIRに提案しています。私もこのワーキンググループメンバーの一人です。9月に開催された国際会議INTERSPEECH2010ではこのワーキンググループが中心となってスペシャルセッションを企画しました。



http://www.interspeech2010.org/SpecialSession.html



東京工科大学メディア学部ではこの音声ドキュメント検索に関連して、感性による効果音検索や楽器音特徴による音楽検索の研究を行っています。

研究紹介」カテゴリの記事

« NPO法人ルーム・トゥ・リード ジャパン代表が「社会問題とメディア」で講演 | トップページ | プロジェクト演習~音声対話 »