良い間違いと悪い間違い(音声編)
2023年7月21日 (金) 投稿者: メディア技術コース
メディア学部の大淵です。
前回に続き、2クラス分類問題における良い間違いと悪い間違いについて考えてみます。
私の授業は「先端音声処理特論」なので、音声に関連することを考えてみましょう。話者照合と呼ばれるシステムでは、声のデータをもとに、それがある人の声であるかどうかを判定します。
話者照合の使い道はいろいろありますが、代表的なもののひとつが犯罪捜査です。犯人のものと思われる声のデータをもとに、容疑者が犯人かどうかを判定するわけですが、わが国の司法の原則は「疑わしきは罰せず」ですから、この場合の判断基準は極めて高い値である必要があります。
しかし、同じ犯罪捜査であっても、容疑者の発見に話者照合を用いることもあります。事件に関連する大勢の人の声を集めて、犯人のものと思われる声をもとに、疑わしい人を見つけるわけです。この場合、容疑者とされてからも捜査は継続するので、間違えたからといってすぐに冤罪にはつながりません。一方、大勢の人に含まれる犯人を見逃してしまうと、その後の捜査で犯人が見つかることはなくなってしまいます。なので、低い基準で判断をする必要があるわけです。
似たような例は、音響識別と呼ばれる分野にもあります。機械の音から故障を発見する場合とか、聴診器の音から病気を発見する場合などです。これらのケースで、どんな使い方の場合には基準値が高くなり、どんな使い方の場合には基準値が低くなるのか、頭の体操だと思ってぜひ考えてみてください。
「授業紹介」カテゴリの記事
- トップレベルの論文を読み込む「CG技術特論」(大学院授業紹介)(2019.03.13)
- 大学院授業:プロシージャルアニメーション特論の紹介(2019.03.08)
- 専門演習「空間インタラクティブコンテンツ」2018後期(3)(2019.02.22)
- タンジブルインタラクションデザイン最終発表(2019.02.13)
- 専門演習「空間インタラクティブコンテンツ」2018後期(2)(2019.02.12)