« 重要なことは何度でも | トップページ | 良い間違いと悪い間違い(音声編) »

良い間違いと悪い間違い(一般編)

2023年7月19日 (水) 投稿者: メディア技術コース

メディア学部の大淵です。

大学院の講義科目「先端音声処理特論」では、音声を対象とした様々な機械学習方式を紹介していますが、その導入として、機械学習の基礎的な部分から話を始めています。

機械学習の最も基本的な応用は2クラス分類と呼ばれるもので、未知のデータが○○であるかどうかを推定するといった形で使われます。このとき、最初に「○○である確率」が求まり、それに基づいて「○○である」あるいは「○○でない」という結論が出されるのですが、その際の基準は、必ずしも「確率が50%以上かどうか」である必要はありません。

そんなふうに聞いてもなかなかピンとこないかもしれないので、授業では具体例を挙げて説明します。基準をもっと低くしなければならない代表例は、テロリストの発見です。空港のセキュリティチェックで、万一テロリストを見逃してしまうと大変なことになります。一方、テロリストでは無い人をテロリストだと疑ったとしても、さらに念入りなチェックをするだけなので、手間をかけてしまったことを謝るぐらいで済みます。こういう場合には、5%とか1%とか、とにかく低い基準で「見つけた!」と出力することが必要です。

逆に、基準を高くしなければならない例としては、油田の採掘場所の発見というのがあります。ある地域に石油が出そうな場所がいくつかあるとして、それを全部見つけられなくても大きな問題ではありません。でも、ここだと思った場所に何億円もかけて採掘設備を作って、そのあとで石油が出なかったということになったら大損です。このような場合には、95%とあ99%とか、とにかく高い基準で「見つけた!」と出力しなければなりません。

こうした違いは、Precision(正解制度)とかRecall(再現率)とか、あるいはFAR(誤検出率)とかFRR(誤棄却率)といった用語を使って定式化されています。実際に役に立つシステムを作るためには、ただ精度を上げようというだけでなく、どのような精度を上げるべきかを考えるのも重要だといえるでしょう。

授業紹介」カテゴリの記事

« 重要なことは何度でも | トップページ | 良い間違いと悪い間違い(音声編) »