不公平な点数を補正する
2015年9月17日 (木) 投稿者: メディア技術コース
こんにちは。大淵です。今日は、私が取り組んでいる「うるさいところで音声認識する」という研究を、ちょっとした例え話で紹介しようと思います。
大学入試センター試験で、特定の科目の平均点が低くて、問題になることがありますね。実は今年の理科でもそういうことがあって、点数の調整が行われました(例えば、生物で50点の人は、実際には58点として扱うことになりました)。確かに、特定の科目だけが難しすぎて点数が低くなってしまったら不公平なので、調整をした方がいいでしょう。では、調整はどのように行うべきでしょうか?
一番簡単な方法は、点数が低い方の科目の受験生全員に、一定の点数を加算するというものです。堅苦しい専門用語では、平均正規化と言います。例えば、生物の平均点が物理より10点低い場合、生物の受験者全員の点数に10点加算すれば、平均点は同じになりますね。(ただし、もともと100点だった人は110点になってしまって、ちょっと困りますが)
ところが、科目間の不公平は、平均点だけに現れるとは限りません。どの問題も適度に難しければ良いのですが、難しすぎる問題や簡単すぎる問題ばかりでは、実力に応じた差がつきません。そうなると、成績の良い受験生にとっては不利だし、成績の悪い受験生にとっては有利になりますが、いずれにせよ他の科目との整合が取れなくては困ります。
このように、平均だけでなく科目内での差のつき方も補正したい場合には、「平均から何点離れているか」に着目して補正します。例えば、差のつきにくいテストで平均より5点高い点を取った人は、普通ならその2倍ぐらいの差をつけられたはずだと考えて、平均より10点高い点に補正するといった具合です。このやり方を分散正規化と言います。また、平均正規化と分散正規化を同時に行うこともできます。
では、平均と分散を補正すれば、完璧に公平なのでしょうか。実は必ずしもそうではありません。実際にやってみると、ちょっと得をする人やちょっと損をする人などがどうしても出てしまいます。そこで、もっとずっと大胆な補正が考えられました。点数のことは一旦忘れて、順位だけに着目するのです。例えば、生物を受けた人が、物理を受けた人に対して不公平にならないようにするためには、「上位10%に入る人は物理では○○点を取っている」「上位20%に入る人は物理では○○点を取っている」というように考えて、生物の人もその点数にしてしまうのです。これなら、同じ順位の人は必ず同じ点数になりますから、かなり公平と言えそうです。このやり方を、ヒストグラム均等化といいます。そして、センター試験の点数調整も、実はこのヒストグラム均等化に基づいて行われています(完全に均等化するのではなく、それに近づけるという方法ですが)。
さて、最初の話に戻って、「うるさいところで音声認識する」ことは、この話とどういう関係があるのでしょうか。実は、コンピューターによる音声認識では、入力音声を元に得られた数値を、あらかじめ用意しておいたパターンと比較しています。ところが、雑音と一緒に入ってきた声から得られる数値は、「本来の実力」に相当する数値からずれてしまうのです。ずれた値で比較すると、間違った認識結果になってしまいます。
そうならないようにするため、うるさい環境でのデータの分布を調べ、「うるさい環境での数値」から「静かな環境での数値」への補正を行います。実際のプログラムでは、雑音の大きさやコンピューターの処理能力などに応じて、平均正規化・分散正規化・ヒストグラム均等化の中から最適な方法が選ばれます。また、これらの正規化方法をベースとして、さらに複雑な正規化方法を使うこともあります。そうした補正により、本来の数値との比較ができ、正しい認識結果が得られるわけです。
「正規化」は、この他にもメディア処理のいろんなところに出てきます。どんな分野でも、データを見たら「その値は本来の性質をきちんと表しているか?」と疑ってみることが大切なんですね。
「研究紹介」カテゴリの記事
- 映像表現・芸術科学フォーラムにて卒研生が優秀発表賞を受賞(2019.03.17)
- 自由な言葉でライブパフォーマンスをアレンジする(2019.03.16)
- 先端メディア学II(2年生)の学生が人工知能学会の研究会で発表(2019.03.15)
- 映像表現・芸術科学フォーラムでの発表(2019.03.10)
- ゲームの学会?!(2019.03.07)