« 記述統計と推測統計 | トップページ | ベイズの定理とベイズ統計(2) »

ベイズの定理とベイズ統計(1)

2021年2月 4日 (木) 投稿者: メディア社会コース

皆さんは、ベイズの定理というのを聞いたことがあるでしょうか? 高校数学で習う条件付き確率とも大いに関係している概念です。このベイズというのは、18世紀に活躍したイギリスの数学者トーマス・ベイズ(Thomas Bayes)のことです。結果から過去に遡って原因を探るという考え方が、ベイズ研究の基本指針でした。そこから生まれたのがベイズの定理であり、さらにそれがベイズ統計の確立に結び付いていきました。本日は、比較的理解しやすいベイズの定理について話をします。

昨今の市中で行われている新型コロナウィルスのPCR検査に関して、陽性・陰性という言葉をよく耳にしますね。これは検査結果の表現であり、陽性は感染している、陰性は感染していないということをそれぞれ意味します。さすがに、このことはご存じですよね。ちなみに、表立って出てくることはあまりないのですが、偽陽性や偽陰性という表現もあります。実際には感染していないのに感染という結果が出ることを偽陽性と言い、実際には感染しているのに感染してないという結果が出ることを偽陰性と言います。余事象の概念の基本であり、この先の話の理解の助けになるので、この偽○○という表現は押さえておきましょう。

さて、仮想の感染症Dを例として、ベイズの定理の具体的な適用イメージを記してみます。数式や代数表現をできるだけ避けて話を進めたいと思います。まず、母集団を仮に1万人とします。そして、ここに潜在的にD感染者が500人いるとしましょう。つまり、5%の人が真に感染しているという設定です(これを罹患(りかん)率と言います)。ここで、ある感染症D用の検査キットが、陽性を90%(偽陽性を10%)、陰性を80%(偽陰性を20%)の確率で検出するとします。この状況のもと、ある日の街頭で1000人を対象に検査を行ったところ、80人の陽性者が見つかりました。この街頭検査での陽性率は8%となるわけですが、この検査結果を母集団に照らし合わせた際、どのように解釈すべきでしょうか?

罹患率を真の値として考えれば、街頭の検査対象1000人中に感染者は50人いるということになります。そして、検査キットの精度により、理論上は45人(=50人×0.9)が陽性、5人(=50人×0.1)が偽陽性(陰性)となります。一方、非感染者でありうる950人に関しては、760人(=950人×0.8)が陰性、190人(=950人×0.2)が偽陰性(陽性)となります。したがって、母集団に照らし合わせると、陽性の的中率は(45+190/100002.35%となります。標本対象の陽性率8%と異なることに留意しましょう。

さて、なるべく複雑な数式や公式的なものを記さずにベイズの定理のエッセンスを記したのですが、それとなくベイズの逆発想の考え方に馴染めましたか? 話が長くなったので、本日はここまでとしますが、明日はベイズ統計のさわりの話をしたいと思います。本日も宿題(Quiz)は無しです。

以上

文責: メディア学部 松永

2021.02.04

在学生向け」カテゴリの記事

社会」カテゴリの記事

高校生向け」カテゴリの記事

ソーシャル」カテゴリの記事

« 記述統計と推測統計 | トップページ | ベイズの定理とベイズ統計(2) »