ゲーム理論とゲームについて(2) 「ナッシュ均衡」と「囚人のジレンマ」
2019年9月 9日 (月) 投稿者: メディア技術コース
渡辺です。こんにちは。
7/5の記事で「ゲーム理論」に関する解説を掲載したのですが、そこから随分間が空いてしまいました。当初は二週間くらいで投稿するつもりだったのですが、学生の研究発表やら採点やら学会やらが続いてしまい、ズルズルとこの時期まで延びてしまいました...
さて、この記事は前回の続きとなりますので、まずは前回記事をご覧下さい。そちらでは、「ゲーム理論」という学問領域の紹介を簡単に行っています。
ジョン・フォン・ノイマン(1903-1957) とオスカー・モルゲンシュタイン(1902-1977)により創始された「ゲーム理論」は、当初は社会や経済の世界の事象を数学的に記述していくことに重点が置かれました。これにより、これまで論述的にしか分析がなされなかったことを数学的に分析することが可能となったことは確かなのですが、それはあくまで「問題を数式として記述できた」ことを意味するだけで、具体的にどのように最適な解を求めることは困難と言えました。
これに対し、1950年にジョン・ナッシュ(1928-2015)が今では「ナッシュ均衡」と呼ばれる画期的な手法を発表しました。このナッシュ均衡を説明する前に、ゲーム理論における用語を先に説明しておきます。
まず、ゲーム理論とは「複数のプレイヤーが様々な行動を行いながら自身の利益を追求する様子を記述する」というものです。ここでいうプレイヤーは、通常のゲームのように各プレイヤーを指すときもありますし、企業同士の競争の場合は各企業、国同士の争いのときには各国が「プレイヤー」となります。また、プレイヤーは利益を得るために様々な行動を行っていきますが、この行動を「戦略」と呼びます。
ナッシュ均衡はこの「プレイヤー」「利益」「戦略」という用語を用いると、「どのプレイヤーも、現在選択している戦略と別の戦略を選択しても利益が上昇しない」という状態のことを言います。なぜこれが画期的だったかというと、多くの場面でこの「ナッシュ均衡」こそ全プレイヤーが合理的に判断した様子を表すからです。つまり、「シミュレーション」を行うことができるというわけですね。この考え方が提案されて以降、ゲーム理論ではまず最初にこの「ナッシュ均衡」を求めることがセオリーとなりました。また、ゲーム中のキャラクターAIを実現する上でも重要な考え方となっています。
では、プレイヤーはこの「ナッシュ均衡」に基づいた行動を取っていれば、常に最大の利益を得られると言えるのでしょうか?それについて、1950年にアルバート・タッカー(1905-1995)が「囚人のジレンマ」という強烈な事例を提示しました。
二人の囚人A,Bがそれぞれ別室で隔離されており、黙秘か自白かを選択できる状況だとします。そして、以下のような懲役が課されるとします。
・両方とも黙秘した場合、両方とも懲役2年となる。
・両方とも自白した場合、両方とも懲役5年となる。
・自分が自白し相手が黙秘した場合、自分は釈放、相手は懲役10年となる。
・自分が黙秘し相手が自白した場合、自分は懲役10年、相手は釈放となる。
・両方とも自白した場合、両方とも懲役5年となる。
・自分が自白し相手が黙秘した場合、自分は釈放、相手は懲役10年となる。
・自分が黙秘し相手が自白した場合、自分は懲役10年、相手は釈放となる。
このような場合、Aの立場になってみると以下のように言うことができます。
・黙秘した場合、Bが黙秘すれば2年、Bが自白すれば10年となる。
・自白した場合、Bが黙秘すれば0年、Bが自白すれば5年となる。
・自白した場合、Bが黙秘すれば0年、Bが自白すれば5年となる。
つまり、AにとってみればBが黙秘しようが自白しようが、どちらにしても自白してしまった方が得なわけです。ですので、「ナッシュ均衡」の考え方に基づけば「AもBも自白」が正解で、その場合両者とも懲役5年となります。
ところがですね、上記はもしAもBも黙秘を選んでおけば、両方の懲役は2年になるわけです。つまり、「ナッシュ均衡」は必ずしも両者が最も利益が得られる状況というわけではないのです。それに対し、個々の戦略だけでなく他のプレイヤーとの兼ね合いも考えて利益を最大化することを「パレート最適」と言います。
現実世界においても、自分の都合だけ見ているとより大きな利益を損なってしまうような状況はしばしば見受けられます。一方で、本来はライバル同士である関係ですが一時的に協力するような状況はこの「パレート最適」を踏まえてのものとなります。例えば、自動車メーカーは現在世界的にライバル同士が手を組んで大きな連合を組みつつあります。利己的な都合だけを追求していっても、最大の利益が得られるわけではないんですね。まさに「情けは人のためならず」ということわざの通りです。
ただ、上記の「囚人のジレンマ」の例を見てわかるとおり、全体の状況を踏まえて利益を増やしていこうとするのは、理論的にはなかなか難しいわけです。私の研究室の学生の多くがゲームAIについて研究を提案するのですが、最近は「敵のAI」よりも「味方のAI」をなんとかしたいという話がよくでてきます。実際、ゲームAIを作成する立場になると、敵対関係よりも協力関係の方が実現する難度が高いのです。
次回は、ゲーム理論の中でも割と新しい「協力ゲーム理論」を取り上げ、協力関係というのをどのように理論的に実現していくのかについて論じていきたいと思います。
(メディア学部准教授 渡辺大地)
「おもしろメディア学」カテゴリの記事
- 【研究紹介】お城を数値で作り上げる!:日本城郭のプロシージャルモデリング(2019.01.22)
- 【研究紹介】プロジェクションマッピングはエンタメだけじゃない!プロジェクションマッピングによる動作支援(2019.01.15)
- 高大連携企画・映像制作ワークショップを開催しました(2019.01.14)
- 【再掲】世にも恐ろしい本当にあった話...(からぁ~の,エール!)(2019.01.09)
- 【研究紹介】”匂い”で季節感を感じさせることはできるか?(2019.01.06)