トップページに戻る
ホスト側の目標は可能な限り賞品を渡さないことである。
ホスト側が変更できるパラメータは、挑戦者が当たりの扉1を選んだときにホストが扉3 を開ける割合である。
挑戦者側が変更できるパラメータは、switch する割合である。
こうした設定で、ミニ・マックス法を応用すると、 「ホスト側は半々で扉3を開け、挑戦者側は常にswitch する」 という戦略の組み合わせに落ち着くらしい。
このことを、私なりのやり方で確認して見た。
モンティ・ホール問題にゲーム理論の考え方を適用 と同様に番組の放送ごとに交代するかも知れないホストの総体を 1つのプレイヤーとしてとらえ、番組の放送ごとに次から次に現れる挑戦者の総体を 1つのプレイヤーとしてとらえることとする。
さらに、を設定することをホスト側の戦略としてとらえ、ホストが開けた扉に応じて挑戦者が switch する割合と stay する割合を挑戦者側の戦略としてとらえることとする。
大当たりが出る確率を計算するために場合分けの表を作ると次のようになる。
この表を見るとゲーム理論を使うまでもなく、次のことがわかる。
トップページに戻る
2013/08/18 14:36:37
モンティ・ホール問題にゲーム理論の考え方を適用 その2
Gill, Richard D.(2010). でモンティ・ホール問題にゲーム理論を応用するときに、次のような設定で行っている。ホスト側の目標は可能な限り賞品を渡さないことである。
ホスト側が変更できるパラメータは、挑戦者が当たりの扉1を選んだときにホストが扉3 を開ける割合である。
挑戦者側が変更できるパラメータは、switch する割合である。
こうした設定で、ミニ・マックス法を応用すると、 「ホスト側は半々で扉3を開け、挑戦者側は常にswitch する」 という戦略の組み合わせに落ち着くらしい。
このことを、私なりのやり方で確認して見た。
モンティ・ホール問題にゲーム理論の考え方を適用 と同様に番組の放送ごとに交代するかも知れないホストの総体を 1つのプレイヤーとしてとらえ、番組の放送ごとに次から次に現れる挑戦者の総体を 1つのプレイヤーとしてとらえることとする。
さらに、を設定することをホスト側の戦略としてとらえ、ホストが開けた扉に応じて挑戦者が switch する割合と stay する割合を挑戦者側の戦略としてとらえることとする。
ゲーム理論の考え方を適用する準備
まず、変数を次のように整理する。
|
|
---|---|
扉1が当たりのときに扉3を開ける率 | q |
扉2が開けられたときに switch する率 | v |
扉3が開けられたときに switch する率 | w |
大当たりが出る確率を計算するために場合分けの表を作ると次のようになる。
の 戦略 |
の 選んだ扉1 |
|
の 戦略 |
が 勝つか |
の 確率 |
勝つ 抜書き |
勝つ 和 |
---|---|---|---|---|---|---|---|
扉1 が当たりのときに割合 q で扉3 を開ける | 当り | 扉2 | switch | 勝つ | 0 | 0 |
((1 + q) + (v + qw)) / 3(1+ q) |
負ける | 略 | ||||||
stay | 勝つ | (1-v)q / 3(1 + q) | (1-v)q / 3(1 + q) | ||||
負ける | 略 | ||||||
扉3 | switch | 勝つ | 0 | 0 | |||
負ける | 略 | ||||||
stay | 勝つ | (1 -w) / 3(1 + q) | (1 -w) / 3(1 + q) | ||||
負ける | 略 | ||||||
ハズレ | 扉2 | switch | 勝つ | v / 3 | v / 3 | ||
負ける | 略 | ||||||
stay | 勝つ | 0 | 0 | ||||
負ける | 略 | ||||||
扉3 | switch | 勝つ | w / 3 | w / 3 | |||
負ける | 略 | ||||||
stay | 勝つ | 0 | 0 | ||||
負ける | 略 |
- 挑戦者側にとって常に switch する戦略が最善手である。
( v = w = 1) - 挑戦者側が v = w = 1 という戦略をとった場合、ホスト側の戦略によらず、2/3 の確率で大当たりとなる
参考文献
-
Gill, Richard D.(2010).
The Monty Hall Problem is not a Probability Puzzle
用語解説
トップページに戻る