トップページに戻る
いいかえると、ホストの癖に合わせて switch する確率を変える戦略で当りをget する確率 が常にswitch する戦略で当たりをget する確率 2/3 より大きくすることができるか、という問題である。
これにより、ホストのくせによらず、ホストが扉2を開けたなら必ず switch することが挑戦者にとって最も有利であることがわかった。
これにより、ホストのくせによらず、ホストが扉3を開けたなら必ず switch することが挑戦者にとって最も有利であることがわかった。
なお、ここで求めた確率は 条件付確率の問題設定 での確率ではなくて 非条件付確率の問題設定 での確率であることにくれぐれも注意しなければならない。
上で行ったような計算は、逆に条件付確率の問題設定の方を非条件付確率の問題設定に帰着させることで、非条件付確率の問題設定と条件付確率の問題設定の関係を議論したことになる。
等確率開扉の仮定を前提にせずに、条件付確率の問題設定から非条件付確率の問題設定に帰着せしめている。
非条件付確率の問題設定の方が条件付確率の問題設定よりも粗い問題設定で、 しかも 標準仮定 のうち 等確率開扉の仮定 以外が満たされているからこそできるのだろう。
トップページに戻る
2013/08/18 14:36:38
やっぱりswitch が有利
問題提起
標準仮定 のうち 等確率開扉の仮定 以外が満たされていて、ホストがハズレ扉を開けるときの扉の選び方の癖がわかっている場合に、その癖を考慮しながら挑戦者が扉を switch するかどうか決めたらどうなるか、という疑問が発端である。いいかえると、ホストの癖に合わせて switch する確率を変える戦略で当りをget する確率 が常にswitch する戦略で当たりをget する確率 2/3 より大きくすることができるか、という問題である。
くせのあるホストに対して挑戦者が switch する確率を調節した場合に当りをget する確率の計算方法
前提条件
次のような問題設定とする。- いつものように、挑戦者が扉1を選んだ場合に限定して考える。
- ホストと挑戦者は互いの戦略を読み合ったりしない。言い換えると心理戦の要素はない。
- あらかじめ挑戦者はホストのくせを知っている。
- 挑戦者がホストのくせに合わせて自分のくせを調節する方法は乱数発生機を使う方法でもよい
記号法
記号 | 意味 |
---|---|
Pa |
|
Pa, b |
a番目の扉が当たりで、かつ |
|
a番目の扉が当たりで、かつ 挑戦者がc番目の扉を最終選択する確率 |
q |
扉1が当たりのときに 挑戦者が知っている |
s |
ホストが扉2を開けたときに |
t |
ホストが扉3を開けたときに |
ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率
ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率 = ホストが扉2を開けて挑戦者が賞品を get する確率 / ホストが扉2を開ける確率 ホストが扉2を開けて挑戦者が賞品を get する確率 = P1, 2×(1 - s) + P3, 2×s = P1×q ×(1 - s) + P3×s = (1/3)×q ×(1 - s) + (1/3)×s = (1/3)×(q + (1 - q)×s) ホストが扉2を開ける確率 = 扉1が当たりでホストが扉2を開ける確率 + 扉3が当たりの確率 = P1, 2 + P3 = P1×q + P3 = (1/3)×(q + 1) ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率 = (1/3)×(q + (1 - q)×s) / ((1/3)×(q + 1)) = (q + (1 - q)×s) / (q + 1) 検算 ホストが扉2を開けるくせがある場合にホストが扉2を開けてswitch しないケース( q = 1, s = 0) の確率 = 1/2 ホストが扉3を開けるくせがある場合にホストが扉2を開けてswitch しないケース( q = 0, s = 0) の確率 = 1
ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率の最大値
(q + (1 - q)×s) / (q + 1) は s = 1 のときに最大値 1 / (q + 1) となる。これにより、ホストのくせによらず、ホストが扉2を開けたなら必ず switch することが挑戦者にとって最も有利であることがわかった。
ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率
ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率 = ホストが扉3を開けて挑戦者が賞品を get する確率 / ホストが扉3を開ける確率 ホストが扉3を開けて挑戦者が賞品を get する確率 = P1, 3×(1 - t) + P2, 3×t = P1×(1 - q) ×(1 - t) + P2×t = (1/3)×(1 - q)×(1 - t) + (1/3)×t = (1/3)×(1 + q×(t - 1)) ホストが扉3を開ける確率 = 扉1が当たりでホストが扉3を開ける確率 + 扉2が当たりの確率 = P1, 3 + P2 = P1×(1 - q) + P2 = (1/3)×(2 - q) ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率 = (1/3)×(1 + q×(t - 1)) / ((1/3)×(2 - q)) = (1 + q×(t - 1) / (2 - q) 検算 ホストが扉2を開けるくせがある場合にホストが扉3を開けてswitch しないケース( q = 1, t = 0) の確率 = 0 ホストが扉3を開けるくせがある場合にホストが扉3を開けてswitch しないケース( q = 0, t = 0) の確率 = 1/2
ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率の最大値
(1 + q×(t - 1) / (2 - q) は t = 1 のときに最大値 1 / (2 - q) となる。これにより、ホストのくせによらず、ホストが扉3を開けたなら必ず switch することが挑戦者にとって最も有利であることがわかった。
ホストが扉2を開けた場合と扉3を開けた場合を総合したときに、挑戦者が必ず switch する場合に賞品を get する確率
ホストが扉2を開けた場合と扉3を開けた場合を総合して計算する。 挑戦者が必ず switch する場合に賞品を get する確率 = ホストが扉2を開けて挑戦者が賞品を get する確率 + ホストが扉3を開けて挑戦者が賞品を get する確率 = P1, 2×(1 - s) + P3, 2×s + P1, 3×(1 - t) + P2, 3×t = P3, 2×s + P2, 3×t = (1/3)×s + (1/3)×t = 2/3これにより、ホストが扉2を開けた場合と扉3を開けた場合を総合して計算すると 挑戦者が必ず switch する戦略をとった場合、ホストのハズレ扉のくせががどのようであっても挑戦者が賞品を get する確率は 2/3 以外にならないことがわかった。
なお、ここで求めた確率は 条件付確率の問題設定 での確率ではなくて 非条件付確率の問題設定 での確率であることにくれぐれも注意しなければならない。
同じことをゲーム理論でも確かめられるらしい
Wilipedia(英語版)の "Monty Hall problem" の記事 (10:41, 27 May 2013の版 ) の "Other host behaviors"という項の "Possible host behaviors in unspecified problem" という表の "Four-stage two-player game-theoretic "という欄を見るとGill, Richard (2011).でゲーム理論を応用して似たような結果を得ているようである。こういうことか
非条件付確率の問題設定と条件付確率の問題設定の関係を議論する場合、等確率開扉の仮定を含めて標準仮定が完全に満たされている場合の扉の間の対称性を利用して、非条件付確率の問題設定を条件付確率の問題設定に帰着させることが多い。上で行ったような計算は、逆に条件付確率の問題設定の方を非条件付確率の問題設定に帰着させることで、非条件付確率の問題設定と条件付確率の問題設定の関係を議論したことになる。
等確率開扉の仮定を前提にせずに、条件付確率の問題設定から非条件付確率の問題設定に帰着せしめている。
非条件付確率の問題設定の方が条件付確率の問題設定よりも粗い問題設定で、 しかも 標準仮定 のうち 等確率開扉の仮定 以外が満たされているからこそできるのだろう。
参考文献
-
Gill, Richard (2011).
The Monty Hall Problem is not a probability puzzle (it's a challenge in mathematical modelling).
Statistica Neerlandica 65(1) 58–71, February 2011.
用語解説
-
標準仮定
モンティ・ホール問題や3囚人問題を数学的に解くためには問題文に明示的に書かれていない条件を仮定する必要がある。
標準仮定はそうした仮定の一つであり、モンティ・ホール問題の場合、次のような内容となっている。
①当たり扉はランダムかつ等確率に設定される
②ホストは挑戦者の選んだ扉を開けない
③ホストは必ず残りの扉を一枚開ける
④ホストはハズレの扉しか開けない
⑤ホストは挑戦者の選んだ扉が当たりのとき、ハズレ扉をランダムかつ等確率に選んで開ける
⑥ホストは扉を開けた後に必ずswitchの機会を挑戦者に与える
1975年に モンティ・ホール問題を発案した Steve Selvin も、
1990~1991年に PARADE誌のコラム"Ask Marilyn"で論争した人々の多くも、
標準仮定のもとに議論していた。
「標準仮定」(the standard assumptions)とは Wikipedia(英語版)の "Monty Hall problem"の記事で導入された言葉である。
3囚人問題の標準仮定は、「⑥ホストは扉を開けた後に必ずswitchの機会を挑戦者に与える」を除いたものになる。
-
等確率開扉の仮定
上記の標準仮定のうち、「⑤ホストは挑戦者の選んだ扉が当たりのとき、ハズレ扉をランダムかつ等確率に選んで開ける」を
筆者は「等確率開扉の仮定」と呼ぶことにしている。
3囚人問題の場合は、「⑤看守は質問した囚人が恩赦のとき、処刑される囚人からランダムかつ等確率に選んだ囚人の名を告げる」となる。
-
条件付確率の問題設定
ホストが「これこれ」のハズレ扉を開けたということを証拠事象として、
「それぞれ」の扉が当たりである条件付き確率を計算する問題設定である。
-
非条件付確率の問題設定
ホストが「いずれか」のハズレ扉を開けることは最初から分っていることとして
(相場用語なら「織り込み済み」だとして)
「挑戦者が選んだ」扉、あるいは「残りの」扉が当たりである確率を計算する問題設定である。
トップページに戻る