モンティ・ホール問題好きのホームページ    プライバシーポリシー

トップページに戻る
2013/08/18 14:36:38

やっぱりswitch が有利

問題提起

標準仮定 のうち 等確率開扉の仮定 以外が満たされていて、ホストがハズレ扉を開けるときの扉の選び方の癖がわかっている場合に、その癖を考慮しながら挑戦者が扉を switch するかどうか決めたらどうなるか、という疑問が発端である。

いいかえると、ホストの癖に合わせて switch する確率を変える戦略で当りをget する確率 が常にswitch する戦略で当たりをget する確率 2/3 より大きくすることができるか、という問題である。

くせのあるホストに対して挑戦者が switch する確率を調節した場合に当りをget する確率の計算方法

前提条件

次のような問題設定とする。

記号法

記号 意味
Pa a番目の扉が当たりである確率
Pa, b a番目の扉が当たりで、かつ
ホストがb番目の扉を開ける確率
  Pa, b, c   a番目の扉が当たりで、かつ
ホストがb番目の扉を開けて、かつ
挑戦者がc番目の扉を最終選択する確率
n = 1 は switch しないことを意味し
n ≠ 1 は switch することを意味する
q 扉1が当たりのときに
ホストが扉2を開ける条件付き確率
挑戦者が知っている
s ホストが扉2を開けたときに
挑戦者が switch する条件付き確率
挑戦者本人が操作できる
t ホストが扉3を開けたときに
挑戦者が switch する条件付き確率
挑戦者本人が操作できる

ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率

ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率 =
ホストが扉2を開けて挑戦者が賞品を get する確率 / ホストが扉2を開ける確率
 
ホストが扉2を開けて挑戦者が賞品を get する確率 =
P1, 2×(1 - s) + P3, 2×s =
P1×q ×(1 - s) + P3×s =
(1/3)×q ×(1 - s)  + (1/3)×s =
(1/3)×(q + (1 - q)×s)
 
ホストが扉2を開ける確率 =
扉1が当たりでホストが扉2を開ける確率 + 扉3が当たりの確率 =
P1, 2 + P3 =
P1×q + P3 =
(1/3)×(q + 1)
 
ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率 =
(1/3)×(q + (1 - q)×s) / ((1/3)×(q + 1)) =
(q + (1 - q)×s) / (q + 1)
 
検算
ホストが扉2を開けるくせがある場合にホストが扉2を開けてswitch しないケース( q = 1, s = 0) の確率 = 1/2 
ホストが扉3を開けるくせがある場合にホストが扉2を開けてswitch しないケース( q = 0, s = 0) の確率 = 1

ホストが扉2を開けたという証拠事象のもとで賞品を get する条件付き確率の最大値

(q + (1 - q)×s) / (q + 1) は s = 1 のときに最大値 1 / (q + 1) となる。
これにより、ホストのくせによらず、ホストが扉2を開けたなら必ず switch することが挑戦者にとって最も有利であることがわかった。

ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率

ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率 =
ホストが扉3を開けて挑戦者が賞品を get する確率 / ホストが扉3を開ける確率
 
ホストが扉3を開けて挑戦者が賞品を get する確率 =
P1, 3×(1 - t) + P2, 3×t =
P1×(1 - q) ×(1 - t) + P2×t =
(1/3)×(1 - q)×(1 - t) + (1/3)×t =
(1/3)×(1 + q×(t - 1))
 
ホストが扉3を開ける確率 =
扉1が当たりでホストが扉3を開ける確率 + 扉2が当たりの確率 =
P1, 3 + P2 =
P1×(1 - q) + P2 =
(1/3)×(2 - q)
 
ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率 =
(1/3)×(1 + q×(t - 1)) / ((1/3)×(2 - q)) =
(1 + q×(t - 1) / (2 - q) 
 
検算
ホストが扉2を開けるくせがある場合にホストが扉3を開けてswitch しないケース( q = 1,  t = 0) の確率 = 0
ホストが扉3を開けるくせがある場合にホストが扉3を開けてswitch しないケース( q = 0, t = 0) の確率 = 1/2

ホストが扉3を開けたという証拠事象のもとで賞品を get する条件付き確率の最大値

(1 + q×(t - 1) / (2 - q) は t = 1 のときに最大値 1 / (2 - q) となる。
これにより、ホストのくせによらず、ホストが扉3を開けたなら必ず switch することが挑戦者にとって最も有利であることがわかった。

ホストが扉2を開けた場合と扉3を開けた場合を総合したときに、挑戦者が必ず switch する場合に賞品を get する確率

ホストが扉2を開けた場合と扉3を開けた場合を総合して計算する。
 
挑戦者が必ず switch する場合に賞品を get する確率 =
ホストが扉2を開けて挑戦者が賞品を get する確率 + ホストが扉3を開けて挑戦者が賞品を get する確率 =
P1, 2×(1 - s) + P3, 2×s + P1, 3×(1 - t) + P2, 3×t  =
P3, 2×s + P2, 3×t  =
(1/3)×s + (1/3)×t = 2/3
これにより、ホストが扉2を開けた場合と扉3を開けた場合を総合して計算すると 挑戦者が必ず switch する戦略をとった場合、ホストのハズレ扉のくせががどのようであっても挑戦者が賞品を get する確率は 2/3 以外にならないことがわかった。

なお、ここで求めた確率は 条件付確率の問題設定 での確率ではなくて 非条件付確率の問題設定 での確率であることにくれぐれも注意しなければならない。

同じことをゲーム理論でも確かめられるらしい

Wilipedia(英語版)の "Monty Hall problem" の記事 (10:41, 27 May 2013の版 ) の "Other host behaviors"という項の "Possible host behaviors in unspecified problem" という表の "Four-stage two-player game-theoretic "という欄を見るとGill, Richard (2011).でゲーム理論を応用して似たような結果を得ているようである。

こういうことか

非条件付確率の問題設定条件付確率の問題設定の関係を議論する場合、等確率開扉の仮定を含めて標準仮定が完全に満たされている場合の扉の間の対称性を利用して、非条件付確率の問題設定条件付確率の問題設定に帰着させることが多い。

上で行ったような計算は、逆に条件付確率の問題設定の方を非条件付確率の問題設定に帰着させることで、非条件付確率の問題設定条件付確率の問題設定の関係を議論したことになる。
等確率開扉の仮定を前提にせずに、条件付確率の問題設定から非条件付確率の問題設定に帰着せしめている。
非条件付確率の問題設定の方が条件付確率の問題設定よりも粗い問題設定で、 しかも 標準仮定 のうち 等確率開扉の仮定 以外が満たされているからこそできるのだろう。



参考文献

用語解説



トップページに戻る