モンティ・ホール問題好きのホームページ    プライバシーポリシー

トップページに戻る
2013/11/24 14:11:57
初版 2011/11/24

Christensen と Utts の論文

Christensen, R; Utts, J (1992), は、Wikipedia(英語版)の "Two envelope problem" の記事や多くの論文で引用されているので、興味を持って読んでみました。

Christensen, R; Utts, J (1992),の内容

1.THE PARADOX の内容

次のようにゲームの手順と記号法を提示している。
  • ①swami (スワーミ、「ヒンズー教の聖者」という意味) が一つの封筒に$m を入れる
  • ②swami がもう一つの封筒に$2m を入れる
  • ③swami があなたに一つの封筒をわたす
  • ④swami がもう一人の人に残った封筒をわたす
  • ⑤あなたが封筒を開けたら $xが入っていた
  • ⑥相手の封筒に入っている金額の確率変数を Y とする
  • ⑦封筒を交換したときに手に入れる金額の確率変数をWとする
  • ⑧E(W|交換)= 5x/4 だからあなたは交換する方がよい
  • ⑨相手も同じことを考えるので取引が成立する
  • ???常に交換した方がよい???

2. A BAYESIAN RESOLUTION の内容

最初の部分で次のように述べている。
不適切な "noninformative" prior (無情報事前確率) を考えることがパラドックスの原因である。
理にかなった意思決定ルールである "Bayes's rule"に従えば 暗黙の事前確率分布にとらわれる危険をさけられる。


続く部分で"Bayes's rule" の名のもとに条件付き確率や条件付き期待値の計算式を導いている。
  • m の事前分布には何等かの情報がある。
    例えば、二封筒問題を教える講師がお金を封筒に入れたのであれば、高い確率でゼロに近い金額である。 ···私の注
  • M : 最初に封筒に入れる金額mの確率変数
  • g(m) : Mの事前確率
  • X : xに対応する確率変数
  • Pr(X=m|M=m) = Pr(X=2m|M=m)
    つまり、最初に少額側をとるか高額側をとるかは五分五分
  • Pr(M=x|X=x) = g(x) / (g(x) + g(x/2))
  • Pr(M=x/2|X=x) = g(x/2) / (g(x) + g(x/2))
  • E(W|交換) = E(Y|X=x)
    = (g(x/2)/(g(x) + g(x/2)))(x/2) +
    (g(x) / (g(x) + g(x))) (x/2)⋅2x.
  • g(x/2) < 2g(x)なら交換しない方がよい
私の注  論文執筆者自身のことかと思わせるジョークでしょう。

次に、封筒を交換すると倍額になったり半額になったりする確率が 1/2 だとする考え方が"noninformative rule" によるものだという解釈に基づいて、次のようなことを書いている。
封筒を交換すると倍額になったり半額になったりする確率が常に 1/2 であるなら g(x) は定関数となる。 ···私の注1
従って、[0, &inifin;) に渡る一様分布を考えることになる。 ···私の注2
従って、事前確率分布が最大エントロピーとなる。
私の注1  封筒を交換すると倍額になったり半額になったりする確率が常に 1/2 であるとする考えが 「確率の錯覚現象」 であることに気づいていない (あるいは重視していない) 。
私の注2  [0, &inifin;) に渡る一様分布を考えるなら連続的な確率分布を考えることになるので、ここで論じられているような離散型の数式では間に合わない。

最後の部分で、人々が "noninformative rule" に頼ろうとすることが問題だとしている。
真のパラドックスは、"noninformative" prior (無情報事前確率) から封筒を常に交換すべきだという結論になることではなく、人々が "noninformative rule" から "informative" な結論が導かれることを望んでいることである。 ···私の注1
真の問題は、多少なりとも存在する事前の知識を無視して人々が意思決定しようとすることである。 ···私の注2
私の注1  "noninformative rule"で検索したら Wikipdia(英語版) の "Prior probability" の記事が出て来たので、どうやら事前確率を「無情報」な状態で定めるルールのことらしい。
私の注2  そうすることで"informative rule" が適用できるようになる。

3. SONE FREQENTIST CALCULATIONS の内容

最初に頻度主義者の考える標本空間を示している。
S = { (x, y) : (m, 2m), (2m, m) }

次にS の上で条件付き確率を求めている。
X = m ならば Pr(Y=y|X=x)
   = 1 y=2x
   =0 y≠2x

X = 2m ならば Pr(Y=y|X=x)
   = 1 y=x/2
   =0 y≠x/2

次にS の上で条件付き期待値を求めている。
E(Y|X = x) = 2xI[X=m] + (x/2)I[X=2m]

次にS の上で X=mとX=2mの二通りを通した平均値を求めている。
E(Y) = E[E(Y|X=x)]
   = 2m(1/2) + (2m/2)(1/2)
   = 3m/2

ここまでの部分を読んでびっくりするのは、通常は二つの封筒の互角性を示すために使われる 3m/2 という数値があくまでも、封筒を交換して得られる金額 (Y) の期待値として扱われていることです。

そしてこれに続く部分で頻度主義者による意思決定法を考えています。
m と 2m の間にありそうな金額 c を想定します。封筒に入っていた金額 x が c 以下なら交換を申し出、 c より大なら封筒をキープします。

一読すると c の値は x によって変わりそうですが (つまり、封筒を開けてから c の値を決めることになりそうですが)、"Conclusion" の章の内容と照らし合わせると、どうやら定数のようです。つまりゲームを始める前に c の値を決めることになるらしいです。

4. CONCLUSIONの内容

ベイズ主義者であれば、x が大きな金額であればキープしようとし、x が小さな金額であれば交換しようとするので、ベイズ主義者の方が頻度主義者より有利だと述べています。
しかし、頻度主義者と言えども実際に封筒の中の金額を見たら、ベイズ主義者と変わらない判断をしそうに私は思います。
「封筒を開ける前の二つの封筒は互角だから封筒を開けた後の二つの封筒も互角だ」 とする第二の錯覚にとらわれているかどうかの方がむしろ重大な影響を持っていると思います。

注: 「封筒を選んだとき少額側の封筒である確率が 1/2 だから封筒を開けて出て来た金額 x が少額側の金額である確率も 1/2 だ」 とするのが第一の錯覚です。

読後のまとめ

この論文執筆者たちが「頻度主義者」という言葉で表しているのは、次のような傾向の人たちでしょう。 この論文には、確率の錯覚現象がパラドックスの始まりであることに論文執筆者は気づいていない (あるいは重視していない) という弱点がありますが、読みやすく、離散型金額分布の計算式もわかりやすく、期待値 3m/2 を引き出す考え方の弱点も示しているので、入門書として役に立ちます。
パラドックスを解決せんがために "noninformative rule" なるものを振りかざす人たちが多いことに気づかせてくれるのも読む価値大です。

論文執筆者が頻度主義者の考え方として上げているものが、私が「二封筒問題のおまじない」で取り上げた「金額着目型から金額ペア着目型の考え方にこっそり切り替えてごまかすおまじない」 に他ならない点も興味深いです。


参考文献



トップページに戻る