モンティ・ホール問題好きのホームページ    プライバシーポリシー

トップページに戻る
2018/08/02 12:45:07
初版 2011/11/24

Christensen と Utts の論文

Christensen, R; Utts, J (1992) は、Wikipedia(英語版)の "Two envelope problem" の記事や多くの論文で引用されているので、興味を持って読んでみました。

Christensen, R; Utts, J (1992)の内容

1.THE PARADOX の内容

次のようにゲームの手順と記号法を提示している。
  • ①swami (スワーミ、「ヒンズー教の聖者」という意味) が一つの封筒に$m を入れる
  • ②swami がもう一つの封筒に$2m を入れる
  • ③swami があなたに一つの封筒をわたす
  • ④swami がもう一人の人に残った封筒をわたす
  • ⑤あなたが封筒を開けたら $xが入っていた
  • ⑥相手の封筒に入っている金額の確率変数を Y とする
  • ⑦封筒を交換したときに手に入れる金額の確率変数をWとする
  • ⑧E(W|交換)= 5x/4 だからあなたは交換する方がよい
  • ⑨相手も同じことを考えるので取引が成立する
  • ???常に交換した方がよい???

2. A BAYESIAN RESOLUTION の内容

(2018/08/02 修正)

最初の部分で次のように述べている。
交換が常に最適であるという結論は、封筒の内容を見て得られる情報がないという仮定に基づいている。 ··· 私の注1
不適切な "noninformative" prior (無情報事前確率) を考えることがパラドックスの原因である。 ··· 私の注2
合理的な意思決定ルールである "Bayes's rule"に従えば 暗黙の事前確率分布にとらわれる危険をさけられる。 ··· 私の注3
私の注1  もう一方の封筒の金額が半分か倍かの事後確率が定数 (1/2) であることを「得られる情報がない」と表現しているのでしょう。 (← 2018/08/02 追加)
私の注2  この文章は「事前確率分布想定説」に近いと思います。 (← 2018/08/02 追加)
私の注3  この文章は「直観的確率説」に近いと思います。 (← 2018/08/02 追加)

続く部分で"Bayes's rule" の名のもとに条件付き確率や条件付き期待値の計算式を導いている。
  • m の事前分布には何等かの情報がある。
    例えば、二封筒問題を教える講師がお金を封筒に入れたのであれば、高い確率でゼロに近い金額である。 ··· 私の注
  • M : 最初に封筒に入れる金額mの確率変数
  • g(m) : Mの事前確率
  • X : xに対応する確率変数
  • Pr(X=m|M=m) = Pr(X=2m|M=m)
    つまり、最初に少額側をとるか高額側をとるかは五分五分
  • Pr(M=x|X=x) = g(x) / (g(x) + g(x/2))
  • Pr(M=x/2|X=x) = g(x/2) / (g(x) + g(x/2))
  • E(W|交換) = E(Y|X=x)
    = (g(x/2)/(g(x) + g(x/2)))(x/2) + (g(x) / (g(x) + g(x/2))) 2x. (← 2018/08/02 修正)
  • g(x/2) > 2g(x)なら交換しない方がよい (← 2018/08/02 修正)
私の注  論文執筆者自身のことかと思わせるジョークでしょう。

次に、封筒を交換すると倍額になったり半額になったりする確率が 1/2 だとする考え方が"noninformative rule" によるものだという解釈に基づいて、次のようなことを書いている。
封筒を交換すると倍額になったり半額になったりする確率が常に 1/2 であるなら g(x) は定関数となる。 ··· 私の注1
従って、[0, ∞) に渡る一様分布を考えることになる。 ··· 私の注2
従って、事前確率分布が最大エントロピーとなる。
私の注1  封筒を交換すると倍額になったり半額になったりする確率が常に 1/2 であるとする考えが 「確率の錯覚現象」 であることに気づいていない (あるいは重視していない) 。
私の注2  [0, ∞) に渡る一様分布を考えるなら連続的な確率分布を考えることになるので、ここで論じられているような離散型の数式では間に合わない。

最後の部分で、人々が "noninformative rule" に頼ろうとすることが問題だとしている。
真のパラドックスは、"noninformative" prior (無情報事前確率) から封筒を常に交換すべきだという結論になることではなく、人々が "noninformative rule" から "informative" な結論が導かれることを望んでいることである。 ··· 私の注1
真の問題は多少なりとも存在する事前の知識を無視して人々が意思決定しようとすることである。 ··· 私の注2、私の注3
私の注1  ネットで検索しても "noninformative rule" を説明している記事が見つかりませんでした。。 (← 2018/08/02 修正)
私の注2  そうすることで"informative rule" が適用できるようになる。
私の注3  この部分も直観的確率説に近いと思います。 (← 2018/08/02 追加)

ベイズ意思決定論?
(2018/08/02 追加)

2018/08/02 にこの論文を読み返して、この論文がベイズ統計学の論文ではなく、ベイズ意思決定論の論文らしいと気が付きました。
この論文の次の特徴から、そう思います。 "class" が "complete" であるとは
「意思決定ルールの class Cに含まれないルールのどれに対しても、それより優れたルールが C にある」
という意味らしいです。この論文の著者たちは "Bayes's rule" という "class" が "complete" だと言いたいのでしょう。

"noninformative prior" と "noninformative rule" について
(2018/08/02 追加)

"noninformative prior" とはベイズ推定の用語らしいです。英語版 Wikipedia の "Prior probability" の記事に "Uninformative priors" という章がありました。
確率分布に関する情報がない状況でベイズ推定の事前確率分布を定めることらしいのですが、よくわかりません。離散分布の二つの封筒問題の場合は一様分布になるらしいです。
不十分理由の原理や無差別の原理の親戚かも知れません。

"noninformative rule" の方はネットで調べても、説明している記事が見つかりませんでした。
もしかしたら "Bayes's rule" に対立する概念で、"noninformative prior" によって意思決定するルールのことを指しているのかも知れません。

"noninformative prior" に関する著者たちの態度
(2018/08/02 追加)

この論文のそこかしこに「封筒に大金が入っていたら他方にはそれより小額が入っている可能性が高い」といった文章が書かれているので、"noninformative prior" を尊んでいるわけではなさそうです。

3. SONE FREQENTIST CALCULATIONS の内容

最初に頻度主義者の考える標本空間を示している。
S = { (x, y) : (m, 2m), (2m, m) }

次にS の上で条件付き確率を求めている。
X = m ならば Pr(Y=y|X=x)
   = 1 y=2x
   =0 y≠2x

X = 2m ならば Pr(Y=y|X=x)
   = 1 y=x/2
   =0 y≠x/2

次にS の上で条件付き期待値を求めている。
E(Y|X = x) = 2xI[X=m] + (x/2)I[X=2m]

次にS の上で X=mとX=2mの二通りを通した平均値を求めている。
E(Y) = E[E(Y|X=x)]
   = 2m(1/2) + (2m/2)(1/2)
   = 3m/2

ここまでの部分を読んでびっくりするのは、通常は二つの封筒の互角性を示すために使われる 3m/2 という数値があくまでも、封筒を交換して得られる金額 (Y) の期待値として扱われていることです。

そしてこれに続く部分で頻度主義者による意思決定法を考えています。
m と 2m の間にありそうな金額 c を想定します。
封筒に入っていた金額 x が c 以下なら交換を申し出、 c より大なら封筒をキープします。

一読すると c の値は x によって変わりそうですが (つまり、封筒を開けてから c の値を決めることになりそうですが)、"Conclusion" の章の内容と照らし合わせると、どうやら定数のようです。つまりゲームを始める前に c の値を決めることになるらしいです。

4. CONCLUSIONの内容

(2018/08/02 修正)

ベイズ主義の優位性を次のように述べています。
ベイズ主義者の方が有利である。
例えば、封筒に大金(あるいは小さな額)が入っていたら他方がそれより小額(あるいは高額)であることが予想されるが、ベイズ主義者ならそのことを考慮して期待値を計算できる。

しかし、頻度主義者と言えども実際に封筒の中の金額を見たら、ベイズ主義者と変わらない判断をしそうに私は思います。
「封筒を開ける前の二つの封筒は互角だから封筒を開けた後の二つの封筒も互角だ」 とする第二の錯覚 (注) にとらわれているかどうかの方がむしろ重大な影響を持っていると思います。
注:「封筒を選んだとき少額側の封筒である確率が 1/2 だから封筒を開けて出て来た金額 x が少額側の金額である確率も 1/2 だ」 とするのが第一の錯覚です。

読後のまとめ

(2018/08/02 修正)

この論文執筆者たちが「頻度主義者」という言葉で表しているのは、次のような傾向の人たちでしょう。 この論文には、確率の錯覚現象がパラドックスの始まりであることに論文執筆者は気づいていない (あるいは重視していない) という弱点がありますが、読みやすく、離散型金額分布の計算式もわかりやすく、期待値 3m/2 を引き出す考え方の弱点も示しているので、入門書として役に立ちます。
パラドックスを解決せんがために "noninformative rule" なるものを振りかざす人たちが多いことに気づかせてくれるのも読む価値大です。

論文執筆者が頻度主義者の考え方として上げているものが、私が「二封筒問題のおまじない」で取り上げた「金額着目型から金額ペア着目型の考え方にこっそり切り替えてごまかすおまじない」 に他ならない点も興味深いです。

英語版 Wikipedia への影響

(2018/08/02 追加)

この論文には直観的確率説に近い文章と事前確率分布想定説に近い文章の両方が現れます。
しかし、最後の "4 CONCLUSION" の章に「封筒に大金(あるいは小さな額)が入っていたら他方がそれより小額(あるいは高額)であることが予想されるが、ベイズ主義者ならそのことを考慮して期待値を計算できる。」といった意味の文章が書かれています。
このことから、この論文の本心は直観的確率説だと、私は思います。

しかし、英語版 Wikipedia の "Two envelopes problem" の 18:44, 8 February 2012 以降の版で数学的標準説を説明する章で事前確率分布想定説らしい表現が現れるようになり、09:49, 17 November 2014 以降の版では明確に事前確率分布想定説を述べるようになりました。
それらの章には次のような特徴があります。 このことから、英語版 Wikipedia がこの論文に影響を受けたらしいことがわかります。
事前確率分布想定説を述べているFalk, R., & Konold, C. (1992) も参考論文に含まれているので、こちらの影響もあると思います。


参考文献


用語解説



トップページに戻る