モンティ・ホール問題好きのホームページ    プライバシーポリシー

トップページに戻る
2020/01/18 14:01:17
初版 2020/1/18

英語版Wikipedia における McDonnellとAbbott の論文

英語版Wikipedia の 'Two envelopes problem' の記事の"Extensions to the problem"の章での McDonnel と Abbott の論文の紹介の仕方に疑問を感じます。

どんな論文か

問題の章 "Extensions to the problem" で紹介されている論文は McDonnell, M. D., & Abbott, D. (2009) です。
論文のタイトルは "Randomized switching in the two-envelope problem" ですが、論文の主題は二つの封筒問題のパラドックスにまったく関係ありません。
Google scholar でこの論文を引用している論文を調べて、ざっと見た印象ですが、この論文を引用している論文のうち、二つの封筒問題をテーマとした論文はそれほど多くないように感じました。そしてこの論文自体も、二つの封筒問題の分野よりは、制御工学や資産運用の分野の方に属している印象を持ちました。

それはともかく、ランダマイズドスイッチングが二つの封筒問題の定番のテーマの一つだということを示すためには、Wikipedia の "Two envelopes problem" の記事で、McDonnellとAbbott の論文にとどめず、下記の文献も紹介した方がよいと思います。

論文の内容

以下、論文の内容を書かれている順番に整理しました。

第1章 導入

二つの封筒問題を紹介
  • 片方の封筒に xドル(オーストラリアドル?)、もう一方に2xドル
  • ランダムに選んだ封筒を与えられたプレイヤーは封筒を交換すべきか否か
  • 交換すべきだという議論はパラドックスを導く

二つの封筒問題の論文の紹介

ランダマイズドスイッチングに類似のテーマの論文の紹介

その他の先行論文の紹介
  • 量子ゲーム理論の論文などを紹介

この論文の構成
  • 2003年に T. Cover から私的に教わったアイデアをベースにする

私の注:
T. Cover さんは Cover, T. M. (1987)の著者の Cover さんだと思います。

第2章 標準的な二封筒問題の場合

記法と前提
  • 少額側金額を x, その確率変数を X, [0, ∞) 上の確率密度関数を fX(x) で表す
  • X は有限の平均値を持つ
  • X の分布は定常的
  • プレイヤーは X の確率分布を知らない
  • プレイヤーに少額側の金額の封筒が渡される確率は p
    (p = 0.5 とは限らない)
  • プレイヤーは Cover のランダマイズドスイッチング戦略を使う

私の注:
プレイヤーに x の封筒と 2x の封筒の中から少額側が渡される確率が 0.5 とは限らないので「標準的」ではないでしょう。

(a) 期待利得の一般式
  • プレイヤーが開けた封筒の金額を y で表す
  • y が金額ペア (x, 2x) の x である確率は p
  • y の関数 PS(y) ∈ [0, 1] を交換する確率とする。(いわゆるランダム交換関数)
  • X = x のときの期待リターンを R(x) であらわす
  • R(x) の 平均を R であらわす
  • 常に交換しない場合の期待リターンの平均 (2 - p)E[X] を RB で表し、ベンチマークベースリターンと呼ぶ
  • R (交換する戦略の期待リターンの平均) と RB の差、すなわちゲインを G で表すと
    G = 0xfX(x)[pPS (x)−(1−p)PS(2x)]dx   … (2.1)

    変数変換して積分される二つの項の交換関数 PS を一つにまとめると
    G = Φ=0Φ= ∞ΦPS(Φ) [pfX(Φ)−0.25(1−p)fX(Φ/2)]dΦ   … (2.2)
私の注:
p=0.5 でかつ交換関数が常に1(常に交換)の条件で、(2.2) から期待リターンの平均値Rの式を求めると次のようになります。
R
= Φ=0Φ= ∞ [(1/2)ΦfX(Φ) + (1/2)(Φ/2)fX(Φ/2) + (1/2)ΦfX(Φ)−(1/4)(Φ/2)fX(Φ/2) ]dΦ
= Φ=0Φ= ∞ [(1/2){ 2ΦfX(Φ) + (1/2)(Φ/2)fX(Φ/2)} ]dΦ
この式は選んだ封筒の金額を条件とする条件付期待値の平均値の式と形が一致するので、(2.2) の Φ は選んだ封筒の金額を表わしていることがわかります。

(b) どのような場合にゲインを得るか
  • x について、期待リターンとベンチマークリターンとの差が正という条件は
    pPS(x) ≥ (1−p)PS(2x) … (2.3)
    と書ける
私の注:
p = 0.5 の場合、上記の条件は Cover の方法に一致します。

(i) 交換関数が定数の場合
設定した条件
  • 定数 q を値とする関数を交換関数とする
得られた結果
  • ゲインは GC = q (2p - 1)E[X] となる
  • p = 0.5 ならゲインは q によらずゼロ、
    p < 0.5 ならゲインは q に比例してマイナスなので q = 0 が有利、
    p > 0.5 ならゲインは q に比例してプラスなのでq = 1 が有利
  • q = 0 とすると p の値によってゲインがマイナスになり、
    q > 0 とすると p > 0.5 ならゲインは常にプラス

(ii) 交換関数がCover の提案した単調減少関数の場合
設定した条件
  • 交換関数を PS1(y) = e-ay … (2.4) とする
得られた結果
  • p ≥ 0.5 の場合、交換関数 PS1 での、少額側金額 x ごとの期待ゲイン(期待リターンとベンチマークベースリターンの差)は常にプラスになり、x 全体でのゲインG もプラスになる
PS1 以外にも次のような交換関数を使える
  • PS2(y)= 2e−a1y /(e−a1y + ea1y)
  • PS3(y)= sech(a2y).
    (注:sech はハイパボリックセカント)

(iii) y のしきい値による交換の場合
設定した条件
  • y ≤ b のとき 1 を、 y > b のとき 0 を値とする関数を交換関数とする
得られた結果
  • 少額側金額 x ∈[0,b]、p > 0.5 の場合と、x ∈ (0.5b, b]、p = 0.5 の場合にゲインが正。他の場合はゲインがゼロ
  • p = 0.5 の場合、fX(x) が [0, ∞) で正であるならば、b の値によらず ゲインは正である
  • 等式 (2.2) の括弧([ と ] )の中身 "pfX(Φ)−0.25(1−p)fX(Φ/2)" に着目し、Φ∈ [0,a) のとき正、Φ∈ (a,∞). のとき負であるようなa をしきい値にすると最適な戦略になる。
  • b を無限に大きくしたり、無限にゼロに近づけることを考えると、常に交換する戦略やまったく交換しない戦略でも正のゲインがありそうに思えるが、そうするとゲインがゼロに近づくので問題ない。

私の注1:
くどいようですが、「ゲイン」とは「x ごとの期待リターンとベンチマークベースリターンの差の平均」のことです。
私の注2:
b を無限に大きくしたり、無限にゼロに近づけるとゲインがゼロに近づくので、0 と ∞ の間に最適なしきい値があることがわかります。

(c) 一様分布の場合
  • x ∈ [0,d] で、確率密度関数が fX(x)= 1/d のような確率分布について、d → ∞ の極限を考える
  • b < d であるような b をしきい値とする交換戦略の場合、ゲインは G1(b)=b2(5p−1)/8d となり、d → ∞ での極限値はゼロになる。

私の注:
最も単純なケース、P=0 の場合、b を固定して d だけ無限に大きくすると、全体として全く交換しない戦略に近づいて行くことから、ゲインの極限がゼロなので納得できます。

第3章 金額に上限がある場合

ゲームの条件
  • 少額側金額 x には上限 B < ∞ がある。つまりx ∈ (B,∞) に対して fX(x) = 0
  • プレイヤーは B の値を知っている
交換関数
  • 交換関数として、y ≤ B の場合は何らかの交換関数に一致し、それ以外の場合は 0 であるものを考える
期待リターン
  • 上記の交換関数での期待リターンは次のようになる。
    RU = …   (ややこしいので引用省略します)

第4章 数値シミュレーション

  • 少額側金額の確率密度関数は fX(x) = e-x/3/3
  • 交換関数は次の三種類
    • e−0.5y
    • y ≤ 2ln(4) の場合は 1、 y > 2ln(4) の場合は 0 を値とする関数
    • 常に 0 (交換しない)
  • それぞれについて下記を 5セットずつ行った
    • 2万回ゲームを繰り返しながら平均ゲインをプロットし、ゲインの理論値に近づく様子を見る
    (私の注:ここでの「平均ゲイン」は獲得金額と封筒の金額の平均との差の平均を意味すると思います)

第5章 結論と未解決問題

  • Cover の提案した戦略で期待利得を増やすことができた
  • しきい値による方法でも期待利得増加の可能性がある
  • いくつかの残された未開決問題
    • ゲームを始める前に最適な交換関数を見つける方法
    • ゲームを繰り返しながら交換関数を適応させていく方法
    • この結果を制御問題や最適化問題、株式市場のボラティリティ ポンピング問題への応用
    • Parrondo の原理が作用するすべての問題を体系化する共通の数学的フレームワーク

読後感

しきい値型戦略に関する部分が、主たるテーマであるランダマイズドスイッチングと異質な感じがします。しかし「金額に上限がない場合、任意の値をしきい値にしても効果あり」という結果は重要だと思います。最適な Cover 型戦略と最適なしきい値型戦略を実験で比較するなどしたらより興味深いと思います。

英語版 Wikipedia での引用の仕方の変遷

下記のような奇妙な変遷をしています。

2011年4月8日20:37の版

"Extensions to the problem" の章をつくり、McDonnell, M. D., & Abbott, D. (2009)を引用する形で論じています。
しかし、肝心のランダマイズドスイッチングには触れず、一様分布のケースと金額に上限があるケースのみ紹介しています。

2011年5月1日18:36の版

"Extensions to the problem" の章の後ろに "Randomized solutions" の章をつくり、Cover の提案にそったランダマイズドスイッチングを紹介しています。
不思議なことに、ランダム化の方式としてMcDonnell, M. D., & Abbott, D. (2009)が使っている交換関数 (2003年に Cover さんに私的に指導された方法らしい)ではなく、Cover さんが 1987年に提案した方法(Cover, T. M. (1987))を使っています。

2012年2月13日17:23の版

"Extensions to the problem" の章の内容がごっそり変質しました。交換戦略の話題に全く触れず、選んだ封筒の金額を条件とする条件付き期待値の計算式と、選んだ封筒の金額によっては交換が有利だということのみ論じています。

2019年12月29日20:33の版

"Extensions to the problem" と "Randomized solution" の章がともに消滅して、かわりに "Conditional switching" という、下記の内容の章ができました。
問題の拡張として、切り替えるかどうかを決定する前にプレーヤーが封筒Aを見ることが許可されている場合を考える。
この「条件付き切り替え」問題では、確率分布によっては「切り替えなし」戦略を超える利得を生成することがしばしば可能である。

この版の編集者はどのような考えに基づいてこのような行動をとったのか考えてみました。 ”Extensions to the problem" の章と "Randomized solutions" の章の両方をバサッと削除していることから、上記のうち、後者の「開けてから交換型軽視説」が有望です。

参考文献

トップページに戻る