モンティ・ホール問題好きのホームページ    プライバシーポリシー

トップページに戻る
2020/01/05 12:01:57
初版 2020/1/5

英語版Wikipediaのランダマイズドスイッチング



2011年に英語版Wikipedia の "Two envelopes problem" の記事に加えられた "Ramdomized solutions" の章の内容が 2019年12月にごそっと削除されました。 削除してもよいような内容だったのか気になります。

英語版Wikipedia の "Two envelopes problem" の記事の章 "Randomized solutions"

章の生い立ち

"Two envelopes problem" の主要な編集者4人 ( Iさん、Gさん、Gerさん、Hさん) のうちの一人である Gさんによって、2011年5月に "Randomized solution" の章が作られ、同月のうちに主要な内容が完成しました。

章の内容

"Ramdomized solutions" の章の内容がごそっと削除される直前の 2019年12月28日 22:46 のリビジョンでは、当該の章は下記のような部分で構成されているようです。

問題の定義
  • 開けてから交換型の二つの封筒問題を考える。
  • 小さい方の金額をA、大きい方の金額をBで表す。金額の倍率は金額ペアごとに変化してもよい。
  • 選んだ封筒の金額を元に封筒を交換するかしないか決定するアルゴリズムで、まったく交換しない場合より有利な結果をもたらすアルゴリズムがテーマである。

私の注1:
同じ意味の文が何度も繰り返して現れるので、拙い文章に見えます。
Wikipedia の編集方法に慣れていない人が修正を加える都度、同じ文があっちこっちに残ってしまったのかもしれません。

私の注2:
"however"という単語を「・・・する方法によらず」という意味で使っている箇所が二つほどありましたが、私は違和感を感じました。 "no matter how" の方がなじみがあります。 2011年の G さんのオリジナルの文章には "however" のこのような用法はありませんでした。

私の注3:
これらの文章の拙さが、2019年12月に "Randomized solutions" という章を削除した編集者の目に、この章の内容を薄っぺらく思わせたこのかもしれません。

乱数を使った戦略
戦略の定義
  • なんらかの方法で 0 から ∞ まで連測して分布する乱数Z を作る。
  • 選んだ封筒の金額に対して Z の方が大きかったら封筒を交換し、そうでなかったら交換しない戦略を考える。
この戦略が有利であることの証明
  • Z が A とB の両方より小さかったら、この戦略は有利でも不利でもない。
  • Z が A とB の両方より大きかったら、この戦略は有利でも不利でもない。
  • Z が A とB の中間であれば、この戦略は有利である。

私の注:
次の説明の方が分かりやすいと思います。
  • 選んだ封筒の金額がA の場合、この戦略でB を得る確率は P(Z > A)。
  • 選んだ封筒の金額がB の場合、この戦略でB を得る確率は P(Z < B)。
  • したがって、金額ペアが (A, B) のときにこの戦略でB を得る確率は (1/2)P(Z > A) + (1/2)P(Z < B) = 1/2 + (1/2)P(A < Z < B)) > 1/2。

無限大まで分布する乱数の作り方
  • 二進表示で1以下の正の乱数を作ります。具体的には、コイントスの結果に応じて小数点以下の各桁の数字 (0 か1) を順々に決めて行きます。
  • 出来上がった少数の自然対数の反数をとると、0 から ∞ の乱数になります。
  • コイントスを適当な回数だけ行って、出来上がった二進表示の少数の自然対数の反数をとって様子を見る方法なら、有限回のコイントスで済みます。

私の注1:
コイントスを使ったこの方法はG さん自身により 2011年5月3日 に書き込まれました。

私の注2:
桁数に制限のない少数を得たとして、その逆数の自然対数をどうやって計算するのかわかりません。私のパソコンではオーバーフローしそうです。

私の注3:
ややこしい割に、あまり本質的でないアルゴリズムのような気がします。そのため、2019年12月29日の大削除を行った編集者の目に、胡散臭く見えたのかも知れません。

ゲーム理論との関係
ゲーム理論で言うところのゲームとしての解釈
  • 封筒の金額を利得とし、封筒の金額の確率分布を封筒にお金を入れる人の戦略とみなし、上記のZの確率分布を封筒を選ぶ人の戦略とみなすと、2人零和ゲームになる。
  • このゲームは鞍点がない無限ゲームである。
  • Minimax原理も応用できない。

私の注1:
この部分は Gさんによって 2011年5月2日に書かれました。
相手の出方に応じて封筒に入れる金額の分布を変えたり、乱数の分布を変えたりできるようにすると、面白い競技になりそうです。

単調増加関数を利用した戦略
"Randomized solutions" の章にこの戦略が書きこまれたことが、2019年12月29日の大削除のきっかけです。 せっかくG さんが書いた内容まで削除されたのは、とんだとばっちりです。

  • f(x) を実数の集合 R から区間 (0, 1) への単調増加関数とする。
  • 選んだ封筒の金額x に応じて 確率 1 - f(x) で 交換する戦略をとる。
  • 金額ペア(x, y) (x < y) に対して、この戦略でy を得る確率は、(1/2) * (1-f(x)) + (1/2) * f(y) = 1/2 + (f(y) - f(x))/2で、1/2 より大であるから、この戦略は有利である。

私の注:
この方法は二つの封筒問題のランダマイズドスイッチング戦略の中で最もポピュラーなものだと思います。 EXCEL でシミュレーションするのも楽です。

この章を書き直すとしたら

上記の二種類の戦略は「封筒の金額の確率分布によらず、どんなに金額が大きかろうと、あるいは小さかかろうと、選んだ封筒の金額が大きいほど交換する確率を減らす戦略」としてまとめることができます。
そのような戦略が有利であることの証明と、戦略の具体例に分けて書き直すと分かりやすいと思います。

参考文献には下記の古典的な文献をあげます。
McDonnell, M. D., & Abbott, D. (2009, August).は参考文献として適当でないように感じます。内容が難しいのでよくわかりませんが、むしろ適応型戦略の文献に相応しいように思えるからです。

2019年12月29日の大削除

新しくできた章

表題は "Conditional switching" となっていて、"Randomized switching" や "Randomized solutions" と紛らわしいのですが、章の中身(下記)を読んでみると全く別物のようです。
二つの封筒問題の拡張として、封筒を交換するかどうか決める前に中身を見ることができるケースを考えましょう。 このような "conditional switching" 問題の場合、封筒の確率分布によっては、常に交換しない戦略より多くを得ることが、しばしば可能です。
ランダマイズの効果にまったく言及していないことが大きな特徴です。そして "conditional switching" とは単に「開けてから交換型」の二つの封筒問題を意味しているようです。
そして、「封筒の確率分布によっては」という言い回しから、"randomized switching" から完全にかけ離れていることがわかります。

入れ替えの根拠

2019年12月29日に大削除を行った編集者は、編集の理由として "trim per WP:UNDUE" と書いています。

英語販 Wikipedia の "Wikipedia:Neutral point of view" というページの ”2 Achieving neutrality / 2.3 Due and undue weight" という章を読んで 「特定の考えを偏重したり無視したりすること」を戒める内容だと、私は理解しました。 

どうやら "trim per WP UNDUE" とは「大事な考えを無視している内容の削除」という意味かも知れません。彼が理解する "randomized switching" について書かれていないので "Due and undue weight" の基準違反と思って "Randomized solutions" の内容をごっそり削除したのかも知れません。

参考文献

トップページに戻る