トップページに戻る
数学では確率を次のように定義している。
何かの集合を標本空間として、そのべき集合の一部で加算加法族になっているものを事象の集合とし、事象の集合に確率測度を与え、・・・・・・、(難しいので以下省略)
もっと直感的な定義もある。
確率変数の値域のデカルト積のべき集合の・・・・・、(難しいので以下省略)
2次元の格子図を使えば、このような数学の確率の定義に添いながら、条件付確率もしくは事後確率の説明ができるかも知れないという期待がある。格子図の交点が最も細かい事象、すなわち素事象 (prime events) に対応するので、仮説事象と証拠事象の関係がよくわかるのではないか、という期待もある。
例によって、挑戦者が選ぶ扉を扉1に限定して考える。
「ホストが開けた扉」という確率変数の値域 = [開扉1,開扉2, 開扉3]
2013/08/18 14:36:39
素事象を格子状に配置すれば標本空間がよくわかる
2013/05/28 に加筆しました。数学では確率を次のように定義している。
何かの集合を標本空間として、そのべき集合の一部で加算加法族になっているものを事象の集合とし、事象の集合に確率測度を与え、・・・・・・、(難しいので以下省略)
もっと直感的な定義もある。
確率変数の値域のデカルト積のべき集合の・・・・・、(難しいので以下省略)
2次元の格子図を使えば、このような数学の確率の定義に添いながら、条件付確率もしくは事後確率の説明ができるかも知れないという期待がある。格子図の交点が最も細かい事象、すなわち素事象 (prime events) に対応するので、仮説事象と証拠事象の関係がよくわかるのではないか、という期待もある。
モンティ・ホール問題に応用してみる
モンティ・ホール問題を例に試してみる。例によって、挑戦者が選ぶ扉を扉1に限定して考える。
ステップ1 確率変数の値域を確認する
「当たり扉の配置」という確率変数の値域 = [当扉1,当扉2, 当扉3]「ホストが開けた扉」という確率変数の値域 = [開扉1,開扉2, 開扉3]
ステップ2 確率変数の値域の直積として2次元のテーブルを書く
当扉1 | 当扉2 | 当扉3 | |
開扉1 | 当扉1, 開扉1 | 当扉2, 開扉1 | 当扉3, 開扉1 |
開扉2 | 当扉1, 開扉2 | 当扉2, 開扉2 | 当扉3, 開扉2 |
開扉3 | 当扉1, 開扉3 | 当扉2, 開扉3 | 当扉3, 開扉3 |
ステップ3 テーブルの各マス(素事象)に確率を付与するための手がかりを確認する
当たり扉の配置は等確率であるので、
p(当扉1, 開扉1) + p(当扉1, 開扉2) + p(当扉1, 開扉3) = 1/3
p(当扉2, 開扉1) + p(当扉2, 開扉2) + p(当扉2, 開扉3) = 1/3
p(当扉3, 開扉1) + p(当扉3, 開扉2) + p(当扉3, 開扉3) = 1/3
ホストは挑戦者が選んだ扉を開けないので、
(2013/07/04 に訂正しました)
ホストは当たり扉を開けないので
ホストが開ける扉に偏りがないので、
p(当扉1, 開扉2) = p(当扉1, 開扉3)
確率の総和は1なので、
p(当扉1, 開扉1) + p(当扉1, 開扉2) + p(当扉1, 開扉3) +
p(当扉2, 開扉1) + p(当扉2, 開扉2) + p(当扉2, 開扉3) +
p(当扉3, 開扉1) + p(当扉3, 開扉2) + p(当扉3, 開扉3) = 1
ホストは挑戦者が選んだ扉を開けないので、
(2013/07/04 に訂正しました)
p(当扉1, 開扉1) = 0
p(当扉2, 開扉1) = 0
p(当扉3, 開扉1) = 0
p(当扉2, 開扉1) = 0
p(当扉3, 開扉1) = 0
ホストは当たり扉を開けないので
p(当扉1, 開扉1) = 0
p(当扉2, 開扉2) = 0
p(当扉3, 開扉3) = 0
p(当扉2, 開扉2) = 0
p(当扉3, 開扉3) = 0
ホストが開ける扉に偏りがないので、
確率の総和は1なので、
ステップ4 手がかりを頼りに、テーブルの各マス(素事象)の確率を求める
当扉1 | 当扉2 | 当扉3 | |
開扉1 | 当扉1, 開扉1 0 | 当扉2, 開扉1 0 | 当扉3, 開扉1 0 |
開扉2 | 当扉1, 開扉2 1/6 | 当扉2, 開扉2 0 | 当扉3, 開扉2 1/3 |
開扉3 | 当扉1, 開扉3 1/6 | 当扉2, 開扉3 1/3 | 当扉3, 開扉3 0 |
ステップ5 出来上がったテーブルを利用して条件付確率や事後確率を計算する
ホストが扉3を開いたという特定的な証拠事象に対する条件付確率を求める場合
ホストがハズレの扉3を開いたという証拠事象の範囲だけ切り出す
確率の比率を変えずに、総和が1になるように調整する
扉1から switchして賞品を得るということは、扉2が当たりであるということである。
図によると、その確率は 2/3 である。
当扉1 | 当扉2 | 当扉3 | |
開扉3 | 当扉1, 開扉3 1/6 | 当扉2, 開扉3 1/3 | 当扉3, 開扉3 0 |
確率の比率を変えずに、総和が1になるように調整する
当扉1 | 当扉2 | 当扉3 | |
開扉3 | 当扉1, 開扉3 1/3 | 当扉2, 開扉3 2/3 | 当扉3, 開扉3 0 |
扉1から switchして賞品を得るということは、扉2が当たりであるということである。
図によると、その確率は 2/3 である。
ホストが扉2 または扉3 を開いたという不特定な証拠事象に対する条件付確率を求める場合
ホストがハズレの扉2 または扉3 を開いたという証拠事象の範囲だけ切り出す
この段階ですでに確率の総和が1になっている。
扉1から switchして賞品を得るということは、扉2 または扉3 が当たりであるということである。
図によると、その確率は 2/3 である。
当扉1 | 当扉2 | 当扉3 | |
開扉2 | 当扉1, 開扉2 1/6 | 当扉2, 開扉2 0 | 当扉3, 開扉2 1/3 |
開扉3 | 当扉1, 開扉3 1/6 | 当扉2, 開扉3 1/3 | 当扉3, 開扉3 0 |
この段階ですでに確率の総和が1になっている。
扉1から switchして賞品を得るということは、扉2 または扉3 が当たりであるということである。
図によると、その確率は 2/3 である。
結論
上記のように素事象を2次元に配列した図表を使う方法には、次のような利点がある。- 同一の図を使って、証拠事象が特定的な場合と、不特定な場合の両方の確率が計算できる。
- 決定木などの階層的標本空間分析手法や、ベイズ推定などの条件付確率の公式を使わなくても確率を計算できるので、 より基本的な理解が可能になる。
論文やインターネットでの事例
上記のような図表を使ってモンティ・ホール問題を考える人は多くないが、論文やインターネット上では次のような例がある。Carlton, Matthew (2005). では次のような表を "sample space diagram" と称して使っている。
(1,3)1/6 (2,3)1/3 (1,2)1/6 (3,2)1/3この表の括弧の中の数字は、左が当たり扉の番号で、右がホストが開けた扉の番号である。
よく見るとマトリックスになっていないことや並び順が変なことに気が付いた。マトリックスにするのであれば、こうなる。
(1,2)1/6 (2,2)0 (3,2)1/3 (1,3)1/6 (2,3)1/3 (3,3)0
Rossman, A. and Short, T. (1995). では2次元の表を "two-way table" と称して使っている。 確率の表でなく、度数の表であることが特徴である。
そのやり方を真似てモンティ・ホール問題に応用してみたら次のようになった。
| Prize Door| | #1 | #2 | Row Total -------------------+-----+-----+---------- Host opens Door #2 | 10 | 20 | 30 #3 | 10 | 20 | 30 -------------------+-----+-----+---------- Column Total | 20 | 40 | 60
Wikipedia(日本語版)の 「モンティ・ホール問題」 の記事の 「計算」 の項で次のような表が使われている。(2012年4月22日 (日) 19:42.の版)
モンティが開けるドア | 合計 | ||||
A(プレイ ヤー) |
B | C | |||
景品が あるドア |
A | 0 | 1/6 | 1/6 | 1/3 |
B | 0 | 0 | 1/3 | 1/3 | |
C | 0 | 1/3 | 0 | 1/3 | |
合計 | 0 | 1/2 | 1/2 | 1 |
TETRAさんのブログの 「モンティ・ホール問題(確率) | TETRA'S MATH」 というページの 「モンティ・ホール問題・03」 の段に同様の図が使われている。
こういった図表の名称
このような図表を数学用語では何と呼んでいるのか調べて見たが、適当な言葉がみつからなかった。Rossman, A. and Short, T. (1995). の "two-way table" (日本語で「二元表」というらしい) は統計データを分析する表であった。
Carlton, Matthew (2005). には "contingency table" (「分割表」) というものも出てくるが、これも統計データを分析する表であった。
統計数学の教科書を調べたら 「集計表」 や 「クロス集計表」 という表が出てきたが、これらも統計データを分析する表であった。
確率の表についてインターネットで英語で検索したら、 "probability daiagrams" というものが出て来たので日本語の 「確率表」で検索したらギャンブル関連のページが出て来た。
結局、 「標本空間分割表」 や 「場合分け表」 とでも言うしかないのだろう。
私はひそかに、Wikipedia(日本語版)の「モンティ・ホール問題」の記事の 2003年7月14日 (月) 15:06 の版に、図表と解説文を投稿した Mizusumashi さんにちなんで、 「ミズスマシ法」 と呼んでいる。
参考文献
-
Carlton, Matthew (2005).
Pedigrees, Prizes, and Prisoners: The Misuse of Conditional Probability.
Journal of Statistics Education [online] 13 (2).
-
Rossman, A. and Short, T. (1995).
Conditional Probability and Education Reform: Are They Compatible?
Journal of Statistics Education [Online] 3 (2)
トップページに戻る