トップページに戻る
しかし、私たちは全体の傾向から各グループの傾向もそうだと予測したり、各グループの共通の傾向から全体の傾向もそうだと予測しがちなため、とても不思議です。
そしてこのような統計データの性質をシンプソンのパラドックスと呼ぶそうです。
これは医療など現実のデータを解釈するときに実際に起きる現象なので、気を付けなければなりません。
つまりシンプソンのパラドックスの発見者は Simpson より 50年前の Pearson 達か、あるいはそれ以前の人だとわかります。
(*1) 集計表を見ると女子の受験は合格率の低い学科に集まっています。
(*2) Wikipedia の記事の図表から集計表を起こして見ると、次のようなことがわかりました。
2015/06/28 21:22:04
初版 2015/06/28
シンプソンのパラドックス
シンプソンのパラドックスの錯覚現象とモンティ・ホール問題の錯覚現象の間に類似性があるか知りたくて調べてみました。シンプソンのパラドックスの概要
統計データをグループ分けしたときに各グループで共通な傾向があっても、全体ではそのような傾向がないということがあり得ます。しかし、私たちは全体の傾向から各グループの傾向もそうだと予測したり、各グループの共通の傾向から全体の傾向もそうだと予測しがちなため、とても不思議です。
そしてこのような統計データの性質をシンプソンのパラドックスと呼ぶそうです。
これは医療など現実のデータを解釈するときに実際に起きる現象なので、気を付けなければなりません。
発見者
Wikipedia (英語版) の記事 "Simpson's paradox" (11:33, 11 June 2015の版) によると、下記が初期の発表だそうです。- Pearson, Karl; Lee, Alice; Bramley-Moore, Lesley (1899).
- G. U. Yule (1903). "Notes on the Theory of Association of Attributes in Statistics".
- Simpson, Edward H. (1951).
つまりシンプソンのパラドックスの発見者は Simpson より 50年前の Pearson 達か、あるいはそれ以前の人だとわかります。
Wikipediaで調べた例
Wikipedia (英語版) の記事 "Simpson's paradox" (11:33, 11 June 2015の版) にたくさん載っている例の一部です。例 | 実例 | 内容 |
---|---|---|
大学院入学合格率の性差 | 1973年秋のカリフォルニア大学バークレイ校の大学院入学 |
全体では男子の合格率の方が女子より大きいが、学科別に計算すると、いずれの学科においても男女差がない。 (*1) |
腎臓結石の医療効果と結石の大小 | 1986年に発表された論文の事例 |
大きな結石にも小さな結石にも処置Aの成績(効能のあった率)が処置Bに優るが、結石の大小で分けない場合には、処置Bが優る。 (*2) |
(*1) 集計表を見ると女子の受験は合格率の低い学科に集まっています。
(*2) Wikipedia の記事の図表から集計表を起こして見ると、次のようなことがわかりました。
- 小結石の人で処置Aを受ける人は少ない
- 大結石の人で処置Bを受ける人は少ない
- 処置Bの場合、小結石の成績と大結石の成績が近い
放送大学の講義に出て来た肉まんとお茶バージョン
2015年6月のテレビの放送大学でシンプソンのパラドックスを知りました。そのときの題材が 「肉まんとお茶」 だったので特に興味(食欲?)をそそられましたが、内容は覚えていないので、ネットで調べたところ、あるブログで紹介されていて、その内容は次のようなものでした。- 肉まんとお茶の売り上げデータを、肉まんを買ったか否か、お茶を買ったか否か、購入者が若者か実年かで分ける
- 若者と実年、および若者と実年の合算で肉まん購入者のお茶購入割合と肉まん非購入者のお茶購入割合を計算する
- その結果、若者、実年ともに肉まん購入者のお茶購入割合が肉まん非購入者のお茶購入割合を上回ったが、若者と実年の合算では肉まん購入者のお茶購入割合が肉まん非購入者のお茶購入割合を下回った
- 実年は来店頻度が若者より高い
- 実年は肉まんを購入する率が低い
- 実年はお茶を購入する率がお茶を購入しない率に迫っている
モンティ・ホール問題の確率の錯覚現象と似ているか
似ていない点
- モンティ・ホール問題では「確率」が問題になっている。
- シンプソンのパラドックスでは「確率の比較結果」や、「相関係数」が問題になっている。
似ている点
私はモンティ・ホール問題の確率の錯覚現象の原因の一つとして、「確率」 を 「率」 としてとらえず、 「量」 あるいは 「保存量」 としてとらえてしまう 「客観確率幻想」 というものを考えています。もしも 「確率の比較結果」 を 「率の比」 としてとらえず、 「量」 あるいは 「保存量」 としてとらえてしまう 「客観傾向幻想」 というものがあるとしたら、モンティ・ホール問題とシンプソンのパラドックスの間に心理学的な共通原理があることになります。
参考文献
-
Pearson, Karl; Lee, Alice; Bramley-Moore, Lesley (1899).
Genetic (reproductive) selection: Inheritance of fertility in man, and of fecundity in thoroughbred racehorses.
Philosophical Transactions of the Royal Society A 192: 257–330. doi:10.1098/rsta.1899.0006.
-
G. U. Yule (1903). "Notes on the Theory of Association of Attributes in Statistics".
Biometrika 2 (2): 121–134. doi:10.1093/biomet/2.2.121.
-
Simpson, Edward H. (1951).
The Interpretation of Interaction in Contingency Tables.
Journal of the Royal Statistical Society, Series B 13: 238–241.
トップページに戻る