塩沢由典>複雑系>モンティ・ホールの問題

『バタフライ・エコノミクス』113ページ監修者注への補注

モンティ・ホールの問題をどう考えるか

ポール・オームロッド『バタフライ・エコノミクス』(塩沢由典監修・北沢格訳、早川書房、2001年9月30日発行)へ私のつけた「監修者注」に、解説の誤りがありました。すでに数人の読者からご指摘があります。わたしの誤解を含め、ここにより詳しい説明をつけておきます。



モンティ・ホールの問題

モンティ・ホールの問題とは、テレビのバライエティ番組での次の問題をいう。

回答者である番組参加者は、3つの扉の一つを選ぶ。その背後には、当たりである商品とはずれである、たとえばアヒルのおもちゃが隠されている。

回答者が扉Aを選んだ。モンティは、それを伏せたまま、第二の扉、たとえば扉Cを開く。そこには、アヒルのおもちゃがあった。そこで、モンティは回答者に、もう一度、選択し直すことを提案する。回答者は、扉Bに選択し直すことが有利であるか。

わたしの注

扉Cを開ける前の当たりの確率は、A、B、Cともに1/3、扉Cを開けて、それがはずれであったときのAとBにあたりのある確率は、ともに1/2である。したがって、扉Aから扉Bへと選択を変える合理的理由はない。

標準的回答

モンティが以下の数学解説のルール1と2とを正確に守っている(どちらを選ぶか不確定の場合にx=1/2で行動している)場合、扉Bに商品の隠されている確率は2/3、扉Aの隠されている確率1/3となる(その理由は、以下の数学解説を参照)。したがって、モンティのこのような行動を前提すれば、回答者は扉Aから扉Bへと選択し直すのが有利である。

わたしの注の誤りとその理由

 扉Cを開けて、それがはずれであったとき、他の扉に当たりのある確率は、モンティがどのようなルールで行動しているかに依存する。モンティが3つの扉をランダムに(確率1/3ずつで)選んだ結果、扉Cが選ばれ、それがはずれであった場合、扉A、Bの当たりの確率はそれぞれ1/2となり、わたしの注が正しくなる。

 しかし、通常の解説に書かれているように、もしモンティが以下のルール1と2とを守って行動している場合には、扉Aの確率は1/3、扉Bの確率は2/3となる。

 オームロッドの説明には、この点の記述がなく、わたしはあまり深く考えずにランダムに選んだ結果の場合を想定してしまった。しかし、オームロッドがまったく別の説明をしている以上、その理由をきちんとかれの依拠した文献にまで遡って検討すべきであった。これがわたしが反省すべき点である。

謝辞

 『バタフライ・エコノミクス』出版後、はこだて未来大学の川越敏司氏より、この問題が「モンティ・ホールの問題」として有名な事例であること、わたしの解説は誤りであるとの指摘を受けた。また、『バタフライ・エコノミクス』の複数の読者からも、同様の指摘のはがき・メールをいただいた。  指摘を受けて、いくつかの文献によって検討してみた。わたしの思い違い・検討不足は否めない。ご指摘いただいた方方に感謝する。

注意すべき点

 通常の解説にも、不十分なところがある。それは、モンティがどのようなルール(確率的選択を含む)を採用しているかによって、事後的確率の評価が変化するということへの言及がほとんど見られないことである。ルール自体への言及はときにあるが、そのルールが唯一のものであるかに説明されているものが多い。しかし、モンティの取りうるルールは、無限にある。そのルールが違えば、事後(扉Cを開けたあと)に推定さるべき各扉の当たりの確率に一律ではない。

 たとえば、以下の数学解説にあるように、扉Aが当たりであるとき、それを開かずに扉Bか、Cを開くとき、モンティが扉Bと扉Cとをどのような確率で開けるかによって、扉Cを開けて、それがはずれであったとき、扉Aが当たりである確率には違いが生じる。

 結論として強調すべきことは以下の点である。

☆司会者がどのようなルールに従って行動しているかが重要である。その想定が変われば、事後確率の推定値も異なる。☆



数学解説

状況設定

参加者(回答者)は扉Aを選んだ。

以下では、次の記号を使う。
D:司会者がドアCを選び、はずれる事象
A:扉Aが当たりである事象
B:扉Bが当たりである事象
C:扉Cが当たりである事象

一番大切なことは、司会者がどのようなルールに従って行動しているかである。

 司会者が従うルールは、決定論的なものとはかぎらない。二つの扉のどちらかを選ばねばならないとき、「任意に選ぶ」ないし「無作為に選ぶ」というルールは、通常は二つの扉をランダムに選ぶ、すなわち前回の選択とは独立に、一方の扉を確率1/2で選ぶことを意味する(これを以下では、正規のルールと呼ぶことにする)。しかし、このようなものとは別に、一方の扉を選ぶ確率が x (0 =< x =< 1)となるルールも可能であるし、前回の選択に影響されるというルールもありうる。このように、司会者が従うルールは、無限のバライエティが考えられる。以下では、比較的単純で代表的なルールを想定し、そのもとでの事後確率を求める。


場合T.司会者がA、B、Cの扉をランダムに開ける場合

p(A)=p(B)=p(C)=1/3.

この場合、モンティが偶然、最初にあたりの扉を開けてしまう確率が1/3ある。

設定の状況では扉Cを開き、それがはずれであった。

扉A、B、Cがあたりであるとき、事象Dが生ずる確率を求める。


まず、扉Aあるいは扉Bがあたりであるとき、モンティが扉Cを選ぶ確率は
p(D|A)=p(D|B)=1/3.

次に扉Cが当たりであるとき、事象Dが起こることはあり得ないから、
p(D|C)=0.

これより、ベイズの定理を使って、
p(A|D)=p(A)p(D|A)/ {p(A)p(D|A)+p(B)p(D|B)+p(C)p(D|C)}
=1/3・1/3 / {1/3・1/3+1/3・1/3+1/3・0}
= 1/9 / 2/9
= 1/2

 これより、司会者が三つの扉をランダムに開けているときには、扉Aも、扉Bも1/2の当たり確率を持つ。したがって、回答者が扉を取り替えても換えなくても、期待される確率は変わらない。

 これがわたしが監修者注で想定していた事態である。しかし、モンティがこのように均等の確率に従って扉を選んでいないとすれば、この結果だけが正しいとは言えず、わたしの解説は正しくない(好意的に見ても、すくなくとも不十分である)。


場合U.司会者が特定のルールにをもって扉を開いているとき


通常の解説では、モンティが以下の二つのルールに従って扉を選んでいるとされている(オームロッドには、この点の明示的な説明はない)。

ルール1 司会者は、回答者の選んだ扉を最初には開けない。
ルール2 司会者は、あたりのある扉を最初には開けない。

 二つのルール双方を守る場合と、一方は守るが、他方は守らない場合がありうる。どのような組み合わせを取るかにより、以下の3つの場合が生ずる。二つのルールのどちらも守らない場合は、例示されていない。

 ルール1およびルール2は、厳密には確定したルールではない。たとえば、ルール1とルール2の双方を守るとしても、扉Aが当たりであるとき、扉Bと扉Cのどちらを選ぶかにはさまざまな決め方がありうる。以下では、扉Cを確率 x で選ぶというルールを取り上げているが、これ以外のもっと複雑なルールもありうる。すなわち、二つのルールは、この表現では、それぞれが多数のルールの総称にすぎない。


場合U−1. ルール1と2とを守る場合(1)

・扉Aが当たり 
このときの司会者の選択肢 BかC
その内、Cを確率xで開くとする。
p(D|A)=x.
・扉Bが当たり 
このときの司会者の選択肢 C のみ
p(D|B)=1.
・扉Cが当たり 
このときの司会者の選択肢 B のみ
p(D|C)=0.

これより
p(A|D)=p(A)p(D|A)/ {p(A)p(D|A)+p(B)p(D|B)+p(C)p(D|C)}
=1/3・x / {1/3・x+1/3・1+1/3・0}
= x/9 / (1+x)/9
= x/(1+x)

注1
p(A|D)は、x の大きさによって、0から1/2まで変化する。
とくに
x=1/2のとき、p(A|D)=1/3.
x=0のとき、p(A|D)=0.
x=1のとき、p(A|D)=1/2.
x=1というのは、扉Aが当たりであるとき、モンティがつねに扉Cを選ぶ強い癖をもっている場合である。このとき、扉Cを開けて外れだったとすれば、扉Aから扉Bに選択を変える理由はない。正規の場合には、通常の解説のごとく
p(A|D)=1/3 かつ p(B|D)=1/3

もし、回答者が司会者の扉Cを開く確率xを知っていれば、扉Aの当たる確率を計算できる。それを推定することができない場合は、以下の考察が役立つ。


場合U−2. ルール1と2とを守る場合(2)

・扉Aが当たり 
このときの司会者の選択肢 BかC
その内、Cを確率xで開くとする。
p(A|D)=x/(1+x)
・扉Aが当たりであるとき、司会者がある確率 x で扉B、Cを開くということは知れているが、どちらの扉をより多く開く癖があるか不明の場合。

実際には、ある確率で扉Cが選ばれているが、回答者にはどちらに偏るか分からないことがありうる。この場合にも、推測の方法はある。

扉Bに傾く確率と扉Cに偏る確率をそれぞれ1/2ずつとする。このとき、場合U−1での考察を用いれば、

p(A|D)=1/2・x/(1+x) + 1/2・((1-x)/1+(1-x))
=1/2{x/(1+x) + (1-x)/(2-x)}

この関数は、xが0から1までを動くとき、1/2で最大値1/3を取る。
最小値はxが0か1のときで、1/4。

この場合、BとCのどちらかが選ばれる確率 x が決まっていると知るだけで、p(A|D)の最大値は1/3、最悪では1/4となる。このような状況では、扉Bに乗り換えることが有利ということになる。


場合U−3. ルール1を守るが、ルール2は守らない場合

・扉Aが当たり 
このときの司会者の選択肢 BかC
その内、Cを確率xで開くとする。
p(D|A)=x.
・扉Bが当たり 
このときの司会者の選択肢 BかC
このとき、当たりを開いてしまう確率u
p(D|B)=1-u.
・扉Cが当たり 
このときの司会者の選択肢 BかC
このとき、当たりを開いてしまう確率u
(B、Cが対称的な場合)
p(D|C)=0.

これより
p(A|D)=p(A)p(D|A)/ {p(A)p(D|A)+p(B)p(D|B)+p(C)p(D|C)}
=1/3・x / {1/3・x+1/3・(1-u)+1/3・0}
= x/3 / { (x+1-u)/3 }
= x/(x+(1-u))
このとき、p(A|D)=x/(x+(1-u))>=1/2という可能性もある。


場合U−4. ルール2を守るが、ルール1は守らない場合

・Aが当たりのとき、Cを選ぶ確率y
・Bが当たりのとき、Cを選ぶ確率z
・Cが当たりのとき、Cを選ぶ確率0

p(A|D)=p(A)p(D|A)/ {p(A)p(D|A)+p(B)p(D|B)+p(C)p(D|C)}
=(1/3)y/{(1/3)y+(1/3)z+(1/3)・0}
=y/(y+z)

たとえば、y=1/2のとき
p(A|D)=(1/2)/{(1/2)+z}=1/(3-b)
これは、1/3から1/2の値を取る。
ただし、bは当たりのBを開いてしまう確率(=1-z)。

しかし、p(A|D)=y/(y+z)>=1/2という可能性もある。





ホームへ帰る   ページ・トップ