Notice
Recent Posts
Recent Comments
Link
관리 메뉴

뛰는 놈 위에 나는 공대생

[확률및통계] 몬티 홀 문제와 문제 확장(문이 N개일 때) 본문

수학 Mathematics/확률및통계 Probability & Statistics

[확률및통계] 몬티 홀 문제와 문제 확장(문이 N개일 때)

보통의공대생 2021. 2. 28. 19:56

조건부확률과 베이즈 정리에 대해 설명할 때 대표적으로 등장하는 예시입니다.

 

몬티 홀 문제는 몬티 홀이라는 호스트가 진행하는 tv쇼가 배경입니다.

 

출처 : 위키피디아

문이 총 3개가 있을 때 3개의 문 중 하나의 뒤에는 고급 차가 있고 나머지 문 뒤에는 염소가 있습니다.

사회자는 자동차가 어떤 문 뒤에 있는지 알고 있고, 참가자에게 문 하나를 선택하게 합니다.

 

참가자가 문을 하나 선택한 뒤, 사회자는 참가자가 선택하지 않은 문 중 하나를 열어서 염소가 있음을 보여줍니다. 그리고 문을 바꿀 기회를 줍니다.

 

참가자는 문을 바꾸는 것이 더 유리할까요? 아니면 문을 그대로 유지하는 것이 유리할까요?

 

단순하게 생각하면 바꾸든, 바꾸지 않든 확률의 차이가 없을 것 같지만 베이즈 정리를 통해 계산해보면 차이가 존재합니다.

 


Background

 

1. 조건부확률 Conditional probability

$P(B|A)=\frac{P(A\cap B)}{P(A)}$

 

2. Bayes' theorem (Bayes' rule)

 

$P(B_{k}|A)=\frac{P(B_{k}\cap A)}{P(A)}=\frac{P(A|B_{k})P(B_{k})}{ \Sigma_{i=1}^{n} P(A|B_{i}) P(B_{i}) }$

 

간단하게 나타내면 $P(B|A)=\frac{P(B)P(A|B)}{P(A)}$

 

$P(B|A)\text{ : Posterior probability}$ 사후 확률

$P(A|B)\text{ : Likelihood}$ 우도

$P(B)\text{ : Prior probability}$ 사전 확률

$P(A)\text{ : Normalizing constant}$ 한정 상수

 

베이즈 정리는 토마스 베이즈라는 1700년대 영국의 장로교 목사가 자신의 신념(신의 존재)을 주장하기 위해 경험적 증거들을 바탕으로 확률을 업데이트하는 것에서 시작했다고 합니다. 

(출처 : brunch.co.kr/@hvnpoet/106)

 

위의 베이즈 정리는 수식적으로만 생각하면 당연해보이지만,

B를 가설이라고 하고, A를 경험적 증거라고 하겠습니다. A라는 결과가 나왔을 때 가설 B가 맞을 확률을 구하고 싶은 것입니다. 그게 바로 $P(B|A)$를 구하는 문제입니다.

 

$P(B)$는 A에 관계없이 들어맞을 확률이고, $P(A|B)$는 가설 B일 때 A가 발생할 확률입니다. $P(A)$는 가설과 관계없이 A가 발생할 확률입니다.

 

가설이 맞을 때 경험적 증거가 나올 확률을 역으로 이용해, 경험적 증거를 통해 가설이 맞을 확률을 구할 수 있다는 점에서 베이즈 정리는 중요합니다.

 


이제 다시 몬티 홀 문제로 넘어오겠습니다.

 

만약 참가자가 A,B,C 문 중에서 A문을 골랐다고 해보겠습니다.

몬티 홀 씨가 B문을 열었다고 할 때 참가자는 문을 바꾸는 게 유리할까요?

자동차가 C문에 있다면 바꾸는 것이 유리하며, 자동차가 A문에 있다면 바꾸지 않는 것이 유리합니다.

 

따라서 

가설 : "A(또는 B,C)문에 자동차가 있다"라고 설정하고 결과가 "몬티 홀 씨가 B문을 열었을 때", 어떤 가설의 확률이 높은지 생각해보면 됩니다.

 

가설 Notation A B C
사전 확률 (Prior probability) P(가설) 1/3 1/3 1/3
우도 (Likelihood) P(결과|가설) 1/2 0 1
사전 확률 x 우도 P(가설)P(결과|가설) 1/6 0 1/3
사후 확률 P(가설|결과) 1/3 0 2/3

 

P(가설) : A,B,C 문에 자동차가 있을 확률은 무작위로 자동차를 배치했다면 각각의 확률은 $\frac{1}{3}$로 같습니다.

P(결과|가설) : 만약 A문에 자동차가 있더라면 몬티 홀 씨가 B문을 열 확률은 $\frac{1}{2}$입니다. 참가자는 A문을 골랐으므로, A문을 제외하고 B,C문 중 아무거나 열어도 괜찮기 때문입니다.

 

P(가설|결과)$\propto $P(가설)P(결과|가설)라는 성질을 이용해 P(가설l결과)를 구할 수 있습니다.

 

이 결과를 통해 A문보다 C문에 자동차가 있을 확률이 높다는 것을 알 수 있습니다. 참가자는 자신의 선택을 바꾸는 것이 더 유리합니다.


문제의 확장 (문이 N개라면?)

 

몬티 홀 문제는 워낙 다들 익숙해서 "선택을 바꾸는 것이 더 유리하다"는 점을 잘 알고 있습니다.

 

만약 문이 3개가 아니면 4개, 5개... 이면 어떨까요?

 

이번에는 위와 같이 참가자가 A문을 선택하고 몬티 홀 씨가 B문을 연 다음에 다른 문(C,D)으로 바꿀 수 있다고 해보겠습니다.

 

가설 : 자동차가 A(,B,C,D)문에 있다.

가설 Notation A B C D
사전 확률 (Prior probability) P(가설) 1/4 1/4 1/4 1/4
우도 (Likelihood) P(결과|가설) 1/3 0 1/2 1/2
사전 확률 x 우도 P(가설)P(결과|가설) 1/12 0 1/8 1/8
사후 확률 P(가설|결과) 1/4 0 3/8 3/8

 

이번에는 C문에 자동차가 있을 때, 몬티 홀 씨가 B문을 열 확률은 $\frac{1}{2}$가 됩니다. B문 아니면 D문을 열면 되니까요.

A문에 자동차가 있을 때, 몬티 홀 씨가 B문을 열 확률은 $\frac{1}{3}$이 됩니다. B,C,D문 중 하나를 열면 되기 때문입니다.

 

이제 문제를 더 확장해보겠습니다.

 

 

문이 n개가 있다면,

가설 Notation A B C D ...
사전 확률 (Prior probability) P(가설) 1/n 1/n 1/n 1/n  
우도 (Likelihood) P(결과|가설) 1/(n-1) 0 1/(n-2) 1/(n-2)  
사전 확률 x 우도 P(가설)P(결과|가설) 1/n(n-1) 0 1/n(n-2) 1/n(n-2)  
사후 확률 P(가설|결과) 1/(n-1) 0 (n-1)/n(n-2) (n-1)/n(n-2)  

 

A문에 있다는 가설의 경우

 

$\frac{\frac{1}{n(n-1)}}{\frac{1}{n(n-1)}+\frac{1}{n(n-2)}\times (n-2)}$ 식을 통해 P(가설|결과)를 구할 수 있습니다.

위아래에 $n(n-1)$를 곱해주면

 

$\frac{1}{n-1}$입니다.

 

B문을 제외한 나머지 문에 있다는 가설의 경우

$\frac{\frac{1}{n(n-2)}}{\frac{1}{n(n-1)}+\frac{1}{n(n-2)}\times (n-2)}$ 식을 통해 구할 수 있습니다.

 

$\frac{(n-1)}{n(n-2)}$입니다.

 

이 두 확률이 크기를 비교해면

n에 관계 없이

$\frac{1}{n-1}<\frac{(n-1)}{n(n-2)}$ 이 식이 성립합니다.

 

풀이 : 통분해서 비교

 

따라서 항상 참가자가 선택한 문이 확률이 더 낮기 때문에 선택을 바꾸는 편이 낫습니다.

 

 

 

 

Comments