조건부확률과 베이즈 정리에 대해 설명할 때 대표적으로 등장하는 예시입니다.
몬티 홀 문제는 몬티 홀이라는 호스트가 진행하는 tv쇼가 배경입니다.
문이 총 3개가 있을 때 3개의 문 중 하나의 뒤에는 고급 차가 있고 나머지 문 뒤에는 염소가 있습니다.
사회자는 자동차가 어떤 문 뒤에 있는지 알고 있고, 참가자에게 문 하나를 선택하게 합니다.
참가자가 문을 하나 선택한 뒤, 사회자는 참가자가 선택하지 않은 문 중 하나를 열어서 염소가 있음을 보여줍니다. 그리고 문을 바꿀 기회를 줍니다.
참가자는 문을 바꾸는 것이 더 유리할까요? 아니면 문을 그대로 유지하는 것이 유리할까요?
단순하게 생각하면 바꾸든, 바꾸지 않든 확률의 차이가 없을 것 같지만 베이즈 정리를 통해 계산해보면 차이가 존재합니다.
Background
1. 조건부확률 Conditional probability
$P(B|A)=\frac{P(A\cap B)}{P(A)}$
2. Bayes' theorem (Bayes' rule)
$P(B_{k}|A)=\frac{P(B_{k}\cap A)}{P(A)}=\frac{P(A|B_{k})P(B_{k})}{ \Sigma_{i=1}^{n} P(A|B_{i}) P(B_{i}) }$
간단하게 나타내면 $P(B|A)=\frac{P(B)P(A|B)}{P(A)}$
$P(B|A)\text{ : Posterior probability}$ 사후 확률
$P(A|B)\text{ : Likelihood}$ 우도
$P(B)\text{ : Prior probability}$ 사전 확률
$P(A)\text{ : Normalizing constant}$ 한정 상수
베이즈 정리는 토마스 베이즈라는 1700년대 영국의 장로교 목사가 자신의 신념(신의 존재)을 주장하기 위해 경험적 증거들을 바탕으로 확률을 업데이트하는 것에서 시작했다고 합니다.
(출처 : brunch.co.kr/@hvnpoet/106)
위의 베이즈 정리는 수식적으로만 생각하면 당연해보이지만,
B를 가설이라고 하고, A를 경험적 증거라고 하겠습니다. A라는 결과가 나왔을 때 가설 B가 맞을 확률을 구하고 싶은 것입니다. 그게 바로 $P(B|A)$를 구하는 문제입니다.
$P(B)$는 A에 관계없이 들어맞을 확률이고, $P(A|B)$는 가설 B일 때 A가 발생할 확률입니다. $P(A)$는 가설과 관계없이 A가 발생할 확률입니다.
가설이 맞을 때 경험적 증거가 나올 확률을 역으로 이용해, 경험적 증거를 통해 가설이 맞을 확률을 구할 수 있다는 점에서 베이즈 정리는 중요합니다.
이제 다시 몬티 홀 문제로 넘어오겠습니다.
만약 참가자가 A,B,C 문 중에서 A문을 골랐다고 해보겠습니다.
몬티 홀 씨가 B문을 열었다고 할 때 참가자는 문을 바꾸는 게 유리할까요?
자동차가 C문에 있다면 바꾸는 것이 유리하며, 자동차가 A문에 있다면 바꾸지 않는 것이 유리합니다.
따라서
가설 : "A(또는 B,C)문에 자동차가 있다"라고 설정하고 결과가 "몬티 홀 씨가 B문을 열었을 때", 어떤 가설의 확률이 높은지 생각해보면 됩니다.
가설 | Notation | A | B | C |
사전 확률 (Prior probability) | P(가설) | 1/3 | 1/3 | 1/3 |
우도 (Likelihood) | P(결과|가설) | 1/2 | 0 | 1 |
사전 확률 x 우도 | P(가설)P(결과|가설) | 1/6 | 0 | 1/3 |
사후 확률 | P(가설|결과) | 1/3 | 0 | 2/3 |
P(가설) : A,B,C 문에 자동차가 있을 확률은 무작위로 자동차를 배치했다면 각각의 확률은 $\frac{1}{3}$로 같습니다.
P(결과|가설) : 만약 A문에 자동차가 있더라면 몬티 홀 씨가 B문을 열 확률은 $\frac{1}{2}$입니다. 참가자는 A문을 골랐으므로, A문을 제외하고 B,C문 중 아무거나 열어도 괜찮기 때문입니다.
P(가설|결과)$\propto $P(가설)P(결과|가설)라는 성질을 이용해 P(가설l결과)를 구할 수 있습니다.
이 결과를 통해 A문보다 C문에 자동차가 있을 확률이 높다는 것을 알 수 있습니다. 참가자는 자신의 선택을 바꾸는 것이 더 유리합니다.
문제의 확장 (문이 N개라면?)
몬티 홀 문제는 워낙 다들 익숙해서 "선택을 바꾸는 것이 더 유리하다"는 점을 잘 알고 있습니다.
만약 문이 3개가 아니면 4개, 5개... 이면 어떨까요?
이번에는 위와 같이 참가자가 A문을 선택하고 몬티 홀 씨가 B문을 연 다음에 다른 문(C,D)으로 바꿀 수 있다고 해보겠습니다.
가설 : 자동차가 A(,B,C,D)문에 있다.
가설 | Notation | A | B | C | D |
사전 확률 (Prior probability) | P(가설) | 1/4 | 1/4 | 1/4 | 1/4 |
우도 (Likelihood) | P(결과|가설) | 1/3 | 0 | 1/2 | 1/2 |
사전 확률 x 우도 | P(가설)P(결과|가설) | 1/12 | 0 | 1/8 | 1/8 |
사후 확률 | P(가설|결과) | 1/4 | 0 | 3/8 | 3/8 |
이번에는 C문에 자동차가 있을 때, 몬티 홀 씨가 B문을 열 확률은 $\frac{1}{2}$가 됩니다. B문 아니면 D문을 열면 되니까요.
A문에 자동차가 있을 때, 몬티 홀 씨가 B문을 열 확률은 $\frac{1}{3}$이 됩니다. B,C,D문 중 하나를 열면 되기 때문입니다.
이제 문제를 더 확장해보겠습니다.
문이 n개가 있다면,
가설 | Notation | A | B | C | D | ... |
사전 확률 (Prior probability) | P(가설) | 1/n | 1/n | 1/n | 1/n | |
우도 (Likelihood) | P(결과|가설) | 1/(n-1) | 0 | 1/(n-2) | 1/(n-2) | |
사전 확률 x 우도 | P(가설)P(결과|가설) | 1/n(n-1) | 0 | 1/n(n-2) | 1/n(n-2) | |
사후 확률 | P(가설|결과) | 1/(n-1) | 0 | (n-1)/n(n-2) | (n-1)/n(n-2) |
A문에 있다는 가설의 경우
$\frac{\frac{1}{n(n-1)}}{\frac{1}{n(n-1)}+\frac{1}{n(n-2)}\times (n-2)}$ 식을 통해 P(가설|결과)를 구할 수 있습니다.
위아래에 $n(n-1)$를 곱해주면
$\frac{1}{n-1}$입니다.
B문을 제외한 나머지 문에 있다는 가설의 경우
$\frac{\frac{1}{n(n-2)}}{\frac{1}{n(n-1)}+\frac{1}{n(n-2)}\times (n-2)}$ 식을 통해 구할 수 있습니다.
$\frac{(n-1)}{n(n-2)}$입니다.
이 두 확률이 크기를 비교해면
n에 관계 없이
$\frac{1}{n-1}<\frac{(n-1)}{n(n-2)}$ 이 식이 성립합니다.
풀이 : 통분해서 비교
따라서 항상 참가자가 선택한 문이 확률이 더 낮기 때문에 선택을 바꾸는 편이 낫습니다.
'수학 Mathematics > 확률및통계 Probability & Statistics' 카테고리의 다른 글
[확률및통계] 모멘트 (0) | 2023.07.20 |
---|