본문 바로가기
카테고리 없음

탐색 이론 - 재미있는 몬티홀 문제와 Normalize

by all about life 2025. 4. 8.


몬티홀 문제는 확률에서 고전적인 게임에 속하는 유명한 문제입니다. 사회자의 개입이 동반되는 현상이 개인의 선택에는 수리적으로 어떤 영향을 미칠 것인가를 잘 보여주는 영역입니다. 그럼에도 많은 사람들이 수리적으로 이해했다고 하더라도 직관적으로 고개를 갸웃거리게 만드는 문제이기도 합니다.

고전적인 확률 문제 - 몬티홀 문제

 


몬티홀 문제 - 선택을 유지할 것인가, 변경할 것인가


확률을 공부할 때 재미있는 확률 문제로서 '몬티 홀' 문제가 제시되고는 합니다. 미국-캐나다 방송 프로그램인 '몬티 홀'에서 유래된 문제로 게임의 방법은 간단합니다.
 
1. 위의 그림과 같이 A, B, C라는 세 개의 문이 있고 그 중 한 곳에 자동차가 있습니다.
2. 참가자가 A, B, C 중 어느 한 문을 선택하면, 사회자는 나머지 두 개의 문 중 자동차가 없는 곳의 문을 열어 보여줍니다.
3. 참가자는 나머지 문 중에 자동차가 있을 것이라고 생각하고, 최종 선택을 하게 됩니다. 최초 선택을 바꿀 수 있습니다.
 
위의 사항들을 단순하게 생각해보면, 최초 선택시 자동차가 세 개의 문 중 한 곳에 있을 확률은 1/3 입니다. 그리고 사회자가 다른 문을 열어 자동차가 없다는 것을 확인시켜 주었으므로 다음 선택에서는 두 개의 문 중 하나인 1/2로 생각하기 쉽습니다.

그렇다면 '최초 선택을 바꾸는 것이 더 나을까요? 아니면 최초 선택을 그대로 유지하는 것이 좋을까요?'에 대해 생각해보게 하는 문제입니다. 결론적으로 최종 확률은 1/2인 것 같지만 실상은 선택을 바꾸는 것이 2/3 더 높은 확률을 가진다는 것입니다.

일반적인 직관의 영역에서는 당연히 잘 이해가 가지 않습니다. 하지만 역사적으로 조건부 확률 등을 이용해 수리적으로 해결된 문제로 어떤 방법으로 이를 풀었는지 관심이 있으신 분은 검색을 통해서 확인해 보면 좋을 것 같습니다.

다만, 제가 추천 드리고 싶은 방법은 모든 경우의 수를 열거해 보는 것입니다. 가령, 자동차가 B문에 있다는 것을 가정했을 때, 최초 선택에서 A를 하게 되면 사회자는 C문을 열어 줄 수 밖에 없습니다. 그렇다면 내가 A선택을 '유지'하면 꽝, B로 '변경'하면 당첨이되는 2가지 경우의 수가 생기게 됩니다.

다음 최초 선택이 B였다면 사회자는 A, C 두 개의 경우로 문을 열어 줄 것이고 '변경'하면 두 가지 모두 '꽝', '유지'하면 당첨이 됩니다. 이러한 방식으로 모든 경우의 수를 생각해 보고 그 중에 '당첨'이 되는 경우의 수가 몇가지인지를 헤아려 보면 '변경'하는 것이 유리하다라는 결론을 얻을 수 있을 것입니다. 그런 다음에 수리적인 접근 방법에서 이것을 수학적으로 어떻게 표현하고 어떻게 풀이했는지를 살펴 본다면 더욱 이해가 쉬울 것입니다.

이러한 과정이 끝나면, 머릿 속으로는 '변경'이 유리하구나하는 것을 알게 되지만, 만일 직접 그러한 입장에 처한다면 쉽사리 변경을 선택하지는 못할 것 같다는 것이 제 생각입니다. 100개의 문에서 98개를 열어서 보여주든, 2개만 열어 보여주든 내가 당첨되느냐 마느냐하는 1/2 확률 게임 같다는 생각을 버릴 수가 없어서인지도 모르겠습니다.


탐색이론 - Normalize 과정


탐색이론의 입장에서 몬티홀 문제의 사회자 같이 전지전능한 존재는 없습니다. 목표가 어디 존재하는지 미리 알고 있는 존재가 있다면 탐색이론 자체가 무의미하기 때문입니다.

탐색이론에서 탐색자가 몬티홀의 3개의 문 중에 하나를 열어서 직접 확인(탐지확률=1)하게 된 이후에는 목표가 다른 두 문에 존재할 확률이 어떻게 변화할지를 살펴보면 당연하게도 이 확률은 1/2입니다.

최초 3개의 문 어딘가에 목표가 존재할 확률은 1/3, 하나의 문을 확인한 후 다른 두 문 중 하나에 목표가 존재할 확률은 1/2이 된다는 것은 몬티홀과 다르지만 당연한 이야기로 들립니다.

다만, 탐색이론에서 이 과정을 Normalize 과정으로 지칭합니다. 세 개의 문과 탐지확률이 1인 상황을 가정해서 쉽게 느껴지는 측면이 있지만, 복잡한 상황에서도 마찬가지입니다.



위와 같은 4개의 Cell로 이루어진 공간에서 어느 한 공간을 탐색하는데 이 때 탐지확률이 1이 아닌 0.5가 된다면, 목표가 그곳에 위치하고 있을지라도 탐지되지 않았을 확률이 0.5라는 이야기가 됩니다. 다시 이야기하면 최초 4개의 공간 중 어딘가에 목표가 존재할 최초 확률은 1/4로 0.25이며, 탐지확률 0.5를 가지고 한 공간을 탐색했을 때 여전히 그 공간에 표적이 존재할 확률이 존재한다는 이야기 입니다.

1. 목표가 그 공간에 있고 2. 탐색자가 0.5의 확률로 탐색하여 탐지하지 못하는 사건의 두가지 사건이 연속적으로 일어나는 경우 그 확률 값을 곱하게 되면 우리가 원하는 확률값이 도출됩니다. 물론 탐지확률이 0.5라면 탐지하지 못할 확률은 1-0.5=0.5의 값을 갖습니다. 결론적으로 아직 그 공간에 목표가 존재할 확률은 두 값의 곱인 0.125입니다.

다시 돌아가서 문제는 여전히 다른 세 개의 공간에 목표가 존재할 확률은 0.25씩의 값을 가지고 있다는 것입니다. 목표가 이 네 개의 공간 어디 한 곳에는 존재해야 한다가 가장 큰 전제이므로, 4개의 공간에 각각 존재할 확률 값들의 합은 1을 만족해야 합니다. 그런데 0.25의 확률 3개와 0.125 1개를 합산하면 0.125가 부족해집니다. 그래서 Normalize라는 과정을 거지게 되는데, 몬티홀 공간에서 처음 1/3이었다가 1/2로 변한 것을 생각해보면 약간만 복잡해졌을 뿐 같은 원리라는 것을 알 수 있을 것입니다. 즉, 전체 합이 1이 되도록 각각의 확률을 일정 비율을 곱해서 올려준다고 생각하면 될 것 같습니다.

수학적인 풀이는 탐색이론을 본격적으로 논할 때 공간에서 일어나는 사건들을 계산하기 편리한 행렬의 수식을 통해서 살펴보려고 합니다. 다만 어떤 확률이든지 그 합이 1을 만족한다는 전제는 많은 시사점을 주는 것 같습니다. 내가 선택을 하든지, 안하든지도 각각 0.5의 확률로 그 합이 1인 것처럼, 내가 어떤 선택을 하든지 행복이 찾아온다는 사건들의 확률 합이 1, 100%인 것과도 닿아 있지 않을까요?