이번 글에서는 우리의 인지 범위에서는 쉽게 예측할 수 없는 생일과 관련된 확률에 대한 이야기와 희소한 확률과 당연한 사건에 관한 내용을 말씀드리려고 합니다. 365일 중에 생일이 같은 사람이 있을 확률이 99%인 경우라면 그 모임의 인원수는 얼마나 되어야 할까? 그리고 아주 희소한 확률을 지녔지만 그것이 발생하지 않는다는 것은 아니다는 의미, 지금은 확률로만 존재하지만 머지않아 당연한 사실이 될 모습들에 대한 이야기를 전달해 드리겠습니다.
57명 정도만 있으면 그 중에 생일이 같은 사람이 나올 확률은 99%
하나의 그룹 안에 생일이 같은 사람이 2명 이상이 있을 확률은 얼마나 된다고 생각하십니까? 결론적으로 57명의 사람이 모여 있을 때 그중 2명 이상의 생일이 같을 경우는 99% 정도의 확률이 됩니다. 1년이 365일이기 때문에 적어도 365명 정도가 있어야 될 것 같다고 생각하기 쉽겠지만 57명만 있어도 99%의 확률이 된다고 하니 다소 놀라운 결과입니다.
이 문제는 n명의 사람들이 모두 생일이 다를 경우의 확률을 구한 뒤 1에서 그 확률을 빼는 것이 계산하기 편리합니다.
- 먼저, 첫 번째 사람이 어느 특정 날짜가 생일인 확률은 365/365입니다.
- 두 번째 사람이 첫 번째 사람의 생일이 아닌 다른 날짜가 생일인 확률은 364/365이고, 세 번째 사람은 363/365입니다.
- 이런 식으로 n번째 사람까지 나열 후 이 사건들이 동시에 일어나는 확률을 구하는 문제이기 때문에 확률 값은 그 확률들의 곱이 됩니다.
즉, n명의 사람들 중 2명 이상의 생일이 같을 확률 \( P(2명 이상의 생일이 같음) \)의 계산식은
$$ P(2명 이상의 생일이 같음) = 1- \frac{365}{365} × \frac{364}{365} \frac{363}{365} × ⋯ \frac{365-n+1}{365} $$
이 됩니다. 이를 다시 정리하면
$$ P(2명 이상의 생일이 같음) = 1 - \frac{P(365, n)}{365^n} $$가 됩니다.
여기에서 n=23이면 값은 0.5073(51%), n=57이면 0.9901(99%)가 되기 때문에 57명만 모여 있어도 그중에 생일이 같은 사람이 있을 확률은 99%가 넘는다고 할 수 있는 것입니다.
희소한 확률에서도 이벤트는 발생하기 마련
이렇듯 365개나 되는 일자 중에 57명만 있어도 생일이 같을 확률이 99%나 된다는 것은 상식적인 범주 내에서는 생각하기 쉽지 않습니다. 이와 반대로 로또에서 1등이 나올 확률이 814만 분의 1이라는 아주 낮은 가능성이지만 거의 매주 1등이 나오고 있습니다. 확률이 극히 낮지만 로또를 구매하는 횟수가 많기 때문에 가능한 일인 것입니다.
확률은 반드시 그렇다는 것을 전제하지는 않습니다. 확실한 사건의 발생을 의미하는 것이 아니라 예측의 영역에서 추론하는 것이 확률이기 때문입니다. 다른 의미로 사건을 무수히 많이 발생시키면 그 경우의 수가 확률값에 근사하게 된다는 것을 말하기도 합니다.
주사위를 던져서 10번 연속으로 5가 나올 수도 있지만 시행 횟수를 지속 증가시키면 각각의 숫자가 나오는 횟수가 동일할 것이라는 추론이 가능하고 이는 실제 실험을 해도 동일하다는 것은 증명할 수 있는 셈입니다.
최근 히가시노 게이고의 소설 라플라스의 마녀를 읽게 되었습니다. 소설은 뇌 수술로 천재가 된 2명과 온천 지역에서의 유황 중독으로 발생한 사망사고들의 원인을 추적하면서 밝혀지는 복수극이 주요 내용입니다. 그 소설 속 주인공 중 하나인 교수는 온천 지역에서 흘러나온 유황이 흘러나와 특정 인원을 살해하기 위해 사용되었을 확률은 거의 불가능에 가깝다고 말합니다. 모든 자연적인 조건이 맞아야 하는데 인간이 계획할 수 있는 영역이 아니라는 것입니다.
반면에, 그 천재들은 대기 상황과 자연조건들을 정확히 계산하여 언제 어디에 그 유황이 얼마동안 머물 것인지 계산합니다. 예측의 영역이 아닌 확신의 영역에 들어선 것입니다. 동전 던지기도 사람이 어느 각도로 얼마 정도의 힘으로 동전을 던지느냐에 따라 앞면인지 뒷면인지 사전에 정해진다라고도 이야기합니다.
우리들은 그러한 천재들이 아니기 때문에 확신의 영역에서 사건들을 관찰할 수 없습니다. 다만, 확률의 영역에서 어느 쪽이 더 가능성이 있는지 판가름하는 것입니다. 하지만 기상의 모든 조건들을 파악할 수 있게 되는 날 일기예보의 정확도가 100%에 가까워질 것은 자명하기 때문에, 지금은 어떤 확률이지만 차후에는 당연한 이벤트로 바뀔 수도 있다는 점에서 확률이 가지는 재미가 더해지는 것 같습니다.
아무리 희소한 확률을 지니더라도 그 이벤트는 발생하기 마련이고, 현재는 미지의 세계로서 확률로 존재하지만 언젠가는 당연한 사실로 받아들이는 것이 되듯 불변의 진리는 없는 것 같습니다.