본문 바로가기
카테고리 없음

평균에 익숙한 우리들 - 혹시나 놓치고 있을지 모르는 진실(편향 2)

by all about life 2025. 4. 12.


이번 글에서는 우리 주변에서 쉽게 볼 수 있는 편향의 한 종류인 '평균의 함정'에 대해서 말씀드리려고 합니다. '평균'은 생활 속에서 너무나 익숙하게 사용하고 있는 값인데, 그 값을 얼마나 신뢰할 수 있을지에 대해서는 통계학에서 이미 많은 논의가 있었습니다. '평균' 보다는 '중간값'이라는 개념을 잘 사용하는 것이 더 유익할 수 있다는 것에 대해 알아보겠습니다.


대부분이 5점 이하인데, 반 평균은 20점 이상?

 


예를 들어 어떠한 학급에 5명의 학생이 있다고 하고 학급의 수학 점수 평균이 22점이었다고 가정해 봅시다. 평균이 22점이기 때문에 5명이 22점을 중심으로 점수를 받았다든지, 0점~40점 사이에서 점수들이 분포되어 있다고 생각하게 됩니다. 그런데, 실제로 학생들의 점수를 살펴보니 5명이 각각 1점, 2점, 3점, 4점, 100점을 받았던 것입니다.

대부분의 학생인 4명이 5점도 되지 않은 점수를 받았고 100점을 받은 1명으로 인해 학급의 평균 점수가 급등했던 것입니다. 이런 상황에서 평균 점수는 그 학급의 평균적인 실력을 나타내는 척도로 사용할 수 있을까하는 의문을 가지게 됩니다.

물론 예시를 든 수학 점수는 조금 극단적인 경우이기는 합니다. 하지만 어떤 경우에 있어서는 '평균의 함정'에 빠지는 모습을 잘 보여주기도 합니다.

물론, 평균 점수가 무조건적으로 무의하다는 것은 아닙니다. 평균 점수는 전체 점수를 합산하는 과정을 거치기 때문에 모든 데이터가 고려된 척도라는데 의의가 큽니다. 그래서 집단이 커질수록 이상 수치, 특이점, 특수한 경우의 점수가 미치는 영향이 줄어들게 되어 좋은 척도로 활용할 수 있게 됩니다.


다양한 시각을 가지고 현상을 바라보는 것 - 왜곡을 줄이는 최선의 방법

 


특수한 경우에는 중간값의 개념을 사용하는 것이 더 유리할 때도 있습니다. 중간값은 말 그대로 서열상 중간에 위치한 데이터의 값을 제시하는 것을 말합니다. 1, 2, 3, 4, 100점에서 딱 중간에 위치한 표본의 점수인 3점을 가리키는 것입니다. 이렇게 되면 중간 정도의 등수를 하는 사람의 점수가 3점 정도인 것을 알 수 있는 것입니다.

하지만 이렇게 되면 월등히 높은 점수를 받은 100점의 데이터가 무의미하게 느껴집니다. 100점의 데이터 그 나름대로의 가치도 중요하기 때문입니다. 이러한 이유로 수능 점수는 표준 점수를 이용합니다. 어려운 시험으로 대부분의 점수가 낮을 때 시험을 잘 본 사람이 더 높은 점수를 받게 하는 것입니다.

 

각설하고, 이러한 이유로 하나의 현상, 특히 데이터를 살펴 볼 때는 다양한 척도를 활용하는 것이 좋습니다. 통상적으로 이러한 경우에는 최댓값 = 100, 최솟값 = 1, 중간값 = 3, 평균 = 22를 고려해 볼 수 있습니다. 이 네 가지 데이터를 가지고 있으면, 해당 학급에 제일 잘한 학생이 100점, 제일 못한 학생이 1점, 중간 등수가 3점이며, 평균이 22점이기 때문에 대부분의 학생들이 낮은 점수를 받았겠다는 사실을 얻을 수 있기 때문입니다.

 

지금 우리 사회는 '평균'이라는 것에 의존하는 경향이 높다라는 생각을 많이 하게 됩니다. 막상 제 시험 점수가 평균 보다 높으면 그래도 안심하게 되는 것도 사실입니다. 그렇지만 하나의 현상을 다양한 시각을 가지고 바라보는 것, 이러한 습관을 통해서 '왜곡'과 '편향'이라는 오류에서 벗어나 조금 더 균형 있는 시각을 갖출 수 있지 않을까 생각합니다.