티스토리 뷰
통계의거짓말. 2017. 게르트 보스바흐, 옌스 위르겐 코르프 공저
0. 들어가며
본격적으로 서평을 쓰기에 앞서 이 책은 추천하고 싶은 마음과, 추천을 해도 되는지에 대한 미심쩍음이 공존하는 책이다. 그 이유는 다음과 같은데, 우선 이 책은 표지에서 제시한 자극적인 두 개의 슬로건 “정부, 기업, 정치가는 통계로 어떻게 우리를 속이고 있는가”, “우리 사회의 이기적 사기꾼(정치가, 정부, 은행, 보험회사 등)들이 적극적으로 활용하는 통계의 비밀”에 대한 문제제기와 해답제시를 했단 측면에서는 훌륭한 책이라고 할 수 있다. 하지만 번역되기까지(한국 출판 2017년, 독일 출판 2010년) 7년이라는 시간이 걸렸기에 최신 이슈를 다룬 책이라고 이야기하기 어렵다는 점, 독일과 우리나라의 사회보장제도에 다소 차이가 있어 정확히 우리나라의 경우를 대입해 생각해보기가 용이하진 않다는 점 등에서 어느 정도는 한계를 가진 책이기도 하다. 그렇기 때문에 보다 우리 사회에 적용하기 쉽고, 최신의 자료를 다룬 더 좋은 책이 있지 않을까 하는 우려도 동시에 남는 것이다. 하지만 그럼에도 불구하고 우리가 은연중에 너무나도 굳게 갖고 있는 숫자에의 믿음을 크게 흔들어준다는 점에서 읽는 사람들로 하여금 사회에 합리적이고 비판적인 시각을 갖게 해주는 방아쇠로서의 역할은 충실히 하고 있는 책이 아닌가 생각한다.
1. 숫자는 정확하다. 하지만...
우선 이 책에서 이야기하는 '통계가 우리를 속이는 방법' 몇 가지를 소개하고자 한다.
a) b)
c) d)
우선 위의 네 개의 그래프를 살펴보자. 자세히 살펴본 사람은 알겠지만 네 개의 그래프는 모두 같은 그래프이다. 혹시 눈치채지 못한 분들이 있다면 다시 한 번 꼼꼼히 살펴보셔도 좋다. 틀림없이 필자가 임의로 작성한 아래의 표를 바탕으로 만든 '같은' 그래프이다.
그렇다면, 나는 한 회사의 CEO이고, 2008년부터 현재까지 회사의 경영을 맡고 있으며 주주총회에서 회사의 생산량을 주제로 프레젠테이션을 해야 한다고 가정하고 위 그래프를 만드는 시나리오를 생각해보자.
우선 왼쪽 위 그래프 a는 재가공 절차를 거치지 않고 엑셀에서 그래프를 만들었을 때의 모습이다. 2012년과 2013년 다소 생산량이 감소하기는 했지만 전반적으로 생산량은 완만한 곡선을 그리며 변동하고 있다. 하지만, 사람이고 회사고 삶은 극적인 면이 있을 때 더 흥미진진하지 않은가. 이런 재미없는 그래프를 주주 총회에 보여줘서는 나의 능력을 보여줄 수 없다. 하지만 차트의 수치를 조작하는 것은 양심적이고 도덕적인 경영자로서 할 일이 못 된다. 그러니, 어.차.피 아무런 그래프도 지나가지 않는 0부터 200까지의 눈금만 살짝 지워보기로 하자. 어디까지나 '사실에 대한 왜곡 없이' 극적인 그래프 b가 되었다. 응? 아래 눈금을 지운 것도 정보의 왜곡인 것 같다고? 나는 거짓말을 하지 않았지만 뭐 그렇게 생각한다면야 할 수 없다. 0부터 400까지 모든 지표를 살리되 그래프의 세로 폭을 반으로 줄여 c 그래프를 만들어보자. 어디까지나 이것은 '정직한 그래프'다.
하지만, 2012년과 2013년의 극심한 생산량 저하는 나의 무능을 보여주는 것 같아보인다. 그래, 과거가 무엇이 중요하겠는가. 나는 경영자로서 주주들에게 회사의 긍정적인 미래를 제시하고, 그들의 변함없는 지지를 이끌어내야하는 의무가 있다. 2013년부터의 생산량을 이야기하는 그래프 d를 만들어보자. 우리 회사는 13년부터 17년까지 5년에 걸쳐 40%의 생산량 증가를 이뤄낸 앞날이 창창한 기업이다.
위의 시나리오에서 거짓이 들어간 부분은 하나도 없다. 보여주고자 하는 정보를 취사선택하는 약간의 가공과정이 들어갔을 뿐이다. 모든 통계의 문제는 이 가공과정에서 나온다. 이 거짓말 없는 사기공작에 분노하기에 앞서 하나의 사례를 더 살펴보자. 아래 표는 성별에 따른 <UC 버클리 대학원 지원자 및 합격자 현황>이라고 본 책 내에 제시된 표를 인용한 것이다. 필자가 이 표를 다시 만드는 과정에서 쓰기 좋아보이는 부분들에는 색을 표시해두었다. 여러분이 기자라면 아래 표를 보고 어떤 기사를 쓸 수 있을지 생각해보자.
<성별에 따른 UC버클리 대학원 지원자 및 합격자 현황>
지원자 및 합격 현황 |
합격현황(%) |
|||||
학과 구분 |
여성지원자 |
여성 합격자 |
남성 지원자 |
남성 합격자 |
여성 |
남성 |
A |
10명 |
8명 |
80명 |
50명 |
80% |
63% |
B |
5명 |
4명 |
60명 |
40명 |
80% |
67% |
C |
80명 |
20명 |
40명 |
10명 |
25% |
25% |
D |
30명 |
15명 |
40명 |
10명 |
50% |
25% |
합계 |
125명 |
47명 |
220명 |
110명 |
|
|
평균(%) |
37.6% |
50% |
58.75% |
45% |
"대학원 내 남녀차별은 옛말? UC버클리 모든 과에서 여성의 합격률 우세"
"대학원 내 뿌리깊은 남녀차별, UC버클리 합격율 남 50%, 여 37.6%"
"대학원 내 뿌리깊은 남녀차별, UC버클리 합격율 남성 합격률 여성 대비 35% 높아..."
"대학원에 여풍이 분다, UC버클리 대학원 남성 합격율 여성대비 13%p 낮아.."
위의 네 개의 헤드라인은 필자가 임의로 작성해본 것이다. 심지어 이번에는 위 시나리오에서 나온 것과는 달리 가공과정도 거치지 않았다. 그저 표를 읽었을 뿐이다. 하지만 헤드라인은 단 한 치의 거짓 없이도 서로 배치되는 내용을 담고 있다.(참고로 책에서 인용된 기사는 녹색 부분을 인용하여 "UC버클리 대학원 입학과정에서 여성들이 차별을 겪었다"고 이야기했다. 이 기사는 거짓을 말했는가?)
이것이 바로 위에서 든 두 가지 사례를 포함해서 다양한 사례를 통해서 책에서 보여주고자 하는 '통계에 대한 섣부른 믿음의 위험성'이다. 통계 자체는 가치중립적인 유용한 도구이지만, 언제나 조사자 혹은 인용자에 의해 가공의 과정을 거치기 때문에 모든 통계를 곧이곧대로 믿어서는 곤란하다. 이 가공과정은 조사 설계 과정에서의 표본 선택부터, 조사 이후 나온 숫자에서 보여주고자 하는 부분을 제한하는 것까지 다양하게 이루어진다. 그렇기 때문에 누군가 대중에게 보여주고자 하는 부분만을 가공해서 내어놓은 통계는 얼마든지 있을 것이고, 그렇기 때문에 과장을 좀 보태자면 당신의 주장이 무엇이든, 얼마나 억지스럽든 간에 끈기를 갖고 찾아보면 어딘가 한 군데쯤은 이를 뒷받침해줄 수 있는 통계가 존재할지도 모른다. 물론 그러기를 응원하는 것은 아니다.
2. 세상을 선하게 만들기 위한 노력
통계에 대해서, 그리고 이를 가공하는 이에 대해서 불만이 생겼는가? 그렇다면 질문을 던져보자. 이렇게 통계를 가공하는 사람들은 악한 사람들인가? 나는 나쁘다고 생각한다. 하지만 그들을 나쁘게 만드는데는 그들이 가공한 통계를 너무나 쉽게 믿어버린 우리의 잘못도 분명히 있다고 생각한다. '지식의 불균형'이라는 개념이 있다. 의료나 법조계에서 쓰이는 용어를 생각해보면 이해가 쉬운 개념일 것이다. 법조문이나 의사의 처방전은 일반인이 이해하기 어려운 용어로 쓰여진다. 그렇기 때문에 우리는 그들의 언어를 이해할 수 없고, 이를 이해하기 위해서는 긴 시간을 들여 어려운 공부를 해야 한다. 이러한 진입장벽 때문에 우리는 의료인과 법조인들에게 관련 서비스를 위탁할 수밖에 없다. 이러한 과정이 바로 '지식의 불균형'이다. 인구가 점차 늘어나고 사회가 복잡해짐에 따라 통계에도 분명 이런 지식의 불균형이 발생했다. 통계 프로그램을 사용하고, 그 결과를 해석할 수 있는 사람들의 몸값이 올라가는 이유는 이 때문이다. 또한 자신이 조사하고 싶은 바가 있더라도 이를 실행하기에는 많은 시간과 돈이 필요하기 때문에 선뜻 시도하기도 쉽지 않다. 하지만, 의료계, 법조계와 통계는 그 지식의 불균형에 있어 약간의 차이가 있다. 바로 '통계'는 우리가 이해할 수 있는 숫자로 나타난다는 것이다. 그렇기 때문에 우리는 조금 더 시간을 들여 통계를 바라보고, 한번쯤 통계에 담겨있는 작성자의 의도를 의심해봄으로써 통계에 쉽게 속아넘어가거나, 선동되거나, 상대가 원하는대로 움직이지 않을 수 있다는 것이다.
사회의 개선은 언제나 의심에서 시작되었다. 하늘에서 받았다는 저 왕의 권력이 과연 정말로 하늘에서 받은 것일까? 고용주가 노동자들에게 제공하는 처우는 정당한 것인가? 글은 선택받은 사람들이나 배우고 읽는 것일까? 같은 시대의 상식에 대한 의심 말이다. 이러한 의심을 통해 다양한 개혁이 생겨났고, 지금과 같은 서로 간의 계약에 의해 구성된 '대중의 지지를 통해서만 권력을 얻을 수 있는' 사회가 만들어졌다. 그렇기 때문에 권력을 가진 사람들은 다양한 방법으로 사람들의 마음을 얻기 위해 노력한다. 이 과정에서 가장 흔하게 사용되는 수단이 통계이고, 이들은 자신의 입맛에 맞게 자료를 가공한다. 이러한 그들의 주장을 의심하고, 끊임없이 감시하는 것은 우리의 의무이자, 동시에 권리이다. 우리는 적어도 먼 옛날의 사람들과는 달리 우리가 사는 세상을 선하게 만들 수 있는 힘을 가지고 있는 것이다. 어떠한 통계를 볼 때 '시간이 오래 걸려서, 어려워서, 귀찮아서, 심지어는 그들의 이야기가 나의 이익을 대변하기 때문에 믿고 싶어서' 등의 이유로 지나칠 때 통계를 근거로 자신의 주장을 펼치는 사람들(당신의 윗사람이든, 권력자든, 당신에게 보고를 해야하는 아랫사람이든 상관없이)은 주저없이 자신의 이익에 맞게 우리의 생각을 형성해갈 것이다. 내가 권리를 포기했기 때문에 상대가 악해질 수 있었다면 그것은 과연 상대만의 잘못일까? 우리는 우리의 수준에 맞는 사회를 가진다. 그런 면에서 나는 이 책을 읽으면서, 통계를 보기 위한 최소한의 지식을 익히고, 어떠한 통계를 볼 때 조금 더 주의깊게 들여볼 수 있는 습관을 들이는 것은 세상을 선하게 만드는 행위가 될 수 있지 않을까하고 생각해본다.