불친절했다는 지적이 많아서 다시 정리해드립니다.
0. 이른바 K값 이전까지의 이야기
앞부분의 약 8분까지는 개표부정의 역사와 대한민국의 선거 개표 시스템을 이야기합니다. 그런데 그 다음에 총수가 묻는 부분에선 필진들 모두 터졌습니다. 총수는 The Plan에서 타임라인상 선관위가 중앙선관위에 보고한 다음에 언론을 탄다고 주장하더군요. 근데 필진들은 방송국과 신문사 기자들로부터 진다는 것을 이야기 듣고 다들 술 마시러 갔었거든요. 일단 2012년 대선 당시 선거기간동안 진행된 여론조사에서 문후보는 한 번도 이긴 적이 없었습니다. 언론 종사자들은 다 알고 있었단 말이죠. 혹시라도 추세가 바뀌어 이길 수 있지 않을까라고 했는데... 그런 일은 일어나지 않았던 거거든요.
모두가 모두에게 경쟁해야 하는 헬조선의 기자들은 개표현장 나가서 다들 남들보다 빨리 송고하기 위해 경쟁합니다. 그렇게 속보경쟁하다보니 방송사 방송이 항상 선관위 발표보다 빠릅니다. 물론 빨리 하다보니 틀리는 경우도 종종 있습니다. 그건 나중에 선관위 발표를 갖고 '보정'합니다.
역누적 이야기는... 우리 모두 2012년에 투표 독려들을 했죠? 퇴근하자마자 투표마감 시간 전까지 투표장으로 달려간 직장인들 많잖아요? 그거 누구 표겠어요? 늦게까지 투표를 했으니 늦게 도착하는 겁니다. 그런데 문재인에게 유리한 투표함이 나중에 열렸다니;;; 제 기억으론 그때 총수는 투표독려하는 나꼼수 진행하고 하고 있었는데요? 투표 독려하면 당연히 나오는 결과 아닌가요? 역누적은 문재인을 많이 찍은 도시 선거구들이 늦게 개표완료 되었기 때문에 그렇게 보이는 겁니다.
1. 미분류표란
분류기는 3번은 제대로 읽는데 4번 혹은 5번과 같이 찍힌 것은 누구에게 간 것인지 그 판정을 사람에게 넘깁니다. 미분류란 대부분 저런 겁니다. 여기에 기계적 오류가 일부 있을 수 있습니다. 멀쩡한 표인데 미분류로 처리하는 기계적 오류까지 더해지면 미분류표로 처리된 3.6%는 충분히 나올 수 있는 숫자입니다.
실제로 개표참관인 해보시면 미분류처리되는 것이 상당히 나온다는 것을 확인하실 수 있습니다. 선에 조금만 닿아도 미분류 처리하거든요. 그리고 위의 3번처럼 찍지 않고 4번 혹은 5번과 같이 찍어서 기계가 분류하지 못하고 육안분류를 해야 하는 미분류표는 어르신들이 많이 만듭니다. 어떻게 아느냐... 투개표 참관인 좀 해보세요.
이게 어떻게 3.6%씩이나 나오느냐, 뭔가 잘못 되어 있는거 아니냐고 깜짝 놀라는 외국분의 인터뷰가 나오니까 '일단 3.6%라는 숫자는 비정상'이라고 이해하시고 넘어가게 됩니다. 근데요, 의왕구치소 503번을 끝까지 지지하셨던 4%라는 숫자를 두고 '호텔에서 전기포트에 오줌을 끓여본 적이 있다'는 일본 통계 이야기가 유머로 돈 적이 있지요. 네, 이상하게 행동하는 분들은 한 자리 퍼센트는 됩니다. 반복하지만 투개표참관을 같이 해보시면 이상하게 투표하시는 분들 저 숫자 만큼은 보실 수 있습니다.
그럼 다른 나라들은 어떻게 하기에 저 숫자가 낮은 걸까요? 칸이 크고 많이 후보들 간격이 우리처럼 표 안에 들어가 있는게 아니라 후보별로 떨어져서 인쇄되어 있습니다. 그래서 영상에서 나오는 것처럼 긴 투표용지가 나오는거죠. 칸이 크면 기표할때 다른 곳에 찍을 가능성이 아무래도 줄지요.
2. K는 1이어야 한다?
문제의 영상에서 현화신 퀸즈대학 통계학과 겸임교수님은 박근혜를 찍었는데 미분류된 것과 문재인을 찍었는데 미분류된 수치는 박근혜를 찍은 사람들과 문재인을 찍은 사람들의 비율이 같아야 한다고 말씀하십니다. 그 K라는 숫자가 1이어야 한다고 이야기하는 것은 미분류표를 만들어내는 사람들의 숫자가 어느 후보를 찍는 것과 상관없이 '일정해야 한다'고 말씀하시는 거죠.
저 K값이라는 건 박에게 간 미분류표를 문에게 간 미분류표로 나누고 박이 득표한 것을 문이 득표한 값을 나눈 것을 다시 나눈 겁니다.
이 공식으로 놓고보면 잘못 찍는 비율이 투표를 하는 사람들과 연동해야 K값이 1이 됩니다. 즉, 현화신 교수님의 주장은 선거에서 편향이 없거나 그 편향이 흡수될 수 있는 상황을 전제로 합니다.
근데요... 대한민국에서 2012년 선거는 유일하게 두 가지 편향(Bias)이 작동했습니다. 그 전까지 작동했던 것은 지역전쟁이었죠. 하지만 유일하게 2012년의 선거는 지역전쟁이자 세대전쟁이었습니다. 그러니 젊은 층보다 기표 삑사리를 낼 수 있는 분들이 어떻게 투표권을 행사하느냐에 따라 K값에는 편향이 생기게 됩니다. 기표 실수를 할 수 있는 분들이 집중적으로 한 후보를 찍는다면, 1보다 큰 숫자가 나올 수 있습니다.
K값이 1.5라고 총수가 말하니 받아들이시는 분들은 두 종류로 나뉘더군요. 하나는 1.5가 일관되게 발생했다고 믿는 분, 또 하나는 너무 이쁜 포와송 그래프가 만들어졌다는 분들. 같은 영상물을 보셨는데 왜 다른 이야길 하시는지 잘 모르겠습니다. 일단 1.5라는 숫자는 평균값입니다. 실제는 0.97에서 2.27 정도까지 퍼져 있습니다. 평균치에서 극단은 딱 떨어지는 형태는 아니에요. 한 쪽이 약간 치우쳐져 있습니다.
반복하지만 전국적으로 일관된 K값이 나온 것이 아니라 평균값이 1.5였다는 겁니다. 그런데 뭔가 대단한 숫자인 것처럼 생각들 하시는데, K값이 1이 아니라 1.5라는 이야기는 이야기는 기계가 못 읽겠다고 사람더러 판단하라고 던져준 3.6%의 표 중에서 박근혜의 표가 문재인의 표보다 평균 33% 정도 더 나왔다는 이야기입니다. 3.6%에서 저 차이면 전체 투표에선 최대 1% 정도 되는 숫자죠.
저 공식을 놓고 따져보면
박근혜 지지지역에선 박근혜의 득표도 많지만 투표를 하시는 어르신들도 늘어나게 되지요. 그러면 기표 삑사리 비율이 더 높아지게 됩니다. 반면 문재인에게 투표하려고 했으나 미분류로 처리된 표의 숫자는 상대적으로 훨씬 적겠죠. 지역에서 문재인을 지지한 젊은 이들이 삑사리를 낼 가능성은 적으니까. 그러니 분모가 커지는 것보다 분자가 많이 커지게 됩니다. 즉, 꽤 큰 숫자가 나오게 됩니다.
전라도 지역에선 박으로 가는 미분류가 적은 대신 문의 득표율이 높지요. 반면 문으로 가는 미분류가 높고 박의 지지율이 낮구요. 이러면 분자가 경향적으로 작아집니다. 즉, 상대적으로 전라도 지역에선 K값이 낮게 나올 겁니다.
어르신들의 기표실수가 많아서 K값이 커졌다는 것을 가설로 놓고 정리하면 이런 추정을 할 수 있습니다.
전라도 지역은 문을 압도적으로 지지했기 때문에 K값이 상대적으로 낮게 나오는 반면, 경상도, 강원도, 충청도와 같이 박의 지지율이 높았던 상태에서 기표를 정확하게 하지 않는 어르신들이 만들어내는 미분류표 비율이 높았을 지역의 K값은 전라도보다 높을 것이다.
그럼 The Plan에서 K값 계산했다는 것을 한번 보죠.
전라도 쪽이 평균값인 1.5보다 대체로 낮고 경상도는 대체로 1.5 이상이 나옵니다.
한국의 통계학과 교수들이라고 한다면 이 두 가지 편향이 어떤 K값을 만들어내게 될 것인지 빤히 압니다. K값의 평균이 1.5가 나오니까 Planned되었다고 놀라신 교수님은 2012년 한국 대선에서 두 가지 Bias가 작동했다는 것을 모르시니까 그런 겁니다.
그럼 왜 지금까지는 K값이 1이었냐. 지역투표를 하게 되면 표를 정확하게 칸에 찍지 않는 어르신들의 표 역시 지역투표에 흡수됩니다. 분모와 분자가 같이 커지게 되니까요.
그러니까 The Plan이라는 영상물의 제목인 Planned 된 값이라는 K=1.5는 두 가지 편향이 동시에 작동되면 나올 수 밖에 없는, 지난 대선의 특징을 다시 짚어주는 지표일 뿐입니다. 이거, 선거라는 실제의 현장에서 벌어지는 일들을 알고 있는 사람들이라고 하면 다 알고 있는 내용입니다. 무엇보다 이거 수학이나 통계학도 아니에요. 그냥 산수입니다. 반복합니다. 퀸즈대학 통계학과 교수님이 놀라신 것은 2012년 대선에선 두 가지 Bias가 작동했다는 것을 모르시는 분이기 때문에 그런 겁니다.
3. 분류기 해킹
컴터랑 연결되어 있는 기계, 당연히 해킹할 수 있죠. 근데 영상물에선 선관위 디도스 사건을 이야기하면서 선관위 중앙서버의 보안성과 신뢰성에 의문이 있다고 이야기하면서 투표용지 분류기를 '해킹된 선관위 중앙서버가 조작한다'는 것처럼 보이게 해놨습니다. 근데요... K값이 0.97에서 2.27 사이인 값을 전라도는 적게, 경상도 충청도 강원도는 높게 나오는 값을 뿌려주면서 표를 '이동시킨 것'처럼 이야기하는데요...
더 플랜의 주장처럼 해킹되었다고 쳐도 움직일 수 있는 표는 전체 투표자 3천59만4천621명 중에서 최대 1%인 30만표 정도 밖엔 안됩니다. 우린 2012년 선거에서 100만표 넘게 졌습니다.
무엇보다 개표는 하나의 흐름으로 진행됩니다. 그런데 중앙에서 해킹공격을 하려고 하는데 접속할 수 있는 순간이 시작하기 전과 끝난 뒤라고 한다면 이 '흐름'을 바꿀 수 있을까요? 무엇보다 기계만 갖고 개표하는게 아니라 수많은 눈들이 뒤에 또 있단 말입니다.
4. 처리하는 순서만 바꾸면 된다고 하는데?
분류기라는 넘을 쓰는 이유는 개표 종사원으로 참여하게 되는 은행 직원, 학교 선생님 등이 일을 빨리 마치고 다음날 업무를 제대로 보실 수 있도록 하기 위해서 그런 겁니다. 우리 노동법 지켜야 하잖아요? 야근 수당 붙고 철야수당 붙으면 개표 종사원에 대한 인건비 상승폭이 일단 상당합니다. 그 분들이 지금보다 더 오래 일해야 하기 때문이죠.
기본적으로 수개표를 주장하시는 분들은 투개표 현장에 가 보신 적이 없는 분들입니다. 그리고 시스템의 어떤 결함을 열심히 찾아보시려고 하지요. 그렇다고 들었으니까. 그런데 말이죠... 우리 이 투개표 시스템이라는 것은 1987년에 만들어진 겁니다. 군대에서 찍는 표는 여당 표였던 시절에 이지문 중위가 양심선언을 해서 군 부재자 투표는 영외투표로 바뀌는 등의 진통은 있었지만 어찌되었건 간에 박한용 선생님과 송영길 의원, 한홍구 선생님이 말씀하셨던 시절의 개표 문제들을 계속 해결해온 과정이었습니다.
그리고 선거는 돈 많이 써야 하는 판입니다. 후보자 개인이든 소속 정당이든 돈 많이 썼는데 본인들이 납득할 수 없는 결과가 나오면 바로 소송들어가서 모조리 수검표 하는 일을 해왔습니다. 그렇게 했음에도 결과가 아주 많이 바뀐 적은 없습니다.
5. 그러면 뭐냐?
The Plan은 잘 모르는 사람들 겁주기 좋게 만들어진, 총수가 자주 하는 '아님 말고'식으로 던져놓은 음모론에 불과합니다. 문제는 이것이 어떤 여파를 줄 수 있느냐는 겁니다. 더 민주의 국회의원들은 총수가 진행하는 프로그램에 출연하길 좋아하죠. 뭐 좋아하는거, 사실 이해됩니다. 저도 순위 좀 나오는 팟케스트에 종종 출연하는데, 팟케스트 상위 순위에 올라가는 프로그램들은 300만 이상이 듣습니다. 언론 노출을 사랑하는 분들이 많이 노출되는 기회를 버리실리가 없죠.
문제는... 이게 너무 빤한 음모론이기 때문에 공격받기가 쉽다는 겁니다. 선거 투개표에 참여해본 적이 있고 산수 쫌 할 줄 아는 사람이라고 하면 'K값이 1.5로 수렴된다'는 이야기를 보고 '응? 그거 지난 대선의 특징이었는데?' 이상의 이야기를 안하거든요.
아니, 여러분. 여론조사 결과가 납득이 안된다고 통계학과 교수님들이 삿대질하는 판국에 대한민국 통계학과 교수님들이 이 Bias를 모를 것 같으신가요...?
대권 재수중이신 분, 제 아내는 자신의 나라인 네팔을 두 번이나 다녀온 분이라고 해서 아주 좋아합니다. 저 분이 대통령이 되시면 좋겠다고 이야기하기도 하지요. 그런데 그 분에게 홍준표 후보와 유승민 후보, 아니 무엇보다 변 모가 목청 높여 "문재인의 뒤에는 김어준이라는 음모론자가 있다"고 날뛸 것 같아 보이지 않습니까?
딴지필진들은 항상 한 덩어리로 취급받죠. 한쪽에선 마초적이라고 욕 먹고, 한쪽에선 메갈을 빤다고 욕 먹습니다. 근데 딴지의 필진이라고 하면 다들 자기가 하는 다른 일이 있는 사람들이고 비정기적으로 기사를 쓰는 사람들이기 때문에 강한 연대감 같은 것은 없습니다. 한국에서 정치적 입장이 아주 많이 달라도 같이 모여서 술 마실 수 있는 몇 안되는 그룹일 뿐입니다. 그런 양반들이 하나씩 "아니잖아?"라고 하는게 뭐 잘나서 그런거겠어요? 우리 집앞에 떨어진 똥은 우리가 치운다는 것 때문이지.