목표 펀딩액 : 2,000,000,000
현재 펀딩액 : 2,035,133,920
입금완료 : 2,035,133,920
입금대기 : 0
  • 로그인

프로젝트부

관리자
조회 수 732 추천 수 0 댓글 0
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부
?

단축키

Prev이전 문서

Next다음 문서

크게 작게 위로 아래로 댓글로 가기 인쇄 첨부

작성자: 전희경, 현화신

작성일: 2017 8 15

 

 

<더플랜>에서 제시한 K 최근 2017 5월에 치러진 19 대선 결과 분석에 적용되었습니다[1,2]. 통계적 분석 방법이 선거에 응용되는 것을 반갑게 생각하면서, 이러한 검증 과정이  지속적으로 이루어져 앞으로 공정하고 투명한 선거 제도를 정착시키는 데에 기여하게 되기를 바랍니다. 그런데 <더플랜>에서 미분류표 분석의 도구로 거론한 K 일부에서 오해하고 있는 것으로 보여 보충 설명을 하고자 합니다. 객관성을 유지하기 위하여 후보들의 이름보다는 당선자, 경쟁자 또는 후보1, 2 표기합니다.

 

한국 18 대선에서K=1.5 나타났고, 것은 당선자가 경쟁자보다  미분류표에서 상대적으로 많이 득표하여 선출된 것을 의미합니다. 또한 전국 251개의 K값이 1.5 모이는 현상을 발견하고K=1.5 설명하는 방법의 하나로 전자개표기를 프로그램하는 시나리오를 세웠는데, 시뮬레이션 결과가 1 나타난 것과 같이 실제 선거 결과에 (251 개표소) 매우 가깝게 나타났습니다. 것이 의미하는 바는 <더플랜>에서 제시한 시나리오에 의해 18 대선 결과를 재구성할 있다는 것입니다. 따라서 <더플랜> 주제는 전자개표기 사용에 대한 경각심을 불러 일으키고, 나아가 개선 방법을 찾자는 것입니다.   

 

1: 18 대선과 시뮬레이션 결과 (6 개표소)

 

18 대선 결과

시뮬레이션 결과

district index

P1_R

M1_R

P2_R

M2_R

P1_R2

M1_R2

P2_R2

M2_R2

1

66%

33%

69%

22%

66%

34%

67%

23%

20

49%

51%

52%

38%

49%

51%

53%

37%

89

88%

11%

82%

7%

86%

13%

83%

7%

109

7%

93%

9%

80%

9%

91%

9%

79%

122

51%

49%

53%

35%

51%

49%

54%

35%

210

21%

78%

20%

71%

26%

74%

25%

61%

Mean of 251 districts

52%

47%

53%

35%

52%

47%

54%

35%

 

참고: 모든 지역에 대한 시뮬레이션 결과는 프로젝트 사이트2012 아카이브 첨부되어 있습니다.  http://www.projectboo.com/archive/153432

18대와 19 대선 결과와 관련하여 K 이해하고 적용하는 방법을 아래와 같은 순서로 설명하겠습니다.

  • K 무엇인가?
  • K값과 미분류표 생성에 대한 가지 가설 비교
  • 18 대선과 가설 1 & 2  요약 
  • 19 대선과 가설 1 & 2   요약
  • 제안과 결론
    • K=1 정상인가?
    • K=1 되는 선거 환경을 만들 있을까?
    • 18 대선의 K=1.5값이 의도된 것인가?
  • 자료 출처
  • 부록 1 (K-test, 기대값과 분산)
  • 부록2 (K-impact, 승리방정식)

 

 

1.  K란 무엇인가?

 

<더플랜>에서 소개된 K 통계적 테스트를 있는 척도입니다. 예를 들어, 암을 치료하는 새로운 약이 나왔을 , 약의 효능을 판단하기 위하여 그룹을 가지고 실험을 합니다. 통계적으로 정립된 t-test 그룹의 평균을 비교하면서 새로운 약의 효능이 있는지 또는 없는지 판단합니다. 이처럼 K 후보의 미분류율을 비교하면서 당선자가 미분류표에서 상대적으로 득표를 많이 했는지 또는 아닌지 여부를 판단하는 테스트 방법으로 이해하면 되겠습니다 (, two-sample t-test for equal means versus  two-candidate K-test for equal unclassified rates). K 한국 선거시스템을 고려하여 만들어진 통계적 테스트 방법이지만, 그림1 나타나 있는 것처럼 한국과 같은 투개표 시스템을 가진 다른 나라에서도 활용될 있는 일반화된 테스트 방법입니다.

 

좀더 통계적 내용을 소개하자면, 가지의 test statistic 아래와 같이 정의됩니다.

스크린샷 2017-09-02 오후 12.08.30.png

 

여기에서    M1 & M2: two sample means  ( 개의 샘플 평균),

s12& s22: two sample variances  ( 개의 샘플 분산)  ,

N1 & N2: two sample sizes ( 개의 샘플 크기),

P1 & M1: two candidate received votes from the classified ( 후보 분류표 득표수),

P2 & M2: two candidate received votes from the unclassified ( 후보 미분류표  득표수). 

Null hypothesis:     T: 개의 샘플 평균이 같다.

              K: 후보의 미분류율이 같다.

 

테스트 결론을 내리기 위해서는 가지 검정 통계량(test statistic) 주어진 데이타에 적용하여 얻은 값을 귀무가설(null hypothesis)에서 나오는 값들과 비교하게 됩니다. 그런데 T 필요한 조건들을 만족하면 t-distribution 따르고 있으므로 이를 바탕으로 개의 샘플 평균이 같은지 판단합니다. 반면에P1, M1, P2 & M2 각각 이항분포를 따르지만,  K 특정한 분포를 따르지 않습니다. 따라서 후보의 득표수가 크다는 것을 가정하고, 후보의 미분류율이 같다는 귀무가설에서 나오는 기대값과 분산을 계산하였습니다 (부록1 참고). 이러한 통계적 테스트 접근 방식에 따라 후보의 미분류율을 같다고 놓는 것이 K 통계적 특성을 찾는 데에 반드시 필요합니다. 주목할 점은 이러한 귀무가설에서는 K 기대값이 지역 크기와 상관없이 항상 1이고, 분산은 지역 크기에 따라 달라진다는 것입니다. 예를 들어 어떤 지역에서 K=1.05 또는 K=0.94 나왔을 , 값들이K 기대값 1 같은지를 판단하려면, 부록1-(A) 있는 분산을 적용하면 됩니다 (using log-normal distribution). , 지역의  크기와 미분류율을 고려하여 판단하게 됩니다.

 

하지만 후보의 미분류율이 같지 않다면, K 기대값과 분산 모두 지역마다 달라지게 됩니다 (부록1-(B) 참고) . , 한국 18 대선에서 나온 251개의 K값은 하나의 같은 분포에서 나온 것이 아니라, 각각 다른 분포에서 나온 것이 됩니다.

 

 스크린샷 2017-09-02 오후 12.08.58.png

 

 

그림1: 투표지 분류 과정: (1) 전자개표기에 (optical scanner) 의해 먼저 분류되고; (2) 미분류된 투표지들은 심사집계부에 의해 재분류된다.

 

 

현재까지 논의된 바에 의하면 미분류표는 크게 가지로 분류되는데, 전자개표기 오류에 의한정상표 전자개표기가 판독할 없는도장표” (도장이 제대로 찍히는 않은 비정상표) 입니다. 분류표가 투표수의 96% 차지하는 것에 비해 미분류표는 4%정도입니다. 따라서 박빙의 선거일 경우에 미분류표가 특정 후보의 당선 여부를 결정하는 데에 영향을 미칠 있습니다. 전자개표기가 정상적으로 작동하면, 분류표는 정상표임에 반해, 미분류표는 도장표로서 비정상표입니다. 그런데 미분류된 도장표는 선관위의 결정에 따라 유효 또는 무효표로 재분류 되는데, 선관위의 결정이 일정하지 않고 선거 때마다 바뀌는 부분이 있습니다. 따라서 박빙의 선거에서는 미분류표에 많은 관심을 갖게  되는 것이 당연합니다.

 

선거에서 K 활용하고 해석하는 방법은:

먼저K=(미분류표에서 당선자/경쟁자)/(분류표에서 당선자/경쟁자) 놓고 K-값을 구합니다.

(1) K = 1이면, 후보의 미분류율이 공정하게 같게 나타난 경우이므로, 정상적인 선거가 이루어졌음을 제시하는 것이고;

(2) K < 1이면, 당선자가 미분류표에서 경쟁자보다 득표를 하고도 선출된 것이므로, 미분류된 비정상표에 의한 이득이 없으므로, 당선자 득표에 대한 의구심을 가질 필요가 없음을 제시하는 것이지만;

(3) K > 1이면, 당선자가 미분류된 비정상표에서 경쟁자보다 득표를 많이 하여 선출된 것이므로, 미분류표에 의한 이득이 있으므로, 원인을 찾는 것이 필요함을 제시하는 것입니다.

 

또한 K 특성을 다른 각도에서 찾을 수도 있습니다. 수학 식을 이용하여 K 당선자 확정에 미치는 영향을 분석해 보았습니다 (부록2). 요약하자면 18 대선에서 K=1.5이라는 값은, 분류표에서 ( 투표수의 96% 해당)  후보1 (당선자)  후보2 (경쟁자) 99% 이상만 득표하면 선출될 있는 수치라는 것을 승리 방정식 (winning equation) 보여줍니다. 달리 말하자면, K값은 상황에 따라 미리 결정될 있고, 것을 전자개표기가 프로그램에 의해 실행할 있다는 가능성을 보여주는  것입니다. 하지만 이러한 플랜은 분류표를 제대로 확인하지 않을 때에 이루어진다는 점을 밝힙니다.       

 

 

 


2. K값과 미분류표 생성에 대한 가설 비교

 

K값에 대한 기대값은 미분류표의 특성과 관련이 있습니다. 현재까지 논의된 미분류표에 대한 가설은 가지인데, 미분류표는 모든 후보에게 똑같이 발생한다라는 가설1 (<더플랜> 가설) 또는 노령층에 의한 도장표에 의해 미분류표가 발생한다는 가설2 (이하노령층 가설” [3]) 있습니다. 지금까지 미분류표에 대한 공식 자료가 없기 때문에 가설 모두 검증이 필요하므로, 심정적 선택이 아니라 개연성과 현실성 여부를 비교하고자 합니다. 개연성은 선거 결과를 재구성할 있는 정도를 근거로 판단하는 것이 합리적이라 있겠습니다.

 

K값의 기대값은  가설1 의하면 후보와 상관없이 항상 1이고 (이론적으로 증명됨), 가설2 의하면 후보마다 달라지므로 1보다 크거나 작을 수도 있습니다. 따라서 가설1 K=1이라는 기대값을 통해 후보의 미분류율이 같다 또는 다르다를 판단하는 근거를 제시합니다. 반면에 가설2 판단의 기준이 없고 도장표 발생에 따라 달라지므로, 선거가 공정하게 이루어졌는지 여부를 판단할 있는 근거로 사용되지는 못합니다.

 

 

 

 

3. 18대 대선과 가설 1&2 요약

 

가설1 <더플랜>에서 보인 시나리오의 근거입니다. 가설1 시나리오는 연결되어 있지만 같은 내용은 아닙니다. 18 대선을 재구성하기 위해 제안된 것이 시나리오인데, 시나리오가 가설1 바탕으로 만들어진 것입니다. 결과 18 대선에서 나타난 K=1.5 바탕으로 계산한 확률들로 251 개표소에서 나온 후보의 분류표와 미분류표에서의 득표율 가지를 각각 매우 재구성 있었습니다 (1). 심정적으로 받아들이기 어려운 부분이 있을 수도 있으나, 18 대선에서 전자개표기 프로그램이 절대적으로 불가능하다고 확인되지 않는 , 가설1 바탕으로한 시나리오를 틀렸다고 없겠습니다. 시뮬레이션과 실험으로 가설1 개연성은 검증되었으나, 시나리오의 현실성에 있어서는 증명할 없는 부분이므로 가능성만 열어 놓습니다.

 

다른 , 가설2 심정적으로 받아들이기 쉬운 반면에 18 대선 251 개표소에서 나온 미분류율과K 값들을 제대로 설명하지 못하고 있는 아쉬운 점이 있습니다. 먼저 간단한 개별적인 예부터 들자면, 18 대선에서 가장 미분류율이 높았던 곳이 12.5%이었는데 (50 이상이 60% 상대적으로 노령층이 많은 지역), 곳의 K값은 1 나타났습니다. 노령층이 많으면 미분류율이 높고, 또한 미분류율이 높으면 후보1에게 많은 표가 것이므로K>1 기대되는 점에 어긋나는 사례입니다. 가설2 개연성은 전반적으로 미분류율을 어느 정도 설명할 있느냐에  달려 있습니다.

 

가설2 (노령층 가설)  18 대선의 미분류표를 충분히 뒷받침해주지  못하는 점을 크게 가지로 요약하겠습니다. 첫째, 가설2 핵심적 내용은 미분류표가 노령층에 의해 만들어졌다는 것이므로,  251 지역에서 나온 미분류율을 노령층 분포[4] 대략적인 설명을 있어야 합니다. 실제로는 미분류표에서 정상표들이 발견되었지만, 모든 미분류표가 도장표에 의해 전적으로100% 만들어졌다고 가정하고, 투표지 3천만표를 가지고 확률을 계산해 보았습니다 (샘플링이 아니므로 오류가 없음).  50 이상의 투표자들이 ( 투표자의 44%) 미분류표를 만들 확률이 6.2%이고  50 미만에서는( 투표자의56%) 1.8% 나와 50 이상 투표자들의 미분류표 발생이 대략 3 정도 높은 것으로 나옵니다.  (q=0.062 & r=0.018, 확률 계산 자세한 방법은 프로젝트 참고 http://www.projectboo.com/archive/153432)

 

그런데 확률들을 251개표소 각각의 노령층 분포에 ( 50 이상의 구성 비율) 적용해보면, 미분류율의 실제값이 2%~13% 나온 반면에 가설 2 확률에 따른  예상값이1%~5% 정도입니다. 절반에도 못미치는 예상값이므로, 후보별 득표율 예상값도 실제값과 차이가 큽니다. 따라서 가설2 현실성은 있어 보이나18 대선을 충분히 설명하지 못합니다.

 

또한 19 대선과 비교하기 위해 가지 연령 그룹으로 나누어 확률을 계산하여 보면,  60 이상 ( 투표자의 23%), 50 (21%), 50미만 (56%) 가지 연령 그룹에서 미분류표를 만들었을 확률이 각각 5.5%, 6.4%, 1.8% 계산됩니다. 50대가 60 이상 그룹보다 미분류표를 많이 만든 것으로 나타납니다. 점도 가설2 뒷받침하지 않는다고 있습니다.

 

둘째, 가설2 미분류표가 연령에 의해서 발생한다고 했는데, 18 대선 결과를 보면 지지하는 후보에 따라 미분류표 발생 비율이 달라지는 것으로 나타났습니다. 예를 들면, 후보1 지지자들이 후보2 지지자들보다 미분류표를 많이 만들어냈습니다. 현상은 상대적으로 젊은 지역 (50 이상 구성 비율이 20~40% 지역들)에서도 나타났으므로, 미분류표는 연령뿐만 아니라 후보에 따라 발생한 것으로 이해하는 것이 적절합니다. 것은 서울 지역의 25 개표소뿐만 아니라 (그림 2) 전국적으로 나타난 현상으로서 (그림3), 같은 연령 분포를 가진 지역이라도 지지하는 후보자에 따라 미분류표 발생율이 달라진 것을 있습니다.

 

 스크린샷 2017-09-02 오후 12.09.21.png

 

그림2: 18대선 서울지역에서  후보 사이의 미분류율 비교: (1) x: 지역에서 50 이상 투표자들의 비율 (%); (2) y: 후보별 미분류율=P2/(P1+P2) or M2/(M1+M2).

 

 

 

 

 스크린샷 2017-09-02 오후 12.10.11.png

 

 

그림3:  18대선 전국에서 미분류율과 60세이상 노령층 비율 사이의 관계: (1) x: 지역 60 이상 투표자들의 비율 (%); (2) y: 후보별 미분류율=P2/(P1+P2) or M2/(M1+M2).

 

 

그림3 미분류율이 노령층의 비율이 높아짐에 따라 커지는 것을 보여줌과 동시에 노령층 분포만으로는 설명하지 못하는 점도 나타냅니다. , 연령 분포와 상관없이 후보1 지지자들은 (빨간색) 후보2 지지자 (파란색) 보다 비정상표인 미분류표를 많이 만들었다는 것을 뚜렷하게 보여줍니다. 그런데 점을 가설2 설명하지 못하고 있습니다. 부분을보수 설명하려면, 보수 투표자들은 보수가 아닌 투표자들보다 비정상적인 도장표를 많이 만들어 낸다는 사실을 인정해야 합니다.

 

셋째, 가설2 미분류표가 노령층에 의해서 발생한다고 했는데, 특히 50 (50~59) 분포만 보면 이를 뒷받침하지 않습니다. 50대의 분포가 18-22% 지역에서는 50대의 비중이 커져도 미분류율이 전반적으로 비슷하여 차이가 없는 것으로 나타났습니다 (그림4). 참고로 현상은18대뿐만 아니라 19 대선에서도 나타났는데, 가설2 뒷받침하지 않는 점을19 대선에서 더욱 뚜렷하게 보여줍니다 (그림5).

 

 스크린샷 2017-09-02 오후 12.10.34.png

 

 

그림  4:  18대선에서 미분류율과 50 연령층 비율 사이의 관계: (1) x: 지역에서 50  (50~59) 투표자들의 비율 (%); (2) y: 후보별 미분류율=P2/(P1+P2) or M2/(M1+M2).

 

 

 

 

 스크린샷 2017-09-02 오후 12.10.50.png

 

 

그림  5:  19대선에서 미분류율과 50 연령층 비율 사이의 관계: (1) x: 지역에서50  (50~59) 투표자들의 비율 (%); (2) y: 후보별 미분류율= M2/(M1+M2) in blue, H2/(H1+H2) in red or A2/(A1+A2) in green.

 

 

 

 

 

4. 19대 대선과 가설 1&2 요약

 

<더플랜>에서 제시한 K 이항 분포 (Binomial distribution) 적용하여 체계를 갖춘 것으로, 후보의 분류표와 미분류표 득표수가 각각 모두 크다고 가정한 기대값을 구한 것입니다. 그런데  19 대선의 13명의 후보자 중에서 전국 250 지역 모두에서 득표를 했다고 있는 후보는 후보이므로 K값을 후보1, 2, & 3에게만 적용합니다. 실제로는 득표 1, 2위를 당선자와 (후보1) 경쟁자 (후보2) 후보에게 적용하는 것이 선거 감시의  의도이지만, 가설을 검증하기 위해 후보를 비교합니다.

 

먼저 18 대선처럼 하나의 개별적인 예를 들겠습니다. 19 대선에서 가장 미분류율이 높았던 곳이 11%이었는데, 곳은 60 이상이 30% 정도인 지역입니다. 그런데 곳에서 나온 개의 K값은 1.06 (후보1/후보2) & 1.02 (후보1/후보3)  각각 1 가깝게 나타났습니다. 미분류율이 높은데도 개의 K값이 1 가깝게 나온 점이 가설2 예상과는 다름을 보여주는 하나의 사례입니다. 전체적인 면에서 19 대선 결과를 가지로 요약하겠습니다.

 

첫째, 19 대선에서 후보 사이의 K 값을 구해보면, 당선자 후보1 경쟁자 후보2 사이에서  K=0.6, 그리고 후보1 후보3 사이에서 K=0.8 나타났습니다.  것은 가설1 설명이 되지 않습니다. , 후보의 미분류율이 같지 않다는 판단에 이르게 됩니다. 그러나 어떻게 미분류율이 후보마다 다르게 나오게 되었는지는 가설1 설명할 없으므로 의문으로 남습니다. 반면에 가설2 이러한 미분류율 차이를 노령층의 도장표로 설명하려고 시도합니다.

 

18 대선에서는K>1로서 당선자가 상대 후보보다 미분류표에서 많이 득표함으로써 선출되었지만, 19 대선에서는 K<1로서 당선자가 상대 후보보다 미분류표에서 득표하였는데도 당선되었습니다. , <더플랜> K 선출된 후보가 상대 후보와 비교해서 미분류표를 통해 상대적 득표를 많이 또는 적게 했는지를 보여주는 척도로 이해하면 되겠습니다.

 

둘째, 가설2 19 대선의 미분류율을 제대로 설명할 있는지 살펴봅니다. 이를 위해서는 연령별 투표율과 후보 지지율 가지가 필요합니다. 18 대선과는 달리 2 나타나 있듯이 60 이상과 50 (50~59) 투표 성향이 달랐으므로 투표자들의 연령 그룹을60 이상, 50, 50 미만 그룹으로 조정합니다. 모든 미분류표가 도장표라고 가정하면, 미분류표에 정상표가 전혀 없다고 가정하면, 가지 연령 그룹에서 미분류표를 발생시키는 확률이 각각 6.6%, 2.9%, 2.5% 계산됩니다. (확률 계산 자세한 방법은 프로젝트 참고 http://www.projectboo.com/archive/153432)

 

 

여기에서 유의할 점은  이러한 확률값이 2 나와있는 연령별 투표율과  연령별 후보 지지율 가지에 의해 결정된다 사실입니다. 달리 말하자면, 연령별 후보 지지율에 대한 여론 또는 출구 조사 결과에 따라 확률값들이 바뀔 있고, 또한 이에 대한 신뢰할만한 자료가 없다면 확률값들을 구할 없게 된다는 뜻입니다. , 노령층 가설은 수량화 검증이 어려운 내용으로서 미분류표들을 미지의 영역으로 남게 하는 면이 있습니다. 점은 미분류표의 투명성을 약화시켜 공정성 의혹의 근거가 있으므로, 도장표 방지가 공정성을 지키는 데에 절대적으로 필요하다고 봅니다.

 

 

2:연령별 투표율과 후보 지지율 (출구 조사 결과 [5])

 

19 대선

60 이상

50

50 미만

투표율

24.4%

19.9%

55.7%

후보1

23.4%

36.9%

52.3%

후보2

48.4%

26.8%

9.4%

후보3

23.1%

25.4%

19.4%

 

 

그런데 확률들을  250 지역에 각각 적용해보면, 18 대선처럼 지역의 미분류 비율을 제대로 설명하지 못합니다. 예를 들면, 19 대선에서는 미분류표 비율이 실제로 3%~11% 사이로 나타난 반면, 가설2 따른 연령별 확률로는 3%~5% 사이의 예상값이 나옵니다. 가설2 심정적으로 받아들이기 쉽고 현실성이 있는 것으로 여겨지나, 충분한 설명을 하지 못하는 것으로 판단하게 됩니다.

 

셋째, 가설2 60 이상과 50 투표자들이 50 미만 투표자들보다 미분류표를 상대적으로 많이 만들어 낸다고 설명하고 있으며, 앞에서 살펴본 확률로도 차이가 있음을 보았습니다. 가설2 옳고 또한  출구 조사 연령별 지지율이 (2) 신뢰할만 하다고 가정하면, 19 대선에서 나타난 후보1 후보3 미분류율을 이해하기 어렵게 됩니다. 2 의하면 후보350 이상 (60 이상 포함) 연령 그룹에서 후보1보다  지지를 받은 것으로 나타났기 때문에 미분류율이 후보1 보다 작게 나타나야 하는데 실제로는 높게 나타났습니다 (그림6).  따라서 현상도 가설2 설명되지 않습니다.

 

 스크린샷 2017-09-02 오후 12.11.30.png

 

 

그림6:  19대선에서 미분류율과 50 이상 노령층 비율 사이의 관계: (1)x: 지역에서 50 이상 투표자들의 비율 (%); (2) y: 후보별 미분류율= M2/(M1+M2) in blue, H2/(H1+H2) in red or A2/(A1+A2) in green.

 

 

 

 

 

5. 제안과 결론

 

1) K=1 정상인가?

일반적으로 공정한 선거라고 , 연령이 높다고 미분류표를 많이 만들어 내고, 또는 지지하는 후보에 따라 미분류표 비율이 달라지는 것을 정상적이라고 생각하기 어렵습니다. 공정한 선거와 공정한 선거시스템을 구별할 필요가 있습니다. 18대와 19 대선 결과를 보면, 한국의 투표 방법이 (투표지 디자인과 도장 크기 등등) 미분류표 발생 과정에 많은 영향을 미치는 것으로 보입니다. 이것은 선거시스템의 문제입니다. 공정한 선거를 견인할 있는 공정한 선거시스템이 아니라고 있습니다. 따라서 연령이나 후보에 따라 미분류율이 달라지는 것을 당연하다고 받아들이기 전에, 달라지고 있는지 알아보고 원인을 제거함으로써 모든 후보의 미분류율이 같아지도록 개선하는 것이 절대적으로 필요합니다.   K=1 정상이 되는 투개표 환경을 만들어 나가면서, 전자개표기 사용을 감독할 있는 여건을 만들어 나갈 때에만 공정한 선거를 통계적으로 확인할 있게 됨을 강조합니다.    

 

예를 들어 전자개표기를 사용하는 한국의 투개표 시스템과 비슷한 선거 시스템을 운영하는 다른 나라가 있다고 가정합니다. 나라에서는 투표지 디자인과 투표 표시 방법을 한국과 다르게 사용하고 있습니다. 선거에K 적용하면 어떠한 결과가 나올까요?  K 어떤 값이 정상이 될까요? 한국뿐만 아니라 다른 나라의 선거까지 고려하면서 일반적 선거 검증 도구로 K 적용된다면, K=1 정상이라는 전제 아래 선거 결과를 분석하는 것이 적절할 것입니다.

 

다른 예를 들자면, K 전체 미분류율과 상관이 없이 적용될 있습니다. 18대와 19 대선에서 전국 합하여 대략 4% 정도의 미분류율이 나왔는데, 만약 미분류율이 20% 커진다고 하더라도 K값이 1 가까이 나온다면 정상적 선거가 이루어졌다고 판단할 있습니다. 전자개표기가 낙후되어 또는 준비가(calibration) 잘못되어 미분류율이 높아진다하더라도 후보별 미분류율이 같다면 (K=1), 기계적 문제일 개표의 공정성 문제는 아닙니다. 역시 한국에서 K=1 정상이 되는 선거 환경을 만들어가야 하는 이유가 됩니다.     

 

2) K=1 되는 선거 환경을 만들 있을까?

결론부터 말하자면 가능합니다. 노령층 가설은 가지를 가정하고 있습니다. (1) 노령층이 도장표를 만든다; (2) 노령층이 특정 후보를 지지한다. 여기에서 (2) 투표권을 가진 누구에게나 주어지는 권리이므로 반론의 여지가 없습니다. 그런데 (1) 뜻하는 것은노령층은 도장을 제대로 찍지 못한다라는 의미입니다. 노령층 가설과는 별도로 도장표를 만드는 투표자들의 특성에 따르자면,  보수는 도장을 제대로 찍지 못한다”[2], 또는특정 후보의 지지자들은 도장을 제대로 찍지 못한다라는 해석이 나오기도 합니다.

 

그런데 (1) 도장표는 방지할 있습니다. 노령층도, 보수도, 또는 특정 후보 지지자들도 불필요한 책임에서 벗어날 있습니다. 투표지 디자인과 도장찍는 방법 등등 투표 방식의 개선을 통해서 가능합니다.  현재 사용되는 투표지와 도장을 그대로 사용한다면, 그림7 있는 도구를 사용하여 지지하는 특정 후보에 도장을 제대로 찍을 있도록 도움으로써 도장표를 방지할 있습니다. 외의 여러가지 방법으로 도장표 방지가 가능할 것입니다.

 

다른 , 도장표를 방지하여 K=1 정상이 되는 선거 환경을 만든다면, 사전투표 감시 또는 개표 과정 감시에 따르는 비용과 수고를 줄이게 되는 장점이 생깁니다. K-값만 개표 확인하고,  K-값이 1보다 개표소에 대한 검증만 하면 됩니다.

 스크린샷 2017-09-02 오후 12.11.48.png

 

 

그림7: 투표지 도장 제대로 찍기를 돕는 도구   

  1. 도장을 찍을 있는 구멍.
  2. 투명한 카버로 투표지를 있으나 도장을 찍을 없음.
  3. 높이는 후보 3명을 카버할 있을 정도.
  4. 넓이는 손으로 만질 여백을 위해 투표지보다 넓게.

(아이디어: Kim, MH, 디자인: 프로젝트 )

 

3) 18 대선의 K=1.5값이 의도된 것인가? (Intentional or Unintentional?)

K=1.5 설명하는 방법으로 <더플랜>에서 제시한 방법과 (시나리오) 가설2 사이에 차이점이 있습니다. <더플랜>에서는 정상표가 미분류로 것으로 간주하고 플랜에 의해 의도적으로 K=1.5이라는 결과가 나온 것으로 설명한 반면에, 가설2 어떠한 의도 없이 노령층 도장표로  K=1.5 설명하려고 합니다. 여기에서 비교 판단하는 근거는 가지 방식이 얼만큼 실제 대선 결과를 반영할 있느냐는 것입니다. 왜냐하면 가설을 세울 때의 궁극적 목적은 선거 결과를 재구성하는 것입니다. 가설2로는 18대와 19 대선을 제대로 재구성하지 못함을 앞에서 밝혔습니다. 반면에 <더플랜>에서 제시한 방법은 18 대선 재구성을 제대로 했습니다 (1).

 

<더플랜>에서 제시한 것은 18 대선이 의도적이었다고 단정적 결론을 내린 것이 아니라, K값은  승리방정식에 의해 미리 설정될 있고 (<더플랜>에서 언급되지 않았음), 이러한 플랜에 의해 전자개표기를 프로그램하면  K=1.5 만들어질 있음을 시뮬레이션을 통해 보였고 동시에  것이 가능함을 실험을 통해 보였습니다. 또한 미분류율에 영향을 미치는 다른 요인이 있을 있으므로, K=1.5 만들어지는 방법이 다양할 있다고 <더플랜>에서 언급하였습니다. 통계적 분석으로는 증상만 판단할 (K=1.5) 원인을 확정할 없다고 한계도 밝혔습니다. 누가 어떻게 시도했느냐를 밝히는 것은 통계적 분석 범위를 넘어서는 것이므로, 전자개표기를 사용하는 한국 선거 시스템의 잠재적 문제성을 인식하고 개선해 나가자는 것이 <더플랜> 핵심임을 다시 밝힙니다. 따라서 어떠한 의도도 없이 선거 결과를 제대로 재구성 있도록 가설2 보완이 되든지 또는 다른 가설이 나오지 않는 , <더플랜>에서 제시한 의도성은 여전히 남아있다고 있겠습니다. , 어떤 가설로도 K=1.5 자연스러운 현상이라고 제대로 설명할 없다면, <더플랜>에서 제시한 방법이 마지막 카드로 남는 것이 되겠습니다.

 

하지만 가설2 18 또는 19 대선 결과를 전체는 아닐지라도 일부를 설명할 있음을 확률을 통해 보았습니다. 만일 가설2 전적으로 옳다면, 미분류표에 정상표는 소수이고 도장표가 대부분 이라면, 한국 사회의 고령화에 따라 점점 미분류표는 많아질 수밖에 없고, 이러한 면이 공정한 개표를 검증할 없게 만드는 원인이 있습니다.  현재의 투표 시스템을 정밀하게 분석하여, 앞으로 노령층에 의한 도장표가 사라지도록 개선해 나가야 것입니다. 미분류표가 만들어지는 책임을 노령층에 돌리지 말고, 투표 방식을 개선해 연령에 상관없는 투표 시스템을 구축해나가야 공정한 선거를 치를 있게 됩니다.

 

<더플랜>에서 제시한 시나리오에서는 연령별 후보 지지율을 고려하지 않았습니다.  이에 대한 정보는 방송사 또는 신문사 조사 결과에만 전적으로 의지해야 하는데 일관되지 않은 결과들이 나오므로 신뢰도에 문제가 있다고 판단했고 또한 지역별 자료는 없거나 샘플 수가 작으므로 시뮬레이션에 반영하지 않았습니다. , 확실히 신뢰할 있는 자료만 참고하였습니다. 그럼에도 불구하고  <더플랜> 시나리오를 구상할 당시 연령별, 성별 분포와K값들을 살펴보았으나, 연령별 후보별 지지율을 고려하지 않았던 점은 연구의 한계였습니다.

 

끝으로 <더플랜> K 5년마다 실시하는 대선에 계속 활용해 나가기를 기대합니다. 당선자와 상대 후보를 비교 판단하는 기준으로 적용하고, 특히  K>1 경우 노령층 가설 또는 다른 가설들로 충분히 설명할 있어야만 선거 분석이 완성된다고 있겠습니다.  다른 , <더플랜> K 대선마다 적용하면, 전자개표기를 통해 시도하려는 선거 부정을 미리 방지하는 예방 효과도 있습니다. 앞에서 살펴본 것들을 모두 종합하자면, K=1 있는 선거시스템으로 개선하여,  한국의 투개표 방식을 감시하고 공정한 선거 민주주의를 이끌어 가는 것이 바람직하다는 결론을 내립니다.      

 

 

 

 

 

6. 자료 출처

 

1) 김어준, 최진성더플랜,  Available at  https://youtu.be/aGGikPMNn2w

2) 뉴스타파,   19대선 - K값은 1.6…정규분포,  Available at  http://newstapa.org/40171

3) 중앙선거관리위원회, 18 대통령선거 개표부정  의혹 영화 ( 플랜) 대한 입장 Available at http://nec.go.kr/portal/bbs/view/B0000342/35474.do?searchYear=2017&menuNo=200470

4)  행정자치부, 연령별 인구통계,  Available at  http://rcps.egov.go.kr:8081/ageStat.do?command=month

5) 경향신문, 방송3 출구조사

 

참고: 18 대선 자료는 <더플랜> 연구팀이 선관위로부터 받은 개표상황표를 근거로 251 개표소 단위로 정리 검증하였으나, 19 대선 자료는 250 개표소 단위로 정리된 자료를 뉴스타파로부터 받았습니다.

 


스크린샷 2017-09-02 오후 12.14.55.png

 

스크린샷 2017-09-02 오후 12.15.28.png

 

스크린샷 2017-09-02 오후 12.15.58.png

 

스크린샷 2017-09-02 오후 12.16.39.png

 

스크린샷 2017-09-02 오후 12.17.03.png

 


  1. 18대와 19대 대선 데이타에서 나온 K값에 대한 설명 (세 번째 자료)

  2. 18 대 대선 데이타에서 나온 K=1.5 에 대한 보충 설명

  3. "더플랜" K1.5에 대한 반론가설 검증

  4. 개표 과정 상세 보기

  5. 2012 아카이브란

  6. 종로구

  7. 중구

  8. 용산구

  9. 성동구

  10. 광진구

  11. 동대문구

  12. 중랑구

  13. 성북구

  14. 강북구

  15. 도봉구

  16. 노원구

  17. 은평구

  18. 서대문구

  19. 마포구

  20. 양천구

  21. 강서구

  22. 구로구

  23. 금천구

  24. 영등포구

  25. 동작구

  26. 관악구

  27. 서초구

  28. 강남구

  29. 송파구

  30. 강동구

  31. 중구

  32. 서구

  33. 동구

  34. 영도구

  35. 부산진구

  36. 동래구

  37. 남구

  38. 북구

  39. 해운대구

  40. 기장군

  41. 사하구

  42. 금정구

  43. 강서구

  44. 연제구

  45. 수영구

  46. 사상구

  47. 중구

  48. 동구

  49. 서구

  50. 남구

  51. 북구

  52. 수성구

  53. 달서구

  54. 달성군

  55. 중구

  56. 동구

  57. 남구

  58. 연수구

  59. 남동구

  60. 부평구

  61. 계양구

  62. 서구

  63. 강화군

  64. 옹진군

  65. 동구

  66. 서구

  67. 남구

  68. 북구

  69. 광산구

  70. 동구

목록
Board Pagination Prev 1 2 3 4 Next
/ 4