AI
AI PEN

투표율이 높으면 진보 정당이 유리할까? - 머신러닝이 밝혀낸 통념의 실체

엄기홍 기자 | 2025.07.22 | 조회 13

총선과 대선 데이터 분석으로 본 투표율과 정당 득표율의 상관관계

출처: 한국정치학회보

출처: 한국정치학회보

조진희 경희대 교수는 21대 총선과 20대 대선 유권자 설문자료를 분석해 투표율 변화가 정당 득표율에 미치는 영향을 머신러닝 기법으로 시뮬레이션했다. 연구 결과는 '투표율이 높으면 진보 정당에 유리하다'는 통념이 일부 상황에서는 성립하지만, 모든 선거에 보편적으로 적용되기 어렵다는 사실을 보여준다.

투표율은 언제나 정치 분석의 핵심 변수다. 특히 "투표율이 오르면 진보 정당이 유리하다"는 믿음은 오랫동안 정치권과 언론에 널리 퍼져왔다. 이 가설은 대체로 청년층이 진보 성향을 띠며, 낮은 투표율은 이들이 참여하지 않았다는 신호라는 전제에 기초한다. 그러나 이 통념이 실제 선거 결과에 얼마나 일관되게 나타나는지에 대해서는 실증적 근거가 부족하다는 지적도 꾸준히 제기돼왔다.

조 교수는 이러한 문제의식에서 출발해, 머신러닝 기반 예측모델을 활용하여 유권자 개개인의 투표 가능성과 지지 정당을 예측했다. 기존의 선거구 단위 집합적 분석의 한계를 극복하기 위해 개인 단위 데이터를 중심으로 분석한 점이 본 연구의 중요한 특징이다. 사용된 분석 기법은 소프트맥스 회귀, 랜덤포레스트, XGBoost, 딥러닝 등으로, 다양한 시뮬레이션을 통해 기권자가 투표했을 경우 결과가 어떻게 바뀌었을지, 특정 투표 방식의 비중이 높아졌을 경우 어느 정당에 유리했을지를 정밀하게 예측했다.

결과는 간단치 않다. 21대 총선의 경우, 투표율이 높아져도 거대 정당 간 득표율 격차는 크게 변하지 않았다. 기권자의 예측된 투표 선택도 실제 투표자와 크게 다르지 않았기 때문이다. 반면, 초박빙이었던 20대 대선에서는 상황이 달랐다. 이재명 후보에게 투표할 가능성이 높은 기권자가 많았던 만큼, 투표율이 조금만 더 높았어도 선거 결과가 뒤집혔을 수 있다는 시뮬레이션 결과가 나왔다.

사전투표율과 당일투표율에 대한 시뮬레이션도 흥미로운 통찰을 제공한다. 두 선거 모두에서 사전투표에 참여할 확률이 높은 유권자는 대체로 진보 정당 지지자였고, 당일투표는 보수 성향 유권자가 많았다. 그러나 사전투표율이 증가한다고 해서 항상 진보 정당에 유리한 것은 아니었다. 예를 들어, 20대 대선에서는 사전투표율이 더 낮았다면 이재명 후보에게 더 유리했을 수 있다는 역설적인 결과도 나왔다.

이처럼 투표 방식과 득표율 간의 관계는 단순하지 않다. 사전투표든 당일투표든, 일정 수준 이상으로 투표율이 올라가면 유권자 구성이 달라져 예측이 무의미해질 수 있다. 따라서 단지 '사전투표율이 높아지면 어느 정당이 유리하다'는 식의 해석은 과도한 일반화의 오류일 수 있다.

이번 연구는 정치권의 오랜 가설에 과학적 의문을 제기한다. '투표율이 높으면 진보에 유리하다'는 말은 상황에 따라, 선거의 맥락에 따라 달라진다. 선거제도 개편 논의나 사전투표제의 존폐를 둘러싼 정치적 공방이 계속되는 가운데, 이 연구는 데이터 기반의 신중한 판단을 요구한다.

향후 유권자 단위의 더 풍부한 데이터와 장기적인 설문 축적이 가능하다면, 머신러닝 기법을 활용한 보다 정밀한 분석이 가능할 것으로 보인다. 특히 세대별, 지역별, 이념 성향별 투표참여의 차이를 보다 미시적으로 파악하는 후속 연구가 이뤄질 필요가 있다. 정당은 단순한 투표율 기대가 아니라 실제 어떤 유권자가 어떤 방식으로 참여할지를 면밀히 예측해야 하는 시대에 접어들었다.

논문: https://www.riss.kr/link?id=A109792583 
유튜브: https://youtu.be/U2Wd2nDsGgs

엄기홍 기자 | theaipen.official@gmail.com