서비스 메뉴 바로가기 본문 바로가기 아티클 바로가기 프로그램 목록 바로가기

[JTBC빅데이터랩] 관심지수 尹 56 vs 李 44…두 후보 모두 부정 언급 많아

입력 2021-11-17 14:00 수정 2021-11-23 17:40

JTBC 기획·개발 '빅데이터랩' 본격 가동
뉴스·SNS·커뮤니티서 대선 텍스트 추출
데이터 수집 후 실시간 대선 흐름 분석

尹, 후보 결정 뒤 소강…광주 방문으로 반전
李, 낙상사건 때 관심 하락…전국 순회로 상승
전선 없이 각자 행보로 관심도 엎치락 뒤치락

크게 작게 프린트 메일
URL 줄이기 페이스북 X

JTBC 기획·개발 '빅데이터랩' 본격 가동
뉴스·SNS·커뮤니티서 대선 텍스트 추출
데이터 수집 후 실시간 대선 흐름 분석

尹, 후보 결정 뒤 소강…광주 방문으로 반전
李, 낙상사건 때 관심 하락…전국 순회로 상승
전선 없이 각자 행보로 관심도 엎치락 뒤치락

JTBC가 기획ㆍ개발한 대선 빅데이터 분석 플랫폼 'JTBC 빅데이터랩' 분석 결과, 국민의힘 윤석열 후보가 이슈 집중력(*아래 용어설명 참조)에서 더불어민주당 이재명 후보를 앞서가고 있는 것으로 나타났습니다.

17일 오전 현재 빅데이터랩의 관심 지수 비교에서 이재명 후보와 윤석열 후보는 각각 44대 56을 기록했습니다.

24시간 데이터를 주력 분석 대상으로 삼는 JTBC 빅데이터랩 관심지수(*용어설명)는 뉴스와 SNSㆍ온라인 커뮤니티 등 인터넷에 올라온 기사와 게시글을 모은 뒤 핵심 메시지가 있는 텍스트들만 따로 추출해 분석합니다.

이 텍스트에서 각 후보와 연관되는 키워드와 중심 어구들이 이슈를 중심으로 얼마나 강하게 밀집하는 지 집중력을 측정해 관심지수로 환산했습니다.

17일 오전 기준 빅데이터 분석에서 이재명 후보는 실질 언급량(*용어설명) 1382건, 윤석열 후보는 1204건이었습니다. 이슈에 대한 집중도는 윤 후보(27.9)가 이 후보(22.3)를 크게 앞섰습니다. 관심지수는 두 후보에 대한 이슈 집중도를 100으로 환산해 비교한 수치입니다.

JTBC 빅데이터랩은 키워드의 빈도 등 단순 언급량을 분석하는 게 아니라 언급량을 질적 평가해 실질적으로 후보들이 얼마나 관심을 받고 있는지를 심층적으로 접근하는 빅데이터 분석 시스템입니다.

후보에 대한 관심의 양과 강도만 평가해선 관심의 성격을 알 수 없습니다. 긍정·부정 감성 분석이 뒷받침돼야 충실해 집니다. 빅데이터랩은 24시간 전 최신 데이터를 분석할 뿐 아니라 일주일 누적 데이터도 함께 분석합니다.


지난 일주일간 두 후보에 대한 긍정ㆍ부정 언급을 분석한 호감도 평가는 어떻게 나왔을까요. 두 후보 다 부정적 언급이 긍정보다 높게 나타났습니다.

 11월 10일~16일 더불어민주당 이재명 후보와 국민의힘 윤석열 후보에 대한 감성 분석 11월 10일~16일 더불어민주당 이재명 후보와 국민의힘 윤석열 후보에 대한 감성 분석

더불어민주당 이재명 후보와 국민의힘 윤석열 후보의 일일 감성 분석. 16일 24시간 수집한 데이터를 분석했다.더불어민주당 이재명 후보와 국민의힘 윤석열 후보의 일일 감성 분석. 16일 24시간 수집한 데이터를 분석했다.
부정적 언급을 주도했던 키워드는 이 후보의 경우 특검ㆍ수사ㆍ대장동이었습니다. 이 후보가 추가 재난지원금과 청년 관련 정책을 연일 쏟아내며 관심의 초점을 분산 시키는 데 주력하고 있지만 여전히 부정 프레임을 주도하는 키워드는 대장동 개발 관련 의혹이었다는 것을 알 수 있습니다.

윤 후보의 부정 키워드는 윤 후보에 대한 공수처 관련 수사와 특검이 주를 이뤘습니다.

부정적 인식이 긍정적 인식보다 앞선 상황에서 두 후보에 대한 관심 강도는 어떤 변화 양상을 보였을까요.

더불어민주당 이재명 후보와 국민의힘 윤석열 후보에 대한 관심도 추이.더불어민주당 이재명 후보와 국민의힘 윤석열 후보에 대한 관심도 추이.

관심도 추이에서 지난 5일 국민의힘 대선 후보 결정일 윤 후보는 73대 27로 이 후보에 앞섰지만 이후 소강 상태를 보였습니다. 이후 윤 후보는 10~11일 광주와 목포 등 호남 방문 일정을 소화하면서 다시 이슈 중심에서 관심을 키워갔습니다.

반면 이 후보는 아내 김혜경씨 낙상 사고 관련 지난 9일 일정을 전면 취소하면서 당일과 그 다음 이틀간 이슈 집중력을 잃었으나 12일 전국 순회 행보에 나서면서 관심도에서 다시 윤 후보를 앞서나가기 시작했습니다. 이 후보는 부산에서 "부산 재미 없다"는 등의 논쟁성 강한 발언으로 주목을 끌었고 재난지원금 지급과 전방위 청년 스킨십 등 다채로운 행보를 이어가고 있지만 '묵직한 한방'이 없어 관심도가 하락한 것으로 분석됐습니다.

윤 후보는 호남 방문 이후엔 뚜렷한 이슈 없이 선대위 구성과 인선을 놓고 신경전이 이어지면서 이 후보에 비해 이슈 집중력을 보이지 못했습니다. 하지만 진통 끝에 선대위 인선의 윤곽이 나타나기 시작하면서 관심도가 상승하기 시작해 이재명 후보와 경합 국면에 들어갔습니다. 특히 16일에는 '1주택 종부세 면제' 등 종부세 부과를 앞두고 관련 메시지가 퍼지면서 관심도에서 역전이 일어난 것으로 분석됐습니다.

이 기간(12~16일) 윤 후보의 핵심 관련어는 주요 경쟁 상대인 이재명 후보였습니다. 윤 후보는 단조롭다고 할 수 있을 정도로 정중동 행보를 보이고 있지만 이 후보가 이슈성 강한 발언으로 논란에 휩싸일 때마다 주요 경쟁 상대로서 윤 후보가 반사이익을 챙기고 있는 구조를 설명해주고 있습니다.

야구광인 윤 후보가 14일 프로야구 한국시리즈 1차전이 열린 고척스카이돔을 찾아 관람하면서 관심을 끌어 고척스카이가 핵심 키워드로 부상하기도 했습니다.

심상정 정의당 대선후보와 안철수 국민의당 대선후보까지 포함된 관심지수 분석에선 심상정 후보가 상대적으로 강한 이슈 집중력을 보였습니다.

11월10일~16일 대선후보 4인의 관심지수 비교. 11월10일~16일 대선후보 4인의 관심지수 비교.

11월10일~16일 대선후보 4인의  긍정·부정 감성 비교.11월10일~16일 대선후보 4인의 긍정·부정 감성 비교.

용어 설명 :
실질 언급량 = 뉴스와 온라인 커뮤니티, 블로그, SNS에서 검색어 관련 키워드ㆍ핵심 어구가 추출된 글(또는 기사) 건 수
이슈 집중력 = 언어군집(키워드ㆍ핵심 어구들로 형성)의 밀도를 계산한 함수값
관심 지수 = 비교 대상들의 이슈 집중력을 100으로 환산해 나타낸 값

※ 빅데이터 분석은 선거 여론 조사와 다릅니다. 세대와 성별, 지역 등에 따라 표본 추출을 하는 여론조사와 달리 빅데이터 분석은 온라인에 올라온 텍스트만 분석합니다. 온라인상의 정치 관련 생각과 마음을 읽는데 특화된 분석 방법이기에 후보에 대한 지지도를 묻는 여론조사와 근본적으로 다릅니다. 분석 방법과 데이터 출처 등은 관련 기사(https://news.jtbc.joins.com/article/article.aspx?news_id=NB12033954)에서 참조하시기 바랍니다.
광고

JTBC 핫클릭