산업 IT

AI의 눈으로 본 대선후보…단어·어휘복잡도 어떨까?



파운트AI는 대선 후보들의 첫 번째 TV 토론회부터 정밀하게 분석하고 있다. 후보들의 주요 발언은 물론 인터넷 댓글 반응 등도 분석 대상이다.

대선 토론이 진행되는 동안 후보들이 던진 말들을 머신러닝(인공지능 기법 중 하나) 기술을 활용해 낱낱이 뜯어보는 것이다.

이를 통해 각 후보별 어휘 복잡도 및 사용한 단어의 상위 랭킹 등을 알기 쉽게 전달하고 있다.


박철웅 파운트AI 박사는 “일반 대중을 대상으로 하는 연설은 그 무엇보다 쉽게 전달하는 것이 중요하기 때문에 보통의 경우 복잡도가 10을 넘지 않는다”며 “복잡성 분석이나 사용 단어가 절대적인 지표는 아니지만, 후보자별 성향을 파악하는데 있어부분적으로 도움이 될 것”이라고 설명했다.

관련기사



결과를 보면 우선 처음 진행된 1차 토론회보다는 2차 스탠딩 토론회에서 후보자들의 어휘 복잡도가 전체적으로 하락했다. 특히 문재인 후배에게 질의 응답이 압도적으로 많아졌으며, 문 후보는 짧은 문장의 응대가 많아졌다. 이는 스탠딩 토론의 특성상 명확한 의미전달을 위해 단문을 많이 사용한 것으로 보인다.

지난 달 25일 네 번째로 펼쳐진 토론회에서 문 후보는 정책본부·하하하·이명박·차별·일자리·평가·합법화·규정·OECD·입학 등의 단어를 가장 많이 썼다. 홍준표 후보는 희열·청와대·가산점·그리스·재판·패악·노동정책·사형·가족·헌법수호를, 유승민 후보는 태도·계산·공격·중부담·비정규직·줄푸세·실전 배치·4대 재벌·사드·기권을, 심상정 후보는 정직·굳세어라·시중노임·포괄임금·존중·김미경·강군·4차 혁명·안전·평화 등의 단어를 주로 사용한 것으로 나타났다. 자세한 자료는 인공지능 챗봇 ‘로즈’를 통해 찾아볼 수 있다. 카카오톡 플러스친구에서 ‘대선봇’을 검색하면 누구나 쉽게 사용 가능하다.

권용민 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기