사회 사회일반

한국형 AI로 보이스피싱범 잡는다…"외산 대비 77% 기능 향상"

범죄조직 군집화 기능 세계 최초 구현

국과수, 이달 말부터 사기범 목소리 감정에 활용

자료제공=행안부자료제공=행안부




정부가 보이스피싱범의 목소리를 분석하는 인공지능(AI) 모델 자체 개발에 성공했다.

행정안전부는 보이스피싱 사기범 검거에 활용할 수 있는 ‘보이스피싱 음성분석 모델’을 개발하고 이달 말부터 음성 감정 등 사기범 수사 과정에 활용한다고 22일 밝혔다.행안부 통합데이터분석센터는 국과수와 함께 지난해부터 보이스피싱 화자(話者) 구분 정확도를 높이고 범죄연루자 그룹화가 가능한 모델 개발에 착수했다.



최신 AI 딥러닝 기술이 적용된 이번 모델 개발에는 국내외 일반인 및 보이스피싱 사기범 6000여 명으로부터 추출된 100만 개 이상의 외국어와 한국어 음성데이터가 활용됐다. 행안부는 성능 검증 결과 범죄자의 음성을 기존 범죄자와 옳게 매칭하는 비율이 기존 외국산 분석모델보다 약 77% 향상됐다고 설명했다.

관련기사



100개의 범죄자 음성을 감정했을 경우 기존모델에서는 목소리 동일성 여부를 28개만 판별해낼 수 있었지만, 새로운 모델에서는 51개까지 판별 가능했다. 나머지 49개에 대해서는 '알 수 없음'이라는 답을 내놨다.

이번 모델에서는 기존 모델에서 기대할 수 없었던 범죄가담자 그룹화 기능도 세계 최초로 구현할 수 있게 됐다. 범죄자 그룹화는 사건별 범죄자 목소리의 연쇄 비교과정을 거쳐 동일인을 확인하거나 군집화하는 작업이다. 서로 다른 범죄에서 보이스피싱범들의 역할이 다르더라도 분석을 거쳐 이들이 같은 범죄 조직에 소속됐다는 것을 확인할 수 있게 됐다는 뜻이다.

국립과학수사연구원은 그동안 러시아와 영국에서 개발한 음성분석 모델을 활용해 보이스피싱 수사에 필요한 음성감정을 해왔다. 하지만 외국어로 학습된 모델 특성상 한국어를 사용하는 범죄자를 기존 범죄자 집단에서 특정하는 정확도는 약 30%에 불과해 한계가 있었다. 또 보이스피싱 범죄조직은 수사관, 검사 등 사칭하는 역할별로 그룹을 지어 활동하고 있는데 기존 모델에는 범죄에 연루된 사람들을 분류하는 기능이 없었다.

국과수는 새 모델을 이달 말부터 보이스피싱 사기범 목소리 감정에 활용한다. 보유하고 있는 약 1만 개의 보이스피싱범 음성데이터를 분석해 범죄조직을 그룹화하고, 검거된 범죄자의 음성과 이미 확보한 범죄 음성데이터를 비교해 일치 여부에 따라 여죄를 확인한다. 경찰청과도 모델을 공유해 보이스피싱 범죄 초동수사의 속도와 검거율을 높인다. 새 모델로 분석한 보이스피싱범의 음성은 금융감독원 사이트에도 공개하고, 올해 하반기 국제 행사 등을 통해 이 모델을 해외에도 확산할 방침이다.

한창섭 행정안전부 차관은 “새로 개발된 보이스피싱 음성분석모델은 데이터 분석을 통해 사회현안을 해결하는 디지털플랫폼정부의 구체적 성과물에 해당한다”며 “앞으로도 데이터기반의 일 잘하는 정부구현을 위해 국민이 필요로 하는 분석과제를 발굴하고, 분석된 결과를 현장에 적극 활용해 나갈 것”이라고 말했다.


김창영 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기