산업 IT

'이루다' 개발에 쓴 카톡 대화, 온라인에 그대로 공개됐다

서비스 종료된 인공지능(AI) 챗봇 ‘이루다’ 개발에 사용한 소스(프로그램 재료)가 온라인 오픈소스 플랫폼에서 15개월 간 공유돼 온 것으로 확인됐다. 공개된 소스에는 이용자 실명과 거주 지역 등이 그대로 드러나 있어 논란이 확산 될 전망이다.

13일 개발자 커뮤니티 텐서 플로우 코리아에 올라온 ‘이루다’ 개발 소스 내 카카오톡 대화. 실명과 장소는 개인정보 보호를 위해 비식별화했다. /텐서 플로우 코리아 캡처13일 개발자 커뮤니티 텐서 플로우 코리아에 올라온 ‘이루다’ 개발 소스 내 카카오톡 대화. 실명과 장소는 개인정보 보호를 위해 비식별화했다. /텐서 플로우 코리아 캡처



13일 IT업계에 따르면 스캐터랩은 지난 2019년 10월부터 오픈소스 공유 플랫폼 ‘깃허브(GitHub)’에 카카오톡 대화를 활용한 인공신경망 소스를 공개해왔다. 깃허브는 개발자들이 프로그래밍 소스를 공유하는 대표적인 플랫폼이다.


스캐터랩이 공유한 소스에는 이루다 학습에 사용된 것으로 알려진 ‘연애의 과학’ 앱 사용자들의 대화 내역 100건이 비식별화(익명화)되지 않은 채로 들어 있다. 100건의 대화에 포함된 카카오톡 채팅은 총 1,700여 건에 달한다. 이 소스 내에선 연애의 과학 이용자 실명이 20번가량 노출된다. 대화 상대방이 연인 관계인지 친구인지도 구분돼 있다. 거주지역을 알 수 있는 내용은 물론 직장 정보도 등장한다. “혈당을 뽑아서 측정한다”는 등 건강 관련 정보도 눈에 띈다.

관련기사



이 사실은 IT 개발자 소셜네트워크(SNS) 커뮤니티를 통해 알려졌다. 논란이 일자 스캐터랩은 이날 깃허브 게시물을 삭제한 상태다.

이루다는 스캐터랩이 지난달 23일 출시한 AI 챗봇이다. 출시 2주 만에 75만 명에 달하는 이용자를 모았지만 성희롱·사회적 약자 혐오 등 논란을 빚었다. 스캐터랩이 지난 2016년에 출시했던 연애의 과학 앱의 개인정보를 사용했다는 의혹도 일었다. 스캐터랩은 지난 12일 이루다 서비스를 종료했지만 이용자 반발은 잦아들지 않고 있다. 연애의 과학 이용자 300여 명은 집단소송을 준비하고 있다. 개인정보보호위원회는 한국인터넷진흥원(KISA)과 함께 스캐터랩이 개인정보보호법 등을 위반했는지에 관한 현장 조사에 나섰다.


윤민혁 기자
<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>




더보기
더보기





top버튼
팝업창 닫기
글자크기 설정
팝업창 닫기
공유하기