여고생 딸 '은밀한 비밀' 어이없게 들통
빅데이터가 ‘빅브라더’ 된다면…‘데이터 사이언티스트’ 육성 절실[빅데이터 3.0시대] 전문가 육성하라마케팅 활용 과정 개인정보 노출 부작용수집·분석 등 단계마다 데이터 오용 차단위한 제도·기술장치 마련을
유주희기자ginger@sed.co.kr양철민기자chopin@sed.co.kr
첫번째 사진은 기사 내용과 상관 없음
과연 빅 데이터가 모두를 이롭게 할까.
이와 관련해 드라마틱한 일이 미국에서 실제로 벌어졌다. 지난해 초 미네소타 주 미니애폴리스에 있는 종합유통업체 타깃(Target) 매장에 한 남성이 찾아와 항의했다. 그는“아직 고등학생인 딸 앞으로 임부복 할인쿠폰을 보내는 것은 문제가 있다”고 따졌다. 타깃은 빅 데이터를 기반으로 소비자가 앞으로 구입할 가능성이 높은 제품을 미리 추천하는 이메일 서비스를 제공해왔다. 지점장은 정중히 사과하며 손님을 달랬고, 며칠 후 다시 사과하기 위해 전화를 걸었다. 그런데 이 남성은 오히려 지점장에게 사과했다. “딸과 대화를 해 봤더니 정말 임신한 상태였다”는 것이었다.
항의한 남성의 딸은 대용량의 무향 로션, 칼슘ㆍ마그네슘 영양제 등 임신부에게 필요한 물품을 구입한 탓에 자연스레 임부복까지 추천 받게 됐다. 이 사건으로 타깃은 빅 데이터 기술을 활용한 정교한 마케팅이 사생활 침해나 개인정보 유출로 이어질 수 있다는 점을 깨달았다. 데이터 오용으로 인한 소비자 피해를 줄일 기술적인 분석체계와 정보관리자의 필요성도 절감했다. 타깃은 이후 무작위로 결정되는 추천 상품까지 섞은 쿠폰 메일을 보내는 것으로 이 문제를 해결했다.
◇빅 데이터가 개인정보ㆍ사생활 침해 주범?= 이는 타깃에만 벌어질 수 있는 일도 아니다. 페이스북이 최근 공개한 ‘그래프 서치(Graph search)’는 ‘서울 종로구에 거주하는 탱고 애호가’, ‘금융업종에 종사하는 A대 출신’등까지 섬세하게 찾아주는 빅 데이터 기반의 검색 서비스다. 문제는 ‘이성과의 만남 주선 사이트에 자주 접속하는 기혼자’가 검색될 가능성이다. 물론 페이스북은 이용자 각자가 공개토록 설정해 둔 정보만 활용하지만, 이용자 대부분은 개인정보ㆍ사생활과 관련된 설정 기능에 예민하지 않다.
주민등록번호 제도가 있는 우리나라에서는 더욱 심각한 문제가 발생할 수도 있다. 황병선 청강문화산업대 교수는 “다른 나라에서라면 정부의 국민 의료 데이터가 해킹되더라도 그걸로 끝이지만, 우리나라는 의료 데이터에 담긴 주민번호로 카드 사용 내역, 은행 데이터까지 다 노출될 수 있다”고 지적했다. 임종인 고려대정보보호대학원장은 “학문적 통계 등에 빅 데이터를 활용할 때도 익명을 유지하는 것이 중요하다”며 “빅데이터와 개인정보 문제가 충돌할 경우 개인정보보호법이나 정보통신망법을 통해 정부가 어느 정도 개입할 필요가 있다고 본다”고 말했다.
◇‘데이터 사이언티스트’육성해야=물론 이 같은 우려로 빅데이터를 포기할 수는 없다. 문제는 이를 어떻게 극복하느냐다. 류한석 기술문화연구소장은 “기업이 고의든 실수든 개인정보를 유출하는 경우에는 기업이 철저히 책임을 지게 해야 한다”며 “집단소송제 등의 엄격한 사후규제가 이뤄져야 할 것”이라고 말했다. 물론 정보의 수집ㆍ저장ㆍ분석ㆍ활용 과정에서 각 단계마다 익명성을 보장해 줄 수 있는 제도적ㆍ기술적 장치 마련은 필수다.
류 소장은 ‘데이터 사이언티스트’, 즉 데이터를 관리하고 분석하고 유의미한 결과를 뽑아낼 줄 아는 과학자들이 있어야 빅 데이터를 제대로 활용할 수 있다고 강조했다. 류 소장은 “우리나라는 데이터 사이언티스트가 전무하다”며 “정부가 6개월간 교육시킨다고 해결될 문제가 아니라 학교ㆍ기업이 잘 협조해 장기간의 교육 과정과 훈련을 통해 양성해야 한다”고 지적했다. 다행히 실제 사례도 등장하고 있다. 충북대 비즈니스데이터융합학과에는 지식경제부와 다음소프트, 위엠비, 유큐브 등의 지원 아래 빅 데이터 전문가 양성을 위한 석사 과정으로 개설됐다.
한편 빅데이터는 ‘만능 열쇠’가 될 수 없다. 빅데이터를 무작정 도입하기보다는 경영자들의 인식 변화가 절실하다는 목소리가 높다. 장영재 카이스트 교수는 “고속도로만 잘 깔아둔다고 해서 경제 발전이 이뤄지진 않듯, 막연한 기대로 인프라부터 투자해선 안 된다”며 “구체적인 목표를 잡고 어떤 의사 결정, 어떤 정보가 필요한지를 확실히 한 후 데이터를 찾아보는 방식이 돼야 한다”고 말했다. 박민주기자 parkmj@sed.co.kr