2012년 미국 대통령 선거에서 재선에 성공한 오바마 대통령의 대선캠프는 모금, 광고, 공약 등 모든 부문에서 데이터 분석을 통해 전략을 세웠다. 그리고 매일 6만 6,000번의 가상 선거를 통해 0.5% 포인트 미만의 오차범위로 50개 주의 결과를 성공적으로 예측해 냈다. 놀라운 일이지만 불가능한 것은 아니다. 그들이 수집한 방대한 자료(Big Data)에 숨어 있는 유권자들의 마음을 어떻게 해석해내느냐-
텍스트 마이닝(Text Mining), 평판 분석(Opinion Mining), 소셜 네트워크 분석(Social Network Analytics), 클러스터 분석(Cluster Analysis) 등의 기법-의 문제만 푼다면 말이다. 기업의 경우라면 어떤 제품을 기획, 생산, 홍보하기 전 ‘소비자의 마음을 먼저 읽고 이해하는 것’부터 시작해야 한다. 세계 경제 포럼에서 주요 아젠다가 되고 있는 ‘빅데이터’가 기업들의 비즈니스 태도부터 바꿔놓고 있다. 앞으로는 빅데이터를 해석하는 능력이 기업의 경쟁력을 결정지을 것이기 때문이다.
유부혁기자 yoo@hmgp.co.kr
데이터가 너무 많다. 전 세계 정보의 90%가 최근 2년 사이에 발생했다. 그중에서도 비정형 데이터(텍스트, 이미지, 동영상)의 비중이 점점 늘어나고 있다. 축적되는 데이터 95% 이상이 특정 문형이나 수치로 정형화 시킬 수 없어 해석하기가 힘들다. 하지만 실생활과 직접적 연관성이 높아서 활용도는 점점 커지고 있다. 많다고 버릴 수 없는 이유다. 기업들이 맞이할 내일은 어제와 오늘 발생한 데이터를 어떻게 해석하고 반영하느냐에 따라 달라질 것이다. 기업들이 전략적인 비즈니스 스토리를 가지고 ‘내일’을 준비하지 않는 것은 해당 기업과 투자자들에 재앙이다. ‘내일’을 준비하고 있는 미국의 기업(연 매출 10억 달러 이상)들 중 60% 이상이 빅데이터 관련 프로젝트를 기획하고 진행 중이다.
‘내일’을 가장 착실하게 준비하는 글로벌 기업 4인방은 구글, 아마존, 페이스북, 애플이다. 이들 기업의 특징이라면 우리 실생활에 인접한 서비스를 무료 또는 저가로 제공하는 대신 엄청난 양의 데이터를 구축하고 있다는 점이다. 애플의 '시리(Siri)’와 구글의 검색(하루 방문자 6억 2,000만 명, 하루 검색 10억 건,
페이지 뷰 72억 건)이 대표적인 예다. 구글은 검색 데이터를 통해 독감 유행을 예측해 냈는데 미국 질병통제 예방센터보다 1주일 앞선 결과다. 구글의 비즈니스 영역이 어디까지 확대될지 가늠할 수 없는 좋은 예다. 세계적 패션기업 ‘ZARA’는 세계 70여 개국에 2,000개의 매장을 가지고 있는데 소비자, 판매 데이터 분석을 통한 무재고 시스템 도입으로 매출 2억 3,000만 달러, 이익 2,800만 달러를 추가할 수 있었다. 시간을 예측해 기업들에게 기쁨을 안겨주기도 한다. 미국 반도체 업체 마이크론 테크놀로지는 데이터 패칭(흩어진 데이터를 모아서 의미 있는 데이터로 가치를 부여함)을 통해 생산 공정을 최적화시켜 생산시간을 10% 이상 단축시켰다.
우리나라는 어떨까? 삼성경제연구소 발표(2011)에 따르면 우리나라 데이터 통신량(963MB)은 미국(360MB)과 서유럽(458MB)보다 월등하다. 하지만 데이터를 수집해서 경영에 활용하는 기업은 19.4%다. 그나마 실무에 활용하는 데이터는 재무 데이터나 사내·외 보고서가 70%정도다. 우리 기업이 맞이하는 새로운 '위기'가 바로 미래성정동력을 찾을 때 ‘무엇을’ 할 것이며 ‘어떻게’ 시작하고 도전할 것인가다. 리더들은 고민하고 물어보며 통찰할 것이다. 또는 통찰력 있는 전문가를 찾을지 모르겠다. 그리고 그 통찰에 '확신'을 줄 근거가 필요할 것이다. 그들이 가지고 있는 데이터를 살펴보아야 한다. 당장 기업들은 전산실 스토리지부터 시작해서 고객들을 통해 소비와 판매 스토리를 읽어야 한다.
아마존 CEO 제프 베조스는 "우리는 아무것도 내다 버리지 않는다"고 말했다.
버리지 않는다면 쌓여가는 정보들을 어떻게 관리할까? 만약 보안에 문제가 발생한다면 그 문제에 대한 책임은 누가 져야 할까? 빅데이터가 개인정보보호에 있어 안전한 영역에서 다루어지는지에 대한 물음에 당당하게 “완전히 그렇다”고 말할 수 있어야 한다. 다행이라면 빅데이터는 개인이 아닌 집단을 들여다봐야 의미를 가진다는 점이다.
데이터를 다루는 데 일정한 기준과 함께 윤리, 접근권한에 대한 설정이 필요하다. 누군가에게 쓰레기지만 누군가에게는 다시 재생할 수 있는 자원이 될 수 있기 때문이다.
“데이터는 21세기 원유이며 데이터가 미래 경쟁우위를 좌우할 것”이라고 가트너는 말한다. 그러나 아직 우리는 원유생산에 만족할 뿐 산업전반에 사용하지는 않는다. 지금 데이터를 가치 있게 만들어 줄 통찰력 있는 전문가를 찾아야 한다.
정보통신산업진흥원은 국내 시장 빅데이터 도입률이 2~3% 수준에 불과하며 활용할 수 있는 인력이 100명 정도밖에 없다고 밝히고 있다. 당신의 기업은 어떤 문제가 있는지 무엇을 해야할지 고민하고 있나? 먼저 사회와 사람에 대해 깊이 통찰하고 활용할 수 있는 전문가를 찾아야 한다. 버나드 쇼 묘비에 새겨진 "우물쭈물하다 내 이럴 줄 알았지" 를 반복하지 않으려면 말이다.