엄청난 속도로 증가하고 있는 디지털 데이터는 오늘날 기업에 선택을 요구하고 있다. 방대하고 다양한 형태의 빅데이터를 분석함으로써 더 큰 통찰력, 경제적 이익을 창출할 수 있는 기회가 많아진 반면 전략적으로 데이터를 활용하거나 보호하지 못할 경우에는 이 기회가 기업 운명을 바꾸는 위기가 될 수도 있기 때문이다.
현재 수많은 기업들이 앞다퉈 빅데이터 분석에 박차를 가하며 기업 성장을 앞당기고자 매진하고 있다. 실제로 EMC가 지난해 말 전세계 50개국 정보기술(IT) 전문가를 대상으로 실시한 설문조사 결과에 따르면, 79%에 달하는 응답자들이 기업의 사업 성공을 좌우하는 핵심 요인으로 빅데이터를 활용한 분석 능력을 꼽은 것으로 나타났다.
그러나 아직도 많은 기업들이 기하급수적으로 증가하는 다양한 형태의 빅데이터를 분석하는 데 골머리를 앓고 있다. 근본적인 어려움은 서로 다른 플랫폼에 기반한 분산된 스토리지에 데이터를 나눠 저장한 후 분석 작업을 수행하는 데서 기인하고 있다. 각 플랫폼에 정형화된 형태로 저장돼 있는 데이터를 복사해 분석을 수행하기 때문에 분석 업무의 효율성과 정확성이 현저히 떨어질 뿐만 아니라 한곳에서 통합적으로 데이터를 관리하기 어렵기 때문에 의료·금융 데이터 등 높은 기밀성이 요구되는 정보를 저장하기에는 적합하지 않다.
이러한 견지에서 빅데이터 분석을 통해 성과를 내기 위해서는 여러 종류의 프로토콜과 인터페이스를 지원해 상호 운용이 가능하고 데이터를 중앙에서 일관되게 관리할 수 있는 보다 혁신적인 접근법이 요구된다. 한국 EMC 등 업계는 이를 '데이터 레이크(data lake)'라고 칭하고 있다. '데이터 레이크'는 여러 개의 계곡에서 물이 흘러들어와 하나의 거대한 호수에 모이듯이 정형·비정형 형태의 여러 데이터를 분석하기 앞서 하나의 저장 공간에 모아 넣는 개념이다. 데이터 전체를 중앙에서 일관되게 관리하므로 최고 수준의 데이터 관리 및 보안 유지가 가능하며 고립되고 분산된 저장 환경에서 발생했던 정책 및 보호 범위 제한이 사라지기 때문에 잠재적 보안 취약성을 해소할 수 있다.
디지털 데이터는 우리 삶의 방식을 근본적으로 변화시키며 기업의 IT 환경에도 거대한 변화를 이끌어내고 있다. 기업의 IT 관리자는 방대하고 다양한 빅데이터 분석에 앞서 이를 한곳에 축적할 수 있고 실시간으로 접근이 가능하며 안전하게 보호할 수 있는 저장 인프라를 구축함으로써 보다 정확하고 가치 있는 정보를 도출하기 위한 주춧돌을 마련해야 할 것이다.