‘블랙스완’의 저자인 나심 탈레브는 “빅데이터는 더 많은 정보를 뜻할 수 있지만, 더 잘못된 정보를 뜻하기도 한다”고 했다. 이는 통계의 맹점을 잘 설명해주는 말이다. 오늘날 통계는 여러 사회 현상을 설명하는 데 유용하게 쓰이지만, 한편으로는 통계로 인해 사회 현상이 왜곡되는 경우도 종종 보게 된다. 또 의도적이지는 않더라도 통계를 산출하는 기관이 기존 관행에 젖어 수년간 무의미한 통계를 생산하는 경우도 종종 볼 수 있다.
한국감정원이 매 분기 마다 발표하는 상업용 부동산 통계에서도 그런 점이 발견된다. 감정원은 상업용 부동산 통계 조사를 추진한 경위에 대해 ‘해외 자본의 국내 투자 및 리츠 등 부동산 간접투자의 활성화와 같은 부동산 투자환경의 변화로 상업용 부동산에 대한 시장정보 수요 증대’ 때문이라고 설명하고 있다.
하지만 이 목적에 부합하는지는 의문이다. 감정원의 통계가 시장에서 잘 쓰이지 않고 있기 때문이다. 상업용 부동산 시장의 주요 기관투자자들이 감정원의 상업용 부동산 통계를 잘 활용하지 않는 것은 실제 투자하는 대상과 비교하기에는 감정원이 조사하는 표본의 범위가 너무 광범위해 적확하지 않기 때문이다. 감정원이 조사하는 824개 오피스의 선정 기준은 건축 연면적 50% 이상이 임대되고 있는 6층 이상의 빌딩이다. 또 전체 표본 중 절반(404개동)은 서울이고, 나머지는 전국에 흩어져 있다. 기관들은 주로 서울 도심 한복판에 위치한 수천억원대의 오피스를 사고파는데 감정원은 서울에서부터 제주에 이르기까지 모든 중소형 빌딩을 가지고 통계를 낸다. 기관이 아닌 일반 개인투자자들에게 유용하다고 보기도 어렵다. 수익률 산출 방식에도 문제가 있기 때문이다. 감정원이 제공하는 자본수익률은 매매가가 아닌 감정가를 기준으로 계산하는데 그러다 보니 현실의 숫자와 맞지 않는 부분이 있는 것이다. 없는 것보다는 낫다고 할 수도 있지만 이처럼 감정원의 통계는 실제 기관들이 투자 시 참고하기에는 한계가 뚜렷하다. 빅 데이터가 더 잘못된 정보를 뜻하는 현상이 나타나는 것이다.
관련 통계는 지난 2002년부터 조사되고 있다. 한 해 100억원의 예산이 들어간다. 이 통계가 잘 활용되지 않는 것은 수년 전부터 알려진 사실이다. 쓰임새가 떨어지는 통계를 관성적으로 작성하는 것보다 의미가 있고 활용도가 높은 통계를 작성하는 데 자원을 투입하는 것은 어떨까라는 생각을 해본다. 이를테면 실제 감정원이 조사하는 상업용 부동산 통계 중 소규모 상가나 집합 상가 등의 임대료, 공실률 등에 대한 자료는 민간 기관이 맡기 어려운 부분이고, 이를 잘 활용하면 최근 어려움을 겪고 있는 자영업자들에게도 유용한 정보가 될 수 있다.
/고병기기자 staytomorrow@sedaily.com