코스콤, 금융투자업계 최초 빅데이터 구축

6월부터 고도화 프로젝트 착수

국내에서도 빅데이터를 활용한 주가 분석과 예측 시스템 개발이 본격화된다.

코스콤은 22일 지난 1월 착수한 ‘빅데이터 분석과 활용을 위한 파일럿 시스템 구축 프로젝트’를 4개월여 만에 성공적으로 완료하고 특허출원까지 마쳤다고 밝혔다.

코스콤 관계자는 “빅데이터 플랫폼의 핵심은 주가 예측 모델을 개발하는 것이며, 결과적으로 만족할만한 수준의 지수 및 개별종목의 주가 예측 정확도를 보이는 것”이라고 설명했다.

코스콤은 이를 위해 우선 증권매매시스템을 개발ㆍ운영하며 축적한 체결 및 종목별 호가 등의 내부데이터와 정부의 거시경제 데이터, 뉴스, SNS 등 외부데이터를 수집ㆍ분석했다.

이어 내부데이터와 정부의 통계자료 등 정형데이터는 데이터베이스(RDBMS)에, 소셜미디어 데이터 등 비정형데이터는 분산병렬처리 플랫폼인 하둡(Hadoop)에 각각 저장하고, 오픈소스 통계분석 도구 R의 상용버전인 레볼루션R을 활용했다.

특히 소셜미디어 데이터의 경우 코스콤이 독자적으로 구현한 감성사전을 통해 코스피 200지수, 코스피 40종목, 코스닥 10종목 등의 주가 예측에 활용했다. 감성사전은 감성을 나타내는 단어에 긍ㆍ부정의 점수를 부여한 사전으로, 소셜미디어 데이터가 해당 종목에 미치는 영향을 판단하는 감성분석의 기초 도구로 활용된다.

코스콤은 이번 프로젝트를 통해 빅데이터 기술의 적용성과 활용성이 검증됨에 따라 향후 주가 예측 등 빅데이터 서비스를 사업화할 수 있는 기반이 마련될 것으로 평가했다.

코스콤은 이번 프로젝트의 성공을 바탕으로 오는 6월부터 예측 결과의 신뢰도 향상과 비즈니스 모델 발굴을 위한 ‘고도화 프로젝트’를 추진할 예정이다. 또 앞으로 금융산업 이외의 분야에도 축적된 빅데이터 분석 노하우를 적용하고, 정부의 핵심 정책기조인 창조경제와의 접목방안도 마련할 계획이다.

해외 자본시장의 경우 트위터의 데이터와 주가 지수와의 상관관계를 분석해 지수를 예측하는 기술 개발이 한창이며, 트위터의 감성분석 결과를 매매에 활용하는 펀드도 운용된 바 있다.

<저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지>