북한이 군사 퍼레이드에서 노동미사일을 선보이고 있다.
김영한 성균관대 경영전문대학원 교수는 빅데이터 분석을 활용한 연구방법론에 관심이 많은 학자다. 그는 최근 영국 헤지펀드들의 한국 증시 공매도(空賣渡·주식을 갖고 있지 않은 상태에서 매도 주문을 내는 것을 말한다. 주가 하락이 예상될 때 시세차익을 노리는 방법이다)와 영국 언론의 북한 관련 기사를 빅데이터 기법으로 분석해 북한의 도발과 상당한 연관성을 갖고 있다는 사실을 밝혀낸 바 있다. 김영한 교수가 직접 자신의 흥미로운 연구 결과에 대해 말한다.종 잡을 수 없는 북한의 도발을 보다 잘 예측하고 싶은가? 그렇다면 영국에서 나오는 북한 관련 신문기사를 유심히 관찰하고, 영국계 헤지펀드들이 내는 코스피 주가지수 공매도량을 살피고, 북한 지도자들의 생일 전날을 주의하시라.
필자는 미국 헤지펀드 업계에서 쓰이는 빅데이터 기법을 전혀 상관없어 보이는 북한 관련 지정학적 리스크 분야에 접목시켜 흥미롭고 의미심장한 결과들을 찾아냈다.
각종 미디어에 축적된 빅데이터를 활용해서 얻게 되는 집단지성(Collective Intelligence)은 예측력을 강화시킨다. 또한 예측력이 강한 미디어는 그만큼 정보력이 강하다는 것도 알 수 있다. 필자는 여기에 착안해서 오랜 세월 동안 한국 주식시장에서 ‘코리아 디스카운트’의 핵심적인 원인을 차지해왔던 북한이라는 블랙박스를 예측하는 데 빅데이터적 접근을 시도했다. 사실 북한에 대해서는 많은 첩보전과 정보전이 벌어지고 있지만, 여전히 한계가 있다. 예를 들면 김정은 바로 다음의 권력 서열 2인자가 누구인지, 또는 권력 내부에서 누가 숙청되었는지조차 정확하게 파악되지 않고 있다. 다만 북한 소식을 전하는 사진들을 분석한 추측기사들만 난무할 뿐이다.
영국 런던의 금융 중심지인 캐너리 워프 지역.
미국 헤지펀드 업계서 쓰이는 기법 활용이런 마당에 기존의 방법에만 의존해서 북한의 군사도발을 예측한다는 것은 사실 비용이 너무 많이 들어가는 일이다. 이 문제를 극복하기 위해 필자와 강형구 한양대 교수는 빅데이터 기법을 활용해보기로 했다. 우선 1999~2012년에 걸쳐 14년간 일어난 북한과 관련된 287개의 사건들에 대해 당시 북한의 행동을 ‘호전성’에 따라 4단계로 분류했다(0: 우호적인 행동, 1: 아무런 행동 없음, 2: 비우호적 외교행동 및 국지도발, 3: 핵 및 장거리미사일 실험). 또 한편으로는 같은 기간 북한에 관한 영자신문 기사를 7만 개 이상 수집하고 컴퓨터 언어학적 기법을 동원해 매일매일 북한에 관한 논조가 얼마나 부정적인지의 정도를 측정했다. 아울러 국내 영자신문(코리아타임스, 코리아헤럴드)과 외국 신문의 논조 중 어느 쪽이 북한의 행동을 잘 예측하는지도 분석했다. 외국의 신문은 미국, 영국, 일본, 중국, 싱가포르 등의 신문들을 포함했다. 물론 우리나라 언론사들의 한글 신문기사들과 한글 트위터 메시지도 빅데이터 분석업체 다음소프트의 도움을 받아 분석해서 비교했다(아래 그래프 참조).
결과는 뜻밖이었다. 영국 언론의 논조가 북한의 도발을 가장 잘 예측하는 것으로 나타난 반면 우리나라 언론이나 미국 언론의 논조는 예측력이 별로 없었다. 무언가 북한에 대한 고급정보가 영국에 더 많다는 사실을 짐작할 수 있다.
물론 우리나라의 첩보력을 의심할 필요는 없다. 왜냐하면 북한이 도발할 것 같다는 첩보가 언론사에 보도된 후에 실제로 북한이 도발할 확률도 유의미하게 높았기 때문이다. 또한 북한은 지도자들의 생일 전에 도발을 할 확률이 높았는데, 이는 북한이 얼마나 철저한 1인 숭배 체제인지를 보여준다.
우리의 계량모형에서는 이런 변수들을 다 통제하고 나서 빅데이터인 논조 변수의 예측력을 국적별로 본 것이다. 한글 신문의 논조가 예측력이 없는 이유는 전반적으로 한국의 미디어들이 북한에 관해 워낙 광범위한 이슈(군사적, 비군사적)들을 다루기 때문인 것으로 사료된다. 이에 비해 외국의 언론은 큰 관심을 끌 만한 군사적인 측면에 집중한다. 그럼에도 불구하고 유독 영국만이 강한 예측력을 가지는 것은 흥미로운 발견이었다.
필자의 두 번째 연구에서는 북한의 군사적 도발이 있기 며칠 전부터 영국 국적의 자산운용사(헤지펀드)들이 한국 주식시장에서 전보다 더 적극적으로 ‘공매도’를 하더라는 사실을 발견했다. 외국인 투자자들의 주식 매매 행태를 국적별로 알 수 있는 빅데이터 덕분에 발견한 것이었다.
북한의 군사도발은 여전히 한국 증시에 영향을 주고 있다.
외국인 투자자 주식매매 행태 분석북한의 무력도발이 국내 주식시장에 미치는 영향이 이제는 미미해졌다는 얘기도 있지만, 그것은 소규모 충돌에 한정된 얘기다. 그런 경우에도 도발 시각부터 7분 이내에는 주가지수가 0.6~1% 정도 유의미하게 떨어진다. 북한의 핵무기와 장거리 미사일 능력을 과시하는 도발이 있으면 주가지수도 -1.5% 정도 빠져서 돌아오지 않는 패턴을 발견했다. 따라서 이것을 미리 알고 공매도를 하면 이익을 낼 수 있는 정도라고 하겠다.
그뿐 아니라 여기서도 북한의 도발을 예측하는 계량모델을 돌려봤는데, 언론기사의 논조를 통제한 후에도 영국 국적 헤지펀드의 공매도량이 높아지면 그 다음날 북한의 도발 가능성이 높아지더라는 사실도 발견했다. 이런 점을 고려하면 첫 번째 연구와 마찬가지로 영국에는 북한에 대한 고급정보가 더 많다는 것을 알 수 있고, 나아가 그것을 적극적으로 활용해서 금전적인 이득을 추구하는 세력들이 있다는 것도 알 수 있다.
이쯤 되면 이런 질문을 던지지 않을 수 없다. 도대체 영국에는 무슨 비밀이 숨어 있는 것일까?
영국의 런던은 200년 전부터 이미 로스차일드(Rothschild) 가문이 활약하며 해가 지지 않는 제국을 건설하는 데 중추적인 역할을 담당한 국제금융의 중심지였고, 지금까지 그 명맥을 이어오고 있다. 그러니 우리나라 주가지수에 대한 공매도량이 영국계 헤지펀드로부터 쏟아져 나오는 것에 대해서는 그리 놀랄 일은 아니다.
또한 영국은 예로부터 사상과 표현의 자유가 확실하게 보장되는 나라로 유명하다. 유태계 독일인이었던 칼 마르크스(Karl Marx)가 ‘자본론’을 출판한 곳도 독일이 아닌 영국이었다. 그러다 보니 영국에는 공산주의 단체들도 많았으며, 소련을 비롯한 공산국가들이 전멸한 요즘에는 그나마 북한이라는 나라를 지지하는 단체들로 변해버렸다고 한다. 북한이 암암리에 영국의 친북한 단체들을 지원해준다는 보도도 있다. 또한 북한과 영국은 대사를 서로 교환하고 있고, 오랫동안 수교관계를 맺고 있다.
영국에는 친북한 단체들도 존재
아니나 다를까. 지난 4월4일 국제탐사보도언론인협회(ICIJ)에서 밝힌 바에 의하면 북한이 조세피난처에 유령회사를 설립해서 상당액의 외화를 조달해왔는데, 그 과정을 1995년부터 도와준 사람이 다름아닌 영국 국적의 나이겔 코위(Nigel Cowie)라는 뱅커라고 한다!
필자의 연구는 예측하기 어려운 ‘지정학적 사건(Geopolitical Event)’들도 빅데이터 기법을 활용하면 좀 더 효과적이고 효율적으로 예측할 수 있을 뿐만 아니라, 고급정보가 어디로 흐르는지도 알 수 있다는 점을 보여줬다. 이 같은 연구를 확장하면 북한 외에도 이슬람국가(Islamic State) 등 이슈가 되고 있는 다른 단체 및 국가의 행동을 예측하는 데도 도움이 되리라 기대한다.
월별로 영자신문에 나타난 논조와 북한의 행동간의 관계를 보여주는 그래프다. 붉은 선은 북한에 관한 각종 언론의 논조가 얼마나 부정적인지를 나타낸다(부정적일수록 위로 올라감). 푸른 선은 평균 대비 북한에 관한 기사가 얼마나 많이 등장하는지를 보여준다.
■ 빅데이터 분석은 투자시장의 ‘노다지’알파고와 이세돌 9단의 대국으로 핫이슈가 된 인공지능(AI · Artificial Intelligence)의 기본은 ‘자연어 분석(NLP · Natural Language Processing)’이라는 빅데이터 기법으로 신문이나 페이스북, 트위터 등에 등장하는 일상 언어들을 통계적으로 분석하는 것이다.
미국 컬럼비아대의 유명한 파이낸스 분야 교수인 폴 테틀락(Paul Tetlock)의 연구에 의하면 ‘월스트리트저널’의 주식 시황 요약 기사들을 자연어 분석 기법으로 분석해서 나온 논조(Tone)의 빅데이터가 그 다음날 주가지수 움직임을 유의미하게 예측하더라는 것이다.
또한 그의 연구에 의하면 자연어 분석 기법으로 개별 기업들에 관한 신문기사들을 분석한 논조 빅데이터가 모든 경제적인 요소들을 통제하고 나서도 미래 실적을 예측하는 힘이 있더라는 것이다. 또한 미국 미시건대의 회계학 교수인 펑리 (Feng Li)에 의하면 회계감사 보고서에서 경영진의 미래 전망에 관한 논의 부분에서 위험성(Risk)라는 단어가 많이 출현할수록 그다음 해에 회사의 리스크가 올라간다는 사실도 발견했다.
이 모든 연구 결과들이 뜻하는 것은 하나다. 각종 미디어의 빅데이터를 활용해서 얻게 되는 집단지성이 예측력을 강화시킨다는 것이다. 미국과 유럽의 투자은행 및 헤지펀드 업계에서는 이미 10여년 전부터 미디어의 기사 논조를 분석해서 각종 회사의 사건들을 예측하고 투자에 반영해왔다. 도이치뱅크, 블랙록, 르네상스 테크놀로지스 등 굴지의 기업들이 그런 사례들이다.
그뿐 아니라 이제 골드만삭스는 켄쇼(Kensho)라는 AI 회사에 150억 원을 투자했는데, 증시에 관한 애널리스트 리포트조차도 빅데이터 수집을 통해서 자동적으로 써내려 가도록 하고, 투자 의사결정에도 반영한다는 것이다.
김영한 교수는…
1999년 연세대 졸업
1999~2001년 뱅크오브아메리카 (Bank of America) 서울지점 근무
2003년 미국 미네소타주립대 경영학 석사
2009년 미국 미네소타주립대 재무전공 박사
2009~2014년 싱가포르 난양경영대학교 재무관리 교수
2015년~현재 성균관대 경영전문대학원 재무관리 교수
서울경제 포춘코리아 편집부/김영한 성균관대 경영전문대학원 교수