홈 산업 IT

세상만물을 통제하는 사나이

입력2011.11.14 09:45:04 수정 2013.06.04 17:25:07

facebook twitter kakao email 복사

뉴스듣기 가 저장

시스템을 도식화해 세상을 예측, 통제한다

By Gregory Mone

1736년 스위스 수학자 레온하르트 오일러는 그래프 하나로 ‘쾨니히스베르크의 다리 문제’라는 뜨겁던 논쟁에 종지부를 찍었다. 현재는 러시아의 칼리닌그라드로 이름이 바뀐 프로이센의 쾨니히스베르크에는 도시를 4개 구역으로 나누는 프레겔 강이 흐르고 있었고 강 위에는 7개의 다리가 놓여있었다. 쾨니히 스베르크의 다리 문제는 과연 각 다리들을 한 번만 건너서 모든 다리를 건널 수 있는지의 문제였다.

오일러는 이 난제를 풀기 위해 가장 먼저 도시의 지도에서 주택, 도로, 커피전문점 등 문제와는 무관한 요소들을 제거했다. 그리고 지도 자체를 물리적 장소가 아닌 상호연관된 시스템으로 묘사했다. 강에 의해 분리된 도시의 4개 구역은 점, 7개의 다리는 선이 됐다. 수학적 분석이 가능하도록 하나의 도시를 수학자들에게 익숙한 교차점(노드, node)과 선(링 크, link)의 조합으로 변모시킨 것이다. 이렇게 오일러는 한 사람이 동일한 다리를 두 번 건너지 않고는 7개의 다리를 모두 건너는 게 불가능함을 수학적으로 증명했다.

그런데 여기에는 오일러가 문제를 풀었다는 것 자체보다 훨씬 중요한 의미가 하나 있다. 그가 최초로 네트워크를 도식화했다는 사실이 그것이다.

그로부터 200년이 지나서 과학자들은 오일러의 방식을 응용해 ‘그래프 이론’을 발전시켰다. 이 이론은 특정 집단 내에 속한 대상들 사이의 관계를 그래프로 나타내는 것으로서 네트워크 과학의 기반을 이룬다. 그래프 이론은 1959년 헝가리의 수학자 파울 에르되스와 알프레드 레니가 네트워크를 정의하면서 본격 수면 위로 부상했는데 이를 한층 복잡한 문제에 적용한 것은 1990년대 중반에 이르러서였다. 그전에는 거대한 데이터 세트를 얻기도 어려웠고 처리하기는 더 어려웠던 탓이다.

하지만 데이터의 확보가 용이해지고 우수한 프로세서의 가격도 낮아지면서 연구자들은 그래프 이론을 ‘단백질-단백질 상호작용’ 모델링에서 전력망의 운용에 이르기까지 모든 것에 적용시키기 시작했다.

루마니아 태생의 물리학자이자 미국 노트르담 대학의 교수인 알버트 바라바시 박사도 그중 한사람. 그는 지난 15년간 동료 연구자들이 네트워크를 이해하는 방식을 최소한 두 번은 바꿔놓았다. 또한 그의 이론은 엔지니어링, 마케팅, 의약, 첩보기술 등의 발전에도 큰 영향을 미쳤다. 그리고 그의 연구 덕분에 얼마 지나지 않아 엔지니어, 마케터, 의사, 스파이들은 네트워크의 움직임을 이해하고 예측하는 것을 넘어 제어할 수도 있게 될 전망이다.

에르되스-레니 모델
처음에는 바라바시 박사도 오일러처럼 복잡계(complex system)의 도식화에 흥미가 컸다. 특히 ‘에르되스-레니 모델’에 많은 관심을 가졌다. 이 모델에 있어 복잡계 네트워크는 무작위성을 띠고 있으며 네트워크가 충분히 커질 경우 각 노드의 숫자는 시간이 지나면서 다른 노드들이 갖는 링크의 숫자와 거의 같아진다.

1998년 바라바시 박사와 노트르담 대학 학생들은 빅 데이터 세트, 즉 대학 웹 도메인 에 있는 32만5,000여개의 웹페이지를 통해 이 모델의 진정한 의미를 연구할 기회를 얻었다. 연구결과 거의 모든 웹페이지들이 서로 비슷한 숫자의 링크를 지닌 것으로 드러났다. 단지 수십개의 페이지는 다소 독특한 결과가 나왔다. 각 페이지마다 외부에서 연결된 링크가 1,000개 이상이었던 것이다.

당시 구글이 링크가 많은 페이지에 가산점을 부여하는 ‘페이지랭크(PageRank)’를 검색결과에 활용하고 있었을 만큼 이 정도의 링크는 일상적이었지만 네트워크 이론가들에게 이 같은 결과는 너무나도 급진적이었고 웹과는 거리가 먼 것으로 여겨졌다.

에르되스-레니 모델과 자신이 발견한 사실 사이의 모순에 직면한 바라바시 박사는 한층 크고 복잡한 시스템들을 도식화했다. 이중에는 마이크로칩 위의 트랜지스터의 연결 관계, 할리우드 배우들의 협력관계도 포함됐다.

이를 분석하자 그가 ‘허브(hub)’라고 명명했던 ‘링크가 대단히 많은 노드’는 전체 네트워크의 특성을 규정한다는 사실을 확인할 수 있었다.

변칙뿐만 아니라 공학적·자연적 시스템을 분류하는 기준도 여기서 예외가 아니었다.

이후 그는 학부생 레카 앨버트와 함께 현실 세계 네트워크의 허브를 반영할 수 있도록 에르되스-레니 모델을 업데이트했는데 이 과정에서 과거에는 상상할 수 없었던 방식으로 모든 종류의 복잡계를 도식화하고 탐색할 수 있는 도구를 개발했다. 그리고 허브에 관한 그의 논문은 네트워크 과학계에서 가장 많이 인용되는 논문이 됐다.

특히 이 논문은 다른 영역의 과학자들이 그의 허브 이론에 관심을 갖게 한 단초가 되기도 했다. 일례로 암 연구자들은 허브 이론을 적용, 단백질 상호간 네트워크에 의한 체내 종양 억제 기전을 더욱 잘 이해할 수 있었다.

또한 바라바시 박사의 전언으로는 미 중앙정 보국(CIA) 같은 정보기관들이 테러리스트의 네트워크 도식화에 그의 연구를 적용했다.

“그들이 제 이론을 사용하고 있다는 사소한 증거들은 정말 많습니다.” 하지만 바라바시 박사는 자신의 이론을 실생활에 적용하는 데 오랜 관심을 보이지 않았다. 그는 이론가이지 응용과학자가 아닌 탓이다. 때문에 시스템의 도식화 능력을 갖춘 이상 그의 다음 목표는 당연히 시스템의 움직임을 예측하는 것으로 넘어갔다.

이제껏 사람들의 움직임 예측에 성공한 사람은 아무도 없었다.

인간 행동의 예측
결국 2006년 그는 그토록 원하던 시스템 예측의 기회를 잡았다. '유럽 모바일폰 컨소시엄' 이라는 기관의 대표자라는 사람이 흔치않은 제안을 해온 것. 끝내 이름을 밝히지 않은 그는 600만명이 넘는 휴대폰 가입자들의 데이터를 보유하고 있었고 가입자들이 이동통신사를 변경하는 이유를 찾아달라고 요청했다.

바라바시 박사는 그 자료를 학문적 연구에도 활용할 수 있겠다고 판단, 제안을 수락했다.

당초 바라바시 박사는 휴대폰 통화내역과 요금지불 내역의 패턴을 분석하면 의뢰인이 원했던 정보를 찾을 알고리즘 개발이 가능할 것으로 여겼다. 그런데 데이터를 탐색하던 연구팀은 데이터 속에 가입자들이 접속한 기지국 위치정보가 들어있음을 알게 됐다. 휴대폰 통화 시의 물리적 위치 파악까지 할 수 있었던 것이다. 지난 수세기에 걸쳐 물리학자들은 입자와 행성의 움직임을 예측해왔지만 이제껏 사람들의 움직임 예측에 성공한 사람은 아무도 없었다.

관련기사

본능적으로 연구가치를 깨달은 바라바시 박사는 노스이스턴대학의 물리학자 차오밍 송 박사와 함께 휴대폰 가입자를 입자라고 가정하면 특정한 시간에 그 사람의 위치를 예측할 수도 있을 거라는 가정을 세웠다. 그리고 가입자 5만명의 움직임을 도식화하는 소프트 웨어를 만들었다. 각 기지국은 노드, 가입자가 A노드에서 B노드로 옮겨갈 때의 이동경로는 선이 됐다. 이후 두 사람은 각 가입자들의 무질서 정도, 다시 말해 엔트로피(entropy)를 유도했다. 이는 시스템 내부의 무작위성 및 불확실성의 정도를 측정하는 척도가 된다.

이런 방식으로 바라바시 박사와 송 박사는 가입자 이동 데이터를 무질서 수치와 융합시켜 특정 가입자의 위치 예측에 성공했다. 오차거리는 불과 1.6㎞ 이내였고 정확도는 최소 80%, 최대 93%나 됐다.

이 연구성과를 현실에 적용하고자 하는 연구는 이제 시작단계다. 전염병 학자는 항공기의 이동 데이터를 분석, 전염병의 도시 간 전파 양상을 예측하는데 이번 두 사람의 발견은 도시가 아닌 특정 블록의 주택 단위로 정밀한 예측을 가능케 해줄 수 있다. 또한 교통 공학자들은 교통혼잡을 완화시킬 방법을, 개발도상국의 도시 설계자들은 타지역에서 이주해온 대규모 노동자들을 수용할 도시계획을 수립할 수 있다.

하지만 네트워크 예측 과학에는 부작용도 존재한다. 대표적인 예가 2009년 바라바시 박사팀의 연구다. 당시 연구팀은 휴대폰 바이러스가 대대적으로 유행하지 않는 이유, 특정 운영체제가 대다수 휴대폰에 채용되면 큰 위협이 된다는 것 등을 증명하는 예측 알고리즘을 만들었다. 그런데 연구논문이 발표된 직후 엄청난 비난이 답지했다. 정부 당국이 이 알고리즘을 휴대폰에서 수집한 GPS 데이터와 결합하면 시민들의 움직임을 기가 막힐 정도로 정확하게 추적·예측할 수 있기 때문이었다.

제어와 통제 사이
어쨌든 연구 이후 바라바시 박사의 머릿속은 온통 ‘통제’라는 단어로 가득 찼다. 그러던 중 연구성과 발표를 위해 방문한 미네소타대학에서 한 엔지니어와 얘기를 나누게 됐다.

“불과 5분 만에 저는 그 사람이 무슨 연구를 하는지 전혀 알지 못한다는 것을 확신했죠. 그래서 물었어요. ‘뭐하시는 분이시죠?’라고요. 그의 대답은 ‘통제 이론가’였어요.” 엔지니어들은 시스템이 다양한 입력 값에 반응하는 방법을 예측키 위해 통제 이론을 적용한다. 야구하는 로봇, 급커브를 쉽게 회전하는 자동차, 추락하지 않는 항공기 등의 개발도 통제 이론 덕분이다.

하지만 바라바시 박사에게 통제 이론은 금시초문의 영역이었다. 그 엔지니어는 결국 박사를 화이트보드 앞으로 데려가 이런저런 수식을 그려가며 자신의 연구를 설명해야 했다.

그때 바라바시 박사는 엔지니어가 그린 수식과 자신이 네트워크 도식화를 위해 사용하는 수식이 매우 비슷함을 느꼈고 그 수식을 연구 영역에 포함시키기로 결심했다.

예측과 마찬가지로 통제 또한 객체를 중요도가 서로 다른 노드들로 이뤄진 시스템으로 평가해야 한다. “자동차를 예로 들어보죠. 자동차의 구성품, 즉 노드가 5,000개라고 가정하면 운전자가 운전 중 직접 접촉해야 할 노드는 3~5개에 불과해요. 핸들, 액셀레이터, 브레이크에다가 클러치, 변속기 정도가 되겠죠. 하지만 이들만으로도 운전자는 차량을 어디로도 몰고 갈 수 있어요.” 바라바시 박사가 알고자 한 것은 자동차를 위시한 모든 네트워크에서 이러한 ‘통제 노드’를 찾을 수 있는지다. 이에 그는 자신의 연구팀에 있는 양 유 리우 박사와 MIT의 통제이론가 장 자끄 슬로틴 박사에게 도움을 청했다.

통제 노드는 시스템 외부에서 지시 및 신호를 받는다. 액셀을 밟는 것은 자동차가 아닌 사람이듯이 말이다. 이의 발견을 위해 리우 박사는 50년 전 에르되스와 레니가 만든 알고리즘을 차용했다. 이 알고리즘은 네트워크 내에서 움직이는 신호 역할을 한다. 하나의 노드에서 출발해 무작위적으로 선택한 선을 타고 다음 노드로 가며 신호가 오고가는 선 이외의 모든 선은 제거된다. 알고리즘은 이렇게 전체 네트워크 내의 모든 노드에 도달하면서 최소한의 선을 이동하는 경로를 찾을 때 까지 계속해서 네트워크를 탐험한다. 이 출발점이 바로 통제 노드며 이를 제어하면 네트워크 전체의 제어도 가능해진다.

좋은 통제, 나쁜 통제
연구팀은 알고리즘을 교도소 재소자들의 인간관계, 이스트균의 대사 경로 등 37개의 네트워크에서 테스트했다. 그 결과, 상호연결도가 높은 네트워크일수록 통제 노드의 숫자는 적다는 결론에 도달했다. 예를 들어 뉴런이 297개에 불과한 예쁜꼬마선충의 통제 노드는 49개 뿐이다. 반면 4,441개의 단백질을 생산하는 이스트균 세포 내의 유전자 네트워크는 전체 단백질의 80%인 3,500개를 통제해야 세포의 시스템 전체를 통제할 수 있다.

일견 이스트 세포의 통제는 핸들 3,500개가 달린 자동차만큼 유용성이 없어 보인다.

그러나 바라바시 박사는 두 가지를 지적했다.

과학자들은 예쁜꼬마선충의 뉴런 지도가 완성될 때까지 이스트 세포의 유전자 관계망 내의 연결 상황은 단 5%만 파악할 수 있다는 것이 하나며 이 모델에 더 많은 데이터를 입력할 수록 관계망 내의 연결 상황을 더욱 잘 도식화할 수 있고 시스템 운영에 필요한 통제 노드의 숫자도 줄어든다는 것이 두 번째다.

“이 지도들이 아직 불완전하다는 것은 저희도 알고 있어요. 하지만 날로 충실해지고 있습니다.” 그는 또 자신의 이론은 네트워크의 종합적 통제를 지향한다고 덧붙였다. 세포 내의 특정 유전자 발현 같은 부분적 통제라면 훨씬 적은 수의 통제 노드만으로도 원하는 것을 얻을 수 있다는 의미다.

바라바시 박사가 그동안 수행해온 연구 대부분이 그렇듯 이번 연구도 유용성을 발휘하려면 상당한 시일이 걸릴 것이 자명하다.

통제 노드를 찾는 것부터가 그렇다. 페이스북, 인간 면역체계 등 특정한 네트워크에 실 질적인 통제력을 미치는 것은 또 다른 난제가 될 것이다.

아마 첫 돌파구는 의약 분야에서 나타날 공산이 크다. 세포 성장 시스템의 통제 노드를 밝힌다면 성숙한 세포를 배아기로 되돌려 놓아 줄기세포를 얻는 혁신적 기술이 탄생할 수도 있다. 또한 특정 질병의 발병원인은 단순하게 통제가 잘 안되기 때문인 경우가 많다.

그런 질병이라면 세포나 뉴런 단위에서 적절한 통제를 가해 완치시킬 수 있다.

다만 네트워크의 통제는 나쁜 목적으로도 적용될 수 있다. 마케터가 고객을 현혹시켜 지갑을 열게 하거나 정부 관료가 국민들의 여론을 자신들에게 유리한 방향으로 이끌 방법을 찾을 수도 있다.

“네트워크 통제력을 사용해야 할 곳과 사용하지 말아야할 곳을 정하는 것은 결과적으로 우리의 몫으로 남을 것입니다.”

파퓰러사이언스

네이버메인에서 서울경제 구독